Вы находитесь на странице: 1из 879

2.

Edio

ESTATSTICA

CD Resoluo dos Problemas


Rui Campos de Guimares
Jos A. Sarseld Cabral
Bernardo Almada-Lobo

Verlag Dashfer

2. Edio

ESTATSTICA

Introduo
Resoluo dos Problemas
Formulrio
Endereos electrnicos

Verlag Dashfer

ESTATSTICA

2. Edio

Introduo
O CD que acompanha a 2. edio do Estatstica foi concebido para apoiar o leitor
no seu processo de aprendizagem e, simultaneamente, permitir aferir o grau de
compreenso dos conceitos expostos no texto. Nele se incluem as resolues
dos problemas propostos no final de cada captulo (com trs nveis opcionais de
detalhe), um formulrio e um conjunto de endereos electrnicos de interesse.
A compreenso e a apreenso do alcance dos conceitos e das tcnicas e mtodos
estatsticos beneficiam largamente com a prtica de resoluo de problemas.
Por outro lado, o processo de aprendizagem ainda mais eficaz quando assenta
em trabalho individual. Neste sentido, para cada problema apresentado no texto,
o leitor encontrar na seco Resoluo dos Problemas trs opes interactivas
para apoiar o seu estudo:
(a) apenas resultado (apoio 1),
(b) sugesto (apoio 2), e
(c) resoluo completa (apoio 3).
Se o leitor se sentir suficientemente amadurecido para resolver o problema sem
ajuda adicional bastar verificar se o resultado que obtm corresponde quele
que indicado no apoio 1.
Alternativamente, se no for capaz de atacar imediatamente o problema, ou se o
resultado no estiver correcto, deve socorrer-se do apoio 2. Neste segundo nvel
incluem-se vrios tipos de ajuda indicaes pertinentes, reviso de conceitos,
sugestes que orientam o estudo e facilitam a estruturao da resoluo.
A opo apoio 2 constitui assim um convite para que o leitor aprenda por si prprio,
consolidando conhecimentos porventura ainda mal assimilados.

Verlag Dashfer

ESTATSTICA

2. Edio

O apoio 3 corresponde resoluo detalhada do problema. O leitor dever recorrer


a esta opo para confrontar o seu modo de resolver o problema com aquele que
sugerido pelos autores, ou, no caso de ter esgotado sem sucesso os outros
nveis de apoio, analisar em pormenor os passos necessrios para a soluo do
problema.
Na seco Resoluo dos Problemas sugere-se frequentemente que o leitor recorra
s opes de Estatstica da aplicao Microsoft Excel. Optou-se pela verso em
lngua inglesa (embora esteja disponvel uma equivalente em portugus) por se
acreditar que aquela tem uma maior divulgao. De qualquer maneira,
a correspondncia da verso em ingls para a em portugus no colocar
dificuldades significativas.
O Formulrio constitui outro elemento importante para apoiar o leitor na
resoluo de problemas. Ao contrrio do que habitual, no se limita a apresentar
as expresses que constam no texto. De facto, para cada captulo, as expresses
so associadas aos conceitos a que dizem respeito, facilitando assim quer o
confronto de alternativas, quer a compreenso do contexto no qual devem ser
aplicadas.
Finalmente, na seco Endereos Electrnicos o leitor encontrar uma coleco
de stios abrangendo temticas ligadas aprendizagem da Estatstica, sua
prtica, ao seu ensino, vida e obra dos seus principais protagonistas e, ainda,
sua histria. A maioria dos endereos remete para stios nos quais o leitor
encontrar uma vastssima gama de animaes grficas (applets) que permitem
visualizar os principais conceitos da Estatstica. Estes applets constituem um meio
muito eficaz e divertido de aprendizagem, merecendo que o leitor lhes dedique
algum do seu tempo de estudo. No seu conjunto, a lista de endereos encerra um
universo de conhecimentos que, independentemente do nvel de informao que
o leitor possua, vale a pena explorar.

Verlag Dashfer

ESTATSTICA

2. Edio

CAPTULO 2

Captulos
2

Dashfer
Verlag
McGraw-Hill

10

11

12

13

14

CAPTULO 2

ESTATSTICA

2. Edio

Captulos

Captulo 2
Problemas
Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

n.a. = no aplicvel

Dashfer
Verlag
McGraw-Hill

2.1

2.2

2.3

2.4

2.5

2.6

2.7

2.8

n.a.

n.a.

n.a.

n.a.

n.a.

n.a.

n.a.

n.a.

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.1
Apoio 2 (sugesto)
Para efectuar comparaes entre modelos podem ser utilizados todos os tipos de escala, excepto
a nominal.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

Problema 2.1
Apoio 3 (resoluo completa)
(i) Consumo de combustvel
escala ordinal: consumo elevado, mdio ou baixo
escala absoluta: consumo expresso em litros aos 100 km.
(ii) Conforto
escala ordinal: rudo elevado, mdio ou baixo
escala absoluta: rudo expresso em decibis.
(iii) Segurana na travagem
escala ordinal: segurana reduzida, considervel ou elevada
escala absoluta: distncia requerida para parar o veculo a 100 km/h.
Em princpio, os dados expressos numa escala absoluta fornecem mais informao do que
aquela que contida em dados expressos noutra escala (de facto, os dados expressos numa
escala absoluta podem ser expressos numa escala de intervalo ou numa escala nominal).
No entanto, necessrio que quem utiliza os dados saiba interpretar a informao que encerram.
Por exemplo, o rudo dentro da cabine, se expresso em decibis, pode ser convertido em rudo
elevado, mdio ou baixo. No entanto, o cidado comum percebe mais facilmente o significado
de rudo elevado dentro do habitculo de um automvel do que rudo de 15 decibis.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.2
Apoio 2 (sugesto)
A forma mais comum de descrever amostras univariadas com dados expressos numa escala nominal
recorrer a tabelas de frequncias, a diagramas de barras ou a diagramas circulares.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

Problema 2.2
Apoio 3 (resoluo completa)
Os dados apresentados na tabela do enunciado do problema esto expressos numa escala nominal.
A forma mais comum de descrever amostras univariadas com este tipo de dados recorrer a
tabelas de frequncias, a diagramas de barras ou a diagramas circulares.
Apresentam-se seguidamente uma tabela de frequncias, um diagrama de barras e um diagrama
circular, que permitem pr em evidncia a importncia relativa das diferentes categorias de
alunos.
(i)

Tabela de frequncias

Frequncia absoluta
(Nk)

Frequncia
relativa (fk)

Psicologia (P)

0.110

Engenharia (E)

29

0.397

Letras (L)

13

0.178

Farmcia (F)

0.096

Medicina (M)

0.041

Outras (O)

13

0.178

N = 73

1.000

Faculdade (k)

Total

Note-se que N =

N
k =1

Dashfer
Verlag
McGraw-Hill

e que fk =

Nk
.
N

CAPTULO 2

Frequncia absoluta

35
29

30
25
20
15
10

13

13

0
P

Faculdade
Frequncia relativa (%)

ESTATSTICA

2. Edio

(ii) Diagramas de barras

50%
39,7%

40%
30%

17,8%

20%
11,0%

17,8%
9,6%

10%

4,1%

0%
P

Faculdade

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

(iii) Diagrama circular


Frequncia relativa (%)
17,8%

11,0%
P
E

ESTATSTICA

2. Edio

4,1%

9,6%

F
39,7%

M
O

17,8%

Quer a tabela de frequncias quer estes diagramas podem ser facilmente obtidos a partir do
programa Microsoft Excel. Em primeiro lugar, devem preencher-se as clulas da folha de
clculo como se indica na figura:

Seguidamente, constitui-se a lista das faculdades (note-se que a lista nominal) preenchendo-se as clulas necessrias (ver figura seguinte). Para calcular as frequncias absolutas
utiliza-se a funo COUNTIF aplicada ao conjunto de clulas que contm os dados, para cada
uma das abreviaturas associadas s faculdades P, E, , O (ver figura seguinte).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 2

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.3
Apoio 2 (sugesto)
Construa um diagrama de box-and-whisker, medidas amostrais (ou estatsticas), tabela de
frequncias, histograma e polgono de frequncias acumuladas. Note que para os trs ltimos
necessrio agrupar os dados em classes (considere classes de igual amplitude).

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

Problema 2.3
Apoio 3 (resoluo completa)
Apresentam-se seguidamente as medidas amostrais (ou estatsticas).

2. Edio

Dimenso da amostra

64

Mdia

1787.88

Mediana

1021

Moda

444*

ESTATSTICA

Desvio padro (s)

1914.95

Varincia (s2)

3.66705.E6

Kurtose (g2)

2.12

Assimetria (g1)

1.74

Amplitude

7398

Mnimo

97

Mximo

7495

1. Quartil

536

3. Quartil

2258.75

Amplitude interquartil

1722.75

* Existem mltiplas modas. Apresenta-se o valor mnimo.

Recorda-se que
N

s=

Dashfer
Verlag
McGraw-Hill

1
2
( xn - x )
N - 1 n =1

CAPTULO 2

Por outro lado, seja


N

ESTATSTICA

2. Edio

mi =

1
i
( xn - x )
N n =1

o momento centrado de ordem i. A varincia amostral pode ser calculada por

s2 =

N
m2
N -1

Adicionalmente,

g1 =

N2
1
m3

s 3 ( N - 1) ( N - 2 )

g2 =

N 2 ( N + 1)
3 ( N - 1)
1
m4 s4

s 4 ( N - 1) ( N - 2 ) ( N - 3)
( N - 2) ( N - 3)

As medidas amostrais podem ser facilmente obtidas a partir do programa Microsoft Excel.
Em primeiro lugar, introduzem-se os dados na folha de clculo. Em seguida, acciona-se o
menu Tools e, dentro das opes disponveis, escolhe-se Data Analysis (se esta opo
no estiver visvel, selecciona-se Add-Ins, seguidamente Analysis Tool Pack e prime-se
o boto OK). Dentro da opo Data Analysis escolhe-se Descriptive Statics. Dever

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

surgir a janela seguinte, na qual se dever activar Summary statistics (indicando em Input
Range as clulas que contm os dados e em Output Range as clulas que devero ser
ocupadas pelos resultados).

Activar

Na sequncia desta operao surgir a seguinte listagem:


Column1
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count

Dashfer
Verlag
McGraw-Hill

1787,875
239,3693014
1021
444
1914,954411
3667050,397
2,121334946
1,73715751
7398
97
7495
114424
64

CAPTULO 2

ESTATSTICA

2. Edio

No diagrama do tipo caixa (box-and-whisker plot) representam-se graficamente a mediana,


o primeiro quartil, o terceiro quartil e os valores mximo e mnimo dos dados.

2000

4000

6000

8000

Compras

Note que este diagrama no pode ser obtido atravs do programa Microsoft Excel.
(i)

Tabela de frequncias

Para construir a tabela de frequncias (e tambm para o histograma e polgono de frequncias)


deve, sempre que possvel, definir-se clulas de igual amplitude e em nmero aproximadamente
igual raiz quadrada do nmero de dados. Neste caso, as clulas foram definidas da seguinte
forma:
1. amplitude da amostra:
A = ( xn )max - ( xn )min = 7496 - 97 = 7399

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

2. amplitude das clulas: para amplitudes de 1000, 2000 e 3000 obter-se-iam os valores
indicativos

ESTATSTICA

2. Edio

A
A
A
= 7.40 ,
= 3.70 e
= 1.48
1000
2000
5000
3. nmero de clulas (K): para clulas com igual amplitude recorre-se, tipicamente, seguinte
regra:
K N.o de dados ( N ).
Finalmente, tudo ponderado, decidiu-se adoptar o nmero de clulas K = 64 = 8 , com
amplitude de 1000 (iniciando a tabela em 0 e terminando em 8000, garantindo a cobertura de
todos os valores observados). Note-se que h vantagens bvias em associar s clulas amplitudes expressas por nmeros redondos.
Compras [euros]

Frequncia
absoluta

Frequncia absoluta
acumulada

Frequncia
relativa

Frequncia relativa
acumulada

]0; 1000]

32

32

0.5000

0.5000

]1000; 2000]

14

46

0.2188

0.7188

]2000; 3000]

53

0.1094

0.8281

]3000; 4000]

56

0.0469

0.8750

]4000; 5000]

58

0.0313

0.9063

]5000; 6000]

58

0.0000

0.9063

]6000; 7000]

63

0.0781

0.9844

]7000; 8000]

64

0.0156

1.0000

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

(ii) Histograma

20
14
10
7
5
3

0
0

2000

4000

6000

8000

Compras

(iii) Polgono de frequncias acumuladas

Frequncia relativa acumulada

ESTATSTICA

2. Edio

Frequncia absoluta

32
30

100%

75%

50%

25%

0%
0

1000

2000

3000

4000

Compras

Dashfer
Verlag
McGraw-Hill

5000

6000

7000

8000

ESTATSTICA

2. Edio

CAPTULO 2

O histograma de frequncias e o respectivo polgono de frequncias acumuladas, podem


igualmente ser obtidos com auxlio do programa Microsoft Excel. Em primeiro lugar,
introduzem-se os dados na folha de clculo e cria-se uma coluna com os valores referentes aos
limites superiores de cada classe. Em seguida, acciona-se o menu Tools e, dentro das opes
disponveis, escolhe-se Data Analysis (se esta opo no estiver visvel, selecciona-se
sucessivamente Add-Ins, Analysis ToolPack e prime-se OK). Dentro da opo Data
Analysis escolhe-se Histogram. Dever surgir a janela que se apresenta na figura seguinte,
na qual se selecciona Summary statistics (indicando em Input Range as clulas que contm
os dados, em Bin Range as clulas em que se inscreveram os limites superiores de cada classe
e em Output Range as clulas que sero ocupadas pelos resultados). Para alm da opo
Chart Output, que se utiliza para construir o histograma, se se pretender sobrepor-lhe o polgono
de frequncias acumuladas dever activar-se a opo Cumulative Percentage (ver figura
seguinte).

Activar

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

More

32

Bin
1000
2000
3000
4000
5000
6000
7000
8000

Frequency
32
14
7
3
2
0
5
1
0

Cumulative %
50,00%
71,88%
82,81%
87,50%
90,63%
90,63%
98,44%
100,00%
100,00%

Histograma e Polgono de frequncias acumuladas

100%

30

80%

25
60%

20
14

15

40%

10

7
3

5
2

20%
1

0%
<=1000

]1000,2000] ]2000,3000]

]3000,4000]

]4000,5000]

]5000,6000]

Valor das compras (`)

Dashfer
Verlag
McGraw-Hill

Frequncia
acumulada (%)

35

Frequncia

ESTATSTICA

2. Edio

Na listagem e na figura seguintes ilustra-se o resultado destas operaes.

]6000,7000]

]7000,8000]

>8000

Frequncia
Freq. acumulada

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.4
Apoio 2 (sugesto)
Procure representar os dados numa tabela de frequncias, num histograma e num polgono de
frequncias acumuladas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

Problema 2.4
Apoio 3 (resoluo completa)
Apresentam-se seguidamente uma tabela de frequncias, um histograma e um polgono de
frequncias acumuladas. As clulas foram definidas de tal modo que ficasse clara a distino
entre valores do peso lquido escorrido inferiores a 450 gramas (clulas 1 a 6) e valores iguais
ou superiores a 450 gramas (clulas 7 a 9).
Registe-se que, na amostra, 68% das latas tm um peso lquido escorrido inferior ao indicado
como mdio (450 g). A mdia amostral de 444.3 gramas (ver resoluo do Problema 2.5) ,
tambm, inferior quele valor.
(i)

Tabela de frequncias

Classe

Frequncia
absoluta

Frequncia absoluta
acumulada

Frequncia
relativa

Frequncia relativa
acumulada

[420,425[

0.02

0.02

[425,430[

0.05

0.07

[430,435[

13

0.06

0.13

[435,440[

14

27

0.14

0.27

[440,445[

18

45

0.18

0.45

[445,450[

23

68

0.23

0.68

[450,455[

23

91

0.23

0.91

[455,460[

99

0.08

0.99

[460,465[

100

0.01

1.00

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

(ii) Histograma

Frequncia absoluta

25
23

20
18

2. Edio

15

14

10
8
6
5
5
2
1
0
420

430

440

450

460

Peso lquido escorrido (gramas)

(iii) Polgono de frequncias relativas acumuladas


Frequncia relativa acumulada

ESTATSTICA

23

100%

75%

50%

25%

0%
415

420

425

430

435

440

445

450

455

460

465

Peso lquido escorrido (gramas)

Para obter a tabela de frequncias, o histograma de frequncias e o respectivo polgono de


frequncias acumuladas com auxlio do programa Microsoft Excel proceder-se-ia de modo
idntico ao que se descreve no Problema 2.3. As estatsticas amostrais so apresentadas no
Problema 2.5.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.5
Apoio 2 (sugesto)
Para calcular as estatsticas a partir dos dados agrupados recorra ao ponto central de cada clula Mk.
Admita que os dados includos em cada clula tomam o valor correspondente a Mk.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

Problema 2.5
Apoio 3 (resoluo completa)
Na tabela seguinte apresenta-se uma comparao entre as estatsticas calculadas com base nos
dados do problema anterior (varivel PLE peso lquido escorrido) e as estatsticas calculadas
com base nos dados agrupados (varivel PLEGRUP). Notar que, neste caso, se considerou que
os dados se concentravam no centro de cada uma das clulas (o que corresponde aos valores
422, 427, 432, 437, 442, 447, 452, 457 e 462). Registe-se que se verificam diferenas em todas
as estatsticas (embora de pequena monta). Naturalmente que a aproximao ser tanto melhor
quanto menor for a amplitude das clulas.

Varivel
Dimenso da amostra

PLEGRUP

100

100

444.29

444.2

Mediana

445

447

Moda

450

447

Desvio padro (s)

8.787

8.508

Varincia (s2)

77.211

72.384

Kurtose (g2)

-0.207

-0.059

Assimetria (g1)

-0.484

-0.529

Mdia

Amplitude

43

40

Mnimo

421

422

Mximo

464

462

1. Quartil

438.5

437

3. Quartil

450.5

452

12

15

Amplitude interquartil

Dashfer
Verlag
McGraw-Hill

PLE

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.6
Apoio 2 (sugesto)
Note que se est perante uma amostra bivariada (constituda por pares ordenados de dados).
Procure representar num diagrama (x, y) os dados do enunciado. Verifique se os volumes de
produo so estveis ao longo do tempo. Para caracterizar a relao entre os volumes de produo
e os dias sucessivos, ajuste uma relao linear entre as variveis.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

Apoio 3 (resoluo completa)


Ao contrrio do que sucedia nos problemas anteriores, os dados correspondem agora a uma
srie temporal (volumes de produo em 20 dias consecutivos). Faz ento sentido comear por
verificar se os volumes de produo so estveis ao longo do tempo. O grfico VOLPROD
(volume de produo) versus DIA, que se apresenta em seguida, sugere que a primeira varivel
aumenta ligeiramente com o tempo.

14

VOLPROD

ESTATSTICA

2. Edio

Problema 2.6

12

10

8
0

12

16

20

DIA

Nestas condies, recorrendo ao mtodo dos mnimos quadrados, ajustou-se uma relao
linear entre as variveis, do tipo seguinte:
yn = a' + b xn.
Os parmetros a' e b foram estimados a partir das expresses
a' = y - b x

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

e
s XY
.
s XX

Os resultados conduzem seguinte expresso:

VOLPROD = 10.1 + 0.0825 DIA


O coeficiente de determinao, R 2 = 13.9%, representa a proporo da variao dos dados de
VOLPROD que explicada pela regresso linear, a partir da variao dos dias varivel DIA.
Registe-se que, atendendo s grandes oscilaes do volume de produo de dia para dia, o valor
de R2 = 13.9% baixo. No diagrama (VOLPROD, DIA) seguinte apresenta-se a relao linear
ajustada.

14

VOLPROD

ESTATSTICA

2. Edio

b=

12

10

8
0

12
DIA

Dashfer
Verlag
McGraw-Hill

16

20

CAPTULO 2

2. Edio

Para obter esta figura a partir do programa Microsoft Excel procede-se do seguinte modo.
Aps ter introduzido os dados na folha de clculo, selecciona-se o cone Chart Wizart e a
opo XY (Scatter). Por defeito, seleccionado o grfico tipo Scatter tal como se indica na
figura.

ESTATSTICA

Tipo de grfico
seleccionado

Seguidamente, acciona-se o boto Next > e, na janela que fica disponvel, define-se o
Data range seleccionando-se as clulas da folha de clculo que contm os dados e os respectivos
descritivos ( necessrio verificar se os dados esto dispostos em linha ou em coluna e seleccionar
a opo correspondente: Rows ou Columns). Desta forma o grfico (x, y) fica definido.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

Para acrescentar a recta que, pelo mtodo dos mnimos quadrados, melhor se ajusta aos dados,
selecciona-se um dos pontos do grfico e, com o auxlio do boto do lado direito do rato,
escolhe-se a opo Add Trendline. Automaticamente, surge a janela seguinte

Uma vez que se pretende ajustar uma relao linear, de entre as vrias opes que ficam
disponveis ao seleccionar o separador Type escolhe-se Linear (ver figura anterior).
Fazendo OK o processo termina com a sobreposio da recta pretendida no grfico (x, y).

Dashfer
Verlag
McGraw-Hill

A equao da recta pode ser tambm obtida. Para tal, basta seleccionar a recta, accionar o
boto do lado direito do rato e escolher Format Trendline, fazendo surgir a seguinte janela:

ESTATSTICA

2. Edio

CAPTULO 2

Activar

Escolhendo Options, activa-se a opo relativa a Display equation on chart (ver figura
anterior) e carregando em OK obtm-se a equao pretendida.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.7
Apoio 2 (sugesto)
Procure representar os dados atravs de uma tabela de informao cruzada e de um diagrama de
barras tridimensional (ou diagrama de barras sobrepostas).

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

Problema 2.7

Estao

Masculino
Gnero
Feminino

TV1

TV2

Satlite

TOTAL

528

164

285

977

26,8%

8,3%

14,4%

49,5%

598

212

186

996

30,3%

10,7%

9,4%

50,5%

1126

376

471

1973

57,1%

19,1%

23,9%

100,0%

TOTAL

600
N. de telespectadores

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Est-se perante uma amostra bivariada com dados expressos em escalas nominais. Seguidamente
apresentam-se a respectiva tabela de informao cruzada e o correspondente diagrama de barras
tridimensional.

400

200

TV1
TV2

Satlite
Feminino

Dashfer
Verlag
McGraw-Hill

Masculino

ESTATSTICA

2. Edio

CAPTULO 2

Pode agora, facilmente, ordenar-se as estaes por ordem decrescente de importncia,


de acordo com o gnero:
Sexo masculino:

TV1, SATLITE, TV2

Sexo feminino:

TV1, TV2, SATLITE.

O diagrama de barras tridimensional facilmente obtido com auxlio do programa Microsoft


Excel. Em primeiro lugar, introduzem-se os dados na folha de clculo, criando-se uma tabela
tal como se representa na figura seguinte.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

Seguidamente, selecciona-se esta tabela (ver figura anterior), acciona-se o cone Chart
Wizart e escolhe-se a opo Column. Finalmente, seleccionado o tipo grfico que se indica
na figura seguinte, acciona-se o boto Next e seguem-se as instrues do programa at se
obter a figura pretendida.

Seleccionar

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 2

Problema 2.8
Apoio 2 (sugesto)
Repare que se est perante uma amostra bivariada (constituda por pares ordenados de dados).
Procure representar num diagrama (x, y) os dados do enunciado. Ajuste uma relao linear
entre as variveis custo directo de produo e dimenso do lote atravs do mtodo dos
mnimos quadrados e caracterize o grau de ajuste obtido recorrendo ao coeficiente de
determinao.

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

2. Edio

Problema 2.8
Apoio 3 (resoluo completa)
No diagrama seguinte apresenta-se uma relao linear (do tipo yn = a' + b xn) ajustada ao
conjunto de dados (pelo mtodo dos mnimos quadrados). A varivel y (CUSTDIRECT) representa
o custo directo de produo e a varivel x (DIMLOTES) a dimenso do lote.
Os parmetros a' e b, estimados a partir das expresses
a' = y - b x
e
b=

s XY
,
s XX

conduzem seguinte expresso da recta:

CUSTDIRECT = 99.78 + 51.918 DIMLOTES

Dashfer
Verlag
McGraw-Hill

CAPTULO 2

ESTATSTICA

CUSTDIRECT

2. Edio

O coeficiente de determinao muito elevado (R 2 = 99.6%), traduzindo o bom ajuste da


recta aos dados.
12000
10000
8000
6000
4000
2000
0
0

50

100
DIMLOTES

150

200

Para obter esta figura a partir do programa Microsoft Excel (bem como a equao da recta
e tambm o coeficiente de determinao) proceder-se-ia de forma idntica que foi indicada no
Problema 2.6.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Captulos

Captulo 3
Problemas
3.1 3.1 3.1 3.1 3.1
3.2
(i) (ii) (iii) (iv) (v)

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

Dashfer
Verlag
McGraw-Hill

3.3

3.4

3.5

3.6

3.7
(i)

3.7
(ii)

3.8

3.9 3.10 3.11 3.12 3.13

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (i)
Apoio 1 (apenas o resultado)
73.2%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (i)
Apoio 2 (sugesto)
Na Seco 3.3 veja qual das definies de probabilidade se aplica a esta situao.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.1
Alnea (i)
Apoio 3 (resoluo completa)
Gnero
Masculino
Raa

Feminino

TOTAL

Branca
Negra
Outra

1 726 348
628 309
15 239

2 110 253
753 125
7 435

3 836 601
1 381 434
22 674

TOTAL

2 369 896

2 870 813

5 240 709

Acontecimento B: o indivduo seleccionado branco.


Recorrendo definio clssica de probabilidade (expresso 3.1), vem
P(B) =

N
merode
deresultados
resultadosfavor
favor
veis N B 3 836 601
Nmero
favorveis
N
mero
veis
=
=
= 0.732.
oss veis
veis
Nmero
merode
deresultados
resultadospppossveis
Nmero
N
5 240 709
oss
N

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (ii)
Apoio 1 (apenas o resultado)
26.4%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (ii)
Apoio 2 (sugesto)
Na seco 3.3 veja qual das definies de probabilidade se aplica a esta situao.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.1
Alnea (ii)
Apoio 3 (resoluo completa)
Gnero
Masculino
Raa

Feminino

Branca
Negra
Outra

1 726 348
628 309
15 239

2 110 253
753 125
7 435

3 836 601
1 381 434
22 674

TOTAL

2 369 896

2 870 813

5 240 709

Acontecimento N: o indivduo seleccionado negro.


P(N) =

Dashfer
Verlag
McGraw-Hill

TOTAL

N N 1 381 434
=
= 0.264.
N
5 240 709

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (iii)
Apoio 1 (apenas o resultado)
40.3%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (iii)
Apoio 2 (sugesto)
Note que o acontecimento o indivduo seleccionado uma mulher branca equivalente
interseco de dois acontecimentos: o indivduo seleccionado mulher e o indivduo
seleccionado branco.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.1
Alnea (iii)
Apoio 3 (resoluo completa)
Gnero
Masculino
Raa

Feminino

TOTAL

Branca
Negra
Outra

1 726 348
628 309
15 239

2 110 253
753 125
7 435

3 836 601
1 381 434
22 674

TOTAL

2 369 896

2 870 813

5 240 709

Acontecimento M B: o indivduo seleccionado uma mulher branca.

P(M B) =

Dashfer
Verlag
McGraw-Hill

N MB 2 110 253
=
= 0.403.
N
5 240 709

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (iv)
Apoio 1 (apenas o resultado)
73.5%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (iv)
Apoio 2 (sugesto)
Para calcular a probabilidade pretendida, considere que retira um indivduo de uma populao
mais restrita do que a original, apenas constituda por mulheres. Trata-se ento de calcular,
nestas condies, qual a probabilidade de a mulher seleccionada ser de raa branca.
A probabilidade pretendida condicional (ver seco 3.4).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.1
Alnea (iv)
Apoio 3 (resoluo completa)
Gnero
Masculino
Raa

Feminino

TOTAL

Branca
Negra
Outra

1 726 348
628 309
15 239

2 110 253
753 125
7 435

3 836 601
1 381 434
22 674

TOTAL

2 369 896

2 870 813

5 240 709

Acontecimento B: O indivduo seleccionado branco.


Acontecimento M: O indivduo seleccionado mulher.
Recorrendo definio de probabilidade condicional (expresso 3.10), vem

2 110 253
P(B M) 5 240 709 2 110 253
= 0.735.
P(B|M) =
=
=
2 870 813 2 870 813
P(M)
5 240 709

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (v)
Apoio 1 (apenas o resultado)
Em sentido estrito, os acontecimentos no so independentes (na prtica, so quase
independentes).

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.1
Alnea (v)
Apoio 2 (sugesto)
O conceito que est em causa o de independncia entre acontecimentos (ver seco 3.5).

McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.1
Alnea (v)
Apoio 3 (resoluo completa)
Gnero
Masculino
Raa

Feminino

TOTAL

Branca
Negra
Outra

1 726 348
628 309
15 239

2 110 253
753 125
7 435

3 836 601
1 381 434
22 674

TOTAL

2 369 896

2 870 813

5 240 709

Acontecimento M: O indivduo seleccionado mulher.


Acontecimento N: O indivduo seleccionado negro.
P(M N) =
P(M) P(N) =

753 125
= 0.143.
5 240 709
2 870 813 1 381 434

= 0.145.
5 240 709 5 240 709

P(M N) P(M) P(N) M e N no so independentes.


Na realidade, M e N so quase independentes, pois P(M N) P(M) P(N), facto que
resulta de a proporo de mulheres entre indivduos de raa negra ser muito prxima da
proporo de mulheres na populao:
753 125
2 870 813 .

1 381 434
5 240 709

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.2
Apoio 1 (apenas o resultado)
Probabilidade de ganhar o primeiro prmio: 7.15 10 -8.
Probabilidade de ganhar o segundo prmio: 4.29 10 -7.
Probabilidade de ganhar o terceiro prmio: 1.80 10 -5.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.2
Apoio 2 (sugesto)
Considere os seguintes acontecimentos:
6E1:
5E1:
AE2:
NAE2:

Saem as 6 bolas boas, na primeira extraco.


Saem 5 das 6 bolas boas, na primeira extraco.
Acerta-se na restante bola boa, na segunda extraco.
No se acerta na restante bola boa, na segunda extraco.

Defina os acontecimentos A1: Ganhar o primeiro prmio, A2: Ganhar o segundo prmio
e A3: Ganhar o terceiro prmio atravs de

A1 = 6E1 ,
A 2 = 5E1 AE 2
e
A3 = 5E1 NAE 2 .

A definio de probabilidade que se aplica ao acontecimento A1 a clssica. Para calcular os


nmeros de casos favorveis e possveis recorra aos conceitos de Anlise Combinatria revistos
no Apndice 3.1.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.2
Apoio 3 (resoluo completa)
As regras do Totoloto so as seguintes:

ESTATSTICA

2. Edio

Numa aposta simples, escolhem-se (inscrevem-se no boletim) 6 de 49 nmeros


(as bolas correspondentes aos nmeros ficam, a partir de ento, classificadas como
boas as 6 inscritas no boletim ou ms as 43 no seleccionadas).
No dia do sorteio, fazem-se duas extraces das bolas correspondentes
aos 49 nmeros:
g
Primeiro sorteiam-se 6 nmeros bsicos.
g
Depois sorteia-se o nmero suplementar.
Os diferentes prmios obtm-se nas seguintes condies:
g
1. Prmio: Acerta-se nos 6 nmeros bsicos (ou seja, saem as seis bolas boas).
g
2. Prmio: Acerta-se em 5 dos 6 nmeros bsicos (isto , saem 5 das 6 bolas boas).
e acerta-se no nmero suplementar (isto , sai a restante bola boa).
g
3. Prmio: Acerta-se em 5 dos 6 nmeros bsicos (isto , saem 5 das 6 bolas boas)
e no se acerta no nmero suplementar (isto , no sai a restante bola boa).

Seja A1 o acontecimento que corresponde a ganhar o primeiro prmio. Recorrendo definio


clssica, vem
P(A1 ) =

N
merode
deresultados
resultados
favor
veis
Nmero
resultadosfavor
favorveis
1
N
mero
veis
1
=
=
= 7.15 10 -8.
49!
ppossveis
ossveis
veis
N
merode
deresultados
resultadosposs
49
Nmero
N
mero

6 43!6!

Registe-se que de entre todas as combinaes possveis combinaes de 49 seis a seis


s uma favorvel: o que corresponde a sarem as 6 bolas boas e a ficarem de fora as restantes 43.
Note-se ainda que

43!6! 6 5 4 3 2 1
1
=
=
.
49!
49!
49 48 47 46 45 44
43!6!

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

O problema pode ento ser resolvido da forma que se segue. Seja


Bi: A i-sima bola a ser extrada, sendo uma bola boa.
A1 B1 B2 B6

ESTATSTICA

2. Edio

P(A1 ) =
= P(B1 B2 B6 )
= P (B6 (B1 B2 B5 )
= P(B6 |B1 B2 B5 ) P (B5 (B1 B4 )
= P(B6 |B1 B2 B5 ) P(B5 |B1 B4 ) P(B1 B4 )
(...)
= P B6 | ( B1 B2 B5 ) P B5 | ( B1 B4 ) P(B2 |B1 ) P(B1 )

P(B1) = 6/49

(entre as 49 bolas possveis h seis boas que podem


ser extradas)
(entre as 48 bolas que restam, h cinco bolas boas
que podem ser extradas)

P(B2B1) = 5/48
(...)
P(B6(B1 B5) = 1/44

(entre as 44 bolas que restam, h uma nica boa


que pode ser extrada).

Ou seja,

P(A1 ) =

Dashfer
Verlag
McGraw-Hill

6 5 4 3 2 1

= 7.15 10 -8.
49 48 47 46 45 44

CAPTULO 3

Veja-se agora como se procederia para calcular a probabilidade de ganhar o segundo prmio.
Seja
A2: Ganhar o segundo prmio
Ora,

ESTATSTICA

2. Edio

A 2 = 5E1 AE 2 ,
onde
5E1: Saem 5 (das 6) bolas boas, na primeira extraco, e
AE2: Acerta-se na restante bola boa, na segunda extraco.
Recorrendo expresso 3.11, obtm-se

P(A 2 ) = P(5E1 AE 2 ) = P(AE 2 |5E1 ) P(5E1 ).


Por um lado,
6 43

N
mero de resultados favorveis
favorveis 5 1 6 43
Nmero
=
=
P(5E1 ) =
oss veis
Nmero de resultados pposs
Nmero
possveis
49
49
6
6

(notar que de entre todas as combinaes possveis combinaes de 49 seis a seis so


favorveis as que correspondem a sarem 5 bolas boas combinaes de 6 cinco a cinco e,
por cada uma destas, deve figurar uma das restantes 43 bolas combinaes de 43 uma a uma).
Por outro lado,
P(AE 2 |5E1 ) =

Dashfer
Verlag
McGraw-Hill

N
mero de resultados
veis 1
Nmero
resultados favor
favorveis
=
ados poss
Nmero de resulta
ppossveis
oss veis 43
resultados
Nmero

CAPTULO 3

(notar que entre as combinaes possveis tantas quantas as 43 bolas que no saram na
primeira extraco apenas uma favorvel a que corresponde a retirar a nica bola boa
que resta).
Finalmente, substituindo obtm-se:

ESTATSTICA

2. Edio

P(A 2 ) = P(AE 2 |5E1 ) P(5E1 ) =

1 6 43
1
= 6
= 6 P(A1 ) = 4.29 10 -7

43 49
49
6
6

(onde P(A1) representa a probabilidade de ganhar o primeiro prmio).


Procedimento idntico pode ser adoptado para obter a probabilidade do acontecimento A3,
que corresponde a ganhar o terceiro prmio:
A3 = 5E1 NAE 2 ,

onde
5E1:

Saem 5 (das 6) bolas boas, na primeira extraco e

NAE2:

No se acerta na restante bola boa, na segunda extraco.

P(A3 ) = P(5E1 NAE 2 ) = P(NAE 2 |5E1 ) P(5E1 ).

P(5E1 ) =

6 43
(como se viu anteriormente) e
49
6

P(NAE 2 |5E1 ) =

Dashfer
Verlag
McGraw-Hill

N
mero de resultados favorveis
favorveis 42
Nmero
=
oss veis 43
N
mero
de
resultados
Nmero resulttados pposs
possveis

ESTATSTICA

2. Edio

CAPTULO 3

(notar que entre as combinaes possveis tantas quantas as 43 bolas que no saram na
primeira extraco so favorveis as que correspondem a retirar qualquer uma das bolas que
no so boas em nmero de 42).
Ento,
P(A3 ) = P(NAE 2 |5E1 ) P(5E1 )
=

Dashfer
Verlag
McGraw-Hill

42 6 43
1
= 6 42
= 252 P(A1 ) = 1.80 10 -5.

43 49
49
6
6

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.3
Apoio 1 (apenas o resultado)
56.9%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.3
Apoio 2 (sugesto)
Em vez de calcular directamente a probabilidade do acontecimento A: pelo menos duas pessoas
fazem anos no mesmo dia, tente calcul-la a partir da probabilidade do acontecimento
complementar A : todas as pessoas fazem anos em dias diferentes.
Para calcular esta probabilidade admita que as 25 pessoas entram sequencialmente na sala e
defina, para i = 2, 3, ... , 25, o acontecimento
Di: A i-sima pessoa a entrar na sala tem um dia de aniversrio Diferente das pessoas
que a precederam na entrada.
O acontecimento A pode ser definido atravs de
A D2 D3 D24 D25 .

A probabilidade associada a este acontecimento pode ser calculada recursivamente.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.3

2. Edio

Apoio 3 (resoluo completa)


Alternativa 1
A resoluo proposta assenta nas duas hipteses seguintes:

ESTATSTICA

A probabilidade de cada uma das pessoas ter nascido num dia do ano igual de ter
nascido noutro dia qualquer (admitindo que um ano tem 365 dias, aquela probabilidade
1/365 para qualquer dia do ano).
O facto de uma das pessoas ter nascido num dia do ano independente dos dias de
aniversrio das restantes pessoas.

A: Pelo menos duas pessoas fazem anos no mesmo dia.


A: Todas as pessoas fazem anos em dias diferentes.
Admita-se que as 25 pessoas entram sequencialmente na sala e defina-se, para i = 2, 3, , 25,
o acontecimento seguinte:
Di: A i-sima pessoa a entrar na sala tem um dia de aniversrio Diferente das pessoas
que a precederam na entrada.
A D2 D3 D24 D25 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

P(A) =
= P(D2 D25 )
= P (D25 (D2 D3 D24 )

ESTATSTICA

2. Edio

= P(D25 |D2 D3 D24 ) P(D2 D3 D24 )


= P(D25 |D2 D3 D24 ) P (D24 (D2 D3 D23 )
= P(D25 |D2 D24 ) P(D24 |D2 D23 ) P(D2 D23 )
()
= P D25 |(D2 D24 ) P D24 |(D2 D23 ) P(D3 |D2 ) P(D2 ).
P(D2) = 364/365
P(D3D2) = 363/365
P(D4(D2 D3) = 362/365
()
P(D24(D2 D23) = 342/365
P(D25(D2 D24) = 341/365

Dashfer
Verlag
McGraw-Hill

(entre os 365 dias possveis, apenas um o dia


de aniversrio da primeira pessoa a entrar fica
excludo).
(entre os 365 dias possveis, dois deles os dias de
aniversrio das duas primeiras pessoas a entrar, que
so diferentes ficam excludos).
(entre os 365 dias possveis, trs deles os dias de
aniversrio das trs primeiras pessoas a entrar, que so
diferentes ficam excludos).
(entre os 365 dias possveis, vinte e trs deles
os dias de aniversrio das vinte e trs primeiras
pessoas a entrar, que so diferentes ficam excludos).
(entre os 365 dias possveis, vinte e quatro deles
os dias de aniversrio das vinte e quatro primeiras
pessoas a entrar, que so diferentes ficam excludos).

CAPTULO 3

P(A) =

364 363
342 341

= 0.431
365 365
365 365

ESTATSTICA

2. Edio

P(A) = 1 - P(A) = 0.569..

Alternativa 2

P(A) =

Nmero
de resultados
resultados favorveis
N
mero de
favorveis
=
ppossveis
Nmero
de resultados
resultados po
ooss
ss veis
Nmero de

365 A

25
365 A
25

em que
365 A
25

corresponde ao nmero total de sequncias de dias do ano em que as 25 pessoas


podem fazer anos (sendo uma permutao com repeties):
365 A
25

365 A

25

= 36525 ;

corresponde ao nmero total de sequncias de dias do ano em que as 25 pessoas


fazem anos todas em dias diferentes (isto , uma permutao sem repeties):
365 A

25

365!
365!
=
.
340!
(365 25)!

Assim, resulta

365!
P(A) =
= 340! = 0.431.
365 A
36525
25
365 A

Dashfer
Verlag
McGraw-Hill

25

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.4
Apoio 1 (apenas o resultado)
15.4%.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.4
Apoio 2 (sugesto)
Sugesto 1
A definio de probabilidade que se aplica a esta situao a clssica. Para calcular os nmeros
de casos favorveis e possveis recorra aos conceitos de Anlise Combinatria revistos no
Apndice 3.1. Na definio dos casos favorveis ao acontecimento voc e o director financeiro
ficam em lugares adjacentes, verifique quais as posies que o director financeiro pode ocupar
na mesa e quais os lugares adjacentes que correspondem a cada caso. No se esquea de que,
para cada posio ocupada por si e pelo director financeiro, os outros directores podem permutar
as posies entre eles.
Sugesto 2
Considere os seguintes acontecimentos complementares:
Ae: O director financeiro fica num dos extremos.
Am: O director financeiro fica num dos lugares do meio (ou seja, fora dos extremos).
Procure expressar a probabilidade do acontecimento ADJ: Voc e o director financeiro
ficam em lugares adjacentes atravs de P(Ae) e P(Am) segundo um procedimento idntico ao
utilizado no denominador da expresso relativa ao teorema de Bayes (expresso 3.17).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.4

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Alternativa 1
Acontecimento ADJ: Voc (V) e o director financeiro (DF) ficam em lugares adjacentes.
Nmero de resultados possveis: N = P13 = 13!
Para calcular o nmero de resultados favorveis convm distinguir duas situaes:
g

DF fica num dos extremos


Quando DF fica num dos extremos, V s dispe de uma posio adjacente (ver diagrama).
Os outros directores podem, entretanto, permutar entre si. O nmero de resultados
favorveis que correspondem a esta situao ento de P11 = 11!

OUTROS DIRECTORES
(que podem permutar)
DF V

DF fica num dos lugares do meio


Quando DF fica num dos lugares do meio, V dispe de duas posies adjacentes (ver
diagrama seguinte). Para cada uma delas, os outros directores podem, entretanto, permutar
entre si. O nmero de resultados favorveis correspondentes ocupao de um dos lugares
do meio por DF ento de 2 . P11 = 2.11!

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

OUTROS DIRECTORES
(que podem permutar)
()

ESTATSTICA

2. Edio

V DF

DF V

(...)

OUTROS DIRECTORES
(que podem permutar)

Atendendo a que DF pode ocupar 2 lugares situados nos extremos ou 11 lugares do meio,
o nmero de resultados favorveis associados a ADJ vem dado por

N ADJ = 2 P11 + 11 (2 P11 ) = 24 P11 = 24 11!


Finalmente, a probabilidade do acontecimento ADJ vem

P(ADJ) =

N
mero de
de
resultados
favor
veis N ADJ 24 11! 2
Nmero
deresultados
resultadosfavor
favorveis
N
mero
veis
=
=
=
= 0.154.
ppossveis
oss veis
veis
N
mero de
de resultados
resultados
s poss
13!
N
mero
N
13
Nmero
resultados

Alternativa 2
Ae: O director financeiro fica num dos extremos.
Am: O director financeiro fica num dos lugares do meio (ou seja, fora dos extremos).
ADJ: Voc e o director financeiro ficam em lugares adjacentes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Expressando P(ADJ) atravs de P(Ae) e P(Am) segundo um procedimento idntico ao utilizado


no denominador da expresso relativa ao teorema de Bayes (expresso 3.17), vem
P(ADJ) = P(ADJ|A e ) P(A e ) + P(ADJ|A m ) P(A m ).
P(A e ) = 2 / 13

P(ADJ|A e ) = 1 / 12
P(A m ) = 11 / 13
P(ADJ|A m ) = 2 / 12

(dos 13 lugares disponveis para o director financeiro se sentar,


s 2 se situam nos extremos).
(dos 12 lugares que restam depois de o director financeiro se sentar
num dos extremos, s 1 que lhe fica adjacente).
(dos 13 lugares disponveis para o director financeiro se sentar,
so 11 os que se situam no meio).
(dos 12 lugares que restam depois de o director financeiro se sentar
num dos lugares do meio, so 2 os que lhe ficam adjacentes).

P(ADJ) = P(ADJ|A e ) P(A e ) + P(ADJ|A m ) P(A m )


=

1 2
2 11
+
12 13 12 13

2
3
13

= 0.154.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.5
Apoio 1 (apenas o resultado)
7.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.5
Apoio 2 (sugesto)
Em vez de calcular directamente a expresso da probabilidade de entre N msseis enviados
haver pelo menos um que acerta (que a condio de destruio do alvo), tente obter aquela
expresso a partir da que corresponde ao acontecimento complementar (nenhum dos N msseis
enviados acerta no alvo).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.5

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Considerem-se os seguintes acontecimentos:
A:
A:

Entre N msseis enviados, h pelo menos um que acerta no alvo.


Nenhum dos N msseis enviados acerta no alvo.

A probabilidade de um qualquer mssil no acertar 1 0.3 = 0.7. Assim, assumindo como


hiptese subjacente que os resultados associados aos diferentes msseis so independentes uns
dos outros, vem

P(A) = (1 - 0.3) N = 0.7 N


P(A) = 1 - P (A) = 1 - 0.7 N
pelo que
P(A) 0.9 1 - 0.7 N 0.9 .

Esta inequao pode ser resolvida de duas maneiras:


g

Por tentativas
()
N = 6: 1 0.76 = 0.88 < 0.9

O nmero de msseis que deve ser disparado


superior a 6.

N = 7: 1 0.77 = 0.92 > 0.9

O nmero de msseis que deve ser disparado 7.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Recorrendo ao clculo de logaritmos:


1 - 0.7 N 0.9 0.7 N 0.1

ln (0.7 N ) ln (0.1)
N ln (0.7) ln (0.1)
N ( -0.3357) -2.303
N

2.303
= 6.47
0.357

Dado que N inteiro, N = 7 corresponde ao nmero de msseis que devem ser


disparados.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.6
Apoio 1 (apenas o resultado)
Probabilidade de as duas peas serem boas: 42.3%.
Probabilidade de, entre as duas peas, pelo menos uma ser boa: 88.5%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.6
Apoio 2 (sugesto)
Considere os seguintes acontecimentos complementares:
A: As duas peas foram seleccionadas a partir do contentor A.
B: As duas peas foram seleccionadas a partir do contentor B.
Procure expressar a probabilidade do acontecimento 2PB: As 2 Peas seleccionadas so
Boas atravs de P(A) e P(B) segundo um procedimento idntico ao utilizado no denominador
da expresso relativa ao teorema de Bayes (expresso 3.17).
Repita o procedimento para o clculo da probabilidade do acontecimento PM1PB: Pelo
Menos 1 Pea Boa, entre as seleccionadas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.6

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Adopte-se a seguinte notao:
A: As duas peas foram seleccionadas a partir do contentor A.
B: As duas peas foram seleccionadas a partir do contentor B.
2PB: As 2 Peas seleccionadas so Boas.
Expressando P(2PB) atravs de P(A) e P(B) segundo um procedimento idntico ao utilizado
no denominador da expresso relativa ao teorema de Bayes, vem
P(2 PB) = P(2PB|A) P(A) + P(2PB|B) P(B)
(dos 2 contentores disponveis, escolhe-se um deles
P(A) = P(B) = 1 / 2
para retirar as peas).
P(2PB|A) = ?

Considerem-se os seguintes acontecimentos:


PPB: A Primeira Pea seleccionada Boa.
SPB: A Segunda Pea seleccionada Boa.
Ora,

P(2PB) = P(PPB SPB) = P(PPB) P(SPB|PPB).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Se as peas forem seleccionadas a partir de A:


P(PPB) = 10/13
P(SPB|PPB) = 9/12

ESTATSTICA

2. Edio

P(2PB|A) =

(das 13 peas includas no contentor A, 10 so boas).


(das 12 peas que restam no contentor A depois de ter sido
retirada uma pea boa, 9 so boas).

10 9
.
13 12

Se as peas forem seleccionadas a partir de B vir:

P(2PB|B) =

7 6
.
13 12

Ento
P(2PB) = P(2PB|A ) P(A) + P(2PB|B) P(B)
10 9 1 7 6 1
= +
13 12 2 13 12 2
= 0.423 (primeiro dos resultados pretendidos).
Para responder segunda questo, adopte-se a seguinte notao:
PM1PB: Pelo Menos 1 Pea Boa, entre as seleccionadas.
1 (e s 1) Pea Boa, entre as seleccionadas.
1PB:
2PB:
2 Peas seleccionadas so Boas.
Dado que os acontecimentos 1PB e 2PB so mutuamente exclusivos, vem
P(PM1PB) = P(1PB 2PB) = P(1PB) + P(2PB).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Ora, P(2PB) = 0.423 (ver resultado obtido anteriormente). Falta o valor de P(1PB) que pode
ser obtido do seguinte modo:

ESTATSTICA

2. Edio

P(1PB) = P(1PB|A) P(A) + P(1PB|B) P(B).


Como P(A) = P(B) = 1 / 2 falta calcular P(1PB|A) e P(1PB|B).
Seja:
PPB:
PPD:
SPB:
SPD:

A Primeira Pea seleccionada Boa.


A Primeira Pea seleccionada Defeituosa.
A Segunda Pea seleccionada Boa.
A Segunda Pea seleccionada Defeituosa.

Assim,

P(1PB) = P (PPB SPD) + P(PPD SPB)


= P(PPB) P(SPD|PPB) + P (PPD) P (SPB|PPD)
Se as peas forem seleccionadas a partir de A, resulta
P(PPB) = 10/13
P(SPD|PPB) = 3/12

(das 13 peas includas no contentor A, 10 so boas).


(das 12 peas que restam no contentor A depois de ter
sido retirada uma pea boa, 3 so defeituosas).
P(PPD) = 3/13
(das 13 peas includas no contentor A, 10 so boas).
P(SPB|PPD) = 10/12 (das 12 peas que restam no contentor A depois de ter
sido retirada uma pea boa, 2 so defeituosas).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

pelo que

ESTATSTICA

2. Edio

P(1PB|A) =

10 3
3 10
+
= 0.385.
13 12 13 12

Se as peas forem seleccionadas a partir de B, ser ento

P(1PB|B) =

7 6
6 7
+
= 0.538.
13 12 13 12

Assim,
P(1PB) = P(1PB|A) P(A) + P(1PB|B) P(B) = 0.385 0.5 + 0.538 0.5
= 0.462.
Como
P(PM1PB) = P(1PB) + P(2PB),
resulta, finalmente,
P(PM1PB) = 0.462 + 0.423 = 0.885 (segundo resultado pretendido).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.7
Alnea (i)
Apoio 1 (apenas o resultado)
25%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.7
Alnea (i)
Apoio 2 (sugesto)
Desenhe a rvore de resultados.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.7

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Considerem-se os acontecimentos:
S:
C:
PS:
PC:
BE:

Faz sol.
Chove.
O barmetro prev sol.
O barmetro prev chuva.
O barmetro erra a previso.

Representa-se em seguida a rvore de resultados correspondente:


PS|S (0.70)

S (0.75)
PC|S (0.30)

C (0.25)

PS|C (0.10)

PC|C (0.90)

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Assim,
P(BE) = P(S PC) + P(C PS)
= P(S ) P(PC|S) + P(C) P(PS|C)
= 0.75 0.30 + 0.25 0.10
= 0.25.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.7
Alnea (ii)
Apoio 1 (apenas o resultado)
50%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.7
Alnea (ii)
Apoio 2 (sugesto)
Desenhe a rvore de resultados e aplique o teorema de Bayes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.7

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Considerem-se os acontecimentos:
S:
C:
PS:
PC:

Faz sol.
Chove.
O barmetro prev sol.
O barmetro prev chuva.

Representa-se em seguida a correspondente rvore de resultados:


PS|S (0.70)

S (0.75)
PC|S (0.30)

C (0.25)

PS|C (0.10)

PC|C (0.90)

Dashfer
Verlag
McGraw-Hill

Assim,

P(S|PC) =

ESTATSTICA

2. Edio

CAPTULO 3

P(S PC)
P( PC )

P(S) P(PC|S)
P(S) P( PC |S) + P(C) P(PC|C)

0.75 0.30
0.75 0.30 + 0.25 0.90

= 0.5.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.8
Apoio 1 (apenas o resultado)
16%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.8
Apoio 2 (sugesto)
Desenhe a rvore de resultados e aplique o teorema de Bayes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.8

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Adopte-se a seguinte notao:
A:
B:
C:
D:
ND:

A pea produzida pela mquina A.


A pea produzida pela mquina B.
A pea produzida pela mquina C.
A pea Defeituosa.
A pea No-Defeituosa.

Representa-se em seguida a correspondente rvore de resultados:


D|A (0.02)

A (0.60)

ND|A (0.98)
D|B (0.03)

B (0.30)
ND|B (0.97)
C (0.10)

D|C (0.04)

ND|C (0.96)

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Assim,
P(C|D) =

P (C D )
P(D)

P(C) P(D|C)
P( A) P(D|A) + P(B) P(D|B) + P(C) P(D|C)

0.10 0.04
0.60 0.02 + 0.30 0.03 + 0.10 0.04

= 0.16.

Note-se que este resultado est de acordo com aquilo que era de esperar. De facto, dado que
a percentagem de peas defeituosas maior na mquina C do que nas outras duas, a probabilidade
condicional P(C|D) teria de ser maior do que a probabilidade incondicional P(C).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.9
Apoio 1 (apenas o resultado)
79.4%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.9
Apoio 2 (sugesto)
Desenhe a rvore de resultados e aplique o teorema de Bayes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.9

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja,
FE:
FNE:
DFE:
DFNE:

Acidente causado por Falha Estrutural.


Acidente causado por Falha No-Estrutural.
Diagnosticada Falha Estrutural.
Diagnosticada Falha No-Estrutural.

Representa-se em seguida a correspondente rvore de resultados:


DFE|FE (0.80)

FE (0.42)
DFNE|FE (0.20)

DFE|FNE (0.15)
FNE (0.58)

DFNE|FNE (0.85)

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Assim,

P(FE|DFE) =

P(FE DFE)
P(DFE)

P(FE) P(DFE|FE)
P(FE) P(DFE|FE) + P(FNE) P(DFE|FNE)

0.42 0.80
0.42 0.80 + 0.58 0.15

= 0.794.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.10
Apoio 1 (apenas o resultado)
10.7%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.10
Apoio 2 (sugesto)
Procure especificar os acontecimentos. Note que os acontecimentos so independentes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Problema 3.10
Apoio 3 (resoluo completa)
Num total de 8 chaves, 3 abrem a porta e 5 no abrem. Seja,
In :

Insucesso na n-sima tentativa de abertura da porta.

S n:

Sucesso na n-sima tentativa de abertura da porta.

AB4: Abertura da porta quarta tentativa.


Assim,
P(AB4) = P(I1 I 2 I3 S4 )
= P (S4 (I1 I 2 I3 )
= P(S4 |I1 I 2 I3 ) P(I1 I 2 I3 )
= P(S4 |I1 I 2 I3 ) P(I3 |I1 I 2 ) P(I1 I 2 )
= P(S4 |I1 I 2 I3 ) P(I3 |I1 I 2 ) P(I 2 |I1 ) P(I1 ).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

ESTATSTICA

2. Edio

Ora,
P(I1 ) =

Nmero
de resultados
resultados favor
favorveis
N
mero de
veis 5
=
oss veis 8
N
mero de resultados
Nmero
resultados ppossveis

P(I 2 |I1 ) =

Nmero
de resultados
resultados favorveis
N
mero de
favorveis 4
=
ppossveis
oss veis 7
mero
Nmer
o de resultados poss
Nmero

P(I3 |I1 I 2 ) =

resultados
Nmero
de resulta
N
mero de
dos favorveis
favorveis 3
=
ppossveis
oss veis 6
Nmero de resultados poss
Nmero

P(S4 |I1 I 2 I3 ) =

Nmero
de resultados
resultados favorveis
N
mero de
favorveis 3
=
Nmero
de resultados
resultados ppossveis
oss veis 5
Nmero de

Assim, resulta finalmente

P(AB4) =

Dashfer
Verlag
McGraw-Hill

3 3 4 5 3
=
= 0.107.
5 6 7 8 28

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.11
Apoio 1 (apenas o resultado)
43.75%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.11
Apoio 2 (sugesto)
Tente fazer uma representao grfica do problema e recorra ao conceito de probabilidade
geomtrica.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.11
Apoio 3 (resoluo completa)
Representao grfica do problema:

ESTATSTICA

2. Edio

13h

Hora de
chegada do
estudante 2

S
A
A

12h
12h
13h
Hora de chegada do estudante 1

Espao amostral (S): Quadrado sombreado claro, que inclui 16 quadrados elementares
com hora de lado.
Acontecimento A (O encontro realiza-se): Polgono sombreado escuro.
Assim,
P(A) =

` rea de A 7W
7
rea
=
=
= 0.4375,
` rea de S 16W 16
rea

onde representa a rea de um quadrado elementar de 1/4 hora de lado.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.12
Apoio 1 (apenas o resultado)
38.6%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.12
Apoio 2 (sugesto)
Desenhe a rvore de resultados e aplique o teorema de Bayes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.12

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja:
A:
B:
C:
S:
I:

Um utilizador cliente de A.
Um utilizador cliente de B.
Um utilizador cliente de C.
Um utilizador est Satisfeito.
Um utilizador est Insatisfeito.

Representa-se em seguida a correspondente rvore de resultados:


S|A (?)

A (0.41)

I|A (?)
S|B (?)

B (0.38)
I|B (?)
C (0.21)

S|C (?)

I|C (?)

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Alternativa 1
Se 17% dos utilizadores esto insatisfeitos, ento:
P(A) P(I|A) + P (B) P (I|B) + P(C) P(I|C) = 0.17.

ESTATSTICA

2. Edio

Dado que P(A) = 0.41, P(B) = 0.38 e P(C) = 0.21, vem


0.41 P(I|A) + 0.38 P (I|B) + 0.21 P(I|C) = 0.17.

Como 35% dos utilizadores insatisfeitos so clientes de A, resulta


P(I A)
= 0.35,
P(A) P(I|A) + P(B) P(I|B) + P(C) P(I|C)
ou seja,
P(A) P(I|A)
= 0.35.
P(A) P(I|A) + P(B) P(I|B) + P(C) P(I|C)
Substituindo, vem

0.41 P(I|A)
= 0.35,
0.17
P(I|A) =

0.35 0.17
= 0.145
0.41

P(S|A) = 1 - P(I|A) = 1 - 0.145 = 0.855.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Por outro lado, 35% dos utilizadores insatisfeitos so clientes de B. Assim,


P(B) P(I|B)
= 0.35
P(A) P(I|A) + P(B) P(I|B) + P(C) P(I|C)

ESTATSTICA

2. Edio

ou seja,

0.38 P(I|B)
= 0.35,
0.17
P(I|B) =

0.35 0.17
= 0.157
0.38

P(S|B) = 1 - P(I|B) = 1 - 0.157 = 0.843.


Finalmente, 30% dos utilizadores insatisfeitos so clientes de C. Assim,
P(C) P(I|C)
= 0.30
P(A) P(I|A) + P(B) P(I|B) + P(C) P(I|C)
ou seja,

0.21 P(I|C)
= 0.30,
0.17
P(I|C) =

Dashfer
Verlag
McGraw-Hill

0.30 0.17
= 0.243
0.21

CAPTULO 3

P(S|C) = 1 - P(I|C) = 1 - 0.243 = 0.757.

ESTATSTICA

2. Edio

Substituindo na expresso seguinte (que d a probabilidade de um cliente satisfeito estar


ligado rede da empresa B)
P(B|S) =

P(B) P(S|B)
P(A) P(S|A) + P(B) P(S|B) + P (C) P (S|C)

os valores calculados, obtm-se:


0.38 0.843
0.41 0.855 + 0.38 0.843 + 0.21 0.757
P(B|S) = 0.386.
P(B|S) =

Alternativa 2

P(B) = P(B S) + P(B I)


= P(B | S) P(S) + P(B | I) P(I)
Assim,
P(B|S) =

Dashfer
Verlag
McGraw-Hill

P(B) - P(B | I) P(I)


P(S)
0.38 - 0.35 0.17
= 0.386.
0.83

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.13
Apoio 1 (apenas o resultado)
7.4%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 3

Problema 3.13
Apoio 2 (sugesto)
Desenhe a rvore de resultados e aplique o teorema de Bayes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Problema 3.13

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Considerem-se os seguintes acontecimentos:
AD:
AL:
AP:
AC:
AT:
AM:
BD:
BL:
BP:
BC:
BT:
BM:
AA:
AF:
BA:
BF:

Ao jogador A sai a pergunta de Desporto.


Ao jogador A sai a pergunta de Literatura.
Ao jogador A sai a pergunta de Poltica.
Ao jogador A sai a pergunta de Cinema.
Ao jogador A sai a pergunta de Telenovela.
Ao jogador A sai a pergunta de Msica.
Ao jogador B sai a pergunta de Desporto.
Ao jogador B sai a pergunta de Literatura.
Ao jogador B sai a pergunta de Poltica.
Ao jogador B sai a pergunta de Cinema.
Ao jogador B sai a pergunta de Telenovela.
Ao jogador B sai a pergunta de Msica.
O jogador A Acerta a resposta.
O jogador A Falha a resposta.
O jogador B Acerta a resposta.
O jogador B Falha a resposta.

Assim,

P [(AD BD)|(AA BF)] =


=

Dashfer
Verlag
McGraw-Hill

P [(AD BD) (AA BF)]


P(AA BF)
P(AD BD AA BF)
.
P(AA BF)

CAPTULO 3

ESTATSTICA

2. Edio

Reordenando os termos do numerador e admitindo que os acontecimentos AA e BF so


independentes, vem
P [(AD BD)|(AA BF)] =

P(AD AA BD BF)
P(AA) P(BF)
P [(AD AA) (BD BF)]
P(AA) P(BF)

Admitindo que os acontecimentos (AD AA) e (BD BF) so independentes, obtm-se


P [(AD BD)|(AA BF)] =

P(AD AA) P(BD BF)


P(AA) P(BF)

P(AD AA) P(BD BF)

P(BF)
P(AA)

ou seja,
P [(AD BD)|(AA BF)] = P(AD|AA) P(BD|BF).

Dashfer
Verlag
McGraw-Hill

CAPTULO 3

Calcula-se em seguida P(AD|AA) recorrendo a uma rvore de resultados:


A|D (0.90)

ESTATSTICA

2. Edio

F|D (0.10)
D (1/6)

A|L (0.10)
F|D (0.90)

(...)
M (1/6)

A|M (0.30)
F|D (0.70)

Assim,

P(AD|AA) =

P(AD AA)
P(AA)

P(AD|AA) =

P(AD) P (AA|AD)
P(AD) P (AA|AD) + P(AL) P(AA|AL) + + P(AM) P(AA|AM)

Dashfer
Verlag
McGraw-Hill

(1 / 6) 0.90
= 0.346.
(1 / 6) 0.90 + (1 / 6) 0.10 + + (1 / 6) 0.30

CAPTULO 3

ESTATSTICA

2. Edio

Calcule-se agora P(BD|BF):

P(BD|BF) =

P(BD BF)
P(BF)

P(BD|BF) =

P(BD) P(BF|BD)
P(BD) P(BF|BD) + P(BL) P(BF|BL) + + P(BM) P(BF|BM))

(1 / 6) (1 - 0.40)
= 0.214.
(1 / 6) (1 - 0.40) + (1 / 6) (1 - 0.50) + + (1 / 6) (1 - 0.85)

Como
P [(AD BD)|(AA BF)] = P(AD|AA) P(BD|BF)
vem, finalmente
P [(AD BD)|(AA BF)] = 0.346 0.214
= 0.074.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

ESTATSTICA

2. Edio

Captulos

Captulo 4
Problemas
4.1
(i)

4.1 4.1 4.1 4.2 4.2 4.2 4.3 4.3 4.3


4.6 4.6 4.6 4.7 4.7 4.7
4.4 4.5
(ii) (iii) (iv) (i) (ii) (iii) (i) (ii) (iii)
(i) (ii) (iii) (i) (ii) (iii)

n.a.

n.a.

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

n.a. = no aplicvel

Dashfer
Verlag
McGraw-Hill

n.a.

n.a.

n.a.

n.a.

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.1
Alnea (i)
Apoio 2 (sugesto)
Na seco 3.2 veja qual a definio de espao amostral.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.1
Alnea (i)
Apoio 3 (resoluo completa)
Espao amostral: conjunto constitudo pelos seguintes elementos:
AB

AC

AD

AE

AF

AG

BC

BD

BE

BF

BG

CD

CE

CF

CG

DE

DF

DG

EF

EG
FG

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.1
Alnea (ii)
Apoio 2 (sugesto)
Na seco 4.1 veja como definir uma aplicao de um espao amostral sobre um conjunto de
chegada qualquer (que corresponde ao conceito de varivel aleatria).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.1
Alnea (ii)
Apoio 3 (resoluo completa)
A varivel aleatria Y corresponde ao nmero de mulheres. No diagrama seguinte indicam-se os
valores que a varivel Y toma para todos os elementos do espao amostral.
AB

Y=0

AC

AD

AE

AF

AG

BC

BD

BE

BF

BG

CD

CE

CF

CG

DE

DF

DG

EF

EG
FG

Dashfer
Verlag
McGraw-Hill

Y=1

Y=2

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.1
Alnea (iii)
Apoio 2 (sugesto)
Na seco 4.2 veja qual a definio de funo de probabilidade (denotada por p(y)) e de funo
de distribuio (F(y)) de uma varivel aleatria discreta Y. Note que a funo de distribuio
corresponde a uma funo de probabilidade acumulada.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.1
Alnea (iii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


P(y): funo de probabilidade de Y
F(y): funo de distribuio de Y
Representao na forma tabular:
Y

F(y)

p(y)

10
21

0.476

10
21

0.476

10
21

0.476

20
21

0.952

1
21

0.048

1.000

Representao atravs de diagramas de barras:


1.0

1.0

p (y)

F (y)

0.5

0.5

0.0

0.0
0

y = n. de mulheres

Dashfer
Verlag
McGraw-Hill

y = n. de mulheres

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.1
Alnea (iv)
Apoio 1 (apenas o resultado)
Valor esperado: 0.572
Desvio padro: 0.584
Coeficiente de assimetria: 0.442.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.1
Alnea (iv)
Apoio 2 (sugesto)
Na Seco 4.5 veja quais as definies e as respectivas expresses dos parmetros valor esperado
(que se denota por Y), desvio padro (Y) e coeficiente de assimetria (1Y) de uma varivel
aleatria discreta Y.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.1

ESTATSTICA

2. Edio

Alnea (iv)
Apoio 3 (resoluo completa)
2

E(Y ) = mY =

y p ( y) = 0 0.476 + 1 0.476 + 2 0.048 = 0.572


y =0

Var(Y ) = s Y2 =

( y - m ) p ( y) = (0 - 0.572)
Y

0.476 + (1 - 0.572)2 0.476 +

y =0

+ (2 - 0.572)2 0.048 = 0.341

s Y = 0.341 = 0.584
22

( (yy-mY) ) pp( (yy))

m33 y =y 0= 0
=
g=
1YY = 33 =
sYY
=

sY3Y3

==

1
3
3
3
0 - 0.572 ) 0.476 + (1 - 0.572 ) 0.476 + (2 - 0.572 ) 0.048
(

0.584

= 0.442.

Dashfer
Verlag
McGraw-Hill

33

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (i)
Apoio 1 (apenas o resultado)
P(t > 2) = 13.5%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (i)
Apoio 2 (sugesto)
Na seco 4.3 veja qual a definio de funo densidade de probabilidade e qual a expresso
que traduz a probabilidade de uma varivel aleatria contnua qualquer tomar um valor situado
num intervalo [a, b].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (i)
Apoio 3 (resoluo completa)
+

P(t > 2) = et d t =et


2

Dashfer
Verlag
McGraw-Hill

=0 + e2 =0.135.
2

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (ii)
Apoio 1 (apenas o resultado)
P(t > 3) = 4.98%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (ii)
Apoio 2 (sugesto)
Na seco 4.3 veja qual a definio de funo densidade de probabilidade e qual a expresso
que traduz a probabilidade de uma varivel aleatria contnua qualquer tomar um valor situado
num intervalo [a, b].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (ii)
Apoio 3 (resoluo completa)
+

P(t > 3) =

e
3

Dashfer
Verlag
McGraw-Hill

- Dt

d Dt = - e - Dt

= 0 + e -3 = 0.0498 .

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (iii)
Apoio 1 (apenas o resultado)
13.5%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.2
Alnea (iii)
Apoio 2 (sugesto)
A probabilidade pretendida condicional (ver definio na seco 3.1, expresso 3.10).

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

ESTATSTICA

2. Edio

Problema 4.2
Alnea (iii)
Apoio 3 (resoluo completa)
P(t > 3 | t >1) =

P ( Dt > 3 Dt > 1)
P ( Dt > 1)

P ( Dt > 3)
P ( Dt > 1)

e -3
= e -2 = P ( Dt > 2 ) = 0.135
e -1

Em geral,

P Dt > t + T Dt > t =

Dashfer
Verlag
McGraw-Hill

e - (t + T )
= e -T = P ( Dt > T ) .
e-t

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.3
Alnea (i)
Apoio 3 (resoluo completa)
f(x)
0,5

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.3
Alnea (ii)
Apoio 1 (apenas o resultado)
P ( X 1.50 ) = 68.8%
P ( X 2.0 ) = 11.1%
P (1.0 X 2.5) = 57.7% .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.3
Alnea (ii)
Apoio 2 (sugesto)
As probabilidades pretendidas correspondem s reas delimitadas pela funo densidade de
probabilidade e pelos limites em questo da varivel aleatria.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.3
Alnea (ii)
Apoio 3 (resoluo completa)
1.5

2. Edio

P ( X 1.50 ) =

27 (9 x - 6 x

+ x 3 ) dx

1.5

ESTATSTICA

4 6 3 4 1 4
4 9
= x2 x +
x
27
2
27
3
27 4 0

1.5

8 3 1 4
2
= x2 x +
x
27
27 0
3
= 0.688 .

P ( X 2.0 ) = 1 - P ( X < 2.0 )


2

8 3 1 4
2
= 1 - x2 x +
x
27
27 0
3

= 1 0.889 = 0.111.
P (1.0 X 2.5) = P ( X 2.5) - P ( X 1.0 )
2.5

8 3 1 4
2
= x2 x +
x
27
27 1.0
3
= 0.984 - 0.407 = 0.577.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.3
Alnea (iii)
Apoio 2 (sugesto)
A funo de distribuio corresponde a uma funo de probabilidade acumulada, que pode ser
obtida integrando a funo de densidade.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.3
Alnea (iii)
Apoio 3 (resoluo completa)
x

F ( x) =

-
x

2. Edio

ESTATSTICA

f (u) du
x

8
1
4
2
F ( x ) = . (9u - 6u2 + u3 ) du = u2 - u3 + u 4
27
27
27 0
3

2 2 8 3 1 4
x x +
x .
3
27
27

Para verificar se esta expresso est correcta recorde-se que


+

lim F ( x ) =

Neste caso,

F(3) =

f (u) du = 1.

2 2 8 3 1 4
3 - 3 + 3 = 1.
3
27
27
F(x)

0.5

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.4
Apoio 1 (apenas o resultado)
Y = 67.2 C
Y = 3.89 C.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.4
Apoio 2 (sugesto)
Na seco 4.6 veja como se calculam os parmetros valor esperado e desvio padro de uma
varivel transformada a partir dos parmetros correspondentes da distribuio da varivel original
respectiva. Note que neste exerccio a transformao linear.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.4
Apoio 3 (resoluo completa)
Considere a correspondncia entre a escala centgrada e a escala Fahrenheit:

2. Edio

ESTATSTICA

100

212

32
0

Se Y representar temperatura em C e X a temperatura em F, a expresso que permite efectuar


a converso de uma escala na outra a seguinte:

Y
X - 32
5
=
Y = X - 17.8.
100
180
9
Assim,

E (Y ) =

5
5
E ( X ) - 17.8 = 153 - 17.8 = 67.2 C,
9
9
2

25 2
5
Var (Y ) = Var ( X ) =
7 = 15.12
9
81
e
s Y = 15.12 = 3.89 C.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.5
Apoio 1 (apenas o resultado)
N = 124.46
N = 0.771.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.5
Apoio 2 (sugesto)
Uma vez que se est perante uma transformao N = (V) no-linear, verifique se esta pode ser
aproximada em torno do valor esperado de V. Na seco 4.6 veja quais as expresses do valor
esperado e da varincia neste tipo de transformaes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.5

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
N: cota a montante [m]
V: volume de gua armazenada [106 m3]
V0 = 400 [106 m3].
Sabe-se que
E(V) = 20
e que
Var (V) = 225.
Ora,
V = V0 + DV ,

e portanto
E (V ) = E (V0 ) + E ( DV ) = 400 + 20 = 420 .

Do mesmo modo

Var(V ) = Var(V0 ) + Var( DV ) = Var( DV ) = 225.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Sabendo que
N = f (V ) = 75.22 + 0.2511 V - 0.000481 V 2 + 0.386 10 -6 V 3 ,
vem

ESTATSTICA

2. Edio

E ( N ) = E f (V ) f E (V )
E ( N ) 75.22 + 0.2511 E (V ) - 0.000481 E (V )2 + 0.386 10 -6 E (V )3
E ( N ) 75.22 + 0.2511 420 - 0.000481 4202 + 0.386 10 -6 4203
= 124.46.
Do mesmo modo

dN
Var ( N ) = Var f (V )
dV

Var (V ).
V = E (V )

Como

dN
= 0.2511 - 2 0.000481 V + 3 0.386 10 -6 V 2
dV
dN
= 0.2511 - 2 0.000481 420 + 3 0.386 10 -6 4202 = 0.0514 ,
dV V = E (V )
resulta
Var ( N ) 0.05142 225 = 0.59
s N 0.59 = 0.771.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Note que a transformao N = f (V) no-linear, mas os clculos foram efectuados com base
numa aproximao linear da relao entre V e N em torno do ponto v = mV . A razoabilidade
desta opo pode verificar-se no diagrama seguinte.
N[m]
128.00

ESTATSTICA

2. Edio

127.00
126.00
125.00
124.00
123.00
122.00
121.00
360

380

400

420

440

E(V)

E(V) 3VV

460 V [10 m3 ]
6

E(V) + 3VV

Na tabela que se segue apresentam-se os valores assinalados no grfico.

Dashfer
Verlag
McGraw-Hill

122.10

375

122.89

390

123.66

405

124.46

420

125.20

435

125.99

450

126.79

465

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.6
Alnea (i)
Apoio 1 (apenas o resultado)
33 000.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.6
Alnea (i)
Apoio 2 (sugesto)
Na seco 4.5 veja qual a definio e a respectiva expresso, do parmetro valor esperado (que
se denota por Y) de uma varivel aleatria discreta Y.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.6
Alnea (i)
Apoio 3 (resoluo completa)
Seja Y a varivel aleatria que representa o nmero de espectadores. Ento
3

E(Y ) = mY =

y p ( y) = 5000 0.20 + 20 000 0.20 + 30 000 0.10 + 50 000 0.50


y =0

= 33 000.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.6
Alnea (ii)
Apoio 1 (apenas o resultado)
A organizao deve realizar o concerto desde que no se importe de correr riscos.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.6
Alnea (ii)
Apoio 2 (sugesto)
O lucro corresponde diferena entre receitas e custos. Se o valor esperado do lucro for positivo
a organizao dever avanar com o concerto. Na seco 4.6 veja como se calcula o valor
esperado de uma varivel transformada a partir dos parmetros das distribuies das variveis
originais. Note que se est perante uma transformao linear.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.6
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja,
Y: n. de espectadores
L: lucro do concerto [contos].
Ora,
Lucro (L) = Receitas Custos.
Como
Receitas = 4 . 5 . Y [euros]
Custos = 1 . 0 . Y + 75 000 + 30 000 [euros],
resulta
Lucro = 4 . 5 . Y (1 . 0 . Y + 105 000) = 3 . 5 . Y 105 000 [euros],
cujo valor esperado :
E(L) = L= 3 . 5 . E(Y) 105 000 = 3 . 5 . 33 000 105 000 = 10 500 [euros]
Uma vez que o valor esperado do lucro positivo, se a organizao for indiferente ao risco
deve realizar o concerto. Note-se que s dever haver concerto se o nmero de espectadores for
superior a 30000, dado que a partir deste nvel o valor esperado do lucro positivo.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.6
Alnea (iii)
Apoio 1 (apenas o resultado)
A organizao no deve cancelar o concerto, desde que no se importe de correr riscos.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.6
Alnea (iii)
Apoio 2 (sugesto)
Compare o valor esperado do lucro que se obtm com a realizao do concerto com o que
resulta do seu cancelamento. A situao que corresponde a um lucro maior a que se recomenda.
Registe-se que ambas as situaes podem levar a perdas, devendo, neste caso, ser seleccionada
a alternativa que minimiza as perdas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.6
Alnea (iii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja,
Y: n. de espectadores
L: lucro do concerto.
De acordo com as novas previses atmosfricas, o valor esperado do nmero de espectadores
ser:
3

E(Y ) = mY =

y p ( y) = 5000 0.30 + 20 000 0.20 + 30 000 0.20 + 50 000 0.30 = 26 500.


y =0

O lucro do concerto ser dado por


Lucro (L) = Receitas Custos.
Considerem-se separadamente as seguintes situaes:
g

O concerto realiza-se.
Receitas = 4.5 Y [euros]
Custos = 1.0 Y + 75 000 + 30 000 [euros]
Lucro = 4.5 Y (1.0 Y +105 000) = 3.5 Y 105 000 [euros]
E(L) = L = 3.5 E(Y) 105 000 = 3.5 26 500 105 000 = 12 250 [euros]

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

O concerto cancelado.
Receitas = 0 [euros]
Custos = 15 000 + 7500 = 22 500 [euros]
Lucro = 22 500 [euros]

Se a organizao no for avessa ao risco em demasia, dever avanar com a realizao do


concerto. Embora apresente um lucro com valor esperado negativo (prejuzo), corresponde
situao que minimiza o valor esperado das perdas, com um valor de 22 500 euros.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (i)
Apoio 1 (apenas o resultado)
P (0 ) = 0.00075

F (0 ) = 0.00075

P (1) = 0.02525

F (1) = 0.026

P (2 ) = 0.24725

F (2 ) = 0.27325

P (3) = 0.72675

F (3) = 1.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (i)
Apoio 2 (sugesto)
Na seco 4.2 veja qual a definio de funo de probabilidade (denotada por p(y)) e de funo
de distribuio (F(y)) de uma varivel aleatria discreta Y. Note que a disponibilidade de um
veculo independente da dos outros.

Dashfer
Verlag
McGraw-Hill

CAPTULO 4

Problema 4.7

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A varivel aleatria Y representa o nmero de veculos disponveis por dia. Considerem-se os
seguintes acontecimentos:
VN: o veculo mais novo encontra-se disponvel num determinado dia
VA: o veculo mais antigo encontra-se disponvel num determinado dia
VT: o terceiro veculo encontra-se disponvel num determinado dia.
Note que VN, VA e VT so acontecimentos independentes. Assim, a funo probabilidade
vem:

) ( ) ( ) ( )

P(Y = 0) = P VN VA VT = P VN P VA P VT

( )
P (VA ) = 1 - P (VA ) = 1 - 0.85 = 0.15
P (VT ) = 1 - P (VT ) = 1 - 0.90 = 0.10
P VN = 1 - P (VN ) = 1 - 0.95 = 0.05

P(Y = 0) = 0.05 0.15 0.10 = 0.00075

) (

) (

P(Y = 1) = P VN VA VT VN VA VT VN VA VT

= 0.95 0.15 0.10 + 0.05 0.85 0.10 + 0.05 0.15 0.90 = 0.02525

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

) (

) (

P(Y = 2) = P VN VA VT VN VA VT VN VA VT

= 0.95 0.85 0.10 + 0.95 0.15 0.90 + 0.5 0.85 0.90 = 0.24725
P(Y = 3) = P (VN VA VT ) = P (VN ) P (VA ) P (VT )

= 0.95 0.85 0.90 = 0.72675.


Calcule-se agora a funo distribuio:
F (0 ) = P (Y 0 ) = P (Y = 0 ) = 0.00075
F (1) = P (Y 1) = P (Y = 0 ) + P (Y = 1) = 0.00075 + 0.02525 = 0.026
F (2 ) = P (Y 2 ) = P (Y = 0 ) + P (Y = 1) + P (Y = 2 )

= 0.00075 + 0.02525 + 0.24725 = 0.27325


F (3) = P (Y 3) = 1.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (ii)
Apoio 1 (apenas o resultado)
mY = 2.7
s Y = 0.515 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (ii)
Apoio 2 (sugesto)
Na seco 4.5 veja quais as definies e respectivas expresses dos parmetros valor esperado
(que se denota por mY ) e desvio padro (s Y ) de uma varivel aleatria discreta Y.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (ii)
Apoio 3 (resoluo completa)
3

mY =

y. p ( y) = 0.02525 1 + 0.24725 2 + 0.72675 3 = 0.02525 + 0.49455 + 2.18025 = 2.7


y =0

s Y2 =

y =0

y =0

2
( y - mY ) . p ( y) = y2 . p ( y) - mY2

= 0.02525 1 + 0.24725 22 + 0.72675 32 - mY2

= 0.02525 + 0.989 + 6.54075 - 7.29 = 0.265


s Y = 0.265 = 0.515 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (iii)
Apoio 1 (apenas o resultado)
Valor esperado: 135 [/dia]
Desvio Padro: 25.7 [/dia].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (iii)
Apoio 2 (sugesto)
O lucro uma funo linear da varivel Y. Na seco 4.6 veja como se calculam o valor esperado
e o desvio-padro de uma varivel transformada a partir dos parmetros das distribuies das
variveis originais.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 4

Problema 4.7
Alnea (iii)
Apoio 3 (resoluo completa)
O lucro lquido dirio / = 50 <. O respectivo valor esperado e desvio padro vm:

E ( L ) = 50 E (Y ) = 50 2.7 = 135 [/dia]


s L = Var( L ) = 502 Var(Y ) = 662.5 = 25.7 [ /dia ].

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

ESTATSTICA

2. Edio

Captulos

Captulo 5
Problemas
5.1 5.1 5.1 5.2 5.2 5.2 5.2
5.5 5.5 5.5 5.6 5.6 5.6 5.6 5.6 5.6
5.3 5.4
5.7
(i) (ii) (iii) (i) (ii) (iii) (iv) (v) (vi)
(i) (ii) (iii) (i) (ii) (iii) (iv)

Apoio 1
(apenas o n.a. n.a.
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

n.a. = no aplicvel

Dashfer
Verlag
McGraw-Hill

n.a.

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.1
Alnea (i)
Apoio 2 (sugesto)
Procure definir duas aplicaes sobre o espao amostral (constitudo pelos resultados da
experincia lanamento da moeda E-C trs vezes ao ar), em que uma delas especifica a varivel
aleatria X e a outra especifica a varivel aleatria Y. De seguida, na seco 5.2, veja qual a
definio de funo conjunta de probabilidade.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.1
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Na tabela seguinte representam-se os resultados possveis.
Resultados

EEE
ECE
EEC
ECC
CEE
CCE
CEC
CCC

2
1
2
1
1
0
1
0

0
1
1
2
0
1
1
2

A funo conjunta de probabilidade das variveis X e Y, pX, Y (x, y), dada por:
" x, y : pX , Y ( x, y) = P ( X = x Y = y) = P ( X = x, Y = y).
Na tabela seguinte apresentam-se os valores desta funo.

pX, Y (x, y)
2

1
0

8
1

8
1

4
1

8
1

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.1
Alnea (ii)
Apoio 2 (sugesto)
Na Seco 5.4 veja qual a definio de funo condicional de probabilidade de duas variveis
discretas. Note que, para este clculo, necessrio recorrer funo marginal de probabilidade
da varivel X.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

ESTATSTICA

2. Edio

Problema 5.1
Alnea (ii)
Apoio 3 (resoluo completa)
A probabilidade condicional de Y dado que X =1 dada por

pY X Y

X =1 =

pX ,Y ( X = 1 , Y )
pX

( X = 1)

Para calcular tal probabilidade falta determinar pX ( X = 1) . Seja pX (x) a funo marginal de
probabilidade da varivel X. Ento
" x : pX ( x ) =

X ,Y ( x, y ) .

Do mesmo modo, para a funo marginal de probabilidade da varivel Y, py(y), vem

" y : pY ( y) =

p
x

Dashfer
Verlag
McGraw-Hill

X ,Y ( x, y ).

CAPTULO 5

Na tabela seguinte apresentam-se os valores destas funes.

pX, Y (x, y)

ESTATSTICA

2. Edio

2
Y

1
0

py (y)

8
1

8
1

4
1

8
1

2
1

0
0

1
4

X
1

pY X (Y

Assim,

0
1
2

Dashfer
Verlag
McGraw-Hill

X = 1)

18

12

14

12

18

12

p X (x)

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.1
Alnea (iii)
Apoio 1 (apenas o resultado)

1
2

XY = .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.1
Alnea (iii)
Apoio 2 (sugesto)
Na Seco 5.6 veja qual a definio de covarincia (XY) e de coeficiente de correlao populacional (XY). Recorde que ambas so medidas de relacionamento linear entre duas variveis.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.1
Alnea (iii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)

r XY =
g

g XY
.
s X s Y

Clculo dos valores esperados e dos desvios padres das variveis X e Y

E ( X ) = mX =

x p

X ( x) =

E (Y ) = mY =

y p

Y ( y)

1
1
1
0 + 1 + 2 = 1
2
4
4

= mX = 1

Var ( X ) =

(x - m )

pX ( x ) = (0 - 1)

1
1
2 1
2 1
+ (1 - 1) + (2 - 1) =
4
2
4 2

1
2
=
2
2
sY = s X .
sX =

Clculo da covarincia XY
g XY = E ( x - m X ) ( y - mY ) =

(x - m ) (y - m ) p
X

1
1
1
g XY = (0 - 1) (2 - 1) + (2 - 1) (0 - 1) = 8
8
4
g

Clculo da correlao XY

r XY =

Dashfer
Verlag
McGraw-Hill

g XY
=
s X s Y

-1 4
2 2 2 2

=-

1
.
2

X ,Y ( x, y )

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (i)
Apoio 1 (apenas o resultado)
fX ( x ) = 2 x
fY ( y ) = 2 (1 - y ).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (i)
Apoio 2 (sugesto)
A distribuio marginal de probabilidade para cada uma das variveis calculada a partir da
funo conjunta de densidade de probabilidade.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.2
Alnea (i)
Apoio3 (resoluo completa)
De acordo com o enunciado

ESTATSTICA

2. Edio

fX,Y (x,y) = 2

1
D
0
0

Assim,
x

fX ( x) =

f X ,Y ( x, y) dy = 2dy = 2[ y]0x = 2 x

0
1

verificao:

x2
f X ( x ) dx = 2 xdx = 2 = 1 .
2 0
0

Do mesmo modo,
1

fY ( y) =

1
X ,Y ( x, y ) dx

Dashfer
Verlag
McGraw-Hill

verificao:

= 2dx = 2 [ x ]y = 2 (1 - y)
1

1
y2
fY ( y) dy = 2(1 - y) dy = 2 [ y]0 - 2 = 2 - 1 = 1 .
2 0
0

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (ii)
Apoio 1 (apenas o resultado)

X =

2
3
1
3

Y = .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (ii)
Apoio 2 (sugesto)
Os valores esperados de cada varivel so calculados a partir das respectivas distribuies
marginais de probabilidade.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (ii)
Apoio 3 (resoluo completa)
+

mX =

x 3 1 2
2
= .

x
f
(
x
)
dx
x
f
(
x
)
dx
2
x
dx
2
X
X

3 0 3
-
0
0
1

y 2 1
y 3 1
2 1
mY = y fY ( y ) dy = 2 y (1 - y ) dy = 2 - 2 = 1 - = .
2 0
3 0
3 3
0
0

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (iii)
Apoio 1 (apenas o resultado)
f X | Y ( x | y) =

1
1- y

fY | X ( y | x ) =

1
.
x

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (iii)
Apoio 2 (sugesto)
A distribuio condicional de probabilidade para variveis contnuas pode ser definida pela razo
da funo conjunta de densidade de probabilidade e da funo marginal de probabilidade.

Dashfer
Verlag
McGraw-Hill

Problema 5.2
Alnea (iii)
Apoio 3 (resoluo completa)

ESTATSTICA

2. Edio

CAPTULO 5

f X | Y ( x | y) =

f X ,Y ( x, y)
fY ( y)
1

verificao:

2
1
=
2 (1 - y) 1 - y
1

1 - y dx = 1 - y [ x]

fY | X ( y | x ) =

f X ,Y ( x, y)
fX ( x)
x

verificao:

2
1
=
2x x

x dy = x [ y]

Dashfer
Verlag
McGraw-Hill

x
= 1.
x

1- y
= 1.
1- y

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (iv)
Apoio 1 (apenas o resultado)

Cov ( X , Y ) =

1
.
36

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.2
Alnea (iv)
Apoio 2 (sugesto)
Rever o Captulo 5 sobre Distribuies Conjuntas de Probabilidade, dando especial destaque
seco 5.6 Covarincia e Correlao para variveis contnuas. Para o clculo da covarincia
considere os desvios a partir do ponto (X, Y).

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.2
Alnea (iv)
Apoio 3 (resoluo completa)

2. Edio

Cov ( X , Y ) = E ( x - m x ) y - m y

2
1

x - y - 2 dxdy

D
3
3

0
1

ESTATSTICA

2
1

= 2 x - dx y - dy

3
3
x

y2 1 x
2

= 2 x - dx - [ y]0

2 0 3

0
1

2 x2 x

= 2 x -
dx

3 2 3

0
1

x3 x2 x2 2 x
= 2 +
dx
2
3
3
9

1 x 4 1 2 x 3 1 2 x 2 1
= 2 - +
2 4 0 3 3 0 9 2 0
1 2 1
= 2 - +
8 9 9

1
1
1 1
= 2 - = 2
=
.
8 9
72 36
Como se esperava a covarncia diferente de zero (neste caso, positiva). Pode concluir-se
que existe uma relao linear entre as variveis X e Y.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.3
Apoio 1 (apenas a soluo)
Valor esperado: 0.01
Desvio padro: 1.75 10 -3.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.3
Apoio 2 (sugesto)
Uma vez que se est perante uma relao no linear, verifique se ela pode ser considerada aproximadamente linear em torno dos valores esperados das variveis originais (R e C).
Na seco 5.7 veja quais as expresses do valor esperado e da varincia neste tipo de
transformaes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.3

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Como
T = f( R, C )
verifica-se em seguida se ser razovel aproximar f( R, C ) por uma relao linear em torno do
ponto ( R = m R , C = mC ) .

mR

= 106

mC

= 10 -6

10 -2

10 -18

1018 = 10 -2

m R = 106

mC - 3s C = 0.85 10 -6

10 -2 10 -18 0.853 1018 = 0.61 10 -2

m R = 106

mC + 3s C = 1.15 10 -6

10 -2 10 -18 1.153 1018 = 1.52 10 -2

m R - 3s R = 0.91 106

mC = 10 -6

0.913 10 -2 = 0.75 10 -2

m R - 3s R = 0.91 106

mC - 3s C = 0.85 10 -6

0.913 0.853 10 -2 = 0.46 10 -2

m R - 3s R = 0.91 106

mC + 3s C = 1.15 10 -6

0.913 1.153 10 -2 = 1.15 10 -2

m R + 3s R = 1.09 106

mC = 10 -6

1.093 10 -2 = 0.75 10 -2

m R + 3s R = 1.09 106

mC - 3s C = 0.85 10 -6

1.093 0.853 10 -2 = 0.80 10 -2

m R + 3s R = 1.09 106

mC + 3s C = 1.15 10 -6

1.093 1.153 10 -2 = 1.97 10 -2

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

No diagrama seguinte ilustra-se o andamento da funo T nos pontos ( R = m R , C = mC ) e


R
( = mR 3s R , C = mC 3s C ) .

ESTATSTICA

2. Edio

2.0

P C  3V C

PC

P C  3V C

1.15 u 10 6

T [10-2]
1.5

10 6

1.0

0.85 u 10 6

0.5

0 .0
0.9

1.0

1.1

P R  3V R

PR

P R  3V R

R [10-6]

Se a relao T = f( R, C ) fosse linear as curvas representadas corresponderiam a rectas


paralelas equiespaadas. A aproximao linear de T = f( R, C ) corresponde a substituir as trs
curvas por trs rectas paralelas, sendo a distncia que separa a primeira da segunda igual que
separa a segunda da terceira. Dado que as gamas de valores R e C incluem pontos muito extremos
( m 3s ) e tendo em conta a forma e a posio relativa das curvas representadas no diagrama
anterior, a aproximao linear parece ser razovel.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Nestas condies,

1
[E ( R )]3 [E(C )]3 = 10 -2 1018 10 -18 = 10 -2 = 0.01
100
2

Var(T )
m R , mC Var( R) +
m R , mC Var(C )
R

T
3
3
m R , mC =
m R2 mC3 =
1012. 10 -18 = 3 10 -8
R
100
100

ESTATSTICA

2. Edio

E(T )

3
3
T
m R , mC =
m R3 mC2 =
1018 10 -12 = 3 10 4
100
100
C
2

Var( R) = (0.03 106 ) = 9 10 -4 1012 = 9 108


2

Var(C ) = (0.05 10 -6 ) = 25 10 -4 10 -12 = 2.5 10 -15


2

Var(T ) (3 10 -8 ) 9 108 + (3 10 4 ) 2.5 10 -15


= 9 9 10 -8 + 9 2.5 10 -7
= 0.81 10 -6 + 2.25 10 -6
= 3.06 10 -6 .

s T 3.06 10 -3 = 1.75 10 -3 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.4
Apoio 1 (apenas o resultado)
Valor esperado: 920 [toneladas]
Desvio padro: 6.79 [toneladas].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.4
Apoio 2 (sugesto)
Procure explicitar a varivel peso do carvo seco em funo das variveis peso do carvo
hmido e teor de humidade. Uma vez que se est perante uma transformao no linear,
verifique se esta pode ser aproximada por segmentos de recta em torno dos valores esperados
das variveis originais. Na seco 5.7 veja quais as expresses do valor esperado e da varincia
neste tipo de transformaes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

ESTATSTICA

2. Edio

Problema 5.4
Apoio 3 (resoluo completa)
Sejam,
H : peso do carvo hmido [toneladas]
S : peso do carvo seco [toneladas]
t : teor de humidade [%].
Ento,

S=

(100 - t ) H = H 100

t
t

H = 1 H.
100
100

A funo S = f (t , H ) ser aproximada por uma relao linear em torno do ponto

( t = mt , H = m H ) .

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

g
Verificao da razoabilidade desta aproximao
O diagrama que se apresenta seguidamente no qual se definem valores de S = f (t , H ) para
diferentes combinaes de H ( mH , mH - 3s H , mH + 3s H ) e de t ( mt , mt - 3s t , mt + 3s t )
mostra que no se cometero erros apreciveis aproximando S = f (t , H ) por uma relao linear.

ESTATSTICA

2. Edio

950

S [ton]

P t  3V t

t Pt

930

6.5%

8%

t P t  3V t

9.5%

910

890
985

1000

PH

P H  3V H

1015

P H  3V H

H [ton]

Nota: mH e mt no so conhecidos; os seus valores foram substitudos pelas estimativas m H =


= 1000 toneladas e m t = 8 %.
Nestas condies,

E (t )
8

E (H ) = 1 E (S) 1 1000 = 920 [toneladas]

100
100

S
Var (S )
H

Dashfer
Verlag
McGraw-Hill

S
Var ( H ) +
t
mH , mt

Var (t )
mH , mt

ESTATSTICA

2. Edio

CAPTULO 5

S
t
=1H
100

S
H

S
H
=100
t

S
t

=1mH , mt

=mH , mt

8
= 0.92
100

1000
= -10
100

Var ( H ) = 52 = 25
Var (t ) = 0.52 = 0.25
2

Var (S ) 0.922 25 + ( -10 ) 0.25 = 46.16

s S = 46.16 = 6.79 [toneladas].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.5
Alnea (i)
Apoio 1 (apenas o resultado)

Cov Xi - X , X = 0.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.5
Alnea (i)
Apoio 2 (sugesto)
Rever o Captulo 5.7 Variveis Transformadas, dando especial destaque s seces 5.7.2 e
5.7.3.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.5
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


E ( Xi ) = m e Var ( Xi ) = s 2 .
Como Xi (i = 1,, n ) so mutuamente independentes, vem

)(

Cov Xi - X , X = E Xi - X - m Xi - x X - m X .

Dado que

( )

mX = E X =

1
N

E (X ) = N N m = m
i

i =1

( )

m X - X = E Xi - X = E ( Xi ) - E X = m - m = 0 ,
i

resulta:

)(

Cov Xi - X , X = E Xi - X X - m

= E Xi X - m Xi - X + m X

( )+ m

( )

= E Xi X - m 2 - E X

( )

( )

= E Xi X - E X

Dashfer
Verlag
McGraw-Hill

(1)

CAPTULO 5

Ora,

1
E Xi X = E Xi

( )

X = N E ( X X ) + ( N - 1) E ( X X )
j

2. Edio

ESTATSTICA

j i

j =1

1
N

E ( Xi 2 ) + ( N - 1) E Xi X j .
j i

Determine-se agora E( Xi 2 ) e E ( Xi X j ). Como


j i

Var( Xi ) = s 2 = E ( Xi - m )2 = E ( Xi2 ) - 2 m E ( Xi ) + m 2 = E ( Xi2 ) - m 2,


vem
E ( Xi 2 ) = s 2 + m 2.
Por outro lado,

( )

Cov Xi X j = E ( Xi - m ) X j - m = E Xi X j - m E ( Xi ) - m E X j + m 2 .

= E Xi X j - m 2 .

Mas, uma vez que Xi , X j so independentes, Cov Xi X j = 0. Assim,

E Xi X j = m 2 .

Substituindo E ( Xi2 ) e E Xi X j em (2), resulta:

( )

E Xi X =

Dashfer
Verlag
McGraw-Hill

1
s2
s 2 + m 2 + ( N - 1) m 2 =
+ m2.
N
N

(2)

CAPTULO 5

( ) . Ora,

ESTATSTICA

2. Edio

Para resolver a equao (1) falta ainda determinar E X

( )

E X

1
= E
N

2

1
Xi =

N2

i =1

( )

N E ( Xi2 ) + N ( N - 1) E (X
Xi X j )
j
i

N -1
1 2
1
(s + m 2 ) + N m 2 = N s 2 + m 2.
N

( ) em (1), obtm-se

Substituindo E Xi X e E X

Cov Xi - X , X = 0 .
Interpretao do resultado

( X - X ) no est correlacionado com X, uma vez que


i

X tem uma posio central em relao aos Xis, o que implica que qualquer desvio
positivo Xi - X compensado por um desvio negativo.
(b) tal sucede independentemente de X se desviar de m num ou noutro sentido.
(a)

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.5
Alnea (ii)
Apoio 1 (apenas o resultado)

Cov Xi - X , Xi = 1 - s 2 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.5
Alnea (ii)
Apoio 2 (sugesto)
Rever o Captulo 5.7 Variveis Transformadas, dando especial destaque s seces 5.7.2
e 5.7.3.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.5
Alnea (ii)
Apoio 3 (resoluo completa)

ESTATSTICA

2. Edio

Cov Xi - X , Xi = E ( Xi - X - 0) ( Xi - m )
= E ( Xi - X ) ( Xi - m )

( )

( )

= E ( Xi2 ) - m E ( Xi ) - E Xi X + m E X
s 2

= (s 2 + m 2 ) - m 2 -
+ m2 + m2
N

1 2

= 1 - s .
N
Interpretao do resultado

Cov Xi - X , Xi = 1 - s 2

Quando N 2 a covarincia positiva e ser tanto maior quanto maior for N. De facto, quando
um valor de Xi se desvia muito significativamente de m, o valor de X tem tendncia a desviar-se
de m no mesmo sentido. Mas o desvio ser em mdia menor do que o de Xi, pois
X=

Dashfer
Verlag
McGraw-Hill

1
N

X
i

2. Edio

fica preso pelos restantes valores X j ( j i ) . Quando N ento X m e o desvio de X


em relao a m ser nulo. Assim, a um valor positivo de Xi - m estar, em princpio, associado
um valor positivo de Xi - X . A covarincia ser ento positiva. Note-se que,

ESTATSTICA

CAPTULO 5

Cov Xi - X , Xi = E Xi - X - 0 ( Xi - m )

= E Xi - X ( Xi - m ) .

(
(

Ora, quando N tende para infinito X tende para , o que implica que:

E Xi - X ( Xi - m ) = s 2

(este resultado est de acordo com lim 1 - s 2 = s 2 ) .


N
N

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.5
Alnea (iii)
Apoio 1 (apenas o resultado)

Cov Xi - X , X j - X = -

Dashfer
Verlag
McGraw-Hill

s2
.
N

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.5
Alnea (iii)
Apoio 2 (sugesto)
Rever o Captulo 5.7 Variveis Transformadas, dando especial destaque s Seces 5.7.2
e 5.7.3.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.5

Apoio 3 (resoluo completa)

(
)(
= E ( X - X ) ( X - X )

Cov Xi - X , X j - X = E Xi - X - 0 X j - X - 0

ESTATSTICA

2. Edio

Alnea (iii)

) (

) (

( )

= E Xi X j - E Xi X - E X j X + E X

s 2
s 2

= m2 - 2
+ m2 +
+ m2
N
N

= m2 =-

s2
- m2
N

s2
.
N

Interpretao do resultado
A soma dos desvios
N

(X
k =1

Dashfer
Verlag
McGraw-Hill

- X)

ESTATSTICA

2. Edio

CAPTULO 5

sempre nula. Ento, se para um valor particular Xi se verificar Xi - X > 0, os restantes desvios
X j - X ( j i ) tm um valor esperado negativo, ou seja:

E X - X
j

) ( X - X ) > 0 < 0.
i

Por outro lado, se Xi - X < 0 tambm

) ( X - X ) < 0
ser positivo. Ento a covarincia entre ( X - X ) e ( X - X ) ser necessariamente negativa.
E X - X
j

Esta covarincia tender a anular-se quando N tende para infinito, pois, neste caso,

E X - X
j

) ( X - X ) > 0 0
i

E X - X
j

) ( X - X ) < 0 0.
i

De facto, a compensao do desvio Xi - X ser diluda por um nmero infinito de desvios


X j - X ( j i ) , pelo que o valor esperado de cada um destes desvios tender para zero.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (i)
Apoio 2 (sugesto)
Na seco 5.3 veja qual a definio de funo marginal de probabilidade. Note-se que, excepo
do procedimento atravs do qual obtida, nada distingue a funo marginal de uma varivel da
funo de probabilidade dessa mesma varivel.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.6
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja:

pX ( x ): funo marginal de probabilidade da varivel X.


" x : pX ( x ) =

X ,Y ( x, y ) .

pY ( y): funo marginal de probabilidade da varivel Y.


" y : pY ( y) =

X ,Y ( x, y ) .

Na tabela seguinte apresentam-se as funes marginais de probabilidade das variveis X e Y.


pX (x)

pX,Y (x, y)
X [euros]

1000
2000
3000
4000

0.20
0.10
0
0

0.04
0.36
0.05
0

0.01
0.09
0.10
0

0
0
0
0.05

1000

2000

3000

4000

0.20

0.05

0.25
0.55
0.15
0.05

Y [euros]
0.30

Dashfer
Verlag
McGraw-Hill

0.45

pX (x)

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (ii)
Apoio 1 (apenas o resultado)
PX=
2000
=
| Y 2000)
= 0.80.
|Y ( X

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (ii)
Apoio 2 (sugesto)
Na seco 5.4 veja qual a definio de funo condicional de probabilidade de duas variveis
discretas.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (ii)
Apoio 3 (resoluo completa)
Seja pX Y ( X = 2000 Y = 200 0) a probabilidade de o marido ter um rendimento mensal de 2000
euros, admitindo que a mulher tem um rendimento idntico.
pX Y ( X = 2000 Y = 200 0) =

Dashfer
Verlag
McGraw-Hill

pX ,Y ( X = 2000 , Y = 2000)
pY ( Y = 2000)

0.36
= 0.80 .
0.45

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (iii)
Apoio 1 (apenas o resultado)
Valor esperado de X: 2000 [euros]
Valor esperado de Y: 2000 [euros]
Desvio padro de X: 774.6 [euros]
Desvio padro de Y: 836.7 [euros].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (iii)
Apoio 2 (sugesto)
Na seco 4.4 veja quais as definies e as respectivas expresses, do valor esperado e do
desvio padro de uma varivel aleatria discreta.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

ESTATSTICA

2. Edio

Problema 5.6
Alnea (iii)
Apoio 3 (resoluo completa)

x p

E ( X ) = mX =

X ( x ) =1000

0.25 + 2000 0.55 + 3000 0.15 + 4000 0.05 = 2000.

E (Y ) = mY =

y p

Y ( y)

=1000 0.30 + 2000 0.45 + 3000 0.20 + 4000 0.05 = 2000.

Var ( X ) =

(x - m )

pX ( x ) = (1000 - 2000 ) 0.25 + (2000 - 2000 ) 0.555 +

x
2

+ (3000 - 2000 ) 0.15 + ( 4000 - 2000 ) 0.05 = 600 000 [euros2].

s X = 600 000 = 774.6 [euros].


Var (Y ) =

(y - m )
Y

pY ( y) = (1000 - 2000 ) 0.30 + (2000 - 2000 ) 0.45


5+

+ (3000 - 2000 ) 0.20 + ( 4000 - 2000 ) 0.05 = 700 000 [euros2].

s Y = 700 000 = 836.7 [euros].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (iv)
Apoio 1 (apenas o resultado)
As variveis X e Y so dependentes.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (iv)
Apoio 2 (sugesto)
Na seco 5.5 veja qual a definio de independncia entre duas variveis.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

ESTATSTICA

2. Edio

Problema 5.6
Alnea (iv)
Apoio 3 (resoluo completa)
As variveis X e Y so independentes se se verificarem as seguintes condies:
pX Y ( x y) =

pY X ( y x ) =

pX ,Y ( x, y)
pY ( y)
pX ,Y ( x, y)
pX ( x )

= pX ( x )

= pY ( x )

(para todos os valores de x e y )

donde,

" x, y : pX ,Y ( x, y) = pX ( x ) pY ( y).
Ora, uma vez que, por exemplo, pX Y ( X = 2000 Y = 2000) = 0.80 (ver alnea (ii)), e que
pX ( X = 2000) = 0.55, conclui-se que as variveis no so independentes.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (v)
Apoio 1 (apenas o resultado)
Cov (X, Y) = 490 000
Corr (X, Y) = 0.756.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (v)
Apoio 2 (sugesto)
Na seco 5.6 veja qual a definio covarincia ( g XY ) e de coeficiente de correlao populacional
( r XY ). Recorde que ambas so medidas de relacionamento linear entre duas variveis.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.6

ESTATSTICA

2. Edio

Alnea (v)
Apoio 3 (resoluo completa)
A covarincia populacional dada por
g XY = E ( x - m X ) ( y - mY ) =

(x - m ) (y - m ) p
X

X ,Y ( x, y )

Substituindo, vem
g XY = (1000 - 2000 ) (1000 - 2000 ) 0.20 + (1000 - 2000 ) (2000 - 2000 ) 0.04 +
+ (1000 - 2000 ) (3000 - 2000 ) 0.01 + (2000 - 2000 ) (1000 - 2000 ) 0.10 +
+ (2000 - 2000 ) (2000 - 2000 ) 0.36 + (2000 - 2000 ) (3000 - 2000 ) 0.09 +
+ (3000 - 2000 ) (2000 - 2000 ) 0.05 + (3000 - 2000 ) (3000 - 2000 ) 0.10 +
+ (4000 - 2000 ) (4000 - 2000 ) 0.05 = 490 000.
A correlao entre X e Y, medida atravs do coeficiente de Pearson, ser ento:

r XY =

Dashfer
Verlag
McGraw-Hill

g XY
490 000
=
= 0.756.
s X s Y 774.6 836.7

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (vi)
Apoio 1 (apenas o resultado)
a) Valor esperado de R: 4000 [euros]
Desvio padro de R: 1523.15 [euros]
b) Valor esperado de I: 600 [euros]
Desvio padro de I: 226.72 [euros].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.6
Alnea (vi)
Apoio 2 (sugesto)
Na seco 5.7 veja quais as expresses do valor esperado e da varincia de variveis
transformadas. Repare que em ambas as alneas se est perante transformaes lineares.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.6

ESTATSTICA

2. Edio

Alnea (vi)
Apoio 3 (resoluo completa)
a) Denote-se por R o rendimento total em euros. Ento
R=X+Y
E ( R) = m R = E ( X + Y ) = E ( X ) + E (Y ) = 2000 + 2000 = 4000 [euros].
Var ( R) = s R2 = Var ( X + Y ) = Var ( X ) + 2 Cov ( X , Y ) + Var (Y ) .

Assim,
Var ( R) = 600 000 + 2 510 000 + 700 000 = 2 320 000 [euros2]

s R = 2 320 000 = 1523.15 [euros]


b) Denote-se por I o imposto sobre o rendimento familiar em euros. Neste caso,
I = 0.20.X + 0.10.Y
E ( I ) = mI = E (0.20 X + 0.10Y ) = 0.20 E ( X ) + 0.10 E (Y ) = 600 [euros].
Var ( I ) = s I2 = Var (0.20 X + 0.10Y ) = 0.202 Var ( X ) + 2 Cov ( X , Y ) + 0.102 Var (Y )
Var ( I ) = 0.04 600 000 + 2 0.20 0.10 510 000 + 0.01 700 000 = 51 400 [euros2].

s I = 51 400 = 226.72 [euros].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.7
Apoio 1 (apenas o resultado)
Valor esperado de R: 8.5 [%]
Desvio padro de R: 5.16 [%].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

Problema 5.7
Apoio 2 (sugesto)
Na seco 5.7 veja quais as expresses do valor esperado e da varincia de variveis transformadas
(repare que se est perante uma transformao linear). Note que para este clculo necessrio
recorrer s funes marginais de probabilidade das variveis X e Y.

Dashfer
Verlag
McGraw-Hill

CAPTULO 5

Problema 5.7

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


g

Clculo das funes marginais de probabilidade das variveis X e Y.

pX ( x ) : funo marginal de probabilidade da varivel X


" x : pX ( x ) =

X ,Y ( x, y )

pY ( y) : funo marginal de probabilidade da varivel Y

" y : pY ( y) =

X ,Y ( x, y )

pX (x)

pX,Y (x, y)
X: taxa de
rentabilidade
dos fundos de
investimento

6%

0.10

0.10

0.20

8%

0.10

0.30

0.20

0.60

10%

0.10

0.10

0.20

10%

0%

10%

20%

Y: taxa de rentabilidade das aces


0.10

Dashfer
Verlag
McGraw-Hill

0.20

0.40

0.30

PY (y)

CAPTULO 5

Clculo do valor esperado e do desvio padro das variveis X e Y.

x. p ( x) = 6 0.20 + 8 0.60 + 10 0.20 = 8 [%].


= y. p ( y) = (10) 0.10 + 0 0.20 + 10 0.40 + 20 0.30 = 9 [%].

E ( X ) = mX =

E (Y ) = mY

ESTATSTICA

2. Edio

Var ( X ) =

(x - m )

. pX ( x ) = (6 - 8) 0.20 + (8 - 8) 0.60 + (10 - 8) 0.20 = 1.6 .

s X = 1.6 = 1.25 [%].


Var (Y ) =

(y - m )

. pY ( y) = ( -10 - 9) 0.10 + (0 - 9) 0.20 + (10 - 9) 0.40 +

+ (20 - 9) 0.30 = 89 .

s Y = 89 = 9.43 [%].
g

Clculo do valor esperado e do desvio padro da varivel transformada R.


Seja R a taxa de rentabilidade da poupana. Assim,

R=

500 X + 500 Y
= 0.5 X + 0.5Y ,
1000

donde:

E ( R) = m R = E (0.5 X + 0.5Y ) = 0.5 E ( X ) + 0.50 E (Y ) = 0.5 8 + 0.5 9 = 8.5 [%]


e

Var ( R) = s R2 = Var (0.5 X + 0.5Y ) = 0.52 Var ( X ) + 2 0.5 0.5 Cov ( X , Y ) + 0.52 Var (Y )

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 5

A covarincia entre X e Y dada por

Cov ( X , Y ) = g XY = E ( x - m X ) ( y - mY ) =

(x - m ) (y - m ) p
X

X ,Y ( x, y )

pelo que
g XY = (6 - 8) ( -10 - 9) 0.10 + (6 - 8) (0 - 9) 0.10 + (10 - 8) (10 - 9) 0.10 +
+ (10 - 8) (20 - 9) 0.10 = 8 .
Substituindo,
Var ( R) = 0.52 1.6 + 2 0.5 0.5 8 + 0.52 89 = 26.65
e, finalmente
s R = 26.65 = 5.16 [%].

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

ESTATSTICA

2. Edio

Captulos

Captulo 6
Problemas
6.1
(i)

6.1
(ii)

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

Dashfer
Verlag
McGraw-Hill

6.2
(i)

6.2 6.2
6.4 6.4 6.4
6.7
6.3
6.5 6.6
(ii) (iii)
(i) (ii) (iii)
(i)

6.7 6.8 6.8 6.9 6.9 6.10 6.10 6.10


(ii) (i) (ii) (i) (ii) (i) (ii) (iii)

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.1
Alnea (i)
Apoio 1 (apenas o resultado)
a) 24.58%.
b) 9.89%.
c) 90.11%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.1
Alnea (i)
Apoio 2 (sugesto)
Note que a varivel aleatria nmero de grandes prmios terminados segue uma distribuio
Binomial. Na seco 6.2 veja qual a expresso da funo de probabilidade de uma varivel
aleatria Binomial.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.1

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A varivel aleatria Y corresponde ao nmero de grandes prmios terminados. Admitindo que
os resultados associados a cada grande prmio so independentes, ento Y segue uma distribuio
Binomial B(6, 0.20), cuja funo de probabilidade, p(y), :

6
p ( y ) = 0.20 y 0.806 - y .
y
6
a) p (2 ) = 0.202 0.80 4 = 0.2458
2
(este valor dado directamente na Tabela da Distribuio Binomial, includa no Anexo
Tabelas).
b) p (Y 3) = p (3) + p (4 ) + p (5) + p (6 ) = 1 - p (0 ) + p (1) + p (2 ) =
= 1 - (0.2621 + 0.3932 + 0.2458) = 0.0989 .
c) p (Y 2 ) = p (0 ) + p (1) + p (2 ) = 1 - p (Y 3) = 1 - 0.0989 = 0.9011 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.1
Alnea (ii)
Apoio 1 (apenas o resultado)
1.77%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.1
Alnea (ii)
Apoio 2 (sugesto)
Procure caracterizar a varivel nmero de carros Frmula 1 patrocinados pela firma RFM
chegada de um grande prmio. A partir desta varivel, procure definir a varivel nmero de
grandes prmios nos quais h pelo menos dois Frmula 1 chegada.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.1

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Denote-se por U o nmero de carros frmula 1 patrocinados pela firma RFM chegada de um
grande prmio. A varivel U seguir a distribuio Binomial B(3, 0.20) e assim
p (U 2 ) = p (2 ) + p (3) = 0.0960 + 0.0080 = 0.1040 .
Denote-se por V o nmero de grandes prmios nos quais h pelo menos dois Frmula 1
chegada. A varivel V seguir ainda a distribuio Binomial B(6, 0.104), pelo que
p (V 3) = 1 - p (0 ) + p (1) + p (2 ) ,

com
6

p (0 ) = (1 - 0.104 ) = 0.8966 = 0.5174 ,


6
p (1) = 0.104 0.8965 = 0.3603
1
e

6
p (2 ) = 0.1042 0.896 4 = 0.1046
2
Finalmente
p (V 3) = 1 - (0.5174 + 0.3603 + 0.1046 ) = 0.0177.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.2
Alnea (i)
Apoio 1 (apenas o resultado)
35.29%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.2
Alnea (i)
Apoio 2 (sugesto)
Note que a varivel aleatria nmero de votos favorveis dos vogais segue uma distribuio
Binomial. Na seco 6.2 veja qual a expresso da funo de probabilidade de uma varivel
aleatria Binomial.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

ESTATSTICA

2. Edio

Problema 6.2
Alnea (i)
Apoio 3 (resoluo completa)
Considere-se a hiptese de que os vogais no se abstm. Nestas condies, e dado que o presidente
vota favoravelmente na sua proposta, a varivel Y, que denota o nmero de votos favorveis
dos vogais, segue a distribuio Binomial B(6, 0.35). Nestas condies,

6
p ( y ) = 0.35 y 0.656 - y
y
e
p (Y 3) = p (3) + p (4 ) + p (5) + p (6 ) = 1 - p (Y 2 ) = 1 - p (0 ) + p (1) + p (2 )

= 1 - (0.0754 + 0.2437 + 0.3280 ) = 0.3529 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.2
Alnea (ii)
Apoio 1 (apenas o resultado)
82.15%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.2
Alnea (ii)
Apoio 2 (sugesto)
Note que, nesta situao, o nmero de vogais cujas intenes de voto o presidente da empresa
desconhece cinge-se a quatro.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

ESTATSTICA

2. Edio

Problema 6.2
Alnea (ii)
Apoio 3 (resoluo completa)
Seja Z a varivel aleatria que corresponde ao nmero de votos favorveis dos vogais cujas
intenes de voto o Presidente desconhece. Esta varivel segue uma distribuio Binomial
B(4, 0.35). Assim,

4
p ( z ) = 0.35z 0.654 - z
z
e
p ( Z 1) = 1 - p (0 ) = 1 - 0.1785 = 0.8215 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.2
Alnea (iii)
Apoio 1 (apenas o resultado)
48.07%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.2
Alnea (iii)
Apoio 2 (sugesto)
Procure aplicar o Teorema de Bayes, recorrendo ao conceito de probabilidade condicional.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.2

ESTATSTICA

2. Edio

Alnea (iii)
Apoio 3 (resoluo completa)
Considere os seguintes acontecimentos:
S1: sucesso na votao prvia
S2: sucesso na votao em conselho.
A probabilidade associada a este segundo acontecimento

) ( )

P ( S 2 ) = P S 2 S1 P ( S1) + P S 2 S1 P S1

Seja Y1 uma varivel aleatria que denota o nmero de votos favorveis dos dois vogais.
Ento,
Y1

B (2 , 0.35).

Nestas condies,
P ( S1) = P (Y1 1) = 1 - p (0 ) = 1 - 0.4225 = 0.5775
e

( )

P S1 = 1 - P ( S1) = 1 - 0.5775 = 0.4225 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Falta ainda determinar P S 2 S1 e P S 2 S1 . Seja Y2 a varivel aleatria que corresponde


ao nmero de votos favorveis dos vogais que no participaram na primeira votao. Ento
B (4 , 0.35) , vindo
Y2

P S 2 S1 = P(Y2 1) = 1 - p (0 ) = 1 - 0.1785 = 0.8215

P S 2 S1 = P(Y2 4) = P(Y2 = 4) = 0.0150.


Substituindo, resulta
P ( S2 ) = 0.8215 0.5775 + 0.0150 0.4225 = 0.4807.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.3
Apoio 1 (apenas o resultado)
9.8%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.3
Apoio 2 (sugesto)
Note que a varivel aleatria nmero de calos defeituosos na remessa de dez segue uma
distribuio Binomial. Na seco 6.2 veja qual a expresso da funo de probabilidade de uma
varivel aleatria Binomial.
Note ainda que a varivel aleatria nmero de calos defeituosos no conjunto de dois
seleccionados retirados aleatoriamente da remessa, segue uma distribuio Hipergeomtrica.
Na seco 6.4 veja qual a expresso da funo de probabilidade de uma varivel aleatria com
esta caracterstica.
Recorra ao conceito de probabilidade condicional.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.3

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Alternativa 1
Seja Y a varivel aleatria que corresponde ao nmero de calos defeituosos na remessa de dez.
Esta varivel segue uma distribuio Binomial B(10, 0.05). Assim,
10
p ( y ) = 0.05 y 0.9510 - y ,
y

pelo que
p(0) = 0.5987
p(1) = 0.3151
p(2) = 0.0746
p(3) = 0.0105
e p( y > 3) corresponde a um valor desprezvel.
Seja agora Z a varivel aleatria que denota o nmero de calos defeituosos no conjunto
de dois seleccionados aleatoriamente. Esta varivel segue a distribuio Hipergeomtrica H
(10 p, 10 q, 2) , em que 10 p corresponde ao nmero de calos defeituosos na remessa e 10 q
ao nmero de calos no defeituosos. Assim,

10 p 10 q

z N - z
p( z ) =
.
10

2

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Ora,

P( Z = 0) = P Z = 0 Y = 0 P(Y = 0) + P Z = 0 Y = 1 P(Y = 1) +

ESTATSTICA

2. Edio

+ P( Z = 0 Y = 2) P(Y = 2) + P Z = 0 Y = 3 P(Y = 3)

(1)

Calculam-se agora as probabilidades includas nesta expresso.

P Z = 0 Y = 0 =1.

Para determinar P Z = 0 Y = 1 refira-se que, nestas condies, Z segue uma distribuio


H(1, 9, 2). Ento
1 9

0 2 1 9! 2! 8! 8
=
= 0.800 .
p( Z = 0 Y = 1) =
=
2! 7! 10! 10
10

2

Para determinar P Z = 0 Y = 2 o raciocnio semelhante. Com Y = 2 a varivel Z segue


uma distribuio H(2, 8, 2), pelo que
2 8

0 2 1 8! 2! 8! 8 7
=
= 0.622
p( Z = 0 Y = 2) =
=
2! 6! 10! 10 9
10

2

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Com Y = 3 varivel Z segue uma H(3, 7, 2), pelo que P Z = 0 Y = 3 dado por

ESTATSTICA

2. Edio

3 7

0 2 1 7! 2! 8! 6 7
=
= 0.467
p( Z = 0 Y = 3) =
=
2! 5! 10! 10 9
10

2
Substituindo os valores encontrados na expresso (1), vem:
P( Z =
0) =
1 0.5987 + 0.800 0.3151 + 0.622 0.0746 + 0.467 0.0105 =
0.902

Assim, a probabilidade de a remessa ser rejeitada


P( Z 1) = 1 - P( Z = 0) = 1 - 0.902 = 0.098.

Alternativa 2
Note que seleccionar dois calos ao acaso a partir de uma remessa supostamente aleatria o
mesmo que retirar uma amostra aleatria de dois calos a partir da populao. Ento a varivel Z
(nmero de calos defeituosos no conjunto de dois seleccionados aleatoriamente) segue uma
distribuio B(2, 0.05). Nestas condies,

2
p ( z ) = 0.05z 0.952 - z
z
e
P( Z 1) = 1 - P( Z = 0) = 1 - 0.952 = 0.0978 0.098.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.4
Alnea (i)
Apoio 1 (apenas o resultado)
48.4%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.4
Alnea (i)
Apoio 2 (sugesto)
Note que a probabilidade de o operador permanecer 10 minutos sem executar nenhum retoque
equivalente probabilidade de, numa sequncia de 10 peas, nenhuma necessitar de ser retocada.
Reveja as definies associadas distribuio Binomial.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

ESTATSTICA

2. Edio

Problema 6.4
Alnea (i)
Apoio 3 (resoluo completa)
A probabilidade de o operador permanecer 10 minutos sem executar nenhum retoque equivalente
probabilidade de, numa sequncia de 10 peas, nenhuma necessitar de ser retocada.
Seja Y a varivel aleatria que denota o nmero de peas retocadas em 10 minutos. Seja
ainda p = 0.07 a probabilidade de uma pea ser retocada manualmente pelo operador e
q = 1 0.07 = 0.93 a probabilidade de uma pea no necessitar de ser retocada. A varivel Y
seguir ento a distribuio Binomial B(10, 0.07). Assim,
10
p ( y ) = 0.07 y 0.9310 - y
y

e
p (Y = 0 ) = 0.9310 = 0.484.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.4
Alnea (ii)
Apoio 1 (apenas o resultado)
1.83%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.4
Alnea (ii)
Apoio 2 (sugesto)
A varivel nmero de peas produzidas sem retoque at ocorrer a segunda pea a necessitar de
retoque, segue uma distribuio Binomial Negativa. Na seco 6.3 veja qual a expresso da
funo de probabilidade de uma varivel aleatria com esta caracterstica.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.4
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Alternativa 1
Seja Y a varivel aleatria que corresponde ao nmero de peas produzidas sem retoque at
ocorrer a segunda pea a necessitar de retoque. Esta varivel segue uma distribuio Binomial
Negativa BN(2, 0.07), cuja funo probabilidade
y + 2 1
0.07 2 (1 0.07 )y . .
p ( y ) =

Assim, numa sequncia de seis peas, a probabilidade de a ltima ser a segunda pea a
necessitar de retoque :
5
p (4) = 0.07 2 0.934 =0.0183.
4

Alternativa 2
Note que o facto de, entre 6 peas produzidas, a sexta pea corresponder segunda a necessitar
de retoque, implica que nas 5 primeiras haja uma a necessitar de retoque e que a sexta pea seja
tambm defeituosa. Considerem-se os acontecimentos:
A: existir uma pea defeituosa nas 5 primeiras produzidas
B: a sexta pea produzida defeituosa.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

A varivel Z que denota o nmero de peas retocadas num conjunto de cinco, segue uma
distribuio Binomial B(5, 0.07). Nestas condies, a probabilidade pretendida

p (A B) = p B A p (A ) .
Ora, p(A) = p(Z = 1) e, portanto,
5
p ( Z = 1) = 0.071 0.934.
1

Por outro lado, como A e B so acontecimentos independentes, p B A = p (B) = 0.07 .


Substituindo, resulta

5
p ( A B ) = 0.071 0.934 0.07 = 0.0183 = 1.83%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.4
Alnea (iii)
Apoio 1 (apenas o resultado)
13.28 minutos.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.4
Alnea (iii)
Apoio 2 (sugesto)
Note que o tempo (em minutos) que o operador permanece sem executar nenhum retoque equivale
ao nmero de peas que so produzidas sem necessitarem de qualquer retoque, at que haja uma
que necessite. A varivel em questo segue uma distribuio geomtrica, que um caso particular
da distribuio Binomial Negativa.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.4
Alnea (iii)
Apoio 3 (resoluo completa)
Seja Y a varivel aleatria que corresponde ao nmero de peas produzidas at ocorrer a primeira
pea a precisar de retoque. Esta varivel segue uma distribuio Geomtrica G(0.07). O valor
esperado de Y dado por
my =

q
,
p

pelo que o tempo que, em mdia, o operador permanece sem executar nenhum retoque
y = 0.93/0.07 = 13.28 peas (o que equivale a 13.28 minutos).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.5
Apoio 1 (apenas o resultado)
2

5N -1 - 4 N -1
,
6N

com N 2 (em que N representa o nmero cartas recebidas).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.5
Apoio 2 (sugesto)
Sejam A e B os selos em falta. A coleco s pode ficar completa aps ter sido recebida a
segunda carta. Tal suceder na N-sima carta (N 2) se ocorrer uma das duas situaes seguintes:
(i) Nas N 1 cartas anteriores o coleccionador recebe pelo menos um selo A, no recebe
nenhum selo B e na N-sima carta recebe um selo B.
(ii) Nas N 1 cartas anteriores o coleccionador recebe pelo menos um selo B, no recebe
nenhum selo A e na N-sima carta recebe um selo A.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.5

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam A e B os selos em falta. A coleco s pode ficar completa aps ter sido recebida a
segunda carta. Tal suceder na N-sima carta (N 2) se ocorrer uma das duas situaes seguintes:
(i) Nas N 1 cartas anteriores o coleccionador recebe pelo menos um selo A, no recebe
nenhum selo B e na N-sima carta recebe um selo B.
(ii) Nas N 1 cartas anteriores o coleccionador recebe pelo menos um selo B, no recebe
nenhum selo A e na N-sima carta recebe um selo A.
As probabilidades de ocorrncia destas duas situaes so claramente iguais. Calcule-se a
primeira. Sejam,
Acontecimento B: a ltima carta (a N-sima) traz um selo B.
Y: nmero de selos A nas N 1 cartas que precedem a ltima.
Z: nmero de selos B nas N 1 cartas que precedem a ltima.
Para N 2:

PN = P [Y 1 Z = 0] B = P [Y 1 Z = 0] P( B)

= P Y 1 Z = 0 P( Z = 0) P( B) = 1 - P Y = 0 Z = 0 P ( Z = 0 ) P ( B ).
Ora, a varivel Z segue uma Binomial B(N 1, 1/6) e Y | Z = 0 uma Binomial B(N 1, 1/5).
Assim,

P ( Z = 0 ) = 1 -
6

Dashfer
Verlag
McGraw-Hill

N -1

5
=
6

N -1

ESTATSTICA

2. Edio

CAPTULO 6

1
P Y = 0 Z = 0 = 1 -

N -1

4
=
5

N -1

Substituindo, vem:
4
PN = 1 -
5

N -1

5

6

N -1

1 5N -1 - 4 N -1 5N -1 1 5N -1 - 4 N -1
=

=
.
6 N -1 6
6N
6
5N -1

A probabilidade de ocorrncia da situao (i) ou (ii) ento:

, N <2
0

2 PN =
5N -1 - 4 N -1
2
, N2
6N

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.6
Apoio 1 (apenas o resultado)
4.9%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.6
Apoio 2 (sugesto)
Note que a varivel aleatria nmero de peas defeituosas entre as 5 retiradas do lote segue
uma distribuio Hipergeomtrica. Para o clculo da probabilidade pretendida recorra ao
acontecimento complementar. Na seco 6.4 veja qual a expresso da funo de probabilidade
de uma varivel aleatria com esta caracterstica.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.6
Apoio 3 (resoluo completa)
Seja Y a varivel aleatria que denota o nmero de peas defeituosas entre as 5 retiradas do lote.
Ento, Y segue uma distribuio Hipergeomtrica H M p , M (1 - p ) , N , em que p representa
a proporo de peas defeituosas no lote (com p = 0.01) e M o nmero de peas que compe o
lote (com M = 300). Ou seja, Y segue uma distribuio H(3, 297, 5). A funo de probabilidade
de Y :

ESTATSTICA

2. Edio

3 297

y 5 - y
p ( y) =
.
300

5
Como
p (Y 1) = 1 - p (Y = 0 )
e
3 297

0 5 297! 5! 295!
p (0 ) =
=
= 0.951 ,
5! 300! 292!
300

resulta
p (Y 1) = 1 - 0.951 = 0.049 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.7
Alnea (i)
Apoio 1 (apenas o resultado)
4.19%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.7
Alnea (i)
Apoio 2 (sugesto)
razovel admitir que a varivel aleatria nmero de avarias por unidade de tempo segue
uma distribuio de Poisson. Na seco 6.5 veja qual a expresso da funo de probabilidade de
uma varivel aleatria que segue uma distribuio de Poisson.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.7

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Para cada mquina, o nmero mdio de avarias por hora de lM = 2 avarias/8 horas = 0.25.
razovel admitir que a varivel aleatria Y nmero de avarias/hora segue uma distribuio
de Poisson (lM = 0.25). Considera-se agora o conjunto de 20 mquinas. Nesta situao, a taxa
horria de avarias (das 20 mquinas ) ser:
lC = 20 0.25 = 5 [avarias/hora].

Ora, um intervalo de tempo Dt de 10 minutos corresponde a 0.1667 horas. Dado que a


probabilidade de se registar uma avaria num intervalo qualquer de dimenso Dt praticamente
proporcional dimenso do intervalo, a taxa de avarias, para o conjunto das 20 mquinas, em
perodos de 10 minutos dada por:

l = lC Dt = 5 0.1667 = 0.8333 [avarias/10 minutos].


Nestas condies, a varivel aleatria Y, que denota o nmero de avarias em qualquer perodo
de 10 minutos, seguir uma distribuio de Poisson (l = 0.8333). Note-se que a distribuio do
nmero de avarias em cada intervalo de 10 minutos a mesma para todos os intervalos (constitui
uma das condies que se dever verificar numa distribuio de Poisson). Como a funo de
probabilidade de Y
ly
pY ( y ) = e -l
,
y!
vem
P (Y = 3) = e -0.8333

Dashfer
Verlag
McGraw-Hill

0.83333
= 0.0419 .
3!

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.7
Alnea (ii)
Apoio 1 (apenas o resultado)
Valor esperado: 5 [avarias/hora]
Varincia: 5 [avarias/hora]2.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.7
Alnea (ii)
Apoio 2 (sugesto)
Na seco 6.5 veja quais as expresses do valor esperado e da varincia da distribuio de
Poisson.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.7
Alnea (ii)
Apoio 3 (resoluo completa)
Seja Z a varivel aleatria que representa o nmero de avarias/hora que se verificam no conjunto
de 20 mquinas. Para este conjunto, a taxa horria de avarias lC = 20 0.25 = 5 e a varivel Z
seguir uma distribuio de Poisson (C = 5). Nestas condies,
E ( Z ) = mZ = lC = 5 [avarias/hora]
e
Var ( Z ) = s Z2 = lC = 5 [avarias/hora]2.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.8
Alnea (i)
Apoio 1 (apenas o resultado)
83.47%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.8
Alnea (i)
Apoio 2 (sugesto)
A distribuio das variveis aleatrias nmero de bolhas por m2 e nmero de bolhas por placa
podem ser aproximadas por distribuies de Poisson. Na seco 6.5 veja qual a expresso da
funo de probabilidade de uma varivel aleatria seguindo uma distribuio de Poisson.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.8
Alnea (i)
Apoio 3 (resoluo completa)
Considera-se aceitvel admitir que a varivel aleatria Y, nmero de bolhas por m2, segue uma
distribuio de Poisson ( = 0.4). Considerando agora cada placa de 1.5 3.0 m2, o nmero
mdio de bolhas por placa (p) ser de:

p = (0.4 bolhas/m2).(1.5 3.0m2) = 1.8 bolhas/placa.


A varivel aleatria Y, nmero de bolhas por placa, seguir ento uma distribuio de Poisson
(p = 1.8). Assim,

P (Y 1) = 1 - P (Y = 0 ) = 1 - e -1.8

Dashfer
Verlag
McGraw-Hill

1.80
= 1 - e -1.8 = 1 - 0.1653 = 0.8347.
0!

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.8
Alnea (ii)
Apoio 1 (apenas o resultado)
0.844%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.8
Alnea (ii)
Apoio 2 (sugesto)
Note que a varivel aleatria nmero de placas sem bolhas de entre um conjunto de seis segue
uma distribuio Binomial. Na seco 6.1 veja qual a expresso da funo de probabilidade de
uma varivel aleatria Binomial.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.8

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Na alnea (i) admitiu-se que varivel aleatria Y, nmero de bolhas por placa, seguia uma
distribuio de Poisson(p = 1.8). Ora (ver Tabela 2 do Anexo Tabelas), P(Y = 0) = 0.1653.
Seja Z a varivel aleatria que denota o nmero de placas sem bolhas num conjunto de seis.
A varivel Z segue uma distribuio Binomial B(6, 0.1653), cuja funo probabilidade

6
p ( z ) = 0.1653z 0.83476 - z .
z
Assim, como
e

P ( Z 4 ) = p ( 4 ) + p ( 5 ) + p (6 )
6
p (4 ) = 0.16534 0.83472 = 0.00780 ,
4
6
p (5) = 0.16535 0.83471 = 0.00062 ,
5
6
p (6 ) = 0.16536 0.83470 = 0.00002 ,
6

resulta
P ( Z 4 ) = 0.00780 + 0.00062 + 0.00002 = 0.00844.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.9
Alnea (i)
Apoio 1 (apenas o resultado)
53.6 [toneladas].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.9
Alnea (i)
Apoio 2 (sugesto)
Note que a quantidade de cimento transferida diariamente do comboio para o entreposto (que se
denota por Q) igual quantidade descarregada diariamente para os camies. Procure definir a
funo de probabilidade da varivel Q em funo do nmero de camies que podem chegar
diariamente ao entreposto.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.9

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A varivel aleatria Y nmero de camies que se dirigem diariamente ao entreposto segue
uma distribuio de Poisson ( = 3). Considere-se agora a varivel Q que denota a quantidade
de cimento que, diariamente, transferida do comboio para o entreposto. Ora, Q (em toneladas)
igual quantidade descarregada diariamente para os camies o que, por sua vez, corresponde
procura satisfeita diariamente. Assim:
20 y , y 3
Q=
, y>3
80
Na tabela seguinte apresentam-se os valores da funo probabilidade de Q em funo do
nmero de camies que chegam por dia. Note-se que a capacidade mxima do entreposto equivale
descarga de quatro camies (80 toneladas) e portanto
p (Y 4 ) = 1 - p (Y 3) = 1 - p (0 ) + p (1) + p (2 ) + p (3) =

= 1 - (0.0498 + 0.1493 + 0.2241 + 0.2240 ) = 0.3528.


y [n. de camies]

q [toneladas]

p(Q = q) = p(Y = y)

p(0) = p(Y = 0) = 0.0498

20

p(20) = p(Y = 1) = 0.1493

40

p(40) = p(Y = 2) = 0.2241

60

p(60) = p(Y = 3) = 0.2240

80

p(80) = p(Y 4) = 0.3528

O valor esperado de Q resulta ento,


E (Q ) = mQ =

q p (q )
q

= 0 0.0498 + 20 0.1493 + 40 0.2241 + 60 0.2240 + 80 0.3528 = 53.6 [toneladas].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.9
Alnea (ii)
Apoio 1 (apenas o resultado)
6.4 [toneladas].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.9
Alnea (ii)
Apoio 2 (sugesto)
Procure definir a varivel aleatria procura no satisfeita (PNS) a partir das variveis aleatrias
procura total (PT) e procura satisfeita (Q). Na seco 4.6 do Captulo 4, veja como se
calcula o parmetro valor esperado de uma varivel transformada a partir dos parmetros das
distribuies das variveis originais. Note que se est perante uma transformao linear.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.9
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Alternativa 1
Seja,
PT: procura total (diria)
PNS: procura no satisfeita (diariamente)
Q: procura satisfeita (diariamente).
Ento,
PNS = PT Q.
O valor esperado de PNS
E(PNS) = PNS = E(PT) E(Q).
Ora,
PT = 20 . Y,
donde
E(PT) = PT = 20 . E(Y).

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Uma vez que Y segue uma distribuio de Poisson ( = 3), o seu valor esperado Y = 3 camies/
/dia. Ento E(PT) = PT = 20.3 = 60 toneladas/dia, obtendo-se
E(PNS) = PNS = E(PT) E(Q) = 60 53.6 = 6.4 toneladas/dia.

ESTATSTICA

2. Edio

Alternativa 2
A procura no satisfeita (PNS) toma os seguintes valores (em toneladas/dia)

0,
PNS =
20 y,

y4
y>4

Na tabela seguinte apresentam-se os valores da funo probabilidade de PNS para o nmero


de camies (y) que, por dia, so desviados por no poderem carregar cimento (pelo facto de o
entreposto estar vazio).
y [n. de camies]
4
5
6
7
8
9
10
11
> 11

pns [toneladas]
0
20
40
60
80
100
120
140
> 140

p(Q = q) = p(Y = y)
p(0) = p(Y = 0) = 0.8153
p(20) = p(Y = 5) = 0.1008
p(40) = p(Y = 6) = 0.0504
p(60) = p(Y = 7) = 0.0216
p(80) = p(Y = 8) = 0.0081
p(100) = p(Y = 9) = 0.0027
p(120) = p(Y = 10) = 0.0008
p(140) = p(Y = 11) = 0.0002
p( >140) = p(Y > 11) 0

Ora,
E ( PNS ) =

pns p ( pns )

= 20 0.1008 + 40 0.0504 + 60 0.0216 + 80 0.0081 +


+100 0.0027 + 120 0.0008 + 140 0.0002 = 6.37 6.4 [toneladas].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.10
Alnea (i)
Apoio 1 (apenas o resultado)
6.23%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.10
Alnea (i)
Apoio 2 (sugesto)
O nmero de insucessos at ocorrer o r-simo sucesso (sair a face escolhida) segue uma
distribuio Binomial Negativa. Calcule a probabilidade de ganhar o jogo ou ao fim de trs
lanamentos, ou fim de quatro, ou de cinco, ou de seis. A probabilidade pretendida no enunciado
(ganhar uma partida) corresponde soma das anteriores. Na seco 6.3 veja qual a expresso da
funo de probabilidade de uma varivel aleatria Binomial Negativa.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.10

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Calcule-se a probabilidade de ganhar o jogo ou ao fim de trs lanamentos, ou ao fim de quatro,
ou de cinco, ou de seis. A probabilidade pretendida no enunciado (ganhar uma partida)
corresponde soma das anteriores. A primeira situao ocorre quando em trs lanamentos
sucessivos se verificam zero insucessos (ou seja, a partida acaba ao fim de trs lanamentos), a
segunda quando se ganha ao quarto lanamento (o que significa que ocorre um insucesso antes
dele) e assim sucessivamente, at situao em que se obtm o terceiro sucesso apenas no sexto
lanamento.
Uma vez que se est perante experincias de Bernoulli, a probabilidade de existirem Y insucessos
at ocorrer o r-simo sucesso (sair a face escolhida) dada recorrendo distribuio Binomial
Negativa. No caso em estudo, a varivel Y segue uma distribuio Binomial Negativa BN(r = 3,
p = 1/6), cuja funo de probabilidade :
y + 3 - 1 1 3 5 y
p ( y) =
. .
y
6 6

Assim, a probabilidade de ganhar em seis lanamentos


p (Y 3) = p (0 ) + p (1) + p (2 ) + p (3) .

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Como

2. Edio

2 1 3 5 0
p (0 ) = . = 0.0046
0 6 6

ESTATSTICA

3 1 3 5 1
p (1) = . = 0.0116
1 6 6
4 1 3 5 2
p (2 ) = . = 0.0193
2 6 6
5 1 3 5 3
p (3) = . = 0.0268 ,
3 6 6
resulta
p (Y 3) = 0.0046 + 0.0116 + 0.0193 + 0.0268 = 0.0623.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.10
Alnea (ii)
Apoio 1 (apenas o resultado)
5.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.10
Alnea (ii)
Apoio 2 (sugesto)
Em vez de calcular directamente a probabilidade de, entre N partidas jogadas, haver pelo menos
uma em que ganha, tente obter a expresso baseada no acontecimento complementar (nenhuma
das N partidas ganha pelo Sr. Jo Gador). Em alternativa, considere a varivel aleatria Y que
denota o nmero de partidas que o Sr. Jo Gador joga antes de ganhar pela primeira vez.
A varivel Y segue uma distribuio Geomtrica G(p), em que p corresponde ao resultado obtido
na alnea (i).

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Problema 6.10

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Alternativa 1
Considerem-se os seguintes acontecimentos:
A: de entre as N partidas jogadas, h pelo menos uma em que o Sr. Jo Gador ganha
A: o Sr. Jo Gador perde as N partidas jogadas.
A probabilidade de o Sr. Jo Gador no ganhar uma partida de p = 1 0.0623 = 0.9377 (ver
o resultado da alnea (i)). A probabilidade de o Sr. Jo Gador no ganhar N partidas (admitindo
que os resultados so independentes) ser:
p(A) = (1 - 0.0623N ) = 0.9377 N .
Ento, a probabilidade de em N partidas ganhar pelo menos uma vem
p(A) = 1 - p(A) = 1 - 0.9377 N,

donde
p(A) 0.25

Dashfer
Verlag
McGraw-Hill

1 - 0.9377 N 0.25 .

CAPTULO 6

Esta inequao pode ser resolvida de duas maneiras:


g

Por tentativas:

ESTATSTICA

2. Edio

N = 4: 1 - 0.93774 = 0.227 0.25 (pelo que o nmero de partidas que devem ser jogadas
ser superior a 4)
N = 5: 1 - 0.93775 = 0.275 0.25 (o nmero de partidas que devem ser jogadas ser de 5).
g

Recorrendo ao clculo de logaritmos:


1 - 0.9377 N 0.25 0.9377 N 0.75

ln (0.9377 N ) ln (0.75)
N ln (0.9377) ln (0.75)
N ( -0.06433) -0.28768

0.28768
= 4.47.
0.06433

Uma vez que N inteiro, o nmero de partidas que devem ser jogadas ser de N = 5.
Alternativa 2
Como se viu na alnea (i), a probabilidade de ganhar uma partida de p = 6.23%. Seja Y a
varivel aleatria que denota o nmero de partidas que o Sr. Jo Gador joga antes de ganhar pela
primeira vez. Nesta situao, a varivel Y segue uma distribuio Geomtrica G(p = 0.0623)
(note-se que a distribuio Geomtrica um caso particular da distribuio Binomial Negativa).
A funo de probabilidade de Y :
y

p (Y = y ) = 0.0623 (1 - 0.0623) .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Seja K = Y + 1 o nmero de partidas que o Sr. Jo Gador joga, na condio de ganhar na ltima
pela primeira vez. Na tabela seguinte apresentam-se os valores da funo de probabilidade e de
distribuio de K para cada valor de Y.
k
1
2
3
4
5

y
0
1
2
3
4

p(Y = y)
0.0623
0.0584
0.0548
0.0514
0.0482

F(y)
0.0623
0.1207
0.1755
0.2269
0.2750

Dado que para F(k = 5) 0.25, o nmero mnimo de partidas que o Sr. Jo Gador deve jogar
ser de 5.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.10
Alnea (iii)
Apoio 1 (apenas o resultado)
Valor esperado: 33.15 moedas de ouro.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Problema 6.10
Alnea (iii)
Apoio 2 (sugesto)
Note que h seis situaes distintas que podem ocorrer: ganhar numa das 5 partidas disponveis
ou no ganhar nenhuma. Determine a probabilidade de ocorrer cada situao e o respectivo
lucro.

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

ESTATSTICA

2. Edio

Problema 6.10
Alnea (iii)
Apoio 3 (resoluo completa)
H seis situaes distintas que podem ocorrer: ganhar numa das 5 partidas disponveis ou no
ganhar nenhuma.
Determine a probabilidade de ocorrer a ltima situao (no ganhar nenhuma partida) e o
respectivo lucro. Denote-se por L o lucro obtido e por Z o nmero de partidas ganhas em 5 tentativas. A varivel aleatria Z segue uma distribuio Binomial B(N = 5, p = 0.0623) (ver resultado
da alnea (i)). A probabilidade de no ganhar nenhuma partida dada por:

5
0
5
p (0 ) = (0.0623) . (1 - 0.0623) = 0.7250 .
0
A este resultado est associado um lucro (negativo) de L = 0 30 - 5 10 = -50 [moedas
de ouro].
Seja Y a varivel aleatria que denota o nmero de partidas que o Sr. Jo Gador joga antes de
ganhar pela primeira vez. Nesta situao, a varivel Y segue uma distribuio Geomtrica
G(p = 0.0623) e o lucro dado por L = 30 - 10 Y . Atendendo s regras estabelecidas pelo Sr. Jo
Gador, Y dever ser inferior a 5 (Y 4).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 6

Na tabela seguinte apresentam-se os cinco valores da funo de probabilidade de Y e de L


para as cinco situaes que faltam considerar: ganhar numa das 5 partidas disponveis.
p(Y = y)
0.0623
0.0584
0.0548
0.0514
0.0482

y
0
1
2
3
4

L
30
20
10
0
10

p(L = l)
P(L = 30) = p(Y = 0) = 0.0623
P(L = 20) = p(Y = 1) = 0.0584
P(L = 20) = p(Y = 2) = 0.0584
P(L = 0) = p(Y = 3) = 0.0514
P(L = 10) = p(Y = 4) = 0.0482

O valor esperado lucro dado por


6

E (L ) =

l p (l ) = -50 0.7250 + 30 0.0623 +


l =1

+20 0.0584 + 10 0.0548 - 10 0.0482 = -33.15 [moedas de ouro].

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Apndice

ESTATSTICA

2. Edio

Distribuies Discretas no Microsoft Excel


Distribuio Binomial
BINOMDIST: D o valor da funo de probabilidade [P(Y = y0)] e da funo de probabilidade
acumulada [P (Y y0)] da distribuio Binomial.
Exemplo: Se Y for B(6,0.20), calcular P(Y = 2) [= 0.24576] e P(Y 2) [= 0.90112].
Number_s:
Trials:
Probability_s:
Cumulative:

nmero de sucessos: 2
nmero de experincias: 6
probabilidade de um sucesso: 0.20
FALSE d a funo de probabilidade
TRUE d a funo de probabilidade acumulada

CRITBINOM: D o menor valor da varivel Binomial para o qual a funo de probabilidade


acumulada maior ou igual a um determinado valor.
Exemplo: Se Y for B(6,0.20), calcular o menor valor de y0 para o qual P(Y y0) 70% [y0 = 2]
Trials:
Probability_s:
Alpha:

Dashfer
Verlag
McGraw-Hill

nmero de experincias: 6
probabilidade de um sucesso: 0.20
valor da probabilidade em anlise: 0.70

CAPTULO 6

Funo de probabilidade da distribuio


Binomial ( N = 6, p = 0.20)

ESTATSTICA

Probabilidade

2. Edio

0.50
39.3%

0.40
0.30

26.2%

24.6%

0.20
8.2%

0.10
0.00

1.5%

0.2%

0.0%

Funo de probabilidade acumulada da


distribuio Binomial (N = 6, p = 0.20)

Probabilidade

1.00

90.1%

0.80

98.3%

99.8%

100.0% 100.0%

65.5%

0.60
0.40

26.2%

0.20
0.00
0

Dashfer
Verlag
McGraw-Hill

CAPTULO 6

Distribuio Hipergeomtrica
HYPGEOMDIST: D o valor da funo de probabilidade da distribuio Hipergeomtrica.

ESTATSTICA

2. Edio

Exemplo: Se Y for H(3, 297, 5), calcular P(Y = 1) [= 0.048669].


Sample_s:
Number_sample:
Population_s:
Number_pop:

nmero de sucessos: 1
nmero de experincias: 5
nmero de sucessos na populao: 3
dimenso total da populao: 300

Distribuio Binomial Negativa


NEGBINOMDIST: D o valor da funo de probabilidade da distribuio Binomial Negativa
[Prob(Y = y0)], isto , d a probabilidade de existirem y0 insucessos at ocorrer o r-simo sucesso.
Exemplo: Se Y for BN(r = 2, p = 0.07), calcular P(Y = 4) [= 0.0183].
Number_f:
Number_s:
Probability_s:

nmero de insucessos ocorridos at ao r-simo sucesso: 4


valor de r: 2
probabilidade de ocorrer um sucesso: 0.07

Distribuio de Poisson
POISSON: D o valor da funo de probabilidade [P(Y = y0)] e da funo de probabilidade
acumulada da distribuio de Poisson [P(Y y0)].
Exemplo: Se Y for Poisson (l = 0.833), calcular P(Y = 2) [= 0.15083] e P(Y 2) [= 0.94772].
Y:
Mean:
Cumulative:

Dashfer
Verlag
McGraw-Hill

nmero de ocorrncias no intervalo considerado: 2


nmero mdio de ocorrncias por unidade de tempo (l): 0.833
TRUE d a funo de probabilidade acumulada
FALSE d a funo de probabilidade

CAPTULO 7

ESTATSTICA

2. Edio

Captulos

Captulo 7
Problemas
7.1
(i)

7.1 7.1 7.2


(ii) (iii) (i)

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

Dashfer
Verlag
McGraw-Hill

7.2 7.2 7.2 7.3


(ii) (iii) (iv) (i)

7.3 7.3
7.4
(ii) (iii)

7.5
(i)

7.5
(ii)

7.6 7.6
(i) (ii)

7.7
(i)

7.7
(ii)

7.8

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.1
Alnea (i)
Apoio 1 (apenas o resultado)
26.4%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.1
Alnea (i)
Apoio 2 (sugesto)
A varivel aleatria tempo entre avarias consecutivas, t, segue uma distribuio Exponencial
Negativa. Note que a probabilidade de no ocorrer qualquer avaria antes do instante t = 6 horas
equivalente probabilidade de o tempo entre avarias consecutivas, t, ser superior a 6 horas.
Na seco 7.3 veja qual a expresso da funo de distribuio de uma varivel aleatria com
estas caractersticas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.1

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A varivel aleatria tempo entre avarias consecutivas, t, segue uma distribuio Exponencial
Negativa EN( = 1/l = 4.5 horas), onde l representa a taxa (mdia) de avarias por hora. A funo
distribuio F(t), que corresponde probabilidade de ocorrer pelo menos uma avaria no intervalo
[0, t], dada por
1

- t
F (t ) = 1 - e 4.5 ,

com t > 0.
Assim, a probabilidade pretendida vem
6
6

P (t 6 ) = 1 - F (6 ) = 1 - 1 - e 4.5 = e 4.5 = e -1.333 = 0.264 .

Na figura seguinte representa-se esta funo densidade de probabilidade de t para l = 1/4.5,


bem como a rea que corresponde a P(t 6).
f (t)

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.1
Alnea (ii)
Apoio 1 (apenas o resultado)
64.1%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.1
Alnea (ii)
Apoio 2 (sugesto)
A probabilidade pretendida condicional (ver definio na seco 3.4, expresso 3.10).

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.1

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Pretende-se calcular a probabilidade condicional

P t6 t4 =

P (t 6 t 4 )
P (t 4 )

P (t 6 )
P (t 4 )

Ora
6
6

P (t 6 ) = 1 - F (6 ) = 1 - 1 - e 4.5 = e 4.5 = e -1.333 = 0.264

e
4
4

P (t 4 ) = 1 - F ( 4 ) = 1 - 1 - e 4.5 = e 4.5 = e -0.889 = 0.411.

Substituindo,

P t6 t4 =

0.264
= 0.641 .
0.411

Note-se que, uma vez que t segue uma distribuio Exponencial Negativa, resulta que

P t 6 t 4 = P (t 2 ) .
De facto,
2
2

P (t 2 ) = 1 - F (2 ) = 1 - 1 - e 4.5 = e 4.5 = e -0.444 = 0.641 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.1
Alnea (iii)
Apoio 1 (apenas o resultado)
23.4%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.1
Alnea (iii)
Apoio 2 (sugesto)
Note que, a varivel aleatria nmero de avarias por unidade de tempo segue uma distribuio
de Poisson. Na seco 6.5 veja qual a expresso da funo de probabilidade de uma varivel
aleatria seguindo uma distribuio de Poisson.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.1
Alnea (iii)
Apoio 3 (resoluo completa)
Seja Y a varivel aleatria que denota o nmero de avarias por perodo de 6 horas. Sabe-se que
o nmero mdio de avarias por hora de l = 1/4.5. Dado que a probabilidade de se registar uma
avaria num intervalo qualquer de dimenso t praticamente proporcional dimenso do intervalo,
vem que
1
lt = l t =
6 = 1.333 [avarias / 6 horas].
4.5
Nestas condies, Y segue uma distribuio de Poisson (l =1.333). Recorrendo expresso
da funo de probabilidade de Y vem
P (Y = 2 ) = e -1.333

Dashfer
Verlag
McGraw-Hill

1.3332
= 0.234 .
2!

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (i)
Apoio 1 (apenas o resultado)
1.08%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (i)
Apoio 2 (sugesto)
Considere que as alturas, X, dos cidados so medidas com uma preciso de 0.005 m ( 0.5 cm).
Comece por padronizar a varivel X (na seco 7.4 veja como se efectua esta transformao).
Seguidamente recorra Tabela 3, do Anexo Tabelas, para determinar a probabilidade
pretendida.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

ESTATSTICA

2. Edio

Problema 7.2
Alnea (i)
Apoio 3 (resoluo completa)
Denote-se por X a varivel aleatria que representa a altura dos cidados adultos de um
determinado pas. Admita-se que as alturas dos cidados so medidas com uma preciso de
0.005 m ( 0.5 cm). Ora, X segue uma distribuio Normal N(x = 1.7, x = 0.05). Padronize-se
a varivel X:

Z=

X - mX
(note-se que Z uma Normal N(0, 1)).
sX

Assim,

X - 1.700 1.805 - 1.700


1.795 - 1.700
P (1.795 X 1.805) = P
Z=

0.05
0.05
0.05
= P (1.9 Z 2.1) = P ( Z 1.9) - P ( Z 2.1)

= 0.0287 - 0.0179 = 0.0108 (ver Tabela 3, do Anexo Tabelas).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (ii)
Apoio 1 (apenas o resultado)
1.79%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (ii)
Apoio 2 (sugesto)
Comece por padronizar a varivel X (na seco 7.4 veja como se efectua esta transformao).
Seguidamente recorra Tabela 3, do Anexo Tabelas, para determinar a probabilidade
pretendida.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (ii)
Apoio 3 (resoluo completa)
A varivel aleatria X, que representa a altura dos cidados adultos de um determinado pas,
segue uma distribuio Normal N(x = 1.7, x = 0.05). Padronizando a varivel X vem

X - 1.700 1.805 - 1.700

P ( X 1.805) = P Z =

0.05
0.05
= P ( Z 2.1) = 0.0179 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (iii)
Apoio 1 (apenas o resultado)
13.2%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (iii)
Apoio 2 (sugesto)
A probabilidade pretendida condicional (ver definio na seco 3.4, expresso 3.10).

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.2

ESTATSTICA

2. Edio

Alnea (iii)
Apoio 3 (resoluo completa)
A varivel aleatria X, que representa a altura dos cidados adultos de um determinado pas,
segue uma distribuio Normal N(x = 1.700, x = 0.05). A probabilidade condicional pretendida :

P X 1.805 X 1.755 =

P ( X 1.805 X 1.755)
P ( X 1.755)

P ( X 1.805)
P ( X 1.755)

Ora,
P ( X 1.805) = 0.0179
e
X - 1.700 1.755 - 1.700

P ( X 1.755) = P Z =

0.05
0.05

= P ( Z 1.1) = 0.1357 .
Finalmente,

P X 1.805 X 1.755 =

Dashfer
Verlag
McGraw-Hill

0.0179
= 0.132 .
0.1357

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (iv)
Apoio 1 (apenas o resultado)
96.42%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.2
Alnea (iv)
Apoio 2 (sugesto)
Comece por padronizar a varivel X (na seco 7.4 veja como se efectua esta transformao).
Seguidamente recorra Tabela 3, do Anexo Tabelas, para determinar a probabilidade
pretendida.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.2

ESTATSTICA

2. Edio

Alnea (iv)
Apoio 3 (resoluo completa)
A varivel aleatria X, que representa a altura dos cidados adultos de um determinado pas,
segue uma distribuio Normal N(x = 1.7, x = 0.05). Assim

X - 1.700 1.805 - 1.700


1.595 - 1.700
P (1.595 X 1.805) = P
Z=

0.05
0.05
0.05
= P ( -2.1 Z 2.1)
= P ( Z -2.1) - P ( Z 2.1) = 1 - P ( Z 2.1) - P ( Z 2.1)
= 1 - 2 P ( Z 2.1) = 1 - 2 0.0179 = 0.9642 .
Na figura seguinte representa-se a funo densidade de probabilidade de X e a rea
correspondente probabilidade pretendida.

f (x)

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (i)
Apoio 1 (apenas o resultado)
46.81%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (i)
Apoio 2 (sugesto)
Recorra transformao logartmica da varivel rendimento anual de um agricultor. De acordo
com a definio de distribuio Lognormal, a varivel transformada, V, seguir uma distribuio
Normal. Veja na Seco 7.5.2, as expresses dos parmetros da varivel transformada V.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.3
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)

Varivel aleatria X, que representa o rendimento anual (milhares de euros) dos agricultores numa determinada regio, Lognormal =
LN ( X 3.25,
=
X2 0.25). Assim,

V = ln X

N ( mV , s V2 ) ,

com

mV =

m4 1
1
3.254

ln 2 X 2 = ln
= 1.167
2
0.25 + 3.25
2
s X + mX 2

e
s 2

0.25

s V2 = ln X2 + 1 = ln
+ 1 = 0.1532 .
2

m
3
.
25
X

Nestas condies,
P ( X > 3.25) = P (V = ln X > ln 3.25) = P (V > 1.179)

V - 1.167 1.179 - 1.167

= PZ =
>
= 0.078

0.153
0.153
= 0.4681.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (ii)
Apoio 1 (apenas o resultado)
3.21.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (ii)
Apoio 2 (sugesto)
Na seco 7.5.2 apresenta-se a expresso para a mediana de uma distribuio Lognormal, que
funo do valor esperado da varivel transformada V.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (ii)
Apoio 3 (resoluo completa)
A mediana de X dada por
h X = e mV = e1.167 = 3.21

Note que, ao contrrio da distribuio Normal, a distribuio Lognormal assimtrica


direita.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (iii)
Apoio 1 (apenas o resultado)
0.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (iii)
Apoio 2 (sugesto)
Recorra padronizao da varivel transformada V, consultando posteriormente a tabela da
distribuio Normal padronizada (Tabela 3 do Anexo Tabelas).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.3
Alnea (iii)
Apoio 3 (resoluo completa)
A varivel aleatria X, que denota rendimento anual (milhares de euros) dos agricultores numa
determinada regio Lognormal LN ( m X = 3.25, s X2 = 0.25). A varivel transformada V = ln X
segue uma distribuio Normal N ( mV , s V2 ) . Nestas condies,
P ( X < 0.9) = P (V < ln 0.9) = P (V < -0.105)

V - 1.167 -0.105 - 1.167

= PZ =
<
= -8.32

0.153
0.153
= P ( Z < -8.32 ) 0.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.4
Apoio 1 (apenas o resultado)
22.84%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.4
Apoio 2 (sugesto)
Note que a varivel aleatria nmero de peas com grau de qualidade A includas na amostra
segue uma distribuio Hipergeomtrica. Procure aproximar esta distribuio por uma distribuio
Normal cujos parmetros valor esperado e desvio padro so os mesmos da distribuio
Hipergeomtrica.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

ESTATSTICA

2. Edio

Problema 7.4
Apoio 3 (resoluo completa)
A varivel aleatria X, que denota nmero de peas com grau de qualidade A includas na amostra,
segue uma distribuio Hipergeomtrica H (7000 p, 7000 q, 300 ). O parmetro p = 5000/
/7000 = 5/7 corresponde proporo de peas com grau de qualidade A e q = 1 p = 2/7
proporo de peas com grau de qualidade B. Assim, X
H (5000 , 2000 , 300 ) , com
5
= 214.3 [peas]
7
5 2 7000 - 300
M-N
= 300
= 58.6 [peas2]
s X2 = N p q
7 7 7000 - 1
M -1
m X = N p = 300

e
s X = 58.6 = 7.66 [peas].
Uma vez que M 10 N , esta distribuio Hipergeomtrica pode ser aproximada por uma
distribuio Binomial. Por sua vez, dado que N 20 e N p > 7, a distribuio Binomial pode
ser aproximada por uma distribuio Normal. Assim, admite-se que X segue aproximadamente
uma distribuio Normal N ( m = 214.3, s 2 = 58.6 ), vindo

X - 214.3 220 - 214.3

P ( X > 220 ) = P Z =
>

7.66
7.66
= P ( Z > 0.744 ) .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Ora

P ( Z > 0.74 ) = 0.2296

ver Tabela 3, do Anexo Tabelas


P ( Z > 0.75) = 0.2266
Efectuando uma interpolao linear obtm-se
P ( Z > 0.744 ) = 0.2296 -

= 0.2284.

Dashfer
Verlag
McGraw-Hill

0.2296 - 0.2266
4
(0.744 - 0.74 ) = 0.2296 - 0.0030
0.75 - 0.74
10

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.5
Alnea (i)
Apoio 1 (apenas o resultado)
10.12.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.5
Alnea (i)
Apoio 2 (sugesto)
O valor pretendido pode ser obtido directamente da Tabela 4 no Anexo Tabelas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.5

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
2 . Na Tabela 4 do Anexo Tabelas registam-se os valores
A varivel X segue uma distribuio c19
2
crticos de distribuies c GL (a ) , tais que

a=

f (u) du.

2
c GL

(a )

Ora, o valor de x0 que satisfaz a condio P(X < x0) = 5% satisfaz tambm P(X > x0) = 95%.
Consultando a tabela obtm-se directamente x0 = 10.12. Na figura seguinte representa-se a funo
2 e o valor correspondente probabilidade
densidade de probabilidade da distribuio c19
pretendida.

D = 95%

F192

F192 (D = 95%) = 10.12

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.5
Alnea (ii)
Apoio 1 (apenas o resultado)
72.5%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.5
Alnea (ii)
Apoio 2 (sugesto)
O valor pretendido pode ser obtido directamente da Tabela 4 no Anexo Tabelas.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.5
Alnea (ii)
Apoio 3 (resoluo completa)
2 a
Note que na Tabela 4 do Anexo Tabelas se registam os valores crticos de distribuies c GL
( )
e no as probabilidades associadas s caudas (tal como na distribuio Normal). Estes valores
podem ser obtidos directamente desta tabela:
P(8.91 < X < 22.72) = P (X > 8.91) P(X > 22.72)
= 0.975 0.250
= 0.725.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.6
Alnea (i)
Apoio 1 (apenas o resultado)
2.998.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.6
Alnea (i)
Apoio 2 (sugesto)
O valor pretendido pode ser obtido directamente da Tabela 5 no Anexo Tabelas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.6

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A varivel V segue uma distribuio t7. Na Tabela 5 do Anexo Tabelas registam-se as
probabilidades associadas cauda direita de distribuies tGL(), tais que

a=

f (u) du.

tGL (a )

Consultando a tabela obtm-se directamente o valor de v0 que satisfaz a condio P(V > v0) = 1%.
Tal valor v0 = 2.998. Na figura seguinte representa-se a funo densidade de probabilidade da
distribuio t7 e o valor correspondente probabilidade pretendida.

D = 1%

t7
t 7 (D = 1%) = 2.998

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.6
Alnea (ii)
Apoio 1 (apenas o resultado)
84.0%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.6
Alnea (ii)
Apoio 2 (sugesto)
A probabilidade pretendida pode ser calculada com base nos valores que se apresentam na
Tabela 5 do Anexo Tabelas.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.6
Alnea (ii)
Apoio 3 (resoluo completa)
Pretende-se calcular P(1.12 < V < 2.99). Ora,
P(1.12 < V < 2.99) = P(V < 2.99) P(V < 1.12) = 1 [P(V > 2.99) + P(V > 1.12)].
Recorrendo Tabela 5 do Anexo Tabelas fcil determinar estas probabilidades:
1 [P(V > 2.99) + P(V > 1.12)] = 1 (0.010 + 0.150) = 0.840.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.7
Alnea (i)
Apoio 1 (apenas o resultado)
1.89.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.7
Alnea (i)
Apoio 2 (sugesto)
O valor pretendido pode ser obtido directamente da Tabela 6 no Anexo Tabelas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Problema 7.7

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A varivel U segue uma distribuio F24, 30. Na Tabela 6 do Anexo Tabelas registam-se os
valores FGL1 , GL2 (a ) , tais que

a=

f (u ) du.

FGL1 , GL2 (a )

Consultando a tabela obtm-se directamente o valor de u0 que satisfaz a condio P(U > u0) = 5%.
Tal valor u0 = 1.89. Na figura seguinte representa-se a funo densidade de probabilidade da
distribuio F24,30 e o valor correspondente probabilidade pretendida.

D = 5%

F24, 30
F24, 30 (D = 5%) = 1.89

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.7
Alnea (ii)
Apoio 1 (apenas o resultado)
0.388.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.7
Alnea (ii)
Apoio 2 (sugesto)
Para determinar o valor pretendido recorra seguinte relao
FGL1 , GL2 (1 - a ) =

Dashfer
Verlag
McGraw-Hill

1
FGL2 , GL1 (a )

CAPTULO 7

Problema 7.7
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja a a probabilidade associada cauda direita da distribuio FGL1 , GL2 (a ) , ou seja,

a=

f (u ) du.

FGL1 , GL2 (a )

Para se obterem os valores FGL1 , GL2 (1 - a ) correspondentes a reas de valor a situadas na


cauda esquerda da distribuio FGL1 , GL2 , recorre-se seguinte expresso:
FGL1 , GL2 (1 - a ) =

1
.
FGL2 , GL1 (a )

O valor de u1 que satisfaz a condio P(U = F24, 30 < u1) = 1% corresponde ao valor da
distribuio F24, 30 cuja rea sua direita de 99%. Assim,

F24, 30 (0.99) =

1
F30, 24 (0.01)

Recorrendo Tabela 6 verifica-se que P(F30, 24 > 2.58) = 1%, donde

F24, 30 (0.99) =

Dashfer
Verlag
McGraw-Hill

1
2.58

u1 =

1
= 0.388.
2.58

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.8
Apoio 1 (apenas o resultado)
15.15%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 7

Problema 7.8
Apoio 2 (sugesto)
Repare que a probabilidade de uma varivel tomar um valor superior ao de uma outra,
equivalente a considerar-se a probabilidade de uma nova varivel, que resulta da diferena entre
as duas anteriores, ser superior a zero. Recorde que a combinao linear de duas variveis
normais independentes segue ainda uma distribuio Normal.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

ESTATSTICA

2. Edio

Problema 7.8
Apoio 3 (resoluo completa)
Denote-se por DT a longevidade de um pilha do tipo T (em horas) e por DA a longevidade de uma
pilha do tipo A. A probabilidade pretendida :
P(DT > DA) = P(DT DA > 0).
A varivel (DT DA) resulta da diferena entre duas distribuies Normais, pelo que tambm
Normal. Atendendo a que DT e DA so presumivelmente independentes, o valor esperado e a
varincia de (DT DA) vm dados por:
E(DT DA) = E(DT) E(DA) = 150 156 = -6
Var(DT DA) = Var(DT) + Var(DA) = 25 + 9 = 34.
Assim,

( DT - DA ) - ( -6)
0 +6
P ( DT - DA > 0 ) = P
=Z>

34
34

= P(Z > 1.03) = 0.1515.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Apndice

ESTATSTICA

2. Edio

Distribuies Contnuas no Microsoft Excel


Distribuio Normal
NORMDIST: d o valor da funo de probabilidade acumulada [P(X x0)] e da funo densidade
de probabilidade f(x0).
Exemplo: Se X for Normal ( = 2.5, =1.2), calcular P(X 1.6) [= 0.2266] e f(x0 = 1.6)
[=0.2509].
X:
Mean:
Standard_dev:
Cumulative:

valor em anlise: 1.6


valor esperado(): 2.5
desvio padro (): 1.2
TRUE d o valor da funo
de probabilidade acumulada
FALSE d o valor da funo
densidade de probabilidade

NORMINV: d o valor crtico (x0) cuja funo de probabilidade acumulada igual a um


determinado valor P1. [Prob(X x0) = P1].
Exemplo: Se X for Normal ( = 2.5, =1.2), calcular x0 tal que P(X x0) = 0.900 [= 4.0379].
Probability:
Mean:
Standard_dev:

Dashfer
Verlag
McGraw-Hill

valor da probabilidade acumulada: 0.90


valor esperado (): 2.5
desvio padro (): 1.2

CAPTULO 7

NORMSDIST: d o valor da funo de probabilidade acumulada [P(Z z0)] da distribuio


Normal padronizada.
Exemplo: Se Z for Normal ( = 0, = 1), calcular P(Z 1.645) [= 0.9500].

ESTATSTICA

2. Edio

Z:

valor em anlise: 1.645

NORMSINV: d o valor crtico (z0) cuja funo de probabilidade acumulada da distribuio


Normal padronizada igual a um determinado valor P1 [Prob(Z z0) = P1].
Exemplo: Se Z for Normal ( = 0, = 1), calcular z0 tal que P(Z z0) = 0.025 [= 1.9600].
Probability:

valor da probabilidade acumulada: 0.025

STANDARDIZE: Padroniza o valor de uma varivel X que segue uma distribuio Normal
qualquer.
Exemplo: Se X for Normal ( = 2.5, = 1.2), obter o valor padronizado de X = 0.7 [= 1.5].
X:
Mean:
Standard_dev:

valor da varivel a padronizar: 0.7


valor esperado (): 2.5
desvio padro (): 1.2

Distribuio t de Student
TDIST: d, para um determinado valor positivo (t0) da distribuio tGL, a probabilidade de obter
um valor superior a t0, [P(tGL t0)], ou a probabilidade de obter um valor mais extremo do
que t0 [P(tGL t0 ou tGL t0)].

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Exemplo: Para a distribuio t18, calcular P(t18 1.6) [= 0.0635] e P(t18 1.6 ou t18 1.6)
[= 2 0.0635 = 0.1270].

ESTATSTICA

2. Edio

X:
Deg_freedom:
Tails:

valor em anlise: 1.6


Graus de liberdade da distribuio t: 18
1 d a valor da P(tGL 1.6)
2 d o valor da P (tGL 1.6 ou tGL 1.6)

TINV: d o valor crtico (t0) cuja probabilidade de obter um valor mais extremo na distribuio tGL
igual a um determinado valor P1 [P(tGL t0 ou tGL t0) = P1].
Exemplo: Para a distribuio t12, calcular t0 tal que P(t12 t0 ou t12 t0) = 0.05 [= 2.1788].
Probability:
Deg_freedom:

valor da probabilidade: 0.05


graus de liberdade da distribuio t: 12

Distribuio F
FDIST: d, para um determinado valor (x0) da distribuio FGL1,GL2 (x0), a probabilidade de obter
um valor superior a x0 [P(FGL1,GL2 x0)].
Exemplo: Para a distribuio F6,15, calcular P(F6,15 2.79) [= 0.0500].
X:
Deg_freedom1:
Deg_freedom2:

valor em anlise: 2.79


graus de liberdade GL1: 6
graus de liberdade GL2: 15

FINV: d o valor crtico (x0) cuja probabilidade de obter um valor superior na distribuio
FGL1,GL2 igual a um determinado valor P1 [P(FGL1,GL2 x0) = P1].

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Exemplo: Para a distribuio F6,15, calcular x0 tal que P(F6,15 x0) = 0.08 [= 2.3916].

ESTATSTICA

2. Edio

Probability:
Deg_freedom1:
Deg_freedom2:

valor da probabilidade: 0.08


Graus de liberdade GL1: 6
Graus de liberdade GL2: 15

Distribuio do Qui-Quadrado
2 (x ), a probabilidade de obter
CHIDIST: d, para um determinado valor (x0) da distribuio c GL
0
2
um valor superior a x0 [P( c GL x0)].
2 , calcular P( c 2 31) [= 0.0288].
Exemplo: Para a distribuio c18
18

X:
Deg_freedom:

valor em anlise: 31
2 : 18
graus de liberdade da distribuio c18

CHIINV: d o valor crtico (x0) cuja probabilidade de obter um valor superior na distribuio
2 igual a um determinado valor P1 [P( c 2 x ) = P1].
c GL
GL
0
2 , calcular x tal que P( c 2 x ) = 0.05 [= 43.7730].
Exemplo: Para a distribuio c 30
30
0
0

Probability:
Deg_freedom:

valor da probabilidade: 0.05


2 : 30
graus de liberdade da distribuio c GL

Distribuio Exponencial Negativa


EXPONDIST: d o valor da funo distribuio [P(X x0)] e da funo densidade de probabilidade f (x0) de distribuio Exponencial Negativa.

Dashfer
Verlag
McGraw-Hill

CAPTULO 7

Exemplo: Se X for EN (l = 3), calcular x0 tal que P(X 0.25) [= 0.5276] e calcular f (0.25)
[= 1.4171].

ESTATSTICA

2. Edio

X:
Lambda:
Cumulative:

valor em anlise: 0.25


nmero mdio de ocorrncias por unidade de tempo: 3
TRUE d a funo de probabilidade acumulada
FALSE d a valor da funo densidade
de probabilidade

Distribuio Lognormal
LOGNORMDIST: d o valor da funo de probabilidade acumulada da varivel X [P(X x0)],
onde ln (X) um varivel que segue uma distribuio Normal, com valor esperado e desvio
padro .
Exemplo: Se X for uma varivel Lognormal, em que ln(X) Normal ( = 1.167, = 0.153),
calcular P(X 3.25) [= 0.5304].
X:
Mean:
Standard_dev:

valor em anlise: 3.25


valor esperado (): 1.167
desvio padro (): 0.153

LOGINV: d o valor crtico (x0) de uma varivel Lognormal cuja funo distribuio igual a
um determinado valor P1 [P(X x0) = P1].
Exemplo: Se X for uma varivel Lognormal, em que ln(X) Normal ( = 1.167, = 0.153),
calcular x0 tal que P(X x0) = 0.5304 [= 3.25].
Probability:
Mean:
Standard_dev:

Dashfer
Verlag
McGraw-Hill

valor da probabilidade acumulada: 0.5304


valor esperado (): 1.167
desvio padro (): 0.153

CAPTULO 8

ESTATSTICA

2. Edio

Captulos

Captulo 8
Problemas
8.1
(i)

8.1
(ii)

8.1
(iii)

n.a.

n.a.

8.2
(i)

8.2
(ii)

8.3

8.4
(i)

8.4
(ii)

8.5
(i)

8.5
(ii)

8.5
(iii)

8.6

8.7

8.8
(i)

n.a.

n.a.

n.a.

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

n.a. = no aplicvel

Dashfer
Verlag
McGraw-Hill

8.8
(ii)

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.1
Alnea (i)
Apoio 1 (apenas o resultado)
Valor esperado: 3.9
Desvio padro: 1.302.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.1
Alnea (i)
Apoio 2 (sugesto)
A varivel aleatria vendas quinzenais resulta da soma de duas variveis aleatrias independentes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.1

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A varivel aleatria Y denota as vendas semanais de computadores. O valor esperado e a varincia
de Y so, respectivamente:
3

E(Y) = mY =

y p ( y) = 0 0.10 + 1 0.15 + 2 0.45 + 3 0.30 = 1.95


y =0

e
3

Var(Y) = s Y2 =

( y - m ) p ( y)
Y

y =0

= (0 1.95)2 0.10 + (1 1.95)2 0.15 + (2 1.95)2 0.45 + (3 1.95)2 0.30


= 0.8475.
Seja Q a varivel aleatria que denota as vendas quinzenais de computadores. Ora, considerando que Y1 e Y2 correspondem s vendas que se verificam em duas semanas consecutivas,
ento:
Q = Y 1 + Y 2,
E(Q) = E(Y1) + E(Y2) = 2 . E(Y) = 2 . 1.95 = 3.9
e
Var(Q) = Var(Y1) + Var(Y2) = 2 . Var(Y) = 2 . 0.8475 = 1.695,
ou

s (Q ) = 1.695 = 1.302.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.1
Alnea (ii)
Apoio 2 (sugesto)
Procure representar numa tabela todas as combinaes possveis das variveis Y1 e Y2 (que
correspondem s vendas que se verificam em duas semanas consecutivas) juntamente com as
probabilidades de tais combinaes ocorrerem. Note que por cada combinao de Y1 e Y2 se
obtm um valor particular de Q.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.1

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Na tabela seguinte apresentam-se todas as combinaes possveis das variveis Y1 e Y2, juntamente
com as probabilidades de tais combinaes ocorrerem.
y1

y2

p(q)

0
0
0
0
1
1
1
1
2
2
2
2
3
3
3
3

0
1
2
3
0
1
2
3
0
1
2
3
0
1
2
3

0
1
2
3
1
2
3
4
2
3
4
5
3
4
5
6

0.10 0.10 = 0.01


0.10 0.15 = 0.015
0.10 0.45 = 0.045
0.10 0.30 = 0.03
0.15 0.10 = 0.015
0.15 0.15 = 0.0225
0.15 0.45 = 0.0675
0.15 0.30 = 0.045
0.45 0.10 = 0.045
0.45 0.15 = 0.0675
0.45 0.45 = 0.2025
0.45 0.30 = 0.135
0.30 0.10 = 0.03
0.30 0.15 = 0.045
0.30 0.45 = 0.135
0.30 0.30 = 0.09
confirmao:

Dashfer
Verlag
McGraw-Hill

p( q ) = 1

CAPTULO 8

A funo de probabilidade da varivel Q ento:

2. Edio

ESTATSTICA

p(q)

q
0
1
2
3
4
5
6

0.015 + 0.015
0.045 + 0.0225 + 0.045
0.03 + 0.0675 + 0.0675 + 0.03
0.045 + 0.2025 + 0.045
0.135 + 0.135

= 0.01
= 0.03
= 0.1125
= 0.195
= 0.2925
= 0.27
= 0.09

Verifiquem-se agora os resultados obtidos na alnea anterior.


6

E(Q) = mQ =

q p (q )
z =0

= 0 0.01 + 1 0.03 + 2 0.1125 + 3 0.195 + 4 0.2925 + 5 0.27 + 6 0.09 = 3.9.


6

Var(Q) = s Q2 =

(q - m ) p (q )
Q

z =0

= (0 3.9)2 0.01 + (1 3.9)2 0.03 + (2 3.9)2 0.1125 + (3 3.9)2 0.195 +


+ (4 3.9)2 0.2925 + (5 3.9)2 0.27 + (6 3.9)2 0.09 = 1.695.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.1
Alnea (iii)
Apoio 2 (sugesto)
Procure gerar duas amostras aleatrias (de dimenso 500) de vendas semanais (ou seja, das
variveis Y1 e Y2) e, a partir destas, gere uma outra de vendas quinzenais (Q = Y1 + Y2). Para gerar
as amostras aleatrias pode recorrer a qualquer calculadora (ou aplicao informtica) que produza
nmeros aleatrios pertencentes a uma distribuio Uniforme U(0, 1). No caso do Microsoft
Excel, basta recorrer funo RAND para se obter um nmero aleatrio maior ou igual a 0 e
menor do que 1.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.1

ESTATSTICA

2. Edio

Alnea (iii)
Apoio 3 (resoluo completa)
Comea-se por produzir duas amostras aleatrias (de dimenso 500) de vendas semanais (ou
seja, das variveis Y1 e Y2). Para tal, geram-se nmeros aleatrios un pertencentes distribuio
Uniforme U(0, 1). Divide-se o intervalo [0, 1[ em tantos intervalos quantos os valores que a
varivel discreta Y pode tomar, associando a cada valor desta um intervalo com uma amplitude
proporcional probabilidade com que tal valor pode ocorrer. Assim:
yn = 0, se 0.0000 un < 0.1000
yn = 1, se 0.1000 un < 0.2500
yn = 2, se 0.2500 un < 0.7000
yn = 3, se 0.7000 un < 1.0000

(10%)
(15%)
(45%)
(30%)

Apresentam-se de seguida duas amostras aleatrias de vendas semanais (y1 e y2) e uma de
vendas quinzenais (q = y1 + y2) criada a partir das duas anteriores. Os nmeros aleatrios un
foram obtidos recorrendo ao Microsoft Excel.
N

u1 = U(0, 1)

u2 = U(0, 1)

y1

y2

q = y1+ y2

1
2
3
4

0.3277
0.7264
0.8929
0.4834

0.2197
0.3982
0.5029
0.7599

2
3
3
2

1
2
2
3

3
5
5
5

498
499
500

0.7640
0.8103
0.5623

0.2814
0.8252
0.9127

3
3
2

2
3
3

5
6
5

()

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Estatstica

Q = Y1+Y2

Dimenso da amostra
Mdia
Desvio padro
Coeficiente de assimetria

500
3.8360
1.2199
0.4417

Na figura seguinte mostra-se o histograma de frequncias relativas construdo com as 500


observaes da varivel Q.

Frequncia relativa

ESTATSTICA

2. Edio

No quadro seguinte apresentam-se algumas estatsticas da amostra de vendas quinzenais.

30%

20%

10%

0%
0

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.2
Alnea (i)
Apoio 1 (apenas o resultado)
10.03%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.2
Alnea (i)
Apoio 2 (sugesto)
Repare que a probabilidade de uma varivel tomar um valor superior a uma outra equivalente
a considerar a probabilidade de a varivel que resulta da diferena entre as duas anteriores ser
superior a zero. Recorde que a combinao linear de duas variveis Normais independentes
segue ainda uma distribuio Normal.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.2

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Denote-se por X o nmero de jogos vendidos por dia na loja do Porto e por Y o nmero de jogos
vendidos por dia na loja de Lisboa. O que se pretende determinar P(X > Y) ou, o que
equivalente, P[(X Y) > 0]. Como X e Y so Normais, a varivel (X Y) tambm o , com valor
esperado
E(X Y) = E(X) E(Y) = 150 200 = 50
e varincia
2

Var ( X - Y ) = (1) Var ( X ) + 2 (1) ( -1) Cov ( X , Y ) + ( -1) Var (Y )

= Var ( X ) + Var (Y ) = 252 + 302 = 1525 (supondo que X e Y so independentes).


Assim,

( X - Y ) - ( -50) > 0 - ( -50)


P ( X - Y ) > 0 = P Z =

1525
1525

= P ( Z > 1.28) = 0.1003 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.2
Alnea (ii)
Apoio 1 (apenas o resultado)
96.49%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.2
Alnea (ii)
Apoio 2 (sugesto)
Em primeiro lugar, procure caracterizar a varivel nmero de jogos vendidos por dia no conjunto
das duas lojas. Seguidamente, caracterize a varivel nmero total de jogos vendidos em 200 dias
no conjunto das duas lojas (que corresponde soma de 200 variveis aleatrias independentes
com a mesma distribuio). Para tal recorra ao Teorema do Limite Central.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.2

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Denote-se por V = X + Y a varivel Normal que corresponde soma do nmero de jogos vendidos
por dia em cada uma das duas lojas (Porto e Lisboa). O valor esperado e varincia de V so,
respectivamente:
E(V) = E(X) + E(Y) = 150 + 200 = 350
2

Var (V ) = (1) Var ( X ) + 2 (1) (1) Cov ( X , Y ) + (1) Var (Y )


= Var ( X ) + Var (Y ) = 252 + 302 = 1525 (admitindo que X e Y so independentes).
Considere agora a varivel T que representa o nmero de jogos vendidos em 200 dias nas
duas lojas. Ou seja,
200

T=

V = V + V
i

+ + V200 = 200 V .

i =1

Esta varivel, que tambm Normal (soma de variveis Normais independentes), tem valor
esperado e varincia, respectivamente,
E (T ) = E(V1 ) + E(V2 ) + E(V3 ) + ... + E(V200 ) = 200 350 = 700 000
Var (T ) = Var(V1 ) + Var(V2 ) + Var(V3 ) + ... + Var(V200 ) = 200 1525 = 305 0000.
Assim,

T - 70 000 69 000 - 70 000


P (T > 69 000 ) = P Z =
>

305 000
305 000

= P ( Z > -1.81) = 1 - P ( Z < -1.81) = 1 - P ( Z > 1.81) = 1 - 0.0351 = 0.9649.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.3
Apoio 1 (apenas o resultado)
17.91%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.3
Apoio 2 (sugesto)
Na seco 8.5 veja qual a definio do Teorema do Limite Central. Repare que o peso dos 50
mineiros, que se denota por S, consiste numa varivel que resulta da soma de 50 variveis
aleatrias independentes com a mesma distribuio.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.3
Apoio 3 (resoluo completa)
Sejam:

ESTATSTICA

2. Edio

X:
C:
M:
N:
S:
X:

o peso de cada mineiro [em kg] (com E(X) = 75 [kg] e Var(X) = 64 [kg2])
a capacidade nominal do elevador (com C = 3800 kg)
a dimenso da populao (com M = 650)
a dimenso da amostra (com N = 50)
o peso de 50 mineiros seleccionados aleatoriamente, e
a mdia amostral de X em amostras de dimenso N = 50.

Nestas condies,

( )

E X = E ( X ) = 75 [kg]

e
M -N 1
650 - 50 1
Var X =
Var ( X ) =
64 .

M -1 N
650 - 1 50

( )

Ora,
50

50

S=

= 50

i =1

Xi
i =1

50

= 50 X ,

vindo

( )

E (S ) = 50 E X = 50 75 = 3750 [kg]

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

e
650 - 50 1
Var (S ) = 502 Var X = 502
64 = 2956.8 [kg2],
650 - 1 50

( )

ou

ESTATSTICA

2. Edio

s S = 2956.8 = 54.38 [kg].


De acordo com o Teorema do Limite Central, a varivel S (soma de 50 variveis aleatrias
independentes com a mesma distribuio) seguir aproximadamente uma distribuio Normal.
Assim,
S

N ( mS = 3750 , s S2 = 54.382 ) .

Transformando a varivel S na varivel normal padronizada N(0, 1) vem

Z=
Assim,

S - mS
.
sS

3800 - 3750
S - 3750
P ( S 3800 ) = P
=Z
54.38
54.38
= P ( Z 0.919) .
Ora,

P ( Z > 0.91) = 0.1814

(ver Tabela 3, do Anexo Tabelas).


P ( Z > 0.92 ) = 0.1788
Efectuando uma interpolao linear, obtm-se finalmente

P ( Z > 0.919) = 0.1814 -

Dashfer
Verlag
McGraw-Hill

0.1814 - 0.1788
(0.919 - 0.91) 0.1791 .
0.92 - 0.91

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.4
Alnea (i)
Apoio 1 (apenas o resultado)
69.57%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.4
Alnea (i)
Apoio 2 (sugesto)
Independentemente da forma da distribuio original do salrio horrio de um engenheiro recm-formado na Alemanha, pode considerar-se que a dimenso da amostra suficientemente grande
para que a varivel mdia amostral siga uma distribuio aproximadamente Normal (Teorema
do Limite Central). Na seco 8.4 veja quais as expresses do valor esperado e da varincia da
mdia amostral. Assuma que os parmetros das populaes coincidem com as correspondentes
estatsticas amostrais.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.4

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Denote-se por A a varivel aleatria salrio horrio de um engenheiro recm-formado na
Alemanha. Admita-se que os parmetros das populaes coincidem com as correspondentes
estatsticas amostrais. A varivel A ter ento valor esperado A = 15.4 e desvio padro A = 3.0.
Atendendo ao Teorema do Limite Central, admite-se que a mdia dos salrios de uma amostra
de 40 engenheiros a trabalhar na Alemanha, que se denota por A, segue uma distribuio Normal
com valor esperado

()

E A = E ( A) = 15.4 [Euros]
e varincia

()

Var A =

1
9
Var ( A) =
= 0.225 [Euros2].
N
40

Padronizando esta varivel vem:


15 - 15.4
A - 15.4 16 - 15.4
P 15 A 16 = P
Z=

= P ( -0.84 Z 1.26 ) =
0.225
0.225
0.225

= 1 - P ( Z 1.26 ) - P ( Z 0.84 ) = 1 - 0.1038 - 0.2005 = 0.6957.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.4
Alnea (ii)
Apoio 1 (apenas o resultado)
31.92%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.4
Alnea (ii)
Apoio 2 (sugesto)
Procure caracterizar a varivel aleatria que resulta da diferena entre as mdias amostrais dos
salrios horrios na Alemanha e em Portugal. Recorde que a combinao linear de duas variveis
Normais independentes segue ainda uma distribuio Normal.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.4
Alnea (ii)
Apoio 3 (resoluo completa)
De acordo com a resoluo da alnea (i), a varivel A segue uma distribuio
N m A = 15.4 , s A2 = 0.225 . Denote-se por P a varivel aleatria que representa o salrio
horrio de um engenheiro recm-formado em Portugal. Do mesmo modo, atendendo ao Teorema
do Limite Central, a varivel P , que representa a mdia dos salrios de uma amostra de 50
engenheiros a trabalhar em Portugal, segue uma distribuio Normal com valor esperado

ESTATSTICA

2. Edio

()

E P = E ( P ) = 11.2 [Euros]

e varincia

()

Var P =

1
9
Var ( P ) =
= 0.18 [Euros2].
N
50

A varivel diferena entre as mdias amostrais, ( A - P ), segue tambm uma distribuio


Normal com valor esperado e varincia, respectivamente,

) () ()

E A - P = E A - E P = 15.4 - 11.2 = 4.2 [Euros]


2

Var ( A - P ) = (1) Var ( A) + 2 (1) ( -1) Cov ( A, P ) + ( -1) Var ( P )

= Var ( A) + Var ( P ) = 0.225 + 0.18 = 0.405 [Euros2]


(admite-se que A e P so independentes e que, portanto, Cov ( A, P ) = 0 ).
Assim,

A - P - 4.2 4.5 - 4.2

>
P A - P > 4.5 = P Z =

0.405
0.405

= P ( Z > 0.47) = 0.3192 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.5
Alnea (i)
Apoio 1 (apenas o resultado)
mV = 27 103
s V 7.79 103 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.5
Alnea (i)
Apoio 2 (sugesto)
Embora V (varivel que denota o volume das peas) resulte de uma transformao no linear de
variveis Normais, considere que pode ser aproximada por uma relao linear em torno de
md1 , md2 e md3 . Na Seco 5.7 do livro, veja quais as expresses do valor esperado e da varincia
neste tipo de transformaes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.5

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Seja V = d1 d2 d3 a varivel aleatria que denota o volume das peas. Embora V resulte de uma
transformao no linear de variveis Normais e independentes, admita-se que pode ser
aproximada por uma relao linear em torno de md1 , md2 e md3. Assim,
mV E ( d1 ) E ( d2 ) E (d3 ) = md3 = 27 103
e

V
Var (V )
d1

Var ( d ) +
1

md1 , md2 , md3

V
+
d2

Var ( d ) +
2

md1 , md2 , md3

V
+
d3

Var ( d )
3

md1 , md2 , md3

= 3 md2 s d2

= 3 9002 25 = 60.75 106 ,


ou

Dashfer
Verlag
McGraw-Hill

V 7.79.103.

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.5
Alnea (ii)
Apoio 1 (apenas o resultado)
16.0%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.5
Alnea (ii)
Apoio 2 (sugesto)
Verifique atravs de um histograma que a hiptese de que a varivel V pode ser aproximada
por uma relao linear em torno de md1 , md2 e md3 no rigorosa. A partir de amostras de d1, d2
e d3 gere amostras de V = d1 d2 d3, e recorra definio frequencista de probabilidade para
calcular P(V > 35). Gere as amostras pelo mtodo de Monte Carlo recorrendo ao Microsoft
Excel.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.5

ESTATSTICA

2. Edio

Alnea (ii)

Apoio 3 (resoluo completa)


Se a hiptese de que a varivel V pode ser aproximada por uma relao linear em torno de
md1 , md2 e md3 for vlida, ento V resultar de uma combinao linear de variveis Normais e
seguir tambm uma distribuio Normal N(V, V). Nessas condies seria

V - 27 103 35 - 27

P (V > 35 103 ) = P Z =
>
= P ( Z > 1.027) 0.1522 .

7.79 103
7.79

No entanto, no parece provvel que a aproximao linear seja muito rigorosa, pois de
esperar que V tenha uma distribuio assimtrica direita (isto , com uma cauda maior direita).
Verifique-se se assim gerando uma amostra de 500 observaes de V, construda a partir de
outras tantas observaes independentes de d1, d2 e d3 (com di sendo IN(d = 30, d = 5). As
amostras de d1, d2 e d3 podem ser produzidas recorrendo ao Microsoft Excel, da seguinte
forma. Para cada uma das variveis di, produzem-se 500 observaes pertencentes distribuio
U(0, 1) recorrendo funo RAND. Em seguida, utilizando a funo NORMINV, que produz
valores da inversa da funo distribuio da Normal (, ), geram-se as observaes de di.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Frequncia relativa

Frequncia relativa

15%

10%

15%

10%

5%

5%

0%

0%
15

20

25

30

35

40

20

15

45

25

30

d2

d1
Frequncia relativa

ESTATSTICA

2. Edio

Nas figuras seguintes apresentam-se os histogramas de frequncias das trs variveis d1,
d 2 e d 3.

15%

10%

5%

0%
15

20

25

30

d3

Dashfer
Verlag
McGraw-Hill

35

40

45

35

40

45

CAPTULO 8

Na tabela seguinte apresentam-se algumas estatsticas amostrais de d1, d2 e d3.

Dimenso da amostra
Mdia
Desvio padro
Coeficiente de kurtose
Coeficiente de assimetria

d1

d2

d3

500
30.208
4.943
1.046
1.096

500
30.132
4.856
0.269
0.249

500
30.209
4.763
0.302
0.614

As 500 observaes de V foram obtidas multiplicando os valores referentes primeira


observao das variveis d1, d2 e d3, segunda observao, e assim sucessivamente at se produzir
uma amostra de dimenso 500.

Frequncia relativa

ESTATSTICA

2. Edio

Estatstica amostral

15%

10%

5%

0%
10

15

20

25

30

Dashfer
Verlag
McGraw-Hill

35

40

45

50

CAPTULO 8

Na tabela seguinte apresentam-se algumas medidas amostrais obtidas a partir da amostra de V.


V

Estatstica amostral

ESTATSTICA

2. Edio

Dimenso da amostra

500

Mdia

27.545

Desvio padro

7.924

Coeficiente de kurtose

0.917

Coeficiente de assimetria

4.633

Tal como se suspeitava, o histograma permite observar uma moderada assimetria direita,
que confirmada pelo valor positivo do coeficiente de assimetria amostral.
Para estimar P(V > 35 000) a partir da amostra de dimenso 500 da varivel V, ordena-se o
vector de valores de V (por exemplo, por ordem decrescente) e verifica-se qual a proporo de
observaes com valor superior a 35 000. Na tabela seguinte pode verificar-se que a partir da
octogsima primeira observao os valores de V so inferiores a 35 000.
Observao n.

74
75
76
77
78
79
80
81
82
83

35.431
35.205
35.181
35.173
35.045
35.014
35.003
34.991
34.950
34.873

> 35 000
< 35 000

Assim,

80
= 0.160.
P (V > 35 000 )
500

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.5
Alnea (iii)
Apoio 1 (apenas o resultado)
V 28 . 32 . 103.
V 10 . 21 . 103.
P(V > 35 000) = 23.0%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.5
Alnea (iii)
Apoio 2 (sugesto)
Note que a nova distribuio de V ter uma disperso maior do que a calculada na alnea anterior.
Assim, torna-se ainda mais recomendvel estimar o valor esperado e a varincia de V, bem como
determinar P(V > 35000), atravs de um processo de gerao artificial de amostras.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.5

ESTATSTICA

2. Edio

Alnea (iii)
Apoio 3 (resoluo completa)
Note-se que, agora, o volume dado por V = d 3, em que d uma varivel N(d = 30, d = 5).
Admita-se, em primeiro lugar, que V aproximvel por uma relao linear em d (em torno
de d). Nessas condies viria:
mV 3 E ( d ) = md3 = 27 103
e
2

V
2
Var ( d ) = 3 md2 s 2
Var (V )
d md
= 9 9002 25 = 1.8225 108 ,

ou
s V 1.350 10 4.

Por outro lado, se a hiptese formulada for vlida, ento V tambm seria Normal (V, V).
Ento:

V 27 103 35 27
P(V > 35 103 )= P Z =
>
= P( Z > 0.593) 0.2767.
1.350 104
13.5

No entanto, se anteriormente a aproximao linear era questionvel agora mais o ser (visto
que a nova distribuio de V ter uma disperso maior do que a anterior). Nestas condies, ser
ainda mais recomendvel estimar o valor esperado e a varincia de V, bem como P(V > 35 000),
atravs de um processo de gerao artificial de amostras.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

ESTATSTICA

Frequncia relativa

2. Edio

Seguidamente apresentam-se os resultados obtidos a partir da amostra de dimenso 500 da


varivel V, agora com V = (d1)3.
15%

10%

5%

0%
10

15

20

25

30

V = (d1)

35

40

45

50

55

60

65

70

Na tabela seguinte apresentam-se algumas medidas amostrais obtidas a partir da amostra de


V = (d1)3.

Dashfer
Verlag
McGraw-Hill

Estatstica amostral

V = (d1)3

Dimenso da amostra

500

Mdia

28324

Desvio padro

10207

Coeficiente de kurtose

6.837

Coeficiente de assimetria

5.392

CAPTULO 8

ESTATSTICA

2. Edio

Procedendo de forma idntica da alnea (ii) estima-se P(V > 35 000). Verifica-se que a
partir da observao colocada em centsimo dcimo sexto lugar os valores de V so inferiores
a 35 000 (ver tabela seguinte).
Observao n.

V = (d1)3

109
110
111
112
113
114
115
116
117
118

35.580
35.177
35.159
35.110
35.085
35.053
35.014
34.964
34.943
34.933

> 35 000
< 35 000

Assim,

115
= 0.230,
P (V > 35 000 )
500
valor substancialmente diferente de 0.2767 que havia sido determinado anteriormente.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.6
Apoio 2 (sugesto)
Na Seco 8.6 Gerao de Amostras Recorrendo Tcnica de Monte Carlo veja como se
podem obter amostras aleatrias provenientes de uma distribuio Exponencial Negativa. Gere
uma amostra de dimenso 500 e compare as estatsticas amostrais obtidas a partir desta via
experimental com os valores teoricamente esperados.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Apoio 3 (resoluo completa)


Sejam as variveis X1,, X15 provenientes de uma distribuio Exponencial Negativa EN( = 1/3).
Sejam ainda
2

ESTATSTICA

2. Edio

Problema 8.6

Xbarra2:

X2 =

1
Xi

2 i =1

Xbarra5:

X5 =

1
Xi

5 i =1

Xbarra10:

X10 =

1
Xi

10 i =1

Xbarra15:

X15 =

1
Xi .

15 i =1

10

15

Recorde-se que a funo de distribuio de uma varivel Exponencial Negativa ()


F ( X ) = 1 - e - l x. Seja U uma varivel aleatria pertencente a uma distribuio U(0, 1). Fazendo
U = F(X), resulta que a funo inversa de F(X), F 1(U), X = 2 ln 1 (1 - U ) . Recorrendo a
esta expresso, podem gerar-se observaes de uma qualquer distribuio Exponencial Negativa
a partir de observaes U(0, 1), obtidas, por exemplo, recorrendo funo RAND no Microsoft
Excel.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Apresentam-se de seguida os histogramas das distribuies de amostras de dimenso 500 de


X, X 2 , X 5 , X10 e X15 produzidas seguindo esta metodologia.
15%
Frequncia relativa

Frequncia relativa

10%

10%

5%

5%

0%

0%
3

12

15

Xbarra2

12

15%
Frequncia relativa

15%
Frequncia relativa

ESTATSTICA

2. Edio

15%

10%

10%

5%

5%

0%

0%
0

Dashfer
Verlag
McGraw-Hill

X barra5

X barra10

CAPTULO 8

ESTATSTICA

2. Edio

Frequncia relativa

15%

10%

5%

0%
0

X barra15

Na tabela seguinte apresentam-se algumas medidas amostrais obtidas a partir das amostras
das diferentes variveis.

Estatstica amostral

X2

X5

X10

X15

Dimenso da amostra
Mdia
Varincia

500
3.216
9.968

500
3.144
4.573

500
3.044
1.841

500
3.034
0.878

500
3.043
0.602

Desvio padro

3.157

2.139

1.357

0.937

0.776

Coeficiente de assimetria

16.521

11.318

7.836

5.079

3.315

Coeficiente de kurtose

18.204

8.995

4.096

2.391

0.332

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Para interpretar estes resultados recorda-se que a disperso da mdia amostral inferior
disperso da varivel original, e tanto menor quanto maior for a dimenso da amostra. De facto,
os resultados da tabela anterior verificam a expresso

s X2 =

1 2
s X ,
N

vlida para amostras aleatrias simples. Recorda-se ainda que o valor esperado da mdia amostral,
independentemente da dimenso da amostra, idntico ao da varivel original (ou seja, m X = m X ).
Por outro lado, a distribuio da mdia amostral, obtida a partir de uma amostra aleatria
simples, tende para uma distribuio Normal medida que a dimenso da amostra cresce (Teorema
do Limite Central). No entanto, dado que se est perante uma distribuio original X muito
assimtrica, a mdia amostral (mesmo quando estimada com N = 15) apresenta ainda uma ligeira
assimetria. Como regra prtica, frequente indicar-se que a aproximao Normal adequada
quando N 50 se a distribuio original for muito assimtrica.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.7
Apoio 2 (sugesto)
Comece por gerar duas variveis U1 (0, 1) e U 2 (0, 1), obtidas a partir de duas sries distintas
produzidas recorrendo funo RAND do Microsoft Excel. Recorra s expresses do
Apndice 8.3 do livro para converter directamente pares de observaes U (0, 1) em pares de observaes N (0, 1). Verifique se as variveis transformadas so de facto independentes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Apoio 3 (resoluo completa)


Utilizando a funo RAND no Microsoft Excel geram-se 500 observaes de duas amostras
independentes U1 e U2, ambas pertencentes a uma distribuio U(0, 1). A partir destes valores,
geram-se 500 observaes X1 e X2 de uma distribuio N(0, 1) recorrendo s expresses de
Box-Muller:

X1 = -2 ln U1 cos (2p U 2 )
e

X 2 = -2 ln U1 sen (2p U 2 ) .
Nas figuras seguintes apresentam-se os histogramas de frequncias acumuladas das
observaes de U1, U2, e os histogramas de frequncias relativas das observaes de X1 e X2.
Nos dois ltimos casos, a cada um dos histogramas sobreps-se a funes densidade de
probabilidade da varivel Normal padronizada.
Frequncia acumulada

100%
100%
Frequncia acumulada

ESTATSTICA

2. Edio

Problema 8.7

75%

50%

75%

50%

25%

25%

0%

0%
0.2

Dashfer
Verlag
McGraw-Hill

0.4

0.6

u1

0.8

1.0

0.2

0.4

0.6

u2

0.8

1.0

ESTATSTICA

2. Edio

Frequncia relativa

Frequncia relativa

CAPTULO 8

10%
8%
6%

10%
8%
6%

4%

4%

2%

2%

-3

-2

-1

x1

-3

-2

-1

x2

Na tabela seguinte apresentam-se algumas medidas amostrais das variveis X1 e X2.


Estatstica amostral

X1

X2

Dimenso da amostra
Mdia

500
0.044

500
0.033

Desvio padro

0.970

0.945

Coeficiente de kurtose

0.459

1.842

Coeficiente de assimetria

1.533

0.637

Na base do mtodo proposto por Box-Muller est o pressuposto de as variveis transformadas


definidas de acordo com as expresses apresentadas anteriormente serem independentes. De facto,
verifica-se que o coeficiente de correlao amostral entre as observaes das variveis X1 e X2
rX1 , X2 = -0.002.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.8
Alnea (i)
Apoio 2 (sugesto)
Comece por especificar a funo de probabilidade e a funo de distribuio da varivel em
causa. Seguidamente, divida o intervalo [0, 1[ em tantos intervalos quantos os valores que a
varivel discreta pode tomar, associando a cada um deles um intervalo com uma amplitude
proporcional probabilidade com que tal valor pode ocorrer. Por fim, recorra tcnica de Monte
Carlo para gerar amostras.

Dashfer
Verlag
McGraw-Hill

CAPTULO 8

Problema 8.8

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Denote-se por Y a varivel de Poisson ( = 4) que corresponde ao nmero de navios que chegam
ao cais por hora. Na tabela seguinte incluem-se os valores da funo de probabilidade e da
funo de distribuio de Y (tais valores foram obtidos recorrendo Tabela 2 do Anexo Tabelas).
Y
0
1
2
3
4
5
6
7
8
t9

P(y)
0.0183
0.0733
0.1465
0.1954
0.1953
0.1563
0.1042
0.0596
0.0297
0.0214

F(y)
0.0183
0.0916
0.2381
0.4335
0.6288
0.7851
0.8893
0.9489
0.9786
1.0000

Divida-se o intervalo [0, 1[ em tantos intervalos quantos os valores que a varivel discreta Y
pode tomar. Associe-se a cada um deles um intervalo com uma amplitude proporcional
probabilidade com que tal valor pode ocorrer. Ou seja, por exemplo, como P(0) = 0.0183, Y tomar
o valor 0 se F(y) < 0.0188, como P(1) = 0.0733, tomar o valor 1 se F(y) 0.0188 e F(y) < 0.0916,
e assim sucessivamente. Sejam un observaes de uma varivel U(0, 1). Estas observaes podem
ser transformadas em nmero de navios, yn, do seguinte modo:

Dashfer
Verlag
McGraw-Hill

yn = 0, se 0.0000 un < 0.0183

(1.83%)

yn = 1, se 0.0183 un < 0.0916

(7.33%)

yn = 2, se 0.0916 un < 0.2381

(14.65%)

ESTATSTICA

2. Edio

CAPTULO 8

yn = 3, se 0.2381 un < 0.4335

(19.54%)

yn = 4, se 0.4335 un < 0.6288

(19.53%)

yn = 5, se 0.6288 un < 0.7851

(15.63%)

yn = 6, se 0.7851 un < 0.8893

(10.42%)

yn = 7, se 0.8893 un < 0.9489

(5.96%)

yn = 8, se 0.9489 un < 0.9786

(2.97%)

yn = 9, se 0.9786 un < 1.0000

(2.14%)

Seja T a varivel que denota o nmero de navios que chegam ao cais num perodo de 3 horas.
Recorrendo srie de nmeros aleatrios equiprovveis independentes da Tabela 7 do Anexo
Tabelas, geraram-se as seguintes trs amostras:

1. amostra
1. hora
2. hora
3. hora
T

u1 = 0.2683
u2 = 0.6621
u3 = 0.2429
T = 11

Dashfer
Verlag
McGraw-Hill

y1 = 3
y2 = 5
y3 = 3

2. amostra

3. amostra

u1 = 0.0993 y1 = 2
u2 = 0.0315 y2 = 1
u3 = 0.7919 y3 = 6
T=9

u1 = 0.4366
y1 = 4
u1 = 0.2821
y2 = 3
u1 = 0.9765
y3 = 8
T = 15

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.8
Alnea (ii)
Apoio 1 (apenas o resultado)
3.89.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.8
Alnea (ii)
Apoio 2 (sugesto)
A partir dos valores registados para o nmero de navios que chegam ao cais num perodo de 3
horas (T1, T2 e T3), calculados para as 3 amostras anteriormente geradas, procure estimar o
nmero de navios que chegam ao cais por hora.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 8

Problema 8.8
Alnea (ii)
Apoio 3 (resoluo completa)
Tomando os resultados da simulao efectuada na alnea (i), o nmero mdio de navios que
chegam ao cais por hora ser:
11 9 15
3 + 3 + 3
y=
= 3.89.
3

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

ESTATSTICA

2. Edio

Captulos

Captulo 9
Problemas
9.1
Apoio 1
(apenas o resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo completa)

n.a. = no aplicvel

Dashfer
Verlag
McGraw-Hill

9.2

9.3
n.a.

9.4

9.5

9.6

9.7

9.8

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.1
Apoio 1 (apenas o resultado)

Pa .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.1
Apoio 2 (sugesto)
A eficincia de um estimador toma em conta no apenas a sua varincia (que mede a disperso
em torno do seu valor esperado) mas tambm o seu enviesamento. A eficincia de um estimador
pode ser medida atravs do erro quadrtico mdio. Veja na seco 9.2.2 a expresso que permite
calcular a eficincia de um estimador. Para comparar os dois estimadores recorra ao conceito de
eficincia relativa.

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

Problema 9.1

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


A eficincia de um estimador (que reflecte a sua preciso potencial) pode ser medida atravs do
erro quadrtico mdio, que para Pa vem dado por

2
Eficincia P = E Pa - p = s P2 + Enviesamento P
Eficincia
a
a
a

) .

Por sua vez, o enviesamento de Pa vem dado por

( )

Enviesamento P = E Pa - p = mP - p .
a

A eficincia relativa do estimador Pa relativamente ao Pb dada pela razo

Eficincia relativa P
Eficincia

/ Pb

E Pa - p
=
E Pb - p

(
(

)
.

)
2

Como hiptese de trabalho admite-se que a populao tem uma dimenso muito maior do
que o conjunto das duas amostras e que X1 e X2 seguem distribuies Binomiais, respectivamente,
B ( N1 , p ) e B ( N 2 , p ) . Recorde-se que os parmetros valor esperado e varincia de uma
distribuio Binomial so dados por m = N p e s 2 = N p q.
Ora, sendo

X + X2
Pa = 1
N1 + N 2

Dashfer
Verlag
McGraw-Hill

X
1 X
e Pb = 1 + 2 ,
2 N1 N 2

CAPTULO 9

vem que

( )

E Pa =

ESTATSTICA

2. Edio

1
1
E ( X1 + X 2 ) =
E ( X1 ) + E ( X 2 )
N1 + N 2
N1 + N 2
1
N1 p + N 2 p = p
N1 + N 2

(ou seja, Pa no enviesado) e


1 E ( X1 ) E ( X 2 ) 1 N1 p N 2 p
+
E Pb =
+
=

N 2 2 N1
N2
2 N1

( )

1
(2 p ) = p
2

( Pb tambm no enviesado).
Calcule-se agora a varincia de Pa e de Pb . No primeiro caso,

( )

Var Pa =

( N1 + N2 )2

Var ( X1 + X 2 ) .

Dado que X1 e X2 so variveis independentes, vem que


Var ( X1 + X 2 ) = Var ( X1 ) + Var ( X 2 ).
Substituindo, resulta:

( )

Var Pa =

Dashfer
Verlag
McGraw-Hill

( N1 + N2 )2
p (1 - p )
N1 + N 2

N1 p (1 - p ) + N 2 p (1 - p )

CAPTULO 9

No segundo caso,
Var ( X1 ) Var ( X 2 ) N1 p (1 - p ) N 2 p (1 - p )
+
=
+
Var Pb =
4 N12
4 N 22
4 N12
4 N 22

ESTATSTICA

2. Edio

( )

1
N + N2
1
.
= p (1 - p )
+
= p (1 - p ) 1

4
4
4
N
N
N1 N 2

1
2
Comparem-se as duas varincias:
N + N2

1
Var Pb - Var Pa = p (1 - p ) 1

4 N1 N 2 N1 + N 2

( )

( )

( N + N )2 - 4 N N
1
2
1
2

= p (1 - p )
4 N1 N 2 ( N1 + N 2 )

N1 - N 2 )
(
.
= p (1 - p )
4 N1 N 2 ( N1 + N 2 )

Assim,

( ) ( )
: Var ( P ) > Var ( P ) P um estimador melhor do que P .

N1 = N 2 : Var Pb = Var Pa Pb e Pa so estimadores idnticos


N1 N 2

Esta concluso faz sentido. De facto, se N1 = N 2 , ento


X + X2
Pa = 1
2 N1

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

e
X + X2
1 N X + N 2 X 2 1 N1
= 2 ( X1 + X 2 ) = 1
= Pa .
Pb = 1 1
2
2 N1
2 N1
N1 N 2

Para ilustrar a situao de N1 N 2 , considere-se, por exemplo, que ( N1 = 1; X1 = 1) e ( N 2 = 99;


X 2 = 0). Neste caso:
p a =

1+ 0
1
=
1 + 99 100

p b =

1
1
(1 + 0 ) = .
2
2

O primeiro estimador faz muito mais sentido, visto que o conjunto de duas amostras
independentes corresponde a uma amostra agregada de dimenso N1 + N2 na qual o nmero de
casos favorveis X1 + X2. Da que se deva estimar p atravs de

X + X2
Pa = 1
.
N1 + N 2

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.2
Apoio 1 (apenas o resultado)
l = 0.0463 avarias/hora.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.2
Apoio 2 (sugesto)
Obtenha a funo de verosimilhana L ( l ) da amostra {t1 , t2 , ..., t8 }. A estimativa de mxima
verosimilhana pode calcular-se a partir de

Dashfer
Verlag
McGraw-Hill

d ln ( L )
dl

= 0.

CAPTULO 9

Problema 9.2

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Denote-se por T a varivel Exponencial Negativa EN(l). A respectiva funo densidade de
probabilidade
f (t ) = l e - l t.
Na tabela seguinte representam-se as oito observaes de T.
t1
t2
t3
t4
t5
t6
t7
t8

24.3
13.5
53.0
17.2
7.6
14.9
8.1
34.3

A probabilidade de ocorrncia de uma amostra idntica quela que foi observada :

L ( l ) = Probabilidade T1 = t1 ,..., T8 = t8 l =
8

n =1

Probabilidade Tn = tn

L ( l ) = l e - l ti = ( l e - l t1 ) ( l e - l t2 ) ( l e - l t8 )
i =1

= l 8 e - l (t1 + t2 ++ t8 ) .

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

ESTATSTICA

2. Edio

Em vez de se recorrer directamente funo de verosimilhana L(), para obter a estimativa


de l maximiza-se a transformada logartmica desta funo:
ln ( L ) = 8 ln l - l (t1 + t2 +  + t8 ) .
Assim,
d ln ( L )
dl

8
- (t1 + t2 +  + t8 ) = 0
l

1
1
=t =
l
8

= 21.61 horas

resultando l = 0.0463 avarias/hora.


Atendendo a que

d 2 ln ( L )
dl 2

=-

8
< 0,
l2

conclui-se que o ponto estacionrio da funo de verosimilhana um mximo e que l = 0.0463


a estimativa mxima verosimilhana do parmetro l da distribuio Exponencial Negativa.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.3
Apoio 2 (sugesto)
Obtenha a funo de verosimilhana L ( p ) da amostra. A estimativa de mxima verosimilhana
d ln ( L )
pode calcular-se a partir de
= 0.
dp

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

Problema 9.3
Apoio 3 (resoluo completa)

ESTATSTICA

2. Edio

A varivel aleatria Y segue uma distribuio B ( N , p ) , cuja funo de probabilidade :


N
N -y
p ( y ) = p y (1 - p ) .
y

A correspondente funo de verosimilhana para p , portanto:

N
N -y
L ( p ) = Probabilidade Y = y p = p y (1 - p ) .
y
Tomando o logaritmo, vem

N
ln ( L ) = ln + y ln ( p ) + ( N - y ) ln (1 - p ) .
y
Por outro lado,
d ln ( L )
dp

y N-y
.
p 1- p

Para se obter um mximo iguala-se esta expresso a 0 e resolve-se em ordem a p, ou seja


y N-y
y
=0 p= .
p 1- p
N

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Pode assim concluir-se que o estimador P de Mxima Verosimilhana para p simplesmente


a proporo de sucessos observada.
Note-se que para garantir que aquele ponto estacionrio da funo de verosimilhana um
mximo, tem que se verificar se
d 2 L ( p)
dp2

<0,
Y =y

tal como se apresenta de seguida


d 2 L ( p)
dp2

Dashfer
Verlag
McGraw-Hill

=-

y
N-y
< 0.
2
p
(1 - p)2

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.4
Apoio 1 (apenas o resultado)
q = max (x1, x2,, x8) = 12.72 minutos.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.4
Apoio 2 (sugesto)
Obtenha a funo de verosimilhana L (q ) da amostra { x1 , x2 , ..., x8 } . Note que se est perante
um caso em que no h qualquer ponto estacionrio na funo de verosimilhana.

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

Problema 9.4

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Denote-se por X a varivel aleatria atrasos de comboios que se admite seguir uma distribuio
Uniforme U (0,q ). A funo densidade de probabilidade de X dada por

1 / q ,
f (x) =
0,

0 x q
x < 0 ou x > q

Na tabela seguinte representam-se as oito observaes de T.


x1
x2
x3
x4
x5
x6
x7
x8

2.23
7.74
1.03
0.08
11.14
12.72
0.42
5.17

A funo de verosimilhana da amostra dada por

) q 1- 0 = q1

L x1 , x2 ,, x8 q =

i =1

vindo

(1 / q )8 ,

L (q ) =
0,

se q max ( xi )
se q < max ( xi )

Note que h restries em q, uma vez que q xi , para todo o i = 1,, 8.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Assim,

q max ( x1 , x2 ,, x8 )

ln ( L ) = -8 ln (q ) .

Derivando esta funo resulta,


d ln ( L )
dq

=-

8
< 0, para todo o q max ( x1 , x2 ,, x8 ) .
q

Este um exemplo em que no h qualquer ponto estacionrio. Ou seja, maximizar L


max ( x ) .
equivalente a minimizar q, satisfazendo a condio de Q
i

Assim, neste caso, a estimativa de Mxima Verosimilhana Q = max (x1, x2,, x8) = 12.72
= max (x , x ,, x ).
minutos e, por sua vez, o respectivo estimador Q
1

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.5
Apoio 1 (apenas o resultado)
a = 2.5.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.5
Apoio 2 (sugesto)
Obtenha a funo de verosimilhana L(a) da amostra { x1 , x2 , ..., x10 }. Note que se est perante
um caso em que no h qualquer ponto estacionrio na funo de verosimilhana.

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

Problema 9.5

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


A funo densidade de probabilidade de X dada por
(x - a )
, se a < x < a + 2

f (x) = 2

contrrio
0, no caso contrrio

As dez observaes de X so apresentadas na tabela seguinte.


x1
x2
x3
x4
x5
x6
x7
x8
x9
x10

3.5
4.3
2.8
4.5
2.9
3.3
3.8
2.9
4.0
3.9

A funo de verosimilhana :

L x1 ,, x10

10 xi - a
1

2 = 210
a = i =1

0,

Dashfer
Verlag
McGraw-Hill

10

(x

- a ) , se min ( xi ) > a e max ( xi ) < a + 2

i =1

no caso contrrio
contrrio

ESTATSTICA

2. Edio

CAPTULO 9

A funo de verosimilhana ser positiva se


min ( xi ) = 2.8 > a a < 2.8
max ( xi ) = 4.5 < a + 2 a > 2.5
Ou seja, a funo de verosimilhana positiva se e quando a ]2.5, 2.8[. O valor de que
maximiza L() ser ento o menor valor contido neste intervalo, pois os factores do produtrio
(todos positivos) tomam os seus valores mximos nesta situao.
Assim, a estimativa de mxima verosimilhana para o parmetro ser
a = max ( xi ) - 2 = 4.5 - 2 = 2.5 , se max ( xi ) - min ( xi ) 2.
Esta condio verifica-se, pois 4.5 2.8 = 1.7 < 2. Se tal no sucedesse, ento no existiria
estimador para a.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.6
Apoio 1 (apenas o resultado)

q = - 1 + N

ln x
n =1

Dashfer
Verlag
McGraw-Hill

n.

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.6
Apoio 2 (sugesto)
Obtenha a funo de verosimilhana L (q ) da amostra { x1 , x2 , ..., xN } . A estimativa de mxima
verosimilhana pode calcular-se a partir de

Dashfer
Verlag
McGraw-Hill

d ln ( L )
dq

= 0.

CAPTULO 9

Problema 9.6

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Como

(q + 1) xq ,

f (X ) =
0,

se 0 < x < 1
no caso contr
rio
contrrio

a funo de mxima verosimilhana vem


(q + 1) N ( x x x )q
N
1
2

L (q ) =
0

com

x1 , x2 , x N ] 0,1 [

Tomando o logaritmo resulta

ln L (q ) = N ln (q + 1) + q ln x1 + + ln x N .
Derivando e igualando a zero, vem
d ln L (q )
pelo que

dq

N
+ ln x1 + + ln x N = 0
q +1

q +1 = -

N
ln x1 + + ln x N

e, finalmente,

q = -1 -

n =1

Dashfer
Verlag
McGraw-Hill

= - 1 + N

ln xn

ln x
n =1

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.7
Apoio 1 (apenas o resultado)

b1 = 55.5; b2 = 58.5; b3 = 55.5

p = 1.5 e 2 p = 3.0.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.7
Apoio 2 (sugesto)
Obtenha a expresso da Soma dos Erros Quadrticos (SEQ). Admitindo que a funo
SEQ ( b1 , b 2 , b 3 , p ) diferencivel, os estimadores ou estimativas do mtodo dos mnimos
quadrados podem ser obtidas resolvendo o sistema de equaes definido por
SEQ
SEQ
= 0 (i = 1, 2 e 3) e
= 0.
b i
p

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

Problema 9.7

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Denote-se por Xj a j-sima observao da varivel X, dada por
( b i - p ) + e ,

X =
( b i + p ) + e ,

se for adoptado o processo convencional


se for adoptado o novo processo

em que o ndice i denota um dos lotes (i = 1, 2, 3), E() = 0 e Var() = 2 (constante para todas
as observaes). A estas condies deve acrescentar-se que os e 's de duas quaisquer observaes
so independentes.
Assim,
SEQ ( b1 , b 2 , b 3 , p ) =

2
j

= (54 - b1 + p ) + (53 - b1 + p ) + (58 - b1 - p ) +


2

+ (57 - b 2 + p ) + (59 - b 2 + p ) + (58 - b 2 - p ) +


2

+ (53 - b 3 + p ) + (57 - b 3 - p ) + (58 - b 3 - p ) .


Admitindo que a funo SEQ ( b1 , b 2 , b 3 , p ) diferencivel, os estimadores ou estimativas
do mtodo dos mnimos quadrados podem ser obtidas resolvendo o sistema de equaes definido por
SEQ
SEQ
= 0 (i = 1, 2 e 3) e
= 0.
b i
p

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

Resulta ento,

ESTATSTICA

2. Edio

SEQ
= ( -2 ) (54 - b1 + p ) + (53 - b1 + p ) + (58 - b1 - p ) = 0
b1

165 - 3 b1 + p = 0

(1)

SEQ
= ( -2 ) (57 - b 2 + p ) + (59 - b 2 + p ) + (58 - b 2 - p ) = 0
b 2

174 - 3 b 2 + p = 0

(2)

SEQ
= ( -2 ) (53 - b 3 + p ) + (57 - b 3 - p ) + (58 - b 3 - p ) = 0
b 3

168 - 3 b 3 - p = 0

(3)

SEQ
= 2 (54 - b1 + p ) + (53 - b1 + p ) - (58 - b1 - p )
p

+ (57 - b 2 + p ) + (59 - b 2 + p ) - (58 - b 2 - p )


+ (53 - b 3 + p ) - (57 - b 3 - p ) - (58 - b 3 - p ) = 0
45 - b1 - b 2 + b 3 + 9 p = 0

Dashfer
Verlag
McGraw-Hill

(4)

CAPTULO 9

Resolvendo as expresses, vem

ESTATSTICA

2. Edio

(1) b1 =

165 + p
3

(2 ) b 2 =

174 + p
3

(3 ) b 3 =

168 - p
3

(4) 45 -

165 + p 174 + p 168 - p


+
+ 9 p = 0
3
3
3

(135 - 165 - 174 + 168) - p - p - p + 27 p = 0


24 p = +36
p = 1.5.
A diferena de rendimento entre os dois processo estimada assim em 2 p = 3.0.
Por sua vez, as estimativas de i so obtidas da forma que se descreve em seguida.
Substituindo em (1) obtm-se

b1 =

165 + 1.5
b1 = 55.5
3

b2 =

174 + 1.5
b 2 = 58.5
3

b3 =

168 - 1.5
b 3 = 55.5
3

Substituindo em (2),

Substituindo em (3),

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Na tabela seguinte comparam-se as observaes Xj e as estimativas dos respectivos valores


esperados.
Lote de matria-prima

Processo Convencional
Processo Novo

Dashfer
Verlag
McGraw-Hill

E1  S 54.00
(54, 53)

E1  S 57.00
(58)

E2  S 57.00
(57, 59)

E 2  S 60.00
(58)

E3  S 54.00
(53)
E3  S 57.00
(57, 58)

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.8
Apoio 1 (apenas o resultado)
y1 = 3.00 ; y 2 = 3.30; y3 = 3.63; y 4 = 4.00; y 5 = 4.40, y n = a n -1 y1.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 9

Problema 9.8
Apoio 2 (sugesto)
Obtenha a expresso da Soma dos Erros Quadrticos (SEQ). Admitindo que a funo
SEQ ( y1 , y2 , ...,y5 ) diferencivel, os estimadores ou estimativas do mtodo dos mnimos
quadrados podem ser obtidos resolvendo o sistema de equaes definido por
SEQ
= 0 (i = 1, ..., 5) .
yi
Uma vez que os valores sucessivos da varivel Y se encontram relacionados, basta obter uma
das estimativas a partir de SEQ.

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

Problema 9.8
Apoio 3 (resoluo completa)
Os valores sucessivos de uma varivel Y, { y1 , y2 ,, yN }, so dados atravs de yn +1 = a yn . Por

ESTATSTICA

2. Edio

outro lado, os valores de yn s so observveis com erro e as observaes { x1 , x2 ,, x N } , so

( )

tais que xn = yn + en, com E (en ) = 0, Var (en ) = s 2 e E ei e j = 0.


Os erros en so sucessivamente

e1 = x1 - y1
e2 = x2 - y2 = x2 - a y1

en = xn - yn = xn - a n -1 y1 .

Ora
SEQ =

2
i

= ( x1 - y1 ) + ( x2 - a y1 ) + ( x3 - a 2 y1 ) + + ( xn - a n -1 y1 ) .
Derivando esta expresso e igualando a zero, vem
dSEQ
= ( -2 ) ( x1 - y1 ) + a ( x2 - a y1 ) + a 2 ( x3 - a 2 y1 ) + + a n -1 ( xn - a n -1 y1 ) = 0
dy1

x1 + a x2 + a 2 x3 + + a n -1 xn - 1 + a 2 + a 4 + + a 2(n -1) y1 = 0

y1 =

x1 + a x2 + + a n -1 xn x1 + a x2 + + a n -1 xn
=
=
1 - a 2n
1 + a 2 + + a 2(n -1)
1-a2

1-a2
( x1 + a x2 + + a n -1 xn ) .
1 - a 2n

Dashfer
Verlag
McGraw-Hill

CAPTULO 9

A partir desta estimativa podem obter-se todas as outras:

y 2 = a y1
y3 = a 2 y1

()

ESTATSTICA

2. Edio

y n = a n -1 y1.
Note-se que a soma de n termos em progresso geomtrica, a, k a, k 2 a, , k n -1 a, dada por:

Sn = a

1 - kn
.
1- k

Como = 1.1 e
x1 = 3.04, x2 = 3.26, x3 = 3.67 , x4 = 4.01 e x5 = 4.33,

resulta,

y1 =

1 - 1.12
(3.04 + 1.1 3.26 + 1.12 3.67 + 1.13 4.01 + 1.14 4.33)
1 - 1.110

1 - 1.21
(3.04 + 3.59 + 4.44 + 5.34 + 6.34 )
1 - 2.594

= 3.00.
A partir de y1 calculam-se os restantes valores:
y 2 = 1.1 3.00 = 3.30
y3 = 1.1 3.30 = 3.63
y 4 = 1.1 3.63 = 4.00
y 5 = 1.1 4.00 = 4.40 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

ESTATSTICA

2. Edio

Captulos

Captulo 10
Problemas
10.1
Apoio 1
(apenas o resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo completa)

Dashfer
Verlag
McGraw-Hill

10.2

10.3

10.4

10.5

10.6

10.7

10.8

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.1
Apoio 1 (apenas o resultado)
[0.817, 0.883].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.1
Apoio 2 (sugesto)
Note-se que a amostra suficientemente grande para que, qualquer que seja a distribuio original
do tempo de reaco (varivel X), a mdia amostral X siga uma distribuio aproximadamente
Normal. Na seco 10.2 veja qual a expresso que define o intervalo de confiana para o valor
esperado, numa situao em que se dispe de uma amostra de grande dimenso.

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.1

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X: tempo de reaco dos condutores de camio, aps o almoo
N = 140
x = 0.85 [segundos]
s = 0.20 [segundos].
A amostra suficientemente grande para que, de acordo com o teorema do limite central,
independentemente da distribuio da varivel original (X), X siga aproximadamente uma
distribuio Normal.
Assim, X
N ( m , s 2 / N ) , onde m e s representam o valor esperado e a varincia da
populao e N a dimenso da amostra. Padronizando, vem:

Z=

X-m
s/ N

N (0, 1)

Uma vez que se admitiu que a amostra grande, resulta

Z=

X-m
S/ N

X-m
s/ N

N (0, 1) ,

em que S representa o estimador desvio padro amostral.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

O intervalo de confiana para o valor esperado X a (1 - a ) 100% vem dado por:

S
S
, X + z (a / 2 )
X - z (a / 2 )
.
N
N

Como z (a 2 = 0.025) = 1.96 (ver Tabela 3), resulta finalmente

0.20
0.20
, 0.85 + 1.96
0.85 - 1.96
[0.817, 0.883] .
140
140

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.2
Apoio 1 (apenas o resultado)
[4472, + [.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.2
Apoio 2 (sugesto)
Uma vez que a amostra de pequena dimenso, considera-se vlida a hiptese de a tenso de
rotura dos cabos do lote (varivel X) seguir, aproximadamente, uma distribuio Normal. Nesta
situao, a mdia amostral padronizada

X-m
S
seguir uma distribuio t de Student. Na seco 10.2 veja qual a expresso que define o intervalo
de confiana para o valor esperado quando a amostra de pequena dimenso.

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.2

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X: tenso de rotura de um cabo SCB-33R (pertencente ao lote)
N = 10
x = 4537 [kg / cm2]
s = 112 [kg / cm2].
Admite-se que a varivel X segue uma distribuio N ( m , s 2 ) . Nestas condies,

Z=

X-m
s/ N

N (0, 1) .

Uma vez que, por um lado, o desvio padro desconhecido e que, por outro, a amostra de
pequena dimenso, no se considera vlida a aproximao S s . Assim, resulta que a varivel

X-m
S/ N

(em que S representa o estimador desvio padro amostral)

segue uma distribuio tN1.


O intervalo de confiana, aberto direita, para o valor esperado, X, a (1 - a ) 100% , assim,
dado por

S
, + .
X - t N -1 (a )
N

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Como t9 (0.05) = 1.833 (ver Tabela 5), resulta

112
, + [ 4472, + [ .
4537 - 1.833
10

Note-se que, para o nvel de confiana de 95%, o limite esquerdo deste intervalo corresponde
ao menor valor possvel para o valor esperado da tenso de rotura. Ou seja, este intervalo de
confiana pode igualmente escrever-se da seguinte forma:

m X 4472 kg/cm 2 , com 95% de confiana.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.3
Apoio 1 (apenas o resultado)
Intervalo de confiana a 90%: [0.059, 0.156]
Intervalo de confiana a 95%: [0.055, 0.174]
Intervalo de confiana a 99%: [0.047, 0.218].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.3
Apoio 2 (sugesto)
Na seco 10.2 veja qual a expresso que define o intervalo de confiana para a varincia de
uma populao Normal. Note que o intervalo de confiana no centrado em s2, pelo facto de a
distribuio do 2 (utilizada na definio daquele intervalo) no ser simtrica.

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.3

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam
X: tempo necessrio para a realizao da operao de montagem
N = 25
s2 = 0.32 = 0.09 [horas2].
Admite-se que X segue aproximadamente uma distribuio N ( m , s 2 ) . Nestas condies,
a varivel

S2

( N - 1) s 2
segue uma distribuio c N2 -1 .
O intervalo de confiana para a varincia de uma populao Normal, s X2 , a (1 - a ) 100%
dado por
( N - 1) S 2
( N - 1) S 2
,
.
2
2
c N -1 (a / 2 ) c N -1 (1 - a / 2 )
Na tabela seguinte representam-se os valores de c N2 -1 (a / 2 ) e de c N2 -1 (1 - a / 2 ) , obtidos a
partir da Tabela 4 para intervalos de confiana de 90, 95 e 99%.

Dashfer
Verlag
McGraw-Hill

1 

2
1  D / 2
F 24

2
D / 2
F 24

90%

13.85

36.4

95%

12.40

39.4

99%

9.89

45.6

ESTATSTICA

2. Edio

CAPTULO 10

Os intervalos pedidos so ento:

24 0.09 24 0.09
36.4 , 13.85 [0.059, 0.156] , a 90% de confiana;

24 0.09 24 0.09
39.4 , 12.40 [0.055, 0.174] , a 95% de confiana;

24 0.09 24 0.09
[0.047, 0.218] , a 99% de confiana.
45.6 ,
9.89

Note-se que os intervalos no so centrados em s 2 = s 2 = 0.09 pelo facto de a distribuio


do Qui-Quadrado no ser simtrica.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.4
Apoio 1 (apenas o resultado)
[0.203, 0.297].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.4
Apoio 2 (sugesto)
perfeitamente razovel admitir que a varivel Y, que representa o nmero de operrios que
conhece suficientemente bem as normas de segurana, segue uma distribuio Hipergeomtrica.
Na seco 6.4.3 reveja a relao entre as distribuies Binomial e Hipergeomtrica. Analise
ainda em que condies a distribuio Binomial pode ser aproximada por uma Normal. Na seco
10.2 veja qual a expresso que define o intervalo de confiana da proporo Binomial (amostra
de grande dimenso).

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.4

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
Y: nmero de operrios que, de entre 300 seleccionados aleatoriamente
uma semana aps a emisso das normas, as conhece suficientemente bem
p: proporo de operrios que, de entre 4000 da empresa industrial, conhece
suficientemente bem as normas de segurana
M: nmero de operrios da empresa industrial = 4000
N = 300.

razovel admitir que Y segue uma distribuio H M p, M (1 - p ) , N . Substituindo os


valores de M e de N, vem
Y

H 4000 p, 4000 (1 - p ) , 300 , com

mY = N p = 300 p

s Y2 = N p (1 - p )

M-N
4000 - 300
= 300 p (1 - p )
= 277.6 p (1 - p ) .
M -1
4000 - 1

Uma vez que M 10 N , esta distribuio Hipergeomtrica pode ser aproximada por uma
distribuio Binomial. Por sua vez, dado que N 20 e partindo do pressuposto que p
suficientemente elevado para que N p > 7, a distribuio Binomial pode ser aproximada por
uma distribuio Normal.
Assim, Y segue aproximadamente a distribuio Normal N m = 300 p,s 2 = 277.6 p (1 - p ) .
Tome-se agora a varivel proporo Binomial, Y / N. Denotando P como o estimador de p resulta

Y
Y
.
P = =
N 300

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Nestas condies, P =

Y
segue aproximadamente a distribuio Normal
300
277.6

N m = p, s 2 =
p (1 - p ) .
2
300

ESTATSTICA

2. Edio

Padronizando a varivel Normal P = Y 300, vem

Z=

Y
-p
300
277.6
p (1 - p )
3002

N (0, 1) .

A expresso do intervalo de confiana para a proporo binomial, p, a (1 a).100% ento


Y
277.6
- z (a / 2 )
p (1 - p ) ,

3002
300

Y
277.6
+ z (a / 2 )
p (1 - p ) .
2
300
300

Uma vez que a proporo p desconhecida, o seu valor nesta expresso ter de ser substitudo
pelo da sua estimativa,

p =

y
75
=
= 0.25 .
N 300

Assim, a estimativa do desvio padro de p resulta

s p =

277.6
p (1 - p ) =
3002

277.6
0.25 0.75 = 0.0240 .
3002

Finalmente, como z (a 2 = 0.025) = 1.96, o intervalo de confiana para a proporo binomial,


p, a 95%
[0.25 - 1.96 0.0240, 0.25 + 1.96 0.0240] [0.203, 0.297].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.5
Apoio 1 (apenas o resultado)
Admitindo que as varincias so iguais:
Intervalo de confiana a 90%: [4.64, 8.76]
Intervalo de confiana a 95%: [4.22, 9.18].
Admitindo que as varincias so diferentes:
Intervalo de confiana a 90%: [4.51, 8.89]
Intervalo de confiana a 95%: [4.05, 9.35].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.5
Apoio 2 (sugesto)
Perante a (pequena) dimenso das amostras, admita que o comportamento das variveis saldos
das contas ordem, quer na agncia A quer na B, no se afastam substancialmente de distribuies Normais. Procure caracterizar a varivel X A - X B . Considere os casos das varincias
das duas populaes serem ou no iguais. Recorrendo a um intervalo de confiana para a razo
das varincias de populaes Normais, verifique se a primeira hiptese plausvel. Na seco
10.2 veja quais as expresses que definem os intervalos de confiana para a diferena entre os
valores esperados de duas populaes. Compare e analise os resultados que obtiver.

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.5
Apoio 3 (resoluo completa)
Sejam,

ESTATSTICA

2. Edio

XA : saldo de uma conta ordem da agncia A [em euros]


XB : saldo de uma conta ordem da agncia B [em euros]
NA = 17

x A = 48.2 euros

s A = 2.74 euros

NB = 13

x B = 41.5 euros

sB = 3.91 euros.

Admite-se que XA e XB seguem distribuies Normais independentes, com varincias no


necessariamente iguais. Nestas condies, a diferena X A - X B ainda uma varivel aleatria
Normal e assim:
X A - XB

s A2 s B2
N m A - mB ,
+
,
N A N B

ou ainda

Z=

( X A - X B ) - ( m A - mB )
s A2 s B2
+
N A NB

N (0, 1) .

Uma vez que, por um lado, os desvios padres (s A e s B ) so desconhecidos e, por outro,
no so vlidas as aproximaes S A s A e SB s B (dado que ambas as amostras so de pequena
dimenso), resulta que

( X A - X B ) - ( m A - mB )
S A2
S2
+ B
N A NB

Dashfer
Verlag
McGraw-Hill

tGL .

CAPTULO 10

Admita-se, em primeiro lugar, que as varincias so iguais (ou seja que s A2 = s B2 = s 2).
Note-se que esta conjectura pode ser verificada construindo um intervalo de confiana (a 95%,
por exemplo) para a razo das varincias s A2 s B2 . Tal intervalo dado por

ESTATSTICA

2. Edio

S2
1
A2

FN A -1 ,N B -1 (0.025) S B

1
FN A -1 ,N B -1 (0.975)

S A2
.
S B2

Ora,

F16, 12 (0.025) = 3.15


e
F16, 12 (0.975) =

1
1
=
.
F12, 16 (0.025) 2.89

Substituindo, o intervalo de confiana para s A2 s B2 a 95% ento:

2.742
1 2.742
3.15 3.912 , 2.89 3.912 [0.1559, 1.4192] .

Como o valor s A2 s B2 = 1 est contido no intervalo, plausvel admitir que as varincias so


iguais (embora, com base apenas neste resultado, isso no se possa afirmar com segurana).
Admitindo que as varincias so iguais, ento a estimativa da varincia comum, s 2, dada
pela expresso:

s 2 = s 2 =

Dashfer
Verlag
McGraw-Hill

( N A - 1) s2A + ( N B - 1) sB2
N A + NB - 2

16 2.742 + 12 3.912
= 3.292
17 + 13 - 2

CAPTULO 10

Neste caso, como a diferena X A - X B segue uma distribuio Normal, a varivel

( X A - X B ) - ( m A - mB )

ESTATSTICA

2. Edio

1
1
+
N A NB

segue uma distribuio t de student com GL (que denota o nmero de graus de liberdade) igual
a 28 (o mesmo nmero de graus de liberdade com que foi estimado S).
Nestas condies, os intervalos de confiana para m A - m B vm:

1
1
+
,
a 90%: X A - X B - t28 (0.05) S
N A NB

( X A - X B ) + t28 (0.05) S

1
1
+

N A N B

[6.7 - 1.701 1.212, 6.7 + 1.701 1.212] [ 4.64, 8.76] ;

1
1
1
1
+
, X A - X B + t28 (0.025) S
+
a 95%: X A - X B - t28 (0.025) S

N A NB
N A N B

[6.7 - 2.048 1.212, 6.7 + 2.048 1.212] [ 4.22, 9.18] .

Admitindo agora que as varincias so diferentes, o valor de GL calculado de acordo com


a expresso:

GL =

S A2
SB2
+
N
N B
A

S A2

/ NA )

NA - 1

S B2

/ NB )

2.617
= 20.5 20
0.0122 + 0.1152

NB - 1

(note-se que recomendado a adopo do inteiro imediatamente inferior, j que este procedimento
conduz definio de um intervalo com uma confiana maior do que a especificada inicialmente).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Intervalos de confiana para m A - m B:

S A2
S2
+ B ,
a 90%: X A - X B - t20 (0.05)
N A NB

( X A - X B ) + t20 (0.05)

S A2
S2
+ B
N A N B

[6.7 - 1.725 1.272, 6.7 + 1.725 1.272] [ 4.51, 8.89] ;

S A2
S2
+ B ,
a 95%: X A - X B - t20 (0.025)
N A NB

( X A - X B ) + t20 (0.025)

S A2
S2
+ B
N A N B

[6.7 - 2.086 1.272, 6.7 + 2.086 1.272] [ 4.05, 9.35] .


Note-se que, quer para 90% quer para 95% de confiana, estes intervalos tm uma amplitude
superior dos que foram calculados no pressuposto de que as varincias eram iguais. Este facto
resulta de, agora, se recorrer aos valores das caudas da distribuio t de student com 20 graus de
liberdade, em vez da distribuio com GL = 28 que se tinha utilizado no primeiro caso.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.6
Apoio 1 (apenas o resultado)
[0.006, 0.194].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.6
Apoio 2 (sugesto)
de admitir que o nmero de quadros superiores e o nmero de gestores que leram a ltima
edio do semanrio seguem distribuies Binomiais. Para definir o intervalo de confiana
pretendido procure caracterizar o estimador PG - PQ de pG - pQ . Como as amostras possuem
grandes dimenses, pode admitir que este estimador segue uma distribuio Normal.

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.6

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
YQ: nmero de quadros superiores que, de entre os 350 quadros
entrevistados, leram a ltima edio do semanrio
YG: nmero de gestores que, de entre os 325 gestores entrevistados,
leram a ltima edio do semanrio
PQ: proporo de quadros que leram a ltima
edio do semanrio
PG: proporo de gestores que leram a ltima
edio do semanrio

YQ

B NQ = 350 , pQ

YG

B ( NG = 325 , pG ) .

Dado que NQ e NG 20 e partindo do pressuposto que pQ e pG so suficientemente elevados


para que NQ pQ > 7 e NG pG > 7, ambas as distribuies Binomiais podem ser aproximadas
por distribuies Normais. Os parmetros destas distribuies so:

( )
Var (Y ) = N

E YQ = NQ pQ
Q

pQ 1 - pQ

E (YG ) = NG pG
Var (YG ) = NG pG (1 - pG ) .

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Assim, YQ e YG seguem aproximadamente distribuies Normais, respectivamente

N m = 350 pQ , s 2 = 350 pQ 1 - pQ

N m = 325 pG , s 2 = 325 pG (1 - pG ) .

Y
Y
PG = G = G
NG 325

ESTATSTICA

2. Edio

Por sua vez,

YQ
YQ
=
PQ =
NQ 350

so estimadores, respectivamente, de PQ e de PG. Estes estimadores seguem (aproximadamente)


as distribuies Normais

pQ 1 - pQ
N m = pQ , s 2 =
350

pG (1 - pG )
N m = pG , s 2 =
.
325

Admitindo que as amostras so independentes, a varivel aleatria PG - PQ segue tambm


(aproximadamente) a distribuio Normal

pG (1 - pG ) pQ 1 - pQ
N m = pG - pQ , s 2 =
+
325
350

Padronizando resulta:

Z=

PG - PQ - pG - pQ
pG (1 - pG )
325

Dashfer
Verlag
McGraw-Hill

pQ 1 - pQ
350

N (0, 1) .

ESTATSTICA

2. Edio

CAPTULO 10

O intervalo de confiana para a diferena de propores binomiais, PQ PG, a 99% ento:

YQ
YG
z (0.005)
N G NQ

pG (1 - pG )
325

pQ 1 - pQ
350

).

Ora,
YG
130
= p G =
= 0.4
NG
325

YQ
NQ

= p Q =

105
= 0.3.
350

Substituindo estes valores na expresso do intervalo de confiana e atendendo a que


Z (0.005) = 2.575, obtm-se:
0.1 2.575 0.0366 0.1 0.094 [0.006 , 0.194] .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.7
Apoio 1 (apenas o resultado)
No mnimo 37 ensaios.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.7
Apoio 2 (sugesto)
Especifique um intervalo de confiana a 99% para o valor esperado. Note que ele centrado na
mdia amostral. A partir do intervalo procure expressar a sua amplitude em funo da dimenso
da amostra.

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.7

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam
X: tenso de rotura do material utilizado nos tubos de ensaio
N: dimenso da amostra a partir da qual ser estimado m X
X : mdia amostral das observaes de X
X = 70 [psi].
Admite-se que a dimenso da amostra (que se ir determinar) suficientemente grande para
que, de acordo com o teorema do limite central e independentemente da distribuio da varivel
original X, a mdia amostral, X , siga aproximadamente uma distribuio Normal.
Nestas condies, e uma vez que a varincia conhecida, verifica-se que

Z=

X-m

N (0, 1) .

sX / N

O intervalo de confiana para o valor esperado X a (1 - a ) 100% dado por:

sX
s .
, X + z (a / 2 ) X
X - z (a / 2 )
N
N

A amplitude deste intervalo 2 z (a / 2 )

Dashfer
Verlag
McGraw-Hill

sX
N

ESTATSTICA

2. Edio

CAPTULO 10

Ora, como Z (a = 0.005) = 2.575 (ver Tabela 3) resulta:

2 2.575

70
N

60

2 2.575 70
N
= 36.1

60

Ou seja
N 37.
De facto, a dimenso mnima da amostra, N = 37, suficientemente grande para se poder
admitir a Normalidade de X (embora de forma aproximada).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.8
Apoio 1 (apenas o resultado)
No mnimo 349 alunos.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 10

Problema 10.8
Apoio 2 (sugesto)
Note que o nmero Y de alunos que, de entre os N inquiridos, favorecem o horrio de sbado de
manh, segue seguramente uma distribuio Hipergeomtrica. Na seco 6.4.3 reveja a relao
entre as distribuies Binomial e Hipergeomtrica. Na seco 10.2, veja qual a expresso que
define o intervalo de confiana para a proporo Binomial (amostra de grande dimenso). Note
que o intervalo de confiana da proporo Binomial centrado. A partir do intervalo, procure
expressar a sua amplitude em funo da dimenso da amostra.

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Problema 10.8

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
Y: nmero de alunos que, de entre os N inquiridos, favorecem
o horrio de sbado de manh
p: proporo de alunos que, de entre os 3800 da Faculdade,
favorecem o horrio de sbado de manh
M: nmero de alunos da Faculdade = 3800
N: dimenso da amostra.

Admite-se que a varivel Y segue uma distribuio Hipergeomtrica H M p, M (1 - p ) , N .


H 3800 p, 3800 (1 - p ) , N com mdia e varincia iguais a:
Substituindo vem, Y

mY = N p e s Y2 = N p (1 - p )

M-N
3800 - N
= N p (1 - p )
.
M -1
3799

Admite-se que a dimenso da amostra, N, pequena quando comparada com o nmero total
de alunos da Faculdade, M, mas suficientemente grande para que a distribuio de Y possa ser
aproximada por uma distribuio Normal.
Nestas condies, possvel aproximar a distribuio de Y pela Normal

3800 - N

.
N m = N p, s 2 = N p (1 - p )
3799

Recorrendo agora proporo amostral, P = Y / N (onde P representa o estimador de p), resulta


que esta varivel seguir (ainda que aproximadamente) a distribuio Normal

p (1 - p ) 3800 - N
N m = p, s 2 =

.
N
3799

Dashfer
Verlag
McGraw-Hill

CAPTULO 10

Padronizando, vem

ESTATSTICA

2. Edio

Z=

Y
-p
N
p (1 - p ) 3800 - N

N
3799

N (0, 1) .

O intervalo de confiana para a proporo binomial, p, a (1 a) 100% ento:


Y
- Z (a / 2 )
N

p (1 - p ) 3800 - N Y

,
+ Z (a / 2 )
3799
N
N

p (1 - p ) 3800 - N

N
3799

A amplitude deste intervalo


2 Z (a / 2 )

p (1 - p ) 3800 - N

.
N
3799

Assim, para = 0.05 vem Z(0.025) = 1.96, donde

2 1.96

p (1 - p ) 3800 - N

0.1.
N
3799

Para resolver esta inequao e determinar N, necessrio dispor de uma estimativa de p, p .


Como, neste caso, isso impossvel, calcula-se N para o valor de p que maximiza a amplitude
do intervalo (ou seja, o valor que maximiza p (1 - p ) ). Assim,

d p (1 - p )
= 1 - 2 p = 0
dp

Dashfer
Verlag
McGraw-Hill

p = 0.5 .

ESTATSTICA

2. Edio

CAPTULO 10

Substituindo,

2 1.96

0.5 (1 - 0.5) 3800 - N


0.25 3800 - N

0.1 0.1 3.92

N
3799
N
3799

3800 - N
0.12

= 0.002603 3800 - N 9.888 N


3799 N 3.922 0.25
N

3800
= 348.9
10.89

Finalmente, a dimenso mnima da amostra que satisfaz os critrios enunciados :


Nmn = 349.
Perante este resultado, a hiptese anteriormente formulada (de que N era grande, mas pequeno
comparada com M) justifica-se plenamente.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

ESTATSTICA

2. Edio

Captulos

Captulo 11
Problemas
11.1

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

Dashfer
Verlag
McGraw-Hill

11.2

11.3

11.4

11.5
(i)

11.5
(ii)

11.6

11.7
(i)

11.7
(ii)

11.8
(i)

11.8
(ii)

11.9
(i)

11.9
(ii)

11.10 11.10
(i)
(ii)

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.1
Apoio 1 (apenas o resultado)
Confirma-se a reivindicao do fabricante (p = 1.83%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.1
Apoio 2 (sugesto)
Est-se perante um teste de localizao relativo ao valor esperado de uma populao. O teste
unilateral direita, concentrando-se por isso a regio de rejeio na cauda direita da distribuio
da estatstica de teste. Uma vez que a amostra no de grande dimenso, admite-se que a
distribuio de X no se afasta substancialmente de uma distribuio Normal e, consequentemente,
que a distribuio da mdia amostral resulta Normal. Atendendo ainda pequena dimenso da
amostra, no se assume como vlida a aproximao S s .

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.1

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X: vida dos pneus MQL utilizados em condies normais
= E(X)
N = 30

x = 43 200
s = 8000.
Enunciam-se seguidamente as hipteses a testar:
H 0 : m = 40 000
H1 : m > 40 000 .

A amostra no tem uma grande dimenso. Contudo, se se considerar que a distribuio de X


no se afasta substancialmente de uma distribuio Normal, recorrendo ao Teorema do Limite
Central pode considerar-se que a mdia amostral, X , segue aproximadamente uma distribuio
Normal. Nestas condies, se H0 for verdadeira, a estatstica de teste
ET =

X - m0
s/ N

segue uma distribuio N (0, 1) .


Note-se que o desvio padro, , desconhecido, sendo estimado atravs do desvio padro
amostral, S. Recorde-se que S representa o estimador desvio padro amostral, cujos valores
particulares so as estimativas s. No entanto, uma vez que a amostra no muito grande, ser

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

prudente no considerar desprezvel o erro de estimao, pelo que a aproximao S s no


ser considerada vlida. Assim, a estatstica de teste a utilizar ser:

ESTATSTICA

2. Edio

ET =

X - m0
,
S
N

que, se H0 for verdadeira, seguir uma distribuio t N -1 .


Assim,
ET =

X - 40 000
S
N

t29 .

Introduzindo na expresso de ET os valores amostrais, resulta:


ET =

43 200 - 40 000
= 2.19 > t29 (a = 0.05) = 1.699.
8000
30

Na figura seguinte ilustra-se este teste.


No Rejeitar H0 Rejeitar H0

t 29 (0.05) = 1.699
ET = 2.19

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

ESTATSTICA

2. Edio

Como o valor de ET superior ao valor crtico (1.699), H0 rejeitada, confirmando-se,


assim, a reivindicao do fabricante.
O valor de prova (p) constitui uma medida do grau com que os dados amostrais contradizem a
hiptese nula. Este valor corresponde probabilidade de a estatstica de teste tomar um valor igual
ou mais extremo do que aquele que, de facto, observado. Assim, p = P ET 2.19 | H 0 1.83%.
Note-se que, recorrendo s tabelas do Livro, s possvel determinar que 1% < p < 2.5%. Aquele
valor foi obtido recorrendo funo TDIST do Microsoft Excel.
Resoluo alternativa
Em alternativa ao procedimento clssico, o teste podia basear-se na definio do intervalo de
confiana (aberto direita) a 95% para o valor esperado:

S
m X - t29 (a = 0.05)
, + com 95% de confiana.
N

Substituindo,

8000
m 43 200 - 1.699
, +
30

m [ 40 718, + [ .
Ou ainda,

40 718, com 95% de confiana.


O intervalo de confiana no inclui o valor 40 000. Pode assim rejeitar-se H0 ao nvel de
significncia de 5%. Mas o intervalo de confiana fornece uma informao adicional: o valor
esperado mnimo da durao dos pneus ser de 40 718 km.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.2
Apoio 1 (apenas o resultado)
H evidncia no sentido de confirmar a hiptese de que m1 > m2 ( p = 2.4%) .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.2
Apoio 2 (sugesto)
Est-se perante um teste de localizao relativo diferena de valores esperados de duas
populaes (amostras independentes e de pequenas dimenses). Para decidir qual a estatstica
de teste a utilizar (admitindo ou no a igualdade das varincias), sugere-se que comece por
efectuar um teste razo de varincias das duas populaes. Recorde que foi assumido que as
variveis seguem distribuies Normais.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.2

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X1: dimetro de um anel produzido na mquina 1 [cm]
X2: dimetro de um anel produzido na mquina 2 [cm]
N1 = 10, x1 = 1.051, s1 = 0.021
N 2 = 15, x2 = 1.036, s2 = 0.015 .
Como pressuposto admite-se que X1 e X2 seguem distribuies Normais.
Sugere-se que o teste diferena entre valores esperados de duas populaes seja precedido
por um outro razo de varincias, uma vez que a estatstica de teste diferena entre valores
esperados no a mesma no caso de as varincias serem iguais ou serem diferentes. Registe-se
que o teste ter a mxima potncia se for possvel admitir que as varincias so iguais. De facto,
neste caso, o nmero de graus de liberdade da distribuio da estatstica de teste (distribuio t)
ser GL = N1 + N 2 - 2 = 23.
Teste razo de varincias entre duas populaes Normais (teste F)
Formulao das hipteses de teste sobre as varincias:

H 0 :s 12 = s 22
H1 :s 12 > s 22.
Note-se que estas hipteses so rigorosamente equivalentes s seguintes:

Dashfer
Verlag
McGraw-Hill

H0 :

s 12
=1
s 22

H1 :

s 12
>1.
s 22

CAPTULO 11

Se H0 for verdadeira a estatstica de teste

ET =

S12 s 12
,
S22 s 22

segue uma distribuio FN1 -1, N2 -1 .

ET =

0.0212
= 1.96 < F9, 14 (a = 0.05) = 2.65.
0.0152

Na figura seguinte ilustra-se este teste.

ESTATSTICA

2. Edio

Substituindo,

No Rejeitar H0 Rejeitar H0

f (x)

ET 1.96

F9, 14 (0.05) 2.65

Como o valor de ET inferior ao valor crtico (2.65), H0 no rejeitada (valor de prova


p = P ET 1.96 | H 0 12.5% ). Assim, admite-se que as varincias das duas populaes so
iguais, ou seja, que
s 12 = s 22 = s 2 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

A varincia comum das populaes X1 e X2, 2, pode ser estimada por


S2 =

( N1 - 1) S12 + ( N2 - 1) S22 .
N1 + N 2 - 2

ESTATSTICA

2. Edio

Substituindo, resulta

s2 =

9 0.0212 + 14 0.0152
= 0.0003095
23

s = 0.0003095 0.0176 .
Teste diferena entre valores esperados de duas populaes
(amostra de pequenas dimenses, populaes Normais)
Formulao das hipteses de teste:
H 0 : m1 = m2

H1 : m1 > m2 .
Admitindo que as varincias so iguais e que H0 verdadeira, a estatstica de teste
ET =

(X

- X2

1
1
+
S
N1 N 2

A estatstica de teste segue uma distribuio tGL (pois as amostras so de pequena dimenso,
no sendo vlida a aproximao S s ) com

GL = N1 + N 2 - 2 = 23 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Substituindo os valores amostrais na expresso de ET, resulta


1.051 - 1.036
1
1
0.0176
+
10 15

= 2.09 > t23 (a = 0.05) = 1.714

Na figura seguinte ilustra-se este teste:


No Rejeitar H0 Rejeitar H0

ESTATSTICA

2. Edio

ET =

f t

t 23 (0.05) 1.714
ET

2.09

Como o valor de ET superior ao valor crtico (1.714), H0 rejeitada (valor de prova


p = P ET 2.09 | H 0 2.4%). Assim, h evidncia estatstica que permite confirmar a hiptese
de que 1 > 2, ou seja, de que, em mdia, os dimetros dos anis produzidos na mquina 1 so
superiores aos dos anis produzidos na mquina 2.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.3
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, no h evidncia de que as fiabilidades dos dois tipos de
termstato sejam diferentes (p = 36.8%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.3
Apoio 2 (sugesto)
A fiabilidade de um termstato refere-se disperso das temperaturas por ele observadas em
relao a um determinado valor esperado. No sentido de confirmar a maior fiabilidade dos
termstatos do fornecedor B dever realizar um teste de razo de varincias das populaes.
Para efectuar este teste ter que admitir que as temperaturas de abertura dos fornos, equipados
com os termstatos proveniente de A ou de B, seguem distribuies Normais (embora a Normalidade no seja referida no enunciado).

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.3

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
A: temperatura observada de abertura de um forno pelos termstatos do fornecedor A
B: temperatura observada de abertura de um forno pelos termstatos do fornecedor B
s A2 : varincia dos termstatos vendidos pelo fornecedor A
s B2 : varincia dos termstatos vendidos pelo fornecedor B
NA = 9
NB = 11.
A mdia e varincias amostrais das variveis A e B so, respectivamente:
x A = 419.67, s 2A = 68.25

x B = 418.54, sB2 = 54.87 .


Embora tal no seja referido no enunciado, admite-se que as temperaturas de aberturas dos
fornos, XA e XB, seguem distribuies Normais.
Teste razo de varincias entre duas populaes Normais (teste F)
Formulao das hipteses do teste:
H 0 :s A2 = s B2

H1 :s A2 > s B2 .
Note-se que estas hipteses so rigorosamente equivalentes s seguintes:

Dashfer
Verlag
McGraw-Hill

H0 :

s A2
=1
s B2

H1 :

s A2
> 1.
s B2

CAPTULO 11

A estatstica deste teste ento

ET =

S A2
,
SB2

que, quando H0 verdadeira, segue a distribuio FN A -1, N B -1 .

ESTATSTICA

2. Edio

Substituindo, vem

ET =

68.25
= 1.24 < F8, 10 (a = 0.05) = 3.07 .
54.87

Na figura seguinte ilustra-se este teste.

No Rejeitar H0 Rejeitar H0

ET 1.24
F8, 10 (0.05) 3.07

Ao nvel de significncia de 5% a hiptese H0 no rejeitada (isto , ao nvel de significncia


de 5%, no h evidncia de que as fiabilidades dos dois tipos de termstato sejam diferentes).
O valor de prova p = P ET 1.24 | H 0 36.8%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.4
Apoio 1 (apenas o resultado)
Os resultados confirmam, ao nvel de significncia de 5%, que a densidade de defeitos diminuiu
(p = 4.2%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.4
Apoio 2 (sugesto)
Admita que a varivel nmero de bolhas em cada placa, Y, segue uma distribuio de Poisson.
Efectue um teste de hipteses unilateral esquerda de localizao ao valor esperado de Y.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.4

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Pressupe-se que o nmero de bolhas, Y, em cada placa de 1.5 3.0 m2 segue uma distribuio de
Poisson. Antes da tentativa de melhorar o processo produtivo, o nmero mdio de bolhas por
placa seria:
l = 0.4 bolhas/m 2 (1.5 3) m 2 = 1.8 bolhas/placa.
Formulam-se de seguida as hipteses do teste unilateral esquerda de localizao a Y :
H 0 : mY = l = 1.8

H1 : mY < l = 1.8 .
Aps as alteraes no processo produtivo, obteve-se

y=

(1 + 0 + 3 + + 1 + 2 + 1) = 18
15

15

= 1.2 bolhas /placa.

Recorde-se que se admitiu que Y seguia uma distribuio de Poisson ( l ) , com parmetros
= (e, portanto, 2 = ). Embora a dimenso da amostra no seja muito grande (N = 15), ser
considerada suficiente para se tomar como vlida a aproximao de Y pela Normal

N m = l, s 2 = .

N
A estatstica do teste ser ento:

ET =

Y -l
l
N

que quando H0 verdadeira segue (aproximadamente) uma N(0, 1).

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Substituindo, vem
1.2 - 1.8
1.8
15

= -1.732 < Z (a = 0.95) = -1.645 .

Na figura seguinte ilustra-se este teste.


Rejeitar H0

ESTATSTICA

2. Edio

ET =

No Rejeitar H0

ET 1.732

Z 0.95 1.645
Como o valor de ET inferior ao valor crtico (1.645), H0 rejeitada ao nvel de significncia de 5%, confirmando-se a diminuio da densidade de defeitos. O valor de prova
p = P ET -1.732 | H0 4.2% (este valor pode ser obtido recorrendo funo NORMDIST
do Microsoft Excel ou Tabela 3 do Anexo Tabelas).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.5
Alnea (i)
Apoio 1 (apenas o resultado)
No se pode concluir que o anncio tenha tido um efeito positivo sobre o nmero de contratos
(p = 7.95%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.5
Alnea (i)
Apoio 2 (sugesto)
Faa um teste diferena de valores esperados do nmero de contratos de aluguer antes do
anncio e depois do anncio. Assuma a hiptese de que as variveis Xi (em que i = A denota os
dias antes anncio e i = D os dias depois do anncio) seguem distribuies Normais com varincias
idnticas. O valor esperado do nmero de contratos depois do anncio tem de ser estimado a
partir do nico valor observado.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.5
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja
Xi: varivel representando o nmero de contratos de aluguer no dia i
(i = 1,
14,15,16,17





)
i= A
(antes
do
(antes do
anncio)
anncio)

i=D
(depoisdo
do
(depois
aanncio)
nncio)

A mdia e varincia amostrais de XA (antes do anncio) so, respectivamente,

x A = 21.71 e s 2A = 4.527 s A = 2.128 .


Admite-se que as variveis Xi (antes e depois do anncio) seguem distribuies Normais
com varincias idnticas.
Efectua-se em seguida o teste diferena de valores esperados de duas populaes (sejam A
e D os valores esperados de Xi antes e depois do anncio). As hipteses em causa so as seguintes:

H0 : mD = m A
H1 : m D > m A .
Como s se considera a primeira observao do nmero de contratos depois do anncio,
a melhor estimativa disponvel de D ser exactamente essa observao ( m D = x15). Por outro
lado, uma vez que se admitiu que Xi eram Normais, ento a varivel X15 - X A tambm o ser.
Assim a estatstica de teste, no caso de H0 ser verdadeira,

ET =

X15 - X A
S A 1 +

1
14

e segue uma distribuio tGL (com GL = NA + ND 2 = 14 + 1 2 = 13).

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Substituindo, resulta
25 - 21.71
1
2.128 1 +
14

= 1.494 < t13 (a = 0.05) = 1.771.

Na Figura seguinte ilustra-se este teste

ESTATSTICA

2. Edio

ET =

No Rejeitar H0 Rejeitar H0

ET 1.494

t13 0.05 1.771

Ao nvel de significncia de 5%, no se pode ento concluir que o anncio tenha tido um
efeito positivo sobre o nmero de contratos. O valor de prova p = 7.95%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.5
Alnea (ii)
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, pode afirmar-se que o anncio teve um efeito positivo sobre o
nmero de contratos (p = 0.73%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.5
Alnea (ii)
Apoio 2 (sugesto)
Continue a assumir a hiptese de que as variveis Xi (antes e depois do anncio) seguem
distribuies Normais com varincias idnticas. No entanto, reestime a varincia comum com
base nos novos dados. O valor esperado do nmero de contratos depois do anncio pode agora
ser estimado com base numa amostra de dimenso 3.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.5
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


A mdia e varincia amostrais da varivel XD (depois do anncio) so, respectivamente:

xD =

1
1
( x15 + x16 + x17 ) = 25.33 e sD2 =
3
2

17

(x

- x D ) = 2.333.

15

Continue a admitir-se que a varincia de Xi no se alterou depois do anncio (a hiptese


s A2 = s B2 poderia agora ser testada, mas, com base nos dados disponveis, claramente no poderia
ser rejeitada). Assim, pode reestimar-se a varincia comum atravs de:

s2 =

(14 - 1) s2A + (3 - 1) sD2


14 + 3 - 2

= 4.234 s = 2.058.

Efectua-se em seguida um teste idntico ao da alnea anterior (teste diferena de valores


esperados de duas populaes Normais):
H0 : mD = m A

H1 : m D > m A .
No caso de H0 ser verdadeira, a estatstica de teste

ET =

XD - XA
S

1 1
+
3 14

segue uma distribuio tGL com GL = 14 + 3 2 = 15.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Substituindo,

ET =

25.33 - 21.71
2.058

1 1
+
3 14

= 2.760 > t15 (a = 0.05) = 1.753

Como o valor de ET superior ao valor crtico (1.753), H0 rejeitada ao nvel de significncia


de 5%, concluindo-se agora que o anncio teve um efeito positivo sobre o nmero de contratos.
O valor de prova p = P ET 2.760 | H 0 0.73%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.6
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5% no possvel provar que a droga provoca, como efeito
secundrio, o aumento do tempo de resposta a estmulos auditivos (p = 6.23%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.6
Apoio 2 (sugesto)
Dado que as amostras no so independentes difcil caracterizar a distribuio da estatstica de
teste (teste diferena do valor esperado de duas populaes). Em alternativa, procure testar a
localizao do valor esperado das diferenas relativas entre as observaes emparelhadas
para cada indivduo. Isto , trabalhe com a varivel
Drn =

que seguir uma distribuio Normal.

Dashfer
Verlag
McGraw-Hill

xCn - xSn
xSn

CAPTULO 11

Problema 11.6

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
XC: tempo de reaco a um sinal sonoro de um indivduo com droga
XS: tempo de reaco a um sinal sonoro de um indivduo sem droga.
As variveis XC e XS no so independentes, mas sim emparelhadas. Nestas condies,
a distribuio da estatstica de teste diferena entre os valores esperados de duas populaes
seria difcil de caracterizar. Em alternativa, toma-se a varivel
Drn =

xCn - xSn
.
xSn

No caso presente, a varivel Drn prefervel diferena absoluta D n = xCn - xSn dado que
existem disparidades substanciais nos tempos de reaco dos indivduos antes de ingerirem a
droga (por exemplo, o indivduo A tem um tempo de reaco inicial de 19 segundos enquanto
que esse valor em C de 34).
Admitindo que Drn segue uma distribuio Normal, possvel definir o teste seguinte:

H 0 : mD = 0
H1 : mD > 0 .
Se H0 for verdadeira, a estatstica de teste

ET =
Segue uma distribuio tN1.

Dashfer
Verlag
McGraw-Hill

D
SD / N

CAPTULO 11

Na tabela seguinte apresentam-se os clculos referentes s diferenas Drn =

XC

XS

A
B
C
D
E
F
G

17
27
39
27
30
21
36

19
22
34
21
27
24
29

ESTATSTICA

2. Edio

Indivduo

%rn =

xCn - xSn
.
xSn

xCn  xSn
xSn

0.1053
0.2273
0.1470
0.2857
0.1111
0.1250
0.2414
'

0.1117

s' 0.1657

Substituindo, vem
ET =

0.1117
= 1.784 < t6 (a = 0.05) = 1.943.
0.1657
7

Nestas condies, H0 no rejeitada ao nvel de significncia de 5%. Assim, no se pode


concluir que a droga provoca, como efeito secundrio, o aumento do tempo de resposta a estmulos
auditivos. O valor de prova p = P ET 1.784 | H 0 6.23%.
Registe-se que recorrendo varivel diferena absoluta, D n = xCn - xSn , o teste equivalente
conduziria rejeio de H0 (com um valor de prova p 4.6%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.7
Alnea (i)
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, no se pode concluir que o mtodo novo menos fivel do que
o mtodo convencional ( p = 18.7%) .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.7
Alnea (i)
Apoio 2 (sugesto)
No contexto do problema, a fiabilidade do mtodo de anlise refere-se sua repetibilidade, ou
seja disperso dos resultados que so obtidos em condies idnticas de trabalho. Se assumir
que as distribuies dos resultados das anlises so Normais, dever realizar um teste razo
das varincias para confirmar a maior fiabilidade do mtodo novo.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.7
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
NC: resultados obtidos nas anlises de rotina com o mtodo convencional
NN: resultados obtidos nas anlises de rotina com o mtodo novo.
Como
N

(x

s2 =
resulta

- x)

i =1

N -1

sC2 =

30.5
= 1.33 sC = 1.15
24 - 1

sN2 =

55.7
= 1.92 sN = 1.39 .
30 - 1

Admite-se que os resultados das anlises (com ambos os mtodos) seguem distribuies
Normais.
No contexto do problema, a fiabilidade do mtodo de anlise refere-se sua repetibilidade,
ou seja, disperso dos resultados que so obtidos em condies idnticas de trabalho. Trata-se
ento da comparao das varincias de duas populaes Normais. As hipteses relativas ao teste
razo das varincias de duas populaes Normais so as seguintes:
H 0 :s N2 = s C2
H1 :s N2 > s C2 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Se H0 for verdadeira,
ET =

SN2
SC2

segue uma distribuio F29, 23 .

ET =

1.92
= 1.44 < F29, 23 (a = 0.05) 1.96
1.33

Na figura seguinte ilustra-se este teste.

ESTATSTICA

2. Edio

Substituindo

No Rejeitar H0 Rejeitar H0

ET

1.44

F29, 23 0.05 1.96

Nestas condies, no possvel rejeitar H0. Ou seja, ao nvel de significncia de 5% no se


pode concluir que o mtodo novo menos fivel do que o mtodo convencional. O valor de
prova p = P ET 1.44 | H 0 18.7%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.7
Alnea (ii)
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, pode afirmar-se que a mdia de 3 observaes obtidas a partir
do novo mtodo mais preciso do que utilizar observaes individuais obtidas a partir do mtodo
convencional ( p = 3.6%) .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.7
Alnea (ii)
Apoio 2 (sugesto)
Procure caracterizar a varivel mdia de 3 observaes obtidas com o novo mtodo. No sentido
de confirmar a maior fiabilidade desta varivel face a um resultado individual produzido com o
mtodo convencional, dever realizar um teste de razo de varincias de duas populaes
Normais.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.7
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Seja Z a mdia de 3 observaes obtidas com o novo mtodo. Nesse caso,
Var ( Z ) = s Z2 =

s N2
.
3

Contemplam-se de seguida hipteses idnticas s testadas na alnea anterior:


s N2
3
2
s
H1 :s C2 > s Z2 = N .
3

H 0 :s C2 = s Z2 =

Se H0 for verdadeira, a estatstica de teste


ET =

segue uma distribuio FNC -1, N N -1 = F23, 29.

SC2
SC2
=
SN2
SZ2
3

Substituindo,
ET =

Dashfer
Verlag
McGraw-Hill

1.33
= 2.08 > F23, 29 (a = 0.05) 1.91.
1.92
3

CAPTULO 11

2. Edio

Na figura seguinte ilustra-se este teste.

ESTATSTICA

No Rejeitar H0 Rejeitar H0

F23, 29 0.05 1.91


ET

2.08

A hiptese nula rejeitada (ao nvel de significncia de 5%). Conclui-se que utilizar a mdia
de 3 observaes obtidas a partir do novo mtodo mais preciso do que recorrer a observaes
individuais obtidas a partir do mtodo convencional. O valor de prova p = 3.16%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.8
Alnea (i)
Apoio 1 (apenas o resultado)
As peas produzidas actualmente so menos resistentes do que o habitual (p = 0.0178%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.8
Alnea (i)
Apoio 2 (sugesto)
Est-se perante um teste de localizao, neste caso ao valor esperado de uma populao cuja
varincia conhecida. O teste unilateral esquerda, concentrando-se por isso a regio de
rejeio na cauda esquerda da distribuio da estatstica de teste. Note que a amostra de pequena
dimenso.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.8
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X: resistncia compresso das peas de um determinado material isolante
produzidas por um molde de injeco
= 5.18 kg/cm2
2
2 = 0.0625 ( kg/cm 2 ) s = 0.25 kg/cm2
N = 12
x = 4.95 kg/cm2.
Embora a amostra seja de pequena dimenso, como X Normal tambm a mdia amostral X
segue uma distribuio Normal. Note-se que a varincia no estimada.
O teste de localizao ao valor esperado contempla as seguintes hipteses:

H 0 : m = 5.18
H1 : m < 5.18 .
A estatstica de teste :

ET =

X-m
,
s
N

que quando H0 verdadeira segue uma distribuio N (0,1).

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Substituindo, resulta
4.95 - 5.18
0.0625
12

= -3.18 < Z (a = 0.95) = -1.645

Na figura seguinte ilustra-se este teste.


Rejeitar H0

ESTATSTICA

2. Edio

ET =

No Rejeitar H0

ET 3.187

Z 0.95

1.645

A hiptese nula rejeitada ao nvel de significncia de 5%. Conclui-se assim que as peas
produzidas actualmente so menos resistentes do que o habitual. O valor de prova p =
= 0.0719%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.8
Alnea (ii)
Apoio 1 (apenas o resultado)
(1 ) = 0.98669.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.8
Alnea (ii)
Apoio 2 (sugesto)
A potncia do teste traduz a probabilidade de rejeitar H0 quando ela falsa, denotando-se tal
probabilidade por 1 . De acordo com o enunciado do problema, esta probabilidade calculada
tomando como verdadeira H1 = 4.90. Considere que a varincia da resistncia compresso das
peas produzidas recentemente idntica das peas produzidas anteriormente.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.8
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
XA: resistncia compresso das peas produzidas anteriormente
A = 5.18
XR: resistncia compresso das peas produzidas recentemente
R = 4.90.
Admita-se o pressuposto de que a varincia no se altera ( 2 = 0.0625).
O erro de tipo II corresponde a no se rejeitar H0 quando a hiptese alternativa, H1, verdadeira.
A probabilidade de nele se incorrer denota-se por . A potncia do teste traduz a probabilidade
de rejeitar H0 quando ela falsa, ou seja, 1 .
O valor crtico (1.645) utilizado na alnea anterior, que separa a zona de rejeio da zona de
no rejeio de H0, foi calculado a partir de uma distribuio Normal padronizada. O valor
crtico correspondente na distribuio de X (que, igualmente, permite definir a regio de rejeio
de H0) dado por (ver figura seguinte):

X - 5.18
= -1.645 X = 5.06 .
0.25
12
Sabendo que H0 falsa e que H1: R = 4.90, a potncia de teste corresponde a:
1 - b = P X R 5.06 | H1 (ver figura seguinte).

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Rejeitar H0

No Rejeitar H0

ESTATSTICA

2. Edio

Distribuio de X A quando
H0 verdadeira
( P = 5.18)

X = 5.06

(1 E )

Distribuio de X R
quando H1 verdadeira
(P = 4.90)

A probabilidade de X R ocorrer na zona de rejeio de H0 (ou seja P X R 5.06 dada por:

X R - 4.90 5.06 - 4.90


P X R 5.06 = P Z =

,
0.25
0.25

12
12

com Z sendo uma varivel Normal N (0, 1) .


Executando os clculos, resulta
P ( Z 2.217) = (1 - b ) = 0.98669 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.9
Alnea (i)
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, pode afirmar-se que as mquinas A e B tm precises diferentes:
a preciso de A inferior preciso de B.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.9
Alnea (i)
Apoio 2 (sugesto)
A preciso de uma mquina traduz a disperso dos resultados observados em torno do seu valor
esperado. No sentido de confirmar se as mquinas diferem na preciso dever realizar um teste
de razo de varincias de duas populaes, admitindo que so Normais.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.9
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
XA: dimetro do veio registado pela mquina A
XB: dimetro do veio registado pela mquina B.
O teste preciso das mquinas equivale a um teste s varincias. Para tal, pressupe-se que
os dimetros dos veios produzidos pelas mquinas A e B seguem distribuies Normais.
Formulao de hipteses de teste razo de varincias (teste F):

H 0 :s A2 = s B2
H1 :s A2 s B2 .

Quando H0 verdadeira, a estatstica de teste


ET =

S A2
segue a distribuio FN A -1,
SB2

N B -1.

Substituindo,

ET =

12.7
= 2.70 > F131,
4.7

119

(a = 0.05 *) = 1.3457

* Nota: apesar de o teste ser bilateral, pode usar-se o valor de = 0.05 (e realizar o teste
direita, se o critrio utilizado na formulao da estatstica de teste for o de fixar, a priori,
que no numerador se coloca o maior dos dois valores, s 2A ou sB2 . De facto, se H0 for verdadeira,
em 50% dos casos constar no numerador s 2A e, nos outros 50%, sB2 .
A hiptese nula da igualdade das varincias rejeitada. Ao nvel de significncia de 5%,
pode concluir-se que as mquinas A e B tm precises diferentes: neste caso, a preciso de A
inferior preciso de B.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.9
Alnea (ii)
Apoio 1 (apenas o resultado)
No h evidncia estatstica de que as propores de veios defeituosos provenientes das mquinas
A e B sejam significativamente diferentes.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.9
Alnea (ii)
Apoio 2 (sugesto)
Dever realizar um teste diferena entre duas propores binomiais (amostras de grandes
dimenses).

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.9
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
pA e pB: propores de veios defeituosos respectivamente nas
populaes A (veios produzidos pela mquina A) e B
(veios produzidos pela mquina B)
NA e NB: dimenses das amostras de A e de B
YA e YB: nmero de veios defeituosos nas amostras de A e de B.
Admite-se que as amostras, de grandes dimenses, so independentes.
O teste diferena entre as propores binomiais contempla as seguintes hipteses:
H 0 : p A = pB

H1 : pA pB .
Note-se que, se H0 for verdadeira, ento pA = pB = p. Combinando as duas propores amostrais
obtm-se a melhor estimativa possvel de p:

p =

YA + YB
15 + 7
=
= 0.0873.
N A + N B 132 + 120

A estimativa do desvio padro de p resulta assim:

s p =

p (1 - p )

Dashfer
Verlag
McGraw-Hill

NA

p (1 - p )
NB

0.0873 0.9127 0.0873 0.9127


= 0.03560.
+
120
132

CAPTULO 11

ESTATSTICA

2. Edio

Por outro lado, como as amostras so de grandes dimenses, se H0 for verdadeira, a estatstica
de teste segue uma distribuio N(0,1) e toma a forma seguinte:

ET =

YA
YB
N - N
A
B
s p

Substituindo, resulta

15
7
ET = 132 120 = 1.553.
0.03560
Adoptando = 5%, vem
ET = 1.553 < Z (a / 2 = 0.025) = 1.96.
Realizando o mesmo teste, mas fazendo a = 10%, resulta
ET = 1.553 < Z (a / 2 = 0.05) = 1.645.
Pode assim concluir-se que, quer ao nvel de significncia de 5% quer mesmo ao de 10%,
H0 no rejeitada (isto , no h evidncia de que as propores de veios defeituosos provenientes
das duas mquinas sejam significativamente diferentes).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.10
Alnea (i)
Apoio 1 (apenas o resultado)
m [194.45, 197.55] com 95% de confiana.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.10
Alnea (i)
Apoio 2 (sugesto)
Admita que a dimenso da amostra suficiente para garantir que a mdia amostral, X , segue,
aproximadamente, uma distribuio Normal, independentemente da distribuio da varivel X,
que representa o peso da castanha de caju contido em cada embalagem.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.10
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X: peso da castanha de caj includo numa embalagem
N = 35
x = 196 g
s 2 = 20.47 = 4.522
Admite-se que a varivel X possui uma distribuio unimodal no muito assimtrica e, assim,
a varivel X obtida a partir de amostras com N = 35 segue aproximadamente uma distribuio
Normal.
O Intervalo de confiana bilateral a 95% para X :
X t34 (a = 0.025)

S
N

Substituindo (com t34(0.025) = 2.034), resulta


196 2.034

4.52
35

196 1.55,
donde
m X [194.45, 197.55] , com 95% de confiana.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.10
Alnea (ii)
Apoio 1 (apenas o resultado)
O departamento de controlo de qualidade tem razo quanto desonestidade do fornecedor.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 11

Problema 11.10
Alnea (ii)
Apoio 2 (sugesto)
Est-se perante um teste ao valor esperado de uma populao. O teste unilateral esquerda,
uma vez que o departamento de controlo de qualidade desconfia que, devido desonestidade do
fornecedor, o peso do contedo das embalagens , em mdia, inferior a 200 gramas (concentrando-se a regio de rejeio na cauda esquerda da distribuio da estatstica de teste). O intervalo
de confiana correspondente dever ser unilateral, aberto esquerda e fechado direita.

Dashfer
Verlag
McGraw-Hill

CAPTULO 11

Problema 11.10
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Formulao das hipteses de teste:
H 0 : m = 200

H1 : m < 200 .
O intervalo de confiana que permite testar estas hipteses dever ser unilateral, aberto
esquerda e fechado direita, com (1 ) = 95%. Assim,

S
m - , X + t34 (a = 0.05)

ou

S
< X + t34 (a = 0.05)
com 95% de confiana.

N
Consultando a Tabela 5 pode verificar-se que t34(0.05) = 1.691. Substituindo resulta
196 + 1.691

4.52
35

= 197.29 .

Ou seja,

197.29, com 95% de confiana


O valor estipulado em H0 ( = 200) no pertence ao intervalo de confiana, o que permite
(ao nvel de significncia = 5%) rejeitar aquela hiptese. Mais ainda, pode afirmar-se (com
95% de confiana) que o valor esperado do peso da castanha de caj includa nas embalagens
inferior 197.29 gramas. O departamento de controlo de qualidade tinha razo quanto desonestidade do fornecedor.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Captulos

Captulo 12
Problemas
12.1
Apoio 1
(apenas o resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo completa)

Dashfer
Verlag
McGraw-Hill

12.2

12.3

12.4

12.5

12.6

12.7

12.8

12.9

12.10

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.1
Apoio 1 (apenas o resultado)
A embalagem influencia a deciso de compra feita pelas donas-de-casa.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.1
Apoio 2 (sugesto)
Parece razovel admitir que as donas-de-casa, se forem indiferentes s embalagens, devero ter
um comportamento compra de idntico perante todas elas. Efectue o teste Qui-Quadrado de
Qualidade de Ajuste de uma amostra a uma distribuio terica (neste caso, a distribuio
Uniforme discreta).

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.1
Apoio 3 (resoluo completa)
Efectua-se de seguida o teste do Qui-Quadrado de Qualidade de Ajuste de uma amostra a uma
distribuio terica. Este teste baseia-se na comparao da distribuio dos dados amostrais
com a distribuio terica qual se supe pertencer a amostra. No caso de no serem influenciadas
pelas embalagens, as preferncias das donas-decasa devero ter um comportamento idntico de
compra perante todas elas. Por este motivo, a distribuio terica referida dever ser a Uniforme
discreta.
Admitindo que a amostra aleatria e de dimenso suficiente efectua-se o teste do c 2 (notar
que, neste caso, o teste K-S no se deve aplicar, pois os dados so qualitativos e, em particular,
expressos numa escala nominal).
Formulao das hipteses do teste:
H0: As vendas distribuem-se igualmente pelas diferentes embalagens
H1: As vendas distribuem-se diferentemente pelas diferentes embalagens.
A estatstica de teste
K

ET = Q =

k =1

( N k - ek )2
ek

com
ek: frequncia esperada
Nk: frequncia observada na amostra.
2 , em que GL = K - 1 - R (onde K
Quando H0 verdadeira, ET seguir uma distribuio c GL
(
)
representa o nmero de classes e R o nmero de parmetros da distribuio populacional estimados
a partir da amostra). Neste problema K = 5 e no necessrio estimar qualquer parmetro. Isto
, R = 0. Assim,

GL = (5 - 1) - 0 = 4 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

O clculo da ET ser efectuado com auxlio da tabela seguinte:


Freq. esperada H0 ek

Nk  ek 2

Embalagens

Freq. observada Nk

132

123.8

0.54

74

123.8

20.03

ek

120

123.8

0.12

131

123.8

0.42

163

123.8

11.79

619

619

ET

32.9

Note-se que nenhuma frequncia esperada inferior a 5. Pode assim afirmar-se que a amostra
suficientemente grande para se efectuar o teste com segurana, ou seja que a estatstica Q
segue de perto a distribuio c 42 .
Ora (ver figura seguinte), ET = 32.9 > c 42 (a = 0.05) = 9.49.
No Rejeitar H0 Rejeitar H0

F 4 0.05

9.49

Nestas condies, a hiptese H0 rejeitada, ou seja, conclui-se, ao nvel de significncia de


5%, que a embalagem influencia a deciso de compra feita pelas donas-de-casa.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.2
Apoio 1 (apenas o resultado)
plausvel que a distribuio em causa seja a de Poisson (com l = 1.5 ).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.2
Apoio 2 (sugesto)

Comece-se por estimar a taxa mdia de ausncias por voo. Efectue-se o teste QuiQuadrado de
Qualidade de Ajuste de uma amostra a uma distribuio de Poisson com parmetro igual a essa
taxa mdia estimada. Uma vez que a frequncia esperada em algumas classes inferior a
5 (ek < 5), conveniente agregarem-se classes adjacentes de forma a obter novas categorias
que satisfaam a condio ek 5.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.2
Apoio 3 (resoluo completa)
Admite-se o pressuposto de que a amostra aleatria e tem dimenso suficiente para efectuar o
teste do c 2 (notar que o teste K-S no se deve aplicar pois os dados so discretos a aproximao
contnua seria, neste caso, muito grosseira).
Estimativa do parmetro l da distribuio de Poisson:

(21 0 + 36 1 + 23 2 + 13 3 + 4 4 + 2 5 + 1 6) = 1.53.
l = Y =
100
Formulao das hipteses do teste:
H0: a distribuio do nmero de ausncias por voo de Poisson (1.5)
H1: a distribuio do nmero de ausncias por voo no Poisson (1.5).
Seja,
ek: frequncia esperada na classe k
Nk: frequncia observada na amostra na classe k.
A estatstica de teste
K

ET = Q =

k =1

( N k - ek )2
ek

2 .
que, quando H0 verdadeira segue, aproximadamente, uma distribuio c GL

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

O clculo da ET ser efectuado com auxlio da tabela seguinte:


Freq. esperada

Nk  ek 2

N. de ausncias

Freq. Observada Nk

21

22.3

0.076

36

33.5

0.187

23

25.1

0.176

13

12.6

0.013

ek H0 ? = 1.5

5 4 / 5 / 6

4.7

2 7

100

ek

1.4 6.5

0.038

0.4

100.0

ET

6 0.490

Sendo H0 verdadeira, a estatstica Q ter uma distribuio tanto mais prxima da distribuio
c K2 -1- R quanto maior for a dimenso da amostra e maiores forem os nmeros de observaes
esperadas nas diferentes classes ek. A seguinte regra prtica permite utilizar este teste com confiana:
9 dimenso da amostra no inferior a 30 ( N 30 )
9 frequncia esperada em cada classe no inferior a 5 (ek 5) .

Visto que a frequncia esperada em algumas classes (k = 4, 5 e 6) inferior a 5 (ek < 5),
conveniente agregar classes adjacentes, de forma a obter uma nova categoria que satisfaa
aquela condio.
Neste caso, o nmero de graus de liberdade toma o valor 3 dado que o nmero de classes
pde 5 e foi estimado um parmetro da distribuio populacional a partir da amostra:
GL = ( K - 1) - R GL = (5 - 1) - 1 = 3 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Nestas condies,
ET = 0.49 < c 52-1-1 (a = 0.05) = c 32 (a = 0.05) = 7.81 (ver figura seguinte).
No Rejeitar H0 Rejeitar H0

ET

(0.05)

0.49

7.81

A hiptese H0 no rejeitada ao nvel de significncia de 5%, sendo plausvel que a distribuio


em causa seja Poisson (l = 1.5).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.3
Apoio 1 (apenas o resultado)
plausvel a hiptese de que a distribuio dos atrasos pode ser aproximada por uma
Normal.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.3
Apoio 2 (sugesto)
Efectue um teste K-S de Qualidade de Ajuste de uma amostra a uma distribuio Normal. Uma
vez que os parmetros populacionais so estimados a partir dos dados amostrais, dever recorrer
verso H. Lilliefors.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.3
Apoio 3 (resoluo completa)
Seja X a varivel que representa o atraso (desvio entre o tempo planeado para uma determinada
operao de montagem numa linha de produo e o tempo efectivamente gasto, em segundos).
Estimativas do valor esperado e do desvio padro dos atrasos:

x=
s2 =

N -1

= 44.55

(x

- x ) = 71.922

s = 71.92 .

Pressupe-se que a populao dos atrasos contnua (trata-se de uma aproximao admissvel,
uma vez que, apesar de os atrasos se expressarem por nmeros inteiros, a mdia e desvio padro
tm valores elevados) e a amostra aleatria. Efectua-se em seguida o teste K-S de qualidade de
Ajuste (verso Lilliefors, dado que e da distribuio Normal so estimados a partir da
amostra).
Formulao das hipteses do teste:
H0: a distribuio dos atrasos normal (isto , pode ser aproximada
por uma distribuio Normal)
H1: a distribuio dos atrasos no Normal.
A estatstica de teste ento:
ET = D = supremo S ( x ) - F0 ( x ) .

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

O clculo da estatstica D ilustrado na tabela seguinte. Os valores de S ( x ) - F0 ( x )


assinalados com sinal e sinal + foram calculados na vizinhana, respectivamente, esquerda
e direita de cada valor xn. O supremo daquela diferena, D, observa-se na vizinhana esquerda
de xn = 32 (ou seja, para F0 ( xn = 32) - S ( xn = 22) ) e toma o valor D = 0.131 .

Dashfer
Verlag
McGraw-Hill

xn

S xn

F0 xn

S xn  F0 xn

122

0.05

0.010

0.010
0.040+

46

0.10

0.104

0.054
0.004+

39

0.15

0.123

0.023
0.027+

38

0.20

0.126

0.024
0.074+

33

0.25

0.140

0.060
0.110+

22

0.30

0.377

0.127
0.077+

32

0.35

0.431

0.131
0.081+

37

0.40

0.458

0.108
0.058+

41

0.45

0.480

0.080
0.030+

47

0.50

0.514

0.064
0.014+

ESTATSTICA

2. Edio

CAPTULO 12

Dashfer
Verlag
McGraw-Hill

xn

S xn

F0 xn

S xn  F0 xn

50

0.55

0.530

0.030
0.020+

53

0.60

0.547

0.003
0.053+

64

0.65

0.607

0.007
0.043+

91

0.70

0.741

0.091
0.041+

102

0.75

0.788

0.088
0.038+

104

0.80

0.796

0.046
0.004+

109

0.85

0.815

0.015
0.035+

112

0.90

0.826

0.024
0.074+

140

0.95

0.908

0.008
0.042+

165

1.00

0.953

0.003
0.047+

CAPTULO 12

Na figura seguinte representam-se a funo distribuio de X quando H0 verdadeira, F0(x),


e a funo distribuio da amostra, S(x).
1

ESTATSTICA

2. Edio

0.8

S (x)
F0 (x)

0.6

0.4

ET = 0.131

0.2

0
-125

-75

-25

25

75

125

175

atraso [dias]

O valor crtico que a estatstica D toma para = 5% e N = 20 D20 ( = 0.05) = 0.190 (ver
Tabela 9 do Anexo Tabelas).
Como
ET = 0.131 < D20 ( = 0.05) = 0.190,
H0 no rejeitada. Assim, plausvel a hiptese de que a distribuio dos atrasos tenha uma
distribuio aproximadamente Normal, com parmetros = 44.55 e s = 71.92.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.4
Apoio 1 (apenas o resultado)
No se pode concluir que a hiptese assumida no relatrio esteja errada.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.4
Apoio 2 (sugesto)
No sendo provvel que a distribuio do prazo de pagamento se aproxime de uma Normal,
dever recorrer a um teste no-paramtrico de localizao de uma populao, nomeadamente ao
teste do Sinal para a mediana da populao.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.4
Apoio 3 (resoluo completa)
Admite-se que a populao aproximadamente contnua e que a amostra aleatria. Na ausncia
de quaisquer pressupostos relativamente forma da distribuio (apenas se admitiu que originalmente a varivel era contnua, embora tenha sido discretizada pelo facto de a resoluo da unidade
de medida ser de apenas um dia) selecciona-se o teste do sinal para a mediana da populao.
Formulao das hipteses do teste:
Do enunciado, pode deduzir-se que a hiptese nula consiste na mediana da populao ser = 14.
No entanto, uma vez que a varivel originalmente contnua, ser prefervel utilizar = 14.5
em vez de = 14, evitando-se assim eliminar uma observao. Ento,
H 0 : = 14.5
H1 : 14.5.

A estatstica de teste consiste no nmero Y de observaes na amostra superiores a 14.5.


No caso de H0 ser verdadeira a varivel Y ter uma distribuio B (10, 0.5) , cuja funo probabilidade :

10
p ( y ) = 0.5 y 0.510 - y .
y
Ora, no caso em estudo, Y = 7.
Assim,
p (Y 7) = p(7) + p(8) + p(9) + p(10)

= 0.1172 + 0.0439 + 0.0098 + 0.0010 = 0.1719.


O teste bilateral. Nestas condies, o valor de prova, p, 2 17.19% = 34.38% , no
permitindo rejeitar H0 para qualquer valor razovel do nvel de significncia.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

Note-se que, uma vez que a distribuio da estatstica de teste discreta, o valor de prova
tambm discreto. Na figura seguinte ilustra-se o teste, considerando = 5%. De facto,
p (Y 9) = 0.0098 + 0.0010 = 0.0108
ou

ESTATSTICA

2. Edio

p (Y 1) = 0.0098 + 0.0010 = 0.0108 .


Por sua vez,
p (Y 8) = 0.0439 + 0.0098 + 0.0010 = 0.0547
ou
p (Y 2 ) = 0.0439 + 0.0098 + 0.0010 = 0.0547.
Assim a regio crtica (de rejeio de H0) para a = 5% incluir Y = 0 e Y = 1 esquerda e
Y = 9 e Y = 10, direita.

Rejeitar H0

No rejeitar H0

Prob. (Y )
D = 95%)

Dashfer
Verlag
McGraw-Hill

Rejeitar H0

CAPTULO 12

ESTATSTICA

2. Edio

A concluso a de que H0 no pode ser rejeitada ao nvel de significncia de 5%. Portanto,


no correcto afirmar que a hiptese assumida no relatrio esteja errada.
Note-se que, no caso de se aceitar que a mdia amostral da varivel Y j seria aproximadamente
Normal para N = 10, faria sentido realizar o teste paramtrico correspondente teste t que
se descreve em seguida.
Formulao das hipteses do teste:

H 0 : m = 14.5
H1 : m 14.5 .
A estatstica de teste
ET =

X - 14.5
,
S
N

que, no caso de H0 ser verdadeira, seguir uma distribuio t9.


A mdia e o desvio padro amostrais so, respectivamente, x = 22.1 e s = 13.4.
Logo,
ET =

22.1 - 14.5
= 1.79 < t9 (a = 0.025) = 2.262 .
13.4
10

Mesmo admitindo a Normalidade de Y a hiptese H0 no seria rejeitada.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.5
Apoio 1 (apenas o resultado)
A nova frmula permite uma proteco solar mais eficaz.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.5
Apoio 2 (sugesto)
Est-se perante um teste de localizao. Verifique se as amostras so independentes ou
emparelhadas. Se concluir por esta segunda possibilidade, o teste no-paramtrico mais potente
disponvel o de Wilcoxon, que requer que a populao seja contnua e simtrica.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

Problema 12.5

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Trata-se de amostras emparelhadas. O teste no-paramtrico de localizao mais potente o de
Wilcoxon. Seja a diferena relativa entre o grau de queimadura solar com a frmula actual
(FA) e com a frmula nova (FN):
D=

( FA - FN )
FA

Pressupe-se que a varivel contnua e simtrica.


Formulao das hipteses de teste:
H 0 :h D = 0
H1 :h D > 0 (isto , a frmula nova protege mais).

Na tabela seguinte ilustra-se o clculo da estatstica de teste T (T+ ou T-) dada pela soma dos
nmeros de ordem (ordem + ou ordem ):
Colaborador

FA

FN

%

_%_

Ordem +

41

37

0.0975

0.0975

42

39

0.0714

0.0714

3.5

48

31

0.3542

0.3542

38

39

0.0263

0.0263

38

34

0.1053

0.1053

45

47

0.0444

0.0444

21

19

0.0952

0.0952

28

30

0.0714

0.0714

29

25

0.1379

0.1379

14

0.4286

0.4286

10

1
7
2
5
3.5

T

Dashfer
Verlag
McGraw-Hill

Ordem

48.5

T

6.5

ESTATSTICA

2. Edio

CAPTULO 12

A estatstica de teste T (T+ ou T-). Consultando a Tabela 11, verifica-se que, para N = 10,
a probabilidade de T ser maior ou igual a 48.5 (ou de T ser menor ou igual a 6.5) de,
aproximadamente 0.0165 (ou seja, o valor de prova p 0.0165).
Nestas condies, H0 rejeitada ao nvel de significncia de 5%, isto , a nova frmula
permite uma proteco solar mais eficaz.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.6
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, pode afirmar-se que a inspeco do andar modelo contribui
para a sua valorizao pelos potenciais clientes.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.6
Apoio 2 (sugesto)
Efectue um teste de localizao relativa de duas populaes que no exija a Normalidade (registe
que as amostras tm pequenas dimenses), designadamente o teste de Mann-Whitney-Wilcoxon.
Note que o teste unilateral, pois admite-se que o andar modelo s pode favorecer a valorizao
feita pelos clientes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.6
Apoio 3 (resoluo completa)
Pressupe-se que as duas distribuies so contnuas e tm a mesma forma, diferindo apenas na
sua localizao, e as duas amostras so independentes. Efectua-se em seguida o teste de Mann-Whitney-Wilcoxon (M-W-W) de localizao relativa de duas populaes.
Formulao das hipteses do teste:

H0 : d = 0

( representa a diferena na localizao da distribuio da varivel


valorizao com inspeco do andar modelo e sem inspeco)

H1 : d > 0

(o teste unilateral direita, pois admite-se que a visita ao andar


modelo s pode favorecer a valorizao feita pelos clientes).

A estatstica de teste corresponde soma dos nmeros de ordem da amostra de menor


dimenso, ET = W. Quando H0 verdadeira, a estatstica W possui uma distribuio simtrica
centrada em
E (W ) = N B ( N + 1) 2 .
Recorde-se que NB denota a dimenso da amostra de menor dimenso, NA a da amostra maior
e N = NA + NB.
A varincia de W dada por
Var (W ) = N A N B ( N + 1) 12 .
Para NA = 15 e NB = 12, a distribuio de W pode ser aproximada pela distribuio Normal.
Nestas condies, a estatstica de teste
ET =

Dashfer
Verlag
McGraw-Hill

W - N B ( N + 1) 2
N A N B ( N + 1) 12

CAPTULO 12

ESTATSTICA

2. Edio

Na tabela seguinte apresentam-se os clculos da estatstica W (soma dos nmeros de ordem


da amostra menor).
NA = 15

Ordem

NB = 12

Ordem

120
150
155
165

180
195

220
225

235

265
270
275

300
315

345

1
2
3
4

6
7

9
10.5

12

16
17
18

20
21

25

175

215

225

240
255
260

295

320
325
335

355
375

10.5

13
14
15

19

22
23
24

26
27
w = 206.5

Substituindo o valor de w = 206.5 na expresso de estatstica de teste, resulta


ET =

Dashfer
Verlag
McGraw-Hill

206.5 - 168
420

= 1.878 .

ESTATSTICA

2. Edio

CAPTULO 12

Recorde-se que quando H0 verdadeira a estatstica de teste segue uma distribuio N(0,1).
Como ET = 1.878 > Z (a = 0.05) = 1.645, rejeita-se H 0 ao nvel de significncia de 5%,
concluindo-se que a inspeco do andar modelo contribui para a valorizao do andar pelos
potenciais clientes.
Nota: o teste paramtrico correspondente ao teste efectuado o teste t, aplicvel se se pudesse
admitir que as duas populaes eram Normais (ou melhor, que as mdias amostrais o eram).
A estatstica deste teste seria:
ET =

Dashfer
Verlag
McGraw-Hill

X1 - X 2
S12 S22
+
N1 N 2

tGL (se m1 = m2 ).

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.7
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5% pode afirmar-se que o tratamento tem um efeito anticorrosivo.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.7
Apoio 2 (sugesto)
Note que as amostras no so independentes mas sim emparelhadas. Efectue o teste que menos
pressupostos exige relativamente ao tipo e forma das distribuies.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.7
Apoio 3 (resoluo completa)
Admite-se que a populao das diferenas de grau de corroso contnua e as N diferenas
constituem uma amostra aleatria obtida a partir daquela populao.
As amostras no so independentes mas sim emparelhadas. Uma vez que o menos exigente
quanto a pressupostos, selecciona-se o teste do Sinal para a mediana da populao constituda
pelas diferenas positivas e negativas entre os graus de corroso (com e sem tratamento).
Formulao das hipteses do teste:
H 0 : p = 0.5
H1 : p > 0.5

(note-se que, uma vez que o tratamento no pode fazer subir o


grau de corroso das superfcies, o teste a realizar unilateral).

A estatstica de teste, ET, corresponde ao nmero de observaes para as quais o grau de


corroso sem tratamento maior do que o com tratamento (poderia ser ao contrrio o nmero
de observaes para as quais o grau de corroso sem tratamento menor mas esta escolha
estaria em contradio com o sentido estabelecido na hiptese alternativa).
Assim,
ET = 15,
Ora, se H0 for verdadeira, a distribuio de ET ser uma Binomial B(20, 0.5), cuja funo
probabilidade :

20
p ( y ) = 0.5 y 0.520 - y.
y

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

Assim,

ESTATSTICA

2. Edio

P(Y ET = 15) = p (15) + p (16 ) + p (18) + + p (20 ) = 0.0207 < 0.05,


pelo que se rejeita H0 ao nvel de significncia de 5%. A este nvel de significncia, pode ento
afirmar-se que o tratamento tem um efeito anticorrosivo.
Na figura seguinte ilustra-se o resultado obtido, representando-se a regio de rejeio de H0.
Note-se que
P(Y 14) = p (14 ) + p (15) + + p (20 ) = 0.0577 > 0.05.

Prob. (Y )

No Rejeitar H0 Rejeitar H0

ET

15

Nota: o teste paramtrico correspondente ao teste efectuado o teste t ao valor esperado de


uma populao Normal, aplicvel caso se puder admitir que as diferenas

Di = (grau de corroso sem tratamento grau de corroso com tratamento),

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

ou as diferenas relativas

Dri = Di / (grau de corroso sem tratamento),


constituem uma amostra aleatria de uma populao Normal. Neste caso as hipteses do teste
seriam

H 0 : mD = 0
H 0 : mD > 0 ,
e a estatstica de teste
ET =

D
,
S
N

seguiria uma distribuio tN1 sempre que H0 fosse verdadeira. O valores de D e de s seriam
calculados, no primeiro caso, a partir das diferenas Di e, no segundo, a partir das diferenas
relativas, Dri .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.8
Apoio 1 (apenas o resultado)
A um nvel de significncia muito baixo, possvel afirmar no s que a amostra no aleatria
mas, ainda, que nos ltimos 20 anos se verificaram tendncias perodos de persistente aumento
e/ou diminuio na produo de uvas naquela parcela.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.8
Apoio 2 (sugesto)
Dever efectuar um teste de aleatoriedade para se poder concluir se a amostra aleatria ou,
caso contrrio, se existem tendncias nas observaes. Uma vez que os dados esto expressos
numa escala quantitativa, aplique o teste das Sequncias Ascendentes e Descendentes. Verifique
se o teste bilateral ou unilateral e, se for este o caso, determine qual o sentido.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.8
Apoio 3 (resoluo completa)
Trata-se de um teste de aleatoriedade. Uma vez que os dados so quantitativos o teste apropriado
o das Sequncias Ascendentes e Descendentes.
Formulao das hipteses do teste:
H0: A amostra aleatria
H1: A amostra no aleatria, pois existem tendncias nas
observaes amostrais (ou seja, o teste unilateral esquerda).
A estatstica de teste consiste no nmero de sequncias V. Recorde-se que uma sequncia
consiste numa sucesso de observaes ordenadas de forma crescente ou decrescente.
Para o clculo de V substituiu-se pelo smbolo + cada observao precedida por uma outra
de valor inferior e pelo smbolo cada observao precedida por uma outra de valor superior.
Procedendo deste modo resulta:
{, +, +, +, +, , , , +, +, +, , , , +, +, +, , +, +}.
Assim, V = 7.
Recorrendo Tabela 14, para N = 20 verifica-se que a probabilidade de a estatstica V tomar
valores menores ou iguais a 7 de 0.0009. Por outras palavras, o valor de prova p = 0,09%.
A hiptese nula assim rejeitada com grande convico, ficando provado que, ao longo dos
ltimos 20 anos, existiram perodos de persistente aumento ou diminuio na produo de uvas
naquela parcela.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.9
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, fica provada a hiptese de que a frequncia s aulas verificada
em turmas prticas est directamente associada percentagem de sucesso dos alunos nelas
matriculados.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.9
Apoio 2 (sugesto)
Est-se perante uma amostra aleatria constituda por pares de observaes expressas em escalas
quantitativas. Admite-se que esta amostra foi retirada de uma populao contnua bivariada,
sobre a qual no se estabelece nenhum pressuposto sobre a sua forma (por exemplo, no se
exige que seja Normal bivariada). Com base no coeficiente de correlao ordinal de Spearman
Rs, construa um teste unilateral direita para verificar se as variveis esto ou no directamente
associadas (teste de associao relativo Correlao Ordinal de Spearman).

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

Problema 12.9

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X: percentagem relativa frequncia s aulas verificada em
12 turmas prticas de um curso de Estatstica
Y: percentagem de sucesso dos alunos matriculados nas turmas prticas
N = 12.
Formulao das hipteses do teste (unilateral direita):
H0: A frequncia s aulas em turmas prticas no est associada
percentagem de sucesso dos alunos nelas matriculados
H1: A frequncia s aulas em turmas prticas est directamente associada
percentagem de sucesso dos alunos nelas matriculados (isto , alunos
com elevada presena nas aulas prticas tendem a ter maior sucesso
na disciplina).
Estando ordenadas de forma crescente, atribui-se um nmero de ordem s observaes da
varivel X de acordo com a seguinte regra: menor o nmero 1, seguinte o nmero 2 e assim
sucessivamente at N. Procede-se de igual forma para com os valores de Y.
Seja dn (com n = 1, 2,, N) a diferena entre os nmeros de ordem de cada par de
observaes xn e yn. A estatstica de teste baseia-se, justamente, no quadrado daquela diferena,
ou seja, em dn2 .
O coeficiente de correlao ordinal de Spearman, Rs, define-se atravs da expresso:
N

6
Rs = 1 -

N (

n =1
N2

2
n

- 1)

Este coeficiente constitui a estatstica de teste para analisar H0.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Na tabela seguinte apresentam-se os clculos de

d .
2
n

Turma n.

10

11

12

N. de ordem (presena)

12

11

10

5.5

5.5

N. de ordem (sucesso)

12

11

10

1.5

1.5

25

0.25 0.25

dn2

0.25 6.25

2
n

= 39

Substituindo os valores respectivos na expresso da estatstica de teste (ou seja, na expresso


de Rs), vem
Rs = 1 -

6 39
= 0.864 .
12 (122 - 1)

Na Tabela 15 apresentam-se os valores crticos da cauda direita da distribuio do


coeficiente Rs quando H0 verdadeira (ou seja, quando as variveis no esto associadas). Para
N = 12 e = 5%, o valor crtico da estatstica de teste Rs = 0.497.
Nestas condies, a hiptese nula rejeitada ao nvel de significncia de 5% (com um
valor de prova p < 0.5%). Fica assim provada a hiptese de que a frequncia s aulas em
turmas prticas est directamente associada percentagem de sucesso dos alunos nelas
matriculados.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.10
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, pode afirmar-se que a cidade de origem das donas-de-casa afecta
a sua atitude relativamente ao novo detergente (as variveis no so independentes).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 12

Problema 12.10
Apoio 2 (sugesto)
A amostra constituda pelos nmeros de observaes (contagens) nas classes (mutuamente
exclusivas e exaustivas) nas quais as variveis Cidade e Opinio se exprimem. Neste caso,
o teste que permite verificar a independncia das duas variveis o do Qui-Quadrado baseado
na Tabela de Contigncia.

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

ESTATSTICA

2. Edio

Problema 12.10
Apoio 3 (resoluo completa)
Pretende verificar-se se cidade de origem das donas-de-casa e a sua atitude relativamente a um
novo detergente so variveis independentes. Cada uma destas variveis est classificada em
trs categorias mutuamente exclusivas e exaustivas. A amostra constituda pelos nmeros de
observaes (contagens) nestas classes. Nestas condies, o teste que permite verificar a independncia das duas variveis o do Qui-Quadrado baseado na Tabela de Contigncia.
Formulao das hipteses de teste:
H0: A cidade de origem das donas-de-casa no afecta a atitude destas
relativamente ao novo detergente (ou seja, as variveis so independentes).
H1: A cidade de origem das donas-de-casa afecta a atitude destas relativamente
ao novo detergente (ou seja, as variveis no so independentes).
Note-se que na hiptese alternativa nada se diz quanto ao tipo de relacionamento das variveis
em estudo.
A estatstica do teste de independncia do Qui-quadrado
I

ET = Q =

(N

i =1 j =1

- eij

ij

eij

),

2
que quando H0 verdadeira, segue aproximadamente a distribuio c ( I -1)( J -1) .
No caso em estudo o nmero de categorias da varivel Cidade I = 3 e o nmero de
categorias da varivel Opinio J = 3, pelo que o nmero de graus de liberdade da estatstica
de teste ser (3 - 1) (3 - 1) = 4 .
Na tabela seguinte, em cada clula ij apresenta-se entre parntesis curvos o valor da respectiva
frequncia esperada, calculado atravs da expresso

eij =

Dashfer
Verlag
McGraw-Hill

Ni N j
N

CAPTULO 12

com
3

Ni =

ij

frequncia marginal observada na categoria Xi

frequncia marginal observada na categoria Yj

j =1
3

N j =

ij

e a dimenso da amostra
3

N=

ij

= 350.

i =1 j =1

Na mesma tabela, mas entre parnteses rectos, em cada clula apresenta-se tambm o valor de

(N

ij

- eij
eij

Cidade (I)

Atitude (J)

ESTATSTICA

2. Edio

i =1

Total

Favorvel

49 (28.70)
[14.36]

25 (42.27)
[7.06]

34 (37.03)
[0.25]

108

Indiferente

27 (35.34)
[1.97]

68 (52.06)
[4.88]

38 (45.60)
[1.27]

133

Desfavorvel

17 (28.96)
[4.94]

44 (42.67)
[0.04]

48 (37.37)
[3.02]

109

93

137

120

350

Total

Q = 37.79

Dashfer
Verlag
McGraw-Hill

CAPTULO 12

Q = 37.79 > c 42 (a = 0.05) = 9.49.


Na figura seguinte ilustra-se este teste
No Rejeitar H0 Rejeitar H0

ESTATSTICA

2. Edio

Verifica-se assim que

F 42 (0.05) 9.49

Nestas condies H0 rejeitada ao nvel de significncia de 5%. Fica assim demonstrado que
a cidade de origem das donas-de-casa afecta a sua atitude relativamente ao novo detergente
(as variveis no so independentes).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

ESTATSTICA

2. Edio

Captulos

Captulo 13
Problemas
13.1

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

Dashfer
Verlag
McGraw-Hill

13.2

13.3
(i)

13.3
(ii)

13.4
(i)

13.4
(ii)

13.5

13.6
(i)

13.6
(ii)

13.7
(i)

13.7
(ii)

13.8

13.9
(i)

13.9
13.10
(ii)

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.1
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, o laboratrio I tem, em mdia, um comportamento diferente do
dos outros dois. No significativa a diferena entre os laboratrios II e III.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.1
Apoio 2 (sugesto)
Recorra anlise de varincia com um factor (o laboratrio, ou melhor, o respectivo equipamento)
para saber se os trs laboratrios tm um comportamento distinto em relao aos testes que
efectuaram ao contedo de isobutano no gs. Dado que os laboratrios I, II e III constituem a
totalidade da populao em apreo, recorra ao modelo ANOVA de efeitos fixos.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

ESTATSTICA

2. Edio

Problema 13.1
Apoio 3 (resoluo completa)
Pretende verificar-se se os trs laboratrios tm um comportamento distinto no que respeita aos
testes efectuados ao contedo de isobutano no gs.
Para descrever esta situao, adopta-se um modelo com um factor (o laboratrio, ou melhor,
o respectivo equipamento) de efeitos fixos (note-se que o objectivo o de comparar os trs
laboratrios em causa):
Xij = mi + Eij = m + a i + Eij ,
com
Eij

IN (0,s 2 ) ,

onde
i:
j:
m i:
m:
ai:
Eij:
Xij:

ndice que designa o grupo de resultados pertencentes ao mesmo laboratrio (i = 1, 2, 3)


ndice que denota o resultado dentro de cada grupo ( j = 1, 2, ..., J i )
valor esperado do i-simo laboratrio
parmetro global fixo
parmetro que corresponde ao efeito do i-simo laboratrio
erro associado j-sima observao do i-simo laboratrio
j-simo resultado do i-simo laboratrio.
O teste de anlise de varincia pode ser especificado do seguinte modo:
H 0 : m1 = m2 = m3 (ou, equivalentemente, a1 = a 2 = a 3 = 0 )
H1 : Nem todos os mi so iguais (ou, equivalentemente, algum a i 0 ).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

A partir dos dados fornecidos construiu-se a seguinte Tabela ANOVA:


Variaes (V)

GL

DQM

Entre grupos (EG)

3.463

1.731

Dentro grupos (DG)

4.038

22

0.184

Total (T)

7.501

24

2. Edio

Fontes de Variao

em que a variao total (VT) foi calculada recorrendo expresso

VT =

(X

ESTATSTICA

-X

ij

a variao entre grupos (VEG) a


VEG =

J (X
i

-X

ij

- Xi

e, finalmente, a variao dentro de grupos (VDG) a

VDG =

(X
i

No caso de H0 ser verdadeira, a estatstica de teste


ET =

DQMEG
DQMDG

seguir uma distribuio F2, 22 .


Assim,
ET =

pelo que se rejeita H0.

Dashfer
Verlag
McGraw-Hill

1.731
= 9.434 > F2, 22 (a = 0.05) = 3.44 ,
0.184

CAPTULO 13

Na figura seguinte representa-se a distribuio de ET/H0 e a respectiva regio de rejeio.

ESTATSTICA

2. Edio

No Rejeitar H0 Rejeitar H0

F2, 22 (0.05) 3.34


Conclui-se assim (com um valor de prova de aproximadamente p = 0.1%) que os laboratrios
tm comportamentos distintos no que diz respeito aos testes ao contedo de isobutano no gs.
Rejeitada a hiptese nula, interessa saber quais os laboratrios que se diferenciam significativamente entre si. Para responder a esta questo recorre-se ao clculo dos intervalos de confiana
para a diferena entre valores esperados pelo mtodo de Tukey. Este o mtodo apropriado,
j que as amostras so pouco desequilibradas. De facto,

= 10 < 2 ( J i )mnimo
= 2 7 = 14.
( Ji )mximo
mximo
m nimo
Os limites dos intervalos de confiana para mi1 - mi2 (i1 i2 ) a (1 - a ) 100% so dados por

X i1 - X i2 qI ,GL2 (a )

DQMDG
,
J

onde qI , GL2 (a ) pode ser obtido (por interpolao) na Tabela 16.


Para I = 3, GL2 = 22 e = 0.05, vem q3, 22 (0.05) = 3.55.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

O valor de J calculado recorrendo seguinte expresso:

J=

3
= 8.16 .
1 1 1
+ +
10 7 8

ESTATSTICA

2. Edio

Substituindo, resulta
qI ,GL2 (a )

DQMDG
0.184
= 3.55
= 0.533 .
J
8.16

Na tabela seguinte apresenta-se o conjunto dos intervalos a 95% de confiana para mi1 - mi2 ,
tais que X i1 - X i2 0.533.

xi1  xi2

i1

i2

II

27.489 28.284 = 0.795

0.795 0.533 1.328,  0.262 *

III

27.489 28.214 = 0.725

0.725 0.533 1.258,  0.192 *

II

III

28.284 28.214 = 0.070

0.070 0.533 0.603,  0.463

Intervalos de confiana a 95%

Ficam assim estabelecidas diferenas significativas entre os laboratrios I e II, e I e III, no


sendo significativa a diferena entre os laboratrios II e III (o intervalo inclui o valor zero).
Verificar-se- em seguida a condio de homogeneidade dos erros, recorrendo ao teste de
Bartlett. As hipteses de teste so as seguintes:

H 0 :s 12 = s 22 = s 32
H1 : os s i2 no so todos iguais.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

A estatstica de teste :

ET =

1
GL ln (S 2 ) C

GL ln (S )
2
i

C =1+

3 ( I - 1)

GL

1
.
GL

Nesta expresso

ESTATSTICA

2. Edio

com,

GLi : J i - 1

GL :

GL

Si2 :
S2 :

GLi
1

GL

(X

ij

- Xi

GL S
i

2
i

Quando H0 verdadeira a estatstica de teste segue uma distribuio c I2-1 (registe-se que o
teste unilateral direita).
No caso em estudo vem:
GL1 = 9

GL2 = 6

GL3 = 7

Dashfer
Verlag
McGraw-Hill

GL

= GL = 22

ESTATSTICA

2. Edio

CAPTULO 13

s12 =

1
2
2
2
(27.64 - 27.49) + (27.48 - 27.49) + + (28.14 - 27.49) = 0.3072

s22 =

1
2
2
2
(28.40 - 28.28) + (28.24 - 28.28) + + (28.45 - 28.28) = 0.0926

s32 =

1
2
2
2
(28.01 - 28.21) + (27.86 - 28.21) + + (28.43 - 28.21) = 0.1025

s2 =

1
(9 s12 + 6 s22 + 7 s32 ) = 0.1835
22

e
C =1+

1 1 1 1
1
+ + - = 1.0625 .
3 (3 - 1) 9 6 7 22

Substituindo estes valores na expresso da estatstica de teste resulta

ET =

1
22 ln (0.184 ) - 9 ln (0.307) + 6 ln (0.093) + 7 ln (0.102 ) = 3.338.
1.062

Uma vez que


ET = 3.338 <

c 22 (0.05) = 5.991

H0 no rejeitada (o valor de prova p = 18.84%).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.2
Apoio 1 (apenas o resultado)
O valor esperado do ndice de qualidade varia de um processo para outro.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.2
Apoio 2 (sugesto)
Recorra anlise de varincia com um factor (o fabrico) para saber se o ndice de qualidade tem
um comportamento diferente de um fabrico para outro. Dado que parece ser mais til caracterizar
a variabilidade de fabrico para fabrico, em geral, do que as diferenas entre apenas os seis
fabricos analisados, recorra o modelo ANOVA de efeitos variveis.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.2
Apoio 3 (resoluo completa)
Seja

ESTATSTICA

2. Edio

Xij : ndice de qualidade da j-sima amostra retirada do i-simo fabrico


de um determinado processo de fabrico.
Adoptar-se- o modelo com um factor (o fabrico) e de efeitos variveis j que parece ser
mais til caracterizar a variabilidade de fabrico para fabrico, em geral, do que as diferenas
existentes entre (apenas) os seis fabricos analisados. Assim,
Xij = m + Ai + Eij ,
com

Ai

IN (0, s A2 )

Eij

IN (0, s 2 ) .

Admite-se ainda que as variveis Ai e Eij so independentes (ou seja, que Cov Ai , Eij = 0 ).
O teste em causa contempla as seguintes hipteses:
H 0 :s A2 = 0 (ou Ai = 0)
H1 :s A2 > 0 .

A estatstica de teste :

ET =

DQMEG
,
DQMDG

que, quando H0 verdadeira, segue uma distribuio F5, 18 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Tabela ANOVA correspondente :


DQM

1177.71

235.54

765.25

18

42.51

1942.96

23

Variaes (V)

Entre grupos (EG)


Dentro grupos (DG)
Total (T)

Na figura seguinte representa-se a distribuio de ET/H0 e a respectiva regio de rejeio.


No Rejeitar H0 Rejeitar H0

ESTATSTICA

2. Edio

GL

Fontes de Variao

F5, 18 (0.05)

2.77

Calculando a estatstica de teste, resulta

ET =

235.54
= 5.54 > F5, 18 (a = 0.05) = 2.77 .
42.514

Como o valor de ET superior ao valor crtico (2.77), H0 rejeitada (com um valor de prova
p = P ET 5.54 | H 0 0.29%).
Uma vez que H0 rejeitada, faz sentido estimar a varincia dos efeitos s A2 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

O estimador de s A2 dado por

DQMEG - DQMDG
,
h

com

ESTATSTICA

Ji J i2

242 - 6 16 576 - 96
i
i
= 4.
h=
=
=
24 5
120

J i ( I - 1)
i

2. Edio

Assim,

s A2 =

235.54 - 42.51
= 48.2 .
4

A varincia residual 2 estimada pelo DQMDG. Ora, DQMDG (ou, se se preferir,

s = DQMDG ) uma estimativa da variabilidade que ocorre nas observaes pertencentes a


uma dada amostra (ou seja, a um dado fabrico). Neste caso, tal valor :

s 2 = DQMDG = 42.514 s = 6.52 .


Por sua vez, s A (ou s A2 ) mede a variabilidade do valor esperado do ndice de qualidade de
fabrico para fabrico. A estimativa do desvio padro da distribuio de Ai ento
s A = 48.2 = 6.95.
Pode assim concluir-se que os valores esperados dos ndices de qualidade dos vrios fabricos
tm uma variabilidade semelhante que ocorre nas observaes pertencentes ao mesmo fabrico.
De facto o desvio padro residual, s = 6.52 , apenas ligeiramente inferior ao desvio padro
dos efeitos que so provocados pela mudana de fabrico, s A = 6.95.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.3
Alnea (i)
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, pode afirmar-se que o leo Y tem uma longevidade mdia
inferior do W e do X.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.3
Alnea (i)
Apoio 2 (sugesto)
Recorra anlise de varincia com um factor (o tipo de leo) para saber se h diferenas
significativas entre as longevidades mdias. O objectivo parece ser o de comparar apenas os
quatro leos em causa, pelo que dever recorrer ao modelo ANOVA de efeitos fixos. Analise os
resultados construindo os respectivos intervalos simultneos de confiana para os valores esperados das longevidades.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.3

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Pretende saber-se se h diferenas significativas entre as longevidades mdias associadas aos
diferentes leos. Para analisar esta situao adopta-se um modelo ANOVA de um factor (o leo)
e efeitos fixos, j que o objectivo o de comparar apenas os quatro leos em causa.
Assim,
Xij = mi + Eij = m + a i + Eij ,
em que Xij representa o j-simo teste de longevidade do i-simo leo.
Neste modelo, admite-se que os erros Eij so independentes e Normais, com valor esperado 0
e varincia 2.
As hipteses em causa so as seguintes:

H 0 : mW = m X = mY = mZ (ou, equivalentemente, a W = a X = a Y = a Z = 0 )
H1 : nem todos os mi so iguais.
Recorde-se que a estatstica de teste

ET =

DQMEG
DQMDG

segue uma distribuio F3, 12 , quando H0 verdadeira. Adoptando = 5% resulta o valor crtico
F3, 12 (0.05) = 3.49 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Na figura seguinte representa-se a distribuio de ET/H0 e a respectiva regio de rejeio.

ESTATSTICA

2. Edio

No Rejeitar H0 Rejeitar H0

F3, 12 (0.05) 3.49

Todas as amostras tm a mesma dimenso (NW = NX = NY = NZ = 4). Na tabela seguinte


apresentam-se alguns clculos intermdios que, neste caso particular, sero teis para a construo
da tabela ANOVA.
leo

Mdia amostral

Varincia amostral

xi

si2

23.75

10.91

26.00

12.67

17.50

4.33

20.00

6.67

21.81

si 2

8.645

De facto, quando todas as amostras tm a mesma dimenso o clculo de DQMDG e de


DQMEG simplifica-se substancialmente:
I

DQMDG = s 2 = si2 =

Dashfer
Verlag
McGraw-Hill

1
si2 ,
I i =1

CAPTULO 13

vindo
DQMDG = si2 =

10.91 + 12.67 + 4.33 + 6, 67


= 8.645 .
4

s X2
(ou s X2 = N s X2 ). Se H0 for verdadeira, a varincia residual, 2, pode
N
assim ser estimada recorrendo expresso:

ESTATSTICA

2. Edio

Em geral, s X2 =

DQMEG =

s 2

=N

s X2

1 I
Xi - X
= N
I - 1 i =1

No caso em estudo,
(23.75 - 21.81)2 + ... + (20.00 - 21.81)2
= 57.562 .
DQMEG = 4
4 -1

Aps estes clculos, a tabela ANOVA resulta


Variaes (V)

GL

DQM

Entre grupos (EG)

172.69

57.562

Dentro grupos (DG)

103.74

12

8.645

Total (T)

276.43

15

Fontes de variao

Como
57.56
= 6.66 > F3, 12 (a = 0.05) = 3.49 ,
8.64
a hiptese nula dever ser rejeitada. Conclui-se assim (com um valor de prova de aproximadamente p = 0.67%) que h diferenas significativas entre as longevidades mdias associadas aos
diferentes leos.
Rejeitada a hiptese nula, interessa saber quais os valores esperados que so significativamente
diferentes uns dos outros. Para responder a esta questo recorre-se ao mtodo de Tukey (uma
vez que as amostras so equilibradas).
ET =

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Os limites dos intervalo de confianas para mi1 - mi2 (i1 i2 ) a (1 - a ) 100% so dados por

X i1 - X i2 qI ,GL2 (a )

DQMDG
.
J

ESTATSTICA

2. Edio

Fazendo
J=4
DQMDG = 8.64
I=4
GL2 = 12
qI , GL2 (a ) = q4, 12 (0.05) = 4.2 (ver Tabela 16),
resulta:

8.64
= 6.17.
4
No quadro seguinte apresenta-se o conjunto dos intervalos de confiana para mi1 - mi2 , com
X i1 - X i2 6.17.

(x

i1

- xi2 4.20

i1

i2

xi1  xi2

23.75 26.00 = 2.25

23.75 17.50 = 6.25

[0.08; 12.42]*

23.75 20.00 = 3.75

[2.42; 9.92]

26.00 17.50 = 8.50

[2.33; 14.67]*

26.00 20.00 = 6.00

[0.17; 12.17]

17.50 20.00 = 2.50

[8.67; 3.67]

Intervalos de confiana a 95%


[8.42; 3.92]

Para os intervalos assinalados com um asterisco, que no contm o valor zero, h evidncia
de existirem diferenas significativas entre os valores esperados. Ao nvel de significncia de 5%,
pode afirmar-se que o leo Y tem uma longevidade mdia inferior do W e do X.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.3
Alnea (ii)
Apoio 1 (apenas o resultado)
21.8%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.3
Alnea (ii)
Apoio 2 (sugesto)
A probabilidade de uma varivel tomar um valor inferior a uma outra equivalente a considerar-se
a probabilidade de uma nova varivel, que resulta da diferena entre as duas anteriores, ser
inferior a zero. Procure caracterizar o estimador desta nova varivel.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.3

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
O problema pode caracterizar-se da seguinte forma:
P ( XW < X Z ) = ?
Ora,
P ( XW < X Z ) = P ( XW - X Z ) < 0 .

Na alnea anterior admitiu-se que os erros Eij eram independentes e Normais, com valor
esperado 0 e varincia 2. Nessas condies, as variveis XW e XZ, tambm sero normais com
valores esperados W e Z, respectivamente, e varincia 2. Recorde-se que DQMDG ,
precisamente, uma estimativa da varincia 2.
Se XW e XZ, so normais tambm o ser ( XW - X Z ) . Para calcular P ( XW - X Z ) < 0 aquela
varivel dever ser padronizada. Note-se que, neste caso, no se conhecem W e Z , mas sim as
suas estimativas mW = xW e m Z = xZ . Registe-se que a varivel ( XW - X Z ) - XW - X Z ainda
Normal (uma vez que XW e X Z tambm o so). Nestas condies, a varivel padronizada

( XW - X Z ) - ( XW - X Z )
DQMDG + DQMDG + DQMDG NW + DQMDG N Z

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

seguir uma distribuio t com os mesmos graus de liberdade com que DQMDG foi calculado,
ou seja, com GL2 = 12. Assim,

ESTATSTICA

2. Edio

P t12 <

=
DQMDG 1 + 1 + 1 4 + 1 4
0 - XW - X Z

- (23.75 - 20.00 )
= P t12 <
=
4.65

= P (t12 < -0.806 ) = 21.8% .


Note-se que P (t12 < -0.806 ) = P (t12 > 0.806 ) . Na figura seguinte ilustra-se este clculo.

P(t12 > 0.806) = 21.8%

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.4
Alnea (i)
Apoio 1 (apenas o resultado)
O nmero mdio de avarias semanais varia de mquina para mquina.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.4
Alnea (i)
Apoio 2 (sugesto)
Recorra anlise de varincia com um factor (a mquina) para saber se as mquinas que integram
o parque tm um comportamento distinto quanto ao nmero de avarias por semana. Admita a
hiptese de que o nmero de avarias semanais tem uma distribuio que pode ser aproximada por
uma Normal e que as quatro mquinas foram seleccionadas aleatoriamente de entre as que compem
o parque. Ou seja, considere o modelo ANOVA de um factor com efeitos variveis.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.4

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
A partir de quatro mquinas seleccionadas aleatoriamente, pretende caracterizar-se o comportamento de um parque de cem (quanto ao nmero de avarias por semana). Admita a hiptese de
que o nmero de avarias semanais tem uma distribuio que pode ser aproximada por uma
Normal. Nesta situao, o modelo ANOVA ser de um factor (a mquina) mas com efeitos
variveis. Assim,
Xij = Mi + Eij = m + Ai + Eij ,

com

Ai

IN (0, s A2 )

Eij

IN (0, s 2 )

Cov Ai , Eij = 0
Verifique-se a condio de homogeneidade dos erros recorrendo ao teste de Bartlett. As hipteses de teste so as seguintes:
H 0 :s 12 = s 22 = s 32 = s 42
H1 : os valores de s i2 no so todos iguais.

Recorde-se que a estatstica deste teste


ET =

Dashfer
Verlag
McGraw-Hill

1
GL ln (S 2 ) C

GL ln (S )
i

2
i

CAPTULO 13

com,
C =1+

3 ( I - 1)

GL

1
,
GL

em que

ESTATSTICA

2. Edio

GLi : J i - 1

GL :

GL

Si2 :

GLi

(X

ij

- Xi

e
S2 :

GL

GL S
i

2
i .

No quadro seguinte apresentam-se alguns clculos intermdios.

xi

ij

 xi

Mq. 1

14.4

109.2

Mq. 2

6.4

43.2

Mq. 3

11.2

66.8

Mq. 4

7.4

77.2

Dashfer
Verlag
McGraw-Hill

9.85

296.4

CAPTULO 13

Prosseguindo os clculos,
GLi = 4

(i = 1, 2, 3, 4)

GL = 4 4 = 16

109.2

= 27.3
4

43.2
s22 =
= 10.8
4
2 1
s = (296.4 ) = 18.525
16
66
8
.

s32 =
= 16.7
4

77.2
s42 =
= 19.3

ESTATSTICA

2. Edio

s12 =

C =1+

1
4 1
- = 1.104 .
3 ( 4 - 1) 4 16

Finalmente,

ET =

{16 ln (18.525) - 4 ln (27.3) + ln (10.8) + ln (16.7) + ln (19.3)} = 0.775 .


1.104

Como
ET = 0.775 <
a hiptese H0 no rejeitada.

Dashfer
Verlag
McGraw-Hill

c 32 (0.05) = 7.815 ,

CAPTULO 13

Aceitando a hiptese da homogeneidade da varincia, passe-se questo fundamental (a de


saber se as mquinas tm, ou no, um comportamento idntico no que respeita ao valor esperado
do nmero de avarias semanais). A tabela ANOVA correspondente aos dados disponveis

Variaes (V)

GL

DQM

Entre grupos (EG)

202.15

67.38

Dentro grupos (DG)

296.40

16

18.53

Total (T)

498.55

19

ESTATSTICA

2. Edio

Fontes de variao

O teste F que ser realizado tem por base as seguintes hipteses:

H 0 :s A2 = 0 (ou A1 = A2 = A3 = A4 = 0 )
H1 :s A2 > 0 .
A estatstica de teste

ET =

DQMEG
DQMDG

seguir uma distribuio F3, 16 se H0 for verdadeira.


Substituindo,

ET =

67.38
= 3.637 > F3, 16 (a = 0.05) = 3.24 ,
18.53

pelo que H0 rejeitada (com um valor de prova de p 3.6%). Conclui-se assim que o nmero
mdio de avarias semanais varia de mquina para mquina.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

ESTATSTICA

2. Edio

Rejeitada H0 faz sentido estimar a varincia dos efeitos s A2 . O estimador de s A2 dado por

S A = DQMEG -h DQMDG ,
com

Ji J i2

202 - 4 25
i
i
h=
=
= 5.
20 3

J i ( I - 1)
i

Substituindo, resulta
s A2 =

67.38 - 18.52
= 9.77 s A = 3.126 .
5

Assim, os valores esperados mi do nmero de avarias semanais de cada mquina i seguiro


uma distribuio N ( m , s A2 ) , cujos parmetros (estimados) so m = x = 9.85 e s A2 = 9.77.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.4
Alnea (ii)
Apoio 1 (apenas o resultado)
4.07%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.4
Alnea (ii)
Apoio 2 (sugesto)
Seja X3j o nmero de avarias da mquina 3 numa dada semana j. Para calcular a probabilidade
pretendida procure caracterizar a varivel X3 j - X3 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.4

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Recorde-se que, de acordo com o modelo ANOVA com um factor (de efeitos variveis), se admitiu
que X3j segue uma distribuio Normal N (3, 2). Para se calcular P (X3j > 20), aquela varivel
dever ser padronizada. No entanto, o parmetro 3 desconhecido, possuindo-se apenas a sua
estimativa:

m 3 = x3 = 11.2 .
Assim, a varivel padronizada
X3 j - X3
1
s 1 +
5

com
s 2 = DQMDG = 18.53 (ou s = 4.30 ),
seguir uma distribuio t de student com 16 graus de liberdade (GL2 = 16).
Finalmente,

P X3 j

X3 j - 11.2
20 - 11.2

> 20 = P
= t16 >
4.71
1

4.30 1 +

P (t16 > 1.86 ) = 4.07%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.5
Apoio 1 (apenas o resultado)
Se no for excessivamente caro, devem imprimir-se os dois cartazes, enviando o do anncio L
para as cidades (pequenas e grandes) e o do anncio M para as vilas. Alternativamente, se o
custo for excessivo, imprimir s o do anncio L.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.5
Apoio 2 (sugesto)
Aplique a tcnica de anlise de varincia para o modelo de dois factores anncio (L ou M)
e tipo de aglomerado urbano (cidade grande, pequena e vila) de efeitos fixos (pretende
comparar-se os dois anncios em causa e os 3 tipos referidos de aglomerado urbano).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.5

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


O modelo ANOVA a adoptar o de dois factores anncio (L ou M) e tipo de aglomerado
urbano (cidade grande, pequena e vila) de efeitos fixos (pretende comparar-se os dois anncios
em causa e os 3 tipos referidos de aglomerado urbano):
Xijk = m + a i + b j + g ij + Eijk ,
com
IN (0,s 2 ) ,

Eij
onde

i : ndice que denota os dois tipos de anncio (com i = 1 e 2)


j : ndice relativo ao tipo de aglomerado (com j = 1, 2 e 3)

k : ndice relativo a cada observao dentro de cada clula (i, j)


Xijk : k-sima observao da clula (i, j)
mij : valor esperado das observaes includas na clula (i, j)
m : parmetro global
a i : efeito do factor tipo de anncio (linha)
b j : efeito do factor tipo de aglomerado (coluna)
g ij : interaco entre os dois efeitos.
Na tabela seguinte apresentam-se alguns resultados obtidos a partir dos dados fornecidos.
(j = 1)

(j = 2)

(j = 3)

Peq. cidade

Gr. cidade

Vila

(i = 1)

x11

4.4

x12

4.1

x13

3.5

x1

4.0

(i = 2)

x21

3.0

x22

2.5

x23

4.1

x2

3.2

x1

3.7

x2

3.3

x3

3.8

3.6

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Recordem-se as expresses necessrias para se construir a tabela ANOVA respectiva:


VDFL = K J

(X

- X

- X

VDFC = K I

(X

2. Edio

VDFI = K

VT =

ijk

- Xi - X j + X

- Xij

(X
i

ij

(X

VR =

ESTATSTICA

(X

ijk

- X

Executados os clculos, resulta


Fontes de variao

Variaes (V)

Factor linha (FL)

6 3 0.42  0.42 5.76

Factor coluna (FC)

6 2 0.12  0.32  0.22 1.68

Interaco (I)

Residual (R)

7.0  4.0  5.0  8.0  5.0  7.0

Total (T)

5.76  1.68  8.88  36.00

0.32

 0.32

 0.42

 0.42

 0.72

 0.72

36.00

52.32

8.88

GL

DQM

5.76

0.84

4.44

30

1.20

35

Comece por testar-se se a interaco entre os factores, g ij , significativa. Para tal recorre-se
ao teste F, cujas hipteses se enunciam em seguida:
H 0 :g ij = 0 (para todo i e todo j)
H1 : algum g ij 0.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

A estatstica de teste
ET =

DQMDI
,
DQMR

que, se H0 for verdadeira, seguir uma distribuio F2, 30 .

ESTATSTICA

2. Edio

Como

ET =

4.44
= 3.70 > F2,30 (a = 0.05) = 3.32 ,
1.20

a hiptese nula H0 rejeitada, ou seja, a interaco entre os factores tipo de aglomerado urbano
e tipo de anncio significativa (ao nvel de significncia de 5%).
Para ajuda a interpretar a situao, os resultados amostrais so ilustrados no diagrama seguinte.
5

4.5

4
3.5
3
2.5
2
Peq. cidade

Gr. cidade

Vila

O teste ao factor linha (tipo de anncio) envolve as seguintes hipteses:

H 0 : a i = 0 (para todo i)
H1 : algum a i 0.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

A estatstica de teste

ET =

DQMDFL
,
DQMR

que, se H0 for verdadeira, seguir uma distribuio F1, 30.

ESTATSTICA

2. Edio

Como
ET =

5.76
= 4.80 > F1,30 (a = 0.05) = 4.17 ,
1.20

a hiptese nula rejeitada, concluindo-se que o efeito de tipo de anncio significativo (ao
nvel de significncia de 5%).
No que respeita a avaliao do efeito do factor coluna (tipo de aglomerado urbano), a simples
anlise dos valores inscritos na tabela ANOVA permite concluir que no possvel rejeitar a
hiptese de ele ser nulo (note-se que DQMDFC < DQMR).
Observando o diagrama anterior, no parece ser claro isolar o efeito do factor linha (tipo de
anncio). Assim, afigura-se importante testar directamente se h diferenas significativas entre
os pares de valores de mij que diferem no tipo de anncio utilizado. Os testes sero realizados
recorrendo aos intervalos de confiana definidos pelo mtodo de Tukey.
Recorde-se que os limites do intervalo de confiana a 95% para mi1 j1 - mi2 j2 so dados por
X i1 j1 - X i2 j2 qIJ , GL4 (a )

DQMR
.
K

Como,

I J = 6 e GL4 = I J ( K - 1) = 30 ,
resulta:

qIJ , GL4 (a )

Dashfer
Verlag
McGraw-Hill

DQMR
1.20
1.20
= q6, 30 (0.05)
= 4.30
= 1.92 .
K
6
6

CAPTULO 13

ESTATSTICA

2. Edio

Na tabela seguinte apresentam-se os valores dos intervalos de confiana em causa.

xi1  xi2

Clula

Clula

Intervalos de confiana a 95%

1,1 (L, Peq. cidade)

2,1 (M, Peq. cidade)

1.4

[0.52; 3.32]

1,2 (L, Gr. cidade)

2,2 (M, Gr. cidade)

1.6

[0.32; 3.52]

1,3 (L, Vila)

2,3 (M, Vila)

0.6

[2.52; 1.32]

Embora no se observem diferenas significativas entre os valores esperados (com = 0.05),


h indcios relativamente firmes de que nas cidades (grandes ou pequenas) o anncio L mais
eficaz (o efeito linha significativo). Poder suceder o contrrio nas vilas (o efeito interaco
significativo).
Dada a necessidade de tomar decises urgentes para a campanha de Vero, farse-o as seguintes
recomendaes:
(i) se no for excessivamente caro, devem imprimir-se os dois cartazes, enviando o do anncio L
para as cidades (pequenas e grandes) e o do anncio M para as vilas;
(ii) alternativamente, se o custo for excessivo, imprimir s o do anncio L;
(iii) em qualquer caso, recolher mais informao para preparar mais convenientemente futuras
decises.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.6
Alnea (i)
Apoio 1 (apenas o resultado)
H interaco significativa (ao nvel de significncia de 5%) entre os factores tipo de resina
e tipo de madeira. Os efeitos de cada factor isolado no so significativos.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.6
Alnea (i)
Apoio 2 (sugesto)
Aplique a tcnica de anlise de varincia recorrendo ao modelo de dois factores (tipo de resina
e tipo de madeira) de efeitos fixos (pretende comparar-se apenas o comportamento dos trs tipos
de resina em causa com os dois tipos de madeira).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.6

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Trata-se de avaliar o comportamento dos trs tipos de resina em causa aplicada aos dois tipos de
madeira. Assim, deve recorrer-se ao modelo de dois factores (tipo de resina e tipo de madeira)
de efeitos fixos:
Xijk = m + a i + b j + g ij + Eijk ,
assumindo as hipteses habituais sobre os erros.
Na tabela seguinte apresentam-se alguns clculos intermdios efectuados a partir dos dados
fornecidos.

(i = 1)

(j = 1)
X
9, 12, 12
x11 11

(i = 2)

15, 12, 12
x21 13

(i = 3)

20, 17, 17
x31 18
x1

14

(j = 2)
Y
12, 15, 18
x12 15

x1

13

14, 15, 16
x22 15

x2

14

10, 12, 14
x32 12

x3

15

14

x2

14

Os clculos referentes aos diversos tipos de variaes so:


VDFL = 3 2 (12 + 02 + 12 ) = 12
VDFC = 3 3 (02 + 02 ) = 0

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

VDI = 3 (11 - 14 - 13 + 14 ) + (15 - 14 - 13 + 14 ) + (13 - 14 - 14 + 14 ) +


2
2
2
+ (15 - 14 - 14 + 14 ) + (18 - 14 - 15 + 14 ) + (12 - 14 - 15 + 14 ) = 3 28 = 84

VR = (22 + 12 + 12 ) + (32 + 02 + 32 ) + (22 + 12 + 12 ) + (12 + 02 + 12 ) + (22 + 12 + 12 ) +

ESTATSTICA

2. Edio

+ (22 + 02 + 22 ) = 6 + 18 + 6 + 2 + 6 + 8 = 46
VT = (52 + 22 + 22 ) + (22 + 12 + 42 ) + (12 + 22 + 22 ) + (02 + 12 + 22 ) + (62 + 32 + 32 ) +
+ ( 42 + 22 + 02 ) = 33 + 21 + 9 + 5 + 54 + 20 = 142.
conveniente verificar estes resultados. Ora,
VT = VDFL + VDFC + VDI + VR .

Como 12 + 0 + 84 + 46 = 142, conclui-se que os clculos esto correctos.


Apresenta-se em seguida a respectiva tabela ANOVA.
Variaes (V)

GL

DQM

Factor linha (FL)

12

Factor coluna (FC)

Interaco (I)

84

42

Residual (R)

46

12

3.833

Total (T)

142

17

Fontes de variao

Inicialmente, teste-se a interaco:


H 0 :g ij = 0 (para todo i e todo j)

H1 : algum g ij 0.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

A estatstica de teste

ET =

DQMDI
,
DQMR

que, se H0 for verdadeira, seguir uma distribuio F2, 12 .

ESTATSTICA

2. Edio

Como

ET =

42
= 10.96 > F2, 12 (a = 0.05) = 3.88,
3.833

a hiptese nula rejeitada (com um valor de prova muito baixo).


Para ajudar a interpretar a situao, no diagrama seguinte ilustram-se os resultados amostrais.
De facto, a figura sugere que no far sentido testar individualmente os efeitos ai e bj , uma vez
que, a existirem, estariam escondidos ou confundidos com a interaco (que tm uma grande
magnitude).

ij
X
Y

15

10
A

Pode assim concluir-se que os trs tipos de resina tm comportamentos distintos consoante
forem aplicados a um tipo de madeira ou a outro.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.6
Alnea (ii)
Apoio 1 (apenas o resultado)
Com uma confiana de 95%, apenas so significativas as diferenas entre os valores esperados
dos seguintes dois pares de clulas:
mCX - m AX [1.63, 12.37] e mCX - mCY [0.63, 11.37] .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.6
Alnea (ii)
Apoio 2 (sugesto)
Uma vez que se est perante amostras equilibradas, dever recorrer ao mtodo de Tukey na definio
de intervalos de confiana para as diferenas entre os valores esperados das clulas.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.6

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Uma vez que se est perante amostras equilibradas, o mtodo de Tukey ser utilizado na definio
de intervalos de confiana para as diferenas entre os valores esperados das clulas. Tais intervalos
de confiana a (1 - a ) 100% = 95% so definidos pela expresso seguinte:

(x

i1 j1

- xi2 j2 qI J , GL4 (a )

DQMR
.
K

Como,
I J = 6,

GL4 = I J ( K - 1) = 12
e

q6, 12 (0.05) = 4.75 ,


resulta:

q6, 12 (0.05)

Dashfer
Verlag
McGraw-Hill

DQMR
3.833
= 4.75
= 5.37.
K
3

CAPTULO 13

Na tabela seguinte apresentam-se os 15 intervalos de confiana referentes s diferenas entre


os valores esperados das clulas.

ESTATSTICA

2. Edio

Clulas

xi1  xi2

Intervalos de confiana a 95%

(C, X); (A, X)

18 11 = 7

[1.63; 12.37]*

(C, X); (B, X)

18 13 = 5

[0.37; 10.37]

(B, X); (A, X)

13 11 = 2

[3.37; 7.37]

(C, Y); (A, Y)

12 15 = 3

[8.37; 2.37]

(C, Y); (B, Y)

12 15 = 3

[8.37; 2.37]

(B, Y); (A, Y)

15 15 = 0

[5.37; 5.37]

(A, X); (A, Y)

11 15 = 4

[9.37; 1.37]

(B, X); (B, Y)

13 15 = 2

[7.37; 3.37]

(C, X); (C, Y)

18 12 = 6

[0,63; 11.37]*

(A, X); (B, Y)

11 15 = 4

[9.37; 1.37]

(A, X); (C, Y)

11 12 = 1

[6.37; 4.37]

(B, X); (A, Y)

13 15 = 2

[7.37; 3.37]

(B, X); (C, Y)

13 12 = 1

[4.37; 6.37]

(C, X); (B, Y)

18 15 = 3

[2.37; 8.37]

(C, X); (A, Y)

18 15 = 3

[2.37; 8.37]

* diferena significativa ao nvel de significncia de 5%.

Os nicos intervalos que no contm o valor zero so os referentes s diferenas dos valores
esperados entre os pares de clulas (C, X), (A, X) e (C, X), (C, Y).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.7
Alnea (i)
Apoio 1 (apenas o resultado)
Apenas significativo na classificao o efeito do factor disciplina.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.7
Alnea (i)
Apoio 2 (sugesto)
Aplique a tcnica de anlise de varincia a uma situao em que esto presentes dois factores
(turma e disciplina) com efeitos variveis (escolheram-se ao acaso duas turmas e trs disciplinas de entre vrias alternativas).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.7

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
O modelo ANOVA em causa o de dois factores (turma e disciplina) com efeitos variveis
(escolheram-se ao acaso duas turmas e trs disciplinas entre vrias alternativas):
Xijk = m + Ai + B j + Cij + Eijk ,
no qual se admite que

Ai

IN (0, s A2 )

Bj

IN (0, s B2 )

Cij

IN (0, s C2 )

Eijk

IN (0, s 2 )

e ainda que Ai , B j , Cij e Eijk so mutuamente independentes.


No caso vertente, o factor linha tem dois nveis,
i = 1 Turma A
i = 2 Turma B
e, por sua vez, o factor coluna possui os trs nveis seguintes:
j = 1 Disciplina X
j = 2 Disciplina Y
j = 3 Disciplina Z.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

ESTATSTICA

2. Edio

Na tabela seguinte apresentam-se alguns clculos intermdios efectuados a partir dos dados
amostrais.
(j = 1)

(j = 2)

(j = 3)

(i = 1)

x11

12.75

x12

14.25

x13

11.50

x1

12.833

(i = 2)

x21

12.25

x22

14.75

x23

11.75

x2

12.917

x1

12.50

x2

14.50

x3

11.625

12.875

As expresses utilizadas no clculo das variaes so:

VT =

(X
i

- X

ijk

VDFL = K J

(X

- X

- X

VDFC = K I

(X

VDFI = K

(X
i

VR =

Dashfer
Verlag
McGraw-Hill

- Xi - X j + X

(X
i

ij

ijk

- Xij .

CAPTULO 13

Na seguinte tabela ANOVA resumem-se os resultados:

Variaes (V)

GL

DQM

Valores esperados

Factor linha (FL)

0.042

0.042

V 2  4 V C2  12 V A2

Factor coluna (FC)

34.750

17.375

V 2  4 V C2  68 V B2

Interaco (I)

1.083

0.542

V 2  4 V C2

Residual (R)

56.750

18

3.153

V2

Total (T)

92.625

23

ESTATSTICA

2. Edio

Fontes de variao

conveniente verificar os clculos a partir da expresso:


VT = VDFL + VDFC + VDI + VR .

De facto, verifica-se que


VT = 96.265 = 0.042 + 34.750 + 1.083 + 56.750.
Em primeiro lugar, testa-se se a varincia da interaco significativa:
H 0 :s C2 = 0
H1 :s C2 > 0 .

A estatstica de teste

ET =

DQMDI
,
DQMR

seguir uma distribuio F2,18 se H0 for verdadeira.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Como

ESTATSTICA

2. Edio

ET =

0.542
= 0.172 << F2, 18 (a = 0.05) = 3.55,
3.153

a hiptese nula no rejeitada.


Admitindo que s C2 = 0, ento tanto o DQMDI como o DQMR sero estimativas da varincia
residual (pois E ( DQMDI ) = s 2 e tambm E ( DQMR ) = s 2 ). Neste caso, pode obter-se uma
melhor estimativa de 2 atravs de:
s 2 =

2 DQMDI + 18 DQMR 2 0.542 + 18 3.153


=
= 2.89 (resultando s = 1.70 ).
20
20

O teste ao factor linha assenta nas seguintes hipteses:

H 0 :s A2 = 0
H1 :s A2 > 0 .
A estatstica de teste agora

ET =

DQMDFL
.
s

Se H0 for verdadeira, ET seguir uma distribuio F1, 20 .


Como

ET =

DQMDFL 0.042
=
= 0.0145 << F1, 20 (a = 0.05) = 4.35,
s 2
2.892

a hiptese nula no rejeitada.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Teste-se agora o factor coluna:

ESTATSTICA

2. Edio

H 0 :s B2 = 0
H1 :s B2 > 0 .

Se H0 for verdadeira, a estatstica de teste


ET =

DQMDFC
s

seguir uma distribuio F2, 20 .


Como
ET =

DQMDFL 17.375
=
= 6.01 > F2, 20 (a = 0.05) = 3.49,
s 2
2.892

H0 rejeitada.
Conclui-se assim que apenas significativo o efeito do factor coluna (disciplina). Tal efeito
traduz-se na variabilidade dos valores esperados das classificaes, cuja magnitude (em termos
de varincia) se estima por
s B2 = ( DQMDFC - s 2 ) / KI = (17.375 - 2.892 ) / 8 = 1.810 (ou s = 1.345 ).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.7
Alnea (ii)
Apoio 1 (apenas o resultado)
22.11%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.7
Alnea (ii)
Apoio 2 (sugesto)
Uma vez que o factor turma no significativo, indiferente que um dos alunos pertena
turma A e o outro turma B. Neste caso, podem juntar-se as observaes das duas turmas (por
disciplina). A probabilidade de um aluno (da turma A ou B) ter na disciplina X uma classificao
superior que obtida por outro aluno (da turma A ou B) na disciplina Y, equivalente a
considerar a probabilidade de varivel que resulta da diferena entre as duas classificaes ser
superior a zero. Procure caracterizar esta nova varivel.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

ESTATSTICA

2. Edio

Problema 13.7
Alnea (ii)
Apoio 3 (resoluo completa)
Uma vez que o factor turma no significativo, indiferente que um dos alunos pertena
turma A e o outro turma B. Neste caso, podem juntar-se as observaes referentes s duas
turmas (por disciplina). Seja
CX:
CY:
C X e CY :

classificao de um aluno na disciplina X (quer pertena turma A, quer B).


classificao de um aluno na disciplina Y (quer pertena turma A, quer B).
classificaes mdias nas disciplinas X e Y (quando se consideram as observaes relativas s duas turmas A e B)

C X = X1 = 12.50
CY = X2 = 14.50.

Nestas condies,
P (C X > CY ) = P (C X - CY > 0 ) .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Padronizando a varivel C X - CY , o clculo daquela probabilidade vem (note-se que no se


conhecem os valores esperado de CX e de CY mas apenas as respectivas estimativas):

(C X - CY ) - (C X - CY )
P
>
(s + s ) + s + s
s
8
8

(1 + 1) + 18 + 18

0 + CY - C X

14.5 - 12.5
= P t20 >

1.70 2.25

= P t20 >
= 0.784 .

2.55
Finalmente, P(t20 > 0.744) = 22.11%.
Este valor corresponde probabilidade de um aluno (da turma A ou B) ter uma classificao
na disciplina X superior classificao que qualquer outro aluno obtm na disciplina Y.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.8
Apoio 1 (apenas o resultado)
A interaco entre os montantes em dvida e o tipo de procedimento no significativa. O
procedimento C mais eficaz do que o procedimento B e, por sua vez, este mais eficaz do que
o procedimento A.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.8
Apoio 2 (sugesto)
Adopte o modelo ANOVA de dois factores, de efeitos fixos. Dever testar sucessivamente se a
interaco entre os dois factores significativa e se so significativamente diferentes de zero os
efeitos dos factores linha (montante em dvida) e coluna (procedimento).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.8
Apoio 3 (resoluo completa)
Adoptar-se- o modelo ANOVA de dois factores, com efeitos fixos:

ESTATSTICA

2. Edio

Xijk = m + a i + b j + g ij + Eijk ,
em que se assume que os erros Eijk sero independentes e Normais, com mdia zero e
varincia 2.
Na tabela seguinte apresentam-se alguns clculos intermdios efectuados a partir dos dados
amostrais.
(j = 1)

(j = 2)

(j = 3)
C

(i = 1)

< 150

x11

(i = 2)

150-250

x21

30

x22

42

x23

48

x2

40

(i = 3)

> 250

x31

31

x32

38

x33

42

x3

37

x1

32

x2

42

x3

46

40

35

x12

46

x13

48

x1

43

No diagrama seguinte ilustram-se os valores mdios das percentagens de clientes que saldaram
as suas contas (no perodo de quinze dias aps a expedio da carta) para os diferentes nveis
dos dois factores. Aparentemente, o factor procedimento ser significativo.
[%]
50

C
B

35

20
< 150

Dashfer
Verlag
McGraw-Hill

150-250

> 250

CAPTULO 13

Efectuam-se em seguida os clculos necessrios para construir a tabela ANOVA.


VDFL = 2 3 (32 + 02 + 32 ) = 108
VDFC = 2 3 (82 + 22 + 62 ) = 624
VDI = 2 (02 + 12 + 12 + 22 + 02 + 22 + 22 + 12 + 12 ) = 32

ESTATSTICA

2. Edio

VR = 22 + 22 + 12 + 12 + 32 + 32 + 12 + 12 + 22 + 22 + 02 + 02 + 32 + 32 + 02 + 02 +
+22 + 22 = 64
VT = 32 + 72 + 52 + 72 + 52 + 112 + 92 + 112 + 02 + 42 + 82 + 82 + 122 + 62 + 22 +
+22 + 42 + 02 = 828 .
Verificao:
VT = VDFL + VDFC + VDI + VR
VT = 828 = 108 + 624 + 32 + 64 = 828 .

A tabela ANOVA resulta ento:


Variaes (V)

GL

DQM

Factor linha (FL)

108

54

Factor coluna (FC)

624

312

Interaco (I)

32

Residual (R)

64

7.1

Total (T)

828

17

Fontes de variao

Comece por testar-se a interaco:


H 0 :g ij = 0 (para todo i e todo j)
H1 : algum g ij 0

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

A estatstica de teste

ET =

DQMDI
,
DQMR

que, se H0 for verdadeira, seguir uma distribuio F4, 9 .

ESTATSTICA

2. Edio

Como
ET =

8
= 1.125 < F4, 9 (a = 0.05) = 3.63,
7.1

a hiptese nula no rejeitada, ou seja, ao nvel de significncia de 5% a interaco no


significativa.
Antes de testar o factor linha (montante em dvida) e uma vez que a evidncia aponta no
sentido de a interaco no ser significativa (ver diagrama anterior), possvel melhorar a
estimativa de 2:

s 2 =

4 DQMDI + 9 DQMR 4 8 + 9 7.1


=
= 7.38.
13
13

O teste ao factor linha (tipo de anncio) envolve as seguintes hipteses:

H 0 : a i = 0 (para todo i)
H1 : algum a i 0.
A estatstica de teste
ET =

DQMFL
s 2

que, se H0 verdadeira, seguir uma distribuio F2, 13.


Como
ET =

54
= 7.317 > F2, 13 (a = 0.05) = 3.81
7.38

a hiptese nula rejeitada, sendo o factor linha considerado significativo.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

No teste ao factor coluna (tipo de procedimento) recorrer-se- a um procedimento anlogo.


H 0 : b j = 0 (para todo j)

H1 : algum b j 0.

ESTATSTICA

2. Edio

A estatstica de teste

ET =

DQMFC
s 2

que, se H0 verdadeira, seguir uma distribuio F2, 13 .


Como
ET =

312
= 42.28 > F2, 13 (a = 0.05) = 3.81
7.38

a hiptese nula rejeitada, sendo o factor coluna considerado significativo.


Atendendo natureza dos valores apresentados no diagrama anterior, faz sentido testar se a
eficcia de C superior eficcia de B, e se esta superior de A. Consequentemente, os testes
s diferenas de eficcia dos procedimentos devero ser unilaterais.
Os testes
H 0 : m j1 = m j 2
H1 : m j1 > m j 2

podem ser efectuados ao nvel de significncia recorrendo aos intervalos de confiana definidos
pelo mtodo de Tukey:

X j1 - X j2 - qJ ,

Dashfer
Verlag
McGraw-Hill

GL3

(2 a )

DQMR
,
I K

+ .

CAPTULO 13

Para efectuar os testes com a = 0.05 seria necessrio dispor de q3, 9 (0.10 ) , o que no sucede.
Na Tabela 16 est disponvel o valor de q3, 9 (0.05) . Nestas condies, os testes sero realizados
ao nvel de significncia de = 2.5%. Assim,

q3,

(0.05)

DQMR
7.111
= 3.95
= 4.3 .
6
6

ESTATSTICA

2. Edio

Na tabela seguinte apresentam-se os trs intervalos em causa.


j1

j2

x j1  x j2

3(C)

1(A)

46 32 = 14

9.7, 

2(B)

1(A)

42 32 = 10

5.7, 

3(C)

2(B)

46 42 = 4

0.3, 

Intervalos de confiana unilateral a 95.5%

Fica claramente estabelecido que os procedimentos C e B so mais eficazes que o A. Quanto


comparao entre os procedimentos C e B, se se tivesse efectuado o teste ao nvel de significncia
de a = 0.05 (como se afigurava desejvel, partida) tambm se concluiria que C seria mais
eficaz do que B (dado que o valor de prova prximo de 2.5%).
Finalmente, ao nvel se significncia de 5%, pode afirmar-se que:
(i) a interaco entre os montantes em dvida e o tipo de procedimento no significativa
(ii) o procedimento C mais eficaz do que o procedimento B e, por sua vez, este mais eficaz
do que o procedimento A.
Tendo por base estas concluses, recomenda-se que:
(a) O procedimento C, embora mais eficaz do que o procedimento B, tem custos mais elevados
(designadamente porque consome tempo ao gestor de clientes difceis e recorre chamada
telefnica). Assim, dever ser adoptado prioritariamente para os clientes com montantes
em dvida mais elevados.
(b) Para os clientes com dvidas menores dever ser adoptado o procedimento B.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.9
Alnea (i)
Apoio 1 (apenas o resultado)
Na zona Y os valores mdios das indemnizaes so significativamente superiores aos das zonas X
e Z. As zonas X e Z no se distinguem entre si. No h evidncia que o tipo de veculo afecte
significativamente o valor das indemnizaes, nem que exista interaco entre a zona e o tipo de
veculo.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.9
Alnea (i)
Apoio 2 (sugesto)
Adopte um modelo de dois factores, de efeitos fixos. Dever testar sucessivamente se a interaco
entre os dois factores significativa e se so significativamente diferentes de zero os efeitos dos
factores linha (tipo de veculo) e coluna (zona).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.9
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Recorrer-se- tcnica de anlise de varincia e ao modelo de dois factores com efeitos fixos:
Xijk = m + a i + b j + g ij + Eijk ,
assumindo as hipteses habituais sobre os erros Eijk.
A correspondente tabela ANOVA a seguinte:
Variaes (V)

GL

DQM

Factor linha (FL)

126.75

2 1=1

126.75

Factor coluna (FC)

844.67

3 1=2

422.33

Fontes de variao

100 945.62

2 1 3 1 2
2 3 50  1 294

12003.04

2 3 50  1 299

Interaco (I)
Residual (R)

86.00

Total (T)

Testem-se as seguintes hipteses relativas interaco


H 0 :g ij = 0 (para todo i e todo j)
H1 : algum g ij 0
recorrendo estatstica de teste

ET =

DQMDI
.
DQMR

Se H0 for verdadeira ET seguir uma distribuio F2,

Dashfer
Verlag
McGraw-Hill

294 .

43.00
37.23

CAPTULO 13

Como

ET =

43.00
= 1.155 < F2, 294 (a = 0.05) = 3.03
37.23

H0 no rejeitada. Isto , a interaco no significativa.

ESTATSTICA

2. Edio

Admitindo que a interaco de facto nula, pode re-estimar-se a varincia residual:

s 2 =

2 DQMDI + 294 DQMR 2 43.00 + 294 37.23


=
= 37.27.
296
296

Passe-se agora ao teste do factor linha


H 0 : a i = 0 (para todo o i)
H1 : algum a i 0.

A estatstica de teste

ET =

DQMDFL
s 2

seguir uma distribuio F1, 296 se H0 for verdadeira.


Como

ET =

126.75
= 3.40 < F1, 296 (a = 0.05) = 3.87,
37.27

H0 no rejeitada, ou seja, no h evidncia de que o tipo de veculo afecte significativamente


o valor das indemnizaes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Para testar o factor coluna,


H 0 : b j = 0 (para todo o j)
H1 : algum b j 0,

ESTATSTICA

2. Edio

recorre-se estatstica
ET =

DQMDFC
s 2

que, se H0 for verdadeira, seguir uma distribuio F2, 296 .


Como
ET =

422.33
= 11.33 > F2, 296 (a = 0.05) = 3.03
37.27

rejeita-se a hiptese nula, ou seja, conclui-se que as zonas tm um efeito significativo no valor
das indemnizaes.
Os intervalos de confiana a (1 - a ) 100% para as diferenas entre os valores esperados dos
efeitos relativos s zonas (X, Y e Z) calculados pelo mtodo de Tukey so definidos por:

(X

j1

- X j2 - qJ ,

GL 4

(a )

DQMR
.
I K

Ora,
q3,

294

(0.05)

DQMR
37.23
= 3.31
= 2.02 .
I K
2 50

Na tabela seguinte apresentam-se os trs intervalos em causa.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

j1

j2

x j1  x j2

3(Z)

1(X)

39.75 41.55 = 1.8

3.82,  0.22

2(Y)

1(X)

43.85 41.55 = 7.3

*
5.28,  9.32

3(Z)

2(Y)

39.75 43.85 = 6.1

*
8.12,  4.08

Intervalos de confiana a 95%

* diferena significativa ao nvel de significncia de 5%.

Verifica-se assim que na zona Y os valores mdios das indemnizaes so significativamente


superiores aos das zonas X e Z. Por sua vez, as zonas X e Z no se distinguem entre si.
Finalmente, interessante estimar o valor que assume o efeito da zona Y (2):

b2 = x2 - x = 43.85 - 41.72 = +2.13 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.9
Alnea (ii)
Apoio 1 (apenas o resultado)
82.7%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.9
Alnea (ii)
Apoio 2 (sugesto)
Seja X13 a indemnizao anual paga a um veculo comercial seguro contra terceiros na zona Z.
Para calcular a probabilidade pretendida comece por caracterizar a varivel X13 - X13 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

Problema 13.9
Alnea (ii)
Apoio 3 (resoluo completa)
A questo formulada

ESTATSTICA

2. Edio

P ( X13 > 34 ) = ?
Admita-se que a varivel X13 Normal com parmetros m13 e s 2. As estimativas destes
parmetros so:

m13 = x13 = 39.8 (em alternativa poder-se-ia tomar a mdia x3 = 39.75 )

s 2 = 37.27 s = 6.10 .

Assim,

X -X
13
P ( X13 > 34 ) = P 13

1
s 1 +
50

34 - x13

>

1
s 1 +

50

34 - 39.8
= P t296 >

6.10 1.02

= P t296 >

-5.8
6.16

= P (t296 >

- 0.941) .

Atendendo ao elevadssimo nmero de graus de liberdade da distribuio t, pode fazer-se


P (t296 >

- 0.941) P ( Z >

- 0.941) .

Resulta assim
P (Z >

Dashfer
Verlag
McGraw-Hill

- 0.941) = 1 - 0.173 = 0.827 .

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.10
Apoio 1 (apenas o resultado)
A concentrao do conservante influi significativamente no valor esperado do nmero adicional
de dias com validade dos iogurtes.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Problema 13.10
Apoio 2 (sugesto)
A varivel nmero adicional de dias com validade no segue, manifestamente, uma distribuio
Normal. Por outro lado, a amostra no grande. Recorra ao teste de Kruskal-Wallis como
alternativa ao teste ANOVA.

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

ESTATSTICA

2. Edio

Problema 13.10
Apoio 3 (resoluo completa)
A varivel nmero adicional de dias com validade no segue, manifestamente, uma distribuio
Normal. Por outro lado, a amostra, igual para todos os nveis do factor, tem uma dimenso
pequena (N = 6). Nestas condies ser mais prudente recorrer ao teste de Kruskal-Wallis.
Este teste tem, neste caso, a seguinte estrutura
H0: as distribuies do nmero adicional de dias com validade tm valores esperados
idnticos para todas as concentraes
H1: nem todas as concentraes produzem distribuies do nmero adicional de dias com
validade com o mesmo valor esperado.
A estatstica de teste
I

ET =

Ti2
12

- 3 ( J + 1)
J ( J + 1) i =1 J i

que, se H0 for verdadeira, seguir uma distribuio c I2-1 .


Note-se que:
I:
i:
Ti:
J i:
J:

nmero total de grupos (neste caso, I = 3)


ndice relativo a cada grupo (neste caso, i = 1, 2 e 3)
soma dos nmeros de ordem do grupo i
dimenso do grupo i
nmero total de observaes (neste caso, J =
J i = 18 ).

Dashfer
Verlag
McGraw-Hill

CAPTULO 13

ESTATSTICA

2. Edio

Na tabela seguinte ordenam-se todas as observaes, indicando-se o grupo de origem e o


respectivo nmero de ordem.

Observao

Grupo

N. de ordem

Observao

Grupo

N. de ordem

1.5

1.5

12

3.5

12

3.5

12

14.5

14.5

16

17

18

A partir dos valores includos na tabela calculam-se as estatsticas Ti :


T1 ( A) = 1.5 + 6 + 6 + 9 + 12 + 17 = 51.5
T2 ( B) = 9 + 12 + 14.5 + 14.5 + 16 + 18 = 84
T3 (C ) = 1.5 + 3.5 + 3.5 + 6 + 9 + 12 = 35.5 .

Para verificar estes resultados procede-se do modo que se descreve em seguida. Tal como
nos testes de Wilcoxon e de Mann-Whitney-Wilcoxon, a soma total dos nmeros de ordem
igual a J ( J + 1) 2 = 18 19 2 = 171. Ora, T1 ( A) + T2 ( B) + T3 (C ) = 51.5 + 84 + 33.5 = 171, pelo
que as contas esto validadas.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 13

Substituindo os valores respectivos na estatstica de teste resulta:

ET =

12 51.52 842 35.52

+
+
- 3 19 = 7.14 .
18 19 6
6
6

Como
ET = 7.14 > c 22 (a = 0.05) = 5.99
a hiptese nula rejeitada, ficando provado (ao nvel de significncia de 5% e com um valor de
prova de p = 2.81%) que a concentrao do conservante influi significativamente no valor esperado do nmero adicional de dias com validade dos iogurtes.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

ESTATSTICA

2. Edio

Captulos

Captulo 14
Problemas
14.1
(i)

Apoio 1
(apenas o
resultado)

Apoio 2
(sugesto)

Apoio 3
(resoluo
completa)

Dashfer
Verlag
McGraw-Hill

14.1
(ii)

14.2
(i)

14.2
(ii)

14.2
(iii)

14.3

14.4
(i)

14.4
(ii)

14.4
(iii)

14.5
(i)

14.5
(ii)

14.6

14.7

14.8
(i)

14.8
(ii)

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.1
Alnea (i)
Apoio 1 (apenas o resultado)
Y = 34 + 2.288 ( X - 16 ) + E .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.1
Alnea (i)
Apoio 2 (sugesto)
O grfico (X, Y) sugere que a relao Y = f (X) pode ser aproximada por uma relao linear.
Estime os parmetros e e verifique se = 0 (versus > 0).

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.1
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Sejam,
X: rendimento anual [1000 u.m.].
Y: capital seguro [1000 u.m.].
Na figura seguinte apresenta-se o grfico (X, Y) construdo com os dados fornecidos
60
Capital
seguro 50
[1000
u.m.] 40
30
20
10
0
0

10

15

20

25

30

Rendimento anual [1000 u.m.]

O grfico sugere que Y = f ( X ) pode ser aproximada por uma relao linear, cujo modelo
pode ser descrito por:

Yn = a + b X n - X + En ,

admitindo-se que os erros En so independentes e Normais, com mdia 0 e varincia 2.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Naquela expresso:
ndice denotando as observaes do par de variveis X e Y ( n = 1, ..., 12 )
( Xn , Yn ) : n-sima observao do par ( X , Y )
a , b : parmetros fixos (ambos desconhecidos, a estimar) da relao linear
entre X e Y
En :
erro aleatrio associado ao valor observado Yn .

ESTATSTICA

2. Edio

n:

Os parmetros a e b podem ser estimados recorrendo ao mtodo dos mnimos quadrados.


A minimizao da funo Soma dos Erros Quadrticos (SEQ) conduz aos seguintes estimadores:

A=

B=

= Y (estimador de a)

S XY
(estimador de a),
S XX

onde

S XY =

( X
n

)(

- X Yn - Y

S XX =

( X

2
- X .

Considerando os valores fornecidos no enunciado, obtm-se as estimativas seguintes:

x = 16
s XY =

(x

- x ) ( yn - y ) = (14 - 16 ) (31 - 34 ) + + (16 - 16 ) (34 - 34 ) = 682

s XX =

(x

- x ) = (14 - 16 ) + (19 - 16 ) + + (16 - 16 ) = 298

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

sYY =

(y

- y ) = (31 - 34 ) + ( 40 - 34 ) + + (34 - 34 ) = 1664

a = a = y = 34

ESTATSTICA

2. Edio

s
682
b = b = XY =
= 2.288 .
s XX 298
Na relao (linear) entre X e Y estima-se ento que b = b = 2.288. O teste mais importante
ser verificar a hiptese nula de que = 0.
No caso de a hiptese alternativa ser formulada como 0 far sentido recorrer ao teste F da
anlise de varincia. O procedimento do teste ANOVA tem a estrutura seguinte:

H0 : b = 0
H1 : b 0 .
A estatstica de teste
ET =

DQMDR
DQMR

seguir uma distribuio F1,10 se H0 for verdadeira.


Neste caso, a tabela ANOVA resulta:
Fontes de variao
Devido regresso (DR)
Residual (R)
Total (T)

Dashfer
Verlag
McGraw-Hill

Variaes (V)
b S XY

2.289 682 1561

1664  1561 103


SYY

1664

GL

DQM

1561

10

10.3

11

CAPTULO 14

Como

ESTATSTICA

2. Edio

ET =

DQMDR 1561
=
= 151.55 >> F1, 10 (a = 0.05) = 4.96 ,
DQMR
10.3

a hiptese nula b = 0 rejeitada ao nvel de significncia de 5% (com um valor de prova quase


nulo).
No entanto, o teste a efectuar deveria ser unilateral, uma vez que parece ser apenas plausvel
que Y cresa com X, ou seja, que b > 0. Nesta situao no se deve recorrer ao teste ANOVA (que
sempre bilateral) mas, preferencialmente, ao teste unilateral:

H0 : b = 0
H1 : b > 0 ,
utilizando a estatstica
ET =

B - b0
.
S
S XX

Quando H0 verdadeira ET segue uma distribuio tN2 .


Para efectuar este teste falta determinar o valor de S. Ora,

s 2 = DQMR =

sYY - b s XY 1664 - 2.288 682


=
= 10.318 .
n-2
10

Assim,
s = 10.318 = 3.212 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Substituindo os valores amostrais na expresso da estatstica de teste vem:

ESTATSTICA

2. Edio

ET =

2.288 - 0
= 12.299 >> t10 (a = 0.05) = 1.81 ,
3.212
298

pelo que se rejeita H0, igualmente com um valor de prova p 0.


A relao linear estimada entre X e Y ser ento

com

Y = 34 + 2.288 ( X - 16 ) + E ,
s E = 3.21.

Uma vez que b > 0, isto , que h uma relao linear significativa entre as variveis X e Y, faz
sentido calcular o respectivo coeficiente de determinao
2 =
RXY

B2 S XX
.
SYY

Substituindo, resulta
2 = 0.938 .
rXY
2 representa a proporo de variao de Y que explicada pela regresso.
Recorde-se que RXY
Consequentemente, estima-se que 93.8% da disperso que se observa nos montantes investidos
em seguros de vida se deve relao linear que existe entre esta varivel e o rendimento anual
das famlias.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.1
Alnea (ii)
Apoio 1 (apenas o resultado)
30.08%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.1
Alnea (ii)
Apoio 2 (sugesto)
O clculo da probabilidade pretendida requer que se padronize a varivel Y. A estimativa do
valor esperado de Y X = 20 corresponde ao valor sobre a recta estimada fazendo X = 20, ou seja,
a mY x = 20. Para determinar P Y > 45 X = 20 , ser necessrio dividir a varivel (Y - mY )
pela estimativa do seu desvio padro. Note que mY (que, para simplificar, se denota por Y a
melhor previso disponvel de Y X e que o erro () que se comete nesta previso dado pela diferena d = Y - Y . Recorra ento expresso que permite calcular a varincia de .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.1
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Em termos simblicos a questo formula-se do seguinte modo:

P Y > 45 X = 20 = ?

Ora, para x = 20 e recorrendo expresso da relao linear estimada entre Y e X, vem


mY = Y = 34 + 2.288 (20 - 16 ) = 43.152 .

Note-se que mY (que, para simplificar, se denota por Y a melhor previso disponvel
de Y X e que o erro () que se comete nesta previso dado pela diferena d = Y - Y . Ento,

Y - Y
45 - 43.152

P Y > 45 X = 20 = P
>
.
2

s
s 2Y -Y

(Y -Y )
( )

Uma vez que se admitiu a Normalidade dos erros En, as variveis Yn sero ainda Normais
(cuja varincia 2 estimada por DQMR). Do mesmo modo, os erros de previso d = Y - Y
tambm seguiro distribuies Normais. Nestas condies, no problema em causa, a varivel
padronizada

Y - Y
s 2

(Y -Y )

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

comportar-se- como uma distribuio t10 (note-se que s 2Y -Y calculado com os mesmos graus
( )
de liberdade que s 2 = s 2 = DQMR).
A varincia dos erros de previso dada por:

X-X
1
Var Y - Y = 1 + +
N
S XX

s 2.

Para os dados do problema, a estimativa daquela varincia


2

1 (20 - 16 )
10.3 = 11.732 (ou s = 11.732 = 3.425 ).
s 2Y -Y = 1 +
+
(Y -Y )
( ) 12
298

Substituindo, resulta finalmente


45 - 43.152

P Y > 45 X = 20 = P t10 >


= P (t10 > 0.539) = 30.08% .

3.425

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.2
Alnea (i)
Apoio 1 (apenas o resultado)
Y = 270. (5) - 3.38 ( X - 2001) + E .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.2
Alnea (i)
Apoio 2 (sugesto)
O grfico (X, Y) sugere que a relao Y = f (X) pode ser aproximada por uma relao linear.
Estime os parmetros a e b e verifique se b 0 ou, melhor, se b < 0.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.2

Apoio 3 (resoluo completa)


Denote-se por X a varivel que representa o ano e por Y o volume de produo.
Nestas condies,

x = 2001
y = 270. (5)
s XX = 60
sYY = 1416. (2 )
s XY = -203 .

Na figura seguinte apresenta-se o grfico (X, Y) construdo a partir dos dados disponveis.
300

Ton . 10 3

ESTATSTICA

2. Edio

Alnea (i)

275

250

225
1997

Dashfer
Verlag
McGraw-Hill

1998

1999

2000

2001

2002

2003

2004

2005

CAPTULO 14

O grfico sugere que a relao Y = f (X) pode ser aproximada por uma relao linear, cujo
modelo descrito por:

Yn = a + b X n - X + En ,

com
IN (0, s 2 ) .

ESTATSTICA

2. Edio

En
No caso vertente,

a = a = y = 270. (5)
e

s
203
b = b = XY = = -3.38 .
s XX
60
Proceder-se- a um unilateral a uma vez que apenas admitir que Y decresce com X, ou seja,
que < 0 (deve assim usar-se o teste t em vez do teste ANOVA). As hipteses em apreo so

H0 : b = 0
H1 : b < 0 ,
e a estatstica de teste
ET =

B - b0
S
S XX

seguir uma distribuio t7 se H0 for verdadeira.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

O estimador de s dado por:

S=

SYY - B S XY
.
N -2

ESTATSTICA

2. Edio

Substituindo, obtm-se a estimativa

s=

1416 (2 ) + 3.38 ( -203)


sYY - b s XY
=
= 104.3 = 10.2.
n-2
7

Como

ET =

-3.38
= -2.567 < t7 (a = 0.95) = -1.8946 ,
10.2
60

a hiptese nula rejeitada com o valor de prova p = 1.85%.


Na figura seguinte ilustra-se este teste.
Rejeitar H0

ET = 2.567
t7 (0.95) = 1.895

Dashfer
Verlag
McGraw-Hill

No Rejeitar H0

ESTATSTICA

2. Edio

CAPTULO 14

A relao linear estimada ento


Y = 270 (5) - 3.38 ( X - 2001) + E ,
com

s E = 10.2 .
O coeficiente de determinao (estimado) :
2

2
rXY

Dashfer
Verlag
McGraw-Hill

b2 s XX ( -3.38) 60
=
=
= 0.484.
sYY
1416.2

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.2
Alnea (ii)
Apoio 1 (apenas o resultado)
45.9%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.2
Alnea (ii)
Apoio 2 (sugesto)
Para cada valor de X, a melhor previso de Y obtm-se recorrendo recta estimada. O erro, ,
que se comete na previso dado pela diferena d = Y - mY (ou d = Y - Y, j que Y = mY X ).
Procure estimar a varincia do erro de previso, uma vez que, para calcular a probabilidade
pretendida, dever padronizar a varivel Y.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.2

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Sejam Y05 e Y06 os volumes de produo de trigo em 2005 e 2006, respectivamente. Simbolicamente, a questo formula-se do seguinte modo:
P (Y06 > Y05 ) = ?
Em 2005 a produo foi, de facto, Y05 = 255. Para 2006, pode estimar-se (ou prever-se) o respectivo valor esperado mY x = 2006 (que, para simplificar, se denotar por Y06 ).
Assim,

Y06 - Y06

P (Y06 > 255) = P Y06 - Y06 > 255 - Y06 = P


>

Var Y06 - Y06

255 - Y06

Var Y06 - Y06

A varincia do denominador , afinal, a varincia do erro de previso:

X-X
1

Var Y06 - Y06 = 1 + +


N
S XX

s 2.

A sua estimativa
s 2Y

06 -Y06

1 (2006 - 2001)2
104.3 = 159.35
= 1 + +
60
9

(note-se que esta estimativa obtida com os mesmos graus de liberdade que s 2 = s 2 = DQMR ).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Por sua vez,


y06 = 270. (5) - 3.38 (2006 - 2001) = 253.655.
Substituindo, resulta finalmente

255 - Y06
255 - 253.655

= P (t7 > 0.106 ) = 45.9%.


P (Y06 > 255) = P
= t7 >
s Y -Y
159.35

( 06 06 )

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.2
Alnea (iii)
Apoio 1 (apenas o resultado)
41.12%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.2
Alnea (iii)
Apoio 2 (sugesto)
Considere o modelo de regresso linear simples

Yn = a + b X n - X + En .

Nestas condies, a previso de Yn

Yn = a + b X n - X .
Tente mostrar que

()

2
Var Yn2 - Yn1 = ( n2 - n1 ) Var b .

) (

Esta expresso necessria para estimar a varincia da varivel Yn2 - Yn1 - Yn2 - Yn1 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.2

ESTATSTICA

2. Edio

Alnea (iii)
Apoio 3 (resoluo completa)
O volume de produo de trigo em 2006 e 2007 denota-se por Y06 e Y07. Nestas condies, o
problema que colocado especifica-se do seguinte modo:
P (Y07 > Y06 ) = P (Y07 - Y06 ) > 0 = ?
As estimativas dos valores esperados (ou, previses) mY x = 2006 e mY x = 2007 denotar-se-o, respectivamente, por Y06 e Y07 . Registe-se ainda que, de acordo com os pressupostos do
modelo de regresso adoptado, se admite que as variveis Y06, Y07, Y06 e Y07 seguem distribuies
Normais.
Assim, a probabilidade P (Y07 - Y06 ) > 0 ser obtida a partir de:

(Y07 - Y06 ) - Y07 - Y06

P
>

Var (Y07 - Y06 ) - Y07 - Y06

0 - Y07 - Y06

Var (Y07 - Y06 ) - Y07 - Y06

O numerador do segundo membro desta expresso dado por


-Y07 + Y06 = Y06 - Y07 = a + b (2006 - 2001) - a + b (2007 - 2001) ,

ou seja
Y06 - Y07 = b (2006 - 2007) = -3.38 ( -1) = 3.38.

Resta agora calcular o denominador, Var (Y07 - Y06 ) - Y07 - Y06 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Ora,

Var (Y07 - Y06 ) - Y07 - Y06 = Var (Y07 - Y06 ) + Var Y07 - Y06 .

O primeiro termo, Var (Y07 - Y06 ) , pode ser estimado por s 2 + s 2 = 2 DQMR. O segundo
termo, Var Y07 - Y06 , estima-se a partir da expresso de Y07 - Y06 deduzida anteriormente.

ESTATSTICA

2. Edio

Assim,

2
Var Y07 - Y06 = Var b (2006 - 2007) = (2006 - 2007) Var (b ).

Ou seja,
s
Var Y07 - Y06 = 12
.
s XX

A estimativa de Var Y07 - Y06 ento


s 2

(Y

07 -Y06

DQMR

)= s
XX

DQMR 104.3
=
.
60
60

Substituindo, resulta

(Y07 - Y06 ) - Y07 - Y06

0 - 3.38

>
P
104.3
DQMR

2 104.3 +
DQMR + DQMR +
60
60

3.38
= P t7 >
1

10.2 2 +

60

Dashfer
Verlag
McGraw-Hill

= P (t7 > 0.233) = 41.12% .

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.3
Apoio 1 (apenas o resultado)
Ao nvel de significncia de 5%, pode afirmar-se que o IPC oficial subestima o IPC correcto.
Por outro lado, no h evidncia de que o IPC oficial cresa mais depressa (ou mais devagar) do
que o IPC correcto.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.3
Apoio 2 (sugesto)
Considere o modelo linear Yn = a + b X n - X + En . Se o IPC oficial estiver bem calculado,
ser a = Y e b = 1. Teste ambas as hipteses.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.3
Apoio 3 (resoluo completa)
Sejam,

Na Figura seguinte apresenta-se o grfico (X, Y) construdo a partir dos dados fornecidos.
160

IPC oficial

ESTATSTICA

2. Edio

X: IPC correcto.
Y: IPC oficial.

140

120

100
100

120

140

160

IPC correcto

Pela observao da figura, o modelo linear Yn = a + b X n - X + En parece perfeitamente


adequado.
Assim,

a = a = y = 130.3
e

s
1012.12
b = b = XY =
= 1.025 .
s XX
987.54

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Comece-se por testar a. Aquilo que se pretende verificar se a = Y . De facto assim ser se
o IPC oficial no subavaliar nem sobreavaliar o IPC correcto.

H 0 : a = y = 133.4
H1 : a 133.4 .

ESTATSTICA

2. Edio

A estatstica de teste

ET =

A -a
,
S
N

seguir uma distribuio t4 (tN2) se H0 for verdadeira.


Substituindo vem

ET =

A - 133.4
,
S
6

onde
S2 =

SYY - B S XY
.
N -2

Ora,
s2 =

1037.88 - 1.025 1012.12


= 0.1143 ,
4

pelo que resulta


ET =

Dashfer
Verlag
McGraw-Hill

130.3 - 133.4
0.1143
6

= -22.47 .

CAPTULO 14

Como
ET = 22.47 >> t4 (a = 0.025) = 2.776 .

ESTATSTICA

2. Edio

A hiptese nula rejeitada. Isto , o IPC oficial subestima o IPC correcto.


Teste-se agora o coeficiente angular da recta de regresso, b. Se o IPC oficial espelhar
devidamente o IPC correcto, a hiptese nula ser b = 1.
H0 : b = 1
H1 : b 1.

A estatstica de teste
ET =

B-b
,
S
S XX

seguir uma distribuio t4 (tN2) se H0 for verdadeira.


Substituindo, vem

ET =

1.025 - 1
= 2.074.
0.337
987.54

Como
ET = 2.074 < t4 (a = 0.025) = 2.776 ,
no se rejeita H0. Ou seja, ao nvel de significncia de 5%, no h evidncia de que o IPC oficial
cresa mais depressa (ou mais devagar) do que o IPC correcto.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.4
Alnea (i)
Apoio 1 (apenas o resultado)
O parmetro significativamente diferente de zero (valor de prova p 0). A recta estimada
y = 43 - 0.3 x .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.4
Alnea (i)
Apoio 2 (sugesto)
Efectue um teste ANOVA para verificar se 0.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.4
Alnea (i)
Apoio 3 (resoluo completa)
Sejam,

ESTATSTICA

2. Edio

X: densidade do trfego, expressa em nmero de veculos por quilmetro


Y: velocidade mdia dos veculos, expressa em km/hora.
Adopte-se um modelo de regresso linear simples:

Y = a + b X - X + E,

no qual se admite que os erros so IN (0, s 2 ) .


Nestas condies,
a = a = y = 25

e
s
1500
b = b = XY = = -0.3 .
s XX
5000

O procedimento do teste ANOVA tem a estrutura seguinte:

H0 : b = 0
H1 : b 0 ,
recorrendo estatstica de teste:
ET =

DQMDR
.
DQMR

Neste caso, se H0 for verdadeira ET seguir uma distribuio F1,18 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

ESTATSTICA

2. Edio

A tabela ANOVA correspondente apresentada seguidamente.


Fontes de variao

Variaes (V)

Devido regresso (DR)

0.3 2 5000
sYY

Total (T)

630

DQM

450

18

10

450

630  450 = 180

Residual (R)

GL

19

Como

ET =

DQMDR 450
=
= 45 >> F1,18 (a = 0.05) = 4.41,
DQMR
10

a hiptese nula H 0 ( b = 0 ) rejeitada ao nvel de significncia de 5% (com um valor de prova


quase nulo).
Nestas condies pode adoptar-se a recta estimada
y = a + b ( x - x ) = 25 - 0.3 ( x - 60 ) = 43 - 0.3 x .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.4
Alnea (ii)
Apoio 1 (apenas o resultado)

[15.13, 28.87] .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.4
Alnea (ii)
Apoio 2 (sugesto)
Para cada valor de X, a melhor previso de Y obtm-se recorrendo recta estimada. O erro que
se comete na previso, d, dado pela diferena d = Y - Y. Inicialmente procure estimar a varincia
do erro de previso para, em seguida, calcular o intervalo de previso pretendido.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.4
Alnea (ii)
Apoio 3 (resoluo completa)
Para X = 70, vem

ESTATSTICA

2. Edio

y = 43 - 0.3 x = 43 - 0.3 70 = 43 - 21 = 22 [km/hora].


Denote-se o erro de previso por d = Y - Y. De acordo com os pressupostos do modelo de
regresso linear, tanto Y como Y so variveis Normais (e independentes). Nestas condies, o
intervalo de confiana a (1 - a ) 100% para Y dado por
Y tGL (a = 0.025) sd ,

sendo a varincia dos erros de previso, Var d = Y - Y , calculada por:

X-X
1
Var (d ) = Var (Y ) + Var Y = 1 + +
N
S XX

()

s 2 .

O intervalo de previso a 95% ento

X-X
1
Y t18 (a = 0.025) s 1 + +
N
S XX

Substituindo,
22 2.1014 DQMR 1 +

1
100
+
20 5000

22 2.1014 3.162 1.0344


22 6.87 .

Finalmente, para uma densidade de trfego de 70 veculos por quilmetro, a velocidade


mdia situar-se- no intervalo [15.13, 28.87] (com 95% de confiana).

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.4
Alnea (iii)
Apoio 1 (apenas o resultado)
xop = 71.67 e s xop = 6.32 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.4
Alnea (iii)
Apoio 2 (sugesto)
Determine um ponto estacionrio de Z = X Y e verifique se o valor em causa corresponde a um
ponto ptimo.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.4
Alnea (iii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


O volume, V, de trfego do tnel (em veculos por hora) dado por V = X Y . Ento,

v = x y = x a + b ( x - x ) = a x + b x 2 - b x x .
O valor xop (densidade do trfego) que optimiza aquela funo obtido por:

dv
= a + 2 b x - b x = 0,
dx
xop =

b x - a x
a
60
25
= =
+
= 71.67.
2b
2 2 b 2 2 0.3

Este valor corresponde a um ponto ptimo, uma vez que

d2v
= 2b < 0.
dx 2
Estima-se em seguida o valor do desvio padro do estimador da densidade ptima, s xop . Ora,
a
x
a
Var xop = Var = Var
.
2 2 b
2 b

( )

Assim,

Dashfer
Verlag
McGraw-Hill

f ( a, b ) =

a
,
2b

df
1
=
da 2 b

df
-a
.
=
db 2 b2

CAPTULO 14

Do mesmo modo,
f

1
2
=
= 1.667 = 2.778
a ,b

(
.
)
2

0
3

ESTATSTICA

2. Edio

e
f

-25
=
= 19290.
a ,b
2 0.09

Admitindo que f ( a, b ) pode ser aproximada por uma relao linear, vem
a f

Var
2 b a

f
Var (a ) +
a ,b

Var (b ) .
a ,b

Como
var ( a ) =

s2
10
s 2 10
=
= 0.002 ,
=
= 0.5 e var (b ) =
s XX 5000
N
20

resulta

2
2.7782 0.5 + 192902 0.002 = 39.97 .
var
2 b
Finalmente,
a
s xop = Var
= 39.97 = 6.32 .
2 b

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.5
Alnea (i)
Apoio 1 (apenas o resultado)
A manuteno deve ser programada em funo do nmero de dias decorridos e no do nmero
de horas de voo.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.5
Alnea (i)
Apoio 2 (sugesto)
Para anlise do modelo de regresso linear mltipla, recorra ao mtodo progressivo (ou forward)
para a seleco das variveis independentes (regressores).

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.5

ESTATSTICA

2. Edio

Alnea (i)
Apoio 3 (resoluo completa)
Na anlise do modelo de regresso linear mltipla, recorrer-se- ao mtodo progressivo (ou
forward) para a seleco das variveis independentes (regressores). Este mtodo envolver os
seguintes passos:
(i) Ajustar dois modelos de regresso linear simples (um para cada um dos regressores, X1 e X2).
O regressor que, isoladamente, explicar a maior proporo significativa da varivel
dependente (Y), ser includo no modelo.
(ii) Construir um modelo de regresso linear dupla que associe, como variveis independentes,
o regressor seleccionado no passo (i) e o outro regressor potencial ainda no includo.
Se este segundo regressor potencial no explicar uma proporo adicional significativa
ser excludo do modelo. Neste caso, o modelo proposto ser o modelo de regresso linear
simples seleccionado no passo anterior.
Passo (i)
Inicie-se este procedimento avaliando o modelo de regresso linear simples para a varivel
independente X1:

Y = a + b X1 - X1 + E ,
com
a = a = y = 2

e
sX Y
120
b = b = 1 =
= 0.08.
s X1 X1 1500

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

O procedimento do teste ANOVA tem a estrutura seguinte:

H0 : b = 0
H1 : b 0 .

ESTATSTICA

2. Edio

A estatstica de teste

ET =

DQMDR
DQMR

seguir uma distribuio F1, 18 se H0 for verdadeira.


A tabela ANOVA correspondente

Fontes de variao

Variaes (V)

Devido regresso (X1)

0.08 120

Residual (X1)

9.6

30.0  9.6 = 20.4


sYY

Total

30.0

GL

DQM

9.6

18

1.133

19

Como
9.6
DQMDR
=
= 8.47 > F1,18 (a = 0.05) = 4.41
1.133
DQMR

a hiptese nula H 0 ( b = 0 ) rejeitada.


Constri-se de seguida o modelo de regresso linear simples Y = f ( X 2 ) . Seja,

Y = a + b 2 X2 - X2 + E .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Assim,

a = a = y = 2
e
sX Y
60
b = b = 2 =
= 0.2.
s X2 X2 300

ESTATSTICA

2. Edio

Neste caso, a tabela ANOVA


Fontes de variao

Variaes (V)

GL

DQM

Devido regresso (X2)

0.2 60 12.0

12.0

30.0  12.0 = 18.0

18

1.0

Residual (X2)

sYY

Total

30.0

19

Como

DQMDR 12.0
=
= 12.0 > F1,18 (a = 0.05) = 4.41
1.0
DQMR
a hiptese nula H 0 ( b = 0 ) deve ser rejeitada.
Passo (ii)
Embora ambos os modelos expliquem uma proporo significativa da variao total, a proporo
explicada maior no segundo. Assim, a varivel X2 passa a estar includa no modelo, havendo
que determinar se h vantagem ou no em acrescentar-lhe X1. Verifique-se ento o modelo de
regresso linear dupla Y = f ( X1 , X 2 ) :

Y = a + b1 X1 - X1 + b 2 X 2 - X 2 + E ,

com
a = a = y = 2 .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

As estimativas b1 = b1 e b2 = b2 so obtidas resolvendo o sistema de equaes


b1 s X1 X1 + b2 s X1 X2 = s X1Y

b1 s X2 X1 + b2 s X2 X2 = s X2Y
Substituindo,

ESTATSTICA

2. Edio

1500 b1 + 500 b2 = 120 1500 b1 + 500 b2 = 120

500 b1 + 300 b2 = 60
-1500 b1 - 900 b2 = -180
- 400 b2 = -60 b2 =

60
= 0.15
400

-1500 b1 + 500 0.15 = 120 b1 =

45
= 0.03.
1500

A tabela ANOVA para modelo de regresso linear dupla ento:


Variaes (V)

GL

0.03 120  0.15 60 12.6

Fontes de variao
Devido regresso (X2, X1)

DR X 2

DR X1 X 2

Residual (X2, X2)

(12.0)

(1)

(12.6 12.0 = 0.6)

(1)

30.0  12.6 = 17.4

17

sYY

19

Total

DQM

30.0

Como,

DQMDR X1 X 2
DQMR

)=

0.6
= 0.586 < F1,17 (a = 0.05) = 4.45
1.023

a hiptese nula H 0 ( b1 = 0 ) no rejeitada.

Dashfer
Verlag
McGraw-Hill

0.6
1.023

ESTATSTICA

2. Edio

CAPTULO 14

Assim, ao nvel de significncia de 5%, concluiu-se que no valer a pena incluir a varivel X1
no modelo de regresso. Neste caso, Y ser funo apenas do nmero de dias. Consequentemente,
a manuteno deve ser programada em funo do nmero de dias decorridos e no do nmero
de horas de voo.
Finalmente, o modelo sugerido o seguinte:

Y = a + b X2 - X2 + E ,

com

a = a = y = 2
e

sX Y
60
b = b = 2 =
= 0.2.
s X2 X2 300
Nestas condies resulta x2 = 10 e s 2 = s 2 = 1.0.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.5
Alnea (ii)
Apoio 1 (apenas o resultado)
3.82%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.5
Alnea (ii)
Apoio 2 (sugesto)
Para cada valor de X, a melhor previso de Y obtm-se recorrendo recta estimada. O erro que
se comete na previso, d, dado pela diferena d = Y - Y . Inicialmente procure estimar a varincia
do erro de previso para, em seguida, calcular o intervalo de previso pretendido.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.5

ESTATSTICA

2. Edio

Alnea (ii)
Apoio 3 (resoluo completa)
Faa-se x = 15 (valor que corresponde a regular o aparelho logo que decorrerem 15 dias aps a
interveno anterior). Neste caso,
y = 2 + 0.2 (15 - 10 ) = 3 .
Padronizando a varivel d = Y - Y vem,

Y - Y

X2 - X2
1
S 1+ +
N
S X2 X2

que, atendendo Normalidade de d = Y - Y seguir uma distribuio t18 (note-se que 18


corresponde ao nmero de graus de liberdade utilizado no clculo de s 2 = s 2 = DQMR).
Substituindo,
Y -3
1 1 +

Ora,

1
25
+
20 300

Y -3
.
1.065

5-3
Y -3

P (Y > 5) = P
= t18 >
= 1.88
1.065

1.065
ou, finalmente
P (Y > 5) = 0.0382 .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.6
Apoio 1 (apenas o resultado)
Sem catalisador: r0 = 75.75 + 1.482 (t - 24.25)
Com catalisador: r1 = 81.75 + 2.465 (t - 24.75) .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.6
Apoio 2 (sugesto)
Dever testar se a diferena dos coeficientes angulares de dois modelos independentes um
para os rendimentos sem presena do catalisador e outro para os rendimentos na presena de
catalisador ou no significativa. Se no o for, a presena ou no do catalisador no processo
qumico um factor qualitativo que pode ser representado por uma varivel muda (do tipo 0
ou 1).

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.6

Rendimento [%]

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Na Figura seguinte representa-se a varivel R (rendimento do processo qumico) em funo da
temperatura de reaco (varivel T), apresentando as duas rectas ajustadas para as situaes em
que o catalisador est e no est presente.
100
Com catalisador

90

Sem catalisador
80

70

60
15

20

25

30

Temperatura [C]

O grfico sugere que a presena do catalisador pode contribuir para o aumento do efeito da
temperatura sobre o rendimento.
Em primeiro lugar estima-se o modelo de regresso linear simples, que modela a varivel R
em funo de T, quando na reaco no est presente o catalisador. Nestas condies, obtm-se
os seguintes resultados:

t = 24.25

r = 75.75

sTR = 72.25

sTT = 48.75

a0 = 75.75

Dashfer
Verlag
McGraw-Hill

sRR = 112.75

CAPTULO 14

b0 =

72.25
= 1.482 .
48.75

Repete-se o exerccio utilizando os resultados das situaes em que o catalisador est presente:

ESTATSTICA

2. Edio

b1 =

80.75
= 2.465
32.75

r = 81.75

sTR = 80.75

sTT = 32.75

sRR = 200.75

a1 = 81.75

b1 =

80.75
= 2.465 .
32.75

Admitindo que s 2 = s 02 = s 12 , a varincia comum s 2 pode ser estimada recorrendo


expresso
S2 =

1
( N 0 - 2 ) S02 + ( N1 - 2 ) S12 ,
N 0 + N1 - 4

onde
S02 = s 02 =

e
S12 = s12 =

N0 - 2

N1 - 2

2
0n

n
2
1n .

Fazendo os clculos,
s02 = (112.75 - 1.482 72.25) 2 = 2.836,
e

s12 = (200.75 - 2.465 80.75) 2 = 0.824

s2 =

Dashfer
Verlag
McGraw-Hill

1
(2 2.836 + 2 0.824 ) = 1.830 = 1.3532.
4

CAPTULO 14

Para testar se a diferena entre 0 e 1 significativa, recorre-se a um teste unilateral com a


estrutura seguinte:

H 0 : b 0 = b1
H1 : b 0 < b1

ESTATSTICA

2. Edio

A estatstica de teste
B1 - B0

ET =
S

1
2 + S2
STT
TT1
0

segue uma distribuio t( N0 + N1 - 4) (no caso em anlise, t4 ), se H0 for verdadeira.


Como
ET =

2.465 - 1.482
1
1.353
48.75 + 32.75

= 59.21 >> t4 (0.025) = 2.776

a hiptese nula rejeitada (com um valor de prova praticamente nulo).


Nestas condies, devem considerar-se dois modelos independentes:
g

um para os rendimentos sem catalisador, cuja relao estimada por


r0 = 75.75 + 1.482 (t - 24.25)
outro para os rendimentos na presena do catalisador, cuja relao estimada por
r1 = 81.75 + 2.465 (t - 24.75) .

Note-se que se H0 no tivesse sido rejeitada, poderia fazer sentido adoptar um modelo de
regresso nico com dois regressores: a varivel T (temperatura) e a varivel muda Z, que tomaria
os seguintes valores:
0, se o catalisador no estiver presente
Z :
contrrio
rio
o
1, caso contr

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.7
Apoio 1 (apenas o resultado)
Previso pontual: 101 936
Intervalo de previso: [73 203, 141 917].

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.7
Apoio 2 (sugesto)
Pela anlise do grfico que representa o volume de vendas em funo do trimestre, aceita-se que
a relao possa apresentar um padro de curva S. Esta relao pode ser linearizada
recorrendo-se, simultaneamente, transformao inversa da varivel independente e transformao logartmica da varivel dependente.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.7

VV (volume de vendas)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Na figura seguinte representa-se graficamente o volume de vendas em funo do trimestre.
120000
90000

60000

30000

0
0

10

t [trimestre]

O grfico sugere que a relao VV = f (t ) apresenta um padro de curva S, ou seja uma


relao do tipo:
VVn = ea + b / tn + En (com a > 0 e b < 0).

Esta relao pode ser linearizada recorrendo-se, simultaneamente, transformao inversa


da varivel independente e transformao logartmica da varivel dependente:
X = 1/ t

Y = ln (VV ) .

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

ESTATSTICA

2. Edio

Na tabela seguinte apresentam-se os clculos correspondentes, efectuados a partir dos dados


fornecidos.

vv

x = 1/t

y = ln(vv)

1 206

1.000

7.0953

11 356

0.500

9.3375

36 888

0.333

10.5156

39 636

0.250

10.5875

53 887

0.200

10.8946

77 806

0.167

11.2620

91 627

0.143

11.4255

80 147

0.125

11.2916

89 646

0.111

11.4036

10

101 677

0.100

11.5295

O modelo linearizado ento

Yn = a + b X n - X + En ,
admitindo-se que os erros En so independentes e Normais, com mdia zero e varincia 2.
Para este modelo obtm-se as seguintes estatsticas:

Dashfer
Verlag
McGraw-Hill

x = 0.2929

y = 10.5343

s XX = 0.6919

sYY = 17.0355

s XY = -3.4188 .

CAPTULO 14

Na figura seguinte representam-se graficamente as observaes do modelo linearizado.


12

10

ESTATSTICA

2. Edio

Y
8

6
0

0.2

0.4

0.6

0.8

Por observao desta figura, pode afirmar-se que o modelo obtido por transformao de
variveis parece ser efectivamente linear. Nesse caso:

a = a = y = 10.5343
e

s
3.4188
b = b = XY = = - 4.9412 .
s XX
0.6919
A tabela ANOVA correspondente :

Fontes de variao
Devido regresso (DR)
Residual (R)
Total (T)

Dashfer
Verlag
McGraw-Hill

Variaes (V)

4.9412 3.4188
17.036  16.893
sYY

17.036

16.893

0.143

GL

DQM

16.893

0.0178

CAPTULO 14

O procedimento do teste ANOVA tem a estrutura seguinte:

H0 : b = 0
H1 : b 0 .

ESTATSTICA

2. Edio

A estatstica de teste

ET =

DQMDR
DQMR

seguir uma distribuio F1, 8 , se H0 for verdadeira.


Como
ET =

DQMDR 16.893
=
= 949 > F1,8 (a = 0.05) = 5.32
DQMR
0.0178

a hiptese nula rejeitada.


Para t = 11 (ou seja, para x = 1/11 = 0.0909), o intervalo de previso de Y a 95%, centrado na
estimativa pontual
y = 10.534 - 4.941 (0.0909 - 0.2929) = 11.5321,
:

X-X
1
Y t8 (a = 0.025) S 1 + +
N
S XX

Como

s 2 = DQMR = 0.0178 s = 0.1334 ,

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

vem

11.5321 2.306 0.1334 1 +

1 (0.0909 - 0.2929)
+
10
0.6919

11.5321 0.3312 ,

[11.201, 11.863].
Calcule-se agora o valor previsto para o volume de vendas no trimestre 11 (vv11). A previso
pontual :
vv11 = e11.5321 = 101 936.

Por sua vez, o intervalo de previso a 95% resulta:

[e11.201 , e11.863 ] [73 203, 141 917].


Na figura seguinte representam-se graficamente estes resultados.
VV [volume de vendas]

ESTATSTICA

2. Edio

pelo que o intervalo pretendido para Y x = 11

Previso pontual

120000

Intervalo de previso a 95%


90000

60000
30000
0
0

t [trimestre]

Dashfer
Verlag
McGraw-Hill

10

12

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.8
Alnea (i)
Apoio 1 (apenas o resultado)
p = e -0.010 - 0.157I .

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.8
Alnea (i)
Apoio 2 (sugesto)
Pela anlise do grfico p = f ( I ) verifica-se que esta relao apresenta um padro exponencial.
Esta relao pode ser linearizada recorrendo-se transformao logartmica da varivel
dependente.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.8
Alnea (i)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


Na figura seguinte representam-se graficamente os dados relativos varivel

p=

PVU
PVN

Em funo da idade do veculo em anos (I).


0.8

p
0.6

0.4

0.2

0
0

10

I [anos]

O grfico sugere que a relao p = f ( I ) apresenta um padro exponencial, cujo modelo


dado por

pn = ea + b I n + En (com a > 0 e b < 0).

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Esta relao pode ser linearizada recorrendo-se transformao logartmica da varivel


dependente:
Y = ln ( p ) .

ESTATSTICA

2. Edio

Na tabela seguinte apresentam-se os dados amostrais transformados.

y = ln p

1
2
3
4
5
6
7
8
9

0.843
0.753
0.580
0.520
0.452
0.414
0.346
0.264
0.241

0.171
0.284
0.545
0.654
0.794
0.882
1.061
1.332
1.423

O modelo linearizado ento

Yn = a + b I n - I + En

admitindo-se que os erros En so independentes e Normais, com mdia zero e varincia 2.


Para este modelo obtm-se as seguintes estatsticas:

Dashfer
Verlag
McGraw-Hill

i =5

y = -0.794

sII = 60

sIY = -9.414

sYY = 1.495

CAPTULO 14

Na figura seguinte representam-se graficamente as observaes do modelo linearizado.

Y
-0.5

ESTATSTICA

2. Edio

-1

-1.5
0

10

Por observao desta figura, pode afirmar-se que o modelo obtido por transformao de
variveis parece ser efectivamente linear. Assim,

a = a = y = -0.794
e

s
-9.414
b = b = IY = = -0.157.
sII
60
A tabela ANOVA correspondente :
Variaes (V)

GL

DQM

Devido regresso (DR)

1.478

1.478

Residual (R)

0.017

0.00243

Fontes de variao

Total (T)

Dashfer
Verlag
McGraw-Hill

sYY

1.495

CAPTULO 14

O procedimento do teste ANOVA tem a estrutura seguinte:


H0 : b = 0
H1 : b 0 .

ESTATSTICA

2. Edio

A estatstica de teste

ET =

DQMDR
DQMR

seguir uma distribuio F1, 7 , se H0 for verdadeira.


Como
1.478
DQMDR
=
= 608.23 > F1, 7 (a = 0.05) = 5.59
0.00243
DQMR

a hiptese nula rejeitada, com valor de prova quase nulo.


A relao estimada ser ento
Y = ln p = -0.794 - 0.157 ( I - 5) .

Por uma questo de precauo, proceder-se- verificao da validade desta relao. Seja
I = 0. Nesta situao o PVU (preo do veculo usado) e o PVN (preo do veculo novo) devem
ser praticamente iguais, pelo que p dever tomar um valor muito prximo da unidade. Ora,
Y = -0.794 + 0.784 = -0.010

p = e -0.01 = 0.99 1 .

Considera-se assim verificada a relao linear estimada. Consequentemente,


p = e -0.794 - 0.157( I - 5)

ou, finalmente, a funo que melhor traduz a relao entre p e I :

p = e -0.010 - 0.157I.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.8
Alnea (ii)
Apoio 1 (apenas o resultado)
19.0%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

CAPTULO 14

Problema 14.8
Alnea (ii)
Apoio 2 (sugesto)
Para cada valor de I, a melhor previso de Y = ln p obtm-se recorrendo recta estimada. O erro
que se comete na previso dado pela diferena d = Y - Y. Inicialmente procure estimar a varincia
do erro de previso para, em seguida, calcular o intervalo de previso pretendido.

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

Problema 14.8
Alnea (ii)

ESTATSTICA

2. Edio

Apoio 3 (resoluo completa)


A probabilidade de p ultrapassar 0.65
P ( p > 0.65) = P Y = ln p > ln (0.65) .

Ou seja, o que se pretende determinar o valor de


P (Y > -0.431) .
Tomando a varivel d = Y - Y , vem:

Y - Y
P

I -I
S 1+ 1 +

N
SII

-0.431 - Y

>

I -I
1
S 1+ +
N
SII

Recorde-se que, de acordo com os pressupostos do modelo de regresso, tanto Y como Y


sero Normais. Nestas condies, a varivel

- 0.431 - y =

I -I
1
S 1+ +
N
SII

Dashfer
Verlag
McGraw-Hill

CAPTULO 14

seguir uma distribuio tN2. Trata-se ento de calcular

ESTATSTICA

2. Edio

-0.431 - y =
P tN -2 >

I -I
1

S 1+ +

N
SII

para um veculo com 3 anos de idade (ou seja, para I = 3). Nessas condies, vem:
y = -0.794 - 0.157 (3 - 5) = -0.480.
Por sua vez,
s 2 = DQMR = 0.00243 (ou s = 0.0483).
Assim, substituindo, resulta

-0.431 + 0.480
P ( p > 0.65) = P t7 >
= 0.935

0.0483 1 + 1 / 9 + 4 / 60
e
P (t7 > 0.935) = 19.04%.

Dashfer
Verlag
McGraw-Hill

ESTATSTICA

2. Edio

FORMULRIO

Formulrio

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Captulo 2 Estatstica Descritiva


Estatsticas de localizao
Estatsticas de disperso

ESTATSTICA

2. Edio

Estatsticas de localizao
Estatsticas de disperso
Outras estatsticas

Captulo 3 Teoria Elementar da Probabilidade


Definio clssica de probabilidade
Definio axiomtica de probabilidade
Probabilidade de A e B
Probabilidade de A ou B
Teorema de Bayes
Anlise Combinatria
Permutaes de n elementos
Arranjos de n elementos distintos tomados k a k
Combinaes de n elementos distintos tomados k a k

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Captulo 4 Variveis Aleatrias.


Distribuies de Probabilidade
Variveis aleatrias

ESTATSTICA

2. Edio

Representao de populaes atravs das funes de probabilidade


Parmetros das funes de probabilidade de variveis aleatrias
Parmetros de localizao
Parmetros de disperso
Outros parmetros
Transformaes lineares de variveis
Transformaes no lineares de variveis

Captulo 5 Distribuies Conjuntas de Probabilidade


Definio de distribuies conjuntas, marginais e condicionais
Independncia entre variveis
Covarincia e correlao
Combinao linear de variveis
Combinao no linear de variveis

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Captulo 6 Caracterizao de Algumas


Distribuies Discretas Univariadas

ESTATSTICA

2. Edio

Distribuio Binomial
Distribuio Binomial Negativa
Distribuio Hipergeomtrica
Distribuio de Poisson

Captulo 7 Caracterizao de Algumas


Distribuies Contnuas Univariadas
Distribuio Uniforme
Distribuio Exponencial Negativa
Distribuio Normal
Distribuio Normal Padronizada
Aproximao da distribuio Binomial pela distribuio de Poisson
Aproximao da distribuio Binomial pela distribuio Normal

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Aproximao da distribuio de Poisson pela Normal


Distribuio Lognormal
Distribuio do Qui-Quadrado

ESTATSTICA

2. Edio

Distribuio t de Student
Distribuio F

Captulo 8 Amostragem aleatria.


Distribuies por amostragem
Parmetros da distribuio da mdia amostral (X)
Forma da distribuio da mdia amostral (X)
Enunciado do teorema do limite central
Aproximao da distribuio Binomial pela distribuio Normal
Aproximao da distribuio Hipergeomtrica pela distribuio Normal
Aproximao da distribuio

Dashfer
Verlag
McGraw-Hill

2
c GL

pela distribuio Normal

FORMULRIO

Captulo 9 Estimao Pontual


Propriedades desejveis dos estimadores pontuais
Mtodos de estimao

ESTATSTICA

2. Edio

Mtodo dos momentos


Mtodo da mxima verosimilhana
Mtodo de estimao linear com varincia mnima
Mtodo dos mnimos quadrados

Captulo 10 Estimao por Intervalo


Intervalo de confiana para o Valor Esperado (m)
Intervalo de confiana para a Proporo Binomial (p)
Intervalo de confiana para a varincia de uma populao Normal (s 2)
Intervalo de confiana para a diferena de valores esperados
de duas populaes ( m A - mB )
Intervalo de confiana para a diferena entre Propores Binomiais (pA pB)
Intervalo de confiana para a razo entre varincias de duas populaes
Normais (s A2 /s B2 )

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Captulo 11 Testes de Hipteses (paramtricos)


Testes disperso e localizao

ESTATSTICA

2. Edio

Definio dos valores crticos dos testes


Teste ao Valor Esperado de uma populao
Teste Varincia de uma populao Normal
Teste Proporo Binomial (amostra de grande dimenso)
Teste Diferena entre Valores Esperados de duas populaes
(Amostras Independentes)
Teste Diferena entre Valores Esperados de duas populaes
(Amostras Emparelhadas)
Teste razo de Varincias de duas populaes Normais
Teste Diferena entre Duas Propores Binomiais
(amostras de grande dimenso)

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Captulo 12 Testes No-Paramtricos


Testes de Qualidade de Ajuste, de Localizao, de Aleatoriedade e de Associao
Testes para uma amostra

ESTATSTICA

2. Edio

Testes de qualidade do ajuste


Testes de localizao
Testes de aleatoriedade
Testes para duas amostras independentes
Testes de qualidade do ajuste
Testes de localizao (amostras independentes)
Testes de localizao para duas amostras emparelhadas
Teste do Sinal
Teste de Wilcoxon
Outros testes para duas amostras
Testes de associao

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Captulo 13 Anlise de Varincia


Modelo com um factor de efeitos fixos
Modelo com um factor de efeitos variveis

ESTATSTICA

2. Edio

Modelo com dois factores de efeitos fixos com interaco


Modelo com dois factores de efeitos variveis com interaco
Modelo aditivo com dois factores de efeitos fixos
com uma observao por clula
Modelo aditivo com dois factores de efeitos variveis
com uma observao por clula
Teste de Kruskal-Wallis
Teste de Bartlett

Captulo 14 Regresso
Modelo de Regresso Linear Simples
Estimativas de a e b
Previses com base no modelo de regresso linear simples
Correlao entre variveis

Dashfer
Verlag
McGraw-Hill

FORMULRIO

Modelo de Regresso Linear Mltipla


Estimativa de a
Estimativas de b j
Correlao entre variveis
Regresso com Variveis Mudas
Regresso no linear

ESTATSTICA

2. Edio

Previses com base no modelo de regresso linear mltipla

Dashfer
Verlag
McGraw-Hill

Captulo 2

Estatstica Descritiva

Estatsticas de localizao

Dados no agrupados

Dados discretos agrupados

Mdia amostral ( x )

K
1 N
x = f k xk
xn
N n =1
k =1
N: nmero de dados da amostra; K: nmero de clulas.
x n : valor de cada um dos dados f : frequncia relativa (Nk /N) de
k
amostrais, n = 1,..., N .
cada valor observado xk .

Mediana amostral (Med)


(ou percentil 50 ou
segundo quartil)

Considere-se que os dados da amostra so colocados po r o rdem


crescente dos seus valores, formando um vector ( x1* , x*2 , x3* ,..., x *N ) .
- Se o nmero de dados que constituem a amostra (N) for mpar, a
mediana t oma o valor do dado que n aquele vector ocupa a
posio central: ( Med = x(*N +1) 2 ) .

x=

Moda (Mod)

McGraw-Hill

Se o nmero de dados for par, a mediana toma o valor mdio dos


dois t ermos cujas localizaes no vector mais se aproximam da
x *N 2 + x(*N 2) + 1
posio central: ( Med =
).
2

A moda o valor dos dados que ocorre com mais frequncia


(se existirem 2 o u mais valores adjacentes para os quais a frequncia
seja mxima, a moda ser a mdia desses valores).
Verlag Dashfer

Estatsticas de disperso

Dados no agrupados

Dados discretos agrupados

Amplitude da amostra (A)

Diferena entre o valor mximo e o valor mnimo dos dados.

Intervalo Interquartis (IIQ)

Intervalo cujos extremos so o primeiro quartil (ou percentil 25) e o


terceiro quartil (ou percentil 75).

Desvio absoluto mdio


amostral (DAM)

1 N
DAM =
xn x
N n =1

Desvio quadrtico mdio


amostral (DQM)

DQM =

Varincia amostral (s2)

Desvio padro amostral (s)

McGraw-Hill

Verlag Dashfer

1 N
( xn x ) 2
N n=1

DAM =

f
k =1

xk x

DQM = f k ( x k x ) 2
k =1

s2 =

N
1
( xn x ) 2
N 1 n =1

s2 =

K
N
f k ( xk x ) 2
N 1 k =1

s=

N
1
( xn x ) 2
N 1 n =1

s=

K
N
f k ( xk x ) 2
N 1 k =1

Estatsticas de localizao

Dados contnuos agrupados


Mdia amostral ( x )

f k M k , M k : ponto central da clula k.

k =1

Mediana amostral (Med)


(ou percentil 50 ou segundo quartil)

famed
: frequncia relativa acumulada correspondente clula que
precede a clula mediana;
f med : frequncia relativa (no acumulada) correspondente clula
mediana;
med : amplitude da clula mediana.
d1
Mod = LI +

d1 + d 2
(onde LI o limite inferior da clula modal (i.e., da clula com
maior frequncia relativa);
d1 : diferena entre a frequncia relativa da clula modal e a
frequncia relativa da clula precedente;
d 2 : diferena entre a frequncia relativa da clula modal e a
frequncia relativa da clula seguinte;
: amplitude da clula modal.

Moda (Mod)

McGraw-Hill

0.5 famed
Med LI med +
med
f med
LI med : limite inferior da clula mediana (i.e., da clula para a qual a
frequncia acumulada passam de um valor inferior a 0.5 para
um valor superior a 0.5);

Verlag Dashfer

Estatsticas de disperso

Dados contnuos agrupados


Amplitude da amostra (A)

Diferena entre o ponto central da clula com o valor mximo e o ponto central
da clula com o valor mnimo.

Intervalo Interquartis (IIQ)

Intervalo cujos extremos so o primeiro quartil (ou percentil 25) e o terceiro


quartil (ou percentil 75).
0.25 fa1 Q
1 Q
Primeiro quartil = LI1 Q +
f1 Q
Terceiro quartil = LI 3 Q +

0.75 fa3 Q
f 3 Q

3 Q

LI1Q ( LI 3 Q ): limite inferior da clula correspondente ao 1 quartil (3quartil),


i.e., da clula onde as frequncias acumuladas passam de um
valor inferior a 0.25 (0.75) para um valor superior a 0.25 (0.75);

fa1Q ( fa3Q ): frequncia relativa acumulada correspondente clula que


precede a clula correspondente ao 1 quartil (3 quartil);
f1Q ( f 3Q ): frequncia relativa (no acumulada) correspondente clula do 1
quartil (3 quartil);
(

):
amplitude
da clula do 1 quartil (3 quartil)
1 Q
3 Q

McGraw-Hill

Verlag Dashfer

Estatsticas de disperso (continuao)


Dados contnuos agrupados
Desvio absoluto mdio
amostral (DAM)

DAM =

Desvio quadrtico mdio


amostral (DQM)

DQM =

Varincia amostral (s2)

Desvio padro amostral (s)

McGraw-Hill

f
k =1

f
k =1

Mk x

(M k x) 2

s2 =

K
N
f k (M k x ) 2
N 1 k =1

s=

K
N
f k (M k x ) 2
N 1 k =1

Verlag Dashfer

Outras estatsticas
Dados discretos
agrupados

Dados no agrupados
Momento ordinrio
de ordem i ( mi )

K
1 N
mi = f k ( x k ) i
( xn ) i
N n =1
k =1
(i = 1,2,)
(i = 1,2,)
N
K
Momento centrado de
1
mi =
( xn x ) i
mi = f k ( x k x ) i
ordem i (mi)
N n =1
k =1
(i = 1,2,)
(i = 1,2,)
Medida da assimetria
N2
(k3)
k3 =
m3
(grande populao;
( N 1) ( N 2)

mi =

Dados contnuos
agrupados
mi =

mi =

g1 =

k3
s3

k4 =

N2
( N + 1) m4 3 ( N 1) m22
( N 1) ( N 2) ( N 3)

g2 =

k4
s4

(grande populao;
amostra limitada)

Coeficiente de
kurtose amostral (g2)

McGraw-Hill

Verlag Dashfer

f
k =1

(M k ) i

(i = 1,2,)

f
k =1

(M k x ) i

(i = 1,2,)

amostra limitada)

Coeficiente de
assimetria amostral
(g1)
Medida de kurtose
(k4)

Captulo 3

Teoria Elementar da Probabilidade

Definio clssica de probabilidade


Considere-se uma experincia a leatria com N resultados possveis mutuamente exclusivos e igualmente
provveis.
A probabilidade de um acontecimento A a razo entre o nmero de resultados favorveis ocorrncia de A
(NA N) e o nmero de resultados possveis associados experincia aleatria (N).
P(A) =

NA
N

Definio axiomtica de probabilidade

Axioma 1: A p robabilidade de u m qualquer acontecimento A, subconjunto do espao amostral S,


satisfaz a condio:
0 P(A) 1
Axioma 2: A probabilidade associada ao acontecimento certo (S) :
P(S)=1

Axioma 3: Para dois acontecimentos mutuamente exclusivos A e B, ento:


P(A B) = P(A) + P(B)

McGraw-Hill

Verlag Dashfer

Probabilidade de A e B
Acontecimentos independentes:

P(A B) = P(A) P(B)

Acontecimentos dependentes:

P (A B) = P(A) P (B A)

[ P (B A) : probabilidade condicional (probabilidade de ocorrncia de B quando se admite que A ocorreu)]

Probabilidade de A ou B
Acontecimentos mutuamente exclusivos:

P(A B) = P(A) + P(B)

Acontecimentos no mutuamente exclusivos:

P(A B) = P(A) + P(B) P(A B)

McGraw-Hill

Verlag Dashfer

Teorema de Bayes
(Para acontecimentos mutuamente exclusivos e dependentes)
Seja An, (n = 1, , N) um conjunto de a contecimentos mutuamente exclusivos preenchendo
exaustivamente o espao amostral e B um acontecimento qualquer. A probabilidade posteriori de cada um
dos acontecimentos An dada pela expresso seguinte:

P(An B) =

McGraw-Hill

Verlag Dashfer

P(B | A n ) P(A n )
P(B | A1 ) P(A1 ) + ... + P(B | A N ) P(A N )

Anlise Combinatria
Permutaes de n elementos
Agrupamentos formados por n elementos que di ferem un s dos o utros ape nas pela ordem pela q ual tais
elementos esto dispostos.
Pn = n! = n (n 1) ... 3 2 1
Exemplo: Permutaes dos nmeros 4, 5 e 6:
4 5 6
4 6 5
5 4 6
= P3 = 3!= 3 2 1 = 6
5 6 4
6 4 5

6 5 4

McGraw-Hill

Verlag Dashfer

Arranjos de n elementos distintos tomados k a k:


Agrupamentos constitudos por k d os n elementos qu e d iferem un s dos o utros quer pelos elementos que
neles figuram, quer pela ordem pela qual esto dispostos.

Akn =

n!
= n (n 1) ... (n k + 1)
(n k )!

Exemplo: Arranjos dos nmeros 4, 5 e 6, tomados 2 a 2:


4 5
5 4
4 6
3!
3 2 1
3
=
=6
= A2 =
6 4
(3 2)!
1!
5 6

6 5

McGraw-Hill

Verlag Dashfer

Combinaes de n elementos distintos tomados k a k:


Agrupamentos constitudos por k dos n elementos que diferem uns dos outros apenas pelos elementos que
neles figuram, independentemente da ordem pela qual esto dispostos.
n
n!
C kn = =
k (n k )!k!
Exemplo: Combinaes dos nmeros 4, 5 e 6, tomados 2 a 2:
4 5
3!
3 2 1

4 6 = C 23 =
=
=3
(3 2)!2!
1!2!

5 6

McGraw-Hill

Verlag Dashfer

Captulo 4

Variveis Aleatrias. Distribuies de


Probabilidade

Variveis aleatrias
Varivel Aleatria: Uma v arivel aleatria utiliza-se para expressar os resultados de uma experincia
aleatria.
Espao Amostral: Conjunto de todos os resultados possveis de uma experincia aleatria.

McGraw-Hill

Verlag Dashfer

Representao de populaes atravs das funes de probabilidade


Seja Y uma varivel aleatria discreta:
A funo de probabilidade da varivel Y, que se den ota po r p(y), a f uno que a ssocia a cada val or
particular que a varivel pode tomar (y) a probabilidade de Y ser igual a y:
p(y) = Probabilidade (Y = y).
A funo de distribuio (ou funo de probabilidade acumulada) da varivel Y, que se deno ta por F(y), a
funo que associa a cada valor particular que a varivel pode tomar (y) a probabilidade de Y ser menor ou
igual a y:
F(y) = Probabilidade (Y

y).

Seja X uma varivel aleatria contnua:


A probabilidade de a varivel X tomar um valor situado dentro de um intervalo finito [a, b] obtm-se a partir
da expresso seguinte:
P(a < X < b) =

McGraw-Hill

Verlag Dashfer

f ( x ) dx .

A funo de distribuio (ou funo de probabilidade acumulada) da varivel X, F(x), associa a cada valor
particular x a probabilidade de X ser menor ou igual a x. Em notao simblica, a funo de distribuio de X
definida pela expresso:
F(x) = P(X

x) =

f ( u ) du .

de notar que no integral que figura na expresso o limite superior de integrao x, pelo que h que
considerar uma varivel de integrao distinta de x, no caso a varivel u.
As funes de probabilidade podem ser encaradas como formas de representao de populaes.
Tal como as distribuies de frequncias, calculadas com base nos dados amostrais, so susceptveis de
serem caracterizadas por estatsticas, tambm as funes de probabilidade associadas s populaes podem
ser caracterizadas por um conjunto de parmetros.
Para uma dada po pulao, as funes de probabilidade e os parmetros que lhes esto associados so fixos,
em contraste com a s estatsticas relativas s frequncias observadas numa amostra, que variam de amostra
para amostra.

McGraw-Hill

Verlag Dashfer

Parmetros das funes de probabilidade de variveis aleatrias


Parmetros de localizao:
Variveis Discretas
Valor
esperado ()
Mediana ()

Y = E (Y ) = y p ( y )
y

Seja y0 o valor mnimo que uma


varivel discreta Y pode tomar e F(y) a
funo de probabilidade acumulada. Se
F ( y0 ) 0.5 , a mediana igual a y0, ou
seja y = y0;
Se F(y0 < 0.5) , ento y = y1, onde y1
denota o valor particular de Y que
satisfaz as seguintes condies:

F ( y1 ) 0.5 e F ( y1 ) < 0.5

( y1 representa o valor particular de


Y imediatamente inferior a y1).
Moda ()

McGraw-Hill

A moda o valor para o qual a funo


de probabilidade toma o valor mximo.

Verlag Dashfer

Variveis Contnuas
+

x = E ( X ) = x f ( x ) dx

Para uma varivel X contnua, se a


equao F(x) = 0.5 tem:
- uma soluo, x corresponde
mediana, x;
- mais do que uma soluo, a mediana
definida por:
X min + X max
2
( Xmin e Xmax representam o mnimo e
o mximo do conjunto de solues,
respectivamente).
x =

A moda o valor para o qual a funo


densidade de probabilidade toma o valor
mximo.

Parmetros de disperso:
Variveis Discretas

Variveis Contnuas

Desvio absoluto
mdio ()

Y = y y p( y )

X =

Varincia
(2 ou Var)

Y2 = Var (Y ) = ( y Y ) 2 p ( y )

Desvio padro ()

Y = Y2

f ( x ) dx

2
X

= Var ( X ) =

(x

) 2 f ( x ) dx

X = X2

Outros parmetros:
Variveis Discretas
Momento ordinrio de
i = y i p( y )
ordem i ( i ) (i = 1,2,)
Y
Momento centrado de ordem i = ( y Y ) i p ( y )
Y
i (i) (i = 1,2,)
Coeficiente populacional de

1 = 33
assimetria (1)

Coeficiente Populacional de

2 = 44 3
Kurtose (2)

McGraw-Hill

Verlag Dashfer

Variveis Contnuas

i =
i =

x i f ( x) dx

( x X ) i f ( x) dx

Transformaes lineares de variveis


Considere-se u ma varivel aleatria qualquer Y, discreta ou contnua, e admi ta-se que o s se us valores
particulares so transformados por aplicao de u ma funo linear f (Y ) = a + b Y , o nde a e b so
constantes. Como resultado desta operao, fica definida uma nova varivel aleatria (X):
X = a + bY

O valor esperado e a varincia da varivel transformada (X) podem ser calculados directamente a partir dos
parmetros da varivel original (Y):
Var( X ) = Var (a + b Y ) = b 2 Var(Y )

E ( X ) = E (a + b Y ) = a + b E (Y )

Transformaes no lineares de variveis


Considere-se u ma varivel aleatria qualquer Z, discreta ou contnua, e admi ta-se que o s se us valores
particulares so transformados por aplicao de uma funo no linear (Z). Como resultado desta operao,
fica definida uma nova varivel aleatria W = (Z).
O valor esperado e a varincia da varivel transformada (W) podem ser calculados a partir das expresses:

E (W ) = E[ (Z ) )] [E ( Z )]
2

d
Var(W ) = Var[ (Z )] b Var (Z ) =
Var (Z )
dZ Z = Z
2

McGraw-Hill

Verlag Dashfer

Captulo 5

Distribuies Conjuntas de Probabilidade

Definio de distribuies conjuntas, marginais e condicionais


No estudo de ex perincias al eatrias mui tas v ezes ne cessrio caracterizar mais d o que um a varivel
aleatria a partir do mesmo espao amostral. Nestas circunstncias importante pr em evidncia no s as
propriedades individuais das variveis mas tambm a s pro priedades conjuntas ( i.e., aquelas que dizem
respeito forma como tais variveis se encontram ass ociadas). Isto envolve a defini o de distribuies
conjuntas, de distribuies marginais e de distribuies condicionais. No quadro seguinte apresentam-se as
expresses rel ativas funo conjunta de prob abilidade (o u de den sidade de pro babilidade), funo
marginal de pro babilidade ( ou de densidade de pr obabilidade) e s funes condicionais de probabilidade
(ou de densidade de probabilidade).
Variveis discretas

Variveis contnuas
Prob.{(X, Y) D } = f X ,Y ( x, y ) dx dy

Distribuio
conjunta

p H ,W (h, w) = P ( H = h e W = w)

Distribuio
marginal

p H (h) = p H ,W (h, w)

f X ( x) = f X ,Y ( x, y )dy

pW ( w) = p H ,W (h, w)

f Y ( y ) = f X ,Y ( x, y )dx

Distribuio
condicional

p H W ( x y) =

pW H ( w h) =

p H ,W (h, w)
pW ( w)
p H ,W (h, w)
p H ( h)

f X Y ( x y) =

f X ,Y ( x, y )

f Y X ( y x) =

f X ,Y ( x, y )dx
f X ,Y ( x, y )

f X ,Y ( x, y )dy

Note-se que estas expresses podem ser facilmente adaptadas para o caso em que uma varivel discreta e
outra contnua.
McGraw-Hill

Verlag Dashfer

Independncia entre variveis

A independncia entre duas variveis implica que entre elas no existe qualquer relao, isto , qualquer que
seja o valor particular que u ma d elas t ome no se altera a d istribuio de proba bilidade da o utra. Daqui
resulta a seguinte condio necessria e suficiente de independncia entre duas variveis aleatrias discretas
H e W e entre duas variveis contnuas X e Y:
h, w : p H ,W (h, w) = p H (h) pW (w)
x, y : f X ,Y ( x, y ) = f X ( x ) f Y ( y )

Se es ta condi o for satisfeita para todos o s valores pa rticulares das variveis, ento estas ser o
efectivamente independentes. Inversamente, se p ara al gum par de v alores a relao no for satisfeita, as
variveis no so independentes.

McGraw-Hill

Verlag Dashfer

Covarincia e correlao
A covarincia e a correlao so medidas do grau de relacionamento linear entre duas variveis.
A covarincia das variveis aleatrias discretas H e W, que se denota por H ,W ou Cov(h, w), definida por:

H ,W = (h H ) (w W ) p H ,W (h, w)
h

A covarincia de X e Y, variveis contnuas, dada por:

X ,Y = 2 ( x X ) ( y Y ) f X ,Y ( x, y ) dx dy
R

O coeficiente de correlao (ou, simplesmente, a correlao) obtido dividindo a covarincia pelo produto
dos desvios padro das variveis em causa.
H ,W =

McGraw-Hill

Verlag Dashfer

H ,W
H W

O coeficiente de correlao pode tomar valores situados entre 1 e 1 (isto , 1 H ,W 1 ).

H ,W = 1 indica uma relao linear perfeita entre as variveis consideradas, de tal forma que quando H

aumenta W tambm aumenta (isto , W = a + b H , com b > 0).

H ,W = 1 indica uma relao linear perfeita entre as variveis consideradas, de tal forma que quando

uma aumenta a outra diminui (isto , W = a + b H , com b < 0)

H ,W = 0 indica que o grau de relacionamento linear entre as variveis nulo.

evidente que se as dua s variveis aleatrias forem independentes ento no existir qualquer relao
entre elas, sendo portanto nulo o grau de relacionamento linear (o que implica que H ,W = 0 ).
No entanto, se o coeficiente de c orrelao for nulo no se p ode da depreender que as v ariveis so
independentes (uma vez que podem existir relaes no-lineares entre elas).

McGraw-Hill

Verlag Dashfer

Combinao linear de variveis


Considerem-se as variveis aleatrias X e Y, discretas o u c ontnuas, e admita-se que o s se us valores
particulares so transformados por aplicao de uma funo linear f ( H , W ) = a + b H + c W , onde a, b e c
so constantes. Como resultado desta opera o fica definida uma nova vari vel al eatria V (em q ue
V = f ( H ,W ) = a + b H + c W ).
O valor esperado e a varincia da varivel V podem ser calculados directamente a partir dos parmetros das
variveis originais (H e W):

E (V ) = E (a + b H + c W ) = a + b E ( H ) + c E (W )
Var(V ) = Var ( a + b H + c W ) = b 2 Var( H ) + 2 b c Cov( H ,W ) + c 2 Var(W )

McGraw-Hill

Verlag Dashfer

Combinao no linear de variveis


Considere-se o caso em que a transformao:

V = ( H ,W )

no linear.
Neste caso, o valor esperado e a varincia de V podem ser obtidos recorrendo s expresses que se seguem:

E (V ) = E[ ( H ,W )] [E ( H ), E (W )]
2



H2 + 2
Var [ ( H , W )]

H = H
H = H
H W
H W
=
=
W

McGraw-Hill

Verlag Dashfer

HW +
W2

=
=
H
H

W
W
H
H

W =

W =
W

Captulo 6

Caracterizao de Algumas Distribuies


Discretas Univariadas

Distribuio Binomial
Envolve uma srie de N experincias idnticas com as seguintes caractersticas:
Cada experincia tem apenas 2 resultados possveis (i.e., sucesso ou insucesso).
A probabilidade de ocorrncia de cada resultado mantm-se inalterada de experincia para experincia:

Prob. (sucesso) = p = constante e Prob. (insucesso) = 1 p = q = constante.

Os resultados das experincias so independentes.

Se Y for uma varivel aleatria discreta que representa o nmero de vezes que no decurso de N experincias
ocorrem sucessos, ento X segue uma distribuio Binomial (em notao simblica representa-se por: Y
B(N, p)].

Funo de probabilidade:
Valor esperado de Y:
Varincia de Y:
onde:

Distribuio Binomial
N!
p( y ) =
p y (1 p ) N y
y!( N y )!
Y = N p
Y2 = N p (1 p )

p: probabilidade de ocorrncia de um sucesso


N: nmero de experincias
y: nmero de sucessos

McGraw-Hill

Verlag Dashfer

Distribuio Binomial Negativa


Envolve uma srie de N experincias idnticas com as caractersticas referidas para a distribuio binomial.
A di ferena resi de no facto haver um processo de con tagem do nmero de i nsucessos encon trados a t
ocorrer o r-simo sucesso. Desta forma, se Y representar este nmero (insucessos) segue uma distribuio
Binomial Negativa [em notao simblica representa-se por: Y

BN(r, p)].

Distribuio Binomial Negativa


y + r 1 r
p (1 p) y
Funo de probabilidade:
p( y ) =
y

r (1 p)
Y =
Valor esperado de Y:
p
r (1 p)
Varincia de Y:
Y2 =
p2
onde:

p: probabilidade de ocorrncia de um sucesso


r: nmero ordinal do sucesso
y: nmero de sucessos at ocorrer o r-simo sucesso

McGraw-Hill

Verlag Dashfer

Distribuio Hipergeomtrica
Considere-se uma populao finita constituda por M elementos de d ois tipos (por exemplo, peas boas e
peas defeituosas). Considere-se que p e (1-p) representam, respectivamente, a proporo de peas boas e de
peas defeituosas existentes na populao. Admita-se que desta populao se retiram sucessivamente, sem
reposio, N elementos.
Se Y for uma varivel aleatria discreta que representa o nmero de elementos de um dos tipos que figuram
entre os N elementos que foram retirados da po pulao, ento Y segue um a distribuio Hipergeomtrica
[em notao simblica representa-se por: Y

H(Mp, M(1-p), N)].

Distribuio Hipergeomtrica
M p M (1 p )

y N y

Funo de probabilidade:
p( y ) =
M

N

onde:

Valor esperado de Y:

y = N p

Varincia de Y:

y2 = N p (1 p)

M N
M 1

p: proporo de elementos do tipo em anlise existente na populao (ex.: peas boas).


N: nmero de elementos retirados da populao
y: nmero de elementos do tipo em anlise (ex.: peas boas) que figuram entre os N

elementos retirados da populao


M: dimenso da populao

McGraw-Hill

Verlag Dashfer

Distribuio de Poisson
A varivel aleatria d iscreta Y que representa o nmero de ocorrncias de u m determinado acontecimento
por unidade de tempo (ou espao) segue uma distribuio de Poisson [em notao simblica representa-se
por: Y

Poisson ()] se se verificarem as trs condies seguintes:

Os acontecimentos ocorrem um a um e no aos grupos


Os ac ontecimentos s o independentes e ntre si. Isto , a

ocorrncia de um acon tecimento num


determinado intervalo (de t empo ou de espao) n o afecta a probabilidade de ocorrer um segundo
acontecimento no mesmo, ou em qualquer outro, intervalo (de tempo ou de espao).

A probabilidade de se registar uma ocorrncia do acontecimento num dado intervalo proporcional

dimenso do intervalo.

Distribuio de Poisson
Funo de probabilidade:

p( y ) =

e y
y!

Valor esperado de Y:
Y =
Varincia de Y:
Y2 =
onde:
y: nmero de ocorrncias no intervalo considerado (de tempo ou de espao)
: nmero mdio de ocorrncias por unidade considerada (de tempo ou de espao)

McGraw-Hill

Verlag Dashfer

Captulo 7

McGraw-Hill

Caracterizao de Algumas Distribuies


Contnuas Univariadas

Verlag Dashfer

Distribuio Uniforme
Considere-se a varivel aleatria contnua X que segu e uma distribuio U niforme [em notao simb lica
representa-se por: X
U(a, b)].
Distribuio Uniforme
1/(b-a) se a x b

Funo densidade de probabilidade: f ( x ) =


0 se x > b ou x < a

Funo de distribuio:

onde:

F ( x ) = ( x a ) (b a )

Valor esperado:

X =

( a + b)
2

Varincia:

X2 =

1
(b a ) 2
12

se x < a
se a x b
se x > b

F(x) a probabilidade de X x
a e b so os limites do intervalo finito [a, b]; a funo densidade de probabilidade

constante dentro desse intervalo e nula fora dele.

McGraw-Hill

Verlag Dashfer

Distribuio Exponencial Negativa


Esta distribuio est relacionada com a distribuio de Poisson.
Admitindo que o pa rmetro da distribuio de Po isson que de screve o nmero de ocorrncias de u m
dado fenmeno por unidade de tempo ou de espao, a varivel aleatria contnua X que representa o tempo
ou espao entre ocorrncias sucessivas de um dado fenmeno segue uma distribuio Exponencial Negativa
com parmetro [em notao simblica representa-se por: X
EN()].
Distribuio Exponencial Negativa
se x 0
0
Funo de distribuio:
F ( x) =
x
se x > 0
e
Valor esperado:
X =1
Varincia:
onde:

X2 = (1 ) 2

F(x) a pro babilidade de X x, o que corresponde pro babilidade de se verificar


pelo menos uma ocorrncia no intervalo [0, x]

Note-se que, como corresponde ao nmero mdio de ocorrncias por unidade de te mpo ou de espao, 1/
representa o tempo ou o espao que, em mdia, separa ocorrncias sucessivas.

McGraw-Hill

Verlag Dashfer

Distribuio Normal
Esta a di stribuio que mais se ut iliza para descrev er fenmenos que s e t raduzem atrav s d e variveis
aleatrias contnuas.
Sempre que X uma varivel a leatria cuj o valor resulta da soma de um gran de n mero de efeitos
provocados por causas independentes, em que o efeito de cada causa negligencivel em relao soma de
todos os outros efeitos, ento X segue uma distribuio Normal [em n otao simblica representa-se: X
N(, 2)].
A distribuio Normal definida a partir de dois parmetros: o seu valor esperado (X) e a s ua var incia
( X2 ).
Distribuio Normal Padronizada
A distribuio Normal Padronizada tem valor esperado igual a zero (Z = 0) e varincia igual a um ( Z2 = 1 ).
Considere-se a varivel:

Z=

X x
,
x

em que X

N ( x , X2 )

Dado que a transformao da varivel Normal X linear, a varivel Z tambm Normal. Os seus parmetros
so:
X x E( X ) x
X x 1
=
Z = E
Z2 = Var
Var( X ) = 1
=0
=
x
x x2
x
A varivel Z (obtida a partir da transformao linear da varivel X) segue uma distribuio Normal
padronizada [Z

McGraw-Hill

N(0, 1)].

Verlag Dashfer

Aproximao da distribuio Hipergeomtrica pela distribuio Binomial

Vlida quando M m uito maior do que N (i.e., na prti ca a aproxi mao s razov el quando
M 10 N )
X H ( M p, M (1 p), N ) X B(N, p)

Aproximao da distribuio Binomial pela distribuio de Poisson

Vlida para N grande (i.e., na prtica a aproximao s razovel para N

S tem interesse quando a distribuio binomial for assimtrica (i.e., quando N p 7 e N q 7 ).


X

B(N, p)

20)

Poisson ( = N p)

Aproximao da distribuio Binomial pela distribuio de Poisson

Vlida para N gra nde ( N 20)) e no caso da d istribuio B inomial ser simtrica ( i.e., na pr tica
quando N p > 7 e N q > 7 )
X

McGraw-Hill

B(N, p)

Verlag Dashfer

Normal( = N p, 2 = N p (1 p ))

Aproximao da distribuio de Poisson pela Normal

Vlida quando ( > 10)


Poisson()

Normal( = , 2 = )

Distribuio Lognormal
Seja X > 0 u ma varivel aleatria contnua e admita-se que V = ln X segue uma distribuio N ( V , V2 ) .
Nestas condies, a varivel X segue u ma d istribuio Lognormal, com parmetros V e V2 [em notao
simblica representa-se por: X

LN ( V , V2 ) ].

Distribuio Lognormal
Funo densidade de probabilidade:

1
f ( x) =
e
x 2 V

Valor esperado de X:

X = e V + V / 2

Varincia de X:
Mediana de X:

X2 = e
X = e V

Moda de X:

X = e ( V V )

Valor esperado de V:

V =

Varincia de V:

X2

= ln 2 + 1
X

McGraw-Hill

Verlag Dashfer

1
2 V2

(ln x V ) 2

2 ( V + V2 )

2 V + V2

2
V

1 X4
ln
2 X2 + X2

Distribuio do Qui-Quadrado
Considere-se um conjunto de variveis aleatrias Zi (i = 1, 2, 3,, GL) obedecendo s seguintes condies:
Cada varivel Zi segue uma distribuio Normal padronizada.
As variveis Zi so mutuamente disponveis independentes.
A varivel aleatria X, co nstituda a part ir da so ma de GL variveis Zi e levadas ao quadrado, segue uma
distribuio Qui-Quadrado com GL graus de liberdade [em not ao simblica representa-se por:
2
X GL
]:
GL

X = Z i2
i =1

Distribuio do Qui-Quadrado
( GL / 2 ) 1
1
Funo densidade de probabilidade:
f ( x) = GL / 2
e x / 2 x
2
(GL / 2)
Valor esperado de X:
X = GL
Varincia de X:
X2 = 2 GL

McGraw-Hill

Verlag Dashfer

Distribuio t de Student

2
Considere-se que Z N(0,1) e V GL
. A distribuio da varivel aleatria X obtida calculando o quociente
Z
designa-se po r distribuio t de Student com GL graus de liberdade [em notao simblica
V / GL

representa-se por: X

tGL]:
Distribuio t de Student

Funo densidade de probabilidade:


Valor esperado de X:
Varincia de X:

McGraw-Hill

Verlag Dashfer

[(GL + 1) / 2]

x2

f ( x) =
1 +
GL (GL / 2) GL
X = 0
(para GL > 1)
2
X = GL /(GL 2) (para GL > 2)

( GL +1) / 2

Distribuio F
2
2
Sendo GL
e GL
duas va riveis independentes, a distribuio da v arivel X dada pel o quociente
1
2

2
/ GL1
GL
1
2
/ GL2
GL
2

designa-se por distribuio F com GL1 e GL2 graus de liberdade [em notao s imblica

representa-se por: X

FGL1 ,GL2 ]:

Distribuio F
Funo densidade de probabilidade: f ( x) =

[0.5 (GL1 + GL2 )]

(GL1 / GL2 ) 0.5GL1 x 0.5GL1 1

(0.5 GL1 ) (0.5 GL2 ) (GL2 + GL1 x) 0.5 (GL1 + GL2 )


GL2
X =
(para GL2 > 2)
GL2 2
2 GL2 (GL1 + GL2 2)
X2 =
(para GL2 > 4)
GL1 (GL2 2) 2 (GL2 4)

Valor esperado de X:
Varincia de X:

Para s e o bterem os valores de FGL1 ,GL2 (1 ) , correspondentes a reas de dimenso si tuadas na cau da
esquerda da distribuio de X

FGL1 ,GL2 , recorre-se seguinte relao:

FGL1 , GL2 (1 ) =

McGraw-Hill

Verlag Dashfer

1
FGL2 , GL1 ( )

Captulo 8 Amostragem aleatria.


Distribuies por amostragem
Considere-se a varivel aleatria X, representativa de uma po pulao qualquer com um determinado valor
esperado ( X) e va rincia ( X2 ) . Suponha-se que so recolhidas amostras de d imenso N e que se pret ende
conhecer a distribuio da mdia amostral ( X ) obtida a partir dessas amostras.

Parmetros da distribuio da mdia amostral ( X )

Amostras aleatrias simples (amostras prove nientes de um a populao aproximadamente infinita ou


amostras com reposio provenientes de uma populao finita).
X = X

X2 =

1
X2
N

Amostras ale atrias que n o sejam simpl es (amostras sem reposio provenientes de u ma po pulao
finita).
X = X

McGraw-Hill

Verlag Dashfer

M N 1
2
X2 =
X
M 1 N

Forma da distribuio da mdia amostral ( X )

Quando a d istribuio da varivel o riginal ( X) Norm al, a distribuio da m dia amostral ( X )


tambm Normal.
O t eorema do limite central garante que , qualquer que s eja a distribuio da v arivel o riginal (X), a
mdia amostral ( X ) segue aproximadamente uma distribuio Normal se a dimenso da amostra (N) for
suficientemente grande.

Enunciado do teorema do limite central


Sejam X 1 , X 2 , ..., X N variveis aleatrias in dependentes c om a mesma di stribuio, que s e admi te t er
varincia finita (note-se que isto acontece em quase todas as distribuies com interesse prtico). Qualquer
que seja a distribuio destas variveis, se o valor N for suficientemente grande, a varivel soma (S):
N

S = Xi
i =1

segue aproximadamente uma distribuio Normal.


A distribuio de S inteiramente especificada atravs do valor esperado e da varincia, que so dados por:
S = N X
S2 = N X2
onde X e X2 representam o valor esperado e a varincia das variveis Xi.

McGraw-Hill

Verlag Dashfer

Aproximao da distribuio Binomial pela distribuio Normal


Do t eorema do limite central resulta que a distribuio de Y (distribuio Bino mial) se aproxima da
distribuio Normal para valores suficientemente grandes de N.

Aproximao da distribuio Hipergeomtrica pela distribuio Normal


Do teorema do limite central resulta que a d istribuio de Y (distribuio Hipergeomtrica) se aproxima da
distribuio Normal quando M for muito superior a N em H ( M p, M q, N ) .

2
Aproximao da distribuio GL
pela distribuio Normal

Do teorema do limite central resulta que a distribuio do Qui-Quadrado se aproxima da distribuio Normal
para valores suficientemente grandes de GL.

McGraw-Hill

Verlag Dashfer

Captulo 9

Estimao Pontual

No mbito da i nferncia es tatstica, as es tatsticas per mitem es timar o s parm etros da popul ao a que
pertence a amostra. estatstica, , cujos valores particulares constituem estimativas de um parmetro ,
designa-se estimador pontual do parmetro em causa.

Propriedades desejveis dos estimadores pontuais

No-Enviesamento
Enviesamento = E () = = 0 .

Eficincia

Eficincia = E ( ) 2 = 2 + (Enviesamento )2.


Eficincia relativa

/2

[
E[(

].
) ]

E ( 1 ) 2
2

Consistncia
Condies suficientes (no necessrias):

2
2
lim ( ) = 0 e lim = 0 ou lim E ( ) = 0 .

Suficincia: Capacidade de condensar t oda a inf ormao que a amostra po ssui rel ativamente ao
parmetro.
Robustez: Capacidade de um estimador se manter aproximadamente no-enviesado e eficiente para uma
vasta gama potencial de distribuies populacionais.

McGraw-Hill

Verlag Dashfer

Mtodos de estimao
Mtodo dos momentos
Propriedades dos estimadores obtidos:

so consistentes

seguem uma distribuio Normal quando a amostra tende para infinito

so, para amostras de grande dimenso, menos eficientes que os obtidos pelo mtodo de mxima
verosimilhana.
Seja uma populao representada pela varivel Z, cuja distribuio conhecida a menos de R parmetros
1 , 2 ,..., R . Geralmente, os momentos populacionais ordi nrios so funes do s parm etros a estimar
i = i ( 1 , 2 ,..., R ) .
Seja ainda
por:

{Z1 , Z 2 ,..., Z N } uma a mostra

aleatria s imples. Os momentos amostrais o rdinrios so dados

M i =

1 N
(Z n ) i
N n=1

Os estimadores Mom (designao abreviada para os estimadores calculados atravs deste mtodo) obtm-se
resolvendo o seguinte sistema de equaes em ordem a 1 , 2 ,..., R :
M i = i (1 , 2 ,..., R ) para i = 1,2,, R

McGraw-Hill

Verlag Dashfer

Mtodo da mxima verosimilhana


Propriedades dos estimadores obtidos:

so, em geral, consistentes

para dimenses de amostras crescentes, tendem a ser no-enviesados e eficientes

seguem, frequentemente, uma distribuio assimptoticamente Normal


Seja Y uma varivel discreta, cuja distribuio conhecida a menos de R parmetros 1 , 2 ,..., R . A funo
de verosimilhana para uma amostra aleatria {y1 , y 2 ,..., y N } dada por:
N

L = Probabilid ade (Y1 = y1 ,...YN = y N | 1 , 2 ,..., R = Probabilid ade(YN = y n | 1 , 2 ,..., R )


n =1

As estimativas de mxima verosimilhana correspondem aos valores dos parmetros que maximizam L.

MAX

2 , 2 ,..., R

: L(1 , 2 ,.., R )

L
= 0 (i = 1, 2,, R)
i

Analogamente, sendo X uma var ivel contnua, cu ja distribuio conhecida a meno s de R parmetros
1 , 2 ,..., R . A funo de verosimilhana para uma amostra aleatria {x1 , x 2 ,..., x N } dada por:
N

L = f x1 ,..., x N |1 ,..., R ( x1 ,..., x N ) = f xn |1 ,...,R ( x n )


n =1

As estimativas de m xima v erosimilhana (que se designam abreviadamente por estimativas MV) so os


valores dos parmetros que maximizam L:

MAX : L(1 , 2 ,.., R )

2 , 2 ,..., R

McGraw-Hill

Verlag Dashfer

L
= 0 (i = 1, 2, R).
i

Mtodo de estimao linear com varincia mnima


Propriedades dos estimadores obtidos:
so no-enviesados
tm a varincia mnima possvel
A p artir deste m todo ob tm-se um es timador que res ulta da co mbinao linear de um c onjunto de
estimadores independentes, no-enviesados e com varincia conhecida. O estimador LVM (designao
abreviada para o estimador assim obtido) calcula-se a partir da expresso:

= k n n com k n =
n =1

1 / n2
N

1 /
i =1

McGraw-Hill

Verlag Dashfer

.
2
i

Mtodo dos mnimos quadrados


Propriedades dos estimadores obtidos:
so, em geral, no-enviesados
tm, em geral, varincia mnima
Considerem-se diferentes rplicas de uma varivel X expressas sob a forma:
X n = f n (1 , 2 ,..., R ) + E n
onde f n (1 , 2 ,..., R ) (n = 1,, N) representam funes conhecidas de R parmetros 1 , 2 ,..., R e En (n =
1,, N) representam rplicas independentes de uma varivel aleatria E, habitualmente designada por erro,
com valor espeardo nulo e varincia E2 .
Dispondo de um conjunto de N (N > R) observaes de X, {X 1 , X 2 ,..., X N } , os estimadores obtidos segundo
o mtodo dos mnimos quadrados (os estimadores MQ) dos parmetros 1 , 2 ,..., R so calculados
minimizando o somatrio do quadrado dos erros:
N

n =1

n =1

2
2
Min : SEQ(1, 2 ,..., n ) = En = [ X n f n (1, 2 ,..., R )]

1 , 2 ,..., n

Resolvendo o seguinte sistema de equaes em ordem a 1 , 2 ,..., R obtm-se os estimadores pretendidos.

SEQ
=0
i

McGraw-Hill

Verlag Dashfer

(i = 1, , R)

Captulo 10

Estimao por Intervalo

Todos os intervalos que seguidamente se definem possuem um nvel de confiana de (100-)%.

Intervalo de confiana para o Valor Esperado ()

Amostra de grande dimenso (s


, X + Z ( / 2)
X Z ( / 2)

N
N

Amostra de pequena dimenso (e populao Normal)


s
s

, X + t N 1 ( / 2)
X t N 1 ( / 2)

N
N

McGraw-Hill

Verlag Dashfer

Intervalo de confiana para a Proporo Binomial (p)

Amostra de grande dimenso (populao infinita ou amostragem com reposio)

p Z ( / 2)

p (1 p)
, p + Z ( / 2)
N

p (1 p )

Amostra de grande dimenso (populao finita de dimenso M e amostragem sem reposio)

p Z ( / 2)

p (1 p) M N
, p + Z ( / 2)

N
M 1

p(1 p ) M N

N
M 1

Intervalo de confiana para a varincia de uma populao Normal (2)


( N 1) s 2 ( N 1) s 2
, 2

2
N 1 ( / 2 ) N 1 (1 / 2)

McGraw-Hill

Verlag Dashfer

Intervalo de confiana para a diferena de valores esperados de duas


populaes ( A B )
Amostras independentes de grande dimenso ( s A2 A2 e s B2 B2 )

Admitindo que as populaes tm varincias diferentes ( A2 B2 ):

A2 B2
A2 B2
( X A X B ) Z ( / 2)

+
+
, ( X A X B ) + Z ( / 2)
N A NB
N A NB

Admitindo que as populaes tm varincias iguais ( A2 = B2 ):

1
1
1
1
+
+
, ( X A X B ) + Z ( / 2)
( X A X B ) Z ( / 2)

N A NB
NA NB

em que:

McGraw-Hill

( N A 1) s A2 + ( N B 1) s B2
N A + NB 2

Verlag Dashfer

Amostras independentes de pequena dimenso (e populaes Normais)

Admitindo que as populaes tm varincias diferentes ( A2 B2 )

s A2
s B2
s A2
s B2
( X A X B ) tGL ( / 2)

, ( X A X B ) + tGL ( / 2)
+
+
NA NB
N A NB

em que GL =

(s

(s

2
A

2
A

/ N A + s B2 / N B

) (
2

s2 / NB
/ NA
+ B
NA 1
NB 1

Admitindo que as populaes tm varincias iguais ( A2 = B2 )

1
1
1
1
+
+
, ( X A X B ) + tGL ( / 2) s
( X A X B ) t GL ( / 2) s

N A NB
NA NB

em que: GL = N A + N B 2 e s =

McGraw-Hill

Verlag Dashfer

( N A 1) s A2 + ( N B 1) s B2
N A + NB 2

Intervalo de confiana para a diferena entre Propores Binomiais ( PA PB )


Amostras independentes de grande dimenso (populaes infinitas ou amostragem com
reposio).

( p A pB ) Z ( / 2)

p A (1 p A ) pB (1 pB )
+

NB
NA

Amostras independentes de grande dimenso (populaes de dimenso finita (MA e MB) e


amostragem sem reposio).

( p A pB ) Z ( / 2)

McGraw-Hill

Verlag Dashfer

p A (1 p A ) M A N A pB (1 pB ) M B N B

NA
M A 1
NB
M B 1

Intervalo de confiana para a razo entre varincias de duas populaes


Normais ( A2 B2 )

s2
s2
1
1
A2 ,
2A

FN A 1, N B 1 ( / 2) s B FN A 1, N B 1 (1 / 2) s B

McGraw-Hill

Verlag Dashfer

Captulo 11

Testes de Hipteses (paramtricos)

Testes disperso e localizao


Quadro resumo
Testes disperso (varincia)
Uma amostra, populao Normal, amostra de qualquer dimenso
Teste do 2
Duas amostras independentes, populaes Normais, amostras de quaisquer dimenses
Teste F
Testes Localizao (valor esperado)
Uma amostra, populao qualquer, amostra de grande dimenso
Teste Z
Uma amostra, populao Normal, amostra de pequena dimenso
Teste t
Duas amostras independentes, populaes quaisquer, amostras de grandes dimenses
Teste Z
Duas amostras independentes, populaes Normais, amostras de pequenas dimenses
Teste t
Duas amostras emparelhadas, populaes quaisquer, amostras de grandes dimenses
Teste Z
Duas amostras emparelhadas, populaes Normais, amostras de pequenas dimenses
Teste t
Testes Localizao (proporo Binomial)
Uma amostra, populao dicotmica, amostra de grande dimenso
Teste Z
Duas amostras independentes, populaes dicotmicas, amostras de grandes dimenses
Teste Z
McGraw-Hill

Verlag Dashfer

Definio dos valores crticos dos testes


(para a tomada de deciso de rejeio - ou no - de H0 a um nvel de significncia de %):

Para um teste bi lateral (si nal em H1), so de finidos do is val ores c rticos, um n a ca uda di reita da
distribuio (Vcd) e o utro na c auda es querda (Vc e). Estes valores so obtidos na dis tribuio da ET
(admitindo que H0 verdadeira), de tal forma que P( ET Vcd ) = 2 e P( ET Vce ) = 2 .

Para um tes te unilateral direita (si nal > e m H1), o valor crtico defi nido na caud a d ireita da
distribuio: P( ET Vcd ) = .

Para um teste unilateral e squerda (sinal < em H1), o val or crtico definido na cauda esquerda da
distribuio: P( ET Vce ) = .
Teste ao Valor Esperado de uma populao
Hipteses
Estatstica de teste
Amostra de grande dimenso (s )
H 0 : = 0
X 0
ET =
H 1 : 0 ou < 0 ou > 0
/ N
Quando H0 verdadeira, ET segue uma
distribuio N(0,1)
Amostra de pequena dimenso, populao Normal (s )
H 0 : = 0
X 0
ET =
s/ N
H 1 : 0 ou < 0 ou > 0
Quando H0 verdadeira, ET segue uma
distribuio t N 1

McGraw-Hill

Verlag Dashfer

Teste Varincia de uma populao Normal


Hipteses
2

H 0 : = 02
H1 : 2 02

ou 2 < 02 ou 2 > 02

Estatstica de teste
s2
ET = ( N 1) 2
0
Quando H0 verdadeira, ET segue uma
distribuio N2 1

Teste Proporo Binomial (amostra de grande dimenso)


Hipteses
H 0 : p = p0
H 1 : p p0 ou p < p0 ou p > p0

McGraw-Hill

Verlag Dashfer

Estatstica de teste
p p0
ET =
p0 (1 p0 )
N
Quando H0 verdadeira, ET segue uma
distribuio N(0,1)

Teste Diferena entre Valores Esperados de duas populaes (Amostras Independentes)


Hipteses
Amostras de grandes dimenses

Estatstica de teste
( s 2A

A2 e

s B2

B2 ),

( A2 B2 ).
H0 : A B = 0
H1 : A B 0 ou A B > 0 ou A B < 0

populaes com varincias diferentes

ET =

(X A X B ) 0

A2 B2
+
NA NB
Quando H0 verdadeira, ET segue um a
distribuio N(0,1)
Amostras de grandes dimenses ( s A2 A2 e s B2 B2 ), populaes com varincias iguais ( A2 = B2 )
(a varincia comum pode ser estimada por: 2 =

H0 : A B = 0
H1 : A B 0 ou A B > 0 ou A B < 0

McGraw-Hill

Verlag Dashfer

ET =

( N A 1) s 2A + ( N B 1) s B2
)
NA + NB 2
(X A X B ) 0

1
1
+
NA NB
Quando H0 verdadeira, ET segue um a
distribuio N(0,1)

Continuao...
Hipteses
Estatstica de teste
Amostras de pequenas dimenses, populaes Normais com varincias diferentes ( A2 B2 )
H0 : A B = 0
H1 : A B 0 ou A B > 0 ou A B < 0

ET =

(X A X B ) 0
s A2
s2
+ B
N A NB

Quando H0 verdadeira, ET segue um a


distribuio tGL .
O nmero de graus de liberdade dado por:

GL =

(s

(s

2
A

2
A

/ N A + s B2 / N B

) (
2

/ NA
s B2 / N B
+
N A 1
N B 1

Amostras de pequenas dimenses, populaes Normais com varincias iguais ( A2 = B2 )


( N A 1) s A2 + ( N B 1) s B2
(a varincia comum pode ser estimada por: s =
)
NA + NB 2
2

H0 : A B = 0
H1 : A B 0 ou A B > 0 ou A B < 0

McGraw-Hill

Verlag Dashfer

ET =

(X A X B ) 0

1
1
+
N A NB
Quando H0 verdadeira, ET segue um a
distribuio tGL .
O nmero de graus de liberdade dado por
GL = N A + N B 2
s

Teste Diferena entre Valores Esperados de duas populaes (Amostras Emparelhadas)


Admita-se que, para um mesmo elemento amostral, se dispem de resultados, no independentes, obtidos
antes e depois de um dado acontecimento. Nestas condies, a varivel aleatria diferena entre pares de
observaes (ou diferena relativa entre pares de o bservaes) pode servir de base realizao de testes de
localizao Existindo N observaes emparelhadas de duas populaes A e B, ( x nA , xBn ) , com n = 1, , N, a
partir delas podem obter-se N observaes da varivel : diferena entre observaes emparelhadas, t ais
que n = x nA xBn (n = 1, , N)1. O teste incide sobre o valor esperado da varivel n (D).

H 0 :
H1 :

H 0 :
H1 :

Hipteses
Estatstica de teste
Amostras de grandes dimenses (s )
= 0
( 0 )
ET =
0 ou > 0 ou < 0
/ N
Quando H0 verdadeira, ET segue uma
distribuio N(0,1)
Amostras de pequenas dimenses (populaes Normais)
= 0
( 0 )
ET =
0 ou > 0 ou < 0
s / N
Quando H0 verdadeira, ET segue uma
distribuio t N 1

Em certas situaes prefervel utilizar a varivel diferena relativa: R =


n

McGraw-Hill

Verlag Dashfer

x An x Bn
.
x An

Teste razo de Varincias de duas populaes Normais


Hipteses

A2
H0 = 2 = 1
B
2
H1 = A2 1,
B
2
H 0 = A2 = r0
B
A2
H1 = 2 r0,
B

Estatstica de teste
ET =

H1 =

A2
A2
H
1
,
<
=
> 1.
1
B2
B2

s 2A
s B2

(ver nota2)

Quando H0 verdadeira, ET segue uma


distribuio FN A 1, N B 1

S A2
S B2
Quando H0 verdadeira, ET segue uma
distribuio FN A 1, N B 1
ET = r0

A2
A2
H1 = 2 < r0, H1 = 2 > r0.
B
B

A estatstica de teste pode ser definida colocando sempre em numerador a amostra com o maior valor da varincia amostral (i.e.,
a ET = s A2 s B2 corresponde a valores das varincias amostrais tais que: s 2A s B2 ). Desta forma o valor crtico do teste deve ser
sempre procurado na cauda direita da distribuio F (para e no para /2)

McGraw-Hill

Verlag Dashfer

Teste Diferena entre Duas Propores Binomiais (amostras de grande dimenso)


Hipteses

Estatstica de teste
( p A pB ) p0
p A (1 p A ) pB (1 pB )
+
NA
NB

H 0 : p A pB = p0
H1 : p A pB p0 ou p A pB < p0 ou p A pB > p0

ET =

H 0 : p A pB = 0
H1 : p A p B 0 ou p A p B < 0 ou p A p B > 0

Quando H0 verdadeira, ET segue uma


distribuio N(0,1)
( p A pB )
ET =
1
1

p0 (1 p0 )
+
N A NB
com

YA + YB
.
NA + NB
Quando H0 verdadeira, ET segue uma
distribuio N(0,1)
p0 =

McGraw-Hill

Verlag Dashfer

Captulo 12

Testes No-Paramtricos

Testes de Qualidade de Ajuste, de Localizao, de Aleatoriedade


e de Associao
Quadro resumo
Testes de Qualidade de Ajuste
Uma amostra, populao qualquer, frequncias observadas
Teste do 2
Uma amostra, populao contnua conhecida
Teste de Kolmogorov-Smirnov
Uma amostra, populao Normal (parmetros estimados)
Teste de Kolmogorov-Smirnov (verso Lilliefors)
Duas amostras independentes, populaes quaisquer, frequncias observadas
Teste do 2
Duas amostras independentes, populaes contnuas
Teste de Kolmogorov-Smirnov

McGraw-Hill

Verlag Dashfer

Quadro resumo (continuao)


Testes de Localizao
Uma amostra, populao contnua qualquer
Teste do Sinal
Uma amostra, populao contnua e simtrica
Teste de Wilcoxon
Duas amostras independentes, populaes contnuas com forma igual
Teste de Mann-Whitney-Wilcoxon
Duas amostras emparelhadas, populaes contnuas quaisquer
Teste do Sinal
Duas amostras emparelhadas, populaes contnuas e simtricas
Teste de Wilcoxon
Testes de Aleatoriedade
Uma amostra, populao qualquer, dados numa qualquer escala
Teste das Sequncias
Uma amostra, populao qualquer, dados numa escala pelo menos ordinal
Teste das Sequncias Ascendentes e Descendentes
Testes de Associao
Duas amostras, populaes contnuas, dados numa escala pelo menos ordinal
Teste de correlao ordinal de Spearman
Duas amostras, populaes quaisquer, frequncias observadas
Teste do 2

McGraw-Hill

Verlag Dashfer

Testes para uma amostra

Testes de qualidade do ajuste


Estes testes pe rmitem determinar se os dados da am ostra s o compatveis c om a hiptese de que f oram
retirados de uma populao que segue uma determinada distribuio.

Teste do 2
Requisitos: amostra aleatria de dimenso N 30.
1. Especificar as hipteses do teste e definir o nvel de significncia ():
H0: Os dados da amostra provm de uma populao com uma determinada distribuio de
probabilidade.
H1: A populao no possui essa distribuio de probabilidade
2. Especificar um nmero K de classes mutuamente exclusivas para a varivel considerada.
3. Anotar a frequncia observada (Nk) de ocorrncia dos valores da amostra em cada classe.
4. Com base na distribuio considerada na hiptese nula, determinar a frequncia esperada (ek) de
cada classe.
Nota: A frequncia esperada em cada classe no deve ser inferior a 5. No caso de existirem classes
com frequncias esperadas inferiores a 5, as classes adjacentes devem agregar-se de forma a atingir
o valor mnimo requerido.

McGraw-Hill

Verlag Dashfer

5.

Os valores das frequncias o bservadas e frequncias esperadas so usados n a seguinte expresso


da estatstica de teste:

6.
( N k ek ) 2
ET =
ek
k =1
K

7.

Comparar a estatstica de teste com o valor crtico da distribuio do 2 , cujo nmero de graus de
liberdade (GL) i gual a ( K 1) R (onde K represe nta o n mero de classes cons ideradas e R o
nmero de parm etros da di stribuio populacional e stimados a part ir da am ostra). O t este
unilateral direita, e consequentemente o valor crtico K2 1 R ( ) dever ser procurado na cauda
direita da distribuio do Qui-quadrado.

Teste de Kolmogorov-Smirnov
Requisitos: a distribuio populacional que se pretende analisar contnua e est completamente
especificada (i.e., conhece-se a forma e os parmetros da funo densidade de
probabilidade).
1. Especificar as hipteses do teste e definir o nvel de significncia ().
H0: A funo de distribuio [F (x)] da populao da qual provm a amostra idntica a uma
dada distribuio terica.
H1: A funo de distribuio [F (x)] da populao da qual provm a amostra no coincide com a
distribuio terica considerada em H0.

McGraw-Hill

Verlag Dashfer

2. Definir a funo de distribuio emprica da amostra [S (x)] . Para qualquer valor particular x da
varivel X, esta funo [S (x)] expressa a soma das frequncias relativas dos dados com valores
menores ou iguais a x. Para definir [S (x)] ordenam-se por ordem crescente as observaes da
amostra e converte-se a frequncia acumulada em cada um dos intervalos considerados na
frequncia relativa acumulada da amostra.
3. Calcular a frequncia relativa acumulada que seria de esperar em cada intervalo de acordo com a
distribuio terica considerada na hiptese nula [F (x)] .
4. Calcular para cada intervalo o valor da diferena d = S ( x) F ( x) . No caso da funo F (x) ser
contnua e S (x) ser uma funo em escada, o valor da diferena d deve ser procurado na vizinhana
de cada valor observado de X.
5. Calcular a estatstica de teste:
ET = D = max S ( x) F ( x )

6. Comparar a estatstica de teste com o valor crtico da distribuio de D tabelado. Para valores de N
> 40, o valor crtico obtido aplicando a expresso definida no final da tabela da distribuio D.
Note-se que como a estatstica de teste definida como um valor absoluto, os valores crticos so
sempre procurados na cauda direita da distribuio.

McGraw-Hill

Verlag Dashfer

Teste de Kolmogorov-Smirnov (verso Lilliefors)

Requisitos: a distribuio populacional que se pretende analisar Normal ou Exponencial Negativa,


mas os seus parmetros no so conhecidos, sendo por isso estimados a partir dos dados
amostrais.
Este teste apenas difere do teste de K-S descrito anteriormente no valor crtico da estatstica de t este.
No caso de H0 contemplar a distribuio Normal, aquele valor deve ser obtido na Tabela 9, referente
distribuio da estatstica D na verso Lilliefors para populaes Normais.

Testes de localizao
Aplicam-se em si tuaes na s quai s o s t estes pa ramtricos bas eados na distribuio Normal ou na
distribuio t de s tudent no s o adequados (p or ex emplo, situaes em que a am ostra de pequena
dimenso, N < 30 e retirada de uma popul ao que segue u ma d istribuio substancialmente d istinta da
Normal).
Os t estes de l ocalizao no-paramtricos envolvem a mediana populacional, constituindo uma alternativa
aos testes paramtricos relativos ao valor esperado.

Teste do Sinal
Pretende avaliar-se se a mediana populacional possui um determinado valor particular (0).
Requisitos: amostra aleatria proveniente de uma populao contnua.
1.

Especificar as hipteses do teste e definir o nvel de significncia.


H0: A mediana populacional possui um determinado valor particular 0 (i.e., = 0 ).
H1: A mediana da populao diferente, superior ou inferior a 0

McGraw-Hill

H0: = 0

H0: = 0

H0: = 0

H1: 0

H1: > 0

H1: < 0

Verlag Dashfer

2.

Calcular a estatstica de teste e o valor crtico da distribuio:


Para N < 20 a estatstica de t este corres ponde ao nmero de observaes a cima o u a baixo da
mediana, conforme a natureza da hiptese alternativa considerada:
Se H1: < 0 a ET a utilizar corresponde ao nmero de observaes abaixo da mediana 0.
Se H1: > 0 a ET a utilizar corresponde ao nmero de observaes acima da mediana 0.
Se H1: 0 , utilizar como ET o nmero de observaes a cima o u ab aixo da mediana. U m
nmero relativamente e levado (reduzido) de ob servaes aci ma da mediana o u um n mero
reduzido (elevado) de observaes abaixo da mediana leva rejeio de H0.
O valor crtico obtido atravs da distribuio Binomial B(N, p = 0.5). S empre que na am ostra se
observarem valores iguais a 0, tais observaes no devero ser consideradas na determinao do
valor crtico da ET e a dimenso da amostra N deve ser diminuda em concordncia.
Para N 20 a estatstica de teste a seguinte:
ET =

P 0.5
,
0.25 N

P = proporo amostral de observaes acima (ou abaixo) da mediana


com
N = Dimenso da amostra (excluindo as observaes da amostra com valores iguais a 0 )

O valor crtico desta estatstica de t este ob tido consultando a t abela da distribuio Normal
padronizada.

McGraw-Hill

Verlag Dashfer

Teste de Wilcoxon

Este teste tem em conta a magnitude das diferenas entre as observaes e a mediana.
Requisitos: amostra aleatria proveniente de uma populao contnua e simtrica.
1.

2.

Especificar as hipteses do teste e definir o nvel de significncia.


H0: A mediana populacional possui um determinado valor particular 0 (i.e., = 0 ).
H1: A mediana da populao diferente, superior ou inferior a 0.
H0: = 0

H0: = 0

H0: = 0

H1: 0

H1: > 0

H1: < 0

Subtrair o valor da mediana considerada na hiptese nula (0) a cada observao da amostra, obtendo:
d i = xi 0

Se

di for igual a zero para alguma observao, deve eliminar-se o val or de di correspondente e reduzir,
em concrdncia, o nmero de observaes da amostra (N) nos clculos seguintes.

3.

Ordenar os v alores res ultantes de di de forma crescente em v alor absoluto. Atribuir a ca da valor
ordenado de d i u m nmero de ordem. No caso d e ex istirem 2 ou mais v alores i dnticos de d i
atribuir-lhes um nmero de ordem igual mdia das posi es que os va lores empatados ocupam. Por
exemplo, se e xistirem trs o bservaes co m o valor mnimo de d i devem ser co locadas n as t rs
primeiras posies o rdenadas, at ribuindo a cada obs
(1 + 2 + 3) 3 = 2 .

McGraw-Hill

Verlag Dashfer

ervao o nmero de ordem

igual a

4.
5.

Atribuir a cada nmero de o rdem um si nal posi tivo ou negativo conforme o sinal ori ginal do
correspondente di.
Calcular a soma dos nmeros de ordem com sinal positivo ( T + ) e com sinal negativo ( T ).

6.

Determinar a estatstica de teste e o valor crtico:


Para N 15 a estatstica de teste a seguinte:
Se H1: > 0 a ET a utilizar corresponde ao T + .
Se H1: < 0 a ET a utilizar corresponde ao T .
Se H1: 0 pode ser indiferentemente tomada tanto a estatstica T + como T .
Se a estatstica T + ou T tomar um valor muito alto ou muito baixo (note-se que ela pode variar entre
o mnimo 0 e o mximo N ( N + 1) 2 ), a hiptese nula poder ser rejeitada. Na Tabela 11 re ferente ao
teste de Wil coxon os valores de P indicam a probabilidade da estatstica tomar valores menores o u
iguais aos valores tabelados te (na cauda esquerda) ou maiores ou iguais aos valores t abelados td (na
cauda direita).
Para N > 15 a estatstica de teste a seguinte:

ET =

T N ( N + 1) / 4
N ( N + 1) (2 N + 1) / 24

O val or crtico desta estatstica de teste ob tido consultando a tab ela da distribuio Normal
padronizada.

McGraw-Hill

Verlag Dashfer

No caso de existirem observaes empatadas, o desvio padro da estatstica de teste deve ser corrigido,
vindo:

T =

ui3 ui

N ( N + 1) (2 N + 1) i
i

24
48

onde ui represen ta o nmero de em pates n o i-simo grupo de o bservaes iguais. Po r exemplo, na


sequncia de valores de d i {1,3,3,5,7,7,7,8} viria u1 = 2 e u 2 = 3 .

Testes de aleatoriedade
Estes testes incidem sobre a independncia de observaes sucessivas. Baseiam-se na anlise da ordem ou da
sequncia.

Teste das Sequncias

Requisitos: observaes classificadas em 2 categorias mutuamente exclusivas.


1.

Especificar as hipteses do teste e definir o nvel de significncia ().


H0: A amostra aleatria (i.e., as observaes tm uma sequncia aleatria).
H1: A amostra no aleatria (teste bilateral), ou
H1: A amostra no aleatria, pois as observaes tm tendncia para se agruparem (teste unilateral
esquerda), ou
H1: A amostra no aleatria, pois as observaes tm tendncia para se misturarem (teste unilateral
direita).

McGraw-Hill

Verlag Dashfer

2.

Contar o nmero de se quncias o bservadas na amostra. Define-se sequncia co mo um c onjunto de


observaes idnticas, qu e precedido ou seguido por uma o bservao de o utro t ipo. Esta definio
comporta sequncias constitudas por uma s observao.

3.

Definir NA (nmero de observaes de um tipo) e NB (nmero de observaes do outro tipo).

4.

Determinar a estatstica de teste e o valor crtico


Para N 20 (e ainda para algumas situaes nas quais 20 < N 24 ) a estatstica de teste a seguinte:
ET = R = nmero de sequncias existentes na amostra.
O valor crtico obtido por consulta Tabela 13, na qual se apresentam os valores da probabilidade
Prob.( R ET )
Prob.( R ET ) correspondentes a reas da caud a direita [ direita do valor da
ET (= rd ) ] ou da cauda esquerda [ esquerda do valor da ET (= re ) ] da distribuio de R, admitindo que
a hiptese nula verdadeira.
Para os restantes valores de N no tabelados, a estatstica de teste a seguinte:
2 N A NB

R =
+1

N
R R

ET =
, com
2 N A N B (2 N A N B N )
R
R =
N 2 ( N 1)

O va lor crtico desta estatstica de t este o btido consultando a t abela da distribuio Normal
padronizada.

McGraw-Hill

Verlag Dashfer

Teste das Sequncias Ascendentes e Descendentes

Requisitos: observaes expressas numa escala pelo menos ordinal.


1.

Especificar as hipteses do teste e definir o nvel de significncia ().


H0: As observaes exibem uma sequncia aleatria.
H1: A amostra no aleatria (teste bilateral), ou
H1: A amostra no aleatria, pois existem tendncias nas observaes (teste unilateral esquerda), ou
H1: A am ostra n o a leatria, po is as observ aes da am ostra t m propenso para al ternar
excessivamente (teste unilateral direita).

2.

Ordenar os dados das amostras por ordem de ocorrncia.

3. Contar o n mero de se quncias o bservadas na amostra. Se se su bstituir pelo smbolo + cada


observao precedida por uma outra de valor inferior, e pelo smbolo cada observao precedida por uma
outra de valor superior, cada conjunto de sinais + representa uma sequncia ascendente, e cada conjunto de
sinais representa uma sequncia descendente. Se houver observaes adjacentes idnticas recomenda-se
que se registe o smbolo 0 naquelas que forem precedidas por outras de igual valor. Estes zeros devem ser
ignorados na deter minao do nmero de sequncias e a d imenso da amostra ( N) dev e ser redu zida em
conformidade.
4.

Calcular a estatstica de teste e valor crtico da distribuio.

Para N 25 a estatstica de teste a seguinte:


ET = V = nmero de sequncias observadas na amostra.
Na Tab ela 14 apre sentam-se os valores da c auda d ireita Prob.(V v d ) = Pd e da
Prob. (V ve ) = Pe da distribuio de V quando H0 verdadeira.
Para N 26 a estatstica de teste a seguinte: ET =

cauda es querda

V = (2 N 1) / 3
V V
, com
V
V = (16 N 29) / 90

O valor crtico desta estatstica de teste obtido consultando a tabela da distribuio Normal padronizada.

McGraw-Hill

Verlag Dashfer

Testes para duas amostras independentes


Testes de qualidade do ajuste
Estes testes permitem verificar se as amostras foram retiradas de populaes com distribuies idnticas.

Teste do 2
Requisitos: amostras aleatrias de dimenso N A , N B 30 .
1. Especificar as hipteses do teste e definir o nvel de significncia (). Considere-se que A e B so as
populaes a partir das quais se obtm as amostras.
H0: As populaes A e B so idnticas.
H1: As populaes A e B no so idnticas.
Especificar um nmero K de classes mutuamente exclusivas para a varivel considerada.
2. Para cada amostra, anotar as frequncias observadas N kA e N kB em cada classe.
3. Com base na distribuio considerada na hiptese nula, determinar a frequncia esperada ekA e ekB
de cada classe.
Nota: A frequncia esperada em cada classe no deve ser inferior a 5. No caso de existirem classes
com frequncias esperadas inferiores a 5, as classes adjacentes devem ser combinadas de forma a
atingir o valor mnimo requerido. Quando houver necessidade de agregar classes adjacentes numa
das amostras, tal operao deve ser igualmente executada na outra amostra.

McGraw-Hill

Verlag Dashfer

4. Os valores das frequncias observadas e frequncias esperadas so utilizados na seguinte expresso


para determinar a estatstica de teste:
( N kA ekA ) 2 K ( N kB ekB ) 2
ET =
+
ekA
ekB
k =1
k =1
K

5. Comparar a estatstica de teste com o valor crtico da distribuio do 2 com um nmero de graus de
liberdade ( GL) i gual a K - 1 (em que K representa o nmero de classes consideradas). O t este
unilateral direita, e consequentemente o valor crtico K2 1 ( ) de ver ser pro curado na cauda
direita da distribuio do Qui-quadrado.

Teste de Kolmogorov-Smirnov
Requisitos: distribuio populacional contemplada em H0 contnua.
1. Especificar as hipteses do teste e definir o nvel de significncia ().
H0: As amostras prov m de uma nica popul ao contnua (ou, equivalentemente, as am ostras
provm de duas populaes contnuas idnticas: FA ( x ) = FB ( x ) .
H1: As amostras no provm de uma mesma populao.
Colocar as observaes das dua s amostras po r ordem crescente e, para cada am ostra, converter a
frequncia acumulada em cada um dos intervalos considerados na frequncia relativa acumulada da
amostra [ S A (x) e S B (x ) ].
2. Calcular para cada intervalo o valor da diferena d = S A ( x) S B ( x) .
3. Calcular a estatstica de teste: ET = D' = max S A ( x ) S B ( x)
4. Comparar a estatstica de teste com o valor crtico tabelado da distribuio D (Tabela10).

McGraw-Hill

Verlag Dashfer

Testes de localizao (amostras independentes)

Estes testes utilizam-se em situaes nas quais se pretende verificar se existem diferenas entre as medianas
de duas populaes (A e B), e em que o s testes paramtricos (ao valor esperado) baseados na d istribuio
Normal ou na distribuio t de student no sejam apropriados.

Teste de Mann-Whitney-Wilcoxon
Requisitos:
1.

amostras independentes provenientes de populaes contnuas e com a mesma forma.

Especificar as hipteses do teste e definir o nvel de significncia.


H0:
H1:

A = B
A

H0:
H1:

A = B
A > B

H0:
H1:

A = B
A < B

2.

Ordenar as observaes de ambas as amostras por ordem crescente.

3.

Atribuir a cada observao um nmero de ordem. Em caso de e mpate atribuir as observaes u m


nmero de ordem igual mdia das posies que os valores empatados ocupam.

4.

Calcular a estatstica de teste e o valor crtico da distribuio:


Para N A 10 e N B 10 a estatstica de teste a seguinte:
ET = W = soma dos nmeros de ordem da amostra de menor dimenso.
Na Tabela 12 caracterizada a distribuio de W quando H0 verdadeira. Para diferentes valores
we e wd , so apresentadas as probabilidades P(W we ) = P(W wd ) = P .

McGraw-Hill

Verlag Dashfer

Para N A > 10 ou N B > 10 a estatstica de teste a seguinte:

ET =

W N w ( N + 1) 2
,
N A N B ( N + 1) 12

em que N w o nmero de elementos da amostra de menor dimenso.


O valor crtico desta estatstica de teste obtido consultando a t abela da d istribuio Normal
padronizada.
Se exi stirem obse rvaes em patadas, o desvio padro da es tatstica de t este dev e ser corrigido,
calculando-se atravs da expresso:

ET =

N A N B ui3 ui
N A N B ( N + 1)
i
i
,

12
12 N ( N 1)

em que, tal como no teste de Wilcoxon, ui representa o nmero de empates no i-simo grupo de
observaes iguais.

McGraw-Hill

Verlag Dashfer

Testes de localizao para duas amostras emparelhadas


Admita-se que, para um mesmo elemento amostral, se dispem de resultados, no independentes, obtidos
antes e depois de um dado acontecimento. Nestas condies, a varivel aleatria diferena entre pares de
observaes (ou diferena relativa entre pares de o bservaes) pode servir de base realizao de testes de
localizao Existindo N observaes emparelhadas de duas populaes A e B, ( x nA , xBn ) , com n = 1, , N, a
partir delas podem obter-se N observaes da varivel : diferena entre observaes emparelhadas, t ais
que n = x nA xBn (n = 1, , N)3. Quando para a varivel n no se verifiquem os pressupostos subjacentes
aos testes paramtricos t ou Z, a alternativa recorrer aos testes no paramtricos de localizao (tal como se
de uma amostra se tratasse).
Teste do Sinal
Requisitos: amostras aleatrias provenientes de populaes contnuas.

Teste de Wilcoxon
Requisitos: amostras aleatrias provenientes de populaes contnuas e simtricas.

Em certas situaes prefervel utilizar a varivel diferena relativa: R =


n

McGraw-Hill

Verlag Dashfer

x An x Bn
.
x An

Outros testes para duas amostras

Testes de associao

Teste da Correlao Ordinal de Spearman


Este teste permite verificar o grau de a ssociao entre duas variveis cujas observaes individuais
possam ser ordenadas por ordem crescente ou decrescente de magnitude.
Requisitos: amostra aleatria constituda por N pares de observaes de duas variveis aleatrias
expressas numa escala pelo menos ordinal provenientes de uma populao bivariada
contnua.
1. Especificar as hipteses do teste e definir o nvel de significncia ().
H0: As variveis (X e Y) no esto associadas.
H1: As variveis esto associadas (teste bilateral)
H1: As variveis esto directamente associadas (teste unilateral direita)
H1: As variveis esto inversamente associadas (teste unilateral esquerda)
2. Atribuir a cada observao das variveis X e Y um nmero de ordem (por ordem crescente). Note-se
que o nmero de ordem tambm poderia ser atribudo por ordem decrescente o importante que
seja atribudo a ambas as variveis um nmero de ordem utilizando o mesmo critrio. Em caso de
empate, atribuir s obse rvaes u m nmero de ordem igual m dia das po sies qu e o s valores
empatados ocupam.
3. Calcular a diferena (di) entre os nmeros de ordem das observaes relativas s variveis X e Y

McGraw-Hill

Verlag Dashfer

4. Calcular a estatstica de teste e o valor crtico da distribuio4.


Para N 30 a estatstica de teste a seguinte
N

ET = Rs = 1

6 d i2
i =1
2

N ( N 1)

Na Tabela 15 apresentam-se os valores crticos para a distribuio de Rs . Atendendo simet ria da


distribuio de Rs , para t estes bil aterais o u t estes u nilaterais e squerda, os val ores cr ticos
correspondentes cauda esquerda da distribuio so obtidos trocando o sinal aos valores tabelados.
Para N > 30 a estatstica de teste a seguinte:
ET = Z = Rs

N 2
1 Rs2

O valor crtico desta estatstica de teste obtido consultando a tabela da distribuio t de St udent
com N 2 graus de liberdade.

Quanto maior for a di ferena entre os nmeros de ord em das ob servaes de X e Y, maior se r o v alor de di2 . Se to das as
diferenas di forem zero, Rs s er igual a 1 i ndicando que as variveis tm uma associao directa perfeita . Se as v ariveis
4

tiverem uma asso ciao inversa perfeita o valor de di2 ser m ximo e Rs se r igual a 1 . Quand o as v ariveis n o esto
perfeitamente associadas, o valor de Rs estar entre 1 e +1.

McGraw-Hill

Verlag Dashfer

Teste do 2 baseado na tabela de contingncia


Este teste permite verificar a independncia entre duas variveis expressas em qualquer escala.
Requisitos: dados agrupados em classes mutuamente exclusivas e exaustivas na forma de contagens.
1. Especificar as hipteses do teste e definir o nvel de significncia.
H0: As variveis (X e Y) so independentes.
H1: As variveis no so independentes
2. Classificar os dados da amostra nume tabela de contingncia. Numa tabela de contingncia os
valores que uma das variveis (X) pode tomar correspondem a diferentes linhas (tabela com I
linhas) e os valores da outra varivel correspondem s colunas (tabela com J colunas).
3. Calcular as frequncias observadas (Nij) de X e de Y em cada clula.
4. Calcular as frequncias marginais observadas em cada categoria de X e de Y (linha e coluna), N i e
N j .
5. Calcular uma nova tabela com as frequncias esperadas que ocorreriam se as variveis fossem
independentes (eij). Nestas condies, a frequncia esperada em cada clula ser igual a
N i N j
eij =
.
N
6. Os valores das frequncias observadas e frequncias esperadas so utilizadas na expresso da
estatstica de teste:
I
J (N e )2
ij
ij
ET =
eij
i =1 j =1

McGraw-Hill

Verlag Dashfer

7. Comparar a estatstica de teste com o valor crtico da distribuio do 2 com graus de liberdade (GL)
igual a ao produto ( I 1) ( J 1) , em que I corresponde ao nmero total de linhas da tabela de
contingncia e J ao nmero total de colunas. O teste unilateral direita, e consequentemente o valor
crtico (2I 1) ( J 1) ( ) dever ser procurado na cauda direita da distribuio do 2.
No caso de I = J = 1, a ET dever ser modificada de acordo com a correco de Yates:
2

ET =
i =1 j =1

(N

ij

eij 0.5

eij

Note-se que este t este do 2 no deve se r ut ilizado se mais do que 20% das f requncias o bservadas
forem inferiores a 5, o u se al guma das frequncias observadas for menor do que 1. E m geral, a
agregao de classes adjacentes em tabelas de cont ingncia no faz qualquer sentido. No entanto,
se tal for possvel, podero ser agregadas classes adjacentes at que aquelas condies se encontrem
preenchidas.

McGraw-Hill

Verlag Dashfer

Captulo 13

Anlise de Varincia

Modelo com um factor de efeitos fixos


X ij =

+
+ Eij
123 12i 3 1
424
3
parmetro
global

efeito
do grupo

erro

Hipteses subjacentes relativas aos erros Eij para a aplicao do teste ANOVA:

valor esperado nulo e varincia constante, 2 ;

mutuamente exclusivos;

normalmente distribudos.
Teste ao efeito do factor (ver tabela ANOVA 13.2)
Hipteses
Estatstica de teste
DQMEG
H 0 : 1 = 2 = ... =
(ou 1 = ... = I = 0)
ET =
DQMDG
H 1 : Nem todos os i so iguais (ou algum i 0)
Quando H0 verdadeira, ET segue uma
distribuio FGL1 ,GL2

McGraw-Hill

Verlag Dashfer

Intervalos de Confiana para a diferena entre valores esperados


Intervalo
Amostras
Equilibradas

J1 = J2 == JI = J

Amostras Pouco
Desequilibradas

(Ji)mximo 2(Ji)mnimo

J=

I
1
1
+ ... +
J1
JI

Amostras
Desequilibradas

(Ji)mximo > 2(Ji)mnimo o

com
I: nmero de grupos
J: nmero de observaes em cada grupo

McGraw-Hill

( X i1 X i2 ) q I ,GL2 ( ) DQMDG / J

Verlag Dashfer

( X i1 X i2 ) ( I 1) FGL1 ,GL2 ( ) DQMDG (

1
1
)
+
J i1 J i2

Modelo com um factor de efeitos variveis


X ij =

+
Ai
+ Eij
123 1
424
3 1
424
3
parmetro
global

efeito varivel
do grupo

erro

Hipteses subjacentes relativas aos erros Eij para a aplicao dos testes ANOVA:
2
valor esperado nulo e varincia constante, ;
mutuamente exclusivos;
normalmente distribudos.
Hipteses subjacentes relativas ao efeito varivel Ai para a aplicao dos testes ANOVA:
2
valor esperado nulo e varincia A ;
mutuamente exclusivos;
normalmente distribudos.
Teste ao efeito varivel do factor (ver tabela ANOVA 13.5)
Hipteses
Estatstica de teste
2
DQMEG
H0 : A = 0
ET =
DQMDG
H 1 : A2 >0
Quando H0 verdadeira, ET segue uma distribuio FGL1 ,GL2

McGraw-Hill

Verlag Dashfer

Modelo com dois factores de efeitos fixos com interaco


X ij =

+ i + j + ij + Eijk
123 1
424
3 1
424
3 1
424
3 1
424
3
parmetro
global

efeito do
1 factor
(linha)

efeito do
2 factor
(coluna)

interaco

erro

Hipteses subjacentes relativas aos erros Eijk para a aplicao dos testes ANOVA:
2
valor esperado nulo e varincia constante, ;
mutuamente exclusivos;
normalmente distribudos.
Teste ao efeito da interaco entre os factores (ver tabela ANOVA 13.9)
Hipteses
Estatstica de teste
DQMDI
H 0 : ij = 0
ET =
DQMR
H 1 : algum ij 0
Quando H0 verdadeira, ET segue uma distribuio FGL3 ,GL4
Teste ao efeito do factor linha (ver tabela ANOVA 13.9)
Hipteses
Estatstica de teste
DQMDFL
H 0 : i = 0
ET =
DQMR
H 1 : algum i 0

Quando H0 verdadeira, ET segue uma distribuio FGL ,GL


1

Se razovel admitir que a interaco nula, e o respectivo teste no contraria esta hiptese, pode ser obtido um novo estimador

de 2 , :
2

2 =

McGraw-Hill

Verlag Dashfer

GL3 DQMDI + GL4 DQMR


GL3 + GL4

Teste ao efeito do factor linha (ver tabela ANOVA 13.9)


Hipteses
Estatstica de teste
DQMDFL
H 0 : i = 0
ET =
DQMR
H 1 : algum i 0

Quando H0 verdadeira, ET segue uma distribuio FGL ,GL


1

Intervalos de Confiana para a diferena entre valores esperados


Intervalo
Duas quaisquer clulas

( X i1 ji X i2 j2 ) q I J ,GL4 ( ) DQMR / K

Linhas

( X i1 X i2 ) q I ,GL4 ( ) DQMR / J K

Colunas

( X j1 X j2 ) q J ,GL4 ( ) DQMR / I K

Com I: nmero de linhas; J: nmero de colunas; K: nmero de observaes por clula


Naturalmente o denominador da s estatsticas dos testes r elativos ao f actor linha e coluna sero substitudos por esta estim ativa e
seguiro distribuies FGL ,GL3+ 4 e FGL
6

2 ,GL3+ 4

respectivamente.

Se razovel admitir que a interaco nula, e o respectivo teste no contraria esta hiptese, pode ser obtido um novo estimador

de 2 , :
2

2 =

GL3 DQMDI + GL4 DQMR


GL3 + GL4

Naturalmente o denominador da s estatsticas dos testes r elativos ao f actor linha e coluna sero substitudos por esta estim ativa e
seguiro distribuies FGL ,GL3+ 4 e FGL
1

McGraw-Hill

2 ,GL3+ 4

Verlag Dashfer

respectivamente.

Modelo com dois factores de efeitos variveis com interaco

X ij =

+ Ai
+ B j + Cij + Eijk
123 1
424
3 1
424
3 1
424
3 1
424
3
parmetro
global

ef. varivel do
1 factor
(linha)

ef. varivel do
2 factor
(coluna)

interaco
varivel

erro

Hipteses subjacentes relativas aos erros Eijk para a aplicao dos testes ANOVA:
2
valor esperado nulo e varincia constante, ;
mutuamente exclusivos;
normalmente distribudos.
Hipteses subjacentes relativas aos efeitos variveis Ai, Bj e Cij para a aplicao dos testes ANOVA:
2
2
2
valores esperados nulos e varincias A , B e C , respectivamente;
mutuamente exclusivos;
normalmente distribudos.

McGraw-Hill

Verlag Dashfer

Teste ao efeito varivel da interaco entre os factores (ver tabela ANOVA 13.11)
Hipteses
Estatstica de teste
2
DQMDI
H0 :C = 0
ET =
DQMR
H 1 : C2 > 0
Quando H0 verdadeira, ET segue uma distribuio FGL3 ,GL4
Teste ao efeito varivel do factor linha (ver tabela ANOVA 13.11)
Hipteses
Estatstica de teste
2
DQMDFL
H0 : A = 0
ET =
DQMR
H 1 : A2 > 0
Quando H0 verdadeira, ET segue uma distribuio FGL ,GL
1

Teste ao efeito varivel do factor coluna (ver tabela ANOVA 13.11)


Hipteses
Estatstica de teste
2
DQMDFC
H0 : B = 0
ET =
DQMR
H 1 : B2 > 0
Quando H0 verdadeira, ET segue uma distribuio FGL ,GL
2

Se razovel admitir que a interaco nula, e o respectivo teste no contraria esta hiptese, pode ser obtido um novo estimador

de 2 , 2 :

GL3 DQMDI + GL4 DQMR


GL3 + GL4
Naturalmente o denominador das estatsticas dos testes relativos ao factor linha e coluna sero substitudos por esta estimativa e
2 =

seguiro distribuies F

GL1 ,GL3+ 4

McGraw-Hill

e F

GL2 ,GL3+ 4

Verlag Dashfer

respectivamente.

Modelo aditivo com dois factores de efeitos fixos com


uma observao por clula
X ij =

+ i + j + Eijk
123 1
424
3 1
424
3 1
424
3
parmetro
global

efeito do
1 factor
(linha)

efeito do
2 factor
(coluna)

erro

Hipteses subjacentes relativas aos erros Eijk para a aplicao dos testes ANOVA:
2
valor esperado nulo e varincia constante, ;
mutuamente exclusivos;
normalmente distribudos.
Note-se que, neste caso, a varincia residual, 2, estimada por:

VR = X ij X i X j + X
i

McGraw-Hill

Verlag Dashfer

Teste ao efeito do factor linha (ver tabela ANOVA 13.12)


Hipteses
Estatstica de teste
DQMDFL
H 0 : i = 0
ET =
DQMR
H 1 : algum i 0
Quando H0 verdadeira, ET segue uma distribuio FGL ,GL
1

Teste ao efeito do factor coluna (ver tabela ANOVA 13.12)


Hipteses
Estatstica de teste
DQMDFC
H0 : j = 0
ET =
DQMR
H 1 : algum j 0
Quando H0 verdadeira, ET segue uma distribuio FGL ,GL
2

Intervalos de Confiana para a diferena entre valores esperados


Intervalo
Linhas

( X i1 X i2 ) q I ,GL3 ( ) DQMR / J

Colunas

( X j1 X j2 ) q J ,GL3 ( ) DQMR / I

Com I: nmero de linhas; J: nmero de colunas

McGraw-Hill

Verlag Dashfer

Modelo aditivo com dois factores de efeitos variveis com


uma observao por clula
X ij =

+ Ai
+ B j + Eijk
123 1
424
3 1
424
3 1
424
3
parmetro
global

ef. varivel do
1 factor
(linha)

erro

ef. varivel do
2 factor
(coluna)

Hipteses subjacentes relativas aos erros Eijk para a aplicao dos testes ANOVA:
2
valor esperado nulo e varincia constante, ;
mutuamente exclusivos;
normalmente distribudos.
Hipteses subjacentes relativas aos efeitos variveis Ai e Bj para a aplicao dos testes ANOVA:
2
2
valores esperados nulos e varincias A e B , respectivamente;
mutuamente exclusivos;
normalmente distribudos.
Note-se que, neste caso, a varincia residual, 2, estimada por:

VR = X ij X i X j + X
i

McGraw-Hill

Verlag Dashfer

Teste ao efeito varivel do factor linha (ver tabela ANOVA 13.13)


Hipteses
Estatstica de teste
2
DQMDFL
H0 : A = 0
ET =
DQMR
H : A2 > 0
1

Quando H0 verdadeira, ET segue uma distribuio FGL ,GL


1

Teste ao efeito varivel do factor coluna (ver tabela ANOVA 13.13)


Hipteses
Estatstica de teste
2
DQMDFC
H0 : B = 0
ET =
2
DQMR
H1 : B > 0
Quando H0 verdadeira, ET segue uma distribuio FGL ,GL
2

McGraw-Hill

Verlag Dashfer

Teste de Kruskal-Wallis
Se for re jeitada a hiptese de normalidade do s erro s e s e as a mostras forem de pequenas d imenses, este
teste constitui um a a lternativa ao teste ANOVA para a valiar a significncia entre diferenas nos valores
mdios de vrios grupos de dados.
1.

Especificar as hipteses do teste e definir o nvel de significncia ():


H0: As d istribuies do s d iferentes grupos so idnticas (as po pulaes dos dif erentes grup os tm
valores esperados idnticos).
H1: As distribuies dos grupos diferem em localizao.

2.

Ordenar a t otalidade da s o bservaes po r ordem c rescente, independentemente do grupo a qu e


pertencem. Atribuir a cada valor ordenado de u m nmero de ordem, e e m caso de existirem 2 o u mais
valores iguais atribuir-lhes um nmero de ordem igual m dia das pos ies que os valores empatados
ocupam.

3.

Para cada grupo i calcular a soma dos nmeros de ordem de cada valor pertencente a este grupo, Ti.

4.

Determinar a estatstica de teste recorrendo expresso:

I
12
T2
i 3 ( J + 1)
J ( J + 1) i J i
com, I: nmero total de grupos de observaes; i: ndice relativo a cada grupo (i = 1, 2 ,, I); Ji: dimenso
do grupo i; J: nmero total de observaes ( J = J i )

ET =

2
O valor crtico desta es tatstica de t este o btido consultando as t abelas da distribuio GL
, e m que
GL= I1.

McGraw-Hill

Verlag Dashfer

Teste de Bartlett
Este teste permite avaliar a homogeneidade das varincias, requisito dos testes ANOVA.
Requisitos A distribuio dos erros Normal.
As vrias amostras envolvidas tm dimenses no inferiores a 4 (Ji 4)
1.

Especificar as hipteses do teste e definir o nvel de significncia ():


H0: 12 = 22 = ... = I2 .
H1: Os i2 no so todos iguais.

2.
3.

Determinar a estatstica de teste recorrendo expresso:


ET =

GL ln( S 2 ) GLi ln( S i2 ) em que C = 1 + {1 /[3 ( I 1)]} 1 / GLi 1 / GL


C
i

i =1

com,
I: nmero total de amostras distintas
i: ndice relativo a cada amostra (i = 1, 2,, I)
Ji: dimenso da amostra i
GLi:Ji-1
X ij : j-sima observao na i-sima amostra
X i : mdia amostral das observaes includa na amostra i
1
S i2 :
( X ij X i ) 2 .
GLi j
2
O valor crtico desta estatstica de teste obtido consultando a tabela da distribuio GL
, em que GL= I - 1.

McGraw-Hill

Verlag Dashfer

Captulo 14

Regresso

Hipteses subjacentes aos erros (En) e que so comuns aos modelos de regresso:

valor esperado nulo e varincia constante, 2;

mutuamente exclusivos;

normalmente distribudos.

Modelo de Regresso Linear Simples


Um modelo de regresso deste tipo traduz a relao entre uma varivel quantitativa independente, X, e uma
varivel quantitativa dependente, Y, nos termos seguintes:
Yn = + ( X n X ) + E n

em que:
n: ndice denotando as observaes do par de variveis X e Y (n = 1, 2, , N)
X : mdia aritmtica das observaes Xn
En: erro aleatrio associado ao valor observado Yn
.

McGraw-Hill

Verlag Dashfer

Estimativas de e :

=a=

1
yn = y
N n

=b=

s XY
s XX

com,

s XY = [( X n X ) (Yn Y )]
n

s XX = ( X n X ) 2 .
n

Intervalos de Confiana a (1 ) 100 % para os parmetros , , e


Parmetro
Parmetro (ordenada na

origem do eixo dos XX)

Parmetro

A t N 2 ( / 2) S 1 / N

1 X2
( A X B) t N 2 ( / 2) S
+
N S XX
B t N 2 ( / 2) S 1 / S XX

Nota: A e B so os estimadores de e , respectivamente.


1
2
[Yn A B ( X n X )] .
S2 um estimador de 2 e dado por
N 2 n

McGraw-Hill

Verlag Dashfer

Testes de Hipteses aos parmetros , , e


Estatstica de teste
A 0
H 0 : = 0
ET =
H 1 : 0 , > 0 ou < 0
S/ N
Quando H0 verdadeira, ET segue uma distribuio t N 2 .
Hipteses
Estatstica de teste

H 0 : = 0
( A X B) 0
ET =
H 1 : 0 , > 0 ou < 0
1 X2
+
S
N S XX
Hipteses

Hipteses
H 0 : = 0

H 1 : 0 , > 0 ou < 0

Quando H0 verdadeira, ET segue uma distribuio t N 2 .


Estatstica de teste
B 0
ET =
S / S XX
Quando H0 verdadeira, ET segue uma distribuio t N 2 .

Teste ao parmetro baseado na Tabela ANOVA (ver tabela 14.3)


Hipteses
Estatstica de teste
DQMDR
H0 : = 0
ET =
DQMR
H0 : 0
Quando H0 v erdadeira, ET segue um a d istribuio
F1, N 2 .

McGraw-Hill

Verlag Dashfer

Previses com base no modelo de regresso linear simples


O valor de uma varivel dependente, Y, pode ser obtida a partir do novo valor da varivel X dependente. Para
isto recorre-se seguinte expresso para a melhor previso de Y:
Y = Y = A + B ( X X ) .

A varincia do erro de previso dado por:

1 ( X X )2 2
Var ( ) = 1 + +
.
S XX
N

Intervalos de Confiana a (1 ) 100 % para a previso


Para valores de Y

1 (X X )
Y t N 2 ( / 2) S 1 + +
N
S XX

1 (X X )
+
N
S XX

Para valores de Y

McGraw-Hill

Verlag Dashfer

Y t N 2 ( / 2) S

Correlao entre variveis


A anlise da correlao entre variveis u ma t cnica muito semelhante regres so no que se refere a os
objectivos. No entanto, esta menos potente, no indicando a forma como as variveis esto relacionadas.
Coeficiente de correlao
amostral

R XY

Coeficiente de correlao
populacional

XY =

Coeficiente de
determinao

Expresso
S XY
=
S XX S YY

E[( X X ) (Y Y )]

E ( X X ) 2 E (Y Y ) 2
R

2
XY

B 2 S XX
=
S YY

Modelo de Regresso Linear Mltipla


Um modelo de regresso deste tipo traduz a relao vrias variveis independentes, Xj (j = 1,, J), e um a
varivel quantitativa dependente, Y, nos termos seguintes:
Yn = + 1 ( X 1n X 1 ) + ... + j ( X jn X j ) + E n

em que:
n: ndice denotando as observaes das variveis Xj e Y (n=1,2,,N)
X j : mdia aritmtica das observaes da varivel Xj
En: erro aleatrio associado ao valor observado Yn .

McGraw-Hill

Verlag Dashfer

Estimativa de

1
yn = y
N n

=a=

Estimativas de j
Os estimadores B1,,BJ dos parmetros 1 ,..., J so o btidos a partir da resoluo do seguinte sistema de
equaes:

B1 S X1X1 + B2 S X1 X 2 + ... + BJ S X1X J = S X1Y


B1 S X 2 X1 + B2 S X 2 X 2 + ... + BJ S X 2 X J = S X 2Y
(...)
B1 S X J X1 + B2 S X J X 2 + ... + BJ S X J X J = S X JY
com,

s X jY = ( X jn X j ) (Yn Y )
n

s X j1 X j 2 = ( X j1n X j1 ) ( X j2 n X j2 ) .
n

Intervalos de Confiana a (1 ) 100 % para os parmetros e j


A t N J 1 ( / 2) S 1 / N

Parmetro

B j t N J 1 ( / 2) Var ( B j )

Parmetro j (j = 1,, J )

Nota: A e Bj so os estimadores de e j, respectivamente. S2 um estimador de 2 e dado por:

1
2
Yn A B1 ( X 1n X 1 ) ... B j ( X jn X j ) .
N J 1 n
McGraw-Hill

Verlag Dashfer

Testes de Hipteses aos parmetros e j


Hipteses
Estatstica de teste
H 0 : = 0
A 0
ET =
H 1 : 0 , > 0 ou < 0
S/ N
Quando H0 verdadeira, ET segue uma distribuio t N J 1 .
Hipteses
Estatstica de teste
H 0 : = 0
( A ( X 1 B1 + ... + X j B j )) 0
ET =
H 1 : 0 , > 0 ou < 0
Var ( A)
Hipteses
H0 : j = 0
H 0 : j 0, j > 0 ou j < 0

Quando H0 verdadeira, ET segue uma distribuio t N J 1 .


Estatstica de teste
j
ET =
Var ( B j )
Quando H0 verdadeira, ET segue uma distribuio t N J 1 .

Teste aos parmetros j baseado na Tabela ANOVA (ver tabela 14.7)


Hipteses
Estatstica de teste
DQMDR
H 0 : 1 = 2 = ... = J = 0
ET =
DQMR
H 0 : Algum j 0
Quando H0 v erdadeira, ET segue um a d istribuio
FJ , N J 1 .
No caso da hiptese nula ser rejeitada, devem efectuar-se testes individuais para determinar quais dos j
so diferentes de zero.

McGraw-Hill

Verlag Dashfer

Previses com base no modelo de regresso linear mltipla


O valor de uma varivel dependente, Y, pode ser obtida a partir dos novos valores das variveis dependentes
Xj (j = 1,, J). Para tal, recorre-se expresso relativa melhor previso de Y:
Y = E (Y ) = A + B1 ( X 1 X 1 ) + ... + B J ( X J X J ) .

A varincia do erro de previso dado por:

Var( ) = (1 + 1 / N ) 2 + ( X X ) T [V (b)] ( X X )
em que :
(X X ) :

vector das variveis independentes (centradas nas respectivas mdias)

(X X ) :
[V (B)] :

( X X ) transposto
matriz de varincia-covarincia dos estimadores B1,,BJ .

Intervalos de Confiana a (1 ) 100 % para a previso

Para valores de Y

Y t N J 1 ( / 2) (1 + 1 / N ) S 2 + ( X X ) T [V (b)] ( X X )

Para valores de Y

Y t N J 1 ( / 2) 1 / N S 2 + ( X X )T [V (b)] ( X X )

McGraw-Hill

Verlag Dashfer

1/ 2

1/ 2

Correlao entre variveis


Coeficiente amostral de
correlao simples
(entre Y e X1, , Xj)
Coeficiente de determinao
mltipla (entre Y e X1, , Xj)
Coeficientes de correlao
parcial (3 variveis)

Expresso
RYX 1 X 2 ... X J = RYY

R X1 X 2 | X 3 =

R X1 X 3 | X 2 =

R X 3 X 2 | X1 =
Coeficientes de correlao
simples (3 variveis)

R X1 X 2

(1 R X2 1 X 3 ) (1 R X 2 X 3 )
R X1 X 3 R X 1 X 2 R X 3 X 2
(1 R X2 1 X 2 ) (1 R X 3 X 2 )
R X 3 X 2 R X 3 X1 R X 2 X1
(1 R X2 3 X 1 ) (1 R X 2 X1 )

RX1 X 2 =

R X1 X 3 =

RX2 X3 =

McGraw-Hill

Verlag Dashfer

VDR
VT
R X1 X 3 R X 2 X 3

2
RYX
=
1 X 2 ... X J

S X1 X 2
S X1 X1 S X 2 X 2

S X1X 3
S X1 X1 S X 3 X 3
S X 2X3
S X 2 X 2 S X 3X3

Regresso com Variveis Mudas


Por vezes necessria a r epresentao do efeito de factores qualitativos nos modelos de r egresso. Isto
feito recorrendo a variveis mudas. No caso de t ratar de um fac tor qualitativo com dois nveis (A e B), o
modelo de regresso toma a seguinte forma:
Yn = + ( X n X ) + ( Z n Z ) + E n = + X n + Z n + E n ,

em que Zn representa a varivel muda, podendo tomar os valores

0, para o nvel A
Zn =
1, para o nvel B .
A ut ilizao do modelo anteriormente ref erido implica que o coeficiente an gular das duas rectas
representativas das duas s ituaes sej a idntico. No entanto, isto pode no acontecer, havendo ento a
necessidade de se c onsiderarem dois modelos d istintos (po r exemplo o modelo 0 e o modelo 1 co m
coeficientes angulares 0 e 1, respectivamente).
Para testar se a diferena entre 0 e 1 significativa, recorre-se a o teste seguinte:

Hipteses
H 0 : 0 = 1
H 1 : 0 1 , 0 < 1 ou 0 > 1

Teste Hiptese 0 = 1
Estatstica de teste
B1 B0
,
ET =
1
1
S
+ 1
0
S XX
S XX
com S 2 =

1
1
+
(N 0 2) S02 + (N1 2) S12 .
N 0 N1

Quando H0 verdadeira, ET segue uma distribuio t N 0 + N1 4 .

McGraw-Hill

Verlag Dashfer

Registe-se que para incorporar um factor qualitativo com K nveis n o modelo de regre sso de vem s er
includas k 1 variveis mudas. Por exemplo, para um factor com trs nveis (A, B e C), o modelo viria:
Yn = + X n + 1 Z1n + 2 Z 2 n + En ,
com

0, para o nvel A
Z1 =
1, para os nveis B ou C

0, para o nvel B
Z2 =
1, para os nveis A ou C

podendo as observaes de Z1 e Z2 tomar os seguintes valores:

Nvel A: Z1 = 0, Z2 = 1.

Nvel B: Z1 = 1, Z2 = 0.

Nvel C: Z1 = 1, Z2 = 1.

McGraw-Hill

Verlag Dashfer

Regresso no linear
Os modelos no lineares que traduzem relaes entre a varivel dependente e uma s varivel independente
podem s er conv ertidos e m modelos lineares por aplicao de t ransformaes s variveis depen dente o u
independente. Seguem-se exemplos de modelos onde a linearizao facilmente obtida:

Modelo original
Modelo

Yn = +
+ En
Xn
Modelo Exponencial

Yn = e + X n + En

Novas variveis

Modelo Curva S

Yn = e + / X n + E n
(com > 0 e < 0 )

McGraw-Hill

Verlag Dashfer

Modelo linearizado

1
Xn

Yn = + U n + E n

Z n = ln Yn

Z n = + X n + En

1
Xn
Z n = ln Yn

Z n = + U n + En

Un =

Un =

ENDEREOS

ESTATSTICA

2. Edio

Lista de endereos seleccionados


para o estudo da Estatstica
A collection of Applets for Visualization of Statistical Concepts
http://paginas.fe.up.pt/~jlborges/statistics/applets.html
STATLETS - 100% Pure Java Applets for Statistical Analysis and Graphics
http://www.mrs.umn.edu/~sungurea/statlets/statlets.htm
VESTAC: Java Applets for Visualization of Statistical Concepts
http://ucs.kuleuven.be/java/index.htm
Rice Virtual Lab in Statistics
http://www.ruf.rice.edu/~lane/rvls.html
Virtual Laboratories in Probability and Statistics
http://www.math.uah.edu/stat/
(disponvel apenas com o browser Mozilla Firefox)

Dashfer
Verlag
McGraw-Hill

ENDEREOS

An Interactive Environment for Teaching Statistics


http://www.stat.vt.edu/~sundar/java/applets/

ESTATSTICA

2. Edio

O ALEA - Aco Local Estatstica Aplicada


http://alea-estp.ine.pt/index.html
The World Wide Web Virtual Library: Statistics
http://www.stat.ufl.edu/vlib/statistics.html
Web-oriented Teaching Resources in Probability and Statistics
http://www.sal.hut.fi/Teaching/Resources/ProbStat/table.html
NIST-SEMATECH e-Handbook of Statistical Methods
http://www.itl.nist.gov/div898/handbook/
Journal of Statistics Education - An International Journal on the Teaching and
Learning of Statistics
http://www.amstat.org/publications/jse/contents_2006.html
PORTRAITS OF STATISTICIANS
http://www.york.ac.uk/depts/maths/histstat/people/

Dashfer
Verlag
McGraw-Hill