Академический Документы
Профессиональный Документы
Культура Документы
Aula 1
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Nota – Instalação das
Ferramentas de Análise do Excel
reinaldo@ele.puc-rio.br 2
Aula 1
Estatística Descritiva
Definições básicas – Introdução à
Probabilidade
Probabilidade
Espaço amostral
Eventos
Propriedades das probabilidades
Probabilidade Condicional
Independência
Teorema de Bayes
reinaldo@ele.puc-rio.br 3
Estatística Descritiva
reinaldo@ele.puc-rio.br 4
Prá que serve estatística?
reinaldo@ele.puc-rio.br 5
Estatística
População e Amostra
População = coleção de todos os elementos cujas
características desejamos conhecer. Os elementos (ou
"indivíduos") na população não são necessariamente
pessoas!
reinaldo@ele.puc-rio.br 6
Exemplos
1) População = eleitores na cidade do Rio de Janeiro
Amostra = 650 eleitores escolhidos aleatoriamente (ao acaso)
Característica de interesse: percentual de eleitores que
planejam votar num candidato X nas próximas eleições.
reinaldo@ele.puc-rio.br 7
Exemplos
reinaldo@ele.puc-rio.br 8
Por que fazer isso?
reinaldo@ele.puc-rio.br 9
E agora?
Existem 2 possibilidades:
Você pode simplesmente descrever estes dados
numéricos através de gráficos e tabelas. Isto é chamado
de estatística descritiva. A maioria das pesquisas de
mercado faz só isso, que é sem dúvida, muito
importante.
reinaldo@ele.puc-rio.br 10
E agora?
Você pode tentar tirar conclusões sobre
as características da população a partir
dos dados observados na amostra.
reinaldo@ele.puc-rio.br 11
E agora?
reinaldo@ele.puc-rio.br 12
Estatística descritiva
reinaldo@ele.puc-rio.br 13
Alguns gráficos da evolução de
variáveis ao longo do tempo
reinaldo@ele.puc-rio.br 14
ja
n/
7
12,000
17,000
22,000
27,000
32,000
7,000
ja 9
n/
8
ja 0
n/
8
ja 1
n/
8
ja 2
n/
8
ja 3
n/
8
ja 4
n/
8
ja 5
n/
8
ja 6
n/
8
ja 7
n/
8
ja 8
n/
8
ja 9
n/
9
ja 0
n/
Jan/1979 a Ago/2006
9
ja 1
n/
9
ja 2
n/
9
ja 3
n/
9
ja 4
n/
9
ja 5
n/
9
reinaldo@ele.puc-rio.br
ja 6
n/
9
ja 7
n/
9
ja 8
Consumo Total Energia Elétrica
n/
9
ja 9
n/
0
ja 0
n/
0
ja 1
n/
0
ja 2
n/
0
Consumo de Energia Elétrica - Total Brasil (GWh) - Fonte: Eletrobrás
ja 3
n/
0
ja 4
n/
0
ja 5
n/
06
15
4/
1/
4/ 200
16
20
24
28
32
36
40
44
48
52
56
60
64
68
72
76
80
84
3/ 0
3/ 200
5 0
2/ /200
7
31 /20 0
/
30 8/2 00
/1 0
29 0/2 00
/1 00
27 2/20 0
/ 0
28 2/2 0
/4 00
27 /20 1
/6 0
26 /20 1
25 /8/2 01
/ 0
24 10/ 01
/1 20
0
22 2/20 1
/2 01
23 /20
/4 0
22 /20 2
/ 0
21 6/20 2
Petróleo WTI
20 /8/ 02
/1 20
19 0/2 02
/1 00
17 2/20 2
/2 0
18 /20 2
/4 0
17 /20 3
/ 0
16 6/2 3
0
02/01/1991 a 03/11/2006
15 /8/2 03
/1 00
14 0/2 3
/1 00
12 2/20 3
/2 0
12 /20 3
/ 0
11 4/2 4
/6 00
monica@ele.puc-rio.br
10 /20 4
/8 0
Brent e WTI – dados diários –
9/ /20 4
10 0
8/ /20 4
EXEMPLO: Preços de Petróleo
12 0
4
6/ /20
2/ 04
7/ 00 2
4/ 5
Petróleo Brent
6/ 200
6/ 5
5/ 200
8
4/ /20 5
10 0
3/ /2 5
12 00
5
Preços de Petróleo (US$/Barril) - Janeiro de 2000 a Novembro de 2006
1/ /200
2/ 5
2/ 200
4 6
1/ /200
6
31 /20 6
/7 06
29 /2
/9 00
/2 6
00
6
16
EXEMPLO: IPC-FIPE
monica@ele.puc-rio.br 17
EXEMPLO: IPC-FIPE
reinaldo@ele.puc-rio.br 18
IPC-FIPE - Janeiro de 2002
a 10/2006
Inflação FIPE (% a.m)- 01/2002 a 10/2006
3.0
2.5
2.0
1.5
1.0
0.5
0.0
2
6
02
03
04
05
06
2
6
2
6
l/0
l/0
l/0
l/0
l/0
t/0
t/0
t/0
t/0
t/0
r/0
r/0
r/0
r/0
r/0
n/
n/
n/
n/
n/
ju
ju
ju
ju
ju
-0.5
ou
ou
ou
ou
ou
ab
ab
ab
ab
ab
ja
ja
ja
ja
ja
INFLAÇÃO - IPC - FIPE (% a.m.)
reinaldo@ele.puc-rio.br 19
IBOVESPA Diário – Julho de 1994 a
a 06/08/2004
reinaldo@ele.puc-rio.br 20
IBOVESPA Diário – Julho de 1994 a
a 06/08/2004
reinaldo@ele.puc-rio.br 21
11000.00
14000.00
17000.00
20000.00
23000.00
26000.00
2000.00
5000.00
8000.00
04/07/1994
08/11/1994
17/03/1995
25/07/1995
29/11/1995
a 06/08/2004
11/04/1996
14/08/1996
17/12/1996
30/04/1997
03/09/1997
08/01/1998
19/05/1998
IBOVESPA em Dólares
22/09/1998
01/02/1999
10/06/1999
14/10/1999
21/02/2000
28/06/2000
reinaldo@ele.puc-rio.br
31/10/2000
13/03/2001
18/07/2001
22/11/2001
IBOVESPA em Pontos em Reais e Dólares
04/04/2002
08/08/2002
IBOVESPA em R$
IBOVESPA Diário – Julho de 1994 a
10/12/2002
17/04/2003
25/08/2003
26/12/2003
05/05/2004
22
Gráfico de Dispersão
(uma variável versus outra)
reinaldo@ele.puc-rio.br 23
Exemplo - IBOVESPA e Dólar
Ibovespa versus Dólar PTAX -10/12/2002 a 12/06/2003
14,500
14,000
11,500
11,000
10,500
10,000
y = -3830.7x + 24366
9,500
R2 = 0.8954
9,000
2.80 2.90 3.00 3.10 3.20 3.30 3.40 3.50 3.60 3.70 3.80 3.90
reinaldo@ele.puc-rio.br 24
Exemplo - IBOVESPA e Dólar –
incorporação de novos dados
26,000
24,000
Claramente, um modelo linear não é mais
apropriado quando levamos em consideração os
22,000
novos dados (entre junho de 2003 e março de
2004) - OU SEJA: O MODELO MUDOU!
20,000
18,000
16,000
y = -10612x + 48010
14,000
R2 = 0.4532
12,000
10,000
8,000
2.80 2.90 3.00 3.10 3.20 3.30 3.40 3.50 3.60 3.70 3.80 3.90
reinaldo@ele.puc-rio.br 25
Exemplo - IBOVESPA e Dólar –
incorporação de novos dados
reinaldo@ele.puc-rio.br 26
10
/
11,000
13,000
15,000
17,000
19,000
21,000
23,000
25,000
9,000
25 12/
/ 0
09 12/ 2
/ 0
24 01/ 2
/ 0
08 01/ 3
/ 0
23 02/ 3
/ 0
10 02/ 3
/ 0
25 03/ 3
/ 0
09 03/ 3
/ 0
24 04/ 3
/ 0
09 04/ 3
/ 0
24 05/ 3
/ 0
08 05/ 3
/ 0
23 06/ 3
/ 0
08 06/ 3
/ 0
23 07/ 3
/ 0
07 07/ 3
/ 0
22 08/ 3
/ 0
06 08/ 3
/ 0
21 09/ 3
/ 0
06 09/ 3
reinaldo@ele.puc-rio.br
/ 0
21 10/ 3
/ 0
incorporação de novos dados
05 10/ 3
/ 0
Exemplo - IBOVESPA e Dólar –
Junho de 2003
IBOVESPA - 10/12/2002 a 02/03/2004
20 11/ 3
/ 0
05 11/ 3
/ 0
20 12/ 3
/ 0
04 12/ 3
/ 0
19 01/ 3
/ 0
03 01/ 4
/ 0
18 02/ 4
/0 04
2/
04
27
Exemplo - temperaturas
Dados:Temperatura máxima mensal (média das
máximas diárias) na estação de Santa Cruz (Rio
de Janeiro) entre Jan/1982 e Dez/1991.
reinaldo@ele.puc-rio.br 28
Exemplo - temperaturas
reinaldo@ele.puc-rio.br
mai/88
set/88
jan/89
Temperaturas Máximas - 1982 a 1991
mai/89
set/89
jan/90
mai/90
set/90
jan/91
mai/91
set/91
30
Exemplo - temperaturas
reinaldo@ele.puc-rio.br 31
Exemplo - temperaturas
reinaldo@ele.puc-rio.br 32
Exemplo - temperaturas
A escolha do número de intervalos é arbitrária.
reinaldo@ele.puc-rio.br 34
Exemplo - temperaturas
reinaldo@ele.puc-rio.br 35
Exemplo - temperaturas
reinaldo@ele.puc-rio.br 36
Exemplo – temperaturas
reinaldo@ele.puc-rio.br 37
Exemplo - temperaturas
Histograma:
Gráfico de barras, onde o eixo vertical contém as
frequências (ou freqüências relativas) e o eixo
horizontal contém os intervalos de classes. Muitas
vezes faz-se a área de cada barra igual à freqüência
relativa de cada classe, de tal forma que a área total
sob o histograma é 1 (100%).
reinaldo@ele.puc-rio.br 38
Histograma – produção no Excel
reinaldo@ele.puc-rio.br 39
Histograma – produção no Excel
reinaldo@ele.puc-rio.br 40
Histograma – produção no Excel
Células contendo os dados
reinaldo@ele.puc-rio.br 42
Histograma – produção no Excel
Note que este histograma usa intervalos diferentes
dos especificados na tabela de freqüência mostrada
anteriormente Histograma
35
30
25
20
Freqüência
15
10
0
24 26 28 30 32 34 36 38 acima de 38
Intervalo
reinaldo@ele.puc-rio.br 43
Histograma – Retorno diário do
preço do petróleo WTI – 01/1991 a
08/2006
Histograma - Log Retornos Petróleo WTI - 1991 a 2006
800
700
A grande maioria dos
600 retornos diários
500
(variações diárias)
nesta faixa, mas
Frequency
400
também variações
300 extremas
200
100
10 %
11 %
12 %
13 %
14 %
%
e
3%
2%
0%
9%
8%
7%
6%
5%
4%
3%
10 %
%
%
%
%
%
%
%
%
%
%
%
-1 %
-1 %
-1 %
4%
or
2
.5
.6
.7
.8
.0
.1
.2
.3
.4
.5
.6
.0
.9
.8
.7
.6
.5
1
2
3
0.
1.
2.
2.
3.
4.
5.
6.
7.
8.
9.
M
3.
2.
1.
0.
-9
-8
-7
-6
-6
-5
-4
-3
-2
-1
-0
-1
Bin
reinaldo@ele.puc-rio.br 44
Produção (% potência máxima)
0.0
10.0
20.0
30.0
50.0
60.0
80.0
40.0
70.0
Jan-81
Mar-82
May-83
Jul-84
Sep-85
Nov-86
Jan-88
Mar-89
May-90
eólica mensal
Jul-91
Sep-92
Nov-93
(Icaraizinho - NE).
Jan-95
Mar-96
May-97
Jul-98
Sep-99
reinaldo@ele.puc-rio.br
Nov-00
Jan-02
Mar-03
May-04
Exemplo: Produção da energia
Jul-05
Sep-06
Nov-07
Jan-09
Mar-10
May-11
45
Jul-12
Hitograma
Produção da energia eólica mensal (Icaraizinho - NE).
10% 100%
9% 90%
reinaldo@ele.puc-rio.br 46
Diagrama de Pareto
reinaldo@ele.puc-rio.br 47
Exemplo – Consumo Residencial
Os dados a seguir representam a distribuição de
domicílios residenciais por classe de consumo de
energia elétrica na área de concessão de uma certa
distribuidora de energia. Os dados referem-se a uma
pesquisa realizada em 2012 com uma amostra de 2100
domicílios.
Consumidores Residenciais
Faixas de consumo número de domicílios frequência relativa
< 80 kWh 170 (170/2100)x100 = 8,1%
80 - 150 kWh 467 (467/2100)x100 = 22,24%
151 - 220 kWh 445 21,19%
221 - 400 kWh 582 27,71%
>400 kWh 436 20,76%
Total 2100
reinaldo@ele.puc-rio.br 48
Exemplo – Consumo Residencial
O diagrama de Pareto para estes dados é:
Diagrama de Pareto
600
500
Número de domicílios
400
300
200
100
0
221 - 400 80 - 150 151 - 220 >400 kWh < 80 kWh
kWh kWh kWh
Faixa de consumo
reinaldo@ele.puc-rio.br 49
0.0
2.0
4.0
6.0
8.0
0.0
2.0
4.0
6.0
8.0
12.0
10.0
12.0
10.0
0.0
2.0
4.0
6.0
8.0
10.0
12.0
Street2014.2 Street2014.2 Street2014.2
Street2014.2 Street2014.2 Street2014.2
Street2014.2 Street2014.2 Street2014.2
Street2014.2 Street2014.2 Street2014.2
Street2014.2 Street2014.2 Street2014.2
Street2014.2 Street2014.2 Street2014.2
Street2014.2 Street2014.2 Street2014.2
Street2014.2 Street2014.2 Street2014.2
Street2014-1 Street2014-1 Street2014-1
Street2014-1 Street2014-1 Street2014-1
Street2014-1 Street2014-1 Street2014-1
Street2013-2 Street2013-2 Street2013-2
Street2013-2 Street2013-2 Street2013-2
Street2013-2 Street2013-2 Street2013-2
Street2013-2 Street2013-2 Street2013-2
Street2013-2 Street2013-2 Street2013-2
Street2013-2 Street2013-2 Street2013-2
Street2013-2 Street2013-2 Street2013-2
Street2013-2 Street2013-2 Street2013-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-2 Reinaldo2014-2 Reinaldo2014-2
Reinaldo2014-1 Reinaldo2014-1 Reinaldo2014-1
Reinaldo2014-1 Reinaldo2014-1 Reinaldo2014-1
Reinaldo2014-1 Reinaldo2014-1 Reinaldo2014-1
Reinaldo2014-1 Reinaldo2014-1 Reinaldo2014-1
Reinaldo2014-1 Reinaldo2014-1 Reinaldo2014-1
Reinaldo2014-1 Reinaldo2014-1 Reinaldo2014-1
P2
P1
60%
50%
40%
30%
20%
10%
0%
0 1 2 3 4 5 6 7 8 9 10
Média antes da P4
Medidas Numéricas
reinaldo@ele.puc-rio.br 53
Medidas Numéricas
Medidas de Dispersão
dizem o quanto os seus dados estão “espalhados”
exemplo: desvio padrão e variância amostrais, amplitude
amostral
reinaldo@ele.puc-rio.br 54
Medidas de Tendência Central
Média Amostral
1 n
X Xi
n i 1
No Excel: função Média (....)
Considere agora a amostra x1, x2, ..., xn e suponha que você
a ordene, de tal forma que x(1) seja o menor elemento da
amostra, x(2) seja o segundo menor elemento, ...., x(n) seja o
maior elemento da amostra. Os valores x(1), x(2), ..., x(n) são
chamados de estatísticas de ordem da amostra. Outras
medidas de tendência central e de dispersão serão
definidas a partir das estatísticas de ordem.
reinaldo@ele.puc-rio.br 55
Produção (% potência máxima)
0.0
10.0
20.0
30.0
50.0
60.0
80.0
40.0
70.0
Jan-81
Mar-82
May-83
Jul-84
Sep-85
Nov-86
Jan-88
Mar-89
May-90
(Icaraizinho - NE).
Jul-91
Sep-92
Nov-93
Jan-95
Mar-96
May-97
Jul-98
Sep-99
reinaldo@ele.puc-rio.br
Nov-00
Jan-02
Mar-03
May-04
Medidas de Tendência Central
Jul-05
Sep-06
Nov-07
Média Amostral: Produção da energia eólica mensal
Jan-09
Mar-10
May-11
Jul-12
56
37.5%
Medidas de Tendência Central
50%
56%
40%
30%
20% 22%
10%
0%
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Anos do Histórico
reinaldo@ele.puc-rio.br 57
Medidas de Tendência Central
Mediana
É definida a partir das estatísticas de ordem.
X n X n
2 1
2
se n, o tamanho da amostra, é par
2
m ou
X
n 1 se n, o tamanho da amostra, é ímpar
2
reinaldo@ele.puc-rio.br 59
Medidas de Dispersão
reinaldo@ele.puc-rio.br 60
Medidas de Dispersão:
Produção da energia eólica mensal
(Icaraizinho - NE).
70%
60%
Produção Média (% Pot)
50%
40%
30% Aug
Feb
20%
Tem maior
10%
dispersão:
0% é mais
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 “espalhada”
Anos do Histórico em torno da
média
reinaldo@ele.puc-rio.br 61
Medidas de Dispersão
Variância Amostral
É a medida mais comum de dispersão . A
variância amostral, denotada por s2 é definida
como:
s2
1 n
X
2
X
n 1
i
i 1
1 n
i
2
s s2 X X
n 1 i 1
reinaldo@ele.puc-rio.br 63
Medidas de Dispersão: Produção da
energia eólica mensal (Icaraizinho -
NE).
4.9%
50%
40%
30%
8.3%
20%
10%
0%
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Anos do Histórico
reinaldo@ele.puc-rio.br 64
Medidas de Dispersão
reinaldo@ele.puc-rio.br 65
Como obter estatísticas
descritivas no Excel?
Opção 1
Use as funções apropriadas, por exemplo,
média(..), med(...), máximo(...), mínimo(...),
desvpad(...), ...
Opção 2
Use a ferramenta “estatística descritiva”
dentro das opções de “análise de dados”,
como indicado na tela a seguir. Várias outras
estatísticas, como a curtose (que mede o
“peso” das “caudas”(extremos) e a assimetria,
são também fornecidas).
reinaldo@ele.puc-rio.br 66
Como obter estatísticas
descritivas no Excel?
reinaldo@ele.puc-rio.br 67
Como obter estatísticas
descritivas no Excel?
Células contendo os
dados
Indicador de nome
da variável na 1a.
posição da coluna
ou linha
Produzir estatísticas
descritivas
reinaldo@ele.puc-rio.br 68
Percentis
reinaldo@ele.puc-rio.br 69
Percentis: no MS Excel
reinaldo@ele.puc-rio.br 70
Quartis
reinaldo@ele.puc-rio.br 71
Estatísticas Descritivas – Retorno
do Petróleo WTI – 01/1991 a 08/2006
reinaldo@ele.puc-rio.br 72
Percentis – Retorno do Petróleo
WTI – 01/1991 a 08/2006
Percentis
5% -3.53%
10% -2.53%
5% dos retornos 25% -1.17%
abaixo de -3.53%
50% 0.07%
75% 1.28%
90% 2.51%
95% 3.45%
90% dos retornos
abaixo de +2.51%
reinaldo@ele.puc-rio.br 73
Percentil:
Produção da energia eólica mensal
(Icaraizinho - NE).
Percentil = 50% 45% 40% 35% 30% 25% 20% 15% 10% 5%
Jan 24.9 24.5 23.6 22.3 20.9 20.1 19.1 17.7 16.4 13.8
Feb 18.8 18.5 18.2 17.2 16.7 16.0 15.5 14.4 12.1 11.0
Mar 15.7 14.5 13.7 13.3 12.4 10.5 10.2 9.9 9.5 9.0
Apr 17.5 16.0 14.3 12.0 11.6 10.6 9.8 9.3 9.2 8.0
May 24.1 21.8 18.9 17.7 16.5 15.6 14.6 12.5 11.4 10.9
Jun 30.6 29.4 27.6 27.2 26.9 26.2 25.3 23.5 23.2 21.2
Jul 37.7 37.2 36.8 36.6 36.4 35.9 33.7 30.7 27.7 26.5
Aug 54.6 54.4 53.7 53.4 52.6 51.9 50.6 50.3 49.7 47.7
Sep 62.1 61.9 61.0 60.4 60.1 58.3 56.3 54.3 51.2 49.7
Oct 58.3 57.9 56.3 56.0 55.3 54.3 51.3 50.6 48.7 46.2
Nov 52.3 51.9 51.5 50.4 49.7 48.4 47.5 45.4 44.6 41.0
Dec 39.9 39.5 38.7 37.4 35.2 31.9 31.5 28.0 27.0 21.4
Média 36.4 35.6 34.5 33.7 32.8 31.6 30.4 28.9 27.6 25.5
reinaldo@ele.puc-rio.br 74
Percentil:
Produção da energia eólica mensal
(Icaraizinho - NE).
Feb Aug
100%
95%
90%
85%
80%
Frequência Relativa Acumulada
75%
70%
65%
60%
55%
50%
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
- 10.0 20.0 30.0 40.0 50.0 60.0 70.0 80.0
Produção de energia (% potência máxima)
reinaldo@ele.puc-rio.br 75
Análise dos Retornos do
IBOVESPA
Considere agora os retornos diários do
IBOVESPA no período entre 04 de julho de 1994 e
06/08/2004.
500
450
400
350
300
Freqüência
250
200
150
100
50
0
- 7 - 6 - 6 - 5 - 5 - 4 - 4 - 3 - 3 - 2 - 2 - 1 - 1 - 0 0. 0. 1. 1. 2. 2. 3. 3. 4. 4. 5. 5. 6. 6. 7. M
.0 .5 .0 .5 .0 .5 .0 .5 .0 .5 .0 .5 .0 .5 00 50 00 50 00 50 00 50 00 50 00 50 00 50 00 ai
0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% 0% % % % % % % % % % % % % % % % s
Bloco
reinaldo@ele.puc-rio.br 77
Percentis dos Retornos
reinaldo@ele.puc-rio.br 79
-
-1
500
1,000
1,500
2,000
2,500
3,000
5.
00
-7 %
.0
0
-6 %
.5
0
-6 %
.0
0
-5 %
.5
0
-5 %
.0
0
-4 %
.5
0
-4 %
IBOVESPA
.0
0
-3 %
.5
0
-3 %
.0
0
-2 %
.5
0
-2 %
.0
0
-1 %
.5
0
-1 %
.0
0
-0 %
.5
0%
0.
00
%
0.
50
%
1.
00
%
1.
50
%
2.
00
%
Análise dos Retornos do
reinaldo@ele.puc-rio.br
2.
50
%
3.
00
%
3.
Frequüências Acumuladas - Retornos Diários
50
%
4.
00
%
4.
50
%
5.
00
%
5.
50
%
6.
00
%
6.
50
%
7.
00
%
20
%
30
%
80
Análise dos Retornos do
IBOVESPA
Se dividirmos cada uma destas freqüências
por 2501 obtemos as freqüências relativas
acumuladas – veremos mais tarde que isso
é uma aproximação para a função de
distribuição acumulada.
reinaldo@ele.puc-rio.br 81
-1
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
55%
60%
65%
70%
75%
80%
85%
90%
95%
100%
5.
00
-7 %
.0
0
-6 %
.5
0
-6 %
.0
0
-5 %
.5
0
-5 %
.0
0
-4 %
.5
0
IBOVESPA
-4 %
.0
0
-3 %
.5
0
-3 %
.0
0
-2 %
.5
0
-2 %
.0
0
-1 %
.5
0
-1 %
.0
0
-0 %
.5
0%
0.
00
%
0.
50
%
1.
00
%
1.
50
%
2.
00
%
2.
50
%
Análise dos Retornos do
reinaldo@ele.puc-rio.br
3.
00
%
3.
50
%
4.
00
%
Frequüências Relativas Acumuladas - Retornos Diários
4.
50
%
5.
00
%
5.
50
%
6.
00
%
6.
50
%
7.
00
%
20
%
30
%
82
Assimetria
i X X i X X
n i 1 i 1
Em geral, se a
assimetria é positiva, a
média é MAIOR que a
mediana.
Na curva A acima a
assimetria é positiva, O oposto ocorre se a
a curva B é simétrica assimetria é negativa (em
e a curva C tem geral média MENOR que a
mediana).
assimetria negativa.
reinaldo@ele.puc-rio.br 84
Assimetria
reinaldo@ele.puc-rio.br 85
Curtose
reinaldo@ele.puc-rio.br 87
Curtose
reinaldo@ele.puc-rio.br 88
Curtose
A fórmula do excesso de curtose é:
n X i X
n
4
4 i 1
2
3
n 2
Xi X
i 1
Note que, se os seus dados são Normais, esta
medida é próxima de zero.
o Se k4 for igual a zero a curva é mesocurtica.
o Se k4 for maior que zero a curva é platicurtica.
o Se k4 for menor que zero a curva é leptocurtica.
reinaldo@ele.puc-rio.br 89
Exercício1 (para casa)
Tomou-se uma amostra de 60 estudantes que fizeram uma
prova, e, a estatística descritiva, diagrama de frequência e
gráfico das notas da prova estão a seguir:
ESTATÍSTICA DESCRITIVA
Média 5,4
Erro padrão 0,3 Frequência relativa
Bloco Freqüência acumulada
Mediana 5,6
Moda 3,8 ≤ 1,2 1 1,67%
Desvio padrão 2,6 (1,2 - 2,4] 11 20,00%
Variância da amostra 7,0
(2,4 - 3,6] 4 26,67%
Curtose -1,2
Assimetria -0,1 (3,6 - 4,8] 9 41,67%
Intervalo 8,4 (4,8 - 6,0] 10 58,33%
Mínimo 1,2
(6,0 - 7,2] 8 71,67%
Máximo 9,6
Soma 325,7 (7,2 - 8,4] 5 80,00%
Contagem 60,0 > 8,4 12 100,00%
reinaldo@ele.puc-rio.br
90
Exercício1 (para casa)
Histograma
reinaldo@ele.puc-rio.br
91
Exercício1 (para casa)
Pergunta-se:
a) 80 % dos alunos, tiraram notas menores ou igual a
8,4.
V ( ) ou F ( ).
b) 60 % das notas dos alunos estão entre 1,2 e 8,4.
V ( ) ou F ( ).
c) Os valores da média e mediana permitem dizer que a
distribuição é simétrica.
V ( ) ou F ( ).
d) Podemos dizer que 20% dos alunos tiraram notas
menores ou igual a 2,4.
V ( ) ou F ( ).
reinaldo@ele.puc-rio.br
92
Exercício1 (para casa)
e) A assimetria negativa indica que existem mais notas
altas e menos notas baixas.
V ( ) ou F ( ).
f) Podemos dizer que a nota 5,4 é a que mais vezes
acontece.
V ( ) ou F ( ).
g) O coeficiente de Variação conforme a estatística
descritiva é igual a 1,296.
V ( ) ou F ( ).
h) Construa o diagrama de Pareto desta amostra,
montando em blocos onforme o diagrama de
frequência dado (esboce o gráfico).
reinaldo@ele.puc-rio.br
93
Exercício1 (para casa)
i)- Na tabela abaixo, temos o diagrama de frequência de uma
amostra de 50 elementos onde: os intervalos [Li-1-L1) são
iguais; x i : é o ponto médio de cada classe (intervalo); fi:
frequência absoluta simples; Fi: frequência cumulada.
- Preencher os espaços vazios do diagrama de frequência.
[Li-1-L1) xi fi Fi x if i
[160 – 180) 850
190
27 2730
9
-260) 1500
50
reinaldo@ele.puc-rio.br
94
PROBEST
Aula 2
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandes@gmail.com
street@ele.puc-rioi.br jjampinho@gmail.com
roxanajc@ele.puc-rio.br 1
Definições básicas –
Introdução à Probabilidade
reinaldo@ele.puc-rio.br 2
Probabilidades – Introdução
Experiência aleatória
Aquela cujo resultado não pode ser conhecido antes da
realização da mesma, por exemplo:
O resultado da jogada de um dado;
O número de carros que passam num posto de pedágio
num intervalo de meia hora;
A cotação do dólar em 02/03/2005;
Os números que vão “sair” no concurso da Mega-Sena da
próxima semana;
A carga no Sudeste às 18 horas de amanhã.
reinaldo@ele.puc-rio.br 5
Experiência Aleatória
reinaldo@ele.puc-rio.br 6
Espaço Amostral
É o conjunto de todos os possíveis resultados de
uma experiência aleatória.
Total de nomes da lista telefônica do Rio de Janeiro
(???)
Valores entre R$ 1.50 e R$ 150 (cotação do dólar em
02/03/2007)
Uma moeda é jogada 3 vezes, e observamos a
seqüência de caras (H) e coroas (T). O espaço amostral
é S = { HHH, THH, HTH, HHT, TTH, THT, HTT, TTT}
Uma lâmpada é fabricada e testada até queimar, e
registra-se o tempo de ocorrência deste evento. O
espaço amostral é S = { x : x > 0 }
O espaço amostral será denotado aqui por S.
reinaldo@ele.puc-rio.br 7
Evento
reinaldo@ele.puc-rio.br 8
Evento
É um subconjunto de S em .
é o espaço de todos os eventos (sigma álgebra de S).
Uma sigma-álgebra de S é um conjunto de subconjuntos de S
que contém S e é fechado na união contável e no
complemento de seus elementos.
Da definição, segue diretamente que ambos e S são
eventos.
Se o espaço amostral é finito e possui n elementos, então
existem 2n subconjuntos deste espaço amostral, isto é,
existem 2n eventos ou elementos em .
É claro que não podemos dizer quantos eventos existem
associados a um espaço amostral infinito.
reinaldo@ele.puc-rio.br 9
Propriedades de Eventos
Espaço Amostral
Evento A Evento B
reinaldo@ele.puc-rio.br 10
Propriedades de Eventos
Espaço Amostral
Evento A Evento B
reinaldo@ele.puc-rio.br 11
Propriedades de Eventos
Espaço Amostral
Ac
reinaldo@ele.puc-rio.br 12
Eventos mutuamente
exclusivos
Eventos mutuamente exclusivos – os elementos de
A não pertencem a B e vice-versa, isto é, A B = .
Note que dois eventos complementares são mutuamente
exclusivos
Espaço Amostral
A B
reinaldo@ele.puc-rio.br 13
Definição axiomática de
probabilidade
A definição axiomática de probabilidade encara
probabilidade como uma função que recebe um
subconjunto do espaço amostral (evento) e
retorna a sua “chance” de ocorrência.
P:[0,1]
reinaldo@ele.puc-rio.br 14
Definição axiomática de
probabilidade
Considere o experimento de lançar uma moeda.
O conjunto amostral é S = {H,T}
O espaço de eventos é = {Ø;{H};{T};S}
A probabilidade mede a chance dos eventos
P({H}) = P({T}) = ½, P(Ø) = 0 e P(S) = 1.
Seja A o evento observar H após o experimento: A = {H}.
Suponha a realização de n experimento similares e que N(A,n)
represente o número de vezes em que o evento A foi
observado nas n realizações.
Hipótese: Se assumimos que o experimento é ivariante no
tempo, podemos supor que a freq. relat. passada é um
indicador da “chance” que um evento A possui em ocorrer
novamente... Então, P(A) pode ser entendida como:
limn∞N(A,n)/n
reinaldo@ele.puc-rio.br 15
Definição axiomática de
probabilidade
A
[0,1]
probabilidade
reinaldo@ele.puc-rio.br 17
Definição axiomática de
probabilidade
A versão mais simples da expressão iii) será usada
muitas vezes neste curso, e por isso a colocamos em
destaque:
P(A1 A2) = P(A1) + P(A2) se A1 e A2 forem
mutuamente exclusivos.
reinaldo@ele.puc-rio.br 19
Propriedades das
Probabilidades
Esta última propriedade resulta numa certa
“ordenação" dentro do espaço amostral, e diz
simplesmente que, se um evento A1 está contido
noutro, a probabilidade de A1 é menor ou igual
à probabilidade do evento que o contém.
reinaldo@ele.puc-rio.br 20
Propriedades das
Probabilidades
Para quaisquer A1 e A2 em S:
P(A1 A2) = P(A1) + P(A2) - P(A1 A2)
reinaldo@ele.puc-rio.br 21
Partição do Espaço Amostral
É formada por eventos cuja interseção é nula e cuja
união é o próprio espaço amostral.
C D
monica@ele.puc-rio.br 22
Em resumo: casos particulares
da lei da adição
Eventos mutuamente exclusivos
P(A B) = P(A) + P(B), pois P(A B) = 0
Eventos complementares
P(A Ac) = P(A) + P(Ac) = 1, já que P(A Ac) = 0
reinaldo@ele.puc-rio.br 23
Exemplo – propriedades das
probabilidades
Um banco possui 10 fundos de investimento. Desses,
6 são de renda fixa, 4 são corporativos e 2 são de
renda fixa e corporativos. Se escolhermos um fundo
ao acaso, qual é a probabilidade dele ser de renda
fixa ou corporativo?
Solução (evento A: renda fixa, evento B: corporativo)
Universo = 10 elementos
P(A B) = P(A) + P(B) – P(A B)
P(A) = 6/10 = 0.6
P(B) = 4/10 = 0.4
P(A B) = 2/10 = 0.2
P(A B) = 0.6 + 0.4 – 0.2 = 0.8 ou 80%
reinaldo@ele.puc-rio.br 24
Probabilidade Condicional
Motivação
Um grupo de 50 pessoas inclui 40 com diploma de curso
superior, 20 microempresários e 10 que são, ao mesmo
tempo, portadores de diploma do curso superior e
microempresários.
reinaldo@ele.puc-rio.br 26
Probabilidade Condicional
Exemplo
Em uma amostra de 100 funcionários de
uma empresa:
35 são homens e fumantes,
28 são homens e não fumantes,
17 são mulheres fumantes
20 são mulheres e não fumantes.
Qual a probabilidade de um funcionário
escolhido ao acaso ser fumante, dado que ele
é homem?
reinaldo@ele.puc-rio.br 29
Probabilidade Condicional
Não
B:Fumantes A:Homens Fumantes Total
fumantes
Homens 35 28 63
Mulheres 17 20 37
Total 52 48 100
Não
Mulheres fumantes
reinaldo@ele.puc-rio.br 30
Probabilidade Condicional
Note que, quando definimos que o evento A
ocorreu (o funcionário é homem), restringimos o
espaço amostral à ocorrência do evento B (o
funcionário é fumante)
O novo universo passa a ser o próprio evento A
Não
Fumantes Total
fumantes
B:Fumantes A:Homens Homens 35 28 63
Mulheres 17 20 37
Total 52 48 100
Ou empregando as probabilidades:
P(A) = 63/100 = 0.63
P(A B) = 35/100 = 0.35
P(A B)/P(A) = 0.35/0.63 = 0.556
reinaldo@ele.puc-rio.br 32
Probabilidade Condicional
reinaldo@ele.puc-rio.br 35
Probabilidade Condicional
Para eventos independentes,
P(A | B) = P(A).P(B)/P(B) = P(A)
reinaldo@ele.puc-rio.br 36
Independência e Dependência
Exemplo
Tomou-se uma amostra com 1000 pessoas num
shopping-center com o objetivo de investigar a
relação entre renda familiar e posse de cartões de
crédito.
reinaldo@ele.puc-rio.br 37
Independência e Dependência
Renda Familiar < R$ 500 R$ 501 a R$1000 R$ 1001 a R$ 2000 > R$ 2001
Núm. Cartões
0 260 170 80 20 530
1 50 100 110 60 320
2 ou mais 20 25 45 60 150
330 295 235 140 1000
reinaldo@ele.puc-rio.br 38
Independência e Dependência
Mas:
P(renda abaixo de R$ 500) = 330/1000 = 0.33
P( 0 cartões de crédito ) = 530/1000 = 0.53
reinaldo@ele.puc-rio.br 39
Exemplo
P(B|A) = M / (M + N-1)
reinaldo@ele.puc-rio.br 41
Probabilidade Condicional
reinaldo@ele.puc-rio.br 42
Probabilidade Condicional
reinaldo@ele.puc-rio.br 43
Exemplo
reinaldo@ele.puc-rio.br 44
Exemplo
Pela definição de probabilidade condicional:
Pr H S Pr S | H Pr H
Pr H | S
Pr S Pr S
Mas Pr (H) e Pr (S | H) são conhecidas, e então só
é preciso calcular Pr (S) (a probabilidade de um
fumante na população). Mas, note que:
S = (S M) (S H) e os conjuntos (S M) e (S H) são
disjuntos
Pr ( S ) = Pr ( S M ) + Pr ( S H ) =
= Pr ( S | H ).Pr ( H ) + Pr ( S | M ).Pr ( M ) =
= ( 0.5 ) ( 0.4 ) + ( 0.3 ) ( 0.6 ) = 0.38
reinaldo@ele.puc-rio.br 45
Exemplo
Finalmente:
Pr H S Pr S | H Pr H 0.50.4 20 10
Pr H | S 0.5263
Pr S Pr S 0.38 38 19
reinaldo@ele.puc-rio.br 46
Independência
reinaldo@ele.puc-rio.br 47
Independência para mais de
dois eventos
Considere uma coleção de n eventos A1,
A2, ..., An. Estes eventos são
independentes se, e somente se:
i) Pr ( A1 A2 ... An ) =
= Pr(A1) . Pr(A2) ... Pr(An) e,
1) Pr( A B) = Pr(A).Pr(B)
2) Pr( A C) = Pr(A).Pr(C)
3) Pr( B C) = Pr(B).Pr(C)
4) Pr( A B C) = Pr(A).Pr(B).Pr(C)
reinaldo@ele.puc-rio.br 49
Partição do Espaço Amostral
B1 B2
B3
A
B6 B
B4
B7
C D
B8
B5
reinaldo@ele.puc-rio.br 50
Partição do Espaço Amostral
reinaldo@ele.puc-rio.br 51
Partição do Espaço Amostral
B1 B2
B3
B6
B4
B7
A
B8
B5
reinaldo@ele.puc-rio.br 52
Partição do Espaço Amostral
reinaldo@ele.puc-rio.br 53
Teorema da Probabilidade
Total
É um resultado que decorre diretamente
das propriedades de uma partição, como
mostrado nas transparências anteriores.
Note que:
Pr(A) = Pr (A B1) + Pr (A B2) + Pr (A B3) +
.....+ Pr (A Bk)
Mas:
Pr (A Bi ) = Pr( Bi ). Pr(ABi) para i =1, 2, ...., k.
Combinando estes dois resultados fornece o
teorema da probabilidade total.
reinaldo@ele.puc-rio.br 54
Teorema da Probabilidade
Total
Sejam B1, B2 , ...., Bk uma partição de S e A um
evento qualquer em S. Então:
j j j j
j 1 j 1
reinaldo@ele.puc-rio.br 58
Exemplo - Bayes
reinaldo@ele.puc-rio.br 60
Exemplo - Bayes
Solução
a) Considere os eventos:
A1 = {economistas}, A2 = {engenheiros}, A3
= {analistas de sistemas}, G = {cargo de
gerência}
reinaldo@ele.puc-rio.br 61
Exemplo - Bayes
reinaldo@ele.puc-rio.br 62
Exemplo - Bayes
reinaldo@ele.puc-rio.br 63
Exemplo - Bayes
reinaldo@ele.puc-rio.br 67
Exemplo - Bayes
reinaldo@ele.puc-rio.br 70
Teorema de Bayes – exercício1
(para casa)
reinaldo@ele.puc-rio.br 72
Teorema de Bayes – exercício1
(para casa)
Dentre os compradores de Volkswagen, 16%
retornam à loja com alguma reclamação sobre o
carro adquirido.
Dentre os compradores de outras marcas, 18%
retornam à loja com alguma reclamação sobre o
carro adquirido.
Pergunta-se:
Um comprador entra na loja com uma reclamação
durante o período de vigência da garantia.
Qual a probabilidade dele ter comprado um carro de
cada uma das marcas (incluindo “outras”)?
Resposta: Pr(R) = 0,1316
PrC1 | R 6,38% PrC3 | R 20,52% PrC5 | R 24,32%
PrC2 | R 7,90% PrC4 | R 12,16% PrC6 | R 28,72%
reinaldo@ele.puc-rio.br 73
Teorema de Bayes – exercício2
(para casa)
reinaldo@ele.puc-rio.br 75
Teorema de Bayes – exercício2
para casa
Dentre os clientes que usam internet menos de 10
horas por semana, 25% estão interessados no
acesso rápido (banda larga).
Pergunta-se:
Um cliente é escolhido aleatoriamente e está
interessado na internet de banda larga. Qual a
probabilidade dele pertencer a cada uma das
classes de usuário (mais de 30 horas, 20 a 30 horas,
etc ...)?
Resposta: Pr(B) = 0,507
Pr A1 | B 26,63% Pr A3 | B 24,85%
Pr A2 | B 31,76% Pr A4 | B 16,76%
reinaldo@ele.puc-rio.br 76
Teorema de Bayes – exercício3
para casa
Uma certa forma de câncer ocorre à razão de 3 em 1000
pessoas. Desenvolveu-se um teste para detectar a
doença.
Se um paciente é sadio, existe 5% de chance de um
alarme falso.
Se um paciente tem a doença, existe 2% de chance de
que o teste não consiga detectá-la.
Qual a probabilidade da pessoa ter a doença sabendo
que o resultado do teste foi positivo (acusou a
existência da doença)?
Resposta:
PrT 0,05279 PrD | T 5,57%
reinaldo@ele.puc-rio.br 78
Teorema de Bayes – exercício4
(para casa)
Dentre os clientes da classe A, 25% usam telefone pré-
pago.
Dentre os clientes da classe B, 45% usam telefone pré-
pago.
Dentre os clientes da classe C, 90% usam telefone pré-
pago.
Dentre os clientes da classe D, 95% usam telefone pré-
pago.
Pergunta-se:
Um cliente é escolhido aleatoriamente e tem o serviço pré-
pago. Qual a probabilidade dele pertencer a cada uma das
classes?
Resposta: Pr(S) = 0,7375
PrC A | S 3,39% PrCC | S 42,71%
PrCB | S 15,25% PrCD | S 38,65%
reinaldo@ele.puc-rio.br 79
Exercício 5 (para casa)
reinaldo@ele.puc-rio.br 80
Exercício 6 (para casa)
reinaldo@ele.puc-rio.br 81
Exercício 7 (para casa)
Uma empresa de desenvolvimento urbano considera a
possibilidade de construir um shopping Center num setor no
Rio de Janeiro. Um elemento vital é uma proposta em um setor
com estrada que liga ao centro da cidade.
Se o Conselho aprovar essa rodovia, há probabilidade de 0,90
da empresa construir o shopping, enquanto, se a rodovia não
for aprovada a probabilidade é de apenas 0,20.
Com base em informações disponíveis, o presidente da
empresa estima que uma chance 0,60 que a estrada seja
aprovada.
Pergunta-se:
Qual é a probabilidade da empresa construir o shopping?
Resposta: Pr(S) = 0,62
Uma vez que o shopping foi construído. Qual é a probabilidade
de que a rodovia seja aprovada?
Resposta: PrR | S 87,10%
reinaldo@ele.puc-rio.br 82
Exercício 8 (para casa)
Em uma linha de produção há dois processos,
“A” e “B”. No processo “A” 20% são defeituosos
e no processo “B” 25%.
Em uma amostra de 300 produtos, 200 são do
processo “A” e 100 do processo “B”.
Pergunta-se:
a) Se o produto é extraído ao acaso, qual a
probabilidade de que ele está com defeito?
Resposta: Pr(D) = 0,2167
b) Se ao extrair o produto ele é defeituoso, qual a
probabilidade de que ele é do processo A?
Resposta: PrPA | D 61,53%
reinaldo@ele.puc-rio.br 83
Exercício 9 (para casa)
Considerando 18 atiradores classificados em 4
grupos.
No primeiro grupo há 5 atiradores com probabilidade
0,8 de acertar o alvo, o segundo é de 7 com
probabilidade 0,7, no terceiro é de 4 com
probabilidade 0,6 e no último é de 2 com probabilidade
0,5 de acertar o alvo.
Pergunta-se:
Escolhe-se aleatoriamente um atirador e ele atira e
erra o alvo. Qual o grupo mais provável que ele
pertence?
Resposta: Pr(D) = 0,3167
PrG1 | E 17,54% PrG3 | E 28,07%
PrG2 | E 36,85% PrG4 | E 17,54%
reinaldo@ele.puc-rio.br 84
Exercício 10 (para casa)
reinaldo@ele.puc-rio.br 85
Exercício 10 (para casa)
Ou seja, o gerente-geral, estima com base na experiência
anterior, que há uma probabilidade de 0.20 que 60% das
lojas chega a doze milhões em vendas anuais, e uma
probabilidade de 0,50 que 70% chega a meta, e, finalmente,
uma probabilidade de 0,30 que 80% chega a meta.
Selecionar aleatoriamente um dos negócios.
Pergunta-se:
Qual é a probabilidade de que este tenha atingido a meta
considerada?
Resposta: Pr(M) = 0,71
Uma vez que esta empresa conseguiu o objetivo, qual é a
probabilidade de que 80% das empresas venderam 12
milhões dólares?
Resposta: PrP3 | M 33,80%
reinaldo@ele.puc-rio.br 86
PROBEST
Aula 3
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Aula 3
reinaldo@ele.puc-rio.br 2
Variáveis Aleatórias
Muitas vezes o espaço amostral não é um conjunto de
valores numéricos. Por exemplo, se jogamos uma
moeda 3 vezes, o espaço amostral é S = { HHH, HHT,
HTH, THH, HTT, THT, TTH, TTT } , onde cada resultado
tem a mesma probabilidade, e T indica “coroa”, H
indica “cara”.
S
espaço amostral espaço da variável aleatória
reinaldo@ele.puc-rio.br 5
Variável Aleatória Discreta
Exemplos
Número de expectadores em uma sessão de cinema,
Resultado do lançamento de um dado,
Número de ligações recebidas por uma central de
telemarketing num intervalo de tempo especificado,
número de assaltos numa esquina.
reinaldo@ele.puc-rio.br 6
Função de Probabilidade
reinaldo@ele.puc-rio.br 7
Variável Aleatória Discreta -
Exemplo
Seja X uma variável aleatória discreta com espaço
= {X: x = 0,1,2,3,4}.
Seja 4 1
4
4! 1
f ( x) Pr( X x) . x 0,1,2,3,4
x 2 x! 4 x ! 16
reinaldo@ele.puc-rio.br 9
Variável Aleatória Discreta -
Exemplo
Uma fábrica produz fusíveis. A probabilidade de
um fusível produzido ser defeituoso é 10%. Testa-
se fusíveis encerrando o teste assim que o
primeiro fusível defeituoso é encontrado.
reinaldo@ele.puc-rio.br 10
Variável Aleatória Discreta -
Exemplo
Solução
O espaço amostral é constituído por seqüências
como:
D
BD
BBD
BBBD
BBBBD
.........
reinaldo@ele.puc-rio.br 11
Variável Aleatória Discreta -
Exemplo
Logo, os valores possíveis de X são: 1, 2, ...., n,
..... (não há um valor máximo).
reinaldo@ele.puc-rio.br 13
Variável Aleatória Discreta -
Exemplo
Nota:
Neste exemplo empregamos a série geométrica
para demonstrar que o somatório das
probabilidades para todos os valores de X era um.
A série geométrica é:
1
k 0
a 1 a a a .....
k 2 3
1 a
desde que a 1
Alternativamente,
se começarmos
a série em k=1:
a k
k 1
a a 2
a 3
..... 1
k 0
a k
1 a
-1 desde que a 1
1 a 1 a
reinaldo@ele.puc-rio.br 14
Variável Aleatória Contínua
Exemplos
Tempo de atendimento em um caixa de banco,
Peso real de um pacote de 1 kg de açúcar,
Custo de construção de uma fábrica,
Custo de lançamento de uma campanha publicitária,
Altura dos homens brasileiros com idades entre 18 e 30
anos,
Retorno diário de uma ação,
Proporção de eleitores a favor da reeleição do prefeito.
reinaldo@ele.puc-rio.br 15
Variável Aleatória Contínua
reinaldo@ele.puc-rio.br 16
Variável Aleatória Contínua
Portanto, não podemos falar da probabilidade de
ocorrência de um valor em particular. Ao invés
disso, devemos pensar na probabilidade de
ocorrência associada a um intervalo.
reinaldo@ele.puc-rio.br 17
Variável Aleatória Contínua
reinaldo@ele.puc-rio.br 18
Função Densidade de
Probabilidade
É uma função que satisfaz:
f ( x) 0 para todo x
f ( x)dx 1
b
Pa X b Pa X b f ( x)dx
a
reinaldo@ele.puc-rio.br 19
Distribuições contínuas de
probabilidade - exemplo
Considere a seguinte função de densidade de
probabilidade: f(x) = (x + 1)/4 para 0 x 2.
Verifique se esta é uma função de densidade de
probabilidade válida para o intervalo considerado.
Calcule a probabilidade de X 1
f(x)
3/4 (x + 1)/4
1/4
0 2 x
reinaldo@ele.puc-rio.br 20
Distribuições contínuas de
probabilidade - exemplo
Solução
a) Para que f(x) seja uma função de densidade de
probabilidade válida, devemos ter a sua área = 1 no
domínio da função.
Neste caso, devemos calcular a área sob a função no
intervalo de 0 a 2.
A área dessa região é dada por:
f ( 2) f ( 0) 3 / 4 1/ 4
Área ( 2 0) 2 1
2 2
Logo, f(x) é uma função de densidade de probabilidade
válida, pois sua integral é 1 no seu domínio de
definição e f(x) é sempre maior ou igual a zero.
reinaldo@ele.puc-rio.br 21
Distribuições contínuas de
probabilidade - exemplo
Solução
(b) A probabilidade para um determinado
intervalo de x é dada pela área sob a função de
densidade de probabilidade nesse intervalo.
reinaldo@ele.puc-rio.br 22
Distribuições contínuas de
probabilidade - exemplo
Exemplo
Seja X uma variável aleatória contínua com
espaço = {x: 0 < x < 1}. Seja f(x) = cx2 para
todo x , onde c é uma constante a
determinar. Qual o valor de c?
Solução
1
cx 3 1 c
0 cx dx 3 0 3 1 c 3
2
reinaldo@ele.puc-rio.br 25
Função de Distribuição
lim F(x)
iii) 1
x
lim F(x)
iv) 0
x
reinaldo@ele.puc-rio.br 26
Função de Distribuição
reinaldo@ele.puc-rio.br 27
Função de Distribuição -
Exemplo
Seja X uma variável aleatória com função
de distribuição definida por:
0 se x 0
F(x ) x
1- e se x > 0
O gráfico desta função de distribuição é mostrado a
seguir.
F( x)
0
0 x 5
reinaldo@ele.puc-rio.br 28
Função de Distribuição –
Exemplo 2
Considere uma variável discreta com a
seguinte função de probabilidade:
4
4! 1
f ( x) Pr X x para x 0,1,2,3,4
x!4 x ! 2
A função de distribuição é:
4
x
4! 1 x
3
F ( x) Pr X x
1
k 0 x!4 x ! 2
k 0 2 x!4 x !
3 x 1
para x 0,1,2,3,4
2 k 0 x!4 x !
reinaldo@ele.puc-rio.br 29
Função de Distribuição –
Exemplo 2
Assim:
F (0) = 1/16 = 0.0625 = Pr (X 0) = Pr (X = 0)
F (4) = 1
reinaldo@ele.puc-rio.br 30
Relação entre a densidade e a
função de distribuição
Seja X uma v.a. contínua com densidade
f(x) e função de distribuição acumulada
F(x). Então:
b
Pr(a X b) f ( x)dx
a
Mas:
a
F (a ) Pr( X a ) f ( x)dx
e
b
F (b) Pr( X b) f ( x)dx
reinaldo@ele.puc-rio.br 31
Relação entre a densidade e a
função de distribuição
Então:
b
Pr(a X b) f ( x)dx F (b) F (a )
a
reinaldo@ele.puc-rio.br 32
Esperança matemática
reinaldo@ele.puc-rio.br 33
Esperança matemática
Exemplo
Seja X uma variável contínua com
densidade: f(x) = cx2 para 0 < x < 1
1) Ache a constante c que faz de f(x) uma
densidade.
2) Encontre a média desta densidade.
reinaldo@ele.puc-rio.br 34
Esperança Matemática
Solução
1) Para que f(x) seja uma densidade:
1 1
x3 1 c
f ( x)dx 1 cx dx 1 c 1 c 3
2
0 0
3 0 3
1 1
x4 1 3
0 x 3x dx 30 x dx 3 4 0 4
2 3
reinaldo@ele.puc-rio.br 35
Esperança matemática
Definição (Variância)
A variância de uma variável aleatória
mede a dispersão da distribuição de
probabilidade, e é definida como:
x . f x dx se X contínua
2
2 VAR( X ) E X
2
x 2 . f x x 2 .Pr X x se X discreta
todo x todo x
reinaldo@ele.puc-rio.br 36
Esperança matemática
reinaldo@ele.puc-rio.br 38
Esperança matemática
reinaldo@ele.puc-rio.br 39
Esperança matemática
reinaldo@ele.puc-rio.br 41
Esperança matemática
reinaldo@ele.puc-rio.br 42
Esperança matemática
reinaldo@ele.puc-rio.br 43
Esperança matemática
A demonstração deste fato segue diretamente da
linearidade das integrais ou somatórios. Em
particular, se a é uma constante, E (a) = a.
reinaldo@ele.puc-rio.br 45
Esperança matemática
Logo:
2 = E (X2) - 22 + 2 = E (X2) - 2
2 = E (X2) - E(X)2
reinaldo@ele.puc-rio.br 46
Esperança matemática
reinaldo@ele.puc-rio.br 47
Esperança matemática
Exemplo
O retorno mensal de certo investimento de risco
pode ser modelado pela variável aleatória R com
função de probabilidade dada a seguir:
r -5 % 0% 5% 10 % 15 %
Pr(R = r) 0.40 0.15 0.25 0.15 0.05
Solução
A variável R é discreta, e sua média é (pela
definição):
reinaldo@ele.puc-rio.br 48
Esperança matemática
= (-5)(0.40) + (0).(0.15) + (5).(0.25) + (10).(0.15) +
(15).(0.05) = 1.5
A variância de R é:
2 = (-5-1.5)2.(0.40) + (0-1.5)2.(0.15)+ (5- 1.5)2.(0.25) +
(10- 1.5)2.(0.15) + (15 - 1.5)2.(0.05) = 40.25
O desvio padrão de R é:
= 2 = 6.344 (em porcentagem, que é a unidade
em que estão expressos os retornos)
reinaldo@ele.puc-rio.br 49
Esperança matemática – exercício1
(para casa)
Seja X uma variável aleatória contínua com densidade f(x)
= c.x onde 0 < x < 3.
a) Ache a constante c que faz de f(x) uma densidade.
2 2x
Resposta: c f ( x )
9 9
b) Encontre a função2 de distribuição de X.
x
Resposta: F ( x) 9
c) Ache a média, a variância e o desvio padrão de X.
1 1
Resposta: E ( x) 2 ; Var ( x) ; DP( x)
2 2
d) Encontre um ponto m no intervalo (0,3) tal que Pr(X
m) = Pr( X m) = 50%. Este ponto é a mediana da
distribuição.
Resposta: m 4,5
reinaldo@ele.puc-rio.br 50
Esperança matemática – exercício2
(para casa)
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Aula 4
reinaldo@ele.puc-rio.br 2
Distribuição Bernoulli
reinaldo@ele.puc-rio.br 3
Distribuição Bernoulli
reinaldo@ele.puc-rio.br 5
Distribuição Binomial
reinaldo@ele.puc-rio.br 6
Distribuição Binomial
reinaldo@ele.puc-rio.br 7
Distribuição Binomial - quadro
resumo
experiência "sucesso" "falha" p= n = número de X = variável
aleatória probabilida repetições da aleatória
de de experiência Binomial
"sucesso"
"chutar" a resposta acertar a errar a 1/5 número de número de
numa prova de resposta resposta questões da respostas
múltipla escolha da questão prova certas na
onde cada prova
questão tem 5
opções
nascimento de menina menino 1/2 número de número de
uma criança crianças na meninas na
numa família família família
jogada de um sair o número sair 1/6 número de jogadas número de
dado 6 qualquer do dado vezes em
outro que saiu o
número número 6 nas
n jogadas do
dado
verificar se uma peça tem peça não proporção de tamanho da número de
peça produzida defeito tem peças com amostra peças com
numa fábrica defeito defeito na defeito na
tem defeito população amostra
de peças
reinaldo@ele.puc-rio.br 8
Distribuição Binomial – exemplo
típico
É importante ter em mente um exemplo típico, um
modelo da situação que representa a aplicação
de uma distribuição de uma densidade ou função
de probabilidade. No caso da Binomial eu sempre
sugiro a idéia da nota da prova de múltipla
escolha em chinês ....
X = número de questões “chutadas” certo numa
prova de múltipla escolha em chinês (presumindo
que você não saiba chinês!). Todas as questões
têm a mesma probabilidade de acerto e o fato de
você acertar ou errar uma questão não afeta a
probabilidade das outras.
X é a sua nota na prova.
reinaldo@ele.puc-rio.br 9
Distribuição Binomial
No Excel:
Use a função estatística distrbinom (ou
dist.binom, dependendo da versão do Excel).
reinaldo@ele.puc-rio.br 10
Distribuição Binomial
No Excel:
Valor de X
Valor de n
Valor de p
Argumento
lógico - se
VERDADEIRO
produz a função
de distribuição
acumulada, se
FALSO produz a
função de
probabilidade reinaldo@ele.puc-rio.br 11
Distribuição Binomial
Média e Variância
Se X ~ Bin(n,p) então:
E(X) = n.p
VAR(X) = n.p.q = n.p.(1-p)
Exemplo
Em uma loja, a probabilidade de um cliente
realizar uma compra é de 15%. Qual a
probabilidade de, entre 5 clientes que entram
na loja, exatamente 3 realizarem uma compra?
n 5; x 3; p 0.15
f (3)
5!
0.15 .0.85 0.024
3 2
3!.2!
reinaldo@ele.puc-rio.br 13
Distribuição Binomial
Exemplo
Numa eleição supõe-se que 30% dos eleitores são
favoráveis a uma certa proposta. Toma-se uma
amostra de tamanho 20 de eleitores da cidade do
Rio de Janeiro. Calcular as probabilidades de 4, 5,
6, 7, 8, 9 ou 10 dos eleitores na amostra serem
favoráveis à proposta.
Solução
Seja X o número de eleitores na amostra que são
a favor da proposta. Então os valores possíveis
de X são 0, 1, 2, ...., 20, e X tem distribuição
Binomial com parâmetros n = 20 e p = 0.30.
reinaldo@ele.puc-rio.br 14
Distribuição Binomial
reinaldo@ele.puc-rio.br 15
Exercício 1 (para casa – use o Excel)
reinaldo@ele.puc-rio.br 16
Exercício2 (para casa – use o Excel)
Você arranjou um emprego numa pizzaria que
funciona no sistema de entrega a domicílio. Apenas
5% dos pedidos são de pizza de lombinho com
abacaxi.
a) Você recebe exatamente 9 pedidos pelo telefone, qual a
probabilidade de, no máximo 1 pizza de lombinho com abacaxi
ser pedida?
Resposta: Pr(X≤1)= 92,87%
b) Você recebe exatamente 30 pedidos pelo telefone num dia de
bastante movimento, qual a probabilidade de receber mais de
3 pedidos de pizza de lombinho com abacaxi? Dica: pare e
pense antes de fazer contas desnecessárias!!!!!!
Resposta: Pr(X>3)= 6,08%
reinaldo@ele.puc-rio.br 17
Distribuição Geométrica
reinaldo@ele.puc-rio.br 18
Distribuição Geométrica
reinaldo@ele.puc-rio.br 19
Distribuição Geométrica
reinaldo@ele.puc-rio.br 20
Distribuição Geométrica
reinaldo@ele.puc-rio.br 21
Distribuição Geométrica -
Exemplo
Você arranjou um emprego numa empresa que
faz pesquisas de opinião pelo telefone.
Apenas 10% das chamadas resultam numa
pesquisa completa, isto é, apenas 10% dos
entrevistados responde todo o seu questionário.
Calcule as seguintes probabilidades:
a) De que a primeira pesquisa completa será
respondida na 5a. ligação telefônica.
b) De que a primeira pesquisa completa será
respondida na 8a. ligação telefônica.
reinaldo@ele.puc-rio.br 22
Distribuição Geométrica -
Exemplo
Esta é uma aplicação típica da
distribuição Geométrica.
Seja X o número de ligações efetuadas até
que a 1a. pesquisa completa seja
respondida.
Então X é uma v.a. Geométrica com
probabilidade de sucesso p = 0.10.
a) Pr X 5 0.90 0.10 6.56%
4
reinaldo@ele.puc-rio.br 23
Distribuição Geométrica – para
casa
Exercício 3 (para casa)
Um gestor de fundos de investimento ultrapassa
a sua meta de retorno mensal 85% das vezes e
nos 15% restantes tem um resultado ruim (abaixo
da meta).
Qual a probabilidade dele ter o primeiro
resultado ruim no 12º mês?
Resposta: Pr(X=12)= 2,51%
E nos primeiros 6 meses?
Resposta: Pr(X≤6)= 62,29%
reinaldo@ele.puc-rio.br 24
Distribuição Geométrica
reinaldo@ele.puc-rio.br 25
Distribuição Geométrica – para
casa
Suponha que cada ida para o campo no fim de
semana seja uma repetição independente. O custo
associado a cada viagem é R$ 25,00 (gasolina e
pedágio).
Você continua dirigindo em alta velocidade até
receber a primeira multa.
a) Qual o custo esperado deste procedimento (viajar em
alta velocidade até ganhar a primeira multa)?
Resposta: R$ 416,67
b) Suponha que você tenha disponível R$300,00 no
banco. Qual a probabilidade de você estourar o seu
orçamento com este procedimento?
Resposta: Pr(X>2)= 72,25%
reinaldo@ele.puc-rio.br 26
Distribuição Geométrica
A função de probabilidade de X é:
f ( x) Pr( X x) q x 1. p onde x = 1, 2, 3, ....
Notação: X ~ Geom(p)
Média e Variância
Se X ~ Geom(p) então:
1) E(X) = 1/p
2) VAR(X) = q/p2
reinaldo@ele.puc-rio.br 27
Distribuição Binomial Negativa
A distribuição Binomial negativa é mais
uma função de probabilidade derivadas de
tentativas de Bernoulli independentes e é
uma generalização da distribuição
Geométrica.
reinaldo@ele.puc-rio.br 30
Distribuição Binomial Negativa -
Exemplo
Um comprador em potencial entra numa
loja de carros a cada hora.
Um vendedor tem probabilidade 0.25 de
concluir uma venda. O vendedor decide
trabalhar até conseguir vender 3 carros
num só dia.
Qual a probabilidade de que o vendedor
tenha de trabalhar exatamente 8 horas
para conseguir vender os 3 carros? E
mais de 8 horas?
reinaldo@ele.puc-rio.br 31
Distribuição Binomial Negativa -
Exemplo
Seja X o número de horas de trabalho
necessárias para vender 3 carros.
Então X tem distribuição Binomial
Negativa com parâmetros r = 3 e p = 0.25.
x 1
Pr( X x) (0.25) 3 .(0.75) x 3 para x = 3, 4, 5, .....
2
reinaldo@ele.puc-rio.br 32
Distribuição Binomial Negativa -
Exemplo
x Pr( X = x )
3 0.01563
4 0.03516 A probabilidade de trabalhar
5 0.05273 exatamente 8 horas é Pr (X = 8)
6 0.06592
= 0.07787. A probabilidade de
7 0.07416
8 0.07787
trabalhar mais de 8 horas é:
reinaldo@ele.puc-rio.br 33
Distribuição Binomial Negativa -
Exemplo
Uma fábrica de sorvetes decidiu fazer uma
campanha para aumentar suas vendas.
A cada 50 sorvetes produzidos um é premiado, e
o prêmio consiste em ganhar um outro sorvete
grátis. Cada sorvete é vendido por R$ 0.80.
a) Se você decide comprar sorvetes até encontrar
um sorvete premiado, quanto você espera
gastar?
b) E se você comprar sorvetes até encontrar o 2o.
sorvete premiado?
reinaldo@ele.puc-rio.br 34
Distribuição Binomial Negativa -
Exemplo
a) Seja X o número de sorvetes comprados até
encontrar o 1o. sorvete premiado. Então X tem
distribuição Geométrica com parâmetro p =1/50. Seja
C o custo deste procedimento. Então C = 0.8X e E(C)
= 0.8.E(X). Mas, E(X) = 1/p = 50 e assim o custo
esperado é de R$40.
reinaldo@ele.puc-rio.br 35
Distribuição Binomial Negativa
Exercício 5 (para casa)
Uma gulosa professora de estatística é
“fissurada” por trufas de chocolate. Em busca
da trufa ideal, ela vai provando chocolates em
diversas lojas, de maneira independente.
A probabilidade dela gostar de uma trufa que
prova é 70%. Ela decide passear por um
shopping, provando todas as trufas que
encontra, e decide parar só ao encontrar a 4a.
trufa “maravilhosa”(para “desespero” da
balança que tem em casa!).
reinaldo@ele.puc-rio.br 36
Distribuição Binomial Negativa –
exercício 5 (para casa)
reinaldo@ele.puc-rio.br 37
Distribuição de Poisson
reinaldo@ele.puc-rio.br 38
Distribuição de Poisson
reinaldo@ele.puc-rio.br 39
Distribuição de Poisson
m xem
f ( x) Pr( X x) onde x 0,1,2,....
x!
Este parâmetro m é a MÉDIA da distribuição e
indica o número esperado de ocorrências num
dado intervalo.
A distribuição Poisson é freqüentemente utilizada
na modelagem de eventos “raros”, ou seja, a
probabilidade de X = 0 ou X = 1 (pequeno número
de ocorrências no intervalo de tempo
especificado) é grande.
reinaldo@ele.puc-rio.br 41
Distribuição de Poisson no
Excel
Valor de X
Parâmetro da
função de
probabilidade
Argumento
lógico
Se FALSO
fornece a
função de
probabilidade
f(x)
reinaldo@ele.puc-rio.br 42
Distribuição de Poisson
Média e Variância
Se X ~ Poisson(m) então:
E(X) = m
VAR(X) m
reinaldo@ele.puc-rio.br 43
Distribuição de Poisson
Exemplo
O número de clientes que entram em um
banco num período de 12 minutos segue
uma distribuição Poisson com média de 1
cliente por minuto.
Qual a probabilidade de entrarem
exatamente 5 clientes em 10 minutos?
m 10; x 5
105 e 10
f (5) Pr X 5 0.0378
5!
reinaldo@ele.puc-rio.br 44
Distribuição de Poisson
Exemplo
Numa campanha de caridade feita por um
programa de TV em todo o Brasil, o número de
pessoas que contribuem mais de 500 reais é uma
variável aleatória Poisson com média de 5
pessoas por programa.
a) Calcule a probabilidade de que, num certo
programa, o número de pessoas que
contribuem mais de 500 reais exceda 8.
b) Faça o gráfico da função de probabilidade.
c) Faça um gráfico da função de distribuição
acumulada.
reinaldo@ele.puc-rio.br 45
Distribuição de Poisson
Solução
Seja X o número de pessoas que contribuem com mais de
500 reais a cada programa. Desejamos calcular Pr{ X > 8}.
reinaldo@ele.puc-rio.br 46
Distribuição de Poisson
x Pr(X = x) Pr( X <= x) 1- F(x) = Pr(X > x)
reinaldo@ele.puc-rio.br 47
Distribuição de Poisson
20%
15%
10% Pr(X = x)
5%
0%
10
12
0
reinaldo@ele.puc-rio.br 48
Distribuição de Poisson
100%
80%
60%
Pr( X <= x)
40%
20%
0%
10
11
12
0
1
2
3
4
5
6
7
8
reinaldo@ele.puc-rio.br 49
Distribuição de Poisson
reinaldo@ele.puc-rio.br 50
Distrbuição de Poisson
A probabilidade desejada é:
reinaldo@ele.puc-rio.br 51
Exercício 6 (para casa – use o Excel)
reinaldo@ele.puc-rio.br 52
Exercício 7 (para casa – use o Excel)
reinaldo@ele.puc-rio.br 53
Exercício 8 (para casa – use o Excel)
reinaldo@ele.puc-rio.br 54
Distribuição Poisson
Exercício 9 (para casa)
O número de erros de digitação numa página de
livro é uma variável aleatória Poisson com média de
2 erros por página. Um capítulo contém 30 páginas.
Calcule as seguintes probabilidades:
a) De que o número total de erros seja menor que 12.
Resposta:- Por página Pr(X<12)= 100%
- Por capítulo Pr(X<12)= 0%
b) De que o número total de erros exceda 10.
Resposta:- Por página Pr(X>10)= 0%
- Por capítulo Pr(X>10)= 100%
reinaldo@ele.puc-rio.br 55
PROBEST
Aula 5
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Aula 5
Variáveis Contínuas
Uniforme
Exponencial
Normal
Lognormal
reinaldo@ele.puc-rio.br 2
Distribuição Uniforme
reinaldo@ele.puc-rio.br 3
Distribuição Uniforme
b a
2
ab
E( X ) , VAR( X )
2 12
reinaldo@ele.puc-rio.br 5
Distribuição Uniforme
Exemplo
Um vôo da ponte aérea RJ-SP leva entre 40 e 50
minutos, com igual probabilidade de ocorrência
dentro desse intervalo
A distribuição é Uniforme no intervalo (40, 50)
f(x) = 1/(50 – 40) para x no intervalo (40,50) e zero fora
desse intervalo
f(x)
0,1
0 40 50 x
reinaldo@ele.puc-rio.br 6
Distribuição Uniforme
Exemplo
O peso mínimo de um pacote de 1 kg de café é de
0,98 kg. O fabricante garante que a distribuição
de pesos é uniforme e que a função de densidade
de probabilidade, f(x), é igual a 9,75. Se o
fabricante disse a verdade, qual é o peso máximo
que um pacote de café pode ter?
Solução
Seja b o peso máximo. Se a distribuição é uniforme, a área
sob f(x) no intervalo de validade de x deve ser igual a 1.
A área é dada por f(x).(b – a), onde f(x) = 9,75 e a = 0,98
Logo, b = a + 1/f(x) = 0,98 + 1/9,75 = 1,0826
reinaldo@ele.puc-rio.br 8
Distribuição Uniforme
Exercício1 (para casa)
O retorno de uma aplicação financeira de risco num
intervalo de uma semana é uma variável com
distribuição Uniforme no intervalo –2% a 1.8%.
Calcule:
A probabilidade do retorno do investimento nesta
semana ser positivo.
Resposta: Pr(0≤x≤1,8) = 47,37%
A probabilidade do retorno estar entre –1% e +1%.
Resposta: Pr(-1≤x≤1) = 52,63%
A probabilidade do retorno exceder 0.5%.
Resposta: Pr(0,5<x<1,8) = 34,21%
reinaldo@ele.puc-rio.br 9
Distribuição Uniforme
Geração de v.a. Uniformes no Excel
(É necessária a instalação prévia do
suplemento “Análise de Dados”)
reinaldo@ele.puc-rio.br 10
Distribuição Uniforme
Geração de v.a. Uniformes no Excel
Número de
variáveis
geradas (uma, Intervalo de
neste caso) definição, neste
caso, densidade
Unif(0,2)
Célula inicial de
armazenamento dos
Número de dados – neste caso
valores gerados os números gerados
(1000 neste caso) irão preencher a
coluna A, a partir da
célula A1
monica@ele.puc-rio.br 11
Densidade Exponencial
Serve para:
Modelar tempos de duração de equipamentos;
Modelar tempos entre ocorrências, por
exemplo, o tempo entre chegadas de carros
num pedágio, entre a chegada de pessoas
num caixa de banco;
Densidade
f ( x) . exp .x onde 0 e x 0
Função de Distribuição
x
x
F ( x) Pr X x . exp .u du e .u
1 e . x
0
0
reinaldo@ele.puc-rio.br 12
Distribuição Exponencial
Média e Variância
Se X é Exponencial com parâmetro , então:
E ( X ) 1/
VAR( X ) 1/ 2
Falta de Memória
A distribuição Exponencial “não tem memória”. O
que isso quer dizer? Esta propriedade indica que
a vida restante de um equipamento não depende
da idade atual deste equipamento. Ou seja, um
componente usado é tão bom quanto um novo
(em termos da sua durabilidade).
reinaldo@ele.puc-rio.br 13
Densidade Exponencial
2.000
1.800
1.600
1.400
1.200
1.000
0.800
0.600
0.400
0.200
0.000
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 4
reinaldo@ele.puc-rio.br 14
Densidade Exponencial
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6
reinaldo@ele.puc-rio.br 15
Densidade Exponencial
Exemplo
O tempo entre as chegadas de táxi num
cruzamento é uma variável Exponencial
com = 1/10 chegadas por minutos.
Calcule:
a) A probabilidade de alguém ter que
esperar mais de 60 minutos por um táxi.
b) A probabilidade de um táxi demorar
menos de 10 minutos para passar.
reinaldo@ele.puc-rio.br 16
Densidade Exponencial
Solução
Seja T o tempo entre chegadas de um táxi, isto é,
o tempo que você terá que esperar por um táxi
nesta esquina.
reinaldo@ele.puc-rio.br 17
Densidade Exponencial
Exercício 2 (para casa)
O tempo até a ocorrência de um defeito (isto é, o tempo
de duração) numa TV é uma variável Exponencial com
parâmetro = 1/3 anos.
Calcule a probabilidade de uma TV “pifar” nos primeiros
2 anos de uso.
Resposta: Pr(X≤2) = 48,66%
Calcule a probabilidade de uma TV “pifar” depois dos 5
anos.
Resposta: Pr(X>5) = 18,89%
Calcule a probabilidade de uma TV “pifar” entre 3 e 5
anos.
Resposta: Pr(3≤X≤5) = 17,90%
reinaldo@ele.puc-rio.br 18
Densidade Exponencial
Exemplo - Simulação
A maioria das linguagens de programação tem um
gerador de variáveis Uniforme (0,1) “embutido”.
reinaldo@ele.puc-rio.br 20
Variável Exponencial - simulação
reinaldo@ele.puc-rio.br 21
Variável Exponencial - simulação
reinaldo@ele.puc-rio.br 22
Variável Exponencial - simulação
1100
900
700
Freqüência
500
300
100
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 More
-100
reinaldo@ele.puc-rio.br 23
Variável Exponencial - simulação
0
100
200
300
400
500
600
700
800
900
0.000
0.372
0.744
1.116
1.488
1.860
2.232
2.604
2.976
3.348
3.720
4.092
4.464
4.835
5.207
reinaldo@ele.puc-rio.br
5.579
5.951
Histograma (Variável Exponencial)
6.323
6.695
7.067
7.439
7.811
Variável Exponencial - simulação
8.183
8.555
8.927
More
25
Variável Exponencial - simulação
Nota:
O Excel não tem um gerador de variáveis
Exponenciais. O procedimento que você deve
usar para simulá-las é apenas uma extensão
do método mostrado neste exemplo.
Para gerar uma variável X com densidade:
f ( x) . exp .x onde 0 e x 0
Faça X = (-1/). Log(U) onde U é uma v.a.
Uniforme(0,1).
reinaldo@ele.puc-rio.br 26
Distribuição Normal
reinaldo@ele.puc-rio.br 27
Distribuição Normal
reinaldo@ele.puc-rio.br 28
Distribuição Normal
x m 2
1
f ( x) .e 2s 2
onde s 2 0 e m R
2s 2
Notação: X ~ N( m , s2 )
A densidade é simétrica em torno de m, e
quanto maior o valor da variância s2, mais
"espalhada" é a distribuição.
reinaldo@ele.puc-rio.br 29
Distribuição Normal
Densidades Normais com média zero e variâncias 1, 2 e 4
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
0.00
0
3
-3
.8
.6
.4
.2
-2
.8
.6
.4
.2
-1
.8
.6
.4
.2
0.
0.
0.
0.
1.
1.
1.
1.
2.
2.
2.
2.
-2
-2
-2
-2
-1
-1
-1
-1
-0
-0
-0
-0
reinaldo@ele.puc-rio.br 30
Distribuição Normal
0.25 0.25
m=10 m=12 s =1,5
0.20 0.20
0.15 0.15
s =2,5
0.10 0.10
0.05 0.05
0.00 0.00
5 10 15 2 7 12 17
reinaldo@ele.puc-rio.br 31
Distribuição Normal
Propriedades
1) f(x) como definida integra a 1.
2) f(x) > 0 sempre.
3) Os limites de f(x) quando x tende a + e - são
iguais a zero.
4) A densidade N(m, s2) é simétrica em torno de m, ou
seja:
f(m + x) = f(m - x)
5) O valor máximo de f(x) ocorre em x = m
6) Os pontos de inflexão de f(x) são x = m s e x =
m – s.
reinaldo@ele.puc-rio.br 32
Distribuição Normal
reinaldo@ele.puc-rio.br 34
Distribuição Normal
Problema:
Não é possível criar uma tabela para cada uma
das (infinitas) densidades Normais existentes.
Solução:
Trabalha-se com a densidade Normal com média
0 e variância 1, e converte-se todas as outras
Normais para esta, chamada de Normal padrão
ou Normal standard.
Se X é N( m , s2 ) . Então a variável Z = ( X - m ) /s
tem distribuição Normal com média zero e
variância um, isto é, Z é N(0,1).
reinaldo@ele.puc-rio.br 38
Distribuição Normal
Cálculo de probabilidades
Se X é uma variável Normal com média m e desvio
padrão s então:
am X m bm am bm
Pr(a X b) Pr Pr Z
s s s s s
bm am
s s
reinaldo@ele.puc-rio.br 39
Distribuição Normal
reinaldo@ele.puc-rio.br 40
Tabela da N(0,1) usando (z0)
0.4
0.4
0.3
0.3
z)
0.2
0.2
0.1
0.1
-
z
reinaldo@ele.puc-rio.br 41
Tabela da N(0,1)
Simetrias
z) = 1- z) se z > 0
ISSO É IMPORTANTE POIS A TABELA SÓ
CONTÉM VALORES DE z POSITIVOS!
Probabilidade de um intervalo simétrico em
torno de zero
Pr (-t < Z < t ) = 1 - 2{(-t) } = 1 - 2 {1 - (t)} =
2. (t) - 1 onde Z ~ N(0,1)
reinaldo@ele.puc-rio.br 42
Tabela da N(0,1) ((z0) = Pr(Z z0))
z z) z z) z z) z z)
0.00 0.5000 0.62 0.7324 1.24 0.8925 1.86 0.9686
0.02 0.5080 0.64 0.7389 1.26 0.8962 1.88 0.9699
0.04 0.5160 0.66 0.7454 1.28 0.8997 1.90 0.9713
0.06 0.5239 0.68 0.7517 1.30 0.9032 1.92 0.9726
0.08 0.5319 0.70 0.7580 1.32 0.9066 1.94 0.9738
0.10 0.5398 0.72 0.7642 1.34 0.9099 1.96 0.9750
0.12 0.5478 0.74 0.7704 1.36 0.9131 1.98 0.9761
0.14 0.5557 0.76 0.7764 1.38 0.9162 2.00 0.9772
0.16 0.5636 0.78 0.7823 1.40 0.9192 2.02 0.9783
0.18 0.5714 0.80 0.7881 1.42 0.9222 2.04 0.9793
0.20 0.5793 0.82 0.7939 1.44 0.9251 2.06 0.9803
0.22 0.5871 0.84 0.7995 1.46 0.9279 2.08 0.9812
0.24 0.5948 0.86 0.8051 1.48 0.9306 2.10 0.9821
0.26 0.6026 0.88 0.8106 1.50 0.9332 2.12 0.9830
0.28 0.6103 0.90 0.8159 1.52 0.9357 2.14 0.9838
0.30 0.6179 0.92 0.8212 1.54 0.9382 2.16 0.9846
0.32 0.6255 0.94 0.8264 1.56 0.9406 2.18 0.9854
0.34 0.6331 0.96 0.8315 1.58 0.9429 2.20 0.9861
0.36 0.6406 0.98 0.8365 1.60 0.9452 2.22 0.9868
0.38 0.6480 1.00 0.8413 1.62 0.9474 2.24 0.9875
0.40 0.6554 1.02 0.8461 1.64 0.9495 2.26 0.9881
0.42 0.6628 1.04 0.8508 1.66 0.9515 2.28 0.9887
0.44 0.6700 1.06 0.8554 1.68 0.9535 2.30 0.9893
0.46 0.6772 1.08 0.8599 1.70 0.9554 2.32 0.9898
0.48 0.6844 1.10 0.8643 1.72 0.9573 2.34 0.9904
0.50 0.6915 1.12 0.8686 1.74 0.9591 2.36 0.9909
0.52 0.6985 1.14 0.8729 1.76 0.9608 2.38 0.9913
0.54 0.7054 1.16 0.8770 1.78 0.9625 2.40 0.9918
0.56 0.7123 1.18 0.8810 1.80 0.9641 2.42 0.9922
0.58 0.7190 1.20 0.8849 1.82 0.9656 2.44 0.9927
0.60 0.7257 1.22 0.8888 1.84 0.9671 2.46 0.9931
reinaldo@ele.puc-rio.br 43
Tabela da N(0,1)
Dicas
Você precisa explorar as simetrias da N(0,1) pois
a tabela só é dada para valores positivos de z0.
Por causa da simetria em torno de zero, (0) = 0.5
e (z0) é menor que 0.5 se z0 for um número
negativo.
reinaldo@ele.puc-rio.br 44
Distribuição Normal
reinaldo@ele.puc-rio.br 45
Distribuição Normal
Pr m ks X m ks Pr ks X m ks
ks X m ks Xm
Pr Pr k k Pr k Z k
s s s s
2. ( k ) 1
reinaldo@ele.puc-rio.br 46
Distribuição Normal
reinaldo@ele.puc-rio.br 47
Distribuição Normal
Exemplo
Numa agência bancária localizada numa grande
cidade brasileira, verificou-se que os clientes
pessoa física mantêm, em média, um volume de R$
4800,00 aplicados no banco.
reinaldo@ele.puc-rio.br 48
Distribuição Normal
reinaldo@ele.puc-rio.br 49
Distribuição Normal
reinaldo@ele.puc-rio.br 50
Distribuição Normal
Solução
Seja X a variável que mede o volume de
recursos de um cliente típico da agência. Então X
é Normal (4800, (1600)2). Daí: Z X 4800
1600
reinaldo@ele.puc-rio.br 51
Distribuição Normal
Solução (continuação)
b) Para estar entre os 10% mais “pobres”
precisamos encontrar z0 tal que (z0) = 10%. A
função INV.NORMP do Excel fornece z0 = -1.281.
Logo,
X 4800
1.281 X 4800 1.281(1600) 2750.40
1600
reinaldo@ele.puc-rio.br 52
Distribuição Normal
Exemplo
O saldo devedor dos usuários de um certo cartão
de crédito é uma variável aleatória Normal com
média R$ 200 e desvio padrão R$ 75.
a) Qual a probabilidade do saldo devedor de um usuário
estar entre R$ 100 e R$ 300?
b) Qual deve ser o seu saldo devedor para que você esteja
entre os 5% mais endividados?
Solução
X é Normal com média 200 e desvio padrão 75 e assim
Z =(X- 200)/75 é N(0,1).
reinaldo@ele.puc-rio.br 53
Distribuição Normal
Solução (continuação)
Pr(100 < X < 300) =
100 200 300 200
Pr Z Pr(1.333 Z 1.333)
75 75
1.333 1.333 2. 1.333 1 0.8176
b) Para que você esteja entre os 5% mais
endividados, o saldo devedor padronizado deve
ser igual a 1.645 (veja tabela da Normal). Daí:
X 200
Z 1.645 X 200 1.645(75) 323.38
75
é o saldo para estar entre os 5% com maior saldo
devedor.
reinaldo@ele.puc-rio.br 54
Distribuição Normal
Exercício3 (para casa)
O consumo médio residencial de energia elétrica nos
meses de verão numa certa cidade é uma variável
Normal com média 210 kWh e desvio padrão 18 kWh.
a) Qual a probabilidade de que o consumo no verão exceda
225 kWh?
Resposta: Pr(X>225) = 20,23%
b) Calcule a probabilidade de que o consumo no verão seja
inferior a 190 kWh.
Resposta: Pr(X<190) = 13,33%
c) Quanto você deve consumir para estar entre os 2.5% que
mais gastam energia?
Resposta: X= 245,28 kWh
reinaldo@ele.puc-rio.br 55
Distribuição Normal
reinaldo@ele.puc-rio.br 56
Distribuição Normal
reinaldo@ele.puc-rio.br 57
Distribuição Normal
reinaldo@ele.puc-rio.br 58
Combinações Lineares de
Variáveis Normais
Sejam X1, X2, ...., Xn variáveis aleatórias
independentes, onde Xi ~ N( mi , si2) e seja Y
= X1 + X2 + ... + Xn .
Então Y tem distribuição Normal com média
my e variância sy2 dadas por:
n
m y mi
i 1
n
s s i2
2
y
i 1
reinaldo@ele.puc-rio.br 59
Combinações Lineares de
Variáveis Normais
Dois casos particulares importantes são:
se os Xi ´s forem iid N(m, s2), então sua soma é
Normal com média n. m e variância n. s2 e
reinaldo@ele.puc-rio.br 60
Distribuição Normal
Exemplo (continuação)
Considere o exemplo dos saldos em
aplicações bancárias. Suponha que
tomamos uma amostra de 16 clientes da
agência.
Qual a probabilidade de que o saldo
médio das aplicações dos clientes na
amostra exceda R$ 4900?
Seja X a média dos saldos dos clientes na amostra.
X tem distribuição N 4800,
1600
2
16
reinaldo@ele.puc-rio.br 61
Distribuição Normal
Então:
X 4800 4900 4800
Pr X 4900 Pr Pr Z 100
1600
1600 400
4 4
Pr Z 0.25 1 0.25 1 0.599 0.401
reinaldo@ele.puc-rio.br 62
Distribuição Normal (para casa)
reinaldo@ele.puc-rio.br 65
Distribuição Normal (para casa)
a)Uma imobiliária pretende oferecer uma viagem de
presente aos compradores de apartamentos de 2 quartos
neste bairro que comprem os apartamentos situados na
faixa dos 10% mais caros. A partir de quanto deve custar
o seu apartamento para que você ganhe a viagem de
“presente”?
Resposta: X= R$388.160,00
b) Considere 16 compradores de apartamentos de 2
quartos neste bairro. Qual a probabilidade do preço
médio pago por eles ser inferior a R$ 300 mil?
Resposta: Pr(͞x<300.000)= 94,52%
c)Dentre as 16 pessoas nesta mesma amostra, qual a
probabilidade do comprador que pagou mais caro por
um apartamento ter pago menos de R$ 285 mil?
Resposta: Pr(V<285.000)= 0,03%
reinaldo@ele.puc-rio.br 66
A distribuição Lognormal
reinaldo@ele.puc-rio.br 67
A distribuição Lognormal
Veja o link:
http://www.inf.ethz.ch/personal/gut/lognormal/ para
um simulador interessante de variáveis lognormais
e normais.
Se você se interessar, o artigo do link:
http://stat.ethz.ch/~stahel/lognormal/bioscience.pdf
discute o uso da lognormal nas ciências.
reinaldo@ele.puc-rio.br 68
A Distribuição Lognormal
reinaldo@ele.puc-rio.br 69
A Distribuição Lognormal
f ( x 0.05 0.30)
f ( x 0.25 0.30)
0.5
0 0
0 1 2 3 4 5 6 7
0.01 x 7
reinaldo@ele.puc-rio.br 70
A Distribuição Lognormal
monica@ele.puc-rio.br 71
A Distribuição Lognormal
Atenção:
A distribuição Lognormal, ao contrário do
que o nome indica, não significa a
densidade do logaritmo de uma variável
Normal, pois uma variável Normal admite
valores negativos, onde o logaritmo não
está definido. Uma variável aleatória com
densidade Lognormal é encontrada
tomando-se a exponencial de uma variável
aleatória Normal!
reinaldo@ele.puc-rio.br 72
A Distribuição Lognormal
St t St . exp m .t s .Z t
onde Z é uma variável N(0,1) e m e s > 0 são
parâmetros conhecidos. O parâmetro m
representa a taxa média de crescimento do preço
ao longo do tempo.
reinaldo@ele.puc-rio.br 74
Lognormal como modelo para
o preço de uma ação
Note que, se s = 0, a evolução dos preços é
puramente determinística, e então:
St t St .exp m .t
Nesta expressão percebemos que a tendência
determinística dos preços é crescente desde que
m > 0.
Se s > 0 então existe uma componente aleatória
no comportamento dos preços. Esta componente
aleatória é dada por uma variável aleatória N(0,1),
e assim o efeito desta variável pode ser o de
atenuar o crescimento determinístico no preço,
pois Z pode ser negativo. Note que a variável
exp(Z) é Lognormal.
reinaldo@ele.puc-rio.br 75
Média e variância da Lognormal
VAR(Y ) exp 2 m s 2
.e s2
1
reinaldo@ele.puc-rio.br 76
PROBEST
Aula 6
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Aula 6
reinaldo@ele.puc-rio.br 2
Objetivos
Seja X uma v.a. discreta ou contínua com função
de probabilidade (ou densidade) conhecida.
Queremos encontrar a densidade (ou função de
probabilidade) de Y=h(X) onde h(.) é uma função
conhecida.
reinaldo@ele.puc-rio.br 3
Transformações de uma v.a.
discreta
Exemplo 1
Seja X o número de “caras” em três jogadas de
uma moeda. A função de probabilidade de X é:
x Pr(X =x) = f(x)
0 1/8
1 3/8
2 3/8
3 1/8
reinaldo@ele.puc-rio.br 5
Transformações de uma v.a.
discreta
Exemplo 2
Seja X uma v.a. discreta com função de probabilidade:
f(x) = Pr( X = x) = (1/2)x onde x = 1, 2, 3, .....
reinaldo@ele.puc-rio.br 6
Transformações de uma v.a.
discreta
Exemplo 2
Dica: Para resolver o problema precisamos usar
a série geométrica infinita:
a
ak
k 1 1 a
se a 1
reinaldo@ele.puc-rio.br 10
Método da Função de
Distribuição - exemplo
Seja X uma v.a. Uniforme(0,1). Seja Y = - log (X) onde
log indica o logaritmo na base e.
Encontre a função de distribuição e a densidade de Y.
Solução
Os valores possíveis de Y estão no intervalo [0, + ),
pois quando X tende a zero, log(X) tende a -, e Y
tende a +. Também, quando X tende a 1, log(X) = 0.
reinaldo@ele.puc-rio.br 12
Método da Função de
Distribuição - exemplo
Logo, se X é Unif(0,1) então Y = - log(X) é
Exponencial(1).
reinaldo@ele.puc-rio.br 14
Método da Função de
Distribuição - exemplo
reinaldo@ele.puc-rio.br 15
Método da Função de
Distribuição - exemplo
O histograma das 10000 observações geradas é:
Histograma - 10000 observações da Unif(0,1)
1100
900
700
Freqüência
500
300
100
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 More
-100
16
reinaldo@ele.puc-rio.br
Método da Função de
Distribuição - exemplo
Agora criamos uma nova coluna de 10000
observações usando a transformação Y =
- log (X) onde X é um valor gerado da
distribuição Unif(0,1).
0
100
200
300
400
500
600
700
800
900
0.000
0.372
0.744
1.116
1.488
1.860
2.232
2.604
2.976
3.348
3.720
4.092
4.464
Método da Função de
4.835
Distribuição - exemplo
5.207
reinaldo@ele.puc-rio.br
5.579
5.951
Histograma (Variável Exponencial)
6.323
6.695
7.067
7.439
7.811
8.183
8.555
8.927
More
18
Método da Função de
Distribuição - exemplo
Suponha que desejamos generalizar este
exemplo de maneira a gerar uma v.a.
Exponencial com parâmetro l qualquer.
Novamente, X é Unif(0,1).
Note que a função de distribuição de X é:
0 se x 0
F ( x) Pr X x x se 0 x 1
1 se x 1
Neste caso só nos interessam os valores
de x entre 0 e 1.
reinaldo@ele.puc-rio.br 19
Método da Função de
Distribuição - exemplo
1
Seja Y log X onde l >0 e log indica o
l
logaritmo natural.
reinaldo@ele.puc-rio.br 20
Método da Função de
Distribuição - exemplo
g ( y ) l. exp ly onde y 0 e l 0
Logo, a transformação:
1
Y log X
l
2050
2030
2010
1990
Freqüência
1970
1950
1930
1910
1890
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 More
Intervalos
22
reinaldo@ele.puc-rio.br
Método da Função de
Distribuição - exemplo
reinaldo@ele.puc-rio.br 23
Método da Função de
Distribuição - exemplo
Histograma da 20000 observações geradas da Expo(2)
1200
1000
800
freqüência
600
400
200
0
00
13
26
40
53
66
79
92
06
19
32
45
58
71
85
98
11
24
37
51
64
77
90
03
17
30
43
56
69
82
96
0.
0.
0.
0.
0.
0.
0.
0.
1.
1.
1.
1.
1.
1.
1.
1.
2.
2.
2.
2.
2.
2.
2.
3.
3.
3.
3.
3.
3.
3.
3.
intervalo
reinaldo@ele.puc-rio.br 24
Método da Função de
Distribuição - exemplo
Podemos calcular empiricamente algumas
probabilidades e compará-las com os
valores reais, obtidos da densidade
Exponencial.
reinaldo@ele.puc-rio.br 26
Método da Função de
Distribuição
A Transformação Y = X2
Seja X uma variável aleatória contínua com densidade
f(x) e função de distribuição F(x).
Seja Y = X2. Então a densidade de Y é:
g( y )
1
2. y
. f ( y ) f ( y )
Nota: o único cuidado que dever ser tomado ao usar
esta fórmula é fazer as adaptações necessárias quando
X (a variável original) for definida apenas na região x 0
(ou x 0), pois neste caso um dos termos y ou - y
acima será nulo.
reinaldo@ele.puc-rio.br 27
Método da Função de
Distribuição
Demonstração
A função de distribuição de Y é:
G ( y ) Pr(Y y ) Pr( X 2 y ) Pr( y X y)
F ( y ) F ( y )
1
2. y
.f ( y)
1
2. y
. f ( y )
1
2. y
. f ( y ) f ( y )
reinaldo@ele.puc-rio.br 28
Método da Função de
Distribuição
Exemplo 3
Seja X uma v.a. contínua com densidade:
1 x2 / 2
f ( x) .e , onde x e um numero real
2
reinaldo@ele.puc-rio.br 29
Método da Função de
Distribuição
Exemplo 3 (continuação)
g ( y)
2.
1
y
. f ( y ) f ( y )
1 (
1 y )2 / 2 1 ( y )2 / 2
g ( y) . e e
2. y 2 2
1 2 y/2 1
. e . y 1/ 2 e y / 2 para y 0
2. y 2 2
reinaldo@ele.puc-rio.br 31
Método do Jacobiano
reinaldo@ele.puc-rio.br 33
Método do Jacobiano
reinaldo@ele.puc-rio.br 34
Método do Jacobiano - exemplo
reinaldo@ele.puc-rio.br 39
Transformações de Variáveis
exercício 4 (para casa)
O preço de um ativo financeiro é uma v.a.
contínua com densidade:
f x 2 xe x2
onde x > 0
reinaldo@ele.puc-rio.br 40
PROBEST
Aula 7
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Aula 7
Vetores Aleatórios
Densidades Conjuntas
Densidades Marginais
Densidades Condicionais
Independência
Covariância e Correlação
Momentos Condicionais
Curva de Regressão
reinaldo@ele.puc-rio.br 2
Objetivos
reinaldo@ele.puc-rio.br 4
Objetivos
reinaldo@ele.puc-rio.br 5
Vetor Aleatório
reinaldo@ele.puc-rio.br 7
Densidade Conjunta
reinaldo@ele.puc-rio.br 8
Condição de Normalização
f x , x dx dx
1 2 1 2 1
reinaldo@ele.puc-rio.br 9
Densidade Conjunta/Função de
Probabilidade Conjunta
Interpretação
Pode-se fazer uma analogia com a
probabilidade da interseção de dois eventos.
reinaldo@ele.puc-rio.br 10
Densidade Conjunta/Função de
Probabilidade Conjunta
Mas, o que acontece se desejamos “olhar”
para cada uma das variáveis separadamente,
ignorando por completo o efeito da(s)
outra(s)?
reinaldo@ele.puc-rio.br 11
Densidade Marginal
Nota
A rigor, no caso discreto, deveríamos chamar f1(x1)
e f2(x2) de funções de probabilidade marginais.
Pr c X 1 d X 2 x2 f x1 x2 dx1
d
reinaldo@ele.puc-rio.br 15
Densidade Condicional
As definições no caso discreto são análogas.
reinaldo@ele.puc-rio.br 17
Exemplo 1
reinaldo@ele.puc-rio.br 18
Exemplo 1
reinaldo@ele.puc-rio.br 20
Exemplo 1
A função de probabilidade condicional de Y dado
X = 0 é a conjunta divida pela probabilidade de X
ser igual a zero, que é 0.3.
reinaldo@ele.puc-rio.br 22
Exemplo 2
reinaldo@ele.puc-rio.br 23
Exemplo 2
0 0
f ( x, y )dxdy 1 c.e x / 2 .e y / 3dxdy c.e y / 3dy e x / 2 dx
0 0 0 0
1 1
c.e y / 3 . 0 dy 2.c.e y / 3dy 2.c. 0 6.c
0 (1 / 2) 0 (1 / 3)
Então 6c = 1 c = 1/6
reinaldo@ele.puc-rio.br 24
Exemplo 2
A densidade marginal de X é:
1 x / 2 y /3 1 x / 2 y /3 e x / 2 1
f x ( x) f ( x, y )dy .e .e dy .e e dy .
0
0 0
6 6 0
6 (1 / 3)
1 x / 2
e se x >0
2
reinaldo@ele.puc-rio.br 25
Exemplo 2
A densidade marginal de Y é:
1 1
f y ( y ) f ( x, y )dx .e x / 2 .e y / 3dx .e y / 3 e x / 2 dx
0 0
6 6 0
e y / 3 1 1 y/3
. 0 e se y > 0
6 (1 / 2) 3
reinaldo@ele.puc-rio.br 26
Exemplo 2
(1 / 2)
e
2 2 2
3
dy . . e
3 (1 / 3)
e
e 1 / 3 e 1 0.7165 0.3679 0.3486
reinaldo@ele.puc-rio.br 27
Exemplo 2
Nota:
A probabilidade de X > 2 poderia ter sido
calculada também através da densidade
conjunta, notando-se que os seguintes
eventos são equivalentes:
X 2 X 2 Y qualquer X 2 Y 0
PrX 2
1 x / 2 y /3
2 6 e e dxdy
1 y/3
6 0
e dy 2e
2 / 2
1 1 y / 3
3 0
e e dy
1 1
3
e 3 e 1
reinaldo@ele.puc-rio.br 28
Exemplo 2
reinaldo@ele.puc-rio.br 29
Exemplo 3
reinaldo@ele.puc-rio.br 30
Exemplo 3
A densidade marginal de X é:
xy
2 2
2.x
f x ( x) f ( x, y )dy x 2 dy 2.x 2 , onde 0 < x 1
0
0
3 3
A densidade marginal de Y é:
xy
1 1
1 y
f y ( y ) f ( x, y )dx x 2 dx , onde 0 y 2
0
0
3 3 6
1 1 y / 3 1 3 y 3 y
f ( y | x 1) . . .1 .1 , onde y (0,2]
2 1 1/ 3 2 4 3 8 3
reinaldo@ele.puc-rio.br 32
Exemplo 3
Abaixo exibimos um gráfico com 3 densidades
condicionais. Note que, à medida que o
“parâmetro” x se altera, a forma da densidade
condicional muda.
Densidades Condicionais de Y dado X
0.75
fy
1
3
0.6
fy
2
3
f ( y 1) 0.4
0.25
0.2
0 0.5 1 1.5 2
0 y 2
reinaldo@ele.puc-rio.br 33
Exemplo 3
A densidade condicional de X dado Y = y é:
xy
x2
f ( x, y ) 3 3.x 2 x. y
f ( x | Y y) , onde x (0,1] e y [0,2]
f y ( y) 1 y 1 y / 2
.1
3 2
Substituindo-se Y = 1 acima encontramos a
densidade condicional de X dado Y = 1:
3.x 2 x 2
f ( x | Y 1)
. 3.x 2 x , onde x (0,1]
1 1/ 2 3
Se agora fazemos Y = 2 encontramos outra
densidade condicional:
3.x 2 2.x 3.x 2 2.x
f ( x | Y 2) , onde x (0,1]
11 2
reinaldo@ele.puc-rio.br 34
Exemplo 3
Densidades Condicionais de X dado Y = y
3,200
2,800
2,400
2,000
1,600
1,200
0,800
0,400
0,000
0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00
reinaldo@ele.puc-rio.br 35
Exercício 1- para casa
Sejam X e Y v.a. contínuas com densidade
conjunta: f ( x, y ) cy 2 xy onde 0 x 1 e 0 y 1
2
reinaldo@ele.puc-rio.br 36
Independência
Conseqüências
Se X1 e X2 são independentes então:
1) As densidades condicionais são iguais às
densidades marginais correspondentes.
Conseqüências
Pr(a <X1< b, c <X2< d) = Pr(a <X1<b). Pr(c <X2< d)
para quaisquer a < b, c < d.
reinaldo@ele.puc-rio.br 39
Independência
Conseqüências
O valor esperado de um produto de
funções de variáveis aleatórias onde cada
função depende apenas de uma das
variáveis aleatórias é igual ao produto
dos valores esperados das funções
individuais sempre que as variáveis
aleatórias X1 e X2 forem independentes.
reinaldo@ele.puc-rio.br 40
Exemplo 1 - continuação
Sejam X e Y variáveis discretas com função de
probabilidade conjunta do Exemplo 1:
Pr( X = x) X=0 X=1 X=2 X=3
Pr(Y = y)
Y=0 0.2 0.1 0.1 0
Y=1 0.1 0.1 0.1 0.1
Y =2 0 0.1 0.1 0
reinaldo@ele.puc-rio.br 43
Coeficiente de Correlação
O coeficiente de correlação é a
covariância dividida pelo produto dos
desvios padrões das duas variáveis, ou
seja, é uma medida padronizada (e
adimensional) da covariância.
reinaldo@ele.puc-rio.br 44
Coeficiente de Correlação
Se X1 e X2 são independentes, a correlação pode ser
zero, positiva ou negativa. Assim: A independência
não especifica a correlação!
reinaldo@ele.puc-rio.br 46
Momentos Condicionais
reinaldo@ele.puc-rio.br 47
Momentos Condicionais
reinaldo@ele.puc-rio.br 48
Momentos Condicionais
reinaldo@ele.puc-rio.br 49
Momentos Condicionais
x
VAR X 2 X 1 x1 2 2 1 f x2 x1 dx2 onde
2
2 1 E X 2 X 1 x1 é a média condicional
reinaldo@ele.puc-rio.br 50
Exemplo 3
9x 4 4x 2
E Y X x
9x 3
E Y2 X x 3x 1
27 x 2 18 x 2
VAR Y X x
81x 2 54 x 9
reinaldo@ele.puc-rio.br 52
Exemplo 3
Curva de Regressã o de Y em X
1.350
1.300
1.250
1.200
1.150
1.100
1.050
0.00 0.20 0.40 0.60 0.80 1.00
reinaldo@ele.puc-rio.br 53
Exercício 3 - para casa
Considere a seguinte densidade conjunta:
f x, y .e
1 y/2
, x 0, y x
4
a) Ache a densidade marginal de X.
1 x2
Resposta: f ( x ) e
2
b) Ache a densidade y marginal de Y.
1
Resposta: f ( y ) . y.e 2
4
c) Calcule Pr( X > 1 Y < 4)
Resposta: Pr ob( x 1 y 4) 26,82%
e au 1
Dica:
au
u.e du . u
a a
reinaldo@ele.puc-rio.br 54
Exercício 4 – para casa
Considere as seguintes distribuições conjuntas:
a) f(x, y) = 4.x.y.exp{ -x2 - y2} para x 0, y 0
b) f(x, y) = 3.x2/y3 para 0 x y 1
Em cada caso, determine se X e Y são
independentes.
f ( x) 2.x.e x
2
Resposta a)
f ( y) 2. y.e y
2
x2 y2
f ( x). f ( y) 4.x. y.e .e ,então, X e Y são independentes.
Resposta b) f ( x)
3
2
1 x2
f ( y) 1
f ( x). f ( y)
3
2
1 x2 ,então, X e Y não são independentes.
reinaldo@ele.puc-rio.br 55
Exercício 5 - para casa
Sejam X e Y v.a. contínuas com densidade conjunta:
f ( x, y ) cx 2 xy onde 0 x 1 e 0 y 1
Encontre a constante c que faz desta expressão uma
densidade. 9
9 f ( x, y ) x 2 x. y
Resposta: c
4 4
Encontre a densidade marginal de X.
9 2 x
Resposta: f ( x) 4 x 2
Encontre a densidade marginal de Y.
Resposta: f ( y) 3 y
4 2
Encontre a densidade condicional de Y dado X = x.
9x 4 y
Resposta: f (Y X x) 9 x 2
Ache a média condicional de Y dado X = x.
27 x 8
Resposta: E Y X x
54 x 12
X e Y são independentes? Por que? Justifique.
Resposta: f ( x). f ( y) 18x y 27 x 4 xy 6 x , não são independentes
2 2
16
reinaldo@ele.puc-rio.br 56
PROBEST
Aula 8
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Aula 8
Distribuições Derivadas da Normal
Diferença entre Probabilidade e Estatística
Amostra Aleatória
Objetivos da Estatística
Distribuição Amostral
Estimação Pontual
Estimação Bayesiana X Clássica
Estimação por Máxima Verossimilhança
Estimação por Método de Momentos
reinaldo@ele.puc-rio.br 2
Distribuições Derivadas da
Normal
Densidade Qui-quadrado com k graus de
liberdade
Seja X uma variável aleatória contínua e positiva
com densidade dada por:
k
1 −1
f ( x) = .x .e − x / 2 onde x > 0
2
k
2k / 2.Γ
2
reinaldo@ele.puc-rio.br 3
Distribuições Derivadas da
Normal
A densidade Qui-quadrado é apenas um caso
particular de uma outra densidade chamada
densidade Gama, que também inclui a
Exponencial como caso particular.
reinaldo@ele.puc-rio.br 4
Distribuição Qui-Quadrado
Densidades Qui-Quadrado
0.476 0.5
0.4
quiquad( x, 2) 0.3
quiquad( x, 5)
quiquad( x, 7)
0.2
0.1
0
0
0 5 10 15 20 25
0.1 x 25
reinaldo@ele.puc-rio.br 5
Distribuição Qui-Quadrado
Densidades Qui-Quadrado
0.112 0.12
0.1
0.08
quiquad( x, 8)
quiquad( x, 10)
0.06
quiquad( x, 20)
0.04
0.02
0
0
0 5 10 15 20 25 30 35 40
0.1 x 39.7
reinaldo@ele.puc-rio.br 6
Distribuição Qui-quadrado
reinaldo@ele.puc-rio.br 7
Distribuição Qui-quadrado
probabilidade 0.01 0.05 0.10 0.25 0.50 0.75 0.90 0.95 0.99
graus de
liberdade
reinaldo@ele.puc-rio.br 8
Distribuição Qui-quadrado
reinaldo@ele.puc-rio.br 10
Distribuição Qui-Quadrado
Valor de x para
o qual
desejamos
Pr(X > x)
Graus de
liberdade
da Qui-
quadrado
reinaldo@ele.puc-rio.br 11
Distribuição Qui-Quadrado
reinaldo@ele.puc-rio.br 12
Distribuição Qui-Quadrado
Por exemplo:
Supondo que X seja uma variável aleatória com
densidade qui-quadrado com 6 graus de
liberdade, a probabilidade de X exceder 0.87 é
99%.
reinaldo@ele.puc-rio.br 13
Distribuição Qui-Quadrado
reinaldo@ele.puc-rio.br 14
Distribuição Qui-Quadrado
Da figura segue que, a
Pr(X > 31.4104) quando
X é uma Qui-quadrado
com 20 graus de
liberdade é 0.05
reinaldo@ele.puc-rio.br 15
Distribuição Qui-Quadrado
reinaldo@ele.puc-rio.br 16
Distribuições Derivadas da
Normal
Uma propriedade muito importante da densidade
Qui-quadrado é a preservação da mesma família
de densidades quando somamos variáveis
independentes.
reinaldo@ele.puc-rio.br 17
Distribuições Derivadas da
Normal
Teorema (aditividade da densidade Qui-quadrado)
reinaldo@ele.puc-rio.br 19
Distribuições Derivadas da
Normal
n
V = ∑ Z i2 = Z12 + Z 22 + ... + Z n2
i =1
reinaldo@ele.puc-rio.br 20
Distribuições Derivadas da
Normal
Por que a densidade Qui-quadrado é importante?
Porque está relacionada com a distribuição da
variância amostral de uma amostra aleatória
Normal, como indicado no próximo teorema.
reinaldo@ele.puc-rio.br 21
Distribuições Derivadas da
Normal
Teorema
Sejam X1, X2, ...., Xn uma amostra aleatória da
distribuição N(µ, σ2). Seja S2 a variância amostral:
( )
n
1
S2 = ∑ i −
2
X X
n − 1 i =1
Então:
∑ (X − X)
n
2
(n − 1) S 2 i
= i =1
σ 2
σ2
tem distribuição Qui-quadrado com (n-1) graus de
liberdade.
reinaldo@ele.puc-rio.br 22
Distribuições Derivadas da
Normal
A partir deste teorema podemos deduzir
facilmente a média e variância de S2.
Teorema
Sejam X1, X2, ...., Xn uma amostra aleatória
da distribuição N(µ, σ2). Seja S2 a
variância amostral. Então:
E (S 2 ) = σ 2
2σ 4
VAR( S ) =
2
n −1
reinaldo@ele.puc-rio.br 23
Distribuições Derivadas da
Normal
A distribuição t de Student
Tem apenas um parâmetro k, o número de graus
de liberdade, e é definida como:
Z
T=
V /k
Onde Z é N(0,1) e V é Qui-Quadrado com k graus
de liberdade, e ambos são independentes.
Esta distribuição é simétrica em torno de zero,
também tem forma de sino e, à medida que o
número de graus de liberdade cresce, se
aproxima da N(0,1).
reinaldo@ele.puc-rio.br 24
Distribuições Derivadas da
Normal
Quando n (número de graus de liberdade) cresce,
a densidade t de Student se torna cada vez mais
parecida com uma N(0,1)
Densidades t de Student e N(0,1)
0,5
0,4
0,4
0,3
N(0,1)
0,3 t(2)
0,2 t(5)
t(10)
0,2
0,1
0,1
-
2
3
,5
,2
,9
,6
,3
,7
,4
,1
2
-1
0,
0,
0,
1,
1,
1,
2,
-2
-2
-1
-1
-1
-0
-0
-0
reinaldo@ele.puc-rio.br 25
Distribuições Derivadas da
Normal
Exemplo (uso de uma tabela t)
graus de 0.9 0.95 0.975 0.99 0.995
liberdade
1 3.078 6.314 12.706 31.821 63.657
5 1.476 2.015 2.571 3.365 4.032
10 1.372 1.812 2.228 2.764 3.169
15 1.341 1.753 2.131 2.602 2.947
20 1.325 1.725 2.086 2.528 2.845
reinaldo@ele.puc-rio.br 28
Distribuições Derivadas da
Normal
Por que a densidade t é importante?
Ela é essencial no contexto de intervalos de
confiança e testes de hipóteses, como veremos
posteriormente. A justificativa vem, em parte, do
próximo resultado.
Teorema
Sejam X1, X2, ...., Xn uma amostra aleatória da
distribuição N(µ, σ2). Sejam X e S2 a média e
variância amostrais. Então:
X −µ n (X − µ )
T= = ~ tn −1
S/ n S
reinaldo@ele.puc-rio.br 29
Probabilidade e Estatística –
Qual a Diferença?
reinaldo@ele.puc-rio.br 30
Diferença entre Probabilidade e
Estatística
A partir de agora começamos realmente a falar de
Estatística.
reinaldo@ele.puc-rio.br 32
Objetivos - Estatística
A distribuição da amostra é conhecida
exceto por alguns parâmetros que
buscamos estimar.
reinaldo@ele.puc-rio.br 33
Objetivos - Estatística
reinaldo@ele.puc-rio.br 34
Distribuição Amostral
n i =1 n − 1 i =1
reinaldo@ele.puc-rio.br 35
Distribuição Amostral
reinaldo@ele.puc-rio.br 36
Estimação Pontual
reinaldo@ele.puc-rio.br 37
Estimação Pontual
reinaldo@ele.puc-rio.br 38
Estimação Pontual
Objetivo: estimar θ.
reinaldo@ele.puc-rio.br 39
Estimação Pontual
reinaldo@ele.puc-rio.br 42
Definição do Problema de
Estimação Pontual
O problema geral aqui é ...
reinaldo@ele.puc-rio.br 43
Definição do Problema de
Estimação Pontual
Seja X 1 , X 2 ,..., X n uma amostra aleatória da
densidade f(x,θ).
reinaldo@ele.puc-rio.br 44
Exemplo
reinaldo@ele.puc-rio.br 45
Exemplo
monica@ele.puc-rio.br 47
Exemplo
50 valores
por variável
5 variáveis
reinaldo@ele.puc-rio.br 48
O que é um bom estimador?
reinaldo@ele.puc-rio.br 49
O que é um bom estimador?
reinaldo@ele.puc-rio.br 50
Método da Máx. Verossimilhança
reinaldo@ele.puc-rio.br 53
Método da Máx. Verossimilhança
L(θ ) = ∏ f ( xi , θ ) = ∏ = 5
∏ x!
i =1 i =1 xi !
i
i =1
reinaldo@ele.puc-rio.br 55
Exemplo 1 - MLE (Poisson)
K(θ) = Múltiplo da
Verossimilhança
0.060
0.040
0.020
0.000 0.0 0.4 0.8 1.2 1.6 2.0 2.4 2.8 3.2 3.6 4.0
reinaldo@ele.puc-rio.br 57
Método da Máx. Verossimilhança
Notação:
Geralmente denotaremos o MLE por θˆ = T(X1 , X 2 , ..., X n )
reinaldo@ele.puc-rio.br 59
Método da Máx. Verossimilhança
Atenção
Em muitos casos o estimador de máxima
verossimilhança é único e pode ser
obtido por métodos analíticos.
reinaldo@ele.puc-rio.br 60
Exemplo 2 - MLE (Poisson)
f ( xi ,θ ) = θ (1 − θ )
xi 1− x i
θ ∈ (0,1), x i = 0,1
i =1
reinaldo@ele.puc-rio.br 62
Exemplo 3 (Bernoulli)
A log verossimilhança é:
l (θ ) = log(L(θ )) = ( ∑ x i ) logθ + (n - ∑ x i ) log(1 − θ ) =
= nX.logθ + (n - nX) log(1 - θ )
reinaldo@ele.puc-rio.br 64
Exemplo 4 (Normal)
A verossimilhança é:
n
1 1 2 1 n
L( µ ) = ∏ exp− ( X i − µ ) = (2π ) −n / 2
exp- ∑ ( X i − µ ) 2
i =1 2π 2 2 i=1
( )
n n
Q(µ ) = ∑ ( X i − µ ) =∑ X i2 − 2 µX i + µ 2 =
2
i =1 i =1
n
= ∑ X i2 − 2 µnX + nµ 2
i =1
reinaldo@ele.puc-rio.br 66
Método dos Momentos
Idéia Geral
Igualar os momentos da distribuição aos
momentos da amostra. Isso é razoável pois a
distribuição empírica converge estocasticamente
para a função de distribuição F(X).
reinaldo@ele.puc-rio.br 67
Método dos Momentos
1 n k
Seja M k = ∑ X i o k - ésimo momento amostral
n i =1
Faça E(Xk) = Mk para k = 1,2,....
Faça isto para quantos k's forem necessários até
obter soluções únicas para os parâmetros
desconhecidos
reinaldo@ele.puc-rio.br 68
Método dos Momentos
Nota
Uma formulação equivalente do método dos
momentos usa os momentos centrais, igualando
os momentos centrais da distribuição e da
amostra até obter soluções únicas para todos os
parâmetros desconhecidos.
Ou seja, a outra formulação do método dos
momentos é igualar:
E ( X − µ ) = mk = ∑ ( X i − X ) para k = 1,2.....
k 1 n k
n i =1
Até encontrar uma solução única. Muitas vezes a
resposta pelas duas formulações será igual.
reinaldo@ele.puc-rio.br 69
Método dos Momentos
reinaldo@ele.puc-rio.br 71
Exercício 1
Determine o parâmetro “Ɵ” pelo Método de
Máxima Verossimilhança, mostrar todos os
passos da solução, para as distribuições:
X
a) Binomial. Resposta: θˆ = MV
n
b) Geométrica. Resposta: θ = 1
^
MV
X
θˆ = n
c) Binomial Negativa. Resposta: X
MV
d) Exponencial. Resposta: θ = 1
^
MV
X
reinaldo@ele.puc-rio.br 72
PROBEST
Aula 9
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Aula 9
Intervalos de Confiança – Motivação
Intervalos de Confiança para Médias
Intervalos de Confiança para Diferenças
entre Médias (Variâncias supostas iguais)
Intervalo de Confiança para a variância de
uma Normal
Intervalos de Confiança para a razão de
variâncias
Intervalo de Confiança aproximado para a
proporção uma Binomial
reinaldo@ele.puc-rio.br 2
Intervalos de Confiança
reinaldo@ele.puc-rio.br 3
Intervalos de Confiança
reinaldo@ele.puc-rio.br 4
Intervalos de Confiança
L ,U
Note que o intervalo X~ X~
é aleatório, e a cada amostra obtida
iremos encontrar valores diferentes para
os limites L e U.
reinaldo@ele.puc-rio.br 5
Intervalos de Confiança –
Média da Normal
Consideraremos agora o caso mais
comum na prática onde os dados são
supostos NORMAIS e θ é média da
distribuição.
reinaldo@ele.puc-rio.br 6
Intervalos de Confiança –
Média da Normal
Argumento intuitivo....
Suponha que você tem uma amostra
aleatória da Normal, em que a média é
desconhecida.
reinaldo@ele.puc-rio.br 7
Intervalos de Confiança –
Média da Normal
E se agora você precisar encontrar um
intervalo que contenha θ com uma
probabilidade especificada?
X −θ n ( X −θ )
=Z = ~ N (0,1)
σ σ
n
reinaldo@ele.puc-rio.br 10
Intervalo de Confiança –
Média da Normal
Prob (-2 < Z < 2) = Φ(2) - Φ(-2)= 0.954
Substituindo Z na expressão anterior leva a:
X −θ 2σ 2σ
−2< < +2 ⇔ X − <θ < X +
σ/ n n n
Daí:
2σ 2σ
Pr ob{− 2 < Z < +2} = Pr ob X − <θ < X + = 0.954
n n
reinaldo@ele.puc-rio.br 11
Intervalo de Confiança –
Média da Normal
Ou seja, na notação mostrada antes:
2σ
L( X ) = X −
~ n
2σ
U(X ) = X +
~ n
1 − α = 0.954
reinaldo@ele.puc-rio.br 12
Intervalo de Confiança –
Média da Normal
Receita de Bolo
Seja X~ =( X 1 ,....., X n ) uma a.a. de tamanho n
da distribuição Normal com média
desconhecida θ e variância conhecida σ2.
reinaldo@ele.puc-rio.br 14
IC para a média da Normal com
σ conhecido
Exemplo
Considere a população de alunos da PUC. Para uma
amostra de 50 alunos obtivemos uma altura média de
1,68m.
Sabe-se que o desvio-padrão da altura da população
de alunos da PUC é o mesmo que o da população de
jovens cariocas com menos de 25 anos: 0,11m.
Suponha que as alturas dos alunos são Normalmente
distribuídas.
Determine, com um nível de confiança de 95%, o
intervalo onde a real altura média da população de
alunos da PUC deve estar localizada.
reinaldo@ele.puc-rio.br 15
IC para a média da Normal com
σ conhecido
Solução
Note que a amostra é Normal com variância
conhecida, e assim a distribuição de X
também é Normal.
reinaldo@ele.puc-rio.br 16
IC para a média da Normal com
σ conhecido
Solução
O IC 95% (para as alturas em cm) é então:
σ σ 11 11
X − z α. ,X + z α. = 168 − 1.96 ,168 + 1.96
1− −
n 50
2 n 1
2 50
= (164.95 cm, 171.05 cm)
reinaldo@ele.puc-rio.br 17
IC para a média da Normal com
σ conhecido
Receita de bolo – qual valor de zα/2 usar?
1.96 (a “resposta
da função” é tal
que a
probabilidade de
estar abaixo deste
valor é 0,975
reinaldo@ele.puc-rio.br 19
IC para a média da Normal com
σ conhecido
Exemplo
Numa amostra de 36 postos de gasolina no Rio de
Janeiro, o preço médio do litro da gasolina aditivada
foi de R$ 1.78. Sabe-se, por experiências anteriores,
que o desvio padrão é R$ 0.20.
Encontre intervalos de confiança 90%, 95% e 99%
para o preço médio da gasolina aditivada no Rio de
Janeiro supondo que a amostra é Normal.
Solução
Aqui estamos supondo que o desvio padrão é conhecido, e
assim podemos usar um intervalo baseado na densidade
Normal.
reinaldo@ele.puc-rio.br 20
IC para a média da Normal com
σ conhecido
Os IC têm a forma geral: X − z . σ , X + z . σ
α α 1− 1−
2 n 2 n
O IC 90% é:1.78 − 1.645 (0.20) ,1.78 + 1.645 (0.20) = (R$ 1.725, R$ 1.835 )
6 6
reinaldo@ele.puc-rio.br 21
IC para a média da Normal com
σ conhecido
Exercício 1 (para casa)
O preço médio de um automóvel Palio ELX 1.0 4 portas
ano 2001 é R$ 17727 (segundo o Jornal Valor Econômico
de 07/07/2003).
Suponha que o desvio padrão REAL dos preços seja R$
1500 e o tamanho da amostra é n = 25 carros.
Encontre intervalos de confiança 95% e 99% para os
preços de Palios ELX 1.0 quatro portas ano 2001
supondo que os preços são Normalmente distribuídos.
Resposta:
- Intervalo de Confiança [1-α] 95% = [17.139 ; 18.315 ]
- Intervalo de Confiança [1-α] 99% = [16.953,60;18.500,40]
reinaldo@ele.puc-rio.br 22
IC para a média da Normal com
σ conhecido
Exercício 2 (para casa)
Toma-se uma amostra de 25 usuário de um cartão
de crédito e observa-se que o gasto médio mensal é
R$ 600.
O desvio padrão é conhecido e igual a R$ 250.
Encontre intervalos de confiança 95 e 99% para o
gasto médio com cartão na população de usuários.
Resposta:
- Intervalo de Confiança [1-α] 95% = [502 ; 698]
- Intervalo de Confiança [1-α] 99% = [471,10 ; 728,90]
reinaldo@ele.puc-rio.br 23
PIVOT
reinaldo@ele.puc-rio.br 24
PIVOT
n (X − θ )
Z=
σ
reinaldo@ele.puc-rio.br 25
IC para a média da Normal com
σ desconhecido
Caso II
X ~ NORMAL(θ, σ2); σ2 DESCONHECIDO
Seja X~ =( X 1 ,....., X n ) uma a.a. de tamanho n
da distribuição Normal acima.
Os estimadores não tendenciosos de θ e σ2
são:
X=
1 n
∑ 2
X
1 n 2
e S = ∑ (X −X)
n −1
i i
ni =1 i =1
σ 2 (n − 1) S 2
onde X ~ N θ , e ~ χ 2
n −1
n σ 2
reinaldo@ele.puc-rio.br 26
IC para a média da Normal com
σ desconhecido
2
Também, X e S são independentes.
Onde: S =2 1 n
∑ (X i − X )2
n − 1 i =1
Assim da tabela da distribuição t de Student com n-1
graus de liberdade podemos obter dois números a e b tais
que: Pr( a < T < b) = 1- α
reinaldo@ele.puc-rio.br 27
IC para a média da Normal com
σ desconhecido
Para encontrar um intervalo simétrico fazemos a =
-b e assim:
X −θ
Prob[a < T < b] = Prob {−b < T < +b} = Prob −b < n < b = 1 − α
S
S S
⇔ Prob −b < X − θ < +b =
n n
S S
= Prob − X − b < −θ < − X + b =
n n
S S
=Prob X − b <θ < X +b =1 − α
n n
reinaldo@ele.puc-rio.br 28
IC para a média da Normal com
σ desconhecido
Portanto:
S S
O intervalo X − b , X + b
n n
reinaldo@ele.puc-rio.br 29
IC para a média da Normal com
σ desconhecido
Receita de Bolo
Seja X1, X2, ..., Xn uma a.a. de tamanho n da
distribuição Normal com média desconhecida
θ e variância desconhecida σ2.
monica@ele.puc-rio.br 31
IC para a média da Normal com
σ desconhecido
O valor tn-1,1-α/2 é obtido de uma tabela da
distribuição t com n-1 graus de liberdade.
Pode-se, alternativamente, usar a função
INVT do Excel.
reinaldo@ele.puc-rio.br 32
IC para a média da Normal com
σ desconhecido
Exercício 3 (para casa)
Numa amostra de 16 postos de gasolina no Rio de
Janeiro, o preço médio do litro da gasolina aditivada foi
de R$ 1.78.
O desvio padrão estimado dos preços na amostra é R$
0.20. Encontre intervalos de confiança 90%, 95% e 99%
para o preço médio da gasolina aditivada no Rio de
Janeiro e compare-os com os encontrados no exemplo
da página 18.
Resposta:
- Intervalo de Confiança [1-α] 90% = [R$1,692 ; R$1,868]
- Intervalo de Confiança [1-α] 95% = [R$1,673 ; R$1,886]
- Intervalo de Confiança [1-α] 99% = [R$1,633 ; R$1,927]
reinaldo@ele.puc-rio.br 33
IC para a média da Normal com
σ desconhecido
Solução
Aqui deve-se usar a distribuição t para encontrar
o IC, pois o desvio padrão é desconhecido. A
forma do intervalo é:
S S S
IC =
X ±t α. =
X −t α. , X +t α.
n −1,1− n −1,1− n −1,1−
2 n 2 n 2 n
Pela função INVT do Excel com 15 graus de
liberdade obtemos os pontos percentuais para os
IC 90, 95 e 99%, que são, respectivamente: 1.753,
2.131 e 2.947.
reinaldo@ele.puc-rio.br 34
IC para a média da Normal com
σ desconhecido
( 0.20 ) ( 0.20 )
O IC 90% é: 1.78 − 1.753 ,1.78 + 1.753 =( R$ 1.692, R$ 1.868)
16 16
reinaldo@ele.puc-rio.br 35
Nota IMPORTANTE – uso de
INVT no Excel
reinaldo@ele.puc-rio.br 36
Utilizando o Excel
Função Descrição
reinaldo@ele.puc-rio.br 37
Distribuição t de Student
0,5
0,4
0,4
0,3
N(0,1)
0,3 t(2)
0,2 t(5)
t(10)
0,2
0,1
0,1
-
2
3
,5
,2
,9
,6
,3
,7
,4
,1
2
-1
0,
0,
0,
1,
1,
1,
2,
-2
-2
-1
-1
-1
-0
-0
-0
reinaldo@ele.puc-rio.br 38
A distribuição t de Student
Exemplo: para uma amostra com 15 elementos
(14 graus de liberdade) e para um nível de
confiança de 5% (α/2 = 0,025), t é igual a 2,1448
G.L 0.100 0.075 0.050 0.025 0.020
1 3.0777 4.1653 6.3137 12.7062 15.8945
0.45 2 1.8856 2.2819 2.9200 4.3027 4.8487
0.40 3 1.6377 1.9243 2.3534 3.1824 3.4819
4 1.5332 1.7782 2.1318 2.7765 2.9985
0.35
5 1.4759 1.6994 2.0150 2.5706 2.7565
0.30 6 1.4398 1.6502 1.9432 2.4469 2.6122
0.25 7 1.4149 1.6166 1.8946 2.3646 2.5168
8 1.3968 1.5922 1.8595 2.3060 2.4490
0.20 9 1.3830 1.5737 1.8331 2.2622 2.3984
reinaldo@ele.puc-rio.br 39
Comparação: IC Normais x IC
t de Student
A distribuição t nos fornece intervalos de
comprimento maior que os intervalos
Normais com a mesma probabilidade.
reinaldo@ele.puc-rio.br 43
Utilizando o Excel
A seguir aplicamos esta análise para o preço da
gasolina em 106 postos do Rio de Janeiro em Agosto
de 2002.
reinaldo@ele.puc-rio.br 44
Utilizando o Excel
Gas. Comum
Média 1.725
O erro padrão é
Erro Padrão 0.007 apenas o desvio
Mediana 1.725 padrão dividido por
Moda 1.749 √n = √106
Desvio Padrão 0.075
Variância Amostral 0.006
Curtose 1.082
Assimetria 0.386
Amplitude (Máx - Mín) 0.410
Mínimo 1.520
(t0.025)σ/√n – basta
Máximo 1.930 subtrair e somar este
Soma 182.847 valor à média para
n 106
encontrar o IC 95%
IC 95% 0.014
reinaldo@ele.puc-rio.br 45
Utilizando o Excel
Nota:
Como o tamanho da amostra é grande,
poderíamos ter usado um IC baseado na
distribuição Normal.
Na verdade, a diferença praticamente
inexiste, pois o número de graus de
liberdade da distribuição t neste caso
(105) a torna, para todos os efeitos,
indistigüível da Normal.
reinaldo@ele.puc-rio.br 46
Forma Alternativa para um IC
baseado na distribuição t
Se definirmos a variância amostral como:
n
1
∑ ( Xi − X )
2
=S*2
n i =1
e então
( n ) S *2 ~ χ 2
n −1
σ 2
reinaldo@ele.puc-rio.br 48
IC para a média de uma distribuição
qualquer – GRANDES AMOSTRAS
Intervalo de confiança aproximado para as
médias de distribuição não-normais (baseado
no Teorema Central do Limite).
reinaldo@ele.puc-rio.br 49
IC para a média de uma distribuição
qualquer – GRANDES AMOSTRAS
Se n (o tamanho da amostra) é grande
o Teorema Central do Limite estabelece
que:
S
2
→ σ
P 2
n
X −θ
→
d (
N (0,1)
)
σ
n( X −θ ) /σ ( X −θ ) d
= n → N (0,1)
(n − 1) S 2 /(n − 1)σ 2 S
reinaldo@ele.puc-rio.br 50
IC para a média de uma distribuição
qualquer – GRANDES AMOSTRAS
Daí, um intervalo de confiança aproximado
para θ quando a variância é desconhecida e Xi
é não- Normal é:
S S
X − z1−α / 2 . ; X + z1−α / 2 .
n n
onde z1-α/2 é obtido de uma N(0,1) tal que:
Prob [- z1-α/2 < Z < z1-α/2 ] = 1- α sendo Z ~ N (0,1)
reinaldo@ele.puc-rio.br 51
IC para diferenças entre médias
Objetivo
Comparação das médias de duas amostras
aleatórias Normais.
reinaldo@ele.puc-rio.br 52
IC para diferenças entre médias
Aplicações - Medicina
Deseja-se medir o efeito da dieta sobre a pressão
sangüínea e a taxa de colesterol de uma pessoa.
Toma-se duas amostras “parecidas” de pessoas
(mesmas idades, pesos, nível de atividade, etc... ).
Umas das amostras é submetida a uma dieta com
alto teor de gordura e carnes vermelhas.
O outro grupo ingere uma dieta consistindo
principalmente em vegetais, carnes brancas e
grãos.
reinaldo@ele.puc-rio.br 53
IC para diferenças entre médias
reinaldo@ele.puc-rio.br 54
IC para diferenças entre médias
Aplicações - Veterinária
A empresa produtora da ração “Baby
Dog” decide lançar no mercado uma nova
marca de ração, “”Super Baby Dog”, que
supostamente tem maior teor nutritivo.
Toma-se uma amostra de 200
cachorrinhos com 2 meses de idade, 100
deles alimentados com “Baby Dog” e 100
alimentados com “Super Baby Dog”.
reinaldo@ele.puc-rio.br 55
IC para diferenças entre médias
reinaldo@ele.puc-rio.br 56
IC para diferenças entre médias
Aplicações – Marketing
A empresa ABC concentra seus anúncios de TV
no horário nobre, gastando uma imensa fortuna
em publicidade. Como forma de conter as
despesas, a companhia decide direcionar seus
anúncios para um horário mais tardio, e para
programas vistos por um público principalmente
das classes A e B. A questão de interesse para a
empresa é: esta mudança foi eficaz? Ou seja,
será que a empresa economizou dinheiro e ainda
manteve o mesmo nível de vendas após a
mudança do horário de seus anúncios?
reinaldo@ele.puc-rio.br 57
IC para diferenças entre médias
Formulação Matemática
Considere duas populações Normais com
médias (µ1 e µ2) possivelmente distintas e
com a mesma variância (esta hipótese é
essencial para resolver o problema!). Isto
é:
Xi ~ N (µ1,σ2) e Yj ~ N (µ2,σ2)
Onde i =1, 2, ..., m e j = 1,2, ..., n
reinaldo@ele.puc-rio.br 58
IC para diferenças entre médias
reinaldo@ele.puc-rio.br 59
IC para diferenças entre médias
( X − Y − c, X − Y + c )
A questão que devemos responder é: como achar
esta constante c?
reinaldo@ele.puc-rio.br 60
IC para diferenças entre médias
Solução:
Sabemos que:
X ~ N ( µ1 ; σ / m);
2
Y ~ N ( µ 2 ; σ / n) 2
reinaldo@ele.puc-rio.br 61
IC para diferenças entre médias
( m − 1) S 2 (n − 1) S 2
1
~χ 2 2
~ χ n2−1
σ 2 m −1
σ 2
Revisão:
Seja Z ~N(0,1) e V~ χp2, ambas independentes.
Então:
T = Z / V / p ~ tp ,
reinaldo@ele.puc-rio.br 63
IC para diferenças entre médias
m n
1
V= ((m − 1) S + (n − 1) S ) ~ χ
2 2 2
n+ m−2
σ 2 1 2
reinaldo@ele.puc-rio.br 64
IC para diferenças entre médias
Z X − Y − ( µ1 − µ 2 )
T= = ~ tn+ m−2
V 1 1 (m − 1) S1 + (n − 1) S 2
2 2
+
n+m−2 n m n+m−2
reinaldo@ele.puc-rio.br 66
IC para diferenças entre médias
Para simplificar a notação, seja:
1 1 ( m − 1) S 2
+ ( n − 1) S 2
R = + 1 2
n m n+m−2
(( X − Y ) − bR; ( X − Y ) + bR )
reinaldo@ele.puc-rio.br 67
IC para diferenças entre médias
Exemplo
Estuda-se um certo processo químico
com o objetivo de tentar aumentar a
produção de um certo composto.
Atualmente usa-se na produção um certo
tipo de catalisador A, mas um outro tipo
de catalisador B é aceitável.
Faz-se uma experiência com n = 8
tentativas para o catalisador A e o mesmo
no de repetições para o catalisador B.
reinaldo@ele.puc-rio.br 68
IC para diferenças entre médias
reinaldo@ele.puc-rio.br 69
IC para diferenças entre médias
1 n
A variância amostral é S = ∑2
n − 1 i =1
( X i − X ) 2
reinaldo@ele.puc-rio.br 71
IC para a variância da Normal
reinaldo@ele.puc-rio.br 72
IC para a variância da Normal
Exemplo
Sejam X1, X2, ..., X9 iid Normais com média
µ e variância σ2.
Observa-se s2 = 7.63. Encontre um
intervalo de confiança 95% para σ2.
reinaldo@ele.puc-rio.br 73
IC para a variância da Normal
Solução
Neste caso precisamos encontrar a e b de
uma tabela Qui-quadrado com 8 graus de
liberdade.
O ponto a tal que a probabilidade de estar
abaixo dele é 2.5% é: 2.180
O ponto b tal que a probabilidade de estar
abaixo dele é 97.5% (ou seja, a
probabilidade de estar acima dele é 2.5%)
é: 17.535.
reinaldo@ele.puc-rio.br 74
IC para a variância da Normal
reinaldo@ele.puc-rio.br 75
IC aproximado para a
proporção de uma Binomial
Seja Y ~ Bin(n,p) onde n é conhecido e 0<p<1
é desconhecido.
Y
Assim, E(Y) = np, VAR(Y) = np(1-p), e pˆ =
n
é o estimador de máxima verossimilhança para p.
reinaldo@ele.puc-rio.br 76
IC aproximado para a
proporção de uma Binomial
reinaldo@ele.puc-rio.br 79
IC aproximado para a
proporção de uma Binomial
Exemplo
Uma pesquisa do governo afirma que 10%
dos homens com idade inferior a 25 anos
estão desempregados.
Encontre a probabilidade de que, ao
tomarmos uma amostra de 400 homens
com menos de 25 anos, a proporção
estimada de desempregados seja superior
a 12%.
reinaldo@ele.puc-rio.br 80
IC aproximado para a
proporção de uma Binomial
Solução
A probabilidade real (segundo o governo)
de um homem desta faixa etária estar
desempregado é p = 10%.
Toma-se uma amostra de tamanho 400 e
estima-se p a partir desta amostra.
Podemos utilizar o Teorema Central do
Limite e encontramos:
pˆ − p pˆ − p pˆ − p
= n ≈ n é aproximadamente N(0,1)
p(1 − p ) p(1 − p ) pˆ (1 − pˆ )
n
reinaldo@ele.puc-rio.br 81
IC aproximado para a
proporção de uma Binomial
A probabilidade desejada é:
Pr ( pˆ > 0.12 ) = Pr ( pˆ − 0.10) > (0.12 − 0.10) =
400 400
(1 / 10 )(9 / 10 ) (1 / 10)(9 / 10)
200 200 4
= Pr ( pˆ − 0.10 ) > (0.02 ) = Pr Z > = Pr (Z > 1.33) = 0.0918
3 3 3
reinaldo@ele.puc-rio.br 83
IC aproximado para a
proporção de uma Binomial
Solução
Pelo exemplo anterior:
pˆ − p pˆ − p pˆ − p
= n ≈ n =
400
( pˆ − p ) = 61.546( pˆ − p )
p(1 − p ) p(1 − p ) pˆ (1 − pˆ ) (0.12)(0.88)
n
reinaldo@ele.puc-rio.br 84
IC aproximado para a
proporção de uma Binomial
Logo:
1.645 1.645 1.645 1.645
⇒ Pr pˆ − < p < pˆ + = Pr 0.12 − < p < 0.12 + =
61.546 61.546 61.546 61.546
= Pr (9.33% < p < 14.67% )
reinaldo@ele.puc-rio.br 85
IC aproximado para a
proporção de uma Binomial
ou:
pˆ (1 − pˆ ) pˆ (1 − pˆ )
IC = pˆ − z1−α / 2 , pˆ + z1−α / 2 = (1 − α )
n n
0,12(0,88)
= (1 − α )
0,12(0,88)
IC = 0,12 − 1,645 , 0,12 + 1,645
400 400
reinaldo@ele.puc-rio.br 86
Exercício 4 (para casa)
Seja X uma variável aleatória contínua que segue uma
Normal com média “μ” e Variância “σ2”, ambas
desconhecidas.
Seja X̰ = (3, 7, 2, 4, 4, 9, 6, 8, 5, 2), uma amostra aleatória
de tamanho 10 desta população. Pede-se:
a) O intervalo de confiança aos níveis de significância de
30% e 10%, , para a “Média (μ)”.
Resposta:
- IC [1-α] 70% = [4,148 ; 5,852]
- IC [1-α] 90% = [3,58 ; 6,42].
a) O intervalo de confiança aos níveis de significância de
10% e 1%, para a “Variância (σ2)”.
Resposta:
- IC [1-α] 90% = [3,19 ; 16,22]
- IC [1-α] 99% = [2,29 ; 31,12].
reinaldo@ele.puc-rio.br 87
Exercício 5 (para casa)
Uma certa empresa de pesquisa resolveu analisar 2 resultados
distintos das alturas dos estudantes de Engenharia Civil da PUC e
da UFRJ, tomou-se uma amostra de 20 alunos da PUC e 18 alunos
da UFRJ, e obteve os seguintes resultados amostrais:
X̅Puc = 1,78m SPuc= 0,5m
X̅UFRJ = 1,72m SUFRJ = 0,6m
Pede-se:
O Intervalo de confiança para a diferença das médias das duas
universidades (μPuc- μUFRJ) ao nível de significância de 10%. Pelo
resultado pode-se afirmar que a média das alturas dos alunos da
PUC é estatisticamente maior do que a média da UFRJ?
Resposta:
- IC [1-α] 90% = [-0,2327 ; 0,3527]
- Não, O Zero está contido no Intervalo de Confiança, portando as
médias das alturas podem ser estatisticamente iguais ao nível de
significância de 90%.
reinaldo@ele.puc-rio.br 88
Exercício 6 (para casa)
Você é contratado pra auditar a pesquisa sobre as
intenções de voto do segundo turno da eleição presidencial
de 2010..
A pesquisa da Datafolha divulgou uma semana antes da
eleição o seguinte resultado: a proporção dos eleitores que
votam na Dilma é de 52% com uma margem de erro de ±2
(pontos percentuais), isso significa que o intervalo de
confiança é IC=[50% , 54%]. Também foi divulgado que o
número de pessoas ouvidas foi de 1500 pessoas.
Deduza o grau de confiança (1-α) empregado nesta
pesquisa, utilizando o Teorema Central do Limite.
Resposta:
[1-α] = 0,8788 ou 87,88%
reinaldo@ele.puc-rio.br 89
Resumo Aula 9
reinaldo@ele.puc-rio.br 90
Z0
σZ
μ X
2015.1
reinaldo@ele.puc-rio.br ing.jdhernandez@gmail.com
street@ele.puc-rio.br jjampinho@gmail.com
1
Testes de Hipóteses
reinaldo@ele.puc-rio.br 2
Testes de Hipóteses
Objetivo geral
Inferir sobre os parâmetros desconhecidos de
uma população usando uma amostra (de
tamanho possivelmente reduzido).
reinaldo@ele.puc-rio.br 3
Testes de Hipóteses
Na prática ...
Procuraremos limitar a probabilidade de um
certo tipo de erro, mas não se pode descartá-
lo totalmente.
reinaldo@ele.puc-rio.br 4
Testes de Hipóteses
O Teste de Hipóteses é um procedimento em que
procuramos testar uma hipótese inicial contra
uma alternativa.
reinaldo@ele.puc-rio.br 5
Testes de Hipóteses
reinaldo@ele.puc-rio.br 6
Testes de Hipóteses
O que é um teste de hipóteses?
reinaldo@ele.puc-rio.br 7
Construção de um Teste de
Hipóteses
Teste
Rejeitar H0 se T(x), uma função apropriada
dos Xi’s da amostra, está numa região
especificada R.
reinaldo@ele.puc-rio.br 8
Erros do Tipo I e II
reinaldo@ele.puc-rio.br 9
Erros do Tipo I e II
reinaldo@ele.puc-rio.br 10
Erros do Tipo I e II
reinaldo@ele.puc-rio.br 11
Potência de um Teste
reinaldo@ele.puc-rio.br 12
Função Potência
reinaldo@ele.puc-rio.br 13
Função Característica de
Operação (OCC)
É definida como:
J(θ) = 1 – K(θ) = Pr{ aceitar H0 | o valor do
parâmetro é θ }
reinaldo@ele.puc-rio.br 14
Testes de Hipóteses - intuição
reinaldo@ele.puc-rio.br 15
Testes de Hipóteses - intuição
R = {X ≥ k }
reinaldo@ele.puc-rio.br 16
Testes de Hipóteses - intuição
X −2 k −2
= Pr{X ≥ k µ = 2} = Pr ≥ =
100 / 25 100 / 25
k −2
= 1 − Φ
2
Por exemplo:
α k z (da N(0,1)) k na tabela ao lado
1% 6.65 2.33
5% 5.29 1.64
é o valor a partir do
10% 4.56 1.28 qual rejeita-se a
hipótese nula
reinaldo@ele.puc-rio.br 17
Testes de Hipóteses - intuição
Vamos ver a função potência em cada um dos casos anteriores
Funções Potência para Diversos Valores de Alfa
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0
00
50
00
50
00
50
00
50
00
50
00
50
00
50
00
50
.0
.5
.0
.5
.0
.5
2.
2.
3.
3.
4.
4.
5.
5.
6.
6.
7.
7.
8.
8.
9.
9.
10
10
11
11
12
12
k(mu) - alfa = 1% k(mu) - alfa = 5% k(mu) - alfa = 10%
reinaldo@ele.puc-rio.br 18
Testes de Hipóteses - intuição
Conclusões
Se α é muito pequeno (erro do tipo I muito
pequeno, p.ex., 1%), a região de rejeição
“exige” um valor de k muito grande para
rejeitar a hipótese nula neste caso, e a função
potência “demora muito” a crescer.
Conclusões
reinaldo@ele.puc-rio.br 20
Testes de Hipóteses uni-caudais
reinaldo@ele.puc-rio.br 21
Testes de Hipóteses uni-caudais
reinaldo@ele.puc-rio.br 22
Testes de Hipóteses uni-caudais
Generalização
Suponha que desejamos testar as seguintes
hipóteses:
H 0 : µ ≤ µ0
H1 : µ > µ 0
O teste tem exatamente a forma descrita antes,
em que a região de rejeição é:
R = {X ≥ k }
reinaldo@ele.puc-rio.br 23
Testes de Hipóteses uni-caudais
Como escolher k?
Através do erro do tipo I (α), previamente
especificado, que leva às seguintes
“receitas de bolo”:
Rejeitar H0 se:
X − µ0 σ σ conhecido
> zα ⇔ X > µ 0 + zα
σ n n
σ desconhecido e usando a
X − µ0 s hipótese de uma amostra
> zα ⇔ X > µ 0 + zα grande, o que possibilita o
s n n
uso da Normal
reinaldo@ele.puc-rio.br 24
Testes de Hipóteses uni-caudais
reinaldo@ele.puc-rio.br 25
Testes de Hipóteses uni-caudais
reinaldo@ele.puc-rio.br 26
Testes de Hipóteses uni-caudais
“Receita de Bolo”
Rejeitar H0 se:
X − µ0 σ
< − zα ⇔ X < µ 0 − zα . σ conhecido
σ n n
X − µ0 s σ desconhecido
< − zα ⇔ X < µ 0 − zα .
s n n
reinaldo@ele.puc-rio.br 27
Testes de Hipóteses uni-caudais
Exemplo
Uma empresa produz café em pó em embalagens de
1 kg. O gerente de produção deseja saber se as
embalagens realmente possuem em média 1 kg do
produto e decidiu realizar um teste.
Ele retirou uma amostra de 50 embalagens e obteve
uma um peso médio de 0,985 kg de produto.
Informações anteriores a respeito da quantidade de
produto por embalagem indicaram um desvio-
padrão de 0,075 kg. O gerente deseja saber, com um
nível de significância de 1% se o conteúdo de cada
embalagem é de, no mínimo, 1 kg.
reinaldo@ele.puc-rio.br 28
Teste de Hipóteses uni-caudais
reinaldo@ele.puc-rio.br 30
Teste de Hipóteses uni-caudais
100%
95%
90%
85%
80%
75%
70%
65%
60%
55%
50%
45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
0
0
90
91
92
93
94
95
96
97
98
99
00
01
02
03
04
05
06
07
08
09
10
0.
0.
0.
0.
0.
0.
0.
0.
0.
0.
1.
1.
1.
1.
1.
1.
1.
1.
1.
1.
1.
reinaldo@ele.puc-rio.br 31
Valor de p (“p value”)
reinaldo@ele.puc-rio.br 32
Testes de Hipóteses uni-caudais
reinaldo@ele.puc-rio.br 33
Teste de hipótese bi-caudal
Agora vamos desenvolver um teste de hipótese
bi-caudal, para uma amostra grande (n ≥ 30) e σ
da população conhecido
H 0 : µ = µ0
H a : µ ≠ µ0
reinaldo@ele.puc-rio.br 34
Teste de hipótese bi-caudal
reinaldo@ele.puc-rio.br 35
Teste de hipótese bi-caudal
Agora, dado um nível de significância α, devemos
considerar dois valores de Z
Um, abaixo do qual há uma probabilidade α/2 da
média de uma amostra estar localizada (– zα/2)
Outro, acima do qual há uma probabilidade α/2
da média de uma amostra estar localizada (zα/2)
A regra de rejeição é:
X − µ0
Rejeitar H 0 se Z = < − zα / 2 ou Z > zα / 2
σ n
reinaldo@ele.puc-rio.br 36
Teste de hipótese bi-caudal
reinaldo@ele.puc-rio.br 37
Teste de hipótese bi-caudal
Mas, como aqui rejeita-se a hipótese nula
dos dois lados, o ponto usado da Normal
é zα/2 e não zα (que era usado nos testes
uni- caudais), de tal forma que Pr(Z > zα/2 )
= α/2.
“Receita de Bolo” – pontos percentuais da
distribuição N(0,1) para testes bi-caudais
Testes Bi-caudais
α z
1% 2.576
5% 1.960
10% 1.645
monica@ele.puc-rio.br 38
Teste de hipótese bi-caudal
Exemplo
Um fabricante de autopeças utiliza esferas de aço
na fabricação de rolamentos. Essas esferas
devem ter um diâmetro de 12 mm, caso contrário
os rolamentos não atingem as especificações
exigidas.
Uma amostra de 30 rolamentos escolhidos ao
acaso forneceu um diâmetro médio de 11,45 mm
e um desvio-padrão de 1 mm.
Pode-se dizer que o diâmetro médio dos
rolamentos utilizados é igual a 12 mm com um
nível de significância de 5%?
reinaldo@ele.puc-rio.br 39
Teste de hipótese bi-caudal
reinaldo@ele.puc-rio.br 40
Teste de hipótese bi-caudal
A região crítica neste exemplo é:
1 1
Rejeitar H 0 se X < 12 − 1.96 ou se X > 12 + 1.96
30 30
Isto é, rejeitar H 0 se : X < 11.64 ou X > 12.36
reinaldo@ele.puc-rio.br
12
Função Potência - Teste bi-caudal
.1
0
12
.2
0
12
Teste de hipótese bi-caudal
.3
0
12
.4
0
12
.5
0
12
.6
0
12
.7
0
12
.8
0
12
.9
0
13
.0
0
42
Teste de hipótese – amostra
pequena
Até o momento, consideramos o caso de uma
amostra grande (n ≥ 30)
reinaldo@ele.puc-rio.br 43
Teste de hipótese – amostra
pequena
Exemplo
Uma revista decidiu realizar uma pesquisa sobre a
qualidade de serviço em grandes aeroportos ao redor do
mundo.
O nível de serviço de um aeroporto é considerado superior
se a nota obtida é igual ou superior a 7. Para o aeroporto de
Heathrow, em Londres, foram entrevistadas 12 pessoas
que atribuíram as seguintes notas: 7, 8, 10, 8, 6, 9, 6, 7, 7, 8,
9, e 8.
Determine, com um nível de significância de 5%, se o
serviço do aeroporto de Heathrow pode ser considerado
superior. Suponha que a população é normalmente
distribuída.
reinaldo@ele.puc-rio.br 44
Teste de hipótese – amostra
pequena
Solução: As hipóteses nula e alternativa para o
teste são:
H0 : µ < 7
Ha : µ ≥ 7
Com uma população normal, n < 30 e σ desconhecido,
utilizaremos s e a distribuição t com 11 graus de liberdade para
o teste.
A média da amostra é 7,75 e s = 1,215
O valor de tα para o teste é 1,796
A regra de rejeição é:
x − µ0 7,75 − 7
Rejeita H 0 se t = > tα ⇒ t = = 2,14 > tα = 1,796
s n 1,215 12
Logo, existe evidência para rejeitar a hipótese nula!
reinaldo@ele.puc-rio.br 45
Teste de hipótese – amostra
pequena
Exemplo
Historicamente, a comissão média paga por
pessoas físicas para operações em bolsa de
valores através de internet numa corretora é
R$15.
Neste mês você fez uma pesquisa com 16
clientes da corretora e notou que a comissão
média foi de R$ 10 e o desvio padrão R$ 6. Com
nível de significância 10%, há evidência para
afirmar que a comissão neste mês foi mais baixa
que historicamente? E com nível de significância
5%? Suponha que os valores pagos são
Normalmente distribuídos.
reinaldo@ele.puc-rio.br 46
Teste de hipótese – amostra
pequena
Desejamos testar as hipóteses:
H 0 : µ = 15
H1 : µ < 15
A região crítica tem a forma: rejeitar H0 se a
média amostral é pequena, e como o tamanho da
amostra é pequeno devemos usar a distribuição t
de Student. s
Rejeitar H 0 se X ≤ µ 0 − t n −1,α .
n
Ou seja :
6
Rejeitar H 0 se X ≤ 15 - t n −1,α .
16
Rejeitar H 0 se X ≤ 15 − t15,α (1.5)
reinaldo@ele.puc-rio.br 47
Teste de hipótese – amostra
pequena
Do Excel:
Para o teste com nível 5% usamos t15,0.05 =
INVT(0.10,15) = 1.753
Para o teste com nível 1% usamos t15,0.01 =
INVT(0.02,15) = 2.602
Região crítica a 5%:
s
Rejeitar H 0 se X ≤ µ 0 − t n −1,α .
n
Ou seja :
6
Rejeitar H 0 se X ≤ 15 - t n −1,α .
16
Rejeitar H 0 se X ≤ 15 − t15,α (1.5)
reinaldo@ele.puc-rio.br 48
Teste de hipótese – exercício 1
(para casa)
Uma amostra de 50 botas usadas por soldados em
uma operação numa região de deserto apresentou
uma vida média de 1,24 anos e desvio padrão de 0,55
anos.
Por outro lado, em situações normais o tempo médio
de vida nominal destas botas é 1,40 anos.
Podemos afirmar, do nível de significância de 5% que
a utilização destas botas no deserto diminui o seu
tempo de vida?
Resposta:
Como[ Z = −2,057] < [ Z 0 = −1,645]
Rejeita H0 ao nível de significância de 5%.
reinaldo@ele.puc-rio.br 49
Teste de hipótese – exercício 2
(para casa)
Uma amostra de 9 medidas de participação de
manganês numa liga de ferro-manganês apresentou
média de 84% e desvio padrão de 1,2%.
Assumindo que a distribuição populacional da
participação do manganês na liga é NORMAL com
média 80.
Teste ao nível de 5% que esta participação de
manganês é superior a 80%.
Resposta:
Como[T = 10] > [t0 = 1,86]
Rejeita H0 ao nível de significância de 5%.
reinaldo@ele.puc-rio.br 50
Teste de hipótese – exercício 3
(para casa)
A performance nominal de uma ferramenta de
corte é de 2000 peças cortadas por vida útil.
Uma amostra de 6 destas ferramentas apresentou
performance em suas vidas úteis de 2010, 1980,
1920, 2005, 1975 e 1950 peças cortadas.
Teste, ao nível de significância de 1% se esta
performance nominal é inferior a 2000 peças
cortadas.
Resposta:
Como[T = −1,921] > [t0 = −3,365]
Aceita H0 ao nível de significância de 1%.
reinaldo@ele.puc-rio.br 51
Teste de hipótese – exercício 4
(para casa)
Uma amostra aleatória de 100 pneus produzida
por uma fábrica apresentou duração média de
32.000 km com desvio padrão de 2000 km. .
Teste se o tempo médio de vida dos pneus é de
30.000 km conforme afirma o fabricante, os níveis
de 1% e 10%.
Resposta:
Como[ Z = 10] > [ Z 0 = 2,578]
Rejeita H0 ao nível de significância de 1%.
Como[ Z = 10] > [ Z 0 = 1,645]
Rejeita H0 ao nível de significância de 10%.
reinaldo@ele.puc-rio.br 52
Revisão – Teste de média para
grandes amostras (n≥30)
Suposições: Xi ~ N (µ, σ2 )
Então, para X = (Xi,...,Xn) a.a. (n)
σ
2
x ~ N µ; ∴ σ é conhecido
2
n
2
x ~ N µ; s ∴ σ é desconhecido
2
n
Hipótese nula:
H 0 : µ = µ0
reinaldo@ele.puc-rio.br 53
Revisão – Teste de média para
grandes amostras (n≥30)
Estatística do teste:
x − µ0 x − µ0
Z= ~ N (0,1) ou Z = ~ N (0,1)
σ s
n n
Hipóteses alternativas:
H1 : µ ≠ µ 0 H1 : µ > µ 0 H1 : µ < µ 0
( Bicaudal ) (Unicaudal ) (Unicaudal )
Regiões criticas para os 3 casos; ao nível de
significância de (1-α). Verificamos o valor de Z nas
regiões criticas:
reinaldo@ele.puc-rio.br 54
Revisão – Teste de média para
grandes amostras (n≥30)
1-α 1-α
1-α
reinaldo@ele.puc-rio.br 55
Exemplo 1:
reinaldo@ele.puc-rio.br 56
Solução Exemplo 1:
Suposições:
v.a. comprimento dos parafusos: Xi ~ N (µ, σ2 )
H 0 : µ = 1,5020 H1 : µ ≠ 1,5020
Estatística do teste:
x − µ0
Z= ~ N (0,1)
s
n
reinaldo@ele.puc-rio.br 57
Solução Exemplo 1:
Substituindo:
1,5032 − 1,5020
Z= −4
= 2,4
5 x10
Regiões críticas:
α = 1% α = 5%
reinaldo@ele.puc-rio.br 59
Solução exemplo 2:
Suposições:
v.a. participação do elemento: Xi ~ N (µ, σ2 )
Dados:
x = 25,2% s = 1% n = 50
H 0 : µ = 25% H1 : µ > 25% (unilateral )
Estatística do teste:
x − µ0
Z= ~ N (0,1)
s
n
reinaldo@ele.puc-rio.br 60
Solução exemplo 2:
Estatística do teste:
25,2 − 25
Z= = 1,41
1
50
Decisão:
α = 5%
Como Z=1,41 < 1,645
Então, Aceita H0 ao
nível de 5%
1,645
reinaldo@ele.puc-rio.br 61
Teste de Hipóteses para:
Diferença entre duas
médias
reinaldo@ele.puc-rio.br 62
Teste de diferencia de
médias
Seja as v.a. X e y independentes
X ~ N (µx, σx2 ) e Y ~ N (µY, σY2 )
x − y ~ N µ − µ ; X + Y
X Y n n
X Y
reinaldo@ele.puc-rio.br 63
Teste de diferencia de
médias
Teste de Hipóteses:
H 1 : µ X ≠ µY
H 0 : µ X = µY Contra H 1 : µ X > µY
H 1 : µ X < µY
A estatística, caso as variâncias sejam
conhecidas, do teste seria:
( x − y ) − ( µ x − µY )
Z= ~ N (0,1)
σ +σ
2 2
x Y
nx nY
reinaldo@ele.puc-rio.br 64
Teste de diferencia de
médias
( x − y)
Z= ~ N (0,1)
σ +σ
2 2
x Y
nx nY
reinaldo@ele.puc-rio.br 65
Teste de diferencia de
médias
Caso as variâncias σ 2 e σ 2 não sejam
x Y
reinaldo@ele.puc-rio.br 67
Solução exemplo 3:
Suposições:
( )
x B ~ N µB ; sB
2
~ N (µ ; s )
2
xA A A
Dados:
n A = 100
nB = 200
Quer-se testar:
H 0 : µ A = µB
H1 : µ A ≠ µ B
reinaldo@ele.puc-rio.br 68
Solução exemplo 3:
Estatística do teste:
x� a − x� b − (µa – µb) 2,0413 − 2,0433 − 0
t= =
na + nb 100 + 200
Sc ∙ Sc ∙
na ∙ nb 100 ∙ 200
Sc = 0,0060059
reinaldo@ele.puc-rio.br 69
Solução exemplo 3:
Estatística do teste:
2,0413 − 2,0433 − 0
t=
100 + 200
0,0060059 ∙
100 ∙ 200
𝐭 = −𝟐, 𝟕𝟕
reinaldo@ele.puc-rio.br 70
Solução exemplo 3:
Estatística do teste:
𝐭 = −𝟐, 𝟕𝟕
Então, H0 é rejeitada!!
para o nível de 1%
reinaldo@ele.puc-rio.br 71
Teste de Hipóteses para:
Variância de uma
população normal
reinaldo@ele.puc-rio.br 72
Teste de Hipótese para a Variância de
uma População Normal
Suposição:
Seja X ~ N (µ, σ2 )
Queremos testar a seguinte hipótese nula simples:
H0 :σ = σ
2 2
0
χ *
=
(n − 1).S 2
σ 02
Onde S² é a variância amostral estimada por:
∑ (X )
n
∑X
n
2
i −X i
S2 = i =1 X= i =1
(n − 1) n
Regra de Decisão:
(χ *
)
H 0 verd ~ χ 2 (n − 1)
reinaldo@ele.puc-rio.br 74
Exemplo:
H 0 :σ = σ 0 H1 : σ ≠ σ 0
2 2 2 2
Contra
Decisão ao nível de α %:
(α 2 ) %
(α 2 ) %
Região de Aceitação H0
Região de Rejeição H0
reinaldo@ele.puc-rio.br 75
H 0 : σ 2 = σ 02 contra H1 : σ > σ 0
2 2
Decisão ao nível de α %:
(α ) %
(α ) %
reinaldo@ele.puc-rio.br 76
Teste de Hipóteses para:
Variância de duas populações
Normais (Teste F)
reinaldo@ele.puc-rio.br 77
Teste de variância de duas
populações Normais (Teste F)
Teste para verificar se as variâncias de duas
populações normais são iguais. Deve ser
usado antes de testar se as médias são
iguais.
Suposições:
X ~ N (µx, σx2 ) e Y ~ N (µY, σY2 )
reinaldo@ele.puc-rio.br 78
Teste de variância de duas
populações Normais(Teste F)
Teste de Hipóteses:
H 0 :σ X = σ Y H1 : σ X ≠ σ Y (> ou <)
2 2 2 2
Contra
f = s X
2
s X
Decisão
( f / H 0 Verd ) ~ F (υ X ;υY ) ∴ υ X = n X − 1 ; υY = nY − 1
reinaldo@ele.puc-rio.br 79
Exemplo 4:
Tem-se duas amostras A e B com valores
e tamanho n =n =10 A B
A 50,8 51,0 49,5 52,1 51,8 47,4 51,5 48,2 49,0 48,0
B 49,3 48,9 49,2 50,0 48,8 49,5 49,2 49,6 48,8 47,5
H 0 :σ A = σ B H1 : σ A ≠ σ B
2 2 2 2
Contra
reinaldo@ele.puc-rio.br 80
Solução exemplo 4:
Suposições:
( )
A ~ N µ A ;σ A
2
B ~ N (µ ;σ )
2
B B
Estatística do teste:
2
f = s X
=
2,97
= 6,59
2
s 0,451
X
reinaldo@ele.puc-rio.br 81
Solução exemplo 4:
Decisão:
( f / H 0 Verdadera) ~ F (υ X = 9 ; υY = 9)
Observação: Fα (υ X ,υY ) ≡ 1
F1−α (υ X ,υY )
reinaldo@ele.puc-rio.br 82
Tabela F (α=2,5%) :
Graus de Graus de
liberdade do liberdade do
denominador numerador
reinaldo@ele.puc-rio.br 83
Teste de hipótese – exercício 5(para casa)
Quer-se testar dois métodos de aprendizados de estatística
entre estudantes de pós-graduação. Para tal, foram
selecionados aleatoriamente dois grupos de 50 alunos e
ambos foram submetidos ao teste de avaliação.
O grupo “A” apresentou nota média de 120 pontos e um
desvio padrão de 12 pontos, enquanto o grupo “B”
apresentou média de 112 pontos de 9 pontos.
Se MU(A) é a média verdadeira do desempenho do grupo
“A” e MU(B) do grupo “B”, teste aos níveis de 1% e 5% que
MU(A)-MU(B) contra a alternativa MU(A)≠MU(B).
Resposta:
Como[ Z = 3,73] > [ Z 0 = 2,578]
Rejeita H0 ao nível de significância de 1%.
Como[ Z = 3,73] > [ Z 0 = 1,96]
Rejeita H0 ao nível de significância de 5%.
reinaldo@ele.puc-rio.br 84
Teste de hipótese – exercício 6(para casa)
Uma indústria desenvolveu e implantou um novo programa
de prevenção de acidentes. Para tal foram coletados de oito
filiais desta indústria o número de horas perdidas na
empresa devido a acidente de trabalho durante 1 ano,
conforme tabela abaixo:
Filial 1 2 3 4 5 6 7 8
Antes do
38,5 69,2 15,3 9,7 120,9 47,6 78,8 52,1
programa
Depois do
28,7 62,2 28,9 0 93,5 49,6 86,5 40,2
programa
Resposta:
Como[T = 0,295] < [t0 = 2,624]
Aceita H0 ao nível de significância de 1%.
Como[T = 0,295] < [t0 = 1,761]
Aceita H0 ao nível de significância de 5%.
reinaldo@ele.puc-rio.br 85
Teste de hipótese – exercício 7(para casa)
Tem-se dois aparelhos para medir a pressão arterial de
pacientes. Para testá-los, mediu-se com dois aparelhos as
pressões de 10 pacientes, obtendo-se:
Paciente 1 2 3 4 5 6 7 8 9 10
Pressão
13,6 11,5 14,2 14,0 12,3 14,7 13,3 15,0 13,8 14,8
"A"
Pressão
14,1 11,7 14,1 14,5 12,7 14,6 13,5 15,2 13,5 15,1
"B"
Resposta:
Como[T = −0,346] > [t0 = −2,878]
Aceita H0 ao nível de significância de 1%.
Como[T = −0,346] > [t0 = −2,101]
Aceita H0 ao nível de significância de 5%.
reinaldo@ele.puc-rio.br 86
Teste de hipótese – exercício 8(para casa)
O peso de sacos de trigo comercializado por uma
fábrica é especificado como uma v.a. Normal com
Variância Nominal de 1,5 Kg². Pegou-se uma amostra
de 10 sacos e a Variância Estimada nesta amostra foi
de 3 Kg².
Podemos dizer aos níveis de 1% e 5% que a Variância
Nominal aumentou? Ou seja, testar a hipótese:
Resposta:
Como[ χ 2 = 18] < [ χ 02,99 (9) = 21,7]
Aceita H0 ao nível de significância de 1%.
Como[ χ 2 = 18] > [ χ 02,95 (9) = 16,92]
Rejeita H0 ao nível de significância de 5%.
reinaldo@ele.puc-rio.br 87
TABELA DISTRIBUIÇÃO F
reinaldo@ele.puc-rio.br 88
TABELA DISTRIBUIÇÃO F
reinaldo@ele.puc-rio.br 89
TABELA DISTRIBUIÇÃO F
reinaldo@ele.puc-rio.br 90
Z0
σZ
μ X
SUMÁRIO
1. INTRODUÇÃO .................................................................................................................................................................. 3
1.1. GENERALIDADES ........................................................................................................................................................... 3
1.2. METODOLOGIA DO TESTE DE HIPÓTESES ........................................................................................................................ 3
1.3. AS HIPÓTESES................................................................................................................................................................ 3
1.4. A ESCOLHA DO TESTE ESTATÍSTICO ............................................................................................................................... 4
1.5. CONCEITOS ADICIONAIS DO TESTE DE HIPÓTESES .......................................................................................................... 4
1.6. A DISTRIBUIÇÃO AMOSTRAL.......................................................................................................................................... 7
1.7. TESTES ESTATÍSTICOS PARAMÉTRICOS .......................................................................................................................... 7
1.8. ETAPAS DO TESTE DE HIPÓTESES ................................................................................................................................... 7
2. TIPOS DE TESTES PARAMÉTRICOS.......................................................................................................................... 9
2.1. TESTES PARA UMA AMOSTRA ........................................................................................................................................ 9
2.1.1. Teste para a média de uma população................................................................................................................. 9
2.1.2. Teste para a proporção ...................................................................................................................................... 11
2.1.3. Teste para a variância........................................................................................................................................ 12
2.2. TESTES PARA DUAS AMOSTRAS INDEPENDENTES ......................................................................................................... 13
2.2.1. Teste para a igualdade entre as variâncias de duas populações ....................................................................... 13
2.2.2. Teste para a diferença entre duas médias populacionais................................................................................... 15
2.3. DUAS AMOSTRAS RELACIONADAS (DEPENDENTES) ..................................................................................................... 19
2.3.1. Teste para a diferença entre duas proporções ................................................................................................... 20
3. EXERCÍCIOS .................................................................................................................................................................. 22
4. RESPOSTAS .................................................................................................................................................................... 27
5. REFERÊNCIAS ............................................................................................................................................................... 29
1. INTRODUÇÃO
1.1. GENERALIDADES
Um dos principais assuntos da Estatística moderna é a inferência estatística. A inferência
estatística é dividida em dois grandes tópicos: a estimação de parâmetros e os testes de hipóteses.
No desenvolvimento dos métodos da estatística moderna, as primeiras técnicas de inferência
que apareceram foram as que faziam diversas hipóteses sobre a natureza da população da qual se
extraíram os dados. Como os valores relacionados com a população são denominados “parâmetros”,
tais técnicas estatísticas foram denominadas de paramétricas.
1.3. AS HIPÓTESES
Uma hipótese estatística é uma suposição ou afirmação que pode ou não ser verdadeira,
relativa a uma ou mais populações. A veracidade ou falsidade de uma hipótese estatística nunca é
conhecida com certeza, a menos que, se examine toda a população, o que é impraticável na maior parte
das situações.
Desta forma, toma-se uma amostra aleatória da população de interesse e com base nesta
amostra é estabelecido se a hipótese é provavelmente verdadeira ou provavelmente falsa. A decisão de
que a hipótese é provavelmente verdadeira ou falsa é tomada com base em distribuições de
probabilidade denominadas de “distribuições amostrais”. Em estatística trabalha-se com dois tipos de
hipótese.
A decisão será baseada nas distribuições amostrais das duas moedas. A tabela 01 mostra as
probabilidades de se obter os valores: 0, 1, 2, 3, 4 e 5, da variável X = número de caras, em 5
lançamentos de cada uma das moedas.
Tabela 01 - Probabilidades de se obter cara em 5 lançamentos de uma moeda
x P(X = x) sob H0 P(X = x) sob H1
0 1/32 → 3,125% 1/3125 → 0,032%
1 5/32 → 15,625% 20/3125 → 0,640%
2 10/32 → 31,250% 160/3125 → 5,120%
3 10/32 → 31,250% 640/3125 → 20,480%
4 5/32 → 15,625% 1280/3125 → 40,960%
5 1/32 → 3,125% 1024/3125 → 32,768%
Total 1 → 100% 1 → 100%
Para poder aceitar ou rejeitar H0 e como conseqüência, rejeitar ou aceitar H1, é necessário
estabelecer uma regra de decisão, isto é, é necessário estabelecer para que valores da variável X vai-se
rejeitar H0, ou seja, afirmar H1, e para que valores da variável X, vai-se aceitar H0, ou seja, nesta
situação particular, afirmar H0.
Desta forma, estabelecendo-se que se vai rejeitar H0, se a moeda lançada der um número de
caras igual a 3, 4 ou 5, pode-se então determinar as probabilidades de tomar as decisões corretas ou as
probabilidades dos erros envolvidos. Assim o conjunto de valores que levará a rejeição da hipótese
nula será denominado de região crítica (RC) e, neste caso, este conjunto é igual a: RC = { 3, 4, 5 }
A faixa restante de valores da variável é denominada de região de aceitação (RA) e, neste
caso, este conjunto vale: RA = { 0, 1, 2 }
Evidentemente esta regra como qualquer outra permitirá decidir sob a H0, mas estará sujeita a
erro. Está se tomando a decisão de aceitar ou rejeitar H0 com base no número X de caras obtidas em 5
lançamentos, que é apenas uma amostra, muito pequena, do número infinito de lançamentos possíveis.
Com base em resultados amostrais, não é possível tomar decisões definitivamente corretas.
Entretanto, pode-se calcular a probabilidade da decisão estar errada. Neste caso foi decidido rejeitar H0
se X = “número de caras” assumir um dos valores do conjunto RC. No entanto, tais valores podem
ocorrer sob H0, isto é, tais valores podem ocorrer quando se lança a moeda M1, conforme tabela. Então
se H0 for rejeitada porque X assumiu o valor 3, 4 ou 5, pode-se estar cometendo um erro. A
probabilidade deste erro é igual a probabilidade de ocorrência destes valores sob H0, isto é, quando a
moeda M1 é lançada, que é conforme tabela igual a:
10/32 + 5/32 + 1/32 = 16/32 = 50%
Lembrando que rejeitar H0 é apenas uma das duas situações possíveis num teste de hipóteses,
tem-se que se X assumir um valor do conjunto RA se aceitará Ho. Mas tais valores podem ocorrer sob
H1, isto é, quando a moeda M2 é lançada. Então se Ho for aceita porque X assumiu um dos valores: 1, 2
ou 3, pode-se estar cometendo um outro tipo de erro, cuja probabilidade é igual a da ocorrência destes
valores sob H1 que é de: 1/3125 + 20/3125 + 160/3125 = 181/3125 = 5,79%
A probabilidade de que a variável (número de caras) assuma um valor do conjunto RC é
denominada de nível de significância do teste. O nível de significância do teste é, na realidade, a
probabilidade de se rejeitar a hipótese nula, quando ela é verdadeira, sendo então a probabilidade de se
cometer um erro. Como este é apenas um dos dois tipos de erro possível de ser cometido num teste de
hipóteses, ele é denominado de erro do tipo I. O outro tipo de erro possível de ser cometido é aceitar
H0 quando ela é falsa e é denominado de erro do tipo II. Em resumo pode-se ter as seguintes situações
em um teste de hipóteses:
Tabela 02 - Possibilidades envolvidas em um teste de hipóteses
Pode-se ver então que o erro do tipo I diminui sensivelmente, mas em compensação tivemos
um aumento substancial do erro do tipo II. Isto sempre vai ocorrer. A única forma de reduzir os dois
tipos de erro simultaneamente é pelo aumento do tamanho da amostra. Neste caso, está se
considerando uma amostra de apenas 5 lançamentos dos infinitos possíveis. É natural que os erros
associados sejam grandes, pois a amostra é muito pequena. Aumentado-se o tamanho da amostra é
possível com a mesma região crítica diminuir sensivelmente os dois tipos de erro.
µ = 455
População Não rejeitar a hipótese
Valor hipotético
do parâmetro. Qual é a magnitude da
Diferença pequena
diferença entre o valor
Selecionada observado da estatística e o
Aleatoriamente valor hipotético da Diferença grande
parâmetro?
Amostra
Valor observado Rejeitar a hipótese
da estatística. x = 435
1. Formular as hipóteses.
Estabelecer as hipóteses nula e alternativa. A construção de um teste de hipóteses pode ser
colocado de forma geral do seguinte modo. Toma-se uma amostra da variável (ou das variáveis) X (no
caso) de uma dada população, de onde se tem uma hipótese sobre um determinado parâmetro, por
exemplo: θ. Esta hipótese é a hipótese nula ou hipótese de igualdade: H0: θ = θ0
Tendo formulado a hipótese nula é conveniente determinar qual será a hipótese aceita caso a
hipótese nula seja rejeitada, isto é, convém explicitar a hipótese alternativa. A hipótese alternativa vai
depender de cada situação mas de forma geral tem-se:
H1: θ = θ2 (hipótese simples), ou então o que é mais comum, hipóteses compostas:
H1: θ > θ0 (teste unilateral ou unicaudal à direita)
θ < θ0 (teste unilateral ou unicaudal à esquerda)
θ ≠ θ0 (teste bilateral ou bicaudal)as hipóteses são do tipo composto.
2. Estabelecer a estatística (estimador ) a ser utilizado.
Após fixar as hipóteses é necessário determinar se a diferença entre a estatística amostral e o
suposto valor do parâmetro da população é suficiente para rejeitar a hipótese. A estatística utilizada
deve ser definida e sua distribuição teórica determinada.
3. Fixar o nível de significância do teste.
Fixar a probabilidade de ser cometer erro do tipo I, isto é, estabelecer o nível de significância
do teste. Fixado o erro do tipo I, é possível determinar o valor crítico, que é um valor lido na
distribuição amostral da estatística considerada (tabela). Este valor vai separar a região de crítica (de
rejeição) da região de aceitação.
4. Calcular a estatística teste (a estimativa).
Através da amostra obtida calcular a estimativa que servirá para aceitar ou rejeitar a hipótese
nula. Dependendo do tipo de hipótese alternativa este valor servirá para aceitar ou rejeitar H0. O
procedimento é:
Teste estatístico = (Estatística - Parâmetro) / Erro padrão da Estatística
5. Tomar a decisão.
Se o valor da estatística estiver na região crítica rejeitar Ho, caso contrário, aceitar H0.
5. Formular a conclusão.
Com base na aceitação ou rejeição da hipótese nula, enunciar qual a decisão a ser tomada na
situação do problema.
(a) σ conhecido
O teste para a média de uma população pode ser executado com qualquer tamanho de amostra
se soubermos que a população de onde for extraída a amostra segue uma distribuição normal. Se a
distribuição da população não for conhecida então é necessário trabalhar com amostras grandes (pelo
menos 30 elementos) para poder garantir a normalidade da média da amostra através do teorema
central do limite.
As hipóteses são:
H0: µ = µ0 contra
H1: µ = µ1 ou então, o que é mais comum:
H1: µ > µ0
µ < µ0
µ ≠ µ0
A estatística teste utilizada aqui é a média da amostra: X . Esta média para ser comparada com
o valor tabelado, determinado em função da probabilidade do erro do tipo I, (isto é, o nível de
significância do teste), precisa ser primeiramente padronizada. Isto é feito, baseado no seguinte
resultado:
Se X é uma variável aleatória normal com média µ e desvio padrão σ, então a variável:
Z = (X - µ) / σ
Tem uma distribuição normal com média “0” e desvio padrão “1”. A variável resultante Z se
encontra tabelada. Qualquer livro de Estatística traz esta tabela que fornece os valores desta variável,
para z variando de -3,9 até 3,9 em intervalos de 0,1 (aproximação decimal), entre -3,9 e -3,0 e entre 3,0
e 3,9, e em intervalos de 0,01 (aproximação centesimal) para os valores entre -3,0 e 3,0.
Para X sabe-se que µ X = µ (média das médias) que σX = σ n (erro padrão da média), então
o valor padronizado de X será:
Z = ( X - µ X ) / σX = ( X - µ) / σ n
Supondo-se fixado um nível de significância de α = P(Erro do Tipo I), verifica-se na tabela
qual o valor de zα (no teste unilateral) ou zα/2 (teste bilateral). Rejeita-se H0 (hipótese nula) se o valor
de z calculado na expressão acima for:
(i) Maior do que zα (no teste unilateral à direita);
(ii) Menor do -zα (no teste unilateral à esquerda) e
(iii) Maior que zα/2 ou menor que -zα/2 (no teste bilateral).
Exemplo
A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo
perdido em acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 hora
/homens por ano com desvio padrão de 20 horas/homem. Tentou-se um programa de prevenção de
acidentes e, após o mesmo, tomou-se uma amostra de 9 indústrias e mediu-se o número de
horas/homem perdidas por acidente, que foi de 50 horas. Você diria, ao nível de 5%, que há evidência
de melhoria?
Solução
As hipóteses a serem testadas são:
H0: µ = 60 hora/homens
H1: µ < 60 hora/homens
A evidência amostral para sugerir que a média baixou é dada através da amostra de n = 9
(elementos) que forneceu x = 50 horas/homens. Vamos testar se esta diferença de 10 horas/homens é
ou não significativa ao nível de 5%. Para isto é necessário padronizar o resultado amostral.
Z = ( X - µ X ) / σX = ( X - µ) / σ/ n = (50 - 60) / 20/ 9 = -1,50
Para saber se este valor (-1,50) é pouco provável é necessário compará-lo com o valor crítico -
zα (pois se trata de um teste unilateral à esquerda), que neste caso vale -1,64, já que o nível de
significância foi fixado em 5%. Vê-se portanto que o valor amostral não é inferior ao valor crítico, não
estando portanto na região de rejeição. Isto quer dizer que a diferença apresentada na amostra não é
suficientemente grande para provar que a campanha de prevenção deu resultado. Então a conclusão é:
“Não é possível ao nível de 5% de significância afirmar que a campanha deu resultado, isto é,
rejeitar H0. ”
Convém lembrar que o fato de não rejeitar a hipótese nula, não autoriza a fazer afirmações a
respeito da veracidade dela. Ou seja, não se provou H0, pois no momento que se aceita a hipótese nula,
o risco envolvido é o do Tipo II, e este neste caso não está fixado (controlado). O teste de hipóteses é
feito para rejeitar a hipótese nula e sua força está na rejeição. Assim quando se rejeita se prova algo,
mas quando se aceita, nada se pode afirmar.
(b) σ desconhecido
A distribuição t de Student
Quando o desvio padrão populacional (σ) é desconhecido é necessário estimá-lo através do
desvio padrão da amostra (s). Mas ao substituir o desvio padrão da população na expressão:
Z = ( X - µ X ) / σX = ( X - µ) / σ/ n
não teremos mais uma distribuição normal.
De fato, conforme demonstrado por W. S. Gosset (Student) a distribuição da variável:
(X - µX ) / σ
X = ( X - µ) / s/ n
Não é mais normal padrão. Ao substituir σ por s na expressão teremos uma distribuição
parecida com a normal, isto é, simétrica em torno de zero, porém com uma variabilidade maior. Desta
forma a distribuição “t” é mais baixa no centro do que a normal padrão, mas mais alta nas caudas.
Assim:
(X - µX ) / σ
X = ( X - µ) / s/ n = tn-1, onde “n - 1” indica a distribuição “t” considerada, pois
cada tamanho de amostra produz uma distribuição de Student diferente.
A distribuição t de Student encontra-se tabelada em função de n = tamanho da amostra ou
então em função de n - 1 denominado de graus de liberdade da distribuição. Neste caso cada linha de
uma tabela se refere a uma distribuição particular e cada coluna da tabela a um determinado nível de
significância. Conforme a tabela o nível de significância poderá ser unilateral ou bilateral. Em todo
caso é necessário sempre ler no cabeçalho ou no rodapé da tabela as explicações sobre como ela está
estruturada.
Desta forma a diferença entre o teste para a média de uma população com σ conhecido e um
com σ desconhecido é que é necessário trocar a distribuição normal padrão pela distribuição “t “ de
Student.
Exemplo
O tempo médio, por operário, para executar uma tarefa, tem sido 100 minutos. Introduziu-se
uma modificação para diminuir este tempo, e, após certo período, sorteou-se uma amostra de 16
operários, medindo-se o tempo de execução gasto por cada um. O tempo médio da amostra foi 85
minutos com desvio padrão de 12 minutos. Este resultado evidencia uma melhora no tempo gasto para
realizar a tarefa? Apresente as conclusões aos níveis de 5% e 1% de significância e diga quais as
suposições teóricas necessárias que devem ser feitas para resolver o problema.
Solução
A suposição teórica necessária é admitir que a distribuição da população de onde foi extraída
a amostra segue uma normal pois n < 30.
H0: µ = 100
H1: µ < 100
Considerando, então, um teste unilateral à esquerda e tendo α = 5% (α = 1%) tem-se que a
região de rejeição é constituída por RC = [-∞, -1,753].(RC = [-∞, -2,602])
O valor de teste é:
X−µ 85 − 100
t15 = = = -5
s 12
n 4
Como este valor pertence as duas regiões críticas, pode-se rejeitar a hipótese nula, aos níveis
de 5% e 1% de significância, isto é, neste caso, pode-se afirmar que a modificação diminuiu o tempo
de execução da tarefa.
2.1.2. T ESTE PARA A PROPORÇÃO
O teste para a proporção populacional é normalmente baseado na seguinte suposição: tem-se
uma população e tem-se uma hipótese sobre a proporção π de elementos da população que possuem
uma determinada característica. Esta proporção é supostamente igual a um determinado valor π0.
Assim a hipótese nula é:
H0 : π = π0
O problema fornece informações sobre a alternativa, que pode ser uma das seguintes:
H1 : π ≠ π0
H1 : π > π0
H1 : π < π0
A estatística teste a ser utilizada é a proporção amostral “P”, que para amostras grandes (n >
50) tem uma distribuição aproximadamente normal com média:
µP = π, e desvio padrão
π(1 − π )
σP = n
Exemplo
As condições de mortalidade de uma região são tais que a proporção de nascidos que
sobrevivem até 60 anos é de 0,60. Testar esta hipótese ao nível de 5% de significância se em 1000
nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até os 60 anos.
Solução
H1: π = 0,60
H0: π ≠ 0,60
Considerando, então, um teste bilateral e tendo α = 5% tem-se que a região de aceitação é
constituída pelo intervalo RA = [-1,96, 196].
O valor de teste é:
p−π 0,53 − 0,60
z= = = -4,52.
π(1 − π) 060(1 − 0,60)
n 1000
Como este valor não pertence a região de aceitação, pode-se rejeitar a hipótese nula, ao nível
de 5% de significância, isto é, neste caso, pode-se afirmar que a taxa dos que sobrevivem até os 60
anos é menor do que 60%. Neste caso, também poderia ser realizado um teste unilateral à esquerda.
Este teste também rejeitaria a hipótese nula, pois para ele o valor crítico zα = -1645.
2.1.3. T ESTE PARA A VARIÂNCIA
Para aplicar o teste para a variância é necessário supor a normalidade da população de onde
será extraída a amostra.
As hipóteses são:
H0: σ2 = σ20 contra
H1: σ2 ≠ σ20
σ2 > σ20
σ2 < σ20
(n − 1) s2 2
A estatística teste é ∼ χn−1
σ20
Quer dizer o quociente acima tem uma distribuição qui-quadrado com “n-1” graus de
liberdade. A qui-quadrado é uma distribuição assimétrica positiva que varia de zero a mais infinito.
Esta distribuição é tabelada também em função dos número de graus de liberdade, isto é, cada grau de
liberdade (n -1) representa uma distribuição diferente. As colunas das tabelas representam diferentes
níveis de significância, isto é, área sob a curva acima do valor tabelado.
com esta amostra não é possível afirmar que a máquina está desregulada, ao nível de 5% de
significância.
Supõem-se a existência de duas populações. Uma população X com média µX e desvio padrão
σX e uma população Y com média µY e desvio padrão σY . Da população X é extraída uma amostra de
tamanho “n” com média X e da população Y é extraída uma amostra de tamanho “m” com média Y .
Define-se a variável D como sendo a diferença entre as duas médias amostrais. Assim D = X - Y e
tem-se:
µD = E(D ) = E( X - Y ) = E( X ) - E( Y ) = µX - µY
2 2
σX σY
σD = V(D ) = V( X - Y ) = V( X ) + V( Y ) = n + m .
(n − 1) S2X (m − 1) S2Y
: χn −1 e : χm−1
2 2
Nestas condições sabe-se que:
σ σ
2 2
X Y
Solução:
Como n = m = 6, tem-se que:
S2X
Q= = F(5, 5) = 5,05
S2Y
A região crítica RC será: RC = (0; 1/5,05) U (5,05; ∝) = (0; 0,20) U (5,05; ∝)
As amostras fornecem:
2
S2X = 40 e SY = 37, portanto a distribuição do quociente Q calculado será:
S2X
Qc = = 40 / 37 = 1,08.
S2Y
Por estes resultados não é possível rejeitar a hipótese de igualdade entre as variâncias a um
nível de significância de 10%. (Como o teste é bilateral, ele envolve uma área de 5% em cada cauda da
distribuição, logo a significância total é de 10%).
2.2.2. T ESTE PARA A DIFERENÇA ENTRE DUAS MÉDIAS POPULACIONAIS
Portanto, rejeita-se a hipótese de igualdade entre as durações médias dos dois tipos de pneus.
Com base nestas amostras, pode-se afirmar, ao nível de 4% de significância, que os dois tipos de pneus
diferem quanto a durabilidade média.
(b) Variâncias σ2X e σ2Y desconhecidas mas supostamente iguais
Vamos supor que as duas populações tenham a mesma variância σ2 = σ2X = σ2Y , porém
desconhecidas.
As hipóteses são:
H0: µX - µY = ∆ contra
H1: µX - µY ≠ ∆ ou
µX - µY > ∆ ou ainda
µX - µY < ∆
A variável teste anterior, para esta situação, será:
Z= X−Y−∆ , mas neste caso σ2X = σ2Y = σ2 (por suposição), então:
2 2
σX + σY
n m
substituído por um estimador não-tendencioso. Como S2X e S2Y são estimadores não tendenciosos do
mesmo parâmetro σ2, então, a média ponderada:
(n −1)S2X + (m−1)S2Y
S= , também será um estimador não-tendencioso de σ2.
2
n + m− 2
Logo a expressão acima poderá ser escrita como:
X−Y−∆ , que terá uma distribuição não mais normal mas sim “t” com “n + m – 2” graus de
1 1
S +
n m
liberdade, desde que n, m sejam maiores ou iguais a 30, ou então que as amostras tenham sido
extraídas de populações que tenham distribuições normais.
Desta forma, a expressão para testar a diferença entre duas médias populacionais, nesta
situação será:
tc = tn+m-2 = X−Y−∆
1 1
S +
n m
Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:
|tc| > tα/2 no teste bilateral;
tc > tα, no teste unilateral à direita e
tc < tα no teste unilateral à esquerda.
Exemplo:
As resistências de dois tipos de concreto foram medidas, mostrando os resultados da tabela.
Fixado um nível de significância de 5%, existe evidência de que o concreto do tipo A seja mais
resistente do que o concreto do tipo B.
Tipo A 54 55 58 51 57
Tipo B 50 54 56 52 53
Solução:
Antes de mais nada vamos testar se as duas populações possuem a mesma variância. Para
tanto aplica-se o teste de igualdade de variâncias, utilizando as amostras acima e uma significância de
5%.
Tem-se: Graus de liberdade: 4 (numerador), 4 (denominador)
F = 7,5/5,0 = 1,50.
F2,5% = 0,10
F97,5% = 9,60
Significância do resultado obtido: 35,20%.
Neste caso, não é possível afirmar que as variâncias populacionais são diferentes.
As hipóteses são:
H0: µA - µB = 0 ( µA = µB ) contra
H1: µA - µB > 0 ( µA > µB )
Os dados obtidos da tabela são:
X = 55,0 e Y = 53,0
2 (n − 1)S2X + (m − 1)S2Y (5 − 1).7,5 + (5 − 1).5,0
S2X = 7,50 e S2Y = 5,0, então S = = = 6,25.
n + m− 2 5+5−2
O valor da variável teste será:
55 − 53
tc = = 1,265
1 1
2,50. +
5 5
Como α = 5%, e o grau de liberdade n - m - 2 = 10 - 2 = 8, então o valor de “t” tabelado será:
1,86.
Neste caso, com estas amostras não é possível afirmar que o concreto do tipo A seja mais
resistente do que o concreto do tipo B.
(c) Variâncias σ2X e σ2Y desconhecidas e supostamente desiguais
As hipóteses são:
H0: µX - µY = ∆ contra
H1: µX - µY ≠ ∆ ou
µX - µY > ∆ ou ainda
µX - µY < ∆
Como as variâncias são desconhecidas é necessária estimá-las através das variâncias amostrais
2 2
SX SY Neste caso, ao se substituir as variâncias populacionais pelas amostrais na expressão:
e .
X−Y−∆
não se terá mais uma distribuição normal, mas sim uma distribuição “t” com o
2 2
σX +
σY
n m
grau de liberdade fornecido pela seguinte expressão:
2
æ S 2 S2 ö
ç X+ Y÷
ç n m÷
ν=
è ø
2 2
æ S2 ö æ S 2 ö
ç X÷ ç Y÷
ç n ÷ çm÷
è ø +è ø
n −1 m −1
desde que n, m sejam maiores ou iguais a 30, ou então que as amostras tenham sido extraídas de
populações que tenham distribuições normais.
Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:
|tc| > tα/2 no teste bilateral;
tc > tα, no teste unilateral à direita e
X−Y−∆
t < tα no teste unilateral à esquerda, onde t =
2 2
S X + SY
n m
Exemplo:
As resistências de dois tipos de concreto foram medidas, mostrando os resultados da tabela.
Fixado um nível de significância de 5%, existe evidências de que o concreto do tipo A seja mais
resistente do que o concreto do tipo B.
Tipo A 54 55 58 50 61
Tipo B 51 54 55 52 53
Solução:
Antes de mais nada vamos testar se as duas populações possuem a mesma variância. Para
tanto aplica-se o teste de igualdade de variâncias, utilizando as amostras acima e uma significância de
10%.
Tem-se: Graus de liberdade: 4 (numerador), 4 (denominador).
F = 17,3/2,5 = 6,92.
Significância do resultado obtido: 4,38%.
F crítico: 6,39.
Neste caso, é possível afirmar que as variâncias populacionais são diferentes.
As hipóteses são:
H0: µA - µB = 0 ( µA = µB ) contra
H1: µA - µB > 0 ( µA > µB )
Os dados obtidos da tabela são:
X = 55,6 e Y = 53,0
S2X = 17,3 e S2Y = 2,5
O valor da variável teste será:
55,6 − 53,0
t= = 1,31
17,3 2,5
+
5 5
2 2
æ S2X S2Y ö æ 17,3 2,5 ö 6,25
ç ÷ ç + ÷
Com α = 5%, e o grau de liberdade ν = ç n +m÷ = è 5 5 ø = = 5,48 ≅ 5,
è ø 0,8125
2 2
2
æ S2X ö æ S2Y ö
2
æ 17,3 ö æ 2,5 ö
ç ÷ ç ÷ ç ÷ ç ÷
ç n ÷ çm÷ è 5 ø +è 5 ø
è ø +è ø
n −1 m −1
4 4
S =
2
D
1 n
å Di − D
n − 1 i =1
( )2
= i =1
n −1
, tem-se que a estatística:
D − µD
t= , tem uma distribuição “t” com “n - 1” graus de liberdade.
SD
n
Exemplo:
Cinco operadores de máquinas são treinados em duas máquinas de diferentes fabricantes, para
verificar qual delas apresentava maior facilidade de aprendizagem. Mediu-se o tempo que cada um dos
operadores gastou na realização de uma mesma tarefa com cada um dos dois tipos de máquinas. Os
resultados estão na tabela ao lado. Ao nível de 10% é possível afirmar que a tarefa realizada na
máquina X demora mais do que na máquina Y?
Solução: Operador Fabricante 1 Fabricante 2
As hipóteses são: 1 80 75
H0: µX - µY = 0 (µX = µY) contra 2 72 70
H1: µX - µY > 0 (µX > µY ) 3 65 60
Pela tabela vê-se que: 4 78 72
di: 5, 2, 5, 6 e 7 5 85 78
Logo: d = 5 e SD = 1,8708, logo t = 5,98.
Como α = 10%, então tα = 1,54, pois o número de graus de liberdade é n - 1 = 4.
Portanto, rejeita-se a hipótese nula, isto é, a 10% de significância pode-se afirmar que com a
máquina X se demora mais do que com a máquina Y.
2.3.1. T ESTE PARA A DIFERENÇA ENTRE DUAS PROPORÇÕES
As hipóteses são:
H0: π1 - π2 = π contra
H1: π1 - π2 ≠ π ou
π1 - π2 > π ou ainda
π1 - π2 < π
Se π = 0, então π1 - π2 = 0, isto é, π1 = π2.
Extraídas uma amostra de cada uma das duas populações a variável P1 - P2 terá uma
distribuição aproximadamente normal com média E(P1 - P2) = π1 - π2 e variância σp2 −P2 =
1
π1(1 − π1) π 2 (1 − π2)
+ , desde que nP1 > 5 e mP2 > 5.
n m
P1 − P2 − π
A variável teste será, então: z =
π1(1− π1) π2(1− π2)
+
n m
Como os valores de π1 e π2 não são conhecidos, deve-se utilizar suas estimativas P1 e P2.
Desta forma, o valor de z será:
P1 − P2 − π
z=
P1 (1 − P1) P2 (1 − P2)
+
n m
Assim fixando o nível de significância “α“, a hipótese nula será rejeitada se:
|z| > zα/2 no teste bilateral;
z > zα, no teste unilateral à direita e
z < zα no teste unilateral à esquerda.
Exemplo:
Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista,
acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância os homens e as
mulheres apreciam igualmente a revista?
Solução:
As hipóteses são:
H0: π1 - π2 = 0 (π1 = π2) contra
H1: π1 - π2 ≠ 0 (π1 ≠ π2)
Tem-se que P1 = 32 / 80 = 0,40 e P2 = 26 / 50 = 52%
O valor da variável teste será:
0,40 − 0,52
z= = -1,34
0,40.0,60 0,52.0,48
+
80 50
Como α = 5%, então zα/2 = -1,96.
Portanto, aceita-se a hipótese de igualdade entre as preferências de homens e mulheres, isto é,
a este nível de significância não é possível afirmar que exista diferença entre as preferências de homens
e mulheres quanto à revista.
3. EXERCÍCIOS
(01) Pretende-se lançar uma moeda 5 vezes e rejeitar a hipótese de que a moeda é não-tendenciosa, isto
é, pretende-se rejeitar Ho: π = 0,50, se em 5 (cinco) jogadas ocorrerem 5 coroas ou 5 caras. Qual é a
probabilidade de se cometer erro do tipo I?
(02) (Bussab, pg. 249) Se, ao lançarmos 3 vezes uma moeda, supostamente equilibrada, aparecerem 3
caras decide-se rejeitar a hipótese de que a moeda é “honesta”, qual a probabilidade de se cometer erro
do tipo I? Se a moeda favorece cara em 80% das vezes, qual a probabilidade de se cometer erro do tipo
II?
(03) Você suspeita que um dado é viciado, isto é, você suspeita que a probabilidade de obter face 6 é
maior do que 1/6. Você decide testar a hipótese de que o dado é não-viciado, jogando-o cinco vezes e
rejeitando essa hipótese se ocorrer a face 6 (seis), 4 ou 5 vezes. Qual o nível de significância do teste?
(04) Nas faces de dois tetraedros regulares, aparentemente idênticos, estão marcados os valores: 0, 1, 2
e 3. Ao lançar um destes tetraedros o resultado observado é o valor da face que fica em contato com a
superfície. Os dois tetraedros são “chumbados”, de tal maneira que, ao jogá-los, as probabilidades de
cada uma das faces ficar em contato com a superfície são as
da tabela. Tomando ao acaso um dos tetraedros tem-se duas
Face Tetraedro A Tetraedro B
hipóteses: H0 : Trata-se do tetraedro A; H1 : Trata-se do
tetraedro B. 0 0,40 0,20
1 0,20 0,20
(04.1) Para testar H0 contra H1, o tetraedro escolhido é
lançado duas vezes. Adota-se a seguinte regra de 2 0,20 0,20
decisão: rejeitar H0 se a soma dos resultados dos dois 3 0,20 0,40
lançamentos for maior ou igual a 5. Determinar o nível Total 1 1
de significância e o poder do teste.
(04.2) Determinar o nível de significância e o poder do teste se a regra de decisão for: rejeitar H0
se sair o valor 3 (três) em ao menos um dos lançamentos e o outro resultado não for o valor 0
(zero).
(05) Em cada uma das quatro faces de dois tetraedros regulares, aparentemente idênticos, estão
marcados os valores: 1, 2, 3 e 4. Entretanto, um dos tetraedros é feito de material homogêneo (tetraedro
A) , de maneira que, ao lançá-lo a probabilidade de qualquer uma das 4 faces fique em contato com a
superfície é 0,25. O outro tetraedro (tetraedro B) é “chumbado”, de tal maneira que, ao jogá-lo, a face
com o valor 4 (quatro) tem probabilidade de 0,50 de ficar em contato com a superfície, enquanto que
qualquer uma das outras três tem probabilidade igual a 1/6. Suponha que um dos tetraedros é lançado
48 vezes, para testar a hipótese H0 de que foi lançado o tetraedro A, contra a hipótese H1 de que foi
lançado o tetraedro B. Supõem-se ainda a seguinte regra de decisão: “se nos 48 lançamentos, a face
com o valor 4 (quatro), for obtida 20 ou mais vezes, rejeita-se H0 em favor de H1. Determine o nível de
significância e o poder do teste.
(06) Uma urna contém 6 fichas, das quais θ são brancas e 6 - θ são pretas. Para testar a hipótese de
nulidade de que θ = 3, contra a alternativa de que θ ≠ 3, são retiradas 2 (duas) fichas da urna ao acaso e
sem reposição. Rejeita-se a hipótese nula se as duas fichas forem da mesma cor.
(06.1) Determine P(Erro do Tipo I).
(06.2) Determine o poder do teste para os diferentes valores de θ.
(06.3) Considere, agora, que a segunda ficha é retirada após a reposição da primeira. Calcule,
novamente, o nível de significância e os valores do poder do teste.
(06.4). Compare os dois procedimentos (com e sem reposição da segunda ficha retirada). Qual a
conclusão?
(07) Para decidirmos se os habitantes de uma ilha são descendentes da civilização A ou B, iremos
proceder da seguinte forma:
(i) Selecionamos uma amostra aleatória de 100 moradores adultos da ilha e determinamos a altura
média;
(ii) Se a altura média for superior a 176 cm, diremos que os habitantes são descendentes de B, caso
contrário, admitiremos que são descendentes de A.
Os parâmetros das duas civilizações são: A: µA = 175 cm e σA = 10 cm e B: µB = 177 cm e σB = 10 cm.
Define-se ainda: erro do tipo I como sendo “dizer que os habitantes são descendentes de B quando, na
realidade, são de A” e erro do tipo II “dizer que os habitantes são de A quando, na realidade, são
descendentes de B”.
(07.1) Qual a probabilidade de erro do tipo I e do tipo II?
(07.2) Se σA = σB = 5, como ficariam os valores dos erros do tipo I e II?
(07.3) Qual deve ser a regra de decisão se quisermos fixar a a probabilidade de Erro I em 5%. Qual
a probabilidade de erro II neste caso?
(07.4) Quais as probabilidades de Erro II, se as médias forem: µA = 178 e se µB = 180?
(08) Fazendo o teste H0: µ = 1150 (σ = 150) contra H1: µ = 1200 (σ = 200) e com n = 100, estabeleceu-
se a seguinte região crítica: RC = [1170, +∞).
(08.1) Qual a probabilidade α de rejeitar H0 quando verdadeira?
(08.2) Qual a probabilidade β de Aceitar H0 quando H1 é verdadeira?
(09) Dados os valores: 4, 6, 3, 6 e 6, de uma amostra aleatória de 5 (cinco) observações de uma
variável X, estime a média e a variância de X e admitindo que X tenha uma distribuição normal, teste,
a 5%, a hipótese de que a média da população é 1 (um), contra a hipótese alternativa de que é maior do
que 1 (um).
(10) Sabe-se que o consumo mensal per capita de determinado produto tem distribuição normal, com
desvio padrão de 2 kg. A diretoria da empresa que fabrica esse produto resolveu que retiraria o produto
da linha de produção se a média de consumo per capita fosse menor do que 8 kg, caso contrário,
continuaria a fabricá-lo. Foi realizado uma pesquisa de mercado, tomando-se uma amostra aleatória de
25 pessoas e verificou-se um consumo total de 180 kg do produto.
(10.1) Construa um teste de hipótese adequado para verificar a hipótese acima a um nível de
significância de 5% e diga qual deve ser a decisão a ser adotada pela empresa?
(10.2) Qual a probabilidade β de a empresa tomar a decisão errada se, na realidade, o consumo
médio mensal populacional é de 7,80 kg?
(10.3) Se a diretoria tivesse fixado uma significância de 1%, a decisão seria a mesma?
(10.4) Se o desvio padrão populacional fosse de 4 kg, qual seria a decisão a ser tomada com base
na amostra mencionada acima?
(11) A associação dos proprietários de indústrias metalúrgicas está preocupada com o tempo perdido
com acidentes de trabalho, cuja média, nos últimos tempos, tem sido da ordem de 60 homens/hora por
ano, com desvio padrão de 20 homens/hora. Tentou-se um programa de prevenção de acidentes e, após
o mesmo, tomou-se uma amostra aleatória de 16 indústrias e verificou-se que o tempo perdido baixou
para 50 homens /hora ano. Você diria que, ao nível de 5% de significância, o programa surtiu efeito?
(12) Está-se desconfiado de que a média das receitas municipais, per capita, das cidades pequenas
(menos de 20 mil habitantes) é maior do que a média da receita estadual que é de 1229 unidades
monetárias. Para testar a hipótese é realizada uma amostragem com 10 pequenas cidades que
forneceram os seguintes resultados (em termos de receitas médias):
1230, 582, 576, 2093, 2621, 1045, 1439, 717, 1838, 1359
Verifique que não é possível rejeitar a hipótese de que as receitas municipais são iguais as do estado,
aos níveis usuais de significância. Como isto se justifica, já que a média da amostra obtida é bem maior
do que a média do estado!
(13) Medidos os diâmetros de 31 eixos de um lote aleatório, produzido pela empresa “Sofazredondo
S.A.” obteve-se a distribuição abaixo:
Diâmetros (em mm) 56,5 56,6 56,7 56,8 56,9 57,0 57,1 57,2 57,3
Número de eixos 1 2 2 4 10 5 4 2 1
Ao nível de significância de 5%, há evidência de que o diâmetro médio dos eixos esteja fora da
especificação de uma média de 57 mm?
(14) Um fabricante garante que 90% das peças que fornece a um cliente estão de acordo com as
especificações exigidas. O exame de uma amostra aleatória de 200 destas peças revelou 25 fora das
especificações. Verifique se as níveis de 5% e 1% de significância há exagero na afirmativa do
fabricante.
(15) Suponha que a experiência tenha mostrado que dos alunos submetidos a determinado tipo de
prova, 20% são reprovados. Se de uma determinada turma de 100 alunos, são reprovados apenas 13,
pode-se concluir, ao nível de significância de 5%, que estes alunos, são melhores?
(16) Um exame é composto de 100 testes do tipo certo-errado. (a) Determine o número mínimo de
testes que um aluno deve acertar para que se possa, ao nível de significância de 5%, rejeitar a hipótese
de que o aluno nada sabe sobre a matéria e respondeu ao acaso, em favor da hipótese de que o alunos
sabia alguma coisa sobre a matéria do teste? (b) Qual seria este mínimo, se fosse adotado o nível de
significância de 1%?
(17) O rótulo de uma caixa de sementes informa que a taxa de germinação é de 90%. Entretanto, como
a data de validade está vencida, acredita-se que a taxa de germinação seja inferior a este número. Faz-
se um experimento e de 400 sementes, tomadas ao acaso, 350 germinam. Qual a conclusão ao nível de
5% de significância?
(18) Observou-se a produção mensal de uma indústria durante alguns anos e verificou-se que ela
obedecia a uma distribuição normal com variância igual a 300 u2. Foi adotada então uma nova técnica
de produção e durante um período de 24 meses observou-se a produção mensal. Após este período
constatou-se que a variância foi de 400 u2. Há motivos para se acreditar que houve alteração na
variância ao nível de 10%?
(19) Numa linha de produção é importante que o tempo gasto numa determinada operação não varie
muito de empregado para empregado. Em operários bem treinados a variabilidade fica em 100 u2. A
empresa colocou 11 novos funcionários para trabalhar na linha de produção, supostamente bem
treinados, e observou os seguintes valores, em segundos:
125 135 115 120 150 130 125 145 125 140 130
Testar se a tempo despendido por estes funcionários pode ser considerado mais variável do que os
demais funcionários. Utilize 5% de significância.
(20) O departamento de psicologia fez um estudo
comparativo do tempo médio de adaptação de uma Estatísticas Homens Mulheres
amostra de 50 homens e outra de 50 mulheres, tomados ao Média 3,2 meses 3,7 meses
acaso, de um grande complexo industrial que mostrou os Desvio padrão 0,8 meses 0,9 meses
seguintes resultados da tabela. É possível afirmar, ao nível
de 5% de significância que as mulheres desta empresa
levam mais tempo para se adaptarem?
(21) Diversas políticas, em relação às filiais de uma rede de supermercados, estão associadas ao gasto
médio dos clientes em cada compra. Deseja-se comparar estes parâmetros de duas novas filiais, através
de duas amostras de 50 clientes, selecionados ao acaso, de cada uma das novas filiais. As médias
obtidas foram 62 e 71 unidades monetárias. Supondo que os desvios padrões sejam idênticos e iguais a
20 um, teste a hipótese de que o gasto médio dos clientes não é o mesmo nas duas filiais. Utilize uma
significância de 2,5%?
(22) Uma fábrica de embalagens para produtos
Processo Tamanho da Média Desvio
químicos está estudando dois processos
amostra padrão
diferentes de combate a corrosão nas latas usadas
A 15 48 10
para embalagem. Para verificar o efeito dos dois
processos foram utilizadas duas amostras B 12 52 15
aleatórias que apresentaram os valores da tabela, quanto a variável “duração da embalagem (em meses)
antes da primeira mancha de corrosão aparecer”. Ao nível de significância de 5% é possível afirmar
que um tratamento é melhor do que o outro?
(23) Você recebe a informação de que a diferença entre duas médias amostrais é “estatisticamente
significativa ao nível de 1%”. Dizer se as afirmações abaixo estão certas ou erradas e justificar.
(23.1) Há pelo menos 99% de probabilidade de existir uma diferença real entre as médias das duas
populações.
(23.2) Se não houvesse diferença entre as médias das duas populações, a probabilidade de detectar
uma tal diferença (ou diferença maior) entre as médias amostrais seria de 1% ou menos.
(23.3) A informação constituí uma evidência sólida de que realmente exista diferença entre as
médias populacionais. Todavia, por si só, não constituí evidência suficiente de que tal diferença
seja suficientemente grande para ter importância prática. Isto ilustra a diferença entre os conceitos
“significância estatística” e “significância prática”.
(23.4) O valor da estatística teste (valor calculado) é exatamente 1%.
(23.5) A probabilidade de que as médias das duas amostras sejam diferentes é de 1%.
(24) Foram levantadas quatro hipóteses sobre a
média salarial anual de engenheiros mecânicos e Engenheiros Tamanho Média Desvio
civis: da amostra padrão
(i) Engenheiros mecânicos e civis ganham Mecânicos 250 38000 8000
em média o mesmo salário. Civis 200 36000 10000
(ii) Os engenheiros mecânicos ganham, em
média R$ 500 a mais do que os civis.
(iii) Os engenheiros mecânicos ganham, em média R$ 1000 a mais do que os civis.
(iv) Os engenheiros mecânicos ganham, em média R$ 2000 a mais do que os civis.
Para testar a hipótese foram extraídas duas amostras aleatórias dos salários dos dois tipos de
profissionais que apresentaram os valores da tabela. Com base, nos valores, responda, justificando,
as seguintes questões:
(24.1) Sem quaisquer, cálculos detalhados, podemos verificar imediatamente, qualquer uma das
hipóteses.
(24.2) Se aplicarmos um teste bilateral a cada uma das hipóteses, quais seriam rejeitadas ao nível
de 5%?
(24.3) Se aplicarmos um teste unilateral a cada uma das hipóteses, quais seriam rejeitadas ao nível
de 5%?
4. RESPOSTAS
(01) RC = { 0, 5} α = P(RC) = P{ X = 0 ou X = 5 / π = 0,50} = (1/2)5+ (1/2)5 = 1/16 = 6,25%
(02) RC = { 3 } α = P({ 3 }) = (1/2)3 = 1/8 = 12,50%
β = P(Ac. H0 / H0 é Falsa} = P(X = 0, 1, 2 / π = 0,8} = (1/5)3 + 3(4/5)1 (1/5)2 + 3(4/5)2 (1/5)1 =
48,80%
(03) RC { 4, 5} α = P(RC) = P({ X = 4 ou X = 5 / π = 1/6}) = 13/3888 = 0, 33%
(04) (04.1) RC = { (2, 3), (3, 2), ( 3, 3) } α = P(RC) = 0,20.0,20 + 0,20.0,20 + 0,20.0,20 = 12%
Poder do Teste = 1 - β = P(Rej. H0 / H0 é Falsa} = 0,20.0,40 + 0,20.0,40 + 0,40.0,40 = 32%
(04.2) RC = { (3, 1), (3, 2), ( 3, 3), (1, 3), (2, 3) } α = P(RC) = 5.0,04 = 0,20 = 20%
Poder do Teste = 1 - β = P(Rej. H0 / H0 é Falsa} = 4.0,08 + 0,16 = 0,48 = 48%
(05) RC = { X ≥ 20 / Tetraedro A) α = P(RC) = P({ X ≥ 20 / Tet. A}) ≅ P( Z ≥ (19,5 - 12) / 3) =
0,62%
β = P(Ac. H0 / H0 é Falsa} = P(X < 20 / Tet. B} = 9,68% Poder = 1 - β = 100% - 9,68% = 90,32%
(06) (06.1) n = 2 S/R RC = {BB, PP} α = P(RC) =(3/6).(2/5) + (3/6).(2/5) = 1/5 + 1/5 = 0,40 = 40%
(06.2) n = 2 S/R 1 - β = P(Rejeitar H0 / H0 é falsa)
θ = 0 ou θ = 6 1 - β = P(RC / θ = 0 ) = 1 = 100% = P(R / θ = 6)
θ = 1 ou θ = 5 1 - β = P(RC / θ = 1 ) = (1/6).(0/5) + (5/6).(4/5) = 2/3 = 66,67% = P(RC / θ = 5)
θ = 2 ou θ = 4 1 - β = P(RC / θ = 2 ) = (2/6).(1/5) + (4/6).(3/5) = 7/15 = 46,67% = P(RC / θ = 4)
(06.3) n = 2 C/R RC = {BB, PP} α = P(RC) =(3/6).(3/6) + (3/6).(3/6) = 1/4 + 1/4 = 0,50 =
50%
θ = 0 ou θ = 6 1 - β = P(RC / θ = 0 ) = 0 + 1 = 100% = P(RC / θ = 6)
θ = 1 ou θ = 5 1 - β = P(RC / θ = 1 ) = (1/6).(1/6) + (5/6).(5/6) = 13/18 = 72,22% =
P(RC / θ = 5)
θ = 2 ou θ = 4 1 - β = P(RC / θ = 2 ) = (2/6).(2/6) + (4/6).(4/6) = 5/9 = 55,56% = P(RC / θ = 4)
(06.4) Com reposição o NS (α) é maior do que SR. Por outro lado, repondo o poder do teste é
maior ou igual a quando não se faz reposição.
(07) (07.1) P(Erro I) = P( X A > 176) = P(Z > 176 - 175) = P(Z > 1) = 15,87%
P(Erro II) = P( XB < 176) = P(Z < 176 - 177) = P(Z < -1) = 15,87%
(07.2) P(Erro I) = P( X A > 176) = P[Z > (176 - 175)/0,5] = P(Z > 2) = 2,28%
P(Erro II) = P( XB < 176) = P[Z < (176 - 177)/2] = P(Z < -2) = 2,28%
(07.3) 5% = P(Erro I) = P( X A > 176) = P(Z > 176 - 175) Þ P(Z > x - 175) = 5% Þ x = 176,645.
Neste caso, deve-se rejeitar H0 somente se a média for superior a 176,645.
P(Erro II) = P( XB < 176,645 - 177) = P(Z < -0,36) = 35,94%
(07.4) µB = 178 P(Erro II) = P( XB < 176 - 178) = P(Z < -2) = 2,28%
µB = 180 P(Erro II) = P( XB < 176 - 180) = P(Z < -4) = 0,00%
(08) (08.1) α = P(Rej. H0 / H0 é V) = P( X > 1170 / µ = 1150) = P[Z > (1170 - 1150) / 15)] =
P(Z > 1,33) = 9,18%
(08.2) β = P(Ac H0 / H1 é V) = P( X < 1170 / µ = 1200) = P[Z < (1170 - 1200) / 20)] =
P(Z < -1,50) = 6,68%
(08.3) P[Z > (x - 1150) / 15)] = P[Z < (x - 1200) / 20)] Þ (x - 1150) / 15 = -(x - 1200) / 20 Þ x =
1171,43
(09) x = 5, s2 = 2 t = 6,32 > t5% = 2,132, portanto rejeita H0
(10) (10.1) H0: µ = 8 kg contra H1: µ < 8 kg. Como α = 5%, zα = -1,645 e zc = -2. Logo rejeitar H0
(10.2) β = P(Ac. H0 / H1 é V) = P( X > 7,34 / µ = 7,80) = P(Z < 1,14) = 87,29%
(10.3) H0: µ = 8 kg contra H1: µ < 8 kg. Como α = 1%, zα = -2,33 e zc = -2. Não rejeita H0
(10.4) Aceitar H0 tanto ao nível de 5% quanto ao de 1% de significância.
(11) Como α = 5%, zα = -1,645 e zc = -2. Rejeita-se H0, isto é, pode-se dizer que o programa surtiu
efeito.
(12) Como tc = -0,566, não é possível rejeitar a hipótese aos níveis de 1%, 5% e mesmo 10%. Isto se
justifica devido a grande variabilidade da amostra que apresenta um desvio padrão igual a 675,82.
(13) H0: µ = 57mm contra H1: µ ≠ 57 mm Como tc = -2,557 e tt = -2,042, rejeita-se H0.
(14) H0: π = 10% contra H1: π > 10%. Como zc = 1,18. Logo não se pode rejeitar H0.
(15) H0: π = 20% contra H1: π < 20%. Como zc = -1,75 e z5% = -1,645 . Logo pode-se rejeitar H0.
(16) H0: π = 50% contra H1: π > 50%. Como z5% = -1,645 o número mínimo de acertos é: 50% +
1,645.σP ≅ 59
Como z1% = -2,33 o número mínimo de acertos é: 50% + 2,33.σP ≅ 62
(17) H0: π = 90% contra H1: π < 90%. Como zc = -1,667 e z5% = -1,645 . Logo pode-se rejeitar H0.
(18) Não, pois χ2 = 30,67 está na região de aceitação que é: RA = [13,09; 35,17]
(19) Não, pois χ2 = 11,41 está na região de aceitação que é: RA = [0; 18,3]
(20) H0: µH = µM contra H1: µH < µM. Como α = 5%, tα = -1,645 e tc = -2,936. Rejeitar H0.
(21) H0: µ1 = µ2 contra H1: µ1 ≠ µ2 . Como α = 2,5%, tα = -2,24 e tc = -2,25. Rejeitar H0.
(22) H0: µ1 = µ2 contra H1: µ1 ≠ µ2 . Como α = 5%, t25 = -2,06 e tc = -0,79. Não rejeitar H0
(23) (23.1). Errada. (23.2) Correta. (23.3) Errada. (23.4) Errada. (23.5) Errada.
(24) (24.1) Sim a quarta. (24.2) Somente a (i) (24.3) Somente a (i) e a (ii).
(24.4) A (i) que pode ser confirmada tanto no teste unilateral quanto no bilateral (mais rigoroso)
(25) H0: µ1 = µ2 contra H1: µ1 ≠ µ2 . Como α = 5%, tα = 2,26 e tc = -2,42. Não rejeitar H0, supondo
amostras emparelhadas.
(26) H0: π1 = π2 contra H1: : π1 ≠ π2 . Como zc = 2,20 e z5% = 1,96. Pode-se afirmar que as duas tintas
diferem.
(27) (a) H0: π1 - π2 = 15% contra H1: : π1 - π2 < 15% Como zc = -2,11 e z5% = -1,645 . Logo pode-se
afirmar que os jovens causam pelo menos 15% a mais de acidentes.
(b) O problema é que as amostras tem um vício de origem, pois fica difícil de saber se esta
diferença é devida a imprudência ou ao fato de que os motoristas são menos experientes.
(28) H0: π1 = π2 contra H1: : π1 > π2 Como zc = 1,22 e z5% = 1,645 . Logo não se pode rejeitar H0
(29) Não se pode afirmar que não são iguais, pois FC = 2,56 e a RA = [0,38; 2,65]
(30) Pode-se afirmar que a qualidade difere, pois Fc = 4,21 e RA = [0,37; 2,54]
5. REFERÊNCIAS
[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 3. ed. São Paulo, Atual,
1986.
[DOW89] DOWNING, Douglas, CLARK, Jeff. Statistics The Easy Way. Hauppauge (New York):
Barron’s Educational Series, Inc, 1989.
[HIN88] HINKLE, Dennis E., WILLIAM, Wiersma, JURS, Stephen G. Applied Statistics for the
Behavioral Sciences. Boston: Houghton Mifflin Co., 1988.
[HOF80] HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo. Livraria Pioneira Editora,
1980.
[NET77] NETO, Pedro Luiz de Oliveira Costa. Estatística. São Paulo, Edgard Blücher, 1977.
[MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And
Economics. IRWIN, Boston, 1990.
[MEY78] MEYER, Paul L. Probabilidade: aplicações à Estatística. Tradução do Prof. Ruy C. B.
Lourenço Filho. Rio de Janeiro, Livros Técnicos e Científicos Editora S.A., 1978
[RES93] Research & Education Association. The Statistics Problem Solver. Piscataway (New Jersey):
1993.
[STE81] STEVENSON, William J. Estatística Aplicada à Administração. São Paulo. Editora Harbra,
1981.
[WEL82] WLKOWITZ, Joan, EWEN, Robert B., COHEN, Jacob. Introductory Statistics for the
Behavioral Sciences. Orlando(FL): Hartcourt Brace Javanovich, 1982.
[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatística. Rio de
Janeiro. Livros Técnicos e Científicos Editora S. A., 1985.