Академический Документы
Профессиональный Документы
Культура Документы
Introduo
At agora vimos os principais modelos de distribuies de probabilidade
e as medidas que caracterizam uma amostra, quando nos referimos ao estudo
da estatstica descritiva.
Aqui, nessa abordagem, vamos juntar o conhecimento adquirido a partir dos
modelos e das medidas estudadas anteriormente para obter as distribuies
amostrais dos principais estimadores.
O conhecimento das distribuies amostrais, ser a base para aplicao das
tcnicas da inferncia estatstica e para um melhor entendimento desses
conceitos, vamos conhecer algumas estatsticas e alguns parmetros.
16.1 Principais Conceitos
16.1.1 Inferncia ou Induo Estatstica
Trata-se do processo de obter informaes sobre uma populao a partir
de resultados observados em amostras. Serve , fundamentalmente para dar
ao pesquisador um grau de confiana em suas incertezas.
De modo geral tem-se uma populao com um grande nmero de
elementos e deseja-se, a partir de uma amostra dessa populao, conhecer o
mais prximo possvel algumas caractersticas dessa populao. Veja a figura
abaixo:
Populao (N) Amostra (n)
u u
Inferncia ou induo estatstica
16.1.2 Amostra Aleatria
Uma amostra aleatria o conjunto de n variveis aleatrias e
independentes (X
1
, X
2
, ... ,X
n
) tal que cada x
i
(i = 1, 2, ...,n) possui a mesma
caracterstica, ou distribuio da varivel populacional X" que se deseja
estudar.
Por exemplo: Se X : N ( , o
2
), cada X
i
: N ( , o
2
)
16.1.3 Estimador ou Estatstica
Um estimador ou estatstica qualquer varivel aleatria funo dos
elementos amostrais, ou seja, ) ,...., , (
2 1 n
X X X f = u
OBS Essa definio nos permite concluir que qualquer combinao das
variveis amostrais (X
1
, X
2
, .... , X
n
) um estimador ou estatstica.
16.2 ESTIMADORES
16.2.1 Estimador para a Mdia Populacional
=
n
x
x
i
a Mdia Aritmtica Amostral
16.2.2 Estimador para a Varincia Populacional o
2
1
) (
2
2
=
n
x x
S
i
Varincia Amostral
6.2.3 Estimador para a Proporo ou Probabilidade de Evento
Populacional p
n
X
p f = =
Freqncia Relativa
16.2.4 Estimador para o Desvio-Padro Populacional o
2
S S =
Desvio-padro Amostral
16.3 Estimativa
o valor numrico do estimador
Exemplo: x = 1,65m uma estimativa da mdia populacional
17 DISTRIBUIO AMOSTRAL
Considerando todas as possveis amostras de tamanho n que podem
ser extradas de uma populao e se para cada uma delas, calcularmos um
valor do estimador, tem-se uma distribuio amostral desse estimador. Como o
estimador uma varivel aleatria, podemos determinar suas caractersticas,
ou seja, sua mdia, varincia, desvio-padro,...
17.1 DISTRIBUIO AMOSTRAL DA MDIA
De uma determinada populao X, retiramos uma amostra de tamanho
n formada pelos elementos x
1
, x
2
, ...,x
n
, ento o estimador da mdia
populacional , calculada na amostra, ser dado por:
n
x
x
i
=
Exemplo:
Consideremos uma populao finita de tamanho N = 5. Seja X = 1, 2,
3, 4, 5 ; os elementos dessa populao. Calculemos ento, a mdia e a
varincia dessa populao:
E (X) =
x
= x
i
p(x
i
) E (X) = 1/5 (1 +2+3+4+5) = 15/5 = 3 E (X) =
x
= 3
V (X) = o
2
x
= E (X
2
) E
2
(X) = 11 9 = 2 V (X) = o
2
x
= 2
Agora vamos retirar dessa populao todas as amostras possveis, com
reposio, de tamanho n = 2, ou seja, sero 25 amostras, e calcularemos as
mdias da cada amostra.
Amostra
i
X
Amostra
i
X
Amostra
i
X
X
) ( X P ) ( . X P X ) ( .
2
X P X
Populao
xXXXPopula
oPOPULA
AO
Parmetro : u
Amostra
AmostraAmo
straAMOST
RAS
Estimadores : u
(1,1) 1,0 (3,1) 2,0 (5,1) 3,0 1,0 1/25 1/25 1/25
(1,2) 1,5 (3,2) 2,5 (5,2) 3,5 1,5 2/25 3/25 4,5/25
(1,3) 2,0 (3,3) 3,0 (5,3) 4,0 2,0 3/25 6/25 12/25
(1,4) 2,5 (3,4) 3,5 (5,4) 4,5 2,5 4/25 10/25 25/25
(1,5) 3,0 (3,5) 4,0 (5,5) 5,0 3,0 5/25 15/25 45/25
(2,1) 1,5 (4,1) 2,5 3,5 4/25 14/25 49/25
(2,2) 2,0 (4,2) 3,0 4,0 3/25 12/25 48/25
(2,3) 2,5 (4,3) 3,5 4,5 2/25 9/25 40,5/25
(2,4) 3,0 (4,4) 4,0 5,0 1/25 1/25 25/25
(2,5) 3,5 (4,5) 4,5
1 75/25 250/25
OBS - A mdia de cada amostra varia de uma amostra para outra, portanto
x uma varivel aleatria, nesse caso, discreta.
Ento, vamos determinar sua distribuio de probabilidade, sua mdia e sua
varincia.
Logo, 3 ) ( 3 25 / 75 ) ( ) ( = = = = = =
X E x p x x E
x x
E, 1 9 10 ) ( ) ( ) (
2 2
= = = x E x E x V 1 ) (
2
= =
x
x V o
Concluso:
Proposio 1
A mdia das mdias amostrais ) (x E igual mdia populacional , ou seja,
= ) (x E
- Demonstrao
) (x E = E
)
`
n
x
n
1
1
= |
.
|
\
|
=
n
i
x E
n
1
1
= ( )
x E
n
1
= ( ) n
n
1
= = ) (x E
Sendo, 2 ) ( = X V , n = 2 e 1 ) ( = x V , conclumos que:
n
X V
x V
) (
) ( =
Proposio 2
A varincia da mdia amostral igual varincia populacional dividida pelo
tamanho da amostra, ou seja,
n
x V
2
) (
o
=
- Demonstrao
( ) ( ) ( ) ( ) ( ) ) ( .... ( ) (
1
....
1 1
) (
2 1
2
2 1
2 2
n n i
x V x V x V
n
x x x V
n
x V
n n
x
V x V + + + = + + + = =
|
|
.
|
\
|
=
n
x V
n
n
n n
2 2
2
2
2 2 2
2
) ( ) . (
1
) ..... (
1 o o
o o o o = = = + + +
Graficamente, teramos:
P(x) ) (x P
5/25 -
4/25 - -
1/5 - - - - - 3/25 - -
2/25 - -
1/25 - -
0 1 2 3 4 5 0 1 2 3 4 5
1,5 2,5 3,5 4,5
Concluso:
1 - Se X: N ( , o
2
) e se dessa populao retirarmos uma amostra de tamanho
n suficientemente grande, com reposio, ento:
|
|
.
|
\
|
~
n
N x
2
,
o
e isto significa que, quanto maior o tamanho da amostra,
menor ser a varincia de x , ou o estimador x ser mais preciso medida que
aumentarmos n.
2 Se a populao X no normal, a varivel no ser exatamente normal,
mas sim aproximadamente normal, ou seja, a varivel
x
x
x
Z
o
=
ter como
distribuio limite a distribuio N (0,1).
3 Se a populao for finita e de tamanho N conhecido e se a amostra dela
retirada for sem reposio, ento:
1
.
=
n
n N
n
x
o
o
Exemplo
Sabe-se que a altura mdia dos alunos de uma faculdade de 175 cm e
desvio-padro de 5 cm. Sabendo-se que esta populao tem 5.000 alunos e
retirou-se uma amostra sem reposio de tamanho n = 100, qual a distribuio
da mdia amostral?
Se X: N (175; 25) = 175 cm e o =5 cm
175 ) ( = = X E
x
e, 49880 , 0
1 000 . 5
100 000 . 5
10
5
1
. =
=
n
n N
n
x
o
o
Logo, a mdia das mdias amostrais 175 com desvio padro 0,5 cm.
Aplicao
Seja X: N (80,26). Dessa populao retiramos uma amostra de n = 25.
Calcular:
a) ) 83 ( x P b) ) 82 ( s x P c) ) 2 2 (
x x
x x P o o + s s
a) Como X: N (80,26) ) 25 / 26 , 80 ( : N x
94 , 3 94 , 2
02 , 1
80 83
= =
= Z
x
Z
x
x
o
. Isto porque: 02 , 1 25 / 26 = =
x
80 83 x 0 2,94 Z
5 , 0 ) 94 , 2 ( ) 83 ( = = Z P x P - P(Z > 2,94) = 0,5 0,498359 = 0,001641
b) 975002 , 0 47002 , 0 5 , 0 ) 96 , 1 ( ) 82 ( = + = s = s Z P x P
80 82 x 0 1,96 Z
c)
= + s s = + s s = + s s ) 02 , 1 . 2 80 02 , 1 . 2 80 ( ) 2 2 ( ) 2 2 ( x P x P x x P
x x x x
o o o o
% 95 954500 , 0 )) 2 2 ( ) 04 , 82 96 , 77 ( ) 02 , 1 . 2 80 02 , 1 . 2 80 ( ~ = s s = s s = + s s Z P x P x P
Concluso
De posse desse valor, podemos afirmar que, temos 95% de confiana de que
se, retirarmos dessa populao, uma amostra de 25 elementos, a mdia
amostral estar no intervalo (77,96 : 82,04) ou, ento, se selecionarmos 100
amostras de tamanho 25, em 95 delas o valor da mdia pertencer ao intervalo
e em 5 delas no pertencer.
Teste seus conhecimentos
1 Uma populao se constitui dos nmeros 2, 3, 4, 5. Considere todas as
amostras possveis, de tamanho 2, que podem ser extradas dessa populao
com reposio.
Determinar:
a) A mdia da populao
5 , 3 =
x
b) O desvio-padro populacional
12 , 1 =
x
o
o
c) A mdia da distribuio amostral das mdias amostrais ;
5 , 3 =
x
o
d) O desvio-padro da distribuio amostral das mdias ; 7906 , 0 =
x
o
e) Com os valores obtidos, constate que ;
x
x E = ) ( e
n
x
/ o o =
2 Seja X: N (900 , 642) .Retiramos uma amostra de tamanho 30 dessa
populao. Determinar:
a) ) 894 ( s x P ; 0,096801
b) ) 903 896 ( s s x P ; 0,54726
c) ) 3 3 (
x x
x x P o o + ; 0,9973
3. Seja X: N(1200 , 1444). Retiramos uma amostra de tamanho 15. Determinar:
a) ) 206 . 1 194 . 1 ( s x P ; 0,458138
b) 90 , 0 ) . . ( = +
x x
Z x Z x P o o
o o
; P(1183,91s x s1216,08) = 0,90
4. Qual dever ser o tamanho de uma amostra a ser retirada de uma
populao normal com mdia 1.200 e varincia 840, de tal forma que:
a) P (1196 < x < 1204) = 0,90. ; 141
b) Que concluses se pode tirar a partir do dimensionamento de n?
5. Que tamanho dever ter uma amostra para ser retirada de uma populao
X : N (200,350) , para que 95 , 0 ) 5 ( = s x P ; n > 54
6. Seja X: N(100 ; 65). Retiramos dessa populao uma amostra de tamanho
20.
Determinar:
a) ) 105 95 ( s s x P ; R = 0,984902
b) 105 ( ) 95 ( x P x P
c) 95 , 0 ) . . ( = +
x x
Z x Z x P o o
o o
; R = 95 , 0 ) 4 , 104 96 . 95 ( = x P
d) Qual o risco de que a mdia no pertena a esse intervalo?
e) O que significa o 0,95 da questo c
17.2 DISTRIBUIO AMOSTRAL DAS PROPOROES
Seja X uma populao infinita e p a probabilidade ou proporo de
sucessos de um evento de X. Ento (1 p) ser a probabilidade desse evento
no ocorrer. Nessas condies e segundo Poisson:
A mdia ser: = E (X) = p e a varincia o
2
= V (X) = pq
Vamos retirar uma grande amostra, n , (x
1
,
x
2
,
... ,x
n
) dessa
populao, com reposio e seja x o nmero de sucessos na amostra, isto
o nmero de elementos com a caracterstica que se quer estudar. Com essas
caractersticas X ter uma distribuio Binomial ou seja, X : B (n, p) com:
mdia, E (X) = np e varincia V(X) = n p q.
Ento, a distribuio amostral da freqncia relativa ou do estimador
populacional p ser dada por:
n
X
f p = =
Calculando a esperana e a varincia de p temos:
p p E p
n
np
x E
n n
x
E p E = = = = |
.
|
\
|
= ) ( ) ( .
1
) ( ou p
p
=
e,
n
pq
p V
n
pq
npq
n
X V
n n
x
V p V = = = = |
.
|
\
|
= ) ( .
1
) (
1
) (
2 2
ou
n
pq
p
=
o
Concluso :
Para n > 30 e pelo teorema central do limite, a distribuio amostral de p ser
aproximadamente normal e,
p
p
p
o
ser assintoticamente normal , isto , ) 1 , 0 (
.
N
n
q p
p p
Z ~
=
OBS
1 - Quando a proporo populacional p desconhecida e a amostra com
reposio grande, determina-se p
o
= x / n, como estimativa de p.
2 Estatisticamente uma amostra suficiente grande quando n.p > 5 e n.q > 5
Graficamente, teramos:
n
pq
n
pq
0 p
APLICAO
1. Para se conhecer a proporo de pessoas de uma populao, portadoras
de determinada doena, retira-se uma amostra de 400 pessoas e atravs de
um exame constata-se que existem 8 portadoras dessa enfermidade. Definir
os limites de confiabilidade de 99% para a proporo populacional.
Soluo
O que queremos saber a proporo de pessoas na populao portadoras
dessa doena.
Como no conhecemos a proporo populacional, temos que estim-la,
atravs da freqncia amostral, assim:
02 , 0 02 , 0
400
8
0
= = = =
o
p
n
x
p e 98 , 0 =
o
q ;
07 , 0 007 , 0
400
98 , 0 . 02 , 0 .
0 . 0
= = = |
.
|
\
|
=
p p
x
n
q p
o o
Como no temos condies da estabelecer um nmero exato para os
portadores dessa doena, deveremos estabelecer um intervalo, onde esta
proporo estar contida.
Da, queremos: 99 , 0 ) . . (
0 0
= + s s
p p
Z p p Z p P o o
o o
0,05% 0,99% 0,05%
- Z
o
0 Z
o
Como
o
Z
= 495 , o
Z
= 2,57 ; Ento temos que:
P (0,02 2,57 . 0,007 s p s 0,02 + 2,57 . 0,007) = P (0, 002 s p s 0,038) = 99%.
Ou seja, podemos garantir com uma confiabilidade de 99% que a proporo de
pessoas portadoras da doena na populao varia de 0,2% no mnimo a 3,8%
no mximo
18 INTERVALOS DE CONFIANA
Introduo
Trata-se de uma tcnica para se fazer inferncia estatstica. A
partir de um intervalo de confiana, construdo com os elementos amostrais
pode-se inferir sobre um parmetro populacional.
Esta tcnica diferente da estimao por ponto, onde se calcula um
nico valor para o parmetro populacional. Agora, busca-se um segmento ou
intervalo que dever conter o parmetro desconhecido.
Tomemos como exemplo, uma amostra de 100 estudantes e calculando-
se a mdia das alturas, encontra-se 1,66 m. Atravs da tcnica de intervalos de
confiana poder-se-ia encontrar um intervalo, por exemplo |1,58 ; 1,68| que em
95% das vezes, incluiria a verdadeira altura dos estudantes, ou a mdia da
populao dos estudantes, = 1,66m
POPULAO
AMOSTRA
ESTIMATIVA Inferncia
PONTO INTERVALO
TOMADA DE DECISO EM
MOMENTOS DE INCERTEZA
1
2
3
4
5
6
7
8
9
10
u (fixo)
Configurao: 10 intervalos de confiana para 10 amostras de mesmo
tamanho e (1 - o) = 90%
17.2.1 NTERVALO DE CONFIANA PARA A MDIA POPULACIONAL
QUANDO A VARINCIA o
2
CONHECIDA
J sabemos que o estimador da mdia populacional x .
Tambm conhecemos a distribuio de x para o caso de populaes infinitas,
ou seja:
x : N ( ; o
2
/n) , sendo a varivel padronizada de x
dada por: x
x
Z =
o/ \ n
Fixando-se um nvel de confiana de 1 o temos :
o / 2 1 o o / 2
Z
o/2
0 Z
o/2
Queremos, ento: a P ( Z
o/2
s Z s Z
o/2
) = 1 o
Substituindo o valor de Z, na expresso acima,vem:
o
o
o o
= |
.
|
\
|
s
s 1
/
2 / 2 /
Z
n
x
Z P
x
e resolvendo as duas inequaes para ,
temos o intervalo de confiana para a mdia populacional quando a varincia
conhecida:
o
o
o
o o
= |
.
|
\
|
+ s s 1 . .
2 / 2 /
n
Z x
n
Z x P
x
Exemplo
A durao de vida de um componente eletrnico tal que o = 5 horas. Foram
amostradas 100 dessas peas obtendo-se a mdia de 500 horas. Deseja-se
construir um intervalo se confiana para a verdadeira durao mdia da pea
com um nvel de confiana de 95%.
Soluo
Dados : o = 5; n = 100; x = 500 (1 - o) = 95%
2,5% 9 5% 2,5%
1,96 500 1,96
OBS
Para encontrar a abscissa 1,96, entrou-se na tabela com 47,5% ou 0,475 = 0,5
0,25
Substituindo-se os valores correspondentes na frmula, temos:
P (500 1,96 . 5/10 s s 500 + 11,96 . 5/10) = 95%
P (499,02 s s 500,98) = 95%
Interpretao:
1 - Podemos afirmar com 95% de confiana que o intervalo |499,02 ; 500,98|,
contm a verdadeira mdia populacional que no caso, desconhecida.
2 Das 100 peas, amostradas, em 95 delas a mdia pertencer ao intervalo
e em 5
delas a mdia populacional estar fora desse intervalo.
Para o caso de populaes finitas e amostragens sem reposio, usa-se a
frmula:
o
o
o
o o
=
|
|
.
|
\
|
+ s s
1
1 1
2 / 2 /
N
n N
n
Z x
N
n N
n
Z x P
9. TESTE DE HIPTESES
Introduo
O teste de hipteses um mtodo de fazer inferncia estatstica sobre
parmetros populacionais. Em vez de se calcular uma estimativa pontual ou
por intervalo, do parmetro, admite-se um valor hipottico do parmetro
populacional e com base em elementos amostrais, realiza-se um teste
estatstico para aceitar ou rejeitar esse valor hipottico.
N n
u
u
0
Em resumo, um processo de anlise que permite decidir por um valor do
parmetro populacional ou por sua modificao do qual depende uma lei de
distribuio estatstica, com um grau de risco, a priori, conhecido.
1. Hiptese Estatstica
Uma hiptese estatstica uma suposio que o pesquisador faz
baseado no verdadeiro valor do parmetro populacional, ou quanto natureza
da distribuio de probabilidade de uma varivel populacional.
So exemplos de hipteses estatsticas:
1 A altura mdia da populao brasileira 1,65 m: =
0
= 1,65
2 A mquina A produz peas com variabilidade menor do que a mquina B:
2 2
B A
o o
3 A proporo de pessoas de uma regio A com uma certa doena, maior
do que na regio B:
B A
p p
So dois os tipos de hipteses estatsticas:
1 H
o
hiptese nula, a hiptese a ser testada, e
2 H
1
Hiptese alternativa
2. O Teste de Hipteses
A questo bsica para o teste a formulao de uma hiptese, quanto
ao verdadeiro valor do parmetro populacional e atravs dos elementos
amostrais realiza-se um teste que indicar a aceitao ou rejeio da hiptese
formulada com um risco, a priori, conhecido.
A hiptese nula expressa por uma igualdade e a hiptese alternativa por uma
desigualdade.
Exemplos
H
o
: = 1,65 para testes bilaterais
H
1
: = 1,65
H
0
:
2 2
B A
o o = para testes unilaterais esquerda
H
1
:
2 2
B A
o o
H
0
:
B A
p p = para testes unilaterais direita
H
1
:
B A
p p
4. Procedimento Padro para Montagem do Teste
1. Define-se as hipteses: nula H
0
e a alternativa H
1
2. Fixa-se um nvel de significncia o (risco);
3. Seleciona-se uma amostra de tamanho n e calcula-se uma estimativa u
0
do parmetro u populacional;
4. Para cada tipo de teste, usa-se uma varivel cuja distribuio amostral do
estimador em questo, seja mais concentrado em torno do verdadeiro valor do
parmetro populacional;
5. Calcula-se, com o valor u
0
, dado por H
0
, o valor crtico (V
cal
)
6. Fixam-se duas regies:
uma regio de no rejeio de H
0
(RNR) e outra de rejeio de H
0
ou crtica
(RC) para o valor calculado, ao nvel e significncia ou risco o e adota-se a
seguinte regra de deciso:
- Se V
cal
e RNR , decide-se no rejeitar H
0
- Se V
cal
e RC , rejeita-se H
0
5. Teste de Hiptese para a Mdia de Populaes Normais com Varincia
Conhecida
Aplicao
De uma populao normal com varincia 36, toma-se uma amostra casual de
tamanho 16, obtendo-se 43 = x . Ao nvel de 10% testar as hipteses:
45 :
45 :
1
0
=
=
H
H
Dados: o = 10% ; n = 16 ; 43 = x e o
2
= 36
Sendo o teste para mdia de populaes normais com varincias conhecidas,
usaremos a varivel Z : N(0,1) como critrio. Da,
33 , 1 33 , 1
5 , 1
45 43
0
= =
=
cal
x
H
Z
x
Z
o
Sendo 5 , 1
4
6
16
6
= = = =
n
x
o
o
Como o teste bilateral, temos que Z
o
= Z
5%
= Z
0,05
= 1,64
RC RNR RC
5%
5% 90% 5%
1,64 1,64
Como Z
cal
= 1,33 pertence a RNR, a deciso no rejeitarmos H
0
, ou seja,
a mdia 45, com 10% de risco de no rejeitarmos uma hiptese falsa
6 Tipos de Erros
Como falamos anteriormente , ao aplicarmos esta tcnica, estaremos
cometendo erros, por estarmos trabalhando com amostras. Diante desse fato
podemos classificar os erros em dois tipos:
6.1 Erro Tipo I ( o )
o erro cometido quando se rejeita H
o
,
sendo H
o
verdadeira.
6.2 Erro Tipo II ( | )
o erro cometido quando aceitamos uma hiptese falsa.
H
0
H i p t e s e s
D e c i s o V e r d a d e i r a F a l s a
Aceitar No h erro Erro tipo II
(1 - o) (|)
Rejeitar Erro tipo I No h erro
(o) (1- |)
Com base no quadro acima, conclui-se que:
- S cometemos o erro tipo I quando rejeitamos uma hiptese verdadeira
- S cometemos o erro tipo II quando aceitamos uma hiptese falsa