Вы находитесь на странице: 1из 42

Inferncia Estat

Inferncia Estat

stica
stica
Prof.
Prof.
V
V

ctor
ctor
Hugo
Hugo
Lachos
Lachos
D
D

vila
vila
AULA:
AULA:
2
Inferncia Estatstica
Inferncia Estatstica um conjunto de tcnicas
que objetiva estudar uma populao atravs de
evidncias fornecidas por uma amostra.
Populao o conjunto de todos os elementos ou
resultados sob investigao. Amostra qualquer
subconjunto da populao.
3
Problemas da Inferncia
Exemplo: Qual a distribuio da altura dos brasileiros
adultos?. Parece razovel pensar num modelo Normal, a
questo agora identificar os parmetros ( e
2
) para que
ela fique completamente especificada. Como fazer isso?
Medindo a altura de todos os Brasileiros adultos. Neste caso no
necessrio usar Inferncia Estatstica!
Escolher estrategicamente uma amostra (X
1
,X
2
,...,X
n
) da populao de
adultos e atravs dessa amostra inferir sobre os parmetros ( e
2
)
da populao.
Os resultados dependeram da qualidade da amostra. Esta tem que ser
representativa da populao.
Descrevemos aqui um dos problemas bsicos da Inferncia
estatstica: Estimao
4
Problemas da Inferncia
Exemplo: suponha agora que desejamos saber se a mdia
da altura dos brasileiros maior que a dos argentinos
(1,65m)?
Para tomarmos uma deciso, escolhemos estrategicamente uma amostra
(X
1
,X
2
,...,X
n
) da populao de adultos e analisamos se > 1,65 com alta
probabilidade.
Descrevemos aqui um outro problema bsico da Inferncia estatstica:
Teste de Hipteses
5
Estima
Estima

o
o
Teste de Hip
Teste de Hip

teses
teses
A moeda honesta ou
desequilibrada?
Qual a proporo de
votos que o candidato A tem
nas eleies?
Qual a probabilidade de
"cara"no lanamento de
uma moeda?
Qual a proporo de
motoristas que tiveram
sua carteira apreendida
aps a vigncia da nova lei
de trnsito?
O candidato A vencer as
eleies ?
Pelo menos 2% dos
motoristas habilitados de
SP tiveram suas carteiras
apreendidas aps a
entrada da nova lei do
trnsito ou no?
6
Como Selecionar uma Amostra
Ex1: Anlise da quantidade de glbulos brancos na sangue de certo
indivduo. Uma gota do dedo seguramente ser representativa para a
anlise. Caso Ideal!
Ex2: Opinio sobre um projeto governamental. Se escolhemos uma
cidade favorecida o resultado certamente conter erro (vis).
Note que a maneira de se obter a amostra muito importante. A
Tecnologia da AMOSTRAGEM uma das especialidades dentro da
estatstica que fornece procedimentos adequados.
Aqui trataremos o caso mais simples e que serve de base para
procedimentos muito mais elaborados: Amostragem aleatria simples
(AAS)
7
AAS
Supomos que podemos listar todos os N elementos da populao
(populao finita).
Usando mtodos de gerao de nmeros aleatrios, sorteia-se um
elemento da populao, sendo que todos os elementos tem a mesma chance
de ser selecionados.
Repete-se o procedimento at que sejam sorteadas as n unidades da
amostra.
Temos AAS com reposio e sem reposio.
AAS com reposio implica que tenhamos independncia entre as
unidades selecionadas, facilitando o estudo das propriedades dos
estimadores. Logo, nestas notas:
AAS AAS com reposio
8
Definio: Uma amostra aleatria simples (a.a) de tamanho n de uma
v.a. X, o conjunto de n v.as independentes (X
1
,X
2
,...,X
n
), cada uma
com a mesma distribuio de X.
Definio: As quantidades da populao, em geral desconhecidas,
sobre as quais temos interesse, so denominadas parmetros. , ,
2
Definio: Chamamos de estatstica a qualquer funo T da amostra
aleatria, i.e.
T=T(X
1
,X
2
,...,X
n
)
Algumas Definies
Definio: A combinao de elementos da amostra, construda com a
finalidade de estimar um parmetro, chamado de estimador,
exemplo, Aos valores numricos assumidos pelos estimadores
chamamos de estimativas exemplo,
___
X
___
x
9
Exemplo: Estamos interessados na mdia () e varincia (
2
) das
alturas de jovens com idade entre 15 e 18 anos de certa cidade. Vamos
coletar uma amostra para tirar concluses. Suponha que escolhemos
ao acaso 10 jovens (AAS).
Possveis estimadores para (que por sua vez so estatsticas)
;
10
...
) ,..., ( ; ) ,..., ( ;
2
) (
) ,..., (
10 1
10 1 3 3 1 10 1 2 2 10 1 1 1
X
X X
X X t X X X t
Max Min
X X t =
+ +
= = = =
+
= =
Agora temos a amostra observada: (em metros)
1,65;1.57;1,72;1,66;1,71;1,74;1,81;1,68;1,60;1,77. As estimativas seriam:
014 , 0

; 006 , 0

0,005;

; 69 , 1
10
77 , 1 ... 65 , 1
; 65 , 1 ; 69 , 1
2
) 81 , 1 57 , 1 (

3
2 2
2
2
1
2
3 1 2 1
= = = =
=
+ +
= = =
+
=


s
Possveis estimadores para
2
2
3
2
1
2 2
2
2
1
2
10 1 4
1
2
)
2
( ; ) (
1
1
; ) (
1
) ,..., (
Min Max
X X
n
S X X
n
X X t
n
i
i
n
i
i

=

= = = =

= =

10
Propriedades dos estimadores

Definio: Um estimador no viciado para um parmetro


se

= ) (
)
E
Definio: Um estimador consistente, se, a medida que o
tamanho de amostra aumenta, seu valor esperado converge para o
parmetro de interesse e sua varincia converge para zero. i.e.

0 )

( lim )
)

( lim )
=
=


Var ii
E i
n
n
Observe que na definio de consistncia estamos supondo que o
estimador depende do tamanho de amostra n. Na definio de vcio o
resultado vale para qualquer que seja n.
11
Exemplo: Considere que uma certa caracterstica X, na populao tem
media e varincia
2
. Uma amostra aleatria simples (a.a.) de
tamanho n, representado por (X
1
,...,X
n
) obtida para estimar . Estude
as propriedades da media amostral.

n
n
)
n
X ... X
E( ) X E( ) E(
n
= =
+ +
= =
1

Logo X
,...,n i X ) Var(X ) E(X
i i i
. forma da es , al populacion media da estimador O
. 1 tes, independen so os que e , que Claro
2
=
= = =


)
n
X Var
n
)
n
X ... X
Var( ) X Var( ) Var(
n
i
i
n
2
1
2
1
) (
1


= =
+ +
= =

=
Portanto, a mdia amostral um estimador no viciado para a mdia
populacional e como sua variancia tende a zero conforme n cresce,
conclumos tambm que um estimador consistente para .
Se o interesse estimar
2
. Estude as propriedades de
2
2
2
1
2

S =
12
n=100
n=50
n=30
n=10
medida que n aumenta, a f.d.p. vai se concentrando ao redor da mdia
populacional 10. Quanto maior o tamanho de amostra maior probabilidade que
uma estimativa de este prxima da mdia populacional.
X
Exemplo: Considere uma a.a. (X
1
,...,X
n
) de uma varivel X~N(10,16).
Como se comporta em funo de n.
X
13
Parmetro Esimador Propriedades


No viciado e consistente
p

No viciado e consistente

2


No viciado e consistente

2


Viciado e consistente

X
n
ica caraterist favoraveis casos de No
= p
) (
1
1
2 2 2

= X n X
n
S i
) (
1

2 2 2

= X n X
n
i
Estimadores para a mdia, proporo e Varincia
14
Suponha que uma amostra aleatria simples (X
1
,...X
n
) retirada de uma
populao com mdia e varincia
2
. Ento, temos que
Teorema Limite Central (TLC)
Em palavras o TLC garante que para n grande a distribuio da mdia
amostral, devidamente padronizada, se comporta segundo um modelo
Normal padronizado (Z).
Em casos onde a verdadeira distribuio dos dados simtrica, boas
aproximaes so obtidas para n ao redor de 30.
Um estudo de simulao descreve graficamente o comportamento de
para diferentes situaes. X~U(0,1), X~Bin(10,0,3) e X~Exp(1)
X

n quando ), 1 , 0 (
/
N
n
X


15
Efeito do tamanho de amostra sobre a distribuio
de X
16
Exemplo: Numa certa cidade, a durao de conversas telefnicas em
minutos, segue um modelo Exponencial com parmetro 3. Observando-
se uma amostra aleatria de 50 dessas chamadas, qual ser a
probabilidade de em mdia, a durao de conversas telefnicas no
ultrapassarem 4 minutos.
9 Var(X) e 3 E(X) Logo . Exp(3) ~ X , : = = chamadas das durao X Seja
9909 , 0 ) 36 , 2 ( )
50 / 9
3 4
50 / 9
3
( ) 4 ( =

= Z P
X
P X P
Admitindo que n grande o suficiente, podemos calcular a probabilidade
desejada da seguinte forma:
17
Coletamos uma a.a. (X
1
,...X
n
) de X~Bernoulli(p), com o objetivo de
estimar p. Definimos a proporo amostral (estimador de p) como sendo
a frao de indivduos com a caracterstica X , i.e.,
Note que podemos escrever
O Caso da Proporo Amostral ( )
n
ica caraterist favoraveis casos de No
= p
p

p
n
np
n
X E X E X E
P E
n
= =
+ + +
=
) ( ... ) ( ) (
)

(
2 1
n
p p
n
p np
n
X X X
Var P Var
n
) 1 ( ) 1 (
)
...
( )

(
2
2 1

=

=
+ + +
=
Assim, temos que
Pelo TLC
) 1 , 0 (
/ ) 1 ( / ) 1 (
) (
) (
N
n p p
p p
n p p
p X
X Var
X E X

)
fracaso , 0
sucesso , 1
X ,
...

i
2 1
= =
+ +
= X
n
X X X
P
n
18
Exemplo: A proporo de peas fora de especificao num lote de 0,4.
Numa amostra de tamanho 30, calcule a probabilidade de que a
proporo de peas defeituosas seja menor do que 0,5.
nto,
. ) ( :

E
amostral proporo amostra na s defeituosa peas de proporo a p Seja
8686 , 0 ) 12 , 1 ( )
30
0,40(0,6)
4 , 0 5 , 0
30
0,40(0,6)
4 , 0
( ) 5 , 0 (
Assim, ),
30
0,40(0,6)
N(0,40, ~ p

n quando ), 1 , 0 (
p)/n - p(1
p - p

) p

Var(
) p

E( - p

<

= <
=
Z P
p
P p P
N
Como conseqncia do TLC, temos que
19
Estimao por Intervalos
Definio[Intervalo de Confiana] Seja X
1
,...,X
n
uma amostra
aleatria de uma populao com a caracterstica X~f(x,). Seja
T
1
=G(X
1
,...,X
n
) e T
2
=H(X
1
,...,X
n
) duas estatsticas tais que T
1
< T
2
e
que
. 1 ) (
2 1
= < < T T P

O intervalo (T
1
, T
2
) chamado de intervalo de 100(1-)% de
confiana para .

Notao: IC(,1-)= (T
1
, T
2
), onde T
1
e T
2
so os limite inferior
superior respectivamente e 1- o coeficiente (ou nvel) de
confiana
20
Intervalo de confiana para uma mdia populacional
Suponha que n
X X L ,
1 uma amostra aleatria de tamanho n, de uma
populao normal com mdia (desconhecida) e varincia

2
(conhecida). Vimos que a mdia amostral
X
, tem distribuio
normal com mdia e varincia
2
/n. Isto

) 1 , 0 ( ~N
n
X
Z


=
Logo, fixando um nvel de confiana (1-), pode-se determinar
z/2 de tal forma:.


=

1 ) (
2
1
2
1
z Z z P
Ou que equivalente



1 )
/
(
2
1
2
1
z
n
X
z P
z
1-/2
-z
1-/2
1-
21
48 47 6 48 47 6
E E
n
z X
n
z X z
n
X
z



2
1
2
1
2
1
2
1
/

+


( ) E X E X
n
z X
n
z X IC + =

+ =

; ; ) 1 , (
2
1
2
1



Logo, intervalo de 100 (1-)% de confiana para dado por:.
Exemplo 1: Em uma industria de cerveja, a quantidade de cerveja
inserida em latas tem-se comportado como uma distribuio
normal com mdia 350 ml e desvio padro 3 ml. Aps alguns
problemas na linha de produo, suspeita-se que houve alterao
na mdia. Uma amostra de 20 latas acusou uma mdia 346 ml.
Obtenha um intervalo de 95% para a quantidade mdia de
cerveja inserida em latas, supondo que no tenha ocorrido
alterao na variabilidade.
22
J que 1-=0,95, temos da tabela normal padro z0,975=1,96.

+ =
n
X
n
X IC

96 , 1 ; 96 , 1 ) 95 , 0 , (
( )
( ) 31 , 347 ; 69 , 344
31 , 1 346 ; 31 , 1 346
20
3
96 , 1 346 ;
20
3
96 , 1 346 ) 95 , 0 , (
=
+ =

+ = IC
0.95
23
No caso de populao finita de N elementos introduzida o fator
de correo de populao finita
1
2
1

=

N
n N
n
z E

2
2 / 1
2 2
2
2 / 1
2
) 1 (

+
=
z N E
Nz
n
Determinao do tamanho da amostra para estimao de
O erro mximo de estimao na estimao de dado por
n
z E

=

2
1
2
2
2 / 1
2
E
z
n


=
24
Exemplo: Uma firma construtora deseja estimar a resistncia mdia
das barras de ao utilizadas na construo de casas. Qual o
tamanho amostral necessrio para garantir que haja um risco de
0,001 de ultrapassar um erro de 5 kg ou mais na estimao ? O
desvio padro da resistncia para este tipo de barra de 25 kg.
Do enunciado tem-se =25, =0,001, e E=5, z0,9995=3,29
5
2
1
= =

n
z E

271 6025 , 270


5
) 25 ( ) 29 , 3 (
2
2 2
= = n
25
Intervalo de confiana para uma mdia populacional quando
desconhecido
A distribuio t-Student
Supondo que a caracterstica de interesse da populao
normal, a estatstica
) 1 (
n
S
X
T

=
tem distribuio de probabilidade conhecida com distribuio t
de Studentcom n-1 graus de liberdade.
26
R t
k
t
k
k
k
t f
k

=
+
; 1
) (
2
2
1
) (
2 / ) 1 (
2
2 / 1

A funo de densidade de um v.a t-Student com k graus de


liberdade dado por:.
27
Notao; T~t(k), indica que v.a tem distribuio t-Student com k
graus de liberdade.
Propriedades: se T~t(k)
) 1 , 0 ( ~ ) (
2 ,
2
) ( ; 0 ) ( ) (
N T k ii
k
k
k
T Var T E i

>

= =
Uso Da Tabela Distribuio t-Student

=

1 ) (
, 1 k
t T P
1-
t
1-,k
28
Considerando a estatstica dada em (1), pode-se mostrar que um
intervalo de 100(1-)% de confiana para dado por:
( ) E X E X
n
S
t X
n
S
t X IC
E
n
E
n
+ =

+ =

; ; ) 1 , (
1 , 2 / 1 1 , 2 / 1
4 43 4 42 1 4 43 4 42 1


Exemplo 3: Deseja-se avaliar a dureza esperada do ao
produzido sob um novo processo de tmpera. Uma amostra de 10
corpos de prova de ao produziu os seguintes resultados, em HRc:
36,4 35,7 37,2 36,5 34,9 35,2 36,3 35,8 36,6 36,9
Construir um intervalo de confiana para , com nvel de
confiana de 95%.
29
( )
2325 , 0 ; 7352 , 0
1
; 5 , 36
10
1
2
10
1
10
1
= =


= =

=
=
=
n
S
n
X X
S X X
i
i
i
i
J que, n=10 (1-)=0,95, =0,05, temos: t0,975, 9=2,26
53 , 0 ) 2325 , 0 )( 26 , 2 ( = = E
( ) ( ) 03 , 37 ; 97 , 35 53 , 0 5 , 36 ; 53 , 0 5 , 36 ) 95 , 0 , ( = + == IC
( ) E X E X IC + == ; ) 95 , 0 , (
30
Intervalo de confiana para uma varincia populacional
A distribuio Qui-quadrado
Supondo que a caracterstica de interesse da populao
normal, a estatstica
) 2 (
) 1 (
2
2

S n
W

=
tem distribuio de probabilidade conhecida com distribuio
qui-quadrado com n-1 graus de liberdade.
A funo de densidade de um v.a qui-quadrado com k graus de
liberdade dado por:.
0 ;
) 2 (
2
) (
2
1
2
2 /
>

=

w e w
k
k
w f
w k
k
2
) (
~
k
W : Notao
31
Se W tem distribuio qui-quadrado com k graus de liberdade
ento:
E(W)=k, Var(W)=2k;
A distribuio assimtrica direita;
A medida que os graus de liberdade aumenta a distribuio
torna-se simtrica.
32
Uso Da Tabela Distribuio Qui-Quadrado


=

1 ) W ( ~ W Se
2
, 1
2
(k) k
P
Exemplo 4: Suponha que W uma v.a com 10 graus de liberdade
determinar:
(a) P(W>2,56);
(b) P(2,56<W<4,87)
(c) O valor de k tal que, P(W<k)=0,95.
x
2
1-,k
33
2
) 1 (
2
2
~
) 1 (

=
n
S n
W

Para uma nvel de confiana 100(1-)% fixado pode-se determinar


2
1 ,
2
n

e
2
1 ,
2
1 n

da distribuio qui-quadrado como mostra a figura::



Da Estatstica dada em (2) temos:
X
2
/2,n-1
X
2
1-/2, n-1
34
Um intervalo de 100(1-)% de confiana para
2
ado por
( )

=

1
) 1 (
2
1 , 2 / 1
2
2
2
1 , 2 /
2
1 , 2 / 1
2
1 , 2 / n n n n
S n
P W P


=

2
1 , 2 /
2
2
1 , 2 / 1
2
2
) 1 (
,
) 1 (
) 1 , (
n n
S n S n
IC



Exemplo: pretende-se avaliar a variabilidade associada ao resultado de
um determinado mtodo de anlise qumica. Com esse objetivo,
efetuaram-se 24 anlises a uma determinada substncia em que se
segui o referido mtodo, em condies perfeitamente estabilizadas. A
varincia amostral dos resultados (expressados numa determinada
unidade) foi de 4,58. Admitindo que o resultado das anlises segue uma
distribuio normal. Obtenha um intervalo de 90% de confiana para
varincia.
35
Para 1-=0,90 =0,10, da distribuio qui-quadrado com n-
1=24-1=23 graus de liberdade temos:
( ) 047 , 8 ; 995 , 2
09 , 13
) 58 , 4 )( 1 24 (
,
17 , 35
) 58 , 4 )( 1 24 (
) 9 , 0 , (
2
=


= IC
x
2
0.05,23
x
2
0.95,23
36
Intervalo de confiana para uma proporo populacional
Suponha que tem-se uma populao dicotmica, constituda
apenas por elementos de dois tipos , isto , cada elemento pode
ser classificado com sucesso ou fracasso, suponha que
probabilidade de sucesso p e de fracasso q=1-p, e desta
populao se retira uma amostra aleatria, X
1
, X
n
de n
observaes. Vimos

) 1 , 0 ( ~
) 1 (

N
n
p p
p p
Z

=
Para um nvel confiana fixando em 100(1-)%,um intervalo para p,
para uma amostra suficientemente grande.

=

n
p p
z p
n
p p
z p p IC
) 1 (
;
) 1 (
) 1 , (
2 / 1 2 / 1

37
Abordagem otimista
) por substituir p - ( p -p) p(

1
Abordagem conservativa
1/4 por substituir -p) p(1
) 1 (
) 1 (
;
) 1 (
) 1 , (
2 / 1 2 / 1
a
n
p p
z p
n
p p
z p p IC

) 1 (
4
1
;
4
1
) 1 , (
2 / 1 2 / 1
b
n
z p
n
z p p IC

+ =

38
Exemplo: Um estudo foi feito para determinar a proporo de famlias
em uma comunidade que tem telefone (p). Uma amostra de 200
famlias selecionada, ao acaso, e 160 afirmam ter telefone. Que
dizer de p com 95% de confiana?
Uma estimativa pontual de p
%) 80 ( 8 , 0
200
160
= = p

J que 1-=0,95, temos da tabela normal padro z0975.=1,96.
Substituindo em (1a)
( ) 855 , 0 ; 745 , 0
200
) 8 , 0 1 ( 8 , 0
96 , 1 8 , 0 ;
200
) 8 , 0 1 ( 8 , 0
96 , 1 8 , 0 ) 95 , 0 , ( =

= p IC
) 869 , 0 ; 731 , 0 (
200 4
1
96 , 1 8 , 0 ;
200 4
1
96 , 1 8 , 0 ) 95 , 0 , ( =

= p IC
Em (1b)
39
Determinao do tamanho da amostra para estimao de p
O erro mximo de estimao na estimao de p dado por
No caso de populao finita de N elementos introduzida o fator
de correo de populao finita
) 1 ( ) 1 (
) 1 (
2 / 1
2 2
2 / 1
2
p p z N E
p p Nz
n
+

=

n
p p
z E
) 1 (
2
1

( )
2
2 / 1
2
) 1 (
E
p p z
n

=

1
) 1 (
2
1


=

N
n N
n
p p
z E

Quando no se teminformao de p:
( )
2
2 / 1
2
25 , 0
E
z
n

=
Quando no se tem informao de p:
) 25 , 0 ( ) 1 (
) 25 , 0 (
2 / 1
2 2
2 / 1
2

+
=
z N E
Nz
n
40
Exemplo: O servio social de um municpio deseja determinar a
proporo de famlias com uma renda familiar inferior a R$ 200,00.
Estudos anteriores indicam que esta proporo de 20%.
(a) Que tamanho de amostra se requer para assegurar uma confiana
de 95% que o erro mximo de estimao desta proporo no
ultrapasse o 0,05?
(b) Em quanto variara o tamanho da amostra se o erro mximo
permissvel reduzido a 0,01.?
Dos dados temos p=0,20 e 1-=0,95. Da tabela normal padro
z0,975.=1,96.
( )
246 86 , 245
05 , 0
8 , 0 2 , 0 ) 96 , 1 (
2
2
=

= n
(a) O erro mximo de estimao E=0,05.
41
(b) O erro mximo de estimao E=0,01.
( )
6147 56 , 6146
01 , 0
8 , 0 2 , 0 ) 96 , 1 (
2
2
=

= n
No caso de estarmos usando nvel de confiana de 95% , temos
que z0,975.=1,96 2, ento temos:
2
0
1
E
n =
A expresso anterior muito usado no planejamento de pesquisa
de levantamento, com o objetivo de estimar vrias propores
como nos exemplos seguintes:
Numa pesquisa eleitoral, em que comum a necessidade de
avaliar a proporo de cada candidato;
Na pesquisa de mercado, em que normalmente desejam-se
avaliar as propores de vrias caractersticas dos consumidores.
42
No caso de populao finita de N elementos introduzida o fator
de correo de populao finita:
1
0
0
+
=
n N
Nn
n