Вы находитесь на странице: 1из 27

ESTIMAO PARA A

PROPORO POPULACIONAL p
FORMATAO & DESIGN
Clber da Costa Figueiredo
figueiredo@usp.br
Thiago Rodrigo Alves Carneiro
thiagorodrigo@ime.usp.br
Estimar a proporo p (desconhecida)
de elementos de uma populao que
tm uma caracterstica de interesse a
partir da informao fornecida por uma
amostra.
Objetivo
Exemplos:


p: proporo de consumidores satisfeitos com
os servios prestados por uma empresa
telefnica;

p: proporo de eleitores da cidade de So
Paulo que votariam em um determinado
candidato caso a eleio para prefeito se
realizasse hoje;
p: proporo de crianas de 2 a 6 anos do
estado de So Paulo que no esto
matriculadas em escola de educao infantil.

p: proporo de alunos da USP que foram ao
teatro pelo menos uma vez no ltimo ms;
- Vamos observar n elementos extrados ao
acaso e com reposio da populao;
- Para cada elemento selecionado,
verificamos a presena (sucesso) ou no
(fracasso) da caracterstica de interesse.
Dois procedimentos complementares de
estimao:

Estimao intervalar
Estimao pontual
Estimador pontual
sendo que
X denota o nmero de elementos na amostra
que apresentam a caracterstica;
,
n
X
p

=
O estimador pontual para p, tambm
denominado proporo amostral, definido
como
Ao observamos o valor k da v. a. X, obtemos
que denominamos estimativa pontual para p.
n k / p

=
n denota o tamanho da amostra coletada.
Exemplo 1: Sejam,

p: proporo de alunos da USP que foram ao
teatro pelo menos uma vez no ltimo ms, e
X: nmero de estudantes que respondem sim
em uma pesquisa com n entrevistados.
Suponha que foram entrevistados n = 500
estudantes e que, destes, k = 100 afirmaram
que foram ao teatro pelo menos uma vez no
ltimo ms.

ou seja, 20% dos estudantes entrevistados
afirmaram que foram ao teatro pelo menos uma
vez no ltimo ms.
, 0,20
500
100
n
k
p

= = =

A estimativa pontual (proporo amostral) para p
dada por:
Note que, outra amostra de mesmo tamanho pode
levar a uma outra estimativa pontual para p.
Para uma amostra observada, os estimadores pontuais
fornecem como estimativa um nico valor numrico
para o parmetro.
Os estimadores pontuais so variveis aleatrias, e
portanto possuem uma distribuio de probabilidade,
denominada distribuio amostral do estimador.

Estimativa intervalar ou
intervalo de confiana
Complementarmente, vamos construir intervalos de
confiana, que incorporam estimativa pontual
informaes a respeito de sua variabilidade (erro
amostral).
Intervalos de confiana so obtidos por meio da
distribuio amostral do estimador pontual.
sendo c a margem de erro (a ser especificada).
A estimativa intervalar corresponde a um
intervalo determinado da seguinte maneira:


, p

; p
c + c
Seja P(c) a probabilidade de a estimativa pontual
estar a uma distncia de, no mximo, c da
proporo verdadeira p, ou seja,

)

p p ( P ) P( c s = c
A probabilidade P(c) tambm denominada
coeficiente de confiana do intervalo
(correspondente margem de erro c), que
denotamos pela letra grega (gama).

Afirmamos ento que a estimativa intervalar tem
(coeficiente de) confiana = P(c).
.
Como X ~ B(n,p) temos que, para n bastante
grande, a varivel aleatria


tem distribuio aproximada N(0,1).
p) - np(1
np - X
Z =
Agora,
( )
( ) ( ) ( )
)
`





c
s


s

c
=
c + s s c =
|
.
|

\
|
c + s s c =
|
.
|

\
|
c s = c s = c
p 1 np
n
p 1 np
np X
p 1 np
n
P
n np X n np P p
n
X
p P
p
n
X
P ) p p

( P ) P(
.
Deste modo, para n grande,
,
p) p(1
n
Z
p) p(1
n
P ) P(

s s

~ c
onde Z ~ N(0,1).
Fazendo
,
p) p(1
n

= z
P(c) = = P(-z s Z s z).
temos que
Exemplo 2:
No exemplo da USP (n = 500), suponha que p=0.20.
Qual a probabilidade de a estimativa pontual
estar a uma distncia de, no mximo, 0,03 da
proporo verdadeira?

Vamos usar a frmula do slide acima.

P(c) = = ??
Dados do problema:
03 , 0 e 20 , 0 p , 500 n
= c = =
Logo, obtemos
(90,6%). 0,906
1 0,953 2
1 A(1,68) 2
1 A(z) 2 ) P(
=
=
=
~ c
Clculo de z:
1,68
0,8 0,2
500 0,03
p) p(1
n
z =

=
c
.
Da relao
p), p(1
z
n
2

|
.
|

\
|
c
=
segue que o tamanho da amostra n, dados e a
margem de erro c, tem o valor
,
n
p) p(1
z

= c
onde z tal que = P(-z s Z s z) e Z ~ N(0,1).
Dimensionamento da amostra
Entretanto, nesta expresso, n depende de p(1-p),
que no problema de estimao desconhecido.
Como resolver este problema?
Pela figura observamos que:
- a funo p(1-p) uma parbola simtrica em torno de
p = 0,5;
Assim, na prtica, podemos substituir p(1-p) por seu
valor mximo, obtendo
, 0,25
z
2
|
.
|

\
|
c
= n
que pode fornecer um valor de n maior do que o necessrio.
Grfico da funo
p(1-p)
para 0 s p s 1.

- o mximo de p(1-p) 0,25, alcanado quando p = 0,5.
Anlise de pior caso

No exemplo da USP (Exemplo 1) suponha que
nenhuma amostra tenha sido coletada ainda.
Quantos estudantes precisamos consultar de
modo que a estimativa pontual esteja, no
mximo, a 0,02 da proporo verdadeira p, com
uma probabilidade de 0,95?
Dados do problema:
c = 0,02 (margem de erro);
P(c) = = 0,95 z = 1,96.
Exemplo 3:
. estudantes 2401 0,25
0,02
1,96
p) - p(1
0,02
1,96
n
2 2
=
|
|
.
|


\
|
s
|
|
.
|


\
|
=
Pergunta: possvel reduzir o tamanho da
amostra quando temos alguma informao a
respeito de p?
Por exemplo, se soubermos que:
p no superior a 0,30, ou
p pelo menos 0,80, ou
p est entre 0,30 e 0,60.
Resposta: Depende do tipo de informao que se
dispe sobre p.
Reduo do tamanho da amostra
Se temos a informao de que p no mximo
0,30 (p s 0,30), ento o valor mximo de p(1-p)
ser dado por 0,3x0,7 = 0,21.
Logo, reduzimos o valor de n para
0,21.
z
n
2
|
.
|

\
|
c
=
Vimos que, se nada sabemos sobre o valor de
p, no clculo de n, substitumos p(1-p) por seu
valor mximo, e calculamos
0,25.
z
n
2
|
.
|

\
|
c
=
Agora, se p pelo menos 0,80 (p > 0,80),
ento o mximo de p(1-p) 0,8 x 0,2 = 0,16
e temos
0,16.
z
n
2
|
.
|

\
|
c
=
Mas, se 0,30 s p s 0,60 , o mximo de p(1-p)
0,5x0,5 = 0,25 e, neste caso, no h reduo, ou
seja,
0,25.
z
n
2
|
.
|

\
|
c
=
Exemplo 4:
No Exemplo 3, suponha que temos a
informao de que no mximo 30% dos alunos
da USP foram ao teatro no ltimo ms.
A reduo em relao ao Exemplo 3 de
2401 2017 = 384 estudantes.

p s 0,30 e, como vimos, o mximo de p(1-p)
neste caso 0,21. Assim, suficiente amostrar

, estudantes 2017 0,21
0,02
1,96
0,21
z
n
2 2
=
|
|
.
|


\
|
=
|
.
|

\
|
c
=
Margem de erro da estimativa
intervalar com confiana
Da igualdade ,
p) p(1
n
z

c
=
deduz-se que a margem de erro c dada por
,
n
p) p(1
z

= c
onde z tal que = P(-z s Z s z), com Z~N(0,1),
produz estimativa intervalar com confiana
(aproximadamente) .

Intervalo de confiana para p
com nvel de confiana
Reiterando: a estimativa intervalar para p tem da
forma:
com
, e z tal que = P(-z s Z s z), Z ~ N(0,1),

n
p) p(1
z


= c

, p

; p
c + c
(

=
n
p) p(1
z p

;
n
p) p(1
z p

) ; IC(p
tem coeficiente ou nvel de confiana .
Em outras palavras, o intervalo
um intervalo de confiana para p com nvel de
confiana .
Intervalo de confiana para p
com nvel de confiana
Um problema prtico do intervalo de confiana
acima, que ele depende de p, o parmetro
desconhecido.
Na prtica, substitumos este parmetro
desconhecido pela proporo amostral , obtendo
o seguinte intervalo de confiana para p com nvel
de confiana :
(
(

=
n
) p

(1 p

z p

;
n
) p

(1 p

z p

) ; IC(p
p

Exemplo 5:
No exemplo da USP, temos n = 500 e suponha que
= 0,20.
Construir um intervalo de confiana para p com
coeficiente de confiana = 0,95.
Como = 0,95 corresponde a
z = 1,96, temos o intervalo:
| | | |. 0,235 ; 0,165 0,035 0,20 ; 0,035 0,20
500
0,80 0,20
1,96 0,20 ;
500
0,80 0,20
1,96 0,20
= + =
(
(

=
(
(

n
) p

(1 p

z p

;
n
) p

(1 p

z p


Neste intervalo (=0,95), a estimativa pontual para p 0,20,
com um erro amostral c igual a 0,035.
p

Interpretao do IC com = 95%:
Comentrios:
Da expresso possvel concluir que:

,
n
p) p(1
z

= c
- para n fixado, o erro aumenta com o aumento de .
Se sortearmos 100 amostras de tamanho n=500 e
construrmos os respectivos 100 intervalos de
confiana, com coeficiente de confiana de 95%,
esperamos que, aproximadamente, 95 destes
intervalos contenham o verdadeiro valor de p.
- para fixado, o erro diminui com o aumento de n.

Вам также может понравиться