Вы находитесь на странице: 1из 10

Janete Pereira Amador

1
Distribuio por Amostragem

1 Introduo


A Finalidade da amostragem obter uma indicao do valor de um ou mais parmetros de
uma populao, tais como a mdia, o desvio padro populacional, ou a proporo de itens
que possuem determinada caractersticas. As estatsticas amostrais que correspondem a
esses parmetros populacionais so usadas para aproximar os valores desconhecidos
daqueles parmetros. Assim que a media amostral usada para estimar a mdia da
populao, o desvio padro amostral usado para estimar o desvio padro populacional, e
a proporo amostral serve para estimar a proporo na populao.
Uma das realidades da amostragem aleatria que, quando se extraem repetidas
amostras da mesma populao, h uma tendncia de a estatstica amostral variar de uma
amostra para outra, e tambm em relao ao verdadeiro valor do parmetro, simplesmente
em razo de fatores casuais relacionados com amostragem. Essa tendncia conhecida
como variabilidade amostral. A variabilidade amostral pode ser descrita por distribuies
de probabilidades tais como a normal e a binomial. Quando as distribuies de
probabilidades so usadas desta maneira so chamadas Distribuies amostrais.


Uma Distribuio Amostral uma distribuio de probabilidades que indica at que
ponto uma estatstica amostral tende a variar devido a variaes casuais na amostragem
aleatria

2 Amostragem com e sem reposio

A questo de reposio do item examinado na populao, antes de se proceder
observao seguinte, surge em relao s populaes finitas, por que a probabilidade de
incluir numa amostra itens da populao depende da amostragem ser com ou sem
reposio. Se o tamanho da amostra pequeno em relao ao da populao, a no
reposio do item ter efeito desprezvel nas probabilidades dos itens restantes. Por outro
lado amostras relativamente grandes tendem a distorcer as probabilidades dos itens
restantes no caso de amostragem sem reposio. Uma regra prtica fazer reposio
quando o tamanho da amostra excede 5% o tamanho da populao.
Se a populao for infinita as retiradas com e sem reposio sero equivalentes, isto
, o fato de se recolocar o elemento retirado de volta na populao no vai afetar em nada a
probabilidade de extrao do elemento seguinte. A amostragem sem reposio mais
eficiente que a amostragem com reposio e reduz a variabilidade uma vez que no
possvel retirar elementos extremos mais do que uma vez.
Se o processo de retirada for com reposio,
n
N = nmero de amostras de tamanho
n que podero ser extradas da populao de tamanho N.
Se o processo for sem reposio,
)! ( !
!
n N n
N
C N
n

= dar o total de amostras de


tamanho n que podero ser extradas da populao de tamanho N




Janete Pereira Amador
2
2.1 Distribuio amostral da mdia

Caso I - Populao for infinita, ou se a amostragem for tomada com reposio.
Considere-se a populao X = { 1, 3, 5, 6 } e todas as amostras possveis de
tamanho n = 2 extradas com reposio. Para cada amostra vai-se calcular a mdia. Ter-se-
assim um conjunto de 16 valores (
n
N = 4
2
= 16) que sero dispostos em uma tabela, com
as respectivas probabilidades, e que constituir ento a distribuio amostral da mdia da
amostra.
As possveis amostras com as respectivas mdias so:

A distribuio de P ( ) x
x 1 2 3 3,5 4 4,5 5 5,5 6
P( ) x 1/16 2/16 3/16 2/16 2/16 2/16 1/16 2/16 1/16

=1 ) (x P
Calculando a mdia da distribuio teremos:
| |

= = ) ( x P x X E
X

| | 6.(1/16) 5,5.(2/16) 5.(1/16) 4,5.(2/16) 4.(2/16) (2/16) 3,5. 3/16) .( 3 2.(2/16) 1/16) .( 1 + + + + + + + + = X E
| |= X E 60/16 = 3,75
Calculando a mdia da populao P = { 1, 3, 5, 6 } teremos:
= =
+ + +
= =

4
15
4
6 5 3 1
) (
n
X
i
x
3,75

Concluso: A mdia da distribuio por amostragem igual a mdia da populao
| |
( X) X E
= . Isso se deve a prpria essncia do processo aleatrio, que faz com que haja,
dentro da amostra, uma natural compensao entre valores mais elevados e valores mais
baixos, produzindo valores de | |
X E
(mdias amostrais) que tendem a ser mais prximos
da
( x)
(mdia da populao) quanto maior o tamanho da amostra n.
Calculando a varincia da distribuio teremos:
| | | |
2 2 2
) ( . ) ( X E p x X V
i X
= =


x 1 2 3 3,5 4 4,5 5 5,5 6
P( ) x 1/16 2/16 3/16 2/16 2/16 2/16 1/16 2/16 1/16

| | =
(
(

+
+ + + + + + +
=
2
2 2
2 2 2 2 2 2 2
75 , 3
.(1/16) 6 .(2/16) 5,5
.(1/16) 5 .(2/16) 4,5 .(2/16) 4 (2/16) . 3,5 3/16) .( 3 .(2/16) 2 1/16) .( 1
) (X V
| |
2
75 , 3
16
5 , 254
) (
(

= X V
= ) (X V 1,84375
Calculando a varincia da populao X = { 1, 3, 5, 6 }
Janete Pereira Amador
3
( )
N
N
X
X
i
i
X

=
2
2
2
=
4
4
) 15 (
71
2

= 3,68.
Erro padro da distribuio amostral das mdias (
X
).
n

x
X
= =
2
1,918

X
= = 1,356 este erro que se comete ao substituir a mdia da
populao pela mdia da amostra.
Concluso: A ) (X V da distribuio amostral das medias corresponde a metade da
2
x
,
pois n = 2. Assim, a varincia da distribuio de amostragem da mdia n vezes menor
que a populao de onde foi retira a mostra. Desta forma tm-se que
) X V(
ou
=
X
2

2
x
. Sendo assim, o erro padro da distribuio amostral (erro que se comete
ao substituir a mdia da populao pela mdia da amostra) denotado por
n

x
X
= .

Caso II - Amostras possveis de tamanho n so retiradas, sem reposio, de uma
populao finita de tamanho N.
Considere-se a populao X = { 1, 3, 5, 6 } e todas as amostras possveis de
tamanho n = 2 extradas sem reposio. Desta forma tm se
)! ( !
!
n N n
N
C N
n

= =
2
12
! 2 !. 2
! 2 . 3 . 4
)! 2 4 ( ! 2
! 4
4
2
= =

= C = 6 amostras de tamanho n.

A distribuio de P ( ) x
x 2 3 3,5 4 4,5 5,5
P( ) x 1/6 1/6 1/6 1/6 1/6 1/6

=1 ) (x P
Calculando a mdia da distribuio teremos:
| |

= = ) ( x P x X E
X

| | = + + + + + = 5,5.(1/6) 4,5.(1/6) 4.(1/6) (1/6) . 5 , 3 3.(1/6) 1/16) .( 2 X E 3,75
Calculando a mdia da populao P = { 1, 3, 5, 6 } teremos:
= =
+ + +
= =

4
15
4
6 5 3 1
) (
n
X
i
x
3,75
Concluso: A mdia da distribuio por amostragem igual a mdia da populao
| |
( X) X E
= , mesmo a populao sendo populao finita e amostra ser retirada sem
reposio de uma de tamanho N. Isso se deve ao fato que a mdia de uma soma de
variveis aleatrias igual a soma das mdias dessas variveis, no exigindo que a
varivel
i x
seja independente.
Calculando a varincia da populao X = { 1, 3, 5, 6 }
Janete Pereira Amador
4
( )
N
N
X
X
i
i
X

=
2
2
2
=
4
4
) 15 (
71
2

= 3,68
Calculando a varincia da distribuio:
Foi visto anteriormente que a varincia da distribuio corresponde a =
X
2

2
x
, no
entanto quando a populao finita e a amostragem sem reposio no se verifica
independncia entre os valores de x
i
utiliza-se um fator de correo para populaes finitas
1

N
n N
, note que fator tende unidade quando o tamanho da populao tende ao infinito.
Utiliza-se o fator multiplicado a varincia amostral desta forma tm-se
1
2
2

=
N
n N
n
x
X

.
Assim a varincia para a distribuio amostral das mdias ser:
= = =

=
3
68 , 3
3
2
2
68 , 3
1 4
2 4
2
68 , 3
2
X
1,22
Para o erro amostral da distribuio teremos:
1
) (

=
N
n N
n
x
x

=
449 , 2
712 , 2
732 , 1
414 , 1
414 , 1
918 , 1
1 4
2 4
2
918 , 1
= =

=1,10

Concluso: a varincia entre as mdias amostrais (
2
X

= 1,22) n vezes (neste caso


2 vezes) menor que a varincia populacional (
X
2

= 3,68) multiplicada pelo fator de


correo
1

N
n N
, de populao finita. Este fator, pode ser considerado como o fator de
eficincia da amostragem sem reposio sobre a amostragem com reposio, que neste
caso (N = 4 e n =2) vale 2/3. Como na amostragem sem reposio no possvel retirar o
mesmo elemento duas vezes, as mdias no podem assumir valores to extremos, como por
exemplo, o valor um ou seisque assumiram na amostragem com reposio. Isto faz
com que a erro padro na amostragem sem reposio seja menor do que na amostragem
com reposio.

O fator de reduo da varincia na amostragem sem reposio (N - n) / (N -1)
demonstra que quanto maior for a diferena entre o tamanho da populao e o tamanho da
amostra mais prximo de um ser este fator. Ento, como regra prtica, pode-se admitir
como necessria a correo para a varincia das mdias amostrais sempre que o tamanho
da amostra exceder a 5% do tamanho da populao. Caso isto no ocorra no necessrio
fazer-se a distino entre os dois procedimentos (com e sem reposio). Evidentemente
essas consideraes valem para populaes pequenas. Se a populao bastante grande ou
infinita, no mais ser possvel pensar em construir tabelas para representar a distribuio
das mdias amostrais. Conseqentemente necessrio procurar por modelos
probabilsticos que descrevam a distribuio da mdia amostral. Neste caso, tambm, a
distino entre amostragem com e sem reposio no ser necessrio, pois o fator de
correo ser aproximadamente um e no necessitar ser utilizado.
A capacidade de usar amostras para fazer inferncias sobre parmetros
populacionais depende do conhecimento da distribuio amostral. Neste caso podemos
fazer as seguintes inferncias sobre a distribuio amostral das mdias, de acordo com o
Teorema do Limite Central.
Janete Pereira Amador
5
Se (X1, X2, ..., Xn) uma amostra aleatria de uma populao com distribuio normal
de mdia e desvio padro , ento a mdia da amostra ( x ) ter uma distribuio
tambm normal com a mesma mdia da populao e com desvio padro , n vezes
menor que a varincia da populao, isto :
Se X N( ,
2
) ento X ser
|
.
|

\
|
n
N

,
No caso de amostragem sem reposio de populao finita, tm-se:
Se X N( ,
2
) ento X ser
|
|
.
|

\
|
|
.
|

\
|

1
,
N
n N
n
N


Se (X1, X2, ..., Xn) uma amostra aleatria extrada de uma populao com qualquer
distribuio de mdia e desvio padro , ento a mdia da amostra ( x ) ter uma
distribuio aproximadamente normal com a mesma mdia da populao e com desvio
padro raiz de n vezes menor que o desvio padro da populao medida que o
tamanho da amostra aumenta.
OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente
boa, para se poder utilizar este resultado.
Assim
Se X tem qualquer distribuio ento x ter uma distribuio aproximadamente
|
.
|

\
|
n
N

, para n grande (n > 30)

Teorema do limite Central
1. Se a populao sob amostragem tem distribuio normal, a distribuio das
mdias amostrais tambm ser normal para todos os tamanhos de amostras.
2. Se a populao bsica no normal, a distribuio de mdias amostrais ser
aproximadamente normal para grandes amostras.

Ex1: Uma populao X tem uma distribuio normal de mdia 100 e desvio padro 10.
a) Qual P(95< X <105)?
Soluo:
Como X uma N(100; 10)
(95< X <105) = (-0,5< Z< 0,5) = 0,19146 + 0,19146 = 38,3 %
b) Se x a mdia de 16 elementos extrada desta populao, qual a
P(95< x <105)?
Soluo:
Neste caso x uma N(100; 2,5)
P(95< x <105) = (-2 < Z< 2) = 0,47725 + 0,47725 = 95,45 %
Ex2: A renda de um conjunto de pessoas de uma certa regio tem mdia 6 salrios
mnimos e desvio padro de 2 salrios mnimos. Se desta populao for extrada uma
amostra de n = 100, qual a probabilidade de a mdia desta amostra acuse uma valor
superior a 6,3 salrios mnimos.
Soluo:
Neste caso como no foi declarado se populao normal, no entanto de
acordo com o teorema do limite central n > 30 (no caso 100) a amostra ter um
a distribuio aproximadamente normal. Desta forma temos que:
Janete Pereira Amador
6
6 = salrios e =
n

= 2 , 0
100
2
= uma vez que o erro padro da
mdia a raiz de n vezes menor do que o desvio padro populacional. Ento, a
probabilidade ser:
P ( x > 6,30) = P (Z > 1,5) = 6,8% a probabilidade das mdias de amostras de
tamanho n = 100 a presentearem um valor superior a 6,30 salrios mnimos.

2.2 Distribuio amostral da varincia

Caso I - Amostragem com reposio
Considere-se a populao X = { 1, 3, 5, 6 } e todas as amostras possveis de
tamanho n = 2 extradas com reposio. Para cada amostra calcula-se a mdia. Ter-se-
assim um conjunto de 16 valores (
n
N = 4
2
= 16) que sero dispostos em uma tabela, com
as respectivas probabilidades, e que constituir ento a distribuio amostral da varincia.
As possveis amostras com as respectivas mdias e varincia so:

Colocando estes resultados em uma tabela(distribuio amostral da varincia) vem:

Visto anteriormente a varincia da populao(
X
2
) X = { 1, 3, 5, 6 } = 3,68
Pela tabela segue-se que:
2 2 2 2
68 , 3 16 59 ) ( ) (
x
s f s S E = = = =

isto a expectncia (mdia) de todas as
varincias das amostras de tamanho n = 2, extradas com reposio da populao X,
igual a varincia populacional (parmetro populacional varincia).

Concluso: Quando a amostragem com reposio a varincia amostral
2
S um
estimador no tendencioso (o valor mdio do estimador igual ao valor do parmetro) da
varincia populacional
2
x
. Desta forma, sempre que se desejar estimar a varincia de
uma populao onde as amostras foram retiradas com reposio, pode-se usar a
varincia amostral como estimador.
Janete Pereira Amador
7

Caso II Amostra sem reposio
Amostras possveis de tamanho n so retiradas, sem reposio, de uma populao
finita de tamanho N.
Considere-se a populao X = { 1, 3, 5, 6 } e todas as amostras possveis de
tamanho n = 2 extradas sem reposio. Desta forma tm se
)! ( !
!
n N n
N
C N
n

= =
2
12
! 2 !. 2
! 2 . 3 . 4
)! 2 4 ( ! 2
! 4
4
2
= =

= C = 6 amostras de tamanho n.
As possveis amostras com as respectivas varincias so:

Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem:

Visto anteriormente a varincia da populao(
X
2
) X = { 1, 3, 5, 6 } = 3,68
Pela tabela segue-se que:
2 2 2 2
92 , 4 6 5 , 29 ) ( ) (
x
s f s S E = = = =

isto a expectncia (mdia) de todas as
varincias das amostras de tamanho n = 2, extradas sem reposio da populao X, no
igual a varincia populacional (parmetro populacional varincia). Neste caso, para que se
obtenha um estimador no tendencioso da varincia populacional necessrio corrigir a
varincia amostral atravs do fator
N
N 1
. Assim se cada varincia acima for multiplicada
por este fator, que neste caso ser,
4
3
4
1 4
=

= 0,75, ento a distribuio ser:



Janete Pereira Amador
8
68 , 3 6 / 1256 , 22 ) ( )

(
2 2 2
= = =

s f s S E =
2
x
isto a expectncia (mdia) de todas as
varincias corrigidas igual ao parmetro populacional
2
x
.
Concluso: quando a populao pequena e amostragem for sem reposio necessrio
corrigir a varincia da amostra pelo fator (N - 1) / N, para que ela seja um bom estimador
da varincia populacional. claro que esta correo s ser importante para populaes
pequenas. Se a populao for grande, por exemplo, N = 1000, ento o fator (N - 1) / N =
999 / 1000 = 0,999 o que aproximadamente 1. Neste caso, no necessrio usar esta
correo e a amostragem sem reposio pode ser considerada equivalente a com reposio
para efeitos de estimao da varincia populacional. Evidentemente estas consideraes
acima valem para populaes pequenas. Se a populao bastante grande ou infinita, no
mais ser possvel pensar em construir tabelas para representar a distribuio das
varincias amostrais. Neste caso necessrio procurar por modelos probabilsticos
(funes) que descrevam a distribuio da varincia amostral. Para a varincia este modelo
existe e denominado de distribuio Qui-quadrado ) (
2



2.3 Distribuio amostral da proporo

Caso I - Amostragem com reposio
Considere-se a populao X = { 1, 3, 5, 6 } e todas as amostras possveis de
tamanho n = 2 extradas com reposio. Para cada amostra vai-se calcular a P de
elementos pares na populao. Ter-se- assim um conjunto de 16 valores (
n
N = 4
2
= 16)
que sero dispostos em uma tabela, com as respectivas probabilidades, e que formaro
ento a distribuio amostral da proporo
As possveis amostras com as respectivas proporo de nmeros pares so:

Colocando estes resultados em uma tabela (distribuio amostral da proporo):

Pode-se ento calcular a expectncia e a varincia:
isto o valor esperado (mdia) de todas as
propores amostrais, extradas com reposio da populao P, igual a proporo
populacional (parmetro populacional ). Isto significa, que o estimador P um estimador
no tendencioso (ou no viciado) da proporo populacional , quando as amostras so
extradas com reposio da populao.
isto , a
varincia entre as propores amostrais n vezes (neste caso 2 vezes) menor que a
Janete Pereira Amador
9
varincia populacional. Isto porque quando se est trabalhando com propores, pode-se
mostrar que a varincia populacional igual a

Concluso: O valor 09375 , 0
) 1 (
=

=
n
P

denominado erro padro da
proporo. Ele mede a variabilidade entre as propores amostrais e d uma idia do
erro que se comete ao se substituir proporo da populao pela proporo da amostra.

Caso II Amostra sem reposio
Amostras possveis de tamanho n so retiradas, sem reposio, de uma populao
finita de tamanho N. Para cada amostra vai-se calcular a P de elementos pares na
populao. Desta forma para n = 2 extradas sem reposio. Desta forma tm se
)! ( !
!
n N n
N
C N
n

= =
2
12
! 2 !. 2
! 2 . 3 . 4
)! 2 4 ( ! 2
! 4
4
2
= =

= C = 6 amostras de tamanho n.
As possveis amostras com as respectivas propores so:

Colocando estes resultados em uma tabela (distribuio amostral da proporo):

isto o valor esperado (mdia) de todas as
propores amostrais, extradas sem reposio da populao P, igual a proporo
populacional (parmetro populacional ). Isto significa, que o estimador P um estimador
no tendencioso (ou no viciado) da proporo populacional , quando as amostras so
extradas sem reposio da populao.
isto , a
varincia entre as propores amostrais n vezes (neste caso 2 vezes) menor que a
varincia populacional multiplicada pelo fator de correo de populao finita. Este fator,
pode ser considerado como o fator de eficincia da amostragem sem reposio sobre a
amostragem com reposio que, neste exemplo, (N = 4 e n = 2) vale 2/3.











Janete Pereira Amador
10
Concluso: O fator de correo para populao finita s vale para populaes
pequenas. Se a populao bastante grande ou infinita, no mais ser possvel pensar em
construir tabelas para representar a distribuio das propores amostrais. Nesta
situao necessrio procurar por modelos probabilsticos que descrevam a distribuio
da proporo amostral. Neste caso, tambm, como declarado acima a distino entre
amostragem com e sem reposio no ser necessria, pois o fator de correo ser
aproximadamente um e no precisar ser utilizado.
O modelo probabilstico para a proporo amostral dada pelo seguinte resultado:
(a) Se (X1, X2, ..., Xn) uma amostra aleatria retirada de uma populao com proporo
=
P
e desvio padro
n
) 1 (


= Para amostras de 30 ou mais valores, em geral,
a aproximao j ser suficiente boa, para se poder utilizar este resultado. Para amostras
pequenas a distribuio da proporo amostral Binomial.
Ex: A proporo de eleitores do candidato D. M. A. numa certa regio de 20%.
Extrada uma amostra de 100 eleitores desta regio, qual a probabilidade que ela apresente
um nmero de eleitores do candidato.
a) Abaixo de 15%
Soluo:
Como n > 30 pode-se usar a distribuio normal com mdia % 20 = = e desvio padro
n
) 1 (


= =
100
) 2 , 0 1 ( 2 , 0
= 0,04 = 4%
P(P<15%) = Z
P
= 25 , 1
4
20 15
=

P
x


= 39,435 - 50 = 10,565% representa a
probabilidade do candidato D. M. A. obter um nmero de eleitores abaixo de 15%, na
regio estudada.
b) Superior a 30%
Soluo:
P(P>30%) = Z
P
= 5 , 2
4
20 30
=

P
x


= 49,379-50 = 0,621% representa a probabilidade
do candidato D. M. A. obter um nmero de eleitores acima de 30%, na regio estudada.

Вам также может понравиться