Вы находитесь на странице: 1из 71

1

1. Introduo
At agora o que fizemos foi desenvolver modelos probabilsticos que se adequavam a
situaes reais. Em particular, indicmos quando os modelos Binomial e Normal eram
adequados. Todos estes modelos se referem a distribuies, de probabilidade, que envolvem
parmetros, que at agora foram supostos conhecidos. Para que as probabilidades associadas
a eventos sejam calculadas necessrio conhecer o valor destes parmetros.
No estudo das probabilidades realizado at agora, o nosso objectivo era calcular a
probabilidade de acontecimentos pr-especificados, mas do ponto de vista prtico
importante poder deduzir informaes, relativas a uma populao, mediante a utilizao de
amostras dela extradas. Esta a grande diferena entre Probabilidade e Estatstica. No estudo
de Probabilidade estamos interessados em definir modelos que possam ser aplicados a
situaes reais. Estes modelos envolvem distribuies de probabilidade totalmente
conhecidas, isto , no apenas a forma da densidade, mas tambm os seus parmetros so
conhecidos. No estudo da Estatstica supe-se que o modelo probabilstico conhecido, isto
, sabe-se qual a distribuio de probabilidade que modela a situao real, mas os parmetros
desta distribuio so desconhecidos, e devem ser estimados a partir dos dados.
O objectivo principal da Inferncia estatstica, estimar os parmetros populacionais (mdia,
varincia etc), deduzidos a partir da estatstica amostral correspondente. Os mecanismos mais
usuais para "inferir" alguma coisa sobre estes parmetros so:
Estimao pontual - o objectivo "encontrar" os valores do parmetro desconhecido.
Estimao por intervalos - o objectivo encontrar um intervalo que contenha o
parmetro de interesse com uma probabilidade especificada.
Testes de hipteses: o objectivo criar conjecturas sobre os valores possveis do
parmetro e verificar se, estas conjecturas, so muito ou pouco provveis (isto , testar
as hipteses).

2. Distrbuio amostral
a distribuio de probabilidade de um estimador ( ou estatstica) da amostra formada
quando amostras de tamanho n so colhidas varias vezes de uma populao.
Por exemplo, se o estimador da amostra for a sua mdia, a distribuio ser uma distribuio
amostral de mdias das amostras.
Um estimador uma caracterstica da amostra.
Como a amostra aleatria um estimador uma varivel aleatria. Assim tudo o que foi visto
em probabilidade sobre variveis aleatrias, aplica-se aos estimadores. A distribuio de
probabilidade de um estimador denominada de distribuio amostral.
Os principais estimadores so:
(I) A mdia da amostra,

que um estimador da mdia da populao:

(ii) A varincia amostral, S


(iii) A proporo amostral,

que um estimador da varincia populacional:

P , que um estimador amostral da proporo populacional

Estimativa
Uma estimativa um valor particular de um estimador
Assim

X =2

uma estimativa. O estimador a expresso (frmula) enquanto que a

estimativa o valor particular que ele assume (nmero).


Clculo dos principais estimadores.
Se (

X1

X2

, ...,

populao, ento:

Xn

) uma amostra aleatria de tamanho n extrada de uma

X =
n

a)

Xi

uma estimativa da mdia populacional quando a amostra no est

X =

agrupada e

f i Xi
uma estimativa da mdia da amostra quando a amostra
n

est agrupada em uma distribuio de frequncias (por ponto ou por valores).


b
n
2

( X i X )

S = i=1

uma estimativa da varincia populacional quando a amostra no

n1

est agrupada e

f i ( X i X )

S 2= i=1

n1

uma estimativa da varincia populacional quando a

amostra est agrupada em uma distribuio de frequncias. Note-se que agora a varincia
calculada
Com n1 no denominador. Isto se deve ao facto de que a varincia for calculada com
n no denominador, a mdia de sua distribuio amostral no ser igual a varincia

populacional o que caracterizaria um estimador tendencioso.


Embora a varincia seja calculada com n1 no denominador com o objectivo de que as
estimativas variem em torno do parmetro, isto no ir ocorrer se a amostragem for sem
reposio de populao finita. Neste caso necessrio utilizar, ainda, uma correco para a

varincia que consiste em multiplic-la pelo valor

N 1
. Evidentemente esta correco s
N

ser necessria se a populao for pequena, caso contrrio o quociente acima ser
aproximadamente igual a um e a correco no precisar ser feita.
Assim se a populao for finita (e pequena) e a amostragem for realizada sem reposio a
varincia dever ser calculada por:
N1 2
2
S^ =
S
N

P=

c)

f
n , onde f

a frequncia de elementos na amostra com determinada

caracterstica uma estimativa da proporo populacional .

Observao:
Funes no estatsticas:
n

( X i X )

S 2= i=1

Xi

por conterem parmetros desconhecidos

(varincia amostral corrigida, usa-se para n 30

n1
n

( X i X )

ou S '2= i=1

X i

(varincia amostral no corrigida, usa-se para n>30

Quais as razes que nos podem levar a preferir uma das estatsticas relativamente
outra?
2
'2
Qual o estimador preferido? S ou S ?

Um critrio que costuma ser aplicado o de escolher um bom estimador como sendo
aquele que centrado e que tem uma boa preciso. Escolhido um plano de amostragem,
define-se:
Estimador centrado Um estimador diz-se centrado quando a mdia das estimativas
obtidas para todas as amostras possveis que se podem extrair da Populao, segundo o
esquema considerado, coincide com o parmetro a estimar. Quando se tem um estimador
centrado, tambm se diz que no enviesado.
2
Uma das razes que nos levam a preferir o estimador S para a varincia, relativamente a

'2

, o facto de no apresentar enviesamento (pelo menos para o plano de amostragem

que iremos utilizar).

Aparece-nos, novamente a palavra enviesamento, mas noutro contexto. Efectivamente,


relacionado com um processo de amostragem e com escolha de um estimador, temos dois
tipos de enviesamento:

O associado com o processo de amostragem, isto , com a recolha da amostra, em


que uma amostra enviesada o resultado do processo de amostragem no ser
aleatrio;

O associado com o estimador escolhido, para estimar o parmetro em estudo. Se o


estimador no for centrado, diz-se que enviesado ou no centrado.

Para se evitar qualquer tipo de enviesamento, necessrio estar atento:

Primeiro na escolha do plano de amostragem


E depois na escolha do estimador utilizado para estimar o parmetro desconhecido. O
facto de utilizarmos um estimador centrado, no nos previne contra a obteno de
ms estimativas, se o plano de amostragem utilizado sistematicamente favorecer uma
parte da Populao (isto , fornecer amostras enviesadas).

Por outro lado, temos que ter outra preocupao com o estimador escolhido, que diz respeito
preciso:
Preciso - Ao utilizar o valor de uma estatstica para estimar um parmetro, temos que cada
amostra fornece um valor para a estatstica que se utiliza como estimativa desse parmetro.
Estas estimativas no so iguais devido variabilidade presente na amostra. Se, no entanto,
os diferentes valores obtidos para a estatstica forem prximos, e o estimador for centrado,
podemos ter confiana de que o valor calculado a partir da amostra recolhida (na prtica
recolhe-se uma nica amostra) est prximo do valor do parmetro (desconhecido).
A falta de preciso e o problema do enviesamento da amostra so dois tipos de erro com
que nos defrontamos num processo de amostragem (mesmo que tenhamos escolhido um
bom estimador).

2.1 Distribuio amostral da mdia


a) Amostragem com reposio

Seja

uma varivel aleatria que assume os seguintes elementos

{ 2 ; 3; 4 ; 5 } .Vamos

extrair, aleatoriamente, com reposio, amostras de dois elementos. Ento, 4 2 = 16 o nmero


de amostras possveis, j que N = 4 e n = 2 o processo com reposio.

( 2; 2 )( 2 ; 3 )( 2 ; 4 ) ( 2; 5 ) ( 3 ; 2 )( 3 ; 3 ) ( 3 ; 4 )( 3 ; 5 ) ( 4 ; 2 )( 4 ; 3 ) ( 4 ; 4 ) ( 4 ; 5 )( 5 ; 2 ) (5 ; 3 )( 5 ; 4 ) (5 ; 5 )
Se calcularmos para cada amostra sua mdia obteremos:

( 2+2 2 =2) ;( 2+32 =2,5) ;( 2+42 =3); ( 2+2 5 =3,5); ( 3+2 2=2,5) ;( 3+32 =3) ;( 3+2 4 =3,5) ;( 3+52 =4) ;( 4 +22 =3)
A distribuio de probabilidade
Mdia

2,5

1
16

Probabilidad
e da Mdia

2
16

:
3

3,5

3
16

4
16

4,5

3
16

2
16

1
16

X
X
E ) e Var ) da seguinte maneira:

Calculamos a

X
X =E ) =

X i P ( X i ) =3,5
i=1

E ( 2 ) =0,625
7

Var ( X )=

(
i=1

X i2 P ( X i )

Como a populao formada pelos elementos


populacional:
n

Xi

x = i=1
n

2+3+ 4+5 14
= =3,5
4
4

{ 2; 3 ; 4 ; 5 } , calculamos a mdia e varincia

X
2
( i x )
=1,25
n
n
2
Var ( X )= =
i=1

Var ( X ) a metade

Observando os valores acima, verificamos que as mdias so iguais e a


da varincia da populao, pois, n=2.

Dai constatamos que

X = X

Var ( X )
e Var ( X )= n = n

Ser que foi coincidncia o facto de que a mdia das mdias amostrais ter coincidido com a

ser igual metade de Var ( X ) ?

mdia populacional? E a varincia de

Vamos mostrar que isso sempre acontece


Teorema
Seja

, ...,

Xn

uma varivel aleatria com mdia

e varincia

e seja (
n

),

uma amostra aleatria simples, ento, se

i=1

Xi
n

X1

X2

, temos os

E ( X ) = X e Var ( X )=
n

Teorema 1
Teorema: Consideremos uma amostra aleatria, (
n

N ( ; 2 ) . A mdia amostral

i=1

Xi
n

X1

X2

, ...,

Xn

segue uma distribuio

), de distribuio
2
n

( ).

N ;

Este teorema pode ser generalizado para uma amostra aleatria de uma distribuio qualquer.

Teorema2
Teorema: Consideremos uma amostra aleatria, (
distribuio qualquer tal que

E ( X i ) =

X1

X2

Var ( X i ) = 2 . Seja

Xn

, ...,
X

), de uma

a mdia amostral.

Ento:

1.

E ( X ) =

2.

Var ( X )=
n

3. Se n grande, pelo teorema central do limite, podemos concluir que

X
N (0 ; 1)

Nota: Neste caso, nada dito a respeito da distribuio de

X . Apenas a sua mdia e

Xi

varincia so conhecidas, e so funes da mdia e varincia de cada


distribuio de

X poderia ser uma coisa estranha, que nada tem a ver com a distribuio

original de cada

Xi

n>30

. No entanto, se o tamanho da amostra grande

concluir que a distribuio de

X , aproximadamente

Teorema 3: Consideremos uma amostra aleatria, (

X1

N ( ; ) . Seja

podemos

N ( 0 ;1 ) .

X2

, ...,

Xn

) , de distribuio

. A princpio a

a varincia amostral dada por

( X i X )

S 2= i=1

n1

. Ento

9
n

( n1 ) S
2

( X i X )

tem distribuio Qui-quadrado com ( n1 ) graus de

i=1

liberdade.
A partir deste teorema podemos deduzir facilmente a mdia e varincia de s2.

Teorema 4: Consideremos uma amostra aleatria, (

N ( ; 2 ) . Seja S 2 a varincia amostral. Ento

X1

X2

, ...,

Xn

) , de distribuio

24
2
E ( S 2 )= 2 e Var ( S )=
n1

Os mecanismos mais usuais para "inferir" alguma coisa sobre estes parmetros so:

Estimao pontual - o objectivo "encontrar" os valores do parmetro desconhecido.


Estimao por intervalos - o objectivo encontrar um intervalo que contenha o

parmetro de interesse com uma probabilidade especificada.


Testes de hipteses - o objectivo criar conjecturas sobre os valores possveis do
parmetro e verificar se, estas conjecturas, so muito ou pouco provveis (isto , testar
as hipteses).
b) Amostragem sem reposio
P= {1 ; 3 ; 5; 6 }

Considere-se a populao

e todas as amostras possveis de tamanho

n=2

extradas sem reposio.


As possveis amostras com as respectivas mdias so:
Amostra
s

(1;3)

1;5)

(1;6)

(3;5)

(3;6)

(5;6)

Mdia

3,5

4,5

5,5

Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:

10

2
3
3,5
4
4,5
5,5

X )
f ( X )=P ( X=

)
X f ( X

X 2 f ( X )

1
6

2
6

4
6

1
6

3
6

9
6

1
6

3,5
6

12,25
6

1
6

4
6

16
6

1
6

4,5
6

20,25
6

1
6

5,5
6

30,25
6

22,5
6

91,75
6

Da tabela segue:
22,25
E ( X ) = X f ( X ) E ( X ) =
=3,75=
6

isto a expectncia (mdia) de todas as

mdias amostrais, extradas sem reposio da populao P, tambm igual a mdia


populacional (parmetro populacional mdia).
91,75
2 N n
2
V ( X )= X 2 f ( X ) 2X V ( X ) =
3,752 V ( X )=1,2292
=1,84375.
6
2 N 1
3

()

isto , a varincia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a
varincia populacional multiplicada pelo factor de correco de populao finita. Este factor,
pode ser considerado como o factor de eficincia da amostragem sem reposio sobre a

amostragem com reposio, que neste caso

( N=4 e n=2 )

vale

2
3 . Como na

amostragem sem reposio no possvel retirar o mesmo elemento duas vezes, as mdias
no podem assumir valores to extremos, como por exemplo, o valor um ou seis que
assumiram na amostragem com reposio. Isto faz com que a erro padro na amostragem
sem reposio seja menor do que na amostragem com reposio.

11

O factor de reduo da varincia na amostragem sem reposio :

N n
N1

Pode-se perceber facilmente que quanto maior for a diferena entre o tamanho da populao e
o tamanho da amostra mais prximo de um ser este factor. Ento, como regra prtica,
pode-se admitir como necessria a correco para a varincia das mdias amostrais sempre
que o tamanho da amostra exceder a 5% do tamanho da populao. Caso isto no ocorra no
necessrio fazer-se a distino entre os dois procedimentos (com e sem reposio).
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para
representar a distribuio das mdias amostrais. Neste caso necessrio procurar por
modelos probabilsticos que descrevam a distribuio da mdia amostral. Neste caso,
tambm, como declarado acima a distino entre amostragem com e sem reposio no ser
necessrio, pois o factor de correco ser aproximadamente um e no necessitar ser
utilizado.
Os modelos probabilsticos so conhecidos a partir dos dois seguintes resultados:
a)

( X 1 ; X 2 ; X n ) uma amostra aleatria de uma populao com distribuio

Se

normal de mdia

e desvio padro

, ento a mdia da amostra

( X ) ter

uma distribuio tambm normal com a mesma mdia da populao e com desvio
padro (erro padro) raiz de n vezes menor que o desvio padro da populao,
isto :
Se

N ( ; ) ento,

ser

N ;

b) Teorema Central do Limite


Se

( X1 ; X2 ; Xn)

distribuio de mdia

uma amostra aleatria extrada de uma populao com qualquer

e desvio padro

, ento a mdia da amostra

(X)

ter uma

distribuio aproximadamente normal com a mesma mdia da populao e com desvio

12

padro (erro padro) raiz de n vezes menor que o desvio padro da populao medida que
o tamanho da amostra aumenta.
Observao: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente
boa, para se poder utilizar este resultado.
Assim:
X

Se

N ;

tem qualquer distribuio ento

X ter uma distribuio aproximadamente

para n grande ( n 30 ) .

Exemplos:
1. Uma populao

X tem uma distribuio normal de mdia 100 e desvio padr o 10 .

P ( 95< X <105 ) ?

a) Qual

(b) Se

a mdia de

16

elementos extrada desta populao, qual a

P ( 95< X <105 ) ?

Soluo:
Como
a)

X uma

N (100 ; 10 ) , vem:

P ( 95< X <105 ) =P (0,5< Z <0,5 ) ( 0,5 ) (0,5 ) =0,69150,3185=38,30 .

Neste caso, X uma N (100 ; 2,5 ) .

b) P ( 95< X <105 )=P (2< Z <2 ) ( 2 ) (2 )=0,97720,0228=95,44 .

2. A renda de um conjunto de pessoas de uma certa regio tem mdia


padro de 2 s . m . Se desta populao for extrada uma amostra de

6 s .m e desvio

n=100 pessoas, qual

a probabilidade de a mdia desta amostra acuse um valor superior a 6,3 s . m ?

13

Soluo:
Neste caso, como no foi declarado que a populao normal necessrio aplicar o teorema
central do limite, uma vez que

n=100>30 , isto possvel. A mdia da amostra ter uma


6 s .m

distribuio aproximadamente normal com mdia

2
=0,2
, uma vez que o erro padro da mdia raiz de
100

e desvio padro de:

vezes menor do que o

desvio padro populacional. Ento, a probabilidade pedida ser:

( (

P ( X >6,3 )=P Z >

6,36
P ( Z >1,5 )= (1,5 ) =6,68
0,2

))

Isto , apenas 6,68% das

mdias de amostras de tamanho n=100 apresentaro um valor superior a 6,3 s . m .

2.2 Distribuio amostral da varincia


a) Amostragem com reposio
Considere-se a populao
n=2

P={1; 3 ; 5 ; 6 }

e todas as amostras possveis de tamanho

extradas com reposio. Para cada amostra vai-se calcular a varincia. Ter-se-

assim um conjunto de

16

valores que sero dispostos em uma tabela, com as respectivas

probabilidades, e que constituir ento a distribuio amostral da varincia.


As possveis amostras com as respectivas varincias so:
Amostra
s
Mdias
S2

(1;1)
1

(1;3)
2

(1;5)
3

(1;6)
3,5

(3;1)
2

(3;3)
3

(3;5)
4

(3;6)
4,5

12,5

4,5

(5;1)

(5;3)

(5;5)

(5;6)

(6;1)

(6;3)

(6;5)

(6;6)

Amostra
s

14

Mdias
S2

5,5

3,5

4,5

5,5

0,5

12,5

4,5

0,5

Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem:


S

0
0,5
2
4,5
8
12,5

f ( S2 ) =P ( S 2=S2 )

S2 f (S2)

4
16

0
16

2
16

1
16

4
16

8
16

2
16

9
16

2
16

16
16

2
16

25
16

59
16

Pela tabela segue que:

E ( S 2 )= S 2 f ( S 2 )

59
=3,6875= 2 , isto a expectncia (mdia) de todas as varincias
16

das amostras de tamanho

n=2 , extradas com reposio da populao P, igual a

varincia populacional
(parmetro populacional varincia). Em outras palavras, pode-se dizer que quando a
amostragem com reposio a varincia amostral

S 2 um estimador no tendencioso da

2
varincia populacional .

Desta forma, sempre que se desejar estimar a varincia de uma populao onde as amostras
foram retiradas com reposio, pode-se usar a varincia amostral como estimador.

15

b) Amostragem sem reposio

Considere-se a populao

P={1; 3 ; 5 ; 6 }

e todas as amostras possveis de tamanho

n=2 obtidas sem reposio.

As possveis amostras com as respectivas varincias so:


Amostra
s
Mdias
S2

(1;3)
2

(1;5)
3

(1;6)
3,5

(3;5)
4

(3;6)
4,5

(5;6)
5,5

12,5

4,5

0,5

Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem:


S

0,5
2
4,5
8
12,5

E= S f ( S ) E=

f ( S2 ) =P ( S 2=S2 )

S2 f (S2)

1
16

0,5
6

2
6

4
6

1
6

4,5
6

1
6

8
6

1
6

12,5
6

29,5
2
3,6875=
6

das amostras de tamanho

29,5
6

isto a expectncia (mdia) de todas as varincias

n=2 , extradas sem reposio da populao finita

P , no

igual a varincia populacional (parmetro populacional varincia). Neste caso, para que se

16

obtenha um estimador no tendencioso da varincia populacional necessrio corrigir a


N 1
N

varincia amostral atravs do factor

multiplicada por este factor, que neste caso ser,


S^ 2

0,375
1,500
3,375
6,000
9,375

. Assim se cada varincia acima for

N 1
=0,75
N=3
4

ento, se ter:

f ( S^ 2 ) =P ( S^ 2= ^S2 )

S^ 2 f ( S^ 2 )

1
6

0,375
6

2
6

3,000
6

1
6

3,375
6

1
6

6,000
6

1
6

9,375
6
22,125
6

22,125
E ( S^ 2 )= S^ 2 f ( S^ 2 )
=3,6875= 2
6

isto a expectncia (mdia) de todas as

varincias corrigidas igual ao parmetro populacional 2. Assim quando a populao


pequena e amostragem for sem reposio necessrio corrigir a varincia da amostra pelo

factor

N 1
, para que ela seja um bom estimador da varincia populacional. claro que
N

esta correco s ser importante para populaes pequenas. Se a populao for grande, por

exemplo, N=1000

, ento o factor

N 1
=0,999
N=999
o que aproximadamente 1. Neste
1000

17

caso, no necessrio usar esta correo e a amostragem sem reposio pode ser considerada
equivalente a com reposio para efeitos de estimao da varincia populacional.
Evidentemente as consideraes acima valem para populaes pequenas. Se a populao
bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para
representar a distribuio das varincias amostrais. Neste caso necessrio procurar por
modelos probabilsticos (funes) que descrevam a distribuio da varincia amostral. Para a
2
varincia este modelo existe e denominado de distribuio Qui-quadrado ( ) .

2.3 Distribuio amostral da proporo


a) Amostragem com reposio
Considere-se a populao
n=2

P={1; 3 ; 5 ; 6 }

e todas as amostras possveis de tamanho

obtidas com reposio. Para cada amostra vai-se calcular a proporo P de

elementos pares na populao.


Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as
respectivas probabilidades, e que formaro ento a distribuio amostral da proporo.
As possveis amostras com as respectivas propores so:
Amostra
s
P
Amostra

(1;1)
0

(1;3)
0

(1;5)
0

(1;6)
0,5

(3;3)
0

(3;5)
0

(3;6)
0,5

(5;5)
0

s
P

(5;6)
0,5

(6;6)
1

(3;1)
0

(5;1)
0

(6;1)
0,5

(5;3)
0

(6;3)
0,5

(6;5)
0,5

Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem:


P

f ( P )=P ( P= p )

Pf ( P )

P2 f ( P )

0,0

9
16

0
16

0
16

0,5

6
16

3
16

1,5
16

1
16

1
16

1
16

18

4
16

2,5
16

Pode-se ento calcular a expectncia e a varincia:


E ( P )= pf ( p )

4
=0,25= , isto o valor esperado (mdia) de todas as propores
16

amostrais, extradas com reposio da populao


(parmetro populacional

P , e igual a proporo populacional

). Isto significa, que o estimador

tendencioso (ou no viciado) da proporo populacional

um estimador no

, quando as amostras so

extradas com reposio da populao.


V ( P )= P f ( p ) p
2

( 1 )
2,5
2
0,25 =0,09375=
16
n

isto , a varincia entre as

propores amostrais n vezes (neste caso 2 vezes) menor que a varincia


populacional. Isto porque quando se est trabalhando com propores, pode-se mostrar que a
varincia populacional igual a ( 1 ) .
P=

O valor

( 1 )
=0,09375
n

denominado erro padro da proporo. Ele mede a

variabilidade entre as propores amostrais e d uma ideia do erro que se comete ao se


substituir a proporo da populao pela proporo da amostra.
Amostragem sem reposio
Considere-se a populao

P={1; 3 ; 5 ; 6 }

e todas as amostras possveis de tamanho

n=2 extradas sem reposio.

As possveis amostras com as respectivas propores so:


Amostra
s
P

(1;3)

(1;5)

(1;6)

(3;5)

(3;6)

(5;6)

0,5

0,5

0,5

19

Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem:


f ( P )=P ( P= p )

0,5

0,5

0,5

E ( P )= pf ( p )

Pf ( P )

P2 f ( P )

0
2

0
2

0,5
2

0,25
2

0,5
2

0,25
2

0,5
=0,25=
, isto a expectncia (mdia) de todas as propores
2

amostrais, extradas sem reposio da populao


(parmetro populacional

P , e igual a proporo populacional

). Isto significa, que o estimador

tendencioso (ou no viciado) da proporo populacional

um estimador no

, quando as amostras so

retiradas sem reposio.


V ( P )= P2 f ( p ) P2

( 1 ) N n
0,25
0,252=0,0625

2
2
N 1

isto , a varincia entre as propores amostrais n vezes (neste caso

vezes)

menor que a varincia populacional multiplicada pelo factor de correco de populao finita.
Este factor, pode ser considerado como o factor de eficincia da amostragem sem reposio
sobre a amostragem com reposio que, neste exemplo, ( N=4 ;n=2 ) vale

2
3 .

Evidentemente as consideraes acima valem para populaes pequenas. Se a populao


bastante grande ou infinita, no mais ser possvel pensar em construir tabelas para
representar a distribuio das propores amostrais. Nesta situao necessrio procurar por
modelos probabilsticos que descrevam a distribuio da proporo amostral. Neste caso,
tambm, como declarado acima a distino entre amostragem com e sem reposio no ser

20

necessria, pois o factor de correco ser aproximadamente um e no precisar ser


utilizado.
O modelo probabilstico para a proporo amostral dado pelo seguinte resultado:
a) Se

( X1 ; X2 ; Xn)

uma amostra aleatria retirada de uma populao com

proporo ,
ento a distribuio da proporo amostral ser aproximadamente normal com mdia

P=

e desvio padro P=

( 1 )
n

Observao:
Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, para se
poder utilizar este resultado. Para amostras pequenas a distribuio da proporo amostral
Binomial.
Exemplo:
1.

A proporo de eleitores do candidato D. M. A. Gogo numa certa regio de 20%.


Extrada uma amostra de 100 eleitores desta regio, qual a probabilidade que ela

apresente um nmero de eleitores do candidato


a) Abaixo de 15%
b) Superior a 30%
Soluo:
n>30

Como

P=

( 1 )
n

pode-se usar a distribuio normal com mdia

P=

0,2 ( 10,2 )
=0,04=4
100

Ento:
a)

P ( P<15 )=P ( Z<1,25 )= (1,25 )=10,56

b)

P ( P>30 )=P ( Z >2,5 ) = (2,5 ) =0,62 .

= =20

e desvio padro

21

3. Estimao
A inferncia estatstica tem por objetivo fazer generalizaes sobre uma populao com base
em valores amostrais. A inferncia pode ser feita estimando os parmetros:
(a) Por ponto
(b) Por intervalo.
A estimao por ponto feita atravs de um nico valor, enquanto que a estimao por
intervalo
fornece um intervalo de valores em torno do valor da estimativa pontual.
Exemplo:
Uma amostra aleatria simples de

400

pessoas de uma cidade extrada e

300

respondem que acham a administrao municipal boa ou tima. Ento o valor


P=

300
=75
400

uma estimativa por ponto do percentual de pessoas da cidade que acham a

administrao boa ou ptima. Esta mesma estimativa poderia ser enunciado como de:
70 a 80

das pessoas da cidade acham a administrao boa ou tima. Neste caso, teramos

uma estimativa por intervalo da proporo. Note-se que o centro do intervalo o valor
75 da estimativa pontual.

Propriedades dos estimadores


Consideremos uma populao com um parmetro de interesse
Xn

e seja ( X 1 , X 2 , ...,

uma amostra aleatria extrada desta populao. Sendo

um estimador do

parmetro , ento:
(i) Se

E ( ^ ) =^

diz-se que

um estimador centrado, no-tendencioso ou no

viciado do parmetro populacional .


(ii) Se

um estimador no tendencioso de um parmetro

, diz-se que

consistente se medida que o tamanho da amostra aumenta a variabilidade do estimador

22

diminui, isto , as observaes vo ficando cada vez mais concentradas em torno do


parmetro na medida em que a amostra vai ficando cada vez maior, ou seja

(iii) Um estimador

de um parmetro

lim Var ( ^ )=0.

diz-se suficiente se transporta toda a

informao da amostra.
(iv) Um estimador

centrado de um parmetro q diz-se eficiente se a sua varincia

mnima.
Seja

uma varivel aleatria de uma populao com mdia

uma proporo

e seja (

X1

X2

, ...,

Xn

, desvio padro s e com

) uma amostra aleatria simples extrada

desta populao. Ento:

P um estimador centrado e consistente da proporo populacional

S2

um estimador centrado e consistente da mdia da populao

estimador centrado e consistente da varincia da populao

p .

2 , a menos que a

extraco seja sem reposio de populao finita. Neste caso, o estimador

S ' 2=

n1 2
S
n
n

X i ; i=1; ; n

Sendo

Variveis aleatrias normais independentes ento

S n= X i
i=0

Xi

X n = i=0
n

so ainda variveis normais.

3.1 Estimao por ponto


Seja

uma populao com mdia

seja (X 1, X 1 , , X n )

, desvio padro e com uma proporo

uma amostra aleatria simples extrada desta populao. Ento:

23

(a)

(b)

P um estimador no-tendencioso e consistente da proporo populacional

um estimador no-tendencioso e consistente da mdia da populao

2
(c) S estimador no-tendencioso e consistente da varincia da populao

.
.

2 , a menos

que a
extrao seja sem reposio de populao finita. Neste caso, o estimador

N1 2
2
S^ =
S
.
N

Mtodos para se encontrar estimadores pontuais: mtodos dos momentos e mtodo da


mxima verossimilhana
Mtodo dos Momentos
Seja

'

r o r-simo momento de X. Em geral,

parmetros desconhecidos
'

Seja m r

'

ser uma funo conhecida dos

1 ; 2 ; k
k

1
'
r
xi
o r-simo momento amostral, isto : m r = n
i=1

O mtodo dos momentos consiste em se resolver as k

equaes

m'r =' j , j=1 ; 2 ; 3 ; k

Observao:
'
O primeiro momento amostral m 1 representado por

x .

Mtodo da Mxima Verossimilhana


Definio : Funo de Verossimilhana A funo de verossimilhana de n v: a:
X1 ; X2 ; Xn

definida como sendo a densidade conjunta das n v:a:,

, que considerada como sendo uma funo de


uma amostra aleatria de uma

. Em particular, se

f ( x 1 ; x 2 ; xn ; )
X1 ; X2 ; Xn

24

densidade

f ( x; ) ,

ento

funo

de

verossimilhana

L ( ; x 1 ; x 2 ; x n) =f ( x 1 ; ) f ( x 2 ; ) f ( x n ; )

Estimador de verossimilhana
L ( )=L ( ; x 1 ; x2 ; x n )

Seja
Se

o valor de

a funo de verossimilhana das v:a:

que maximiza

mxima verossimilhana de

verossimilhana de para amostra

L ( ) ento

^ ( X 1 ; X 2 ; X n )

^ ( x 1 ; x 2 ; x n )

x1 ; x2 ; xn

X1 ; X2 ; Xn

o estimador de

a estimativa de mxima

Os mais importantes que consideraremos so aqueles que

X1 ; X2 ; Xn

formam uma

f ( x1 ; ) f ( x2 ; ) f ( xn ; ) .
amostra aleatria de uma densidade f ( x ; ) de tal modo que
Ento, o estimador de mxima verossimilhana a soluo da equao
Alm disso,

L( )

log L ( )

dL ( )
=0
d

possuem seus mximos para o mesmo valor de

,e

muitas vezes mais fcil encontrar o mximo do logaritmo da funo de verossimilhana.


Se a funo de verossimilhana contm

parmetros

1 ; 2 ; k

os estimadores de

mxima verossimilhana sero a soluo das k -equaes:

L ( 1 ; 2 ; k )
=0
1
L ( 1 ; 2 ; k )
k

L ( 1 ; 2 ; k )
=0
2

=0

3.2 Estimao por intervalo


O estimador por ponto no permite ter uma idia do erro cometido ao se fazer a estimativa do

25

parmetro. Para que se possa associar uma confiana (probabilidade) a uma estimativa
necessrio construir um intervalo em torno da estimativa por ponto. Este intervalo
construdo baseado na distribuio amostral do estimador.
4. Da mdia populacional

a) Desvio padro populacional ( ) conhecido


O intervalo de confiana para a mdia ( ) de uma populao construdo em torno da
estimativa pontual

X . Para construir este intervalo fixa-se uma probabilidade 1

de que o intervalo
construdo contenha o parmetro populacional. Desta forma, ser a probabilidade de que
o intervalo obtido no contenha o valor do parmetro, isto , ser a probabilidade de
erro. Sabe-se que a mdia da amostra tem distribuio normal de mdia

e desvio padro

n
se a populao de onde for extrada a amostra for normal (ou se a amostra for superior a
30

e retirada de qualquer populao ) de mdia

e de desvio padro

, pode-se

ento utilizar a curva normal para estabelecer os limites para o intervalo de confiana.
Lembrando que o que se quer um intervalo que contenha o parmetro populacional

com
probabilidade 1
Z < Z < Z
2

Mas

Z=

, onde

( X)

tem-se ento:
Z
2

o valor da normal padro com rea direita igual a

substituindo na expresso acima vem:

2 .

26

Z <

( X )

<Z =1

2
. Trabalhando esta desigualdade, segue que:
n
P

X Z
< < X + Z
=1
2 n
2 n
. Que o intervalo procurado. Assim o intervalo
P
de confiana (probabilidade) de 1

Z ; X + Z
X
2 n
2 n

para a mdia de uma populao dado por:

onde:

a estimativa por ponto da mdia da populao.

o desvio padro da populao e

Z
2

o valor da distribuio normal padro cuja rea direita igual a

2 , isto , o

valor de
Z

tal que:

P( Z> Z )=
2

Z =
2
2 , ou ento:
2

Exemplo:
10

Uma populao tem um desvio padro igual a

e mdia desconhecida. Uma amostra de

tamanho
n=100

retirada e fornece uma mdia

X =50 . Qual o intervalo de 95% de confiana

para a mdia desta populao?.


Soluo:

=5 e =2,5
Tem-se 1 =95 , ento
2
buscado na normal padro valor

Z
2

. O coeficiente de confiana que deve ser

de Z

tal que:

27

P Z >Z =2,5

Este valor vale

, ou ento:

Z =2,5

1,96 . Ento o intervalo de confiana de

95

para a mdia desta

populao
ser:

][

Z ; X + Z = 501,96. 10 ; 50+1,96. 10 =[ 501,96 ; 50+1,96 ]= [ 48,04 ; 51,96 ]


X
10
10
2 n
2 n

, ou seja, pode-se afirmar com uma certeza de 95

de que este intervalo conter

a mdia desta populao.


Obs.: O valor

valor

2 n

=Z

denominado de erro padro da estimao. No confundir com o

que o erro padro da amostragem. O erro padro da estimao a semi-

amplitude do intervalo de confiana. A amplitude do intervalo de confiana ( IC ) ser;


2 .

b) Desvio padro populacional ( ) desconhecido


Quando o desvio padro da populao ( ) desconhecido necessrio utilizar sua
estimativa
s. S que ao substituir-se o desvio padro populacional pelo sua estimativa no quociente:
( X )

no se ter mais uma normal padro. De fato, conforme demonstrado pelo

estatstico
ingls W. S. Gosset, conhecido por Student o comportamento do quociente:

28

( X )
S
n

segue uma distribuio simtrica em torno de zero, porm com uma

variabilidade maior do que a da normal padro. A distribuio do quociente acima


conhecida como distribuio t de Student.
Na realidade existem infinitas distribuies t, uma para cada tamanho de amostra. Estas
distribuies a exemplo da normal padro encontram-se tabeladas.
A tabela para a distribuio t segue uma metodologia um pouco diferente daquela da
normal
padro. De fato, como existem muitas distribuies de Student no seria possvel tabel-las
da mesma
forma que a da normal padro. Assim cada linha de uma tabela representa uma distribuio
diferente e

cada coluna representa um valor de confiana que poder ser ou 2 , isto , a


tabela poder ser
unilateral ou bilateral. A linha de cada tabela fornece a distribuio t com parmetro
n1 denominado de graus de liberdade, isto , o grau de liberdade =

v =n1=

linha da tabela.
Neste caso, o intervalo de confiana com probabilidade 1

t S ; X + t S
X
2 n
2 n

para a mdia ser:

onde:

a estimativa por ponto da mdia da populao;

o desvio padro da amostra e uma estimativa do desvio padro da populao

o valor da distribuio t

cuja rea direita igual a

tal que:
P(t> t )=
2

Exemplo:

P(t <t< t )=1


.
2 , ou ento:
2
2

t
2 , isto , o valor de

29

25

Uma amostra de tamanho

foi retirada de uma populao com o objetivo de estimar a

sua mdia e forneceu os valores

X =50

s=10 . Qual o intervalo de

95

de

confiana para a mdia desta populao?


Soluo:
1 =95 , ento =5

Tem-se

buscado na distribuio

com

=2,5
. O coeficiente de confiana que deve ser
2

v =n1=251=24 . Esta a linha da tabela. A coluna

poder ser o
valor

=5

ou ento o valor

=2,5
, dependendo do tipo de tabela. Em qualquer
2

caso o que se procura o valor t com grau de liberdade igual a


t 24

24 , isto , o valor

tal que:

P t <t 24 <t =95

Este valor vale 2,064 . (Note-se que na a normal este mesmo valor valia

1,96 ). Ento o

intervalo
de confiana de 95

para a mdia desta populao ser:

][

t S ; X + t S = 502,064. 10 ; 50+2,064. 10 =[ 504,13 ; 50+4,13 ] =[ 45,87 ; 54,13 ]


X
5
5
2 n
2 n

, ou seja, pode-se afirmar com uma certeza de

95

de que este intervalo conter a mdia

desta populao.
Convm notar que a ltima linha da tabela da distribuio t apresenta valores
coincidentes com aqueles que seriam obtidos se fosse utilizado a distribuio normal padro.
Isto ocorre porque a distribuio t tende a distribuio normal medida que o tamanho

30

da amostra aumenta, isto , a distribuio normal o limite da distribuio t quando o


tamanho da amostra tende ao infinito.
Esta aproximao j ser bastante boa para amostras de tamanho
amostra for superior a

30

n>30 . Assim se a

pode-se utilizar a distribuio normal ao invs da distribuio

t , isto , pode-se ler os valores na normal padro, ou ento na ltima linha da tabela

t .

5. Intervalos de confiana
Eis outra maneira de calcularmos uma estimativa de um parmetro desconhecido. Vamos
construir um intervalo de confiana para o parmetro desconhecido com uma probabilidade

( 1 ) (nvel de confiana) de que um intervalo contenha o verdadeiro parmetro.


Observem que ( 1 )
Desta maneira

pode ser igual a 99 ; 95 ; 90 ; 80 ; etc .

ser o nvel de significncia, isto , o erro que estamos cometendo ao

afirmarmos que, por exemplo,

95

das vezes o intervalo

^ 1 << ^ 2

contm

ser de

5.

Tipos de intervalos de confiana


Intervalo de confiana para a mdia populacional quando a varincia populacional
conhecida;
Intervalo de confiana para a mdia populacional quando a varincia populacional
desconhecida;
Intervalo de confiana para proporo populacional;
intervalo de confiana para a varincia populacional.

5.1 Intervalo de confiana para a mdia populacional quando a varincia populacional


conhecida

31

Tabela de distribuio Normal Padro

Exemplo
Seja

a durao de vida de uma pea de equipamento que tem distribuio normal com

desvio padro

=5 horas . Admita-se que

durao mdia de
populacional
Soluo:

100

peas foram ensaiadas fornecendo uma

X =500 horas e que se deseje obter um intervalo de

95

para a mdia

32

n=100; X=500
; =5 ; (1 ) =95 ; z=1,96
Os intervalos de confiana so:
Li=5001,96

5
=499,02 ;
100

Ls=500+1,96

5
=500,98
100

Logo, o intervalo de 95

de confiana para a mdia populacional

IC [ ; 95 ] =[ 499,02; 500,98 ]
95

Assim, podemos dizer que


verdadeira mdia

das vezes, o intervalo

[ 499,02 ; 500,98 ]

contm a

b) Se no conhecemos a distribuio de

central do limite, que diz:

Assim, o intervalo de

( 1 )

X , ento para

n>30 , utilizaremos o termo

( )

N ;

, quando n .

de confiana para a mdia populacional

de forma

IC [ ; ( 1 ) ] =[ Li ; Ls ]
Em que:

Li= X - Z
n

Ls= X + Z
n

, o limite inferior do intervalo de confiana mdia populacional;

, o limite superior do intervalo de confiana mdia populacional.

33

5.2 Intervalo de confiana para a mdia populacional quando a varincia populacional


desconhecida

Assim, a estatstica

t t (n1)

, isto , a estatstica

tem uma distribuio

tstudent

com n1 graus de liberdade.


Assim, o intervalo ( 1 )
IC [ ; ( 1 ) ] =[ Li ; Ls ]

de confiana par a mdia populacional

de forma

em que:

Li= X

t (n 1 )

S
n

, o limite inferior do intervalo de confiana mdia populacional;

Ls= X

+t (n1)

S
n

, o limite superior do intervalo de confiana mdia populacional.

Sendo

t ( n1)

o valor da tabela tstudent

com n1 grau de liberdade e erro .

34

Exemplo:
Suponha que se extraia uma amostra de tamanho 25 de uma populao com mdia

desvio padro desconhecido. Suponha que a mdia amostral seja 4,004 e o desvio padro
amostral seja 0,366. Determinar intervalos com 95% e 99%de confiana para

Solucao:
Temos que

t 0,025;24 =2,064

L1=4,0042, o 64.

0,366
=3,853
25

L2=4,004 +2, o 64.

0,366
=4,155
25

Logo, o intervalo com 95% de confiana para


Analogamente, temos que

[3; 853; 4; 155].

t 0,005;24 =2,797

L1=4,0042,797.

0,366
=3,799
25

L2=4,004 +2,797.

0,366
=4,209
25

Logo, o intervalo com 95% de confiana para

[3; 799; 4; 209].

35

36

b) Se no conhecemos a distribuio de
central de limite e o intervalo de
forma

( 1 )

X , ento, para

n>30 , utiliza-se o teorema

de confiana para a mdia populacional

da

IC [ ; ( 1 ) ] =[ Li ; Ls ] em que:

Li= X

t (n 1 )

S
n

, o limite inferior do intervalo de confiana mdia populacional;

Ls= X

+t (n1)

S
n

, o limite superior do intervalo de confiana mdia populacional.

5.3 Intervalo de Confiana para Proporo Populacional

37

5.4 Intervalo de Confiana para a Varincia Populacional

Anexo

38

6. Distribuio amostral da diferena entre duas mdias (ou distribuio de


probabilidades da diferena entre duas mdias amostrais)
Considere duas amostras aleatrias
(

XA1

XA2

, ...,

XA

X B1

X B2

, ...,

XB

nA

nB

)
)

39

nA

Com

nB

AeB ,

elementos, obtidas independentemente de duas populaes


A

normalmente distribudas com mdias

e varincias

B =

respectivamente.
Sejam:
nA

X A =

XA
nA

i=1

nB

X B =

i=1

XB
nB

7. Distribuio da diferena de mdias amostrais


Considere duas amostras aleatrias
X A X A ; :; X A
1;

X B X B ; : ; X B
1;

com

nA

nA

nB

nB

elementos, obtidas independentemente de duas populaes A e B,


A

normalmente distribudas com mdias


nA

X A =

2
e varincias A

nB

xA
i=1

nA

xB

e X A= i=1
nB

as mdias respectivas das duas amostras.


Temos ento que:
X A X B

A 2 B2
N ( A B ,
+
) Portanto,
nA nB

Temos tambem
(n A 1) s A
2
A

Xn

2
A1

(n 1) s
,e B 2 B
B

Xn

2
B1

Logo
(n A 1) s A 2 (n B1) s B2
+
X n 2+ Xn
2
2
A
B
A

2
A+n B 2

( X A X B )( A B )

A B
+
n A nB

N ( 0,1)

B2= 2

40

Pela definio da distribuio t-student, e considerando A

B =

temos que:

( X A X B ) ( A B )

1 1
+
n A nB
2

( n A 1 ) s A +(nB 1) s B

tn

A+n B2

n A +n 2
B

Distribuicao F

Considere duas v:a: independentes Y e Z tais que Y possua uma distribuio


m graus de liberdade, e Z possua uma distribuio

X 2 com

X 2 com n graus de liberdade.

Suponha que uma v.a. X seja definida por


Y
M nY
=
X= Z mZ
N
Ento a distribuio de X denominada distribuio F com m e n graus de liberdade.
Propriedade da distribuio F:
Se uma varivel aleatria X possui uma distribuio F com com m e n graus de liberdade,

ento

8.

1
X

possui uma distribuio F com com n e m graus de liberdade.

Distribuio da Razo entre duas Varincias Amostrais


X1 ; X2 ; ; Xn

Suponha que

formem uma amostra aleatria de m observaes de

uma distribuio normal com mdia


Y 1; Y 2 ; ; Y n

com mdia

e varincia

12

desconhecidos, e suponha que

formem uma amostra aleatria de n observaes de uma distribuio normal


e varincia 2

desconhecidos. Sabemos que

41
m

(X i X )2
i=1

s12
21

Logo

(m1)s1

S22

(Y iY )2

2
m1

i=1

2
2

(n1)S 22

X 2n1

Fm 1,n1 se 1=

Ento

s1
F m1,n1
2
S2

22
Exemplo:
Suponha que uma amostra de tamanho 6 seja retirada de uma populao normalmente
distribuda com mdia

e varincia 30, e que uma amostra de tamanho 3 seja retirada de


2

uma outra populao normalmente distrbuda com mdia

e varincia 76. Qual a

2
2
probabilidade de s 1 > s 2 ?

Soluo:
s

( )

( )
s

2
1
2
1
2
2
2
2

2
P( s 1> s 2 =P s 2 >1 =P s > 2
2
1

Intervalo de Confiana para a Varincia Populacional

Vimos que
(n1)S 2 2
X n1
2
Logo, podemos determinar pela tabela da distribuio
X2

, [ n1]
2

( )
1

X2

e X2

(1 2 ),[ n1]

, [ n1 ]

(n1)S
X2
=1
2
, [ n1 ]

ou seja

X 2 com n-1 g.l., os nmeros

42

(n1)S 2 2 (n1) S2
2
=1 ,
2
X
X
2

(1 2 ), [ n1 ]

, [ n1]

( n1)S 2 (n1) S 2
, 2
2
X
X

(1 2 ) ,[ n1 ]

, [ n1]

portanto o intervalo

2
um intervalo de confiana para com coeficiente de confiana ( 1 .

Exemplo:
Suponha que seja retirada uma amostra de tamanho cinco de uma populao normalmente
distribuida, e que se tenha encontrado uma varincia amostral de 13,52.
Construa um intervalo com 95% de confiana para a varincia populacional.
Soluo:
Temos que

X 20,975 ;4 =0,48 e X 20,025 ;4 =11,143 . Portanto, os limites inferior e

2
superior do I.C. de 95% para so:

L1 =

(n1)S 2 4 (13,52)
=
=4,83
11,143
X2
2

, [ n1 ]

L2 =

( n1) S
4(13,52)
=
=111,74
2
0,484
X

(1 2 ), [ n1]

2
Portanto,P(4,85 111,74 =0,95

9. Intervalo de Confiana para a diferena de mdias de duas Populaes


2

Varincias 1 e
Como

2
2

Conhecidas

43

11
X
N (0,1)
1

n1

22
X
N (0,1)
2

n2

Logo
X

( 1 X 2)( 1 2)

1 2
+
n1 n 2

N ( 0,1)

Portanto o intervalo de confiana para

12

com coeficiente de confiana 1

dado por
X
X
( 1 X 2)+ Z
2

1 2
+
,
n1 n2

21 22
(1 X 2)Z
+
,
n1 n2
2

2
2
2
2
2- 1 e 2 Desconhecidas mas 1 = 2

Vimos que

44

x
n
n
( 21) S 22
n1+ n22

( 1 x 2)( 12 )

( 11) S 21 +

1 1
+
n1 n 2

Logo, o intervalo de confiana para


confiana 1-

12

, quando

21

22 , com coeficiente de

dado por

x
n
n
( 21) S 22 1 1
2
( 11) S 1 +
.
+
n1+ n22
n1 n 2

( 1 x 2) t , [ n 1+ n22 ] .

Exemplo:
Uma amostra de 10 lmpadas eltricas, da marca A, apresentou a vida mdia de
1400 horas e desvio padro de 120 horas. Uma amostra de 20 lmpadas eltricas,
da marca B, apresentou a vida mdia de 1200 horas e o desvio padro de 100 horas.
Supondo que

A = B

determinar os limites de confiana de a) 95% e b) 99% para

a diferena entre as vidas mdias das populaes das marcas A e B.


Soluo:
a) Para 1= =0,95 1 tem-se que
A B

ser:

t 0,025,28 =2,048

. Portanto, o I.C. de 95% para

45

9(120)2 +19(100)2
1 1
14001200 2,048.
.
+
=(200 67,77)
28
10 20

Ou seja
A B 291,43 =0,99

P(108,57

2
2
10. Intervalo de Confiana para Razo das Varincias 1 / 2

Vimos que
S21
22

Fn 1,n 1

S21

21
Logo, podemos determinar pela tabela da distribuio F com
F

os nmeros

[
[

( 1 2 ), [n 1 ], [n 1 ]
2

e F , [ n21 ] , [ n11 ]
2

S 22
F

, [ n 1] , [ n 1]
(1
2 )
2

21
S 21

F
2

, [ n21] , [ n11 ]

22
1
F
2

, [ n21] , [ n11]

S 21
S 22

21
22

F
2

, [ n21] , [ n11 ]

S 21
S 22

n21 e n11

g.l.,

tal que:

ou

Exemplo:
Duas mquinas A e B produzem parafusos com o mesmo tamanho mdio. Duas
amostras de tamanho

n A =61 e n b=41

= 61 dos parafusos de A e B foram analisadas


2

e os desvios padres amostrais foram S A=3,5 mm e S B =4,5 mm. Determine um


2

intervalo de 95% de confiana para

A
2
B .

46

Soluo:
F0,975,40, 60=

Tem-se que

[
[

1
F 0,025,60,40

1
=O ,556 e F0,025,60,40 =1,74
. Logo
1,80

2
3,5 A
3,5
P 0,556.
2 1,75.
=0,95
4,5 B
4,5

P 0,432

1,353 =0,95

11. Intervalo de Confiana para uma Proporo


Admita-se que uma populao infinita e que a probabilidade de ocorrncia de um evento
(denominado de sucesso) seja p. Considerem-se todas as amostras possveis de tamanho n
extraidas da populao e, para cada amostra, determinaremos a proporo

^p

de sucessos.

Vimos que
E( ^p )= p
Var ( ^p )=

p(1 p)
n

Vimos tambem que para grandes valores de n, a distribuiop de

^p N p

p(1 p)
n

(
2

p(1p)
p(1p)
^p + Z p
n
n
2

Para n grande, em geral substitui-se

P ^pZ
2

uma normal, isto

Portanto, o intervalo de confiana para p, com coeficiente 1


^pZ p

^p

dado por:

)
p por

^p , resultando em:

^p (1^p )
^p (1 ^p )
p ^p +Z
=1
n
n
2

11.1 Intervalo de Confiana para Diferena de Propores

47

Sejam duas propores

p1 e p 2

baseadas em amostras de tamanhos

^p1^p2 N p1 p2 ,

, e suas respectivas propores amostrais


n1 e n2

p(1 p1 ) p(1 p 2)
+
n1
n2

Portanto, o intervalo de confiana para

^p1 e ^p 2

. Para grandes tamanhos de amostra tem-se que:

)
p1 p2

, com coeficiente de confiana

dado por:

( ^p1 ^p2 ) Z
2

^p 1 ( 1 ^p 1 ) ^p2 ( 1 ^p2 )
+
n1
n2

12. A distribuio qui-quadrado


A distribuio ou modelo qui-quadrado pode ser obtida de uma soma de variveis normais
n

Z
padronizadas, isto , n=
i=1
2

A distribuio

2
i

assimtrica positiva (possu uma cauda direita) e de depende do

parmetro
. Sabe-se tambm que:
E ( 2 )=v e que V ( 2 ) =2 v .
2
A comportamento, distribuio de probabilidade, apresentado pela varincia amostral ( S )

est
relacionado com a distribuio (modelo)
2n1=

(n1) S2
2

atravs do seguinte resultado:

, isto , a varincia segue uma distribuio

de liberdade a
menos de uma constante. Neste caso v =n1 .

Tabelas

com " n1 " graus

48

A distribuio

est tabelada em funo do grau de liberdade

tabela) e rea sua direita, isto ,


funo inversa da

n1=v

(linha da

P ( 2> c )= . Na realidade o que est tabelado a

2 , isto , entrando com o valor do parmetro (graus de liberdade) e

uma determinada probabilidade (rea), a tabela fornece um valor da varivel (abscissa) tal
que a probabilidade direita (rea) deste valor seja igual a rea especificada.
O intervalo
Suponha que seja fixado um nvel de confiana de 1
2 tais que

valores da distribuio

e que

P ( 21< 2 < 22 )=1

2 1 e 22

sejam dois

P ( 21< 2 < 22 )=1

P 21 <

( n1 ) S 2 2
< 2 =1
2

1
2
1
<
< 2 =1
2
2
2 ( n1 ) S 1

( n1 ) S 2 2 ( n1 ) S 2
< <
=1
22
21

Assim o intervalo de confiana (probabilidade) de 1

dado por:

( n1 ) S2 ( n1 ) S2
;
22
21

Do desvio padro populacional ()

para a varincia da populao

49

Para determinar um intervalo de confiana de " 1

" de probabilidade para o desvio

padro populacional basta apenas tomar a raiz quadrada positiva dos termos do intervalo para
a varincia populacional.
Assim o intervalo ser:

( n1 ) S2 ( n1 ) S 2
;
22
21

O significado deste intervalo :


P

( n1 ) S 2
( n1 ) S2
<

<
=1
22
21

Exemplo:
2

S =8,38 .

Uma amostra extrada de uma populao normal forneceu uma varincia de


Determinar
90

um intervalo de confiana de

para a varincia da populao e um intervalo de mesma

confiabilidade para o desvio padro da populao.


Soluo.
Neste caso necessrio inicialmente determinar os valores da distribuio

, de modo,

que
21 tenha uma rea (probabilidade) direita igual a 95

tenha uma rea (probabilidade) direita igual a

1=3,940 e 2 =18,307
O intervalo de confiana, para a varincia, ser:

( n1 ) S2 ( n1 ) S2
;
22
21

( 111 ) .8,38 ( 111 ) .8,38


;
18,307
3,940

22
. Estes valores so:

50

[ 4,58 ; 21,27 ]
O intervalo de confiana, para o desvio padro, ser:

( 111 ) .8,38 ( 111 ) .8,38


;
18,307
3,940

[ 4,58 ; 21,27 ]=[ 2,14 ; 4,61 ]

13. Amostragem
A inferncia estatstica consiste em fazer previses a partir de uma parte para o todo,
ou seja, com base na anlise de um conjunto limitado de dados (amostra) recolhidos junto de
um conjunto total de elemento (populao), pretende-se caracterizar a populao. A aplicao
da amostragem possui relevncia pelo facto de facultar a realizao de um estudo em menos
tempo em relao ao censo, visto que, somente alguns dos indivduos so criteriosamente
abrangidos. Aliado a este facto, um estudo feito mediante as tcnicas da amostragem acarreta
menos custos.
Definies
1. Populao - o conjunto dos indivduos de entre os quais se poderia escolher a amostra,
ou seja, o conjunto de elementos que possuem as caractersticas que queremos observar
(DHainaut, 1997).
1.1Finita - quando o nmero de unidades de observao pode ser contado e limitado;
1.2 Infinita - quando a quantidade de unidades de observao ilimitada
Amostra poro ou fraco da populao, retirada segundo algumas tcnicas especficas,
que mantm as mesmas caractersticas da populao.
Amostragem - a operao que consiste em tomar um certo nmero de elementos (ou seja,
uma amostra) no conjunto dos elementos que queremos observar ou tratar (populao).
Parmetro uma medida associada uma caracterstica populacional. Assim se P uma
populao, os principais parmetros so:

51

i. A mdia de P, anotada por

2
ii. A varincia de P, anotada por

iii. O desvio padro de P, anotado por

iv. A proporo de elementos de

que apresentam determinada caracterstica,

anotada por: , entre outros.

Exemplo:
P={1,3, 5,6 } os parmetros acima seriam:

Para a populao
n

xi

= i=1
N

(i)
2=

(1+3+5+6) 15
= =3,75
4
4

xi2 2

N
(1+9+25+36)
(3,752)2
4

2 =

(ii)

17,7514,0625=3,6875 3,69.

= 2
(iv)
(v)

=
1
4

3,69

1,92

25 , onde o numerador representa o nmero de elementos pares na

populao

Estatstica ou estimador uma medida associada uma caracterstica da amostra. So


exemplos de estimadores: mdia amostral, varincia amostral, desvio padro amostral e
proporo amostral. De frisar que, os estimadores so determinados a partir de frmulas.

52

Estimativa um valor particular (nmero) que o estimador assume, ou seja, os resultados


de estimadores chamam-se estimativas.

14. Tamanho de uma Amostra


A qualidade e a validade dos resultados de um questionrio dependem da dimenso da
amostra, ou por outras palavras, o nmero de pessoas/itens a interrogar depende da preciso
desejada. Num grande nmero de casos, mais do que aumentar simplesmente a dimenso da
amostra, o que pode levar a aumentar o nmero de pessoas/itens pertencentes a categorias j
suficientes, h vantagem em construir uma amostra experimental, concebida de forma exacta
em funo das anlises previstas, de forma a evitar amostras inutilmente grandes. A
probabilidade de que amostra seja vlida, se refere ao grau de preciso das caractersticas
retidas, que portanto, determina a dimenso da amostra. Ora, remetemos apenas para as ideias
principais trata se ento, de retirar a uma populao determinada fraco na qual os
diferentes caracteres possuam a frequncia semelhante da populao inicial.
Um dos principais conceitos o erro amostral tolervel, que ser chamado de

E0

. Este

erro o valor mximo que o pesquisador admite ter na estimativa de uma caracterstica da
populao. razovel imaginar que, quanto menor o erro amostral tolervel escolhido, maior
ser o tamanho da amostra necessrio para obt-lo.

53

Isso fica mais claro ao ver a frmula para obteno da primeira estimativa do tamanho de
amostra:
n0 =

1
E20

Onde:

E0

o erro amostral tolervel, e

n0

a primeira estimativa do tamanho de

amostra. Se o tamanho da populao, N, for conhecido, podemos corrigir a primeira


estimativa:
n=

N n 0
N +n0

Exemplo: Obtenha o tamanho mnimo de uma amostra aleatria simples, admitindo com alto
grau de confiana um erro amostral mximo de 2%, supondo que a populao tenha 200
elementos.
Sendo

n0

(a primeira estimativa), e o erro amostral 2% para ambas, podemos calcul-lo

apenas uma vez. Devemos dividir o 2% por 100 antes de substituir na frmula:
n0=

1
1
=2500
2
2
E 0 (0,02)

Ento, nossa primeira estimativa, para um erro amostral de 2%,

retirar uma amostra de 2.500 elementos. Obviamente, precisamos corrigir a primeira


estimativa, pois a populao conta com apenas 200 elementos. Ento:
n=

N n 0 200 2500
=185,185
N +n0 200+2500

Precisamos arredondar, sempre para cima, o tamanho mnimo da amostra. Ento, a amostra
dever ter pelo menos 186 elementos para garantir um erro amostral de 2%.
Determinao do tamanho de uma amostra com base na Estimativa da mdia
populacional
Em muitos casos possvel determinar o tamanho mnimo de uma amostra para estimar um
parmetro estatstico, como por exemplo, a mdia populacional

A frmula para clculo

54

do tamanho da amostra para uma estimativa confivel da mdia populacional ( ) dada


por:

n=

Z /2
E0

Onde: n nmero de indivduos da amostra


Z /2

o valor crtico que corresponde ao grau de confiana desejado

Desvio-padro populacional da varivel estudada


E0

Margem de erro ou erro mximo de estimativa

Z /2=1,65 ( 1 )=90
Z /2=1,96 ( 1 )=95
Z /2=2,0 (1)=95.5

Z /2=2,57 (1)=99

Exemplo : Um economista deseja estimar a renda mdia para o primeiro ano de


trabalho de um Licenciado em Matemtica. Quantos valores de renda devem ser
tomados, se o economista deseja ter 95% de confiana em que a mdia amostral esteja
a menos de 1000,00Mt da verdadeira mdia populacional? Suponha que saibamos,
por um estudo prvio, que para tais rendas , =6250,00 Mt .

Soluo

55

Queremos determinar o tamanho n

da amostra, dado que

95
0,05 de confiana) e

Z / 2=1,96
Desejamos que a mdia amostral seja a menos de
E0=1000.

forma que

Supondo

1000,00 Mt da mdia populacional, de

6250,00 Mt , aplicando a relao acima,

obtemos:

n=

Z /2
E0

)(

1,96 6250 2
=150,0625
1000

150

Determinao do tamanho de uma amostra com base na Estimativa da proporo


populacional
Outro parmetro estatstico cuja determinao afecta o tamanho da amostra a proporo
populacional. Tomemos, como exemplo, a necessidade de determinar a proporo de pessoas
atendidas por uma Unidade de Sade, originrias do municpio de Quelimane. A frmula para
clculo do tamanho da amostra para uma estimativa confivel da proporo populacional (p)
dada por:
Z 2/2 p q
n=
E 20
Onde : p

Proporo populacional de indivduos que pertence a categoria que estamos

interessados em estudar.
q

Proporo populacional de indivduos que no pertence categoria que

estamos interessados em estudar (q=1 p).

E0

- Margem de erro ou erro mximo de estimativa. Identifica a diferena mxima

entre a proporo amostral e a verdadeira proporo Populacional ( p .

56

E se p e q no forem conhecidos?
A Equao anterior exige que se substituam os valores populacionais p e q
amostrais

^p e

e , por valores

q^ . Mas se estes tambm forem desconhecidos, substitumos

^p

e q^

por 0,25 . (Levine, 2000):

Exemplo: Um assistente social deseja saber o tamanho da amostra

necessrio para

determinar a proporo da populao atendida por uma Unidade de Sade, que pertence ao
municpio de Quelimane. No foi feito um levantamento prvio da proporo amostral e,
portanto, seu valor desconhecido. Ela quer ter 90% de confiana que sua o erro mximo de
estimativa seja de 5 (ou 0,05). Quantas pessoas necessitam ser entrevistadas?

Soluo: Considerando que o valor da proporo amostral de atendimentos para pessoas de


Quelimane no conhecida. Utilizamos a para determinar o tamanho da amostra. Sabemos
que, para 90% de confiana teremos o valor crtico ( Za /2 =1,65.
2

Z /2 p q (1,65)2 0,25
n=
=270,6=271
2
2
E0
(0,05)

Devemos, portanto, obter uma amostra de 271 pessoas para determinar a proporo da
populao atendida na Unidade de Sade, que se origina do municpio de Quelimane.

Determinao do tamanho da amostra para populaes Finitas


As frmulas para determinao do tamanho da amostra que vimos at agora trabalhavam com
a ideia de que a populao de onde se retirava a amostra era to grande, que poderamos
consider-la infinita. Entretanto, a maior parte das populaes no to grande em
comparao com as amostras. Caso a amostra tenha um tamanho
do tamanho da populao

maior ou igual a 5%

N , considera-se que a populao seja finita. Neste caso, aplica-

57

se um fator de correo s frmulas vistas anteriormente e teremos as seguintes frmulas


corrigidas: Frmula para determinao do tamanho da amostra

com base na estiva da

mdia populacional:
N 2 (Z / 2)2
n=
( N1)E 20+ 2 ( Z /2 )2

Frmula para determinao do tamanho da amostra

com base na estimativa da

proporo populacional:
n=

N ^p q^ Z /2
( N1)E 20+ ^p q^ (Z /2 )2

15. Tcnicas de Amostragem


A apresentao de uma ilao correspondente ao parmetro est estritamente
relacionada com a margem de erro que possa ser cometida durante o estudo. Ao quantificar a
margem de erro, se torna bvio o nvel de enviesamento o que determina o ndice de rigor nos
resultados. Se por exemplo, um investigador aps os seus estudos afirmar que a margem de
erro que o levou a concluso foi com a probabilidade de

3 , 5 ou

10 , por outro lado,

est a informar que a credibilidade das concluses assegura uma confiana de


90

97 ,95 ou

respectivamente. O controlo da probabilidade de erro na generalizao est

directamente relacionada com a forma como a amostra foi recolhida, portanto, a primeira e a
ltima operao da tcnica da amostragem esto directamente relacionadas. S se pode
quantificar o erro se a amostra for recolhida de uma forma aleatria, isto , se a probabilidade
de todos os elementos da populao fazerem parte da amostra for conhecida e diferente de
zero.

58

Amostragem probabilstica ou aleatria


Uma amostra dita probabilstica ou aleatria se todos os elementos da populao
tiverem probabilidades conhecidas e no zero de pertencer a amostra.
Amostragem aleatria simples

o processo mais elementar aplicado a populaes

homogneas de tamanho conhecido. Todos os elementos da populao tm igual


probabilidade de serem escolhidos. Para uma populao finita o processo deve ser sem
reposio. Todos os elementos da populao devem ser enumerados. Dos mtodos existentes,
os mais usados e simples para a obteno de uma amostragem aleatria simples consistem
em:
Mtodo 1
Extraco de bolas enumeradas
equivalente a um sorteio lotrico. Pode ser realizada numerando-se a populao de 1 a N e
sorteando-se a seguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa
seqncia, os quais correspondero aos elementos pertencentes amostra.
Exemplo: Vamos obter uma amostra de 10% representativa para uma pesquisa da estatura de
80 alunos de uma escola qualquer.
1 - numeramos os alunos de 01 a 90
2 - escrevemos os nmeros dos alunos de 01 a 80 em pedaos iguais de papel, colocamos
numa urna e aps misturar, retiramos, um a um oito nmeros que iro compor a amostra.
Mtodo 2:
Usar uma roda semelhante figura 1.1, que se segue

59

Figure 1 Roda
A roda deve ser desenhada numa superfcie lisa e deve rodar em torno do centro. A
circunferncia deve ser dividida em 10 sectores iguais e numerados: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
Fixa-se um ponteiro, como o que est representado na figura. De cada vez que a roda girar,
ela parar e o ponteiro indicar um sector, por exemplo o 2. Cada sector (nmero) tem a
mesma oportunidade de sair e, como a roda no tem memria, o resultado obtido de cada vez
que a roda gira no vai afectar as tentativas seguintes. Podemos construir, assim, uma tabela
de dgitos aleatrios.
Mtodo 3:
Usar uma tabela de nmeros aleatrios (Consta em anexo)
A tabela de nmeros aleatrios apresenta agrupamento de cinco dgitos e tem as linhas
numeradas, com o objectivo de facilitar na sua consulta.
Propriedades
1. Qualquer par de dgitos na tabela tem a mesma oportunidade de ser (qualquer) um dos
100 possveis pares 00, 01, 02, 03, ..., 97, 98, 99.
2. Qualquer trio de dgitos na tabela tem a mesma oportunidade de ser um dos
1000 possveis trios 000, 001, 002, 003, ..., 997, 998, 999.
3. E assim por adiante, para grupos de 4 ou mais dgitos da tabela.
Exemplo: Se precisarmos de uma a.a.s. de tamanho 5, de um lote de 100 iogurtes para
verificarmos contaminaes bacterianas, devemos
a) Enumerar os 100 iogurtes de 00, 01, 02, ..., 99;
b) Escolher aleatoriamente uma linha na tabela de nmeros aleatrios (por exemplo, a
linha 143 temos 88565, 42628, 17797, 49376)

60

c) Registar os 5 grupos de dois dgitos que tenham correspondncia com os nmeros da


populao: 88, 56, 54,26 e 28. Estes so os iogurtes (numerados) seleccionados para a
amostra.
Exemplo: Pretendemos uma amostra de tamanho 5 de um grupo de 300 unidades. Para
numerar as unidades da populao usaremos 000, 001, 002,.. , 297, 298, 299. Ao ler na
Tabela na linha 116 (escolhida aleatoriamente), grupos de 3 dgitos, temos 144 592 605 631
424 803 716 510 362 253 504 906 118 138 167 985 ... Somente. o 1 , 10 , 13 ,
14

e 15

devem ser usados. Os outros nmeros devem ser ignorados, pois no tm

correspondncia na populao.
Observao: Se aparecerem grupos (neste caso, de dois dgitos) repetidos, devemos ignorlos. Mas se a coincidncia for movida pela repetio do elemento da populao e no do
nmero aleatrio, ento ser considerada mera coincidncia sendo que o elemento dever ser
seleccionado. Este procedimento deve ser repetido at atingir n elementos requeridos para a
amostra.
Amostragem aleatria com e sem reposio
A retirada de elementos de uma populao para comporem a amostra pode ser com ou
sem reposio. Se a populao for infinita ento as retiradas com e sem reposio sero
equivalentes, isto , o facto de recolocar o elemento retirado de volta na populao, no vai
afectar em nada a probabilidade de extraco do elemento seguinte.
Se, no entanto, a populao for finita ser necessrio fazer uma distino entre os dois
procedimentos, pois a extraco com reposio as diversas retiradas sero independentes,
mas no processo sem reposio haver dependncia entre as retiradas, isto , o facto de no
colocar o elemento retirado afecta a probabilidade do elemento seguinte ser retirado.
A amostragem sem reposio mais eficiente e reduz a variabilidade uma vez que no
possvel um elemento mais do que uma vez. Assim se
populao e

nN

representa o tamanho da

o tamanho da amostra, ento o nmero de amostras possveis e as

respectivas probabilidades de acordo com os critrios com e sem reposio ser:

61

Com reposio
k =N n ; onde k

P=

representa o nmero de classe ;

1
n
M

Sem reposio
k =CnN

N!
n! (Nn) !

P=

1
CnM

Exemplo: Considere a populao P {1, 3,5, 6 }. Ento o nmero de amostras possveis de


tamanhos n=2 .
Com reposio
k =N n , neste caso, temos

N=4 e n=3 , portanto, vem k =4 2 k =16

Estas amostras sero:


(1,1) ;(1, 3);( 1,5)(1, 6);
(3, 3) ;(3, 5); (3, 6);( 5,5) ;(5, 6); (6,6);(3, 1); (5,1); (6,1);(5, 3);( 6,3)e (6,5)

A probabilidade de cada elemento da populao ser escolhido

P=

1
42

Sem reposio
Como

N=4 e n=2 ento o nmero possvel de amostras ser: k =C24=6

Estas amostras sero: (1,3)(1, 5)(1,6)(3, 5)(3, 6)(5,6)

Exemplo : Quatro funcionrios de uma empresa (Alberto, Marcos, Catarina, Telma, Nelson e
Judite) pretendem tirar frias no ms de Junho, mas apenas dois deles podem ir nesse

62

perodo. Determine a probabilidade de cada funcionrio fazer parte da amostra e o nmero de


amostras possveis.
Neste caso evidente que se trata de uma amostragem aleatria simples e sem reposio.
Podemos proceder colocando numa caixa papeis com seis letras (cada inicial do nome dos
funcionrios), assim vem: A,M,C,T.N e J. em seguida retiramos a amostra de dois daqueles
papeis.
A probabilidade de cada indivduo pertencer a amostra determinada pela seginte expresso:
P=

1 1
1
=
M
6
15
Cn C2
N

O nmero de amostras: k =Cn C2 =15 k =15

Amostragem aleatria sistemtica


Quando os elementos da populao j se encontram ordenados, no h necessidade de
construir o sistema de referncia. So exemplos , os pronturios de hospitais, os prdios de
uma rua, uma lista telefnica, entre outros.
Seja

o tamanho de uma populao e

a dimenso da amostra. Os elementos da

populao que comporo a amostra obtm-se a partir da:


k=

Determinao do intervalo de amostragem ( k ):


expressas duma forma discreta aconselhvel que

N
n

.Quando se trata de medidas

seja inteiro, o que quer dizer que

susceptvel de arredondamento;
Sorteia-se usando a Tabela de Nmeros Aleatrios de um valor compreendido entre
k ;este ser o 1
d) Partindo de

elemento da amostra e adiante designaremos por t


t , seleccionar respectivamente os elementos das posies

t , t+ k , t+2 k , ... ,t +(n1)k . Posto assim, formamos uma sequncia de elementos

que estaro inclusos na amostra.


Para determinar qualquer elemento da amostra podemos usar a frmula do termo

63

geral de uma P.A.


a)

an=a 1+(n1)k

Exemplo Suponha uma rua com 300 casas, das quais desejamos obter uma amostra
formada por 30 casas para uma pesquisa de opinio

1 - Divide-se o tamanho da populao pelo tamanho da amostra, ou seja,


2 - Escolhe-se por sorteio casual, um nmero entre
fosse

3 , a amostra seria:

3 casa,

13

300
=10
30

01 e 10 . Supondo que esse nmero

casa, 23

casa, 33 casa,

43

casa, e

assim por diante, at completar a amostra de 30 residncias.

Amostragem aleatria estratificada


um processo de amostragem usado quando nos depararmos com populaes
heterogneas. Para a recolha de uma amostra estratificada h que previamente proceder
estratificao da populao, ou seja dividi-la em grupos (estratos) de tal modo que dentro de
cada estrato haja a maior uniformidade possvel e, em que as diferenas entre os vrios
estratos sejam to grandes quanto possvel. Estando a populao classificada em estratos, a
amostra recolhida atravs de amostragens aleatrias simples dentro de cada estrato.
O tamanho de amostra em cada estrato, proporcional ao tamanho do estrato em relao

populao determinado pela seguinte relao:


onde:

ni

o tamanho de cada estrato ; N

qi =

ni
n ;
N

representa o tamanho da populao;

quantidade de elementos que comporo a amostra desejado.

64
n

q i=n
i=1

Exemplo: Vamos obter uma amostra representativa de


de 80

alunos de uma escola qualquer, com

54

10

para uma pesquisa da estatura


26

so meninos e

meninas. Qual o

nmero de meninos e meninas que faro parte da amostra.


So portanto dois estratos (sexo masculino e feminino). Logo, temos:

Sexo

Populao

10

Amostra

Masculino

54

5,4

Feminino

26

2,6

Total

80

Exerccio 1: uma franquia de fast food com foco em sanduches, apresenta lojas em todo o
mundo. Para fazer uma pesquisa de satisfao dos clientes, dividiu-se a populao de lojas
em trs estratos (pases desenvolvidos, pases em desenvolvimento e pases do grupo
asitico). Pretende-se trabalhar com uma amostra de tamanho

n=200 . Com as

informaes a seguir, faa o esquema de uma amostragem estratificada.


ni

qi =

Pases

i =1

de lojas)

Pases desenvolvidos
em

n1

700

q1 =

700
200 101
1390

n2

420

q 2=

420
200 60
1390

270

q3 =

270
200 39
1390

desenvolvimento
Pases do grupo Asitico

n ;

ni

Tamanho do estrato (no


Estratos

n3
n

N ni=1390
i=1

n q i=200
i=1

65

Amostragem por conglomerado ou Agrupamentos


Quando a populao apresenta uma subdiviso natural em grupos menores
(denominados conglomerados), sorteia se um nmero suficiente desses grupos
(conglomerados) e todos os elementos destes vo compor a amostra. Agregados tpicos so:
quarteires, famlias, organizaes, agncias, edifcios, entre outros.
Exemplo: Num levantamento da populao de uma cidade, podemos dispor do mapa
indicando cada quarteiro e no dispor de uma relao atualizada dos seus moradores. Podese, ento, colher uma amostra dos quarteires e fazer a contagem completa de todos os que
residem naqueles quarteires sorteados.
Amostragem por clusters
Quando se torna impraticvel ou impossvel construir uma lista de todos os elementos
que constituem determinada populao sendo, no entanto, muito mais listar em grupos desses
mesmos elementos usa se a mostragem por clusters. Este tipo de amostragem, consiste
quando a populao se encontra dividida num reduzido nmero de grupos (clusters) onde, as
diferenas entre os elementos dentro de cada cluster devem ser as maiores possveis (os
grupos devero tanto quanto possvel ser microcosmos da populao a estudar).
Seleccionam se aleatoriamente alguns grupos e em seguida incluem se na amostra todos os
indivduos pertencentes aos grupos seleccionados.
Exemplo: Pretende se conhecer as atitudes dos trabalhadores da rea industrial do Barreiro
sobre as suas condies de trabalho. Neste caso, mais operacional compilar uma lista de
fbricas daquela rea do que uma outra onde constem os trabalhadores nominalmente.
Portanto, a cada fbrica constitui um cluster de trabalhadores. Apenas uma parte destes
clusters (fbricas) participaro na amostra.
Finalmente sero inquiridos todos os trabalhadores que fazem parte dos clusters (fbricas)
considerados na amostra
Amostragem multi etapas
O primeiro passo deste tipo de amostragem idntico ao anterior. A populao
encontra se dividida em vrios grupos e seleccionam se aleatoriamente alguns desses

66

grupos. No passo seguinte, tambm os elementos de cada grupo so aleatoriamente


escolhidos. Este processo pode multiplicar se por mais de duas etapas se os grupos
estiverem divididos em subgrupos.
Exemplo: Num estudo de mercados internacionais foram seleccionados dois pases para se
identificarem as tcticas de posicionamento a seguir para as pastas dentfricas. Em cada um
dos pases escolhidos foram seleccionados cinco centros urbanos e, destes catorze
estabelecimentos comerciais. Em todas as etapas (pases, centros urbanos e estabelecimentos
comerciais) as escolhas resultam de um processo aleatrio.
Amostragem por conglomerado
Quando a populao apresenta uma subdiviso natural em grupos menores
(denominados conglomerados), sorteia se um nmero suficiente desses grupos
(conglomerados) e todos os elementos destes vo compor a amostra. Agregados tpicos so:
quarteires, famlias, organizaes, agncias, edifcios, etc.
Exemplo:

Amostragens no probabilsticas
So amostragens em que h uma escolha deliberada dos elementos amostrais. No
possvel generalizar os resultados das pesquisas para a populao, pois as amostras noprobabilsticas no garantem a representatividade da populao.

Amostragem Acidental
Trata-se de uma amostra formada por aqueles elementos que vo aparecendo e que
so possveis de se obter at completar o tamanho da amostra. Geralmente este tipo de
amostragem utilizado em pesquisa de opinio, em que os entrevistados so acidentalmente
escolhidos.
Exemplo: pesquisas de opinio em praas pblicas, ruas movimentadas de grandes cidades.

67

Amostragem Intencional
So amostragens realizadas de acordo com determinado critrio. Escolhe-se
intencionalmente um grupo de elementos que iro compor a amostra e intencionalmente o
investigador coleta a opinio desses elementos.
Exemplo: Numa pesquisa sobre a preferncia por determinado cosmtico, o pesquisador se
dirige a um grande salo de beleza e entrevista as pessoas que ali s encontram.
Amostragem por Quotas
Este o mtodo de amostragem mais comumente utilizado em pesquisas de
mercado e em prvias eleitorais. Ela abrange trs fases:
1 - Classificao da populao em termos de propriedades que se sabe ou presume serem
relevantes para a caracterstica a ser estudada;
2 - Determinao da proporo da populao para cada caracterstica, com base na
constituio conhecida, presumida ou estimada da populao;
3 - Fixao de quotas para cada entrevistador, a quem caber a responsabilidade de
selecionar os entrevistados, de modo que a amostra total observada ou entrevistada contenha
a proporo de cada classe, tal como determinada na 2 fase.
Exemplo: Numa pesquisa sobre o trabalho da mulher na actualidade. Provavelmente se
ter interesse em considerar: a diviso, cidade e campo, a habitao, moradia, idade dos
filhos, renda mdia, as faixas etrias, etc.
A primeira tarefa descobrir as propores dessas caractersticas na populao. Imagina-se
que haja 47% de homens e 53% de mulheres na populao. Logo uma amostra de 50 pessoas
dever ter 23 homens e 27 mulheres. Ento o pesquisador receber uma quota para entrevistar
27 mulheres. A considerao de vrias categorias exigir uma composio amostral que
atenda ao n determinado e s propores populacionais estipuladas.

68

Amostragem Snowball
Consiste em localizar indivduos com caractersticas desejadas ou prximas das
requeridas no estudo que se pretende fazer. A amostra vai aumentando na medida em que um
elemento da amostra da caracterstica desejada encontre mais um com as mesmas
caractersticas. Geralmente usado este tipo de amostragem quando se pretende estudar uma
caracterstica especfica, com a certeza de difcil localizao dos possveis constituintes da
amostra.
A maior desvantagem reside no facto de que os amigos podem se indicar, resultando numa
amostra em que todos elementos recolhidos tenham um pensamento ou respostas similares.
Exemplo: Esta amostragem mais usada pela polcia quando pretende localizar mais
companheiros de uma quadrilha de assaltantes depois de capturar o primeiro.
Amostragem por Convenincia
uma amostragem de uma pura coincidncia, porque os elementos que possam ser
constituintes da amostra se localizam na zona onde o inqurito est a decorrer passando a
fazer parte dela por convenincia. Esta uma das amostragens que resulta num grande
enviesamento (viciao). muito importante ser usada quando pretendemos captar ideias
gerais ou identificar aspectos crticos. Neste caso deve-se ter o cuidado de no se assumir
qualquer tipo de objectividade cientfica.
Usualmente denominada de amostragem de pr teste do questionrio.

Amostragem pelo Mtodo Aureolar


um processo de sondagem que permite evitar os inconvenientes de uma base de
sondagem incompleta ou caduca. Consiste numa determinao de subconjuntos de populao
por uma rea geogrfica. Define-se num mapa um certo nmero de reas geogrficas, que
podem ser constitudas por Municpios, Bairros, Quarteires, grupos de casas. Procede-se em
seguida a uma tiragem sorte e exploram-se por fim sistematicamente as unidades de
sondagem assim apuradas.
Amostragem Random Route
Passos a considerar para obter uma Amostra Random Route

69

a) Seleco de um ponto de partida atravs de uma listagem, mapa ou registo de endereo ou


ponto de referncia da zona onde ir decorrer o estudo;
b) Definio de regras de orientao para o entrevistador. Assumimos que o inquiridor tem
uma circunscrio ou um itinerrio aleatrio na escolha de unidades a inquirir.
Imaginemos que queira entrevistar residentes de um certo bairro. Seria mais fcil perguntar
onde fica a igreja X. Da pode seguir a rua em frente, virando esquerda ou direita. Se a data
do seu nascimento for 24, a soma de 2 e 4 d 6; pode-se procurar entrevistar naquela rua
todas casas que tenham a soma dos algarismos de seus nmeros de casa 6, casos de 6, 15, 51,
24, 42, 33. dentro de cada casa interessa em saber que sero os indivduos a entrevistar,
processo que pode ser fcil usando a tabela de nmeros aleatrios ou usando amostragem
sistemtica.

16. Concluso
Alm da Estatstica Descritiva h a Estatstica Indutiva ou Estatstica Inferencial que
consiste, fundamentalmente, das tcnicas de anlise e interpretao dos dados. A partir de um
conjunto restrito de dados, chamado de amostra, organizado e descrito pela Estatstica
Descritiva, a Estatstica Indutiva procura fazer inferncias ou, em outras palavras, tirar
concluses sobre a natureza desses dados e estender essas concluses a conjuntos maiores de
dados, chamados de populaes.
evidente que, para que a Estatstica Indutiva possa deduzir concluses vlidas, necessrio
que se tomem alguns cuidados para a escolha da amostra a ser utilizada.
Esses cuidados, mais propriamente chamados de critrios, so estabelecidos por uma tcnica
chamada de amostragem.
Contudo, para permitir que a Estatstica Indutiva proporcione concluses vlidas no basta
utilizar as tcnicas de organizao e descrio dos dados da Estatstica Descritiva e as
tcnicas correctas de amostragem. Fica ainda faltando uma ltima ferramenta que o clculo
de probabilidades. O clculo de probabilidades um conjunto de tcnicas matemticas que
visa determinar as chances de ocorrncia de eventos regidos pelas leis do acaso.

70

17. Referncias bibliogrficas


[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3. ed. So Paulo,
Actual, 1986.
FERNANDES, Edite Manuela da G.P. Estatstica Aplicada
FERREIRA, Eric Batista; OLIVEIRA, Marcelo Silva. Introduo Estatstica Bsica com
R 1 Edio. Lavras : UFLA/FAEPE, 2008,
[HOF80] HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo. Livraria Pioneira
Editora, 1980.
LEVIN, Jack. Estatstica Aplicada a Cincias Humanas.2a. Ed. So
LEVIN, Jack. Estatstica Aplicada a Cincias Humanas.2a. Ed. So Paulo: Editora Harbra
Ltda, 1987
[MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And
Economics. IRWIN, Boston, 1990.
[MEY78] MEYER, Paul L. Probabilidade: aplicaes Estatstica. Traduo do Prof. Ruy
C. B.
[NET74] NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades:
resumos tericos, exerccios resolvidos, exerccios propostos. So Paulo, Edgard Blcher,
1974.

71

[NET74] NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977.
[STE81] STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora
Harbra, 1981.
[WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica.
Rio de Janeiro. Livros Tcnicos e Cientficos Editora S. A., 1985.

ANEXOS

Вам также может понравиться