Вы находитесь на странице: 1из 167

SAMPLING

UM SOFTWARE NA REA DE AMOSTRAGEM INTEGRADO AO SOFTWARE ESTATSTICO MINITAB FOR WINDOWS

MANUAL DO USURIO APOIO FINANCEIRO DA FAPEMIG

AUTORES: SUELI APARECIDA MINGOTI (*) GREGRIO SARAVIA ATUNCAR (*) MARIA LOURDES GRANHA NOGUEIRA(**) RODRIGO CARAZOLLI DA SILVA (***)

(*) PROFS. ADJUNTO DO DEPARTAMENTO DE ESTATSTICA DA UFMG (**) PROFA. APOSENTADA DO DEPARTAMENTO DE ESTATSTICA DA UFMG (***) BACHAREL E MESTRANDO EM ESTATSTICA PELA UFMG 2001

SAMPLING
UM SOFTWARE NA REA DE AMOSTRAGEM INTEGRADO AO SOFTWARE ESTATSTICO MINITAB FOR WINDOWS

AGRADECIMENTO
OS AUTORES AGRADECEM FAPEMIG PELO APOIO FINANCEIRO QUE POSSIBILITOU A PRODUO DO SOFTWARE SAMPLING.

SAMPLING
UM SOFTWARE NA REA DE AMOSTRAGEM INTEGRADO AO SOFTWARE ESTATSTICO MINITAB FOR WINDOWS

NDICE
O SOFTWARE SAMPLING AMOSTRAGEM ALEATRIA SIMPLES AMOSTRAGEM SISTEMTICA AMOSTRAGEM DO TIPO P.P.S AMOSTRAGEM ESTRATIFICADA AMOSTRAGEM POR CONGLOMERADOS EM 1, 2 OU 3 ESTGIOS SUBAMOSTRAGEM COMO FAZER UMA ANLISE REFERNCIAS BIBLIOGRFICAS 03 07 12 15 17 24 35 164

O SOFTWARE "SAMPLING"
Introduo
O software Sampling foi desenvolvido como parte de um projeto de pesquisa financiado pela FAPEMIG, uma instituio de fomento pesquisa do estado de Minas Gerais. Sua estrutura foi concebida de modo a permitir que o usurio execute facilmente a anlise estatstica de dados atravs de mtodos estatsticos que levem em considerao o procedimento amostral utilizado na coleta destes dados. Este programa funciona como um complemento do popular software estatstico Minitab For Windows (2000). Tal opo pela criao do Sampling como um complemento de outro software deve-se principalmente grande difuso, baixo custo e facilidade de manipulao do Minitab For Windows. Sampling um programa muito simples de ser usado, funcionando de forma totalmente interativa. Seu manuseio requer do usurio conhecimentos bsicos sobre o Minitab For Windows alm de, claro, conhecimento das tcnicas de amostragem. O programa funciona em um sistema de vrias macros interligadas a uma macro mestre onde as informaes so armazenadas. As perguntas so feitas passo a passo em uma seqncia lgica de anlise. Por funcionar a partir do Minitab, o usurio, alm dos recursos disponveis no Sampling, tem a grande vantagem de desfrutar de todos os outros recursos estatsticos importantes `a uma anlise estatstica, sem precisar sair do software. Em termos do espao ocupado no disco rgido, o Sampling bem econmico. Tecnicamente, para se obter uma boa performance, o programa requer no mnimo um computador com processador Pentium 100 e 16 MB de memria RAM. Cabe salientar que no sistema Windows 95 (ou superior), a capacidade de armazenamento de dados limitada apenas pela quantidade de memria disponvel (Minitab verso 11.0 ou superior). Configuraes inferiores podem ser utilizadas, porm o processamento torna-se mais lento. O programa tambm pode ser utilizado com verses anteriores do Minitab a partir da verso 10.0. Os procedimentos amostrais disponveis no software Sampling so : . Amostragem Aleatria Simples com ou sem reposio . . Amostragem Sistemtica. . Amostragem Estratificada.; . Amostragem do Tipo P.P.S. . Amostragem por Conglomerados. . Amostragem em Dois ou Trs Estgios - Subamostragem . Subamostragem Estratificada. . Ps- Estratificao. O software Sampling foi desenhado tendo a Amostragem Estratificada como seu procedimento amostral base. Deste modo, as anlises estatsticas para os casos em que se tem apenas uma amostra proveniente de um procedimento amostral como, Amostragem Aleatria Simples, Amostragem Sistemtica e Amostragem por Conglomerados so obtidas como casos particulares da Amostragem Estratficada quando se tem apenas um estrato na populao, o que significa dizer que o estrato a prpria populao. A Amostragem do tipo P.P.S. tratada como um caso particular da Subamostragem. De um modo geral o software Sampling permite ao usurio a estimao dos parmetros populacionais (mdia, total e propores) atravs dos mtodos estatsticos no-viciados usuais de estimao pontual e intervalar (Cochran, 1977) ou pelos mtodos de Razo e Regresso, sendo que neste caso a varincia dos estimadores poder ser obtida pelo mtodo separado ou mtodo combinado. A estimao por intervalo executada para 4 diferentes valores do nvel de significncia , isto , 1, 2,5, 5 e 10 %. Para a construo dos intervalos utilizada a distribuio t-Student para o 3

caso de amostras pequenas (amostras com tamanho menor que 30 unidades amostrais) e a distribuio Normal para caso de amostras grandes. Nos mdulos de Amosrtragem Aleatria Simples, Amostragem Sistemtica e Amostragem Estratificada, o usurio tambm poder proceder a uma anlise descritiva de seus dados (opcional) ou calcular o tamanho n da amostra necessrio para obter-se uma preciso especificada priori com a respectiva alocao tima ou proporcional. Exemplos de uso do software Sampling esto apresentados na seo Como Fazer uma Anlise. Uma breve descrio dos recursos disponveis em cada um dos planos amostrais existentes no Sampling apresentada a seguir.

. Amostragem Aleatria Simples com ou sem reposio


No Sampling para executar uma anlise estatstica de dados quando o usurio dispe de uma nica amostra coletada pelo mtodo da Amostragem Aleatria Simples este dever proceder como se estivesse executando uma anlise pelo procedimento de Amostragem Estratificada com um nico estrato. Para detalhes sobre a entrada de dados e a forma de sada de resultados veja o a seo Como Fazer uma Anlise-Amostragem Aleatria Simples.

. Amostragem Sistemtica
Neste mdulo o usurio poder estimar pontualmente os parmetros populacionais usando os estimadores usuais da Amostragem Sistemtica (Thompson,1992) como tambm fazer a estimao por intervalo. Neste caso, o clculo da varincia dos estimadores feita atravs de 3 procedimentos diferentes: . Mtodo 1: A varincia estimada utilizando-se a aproximao pela Amostragem Aleatria Simples (Cochran, 1977);

. Mtodo 2: A varincia estimada utilizando-se o mtodo das diferenas (Mingoti e Aguiar,1988). . Mtodo 3: A varincia estimada pelo mtodo da amostragem sistemtica repetida (Scheaffer, Mendenhall e Ott, 1996) . Neste caso, so considerados parties em que o tamanho da amostra n um mltiplo de m=2 ou m=3 ; Como uma forma do usurio avaliar se a aproximao pela Amostragem Aleatria Simples apropriada para a estimao da varincia dos estimadores, o software Sampling fornece uma estimativa da correlao intra-classe das unidades amostrais populacionais para avaliao. Valores prximos de zero indicariam que a aproximao seria razovel. Uma anlise descritiva dos dados amostrais (opcional) tambm est disponvel neste mdulo. Para maiores detalhes sobre entrada de dados e forma de sada de resultados veja a seo Como Fazer uma Anlise- Amostragem Sistemtica.

. Amostragem Estratificada
Neste mdulo presume-se que as unidades amostrais da populao estejam previamente divididas em L estratos disjuntos. Alm da estimao de parmetros populacionais atravs dos mtodos no-viciados usuais ou pelos mtodos de Razo e Regresso, o usurio poder tambm fazer uma anlise descritiva dos dados para cada estrato individualmente ou para amostra global. Os planos amostrais permitidos no software Sampling para seleo de unidades amostrais dentro de cada estrato so o da Amostragem Aleatria Simples (Amostragem Aleatria Estratificada) e o da Amostragem Sistemtica. No caso em que as unidades amostrais de cada estrato esto divididas em conglomerados ou ocorre a subamostragem dentro de cada estrato, os planos amostrais permitidos so o da Amostragem Aleatria Simples, o da Amostragem tipo P.P.S. e o de 4

Amostragem Sistemtica no qual a estimao da varincia dos estimadores feita pela aproximao da Amostragem Aleatria Simples. Os mtodos de estimao considerados em cada estrato so : o mtodo no-viciado usual, os mtodos de Razo e o de Regresso. No caso da estimao por intervalo para amostras pequenas a distribuio t-Student utilizada com os graus de liberdade dados pela frmula sugerida por Cochran (1977, pg.96). O software Sampling permite tambm que o usurio proceda ao clculo do tamanho global da amostra n e a respectiva alocao dos tamanhos amostrais dos estratos populacionais, isto ( n1 , n 2 , ... , n L ) . So consideradas a Alocao tima e a Alocao Proporcional. No caso da Alocao tima dois casos so considerados: a determinao do tamanho da amostra levando-se em considerao a minimizao do custo final de coleta de dados ou a minimizao da variabilidade dos estimadores no-viciados usuais dos parmetros populacionais considerando-se que o plano amostral utilizado em cada estrato o de Amostragem Aleatria Simples ou a Amostragem Sistemtica com varincia aproximada pela Amostragem Aleatria Simples.Para maiores detalhes sobre a entrada de dados e a forma de sada de resultados veja a seo Como Fazer uma AnliseAmostragem Estratificada.

. Amostragem do Tipo P.P.S.


A amostragem do tipo P.P.S . um procedimento amostral probabilstico no qual a probabilidade de seleo de cada unidade amostral populacional proporcional ao respectivo tamanho da unidade amostral. Portanto, um procedimento de amostragem bastante til nas situaes em que as unidades amostrais populacionais diferem de tamanho. A notao P.P.S. significa probabilidade de seleo proporcional ao tamanho (Scheaffer, Mendenhall e Ott, 1996). O software Sampling permite que o usurio estime os parmetros populacionais no caso em que tem uma nica amostra selecionada pelo mtodo P.P.S com reposio, ou nos casos em que a Amostragem P.P.S. utilizada em combinao com a Amostragem Estratificada ou Amostragem em Dois ou Trs Estgios. Em termos operacionais no software Sampling para executar uma anlise estatstica de uma nica amostra proveniente do plano amostral do tipo P.P.S. o usurio dever proceder como se estivesse executando uma anlise pelo procedimento de Amostragem por Conglomerados escolhendo-se a opo P.P.S. Para maiores detalhes sobre a entrada de dados e a forma de sada de resultados veja a seo Como Fazer uma Anlise-Amostragem do Tipo P.P.S.

. Amostragem por Conglomerados


Neste caso presume-se que as unidades amostrais populacionais tenham sido previamente divididas em grupos ou conglomerados disjuntos. Os mtodos de seleo de conglomerados permitidos so o de Amostragem Aleatria Simples sem reposio, o da Amostragem tipo P.P.S com reposio e o da Amostragem Sistemtica como uma aproximao da Amostragem Aleatria Simples. Os estimadores para o caso em que a Amostragem Aleatria Simples com reposio tenha sido utilizado na coleta de dados podem ser obtidos por aproximao considerando-se o caso de populaes infinitas, ou de tamanhos muito grandes. So considerados os casos de conglomerados de mesmo tamanho e de tamanhos diferentes. Os mtodos de estimao de parmetros utilizados so o de estimadores no-viciados usuais e o mtodo de Razo. Para maiores detalhes sobre a entrada de dados e a forma de sada de resultados veja a seo Como Fazer uma Anlise-Amostragem por Conglomerados.

. Amostragem em Dois ou Trs Estgios-Subamostragem


Neste mdulo presume-se que as unidades amostrais populacionais esto previamente divididas em unidades primrias e secundrias (no caso de Amostragem em Dois Estgios) ou em unidades primrias, secundrias e de terceiro estgio (no caso de Amostragem em Trs Estgios). Os procedimentos de seleo para as unidades primrias permitidos so o de Amostragem Aleatria Simples, o de Amostragem do tipo P.P.S com reposio e o de Amostragem Sistemtica com estimativas obtidas por aproximao a Amostragem Aleatria Simples sem reposio. Para a seleo das unidades secundrias e de terceiro estgio so considerados apenas os procedimentos da 5

Amostragem Aleatria Simples sem reposio e o de Amostragem Sistemtica com estimativas aproximadas pela Amostragem Aleatria Simples . Entretanto, o caso da Amostragem Aleatria Simples com reposio pode ser obtido atravs da aproximao para populaes com tamanhos grandes (populao infinita) O software Sampling executa a estimao de parmetros para os casos de unidades primrias de tamanhos iguais ou diferentes combinados com os casos de unidades secundrias e de terceiro estgio de tamanhos iguais ou diferentes. Os mtodos de estimao de parmetros utilizado so o dos estimadores no-viciados usuais e o mtodo de Razo (Sukhatme e Sukhatme, 1970). Para maiores detalhes sobre a entrada de dados e a sada de resultados veja a seo de Como Fazer uma Anlise-Amostragem em Dois ou Trs Estgios.

. Subamostragem Estratificada
A subamostragem estratificada, isto a Amostragem Estratificada combinada com a Amostragem por Conglomerados ou a Amostragem em Dois ou Trs Estgios em cada estrato tambm est disponvel no software Sampling. A estimao de parmetros feita pelo mtodo usual de estimadores no-viciados ou pelo mtodo da Razo. Para maiores detalhes sobre a entrada de dados e a forma de sada dos resultados veja a seo de Como Fazer uma Anlise.

. Ps-Estratificao
A Ps-Estratificao (Scheaffer, Mendenhall e Ott, 1996), aparece com grande frequncia em situaes nas quais a amostra inicial foi coletada sem levar em considerao priori fatores importantes de estratificao (planos como Amostragem Aleatria Simples ou Sistemtica). Assim os estratos populacionais so determinados aps a coleta da amostra de n unidades amostrais. Neste caso, os tamanhos amostrais dos estratos ( nh ) deixam de ser fixos e passam a ser variveis aleatrias. Devido a este fato correes so necessrias no clculo das estimativas das varincias dos estimadores dos parmetros populacionais. No software Sampling estas correes seguem as sugestes indicadas em Scheaffer, Mendenhall e Ott (1996, e Cochran, 1977). Para maiores detalhes sobre a entrada de dados e a forma de sada de resultados veja a seo Como Fazer uma Anlise.

. Estimao de Propores
No software Sampling a estimao de propores populacionais considerada como um caso particular da estimao de mdias populacionais. A varivel resposta Y so pode assumir valores do tipo "0" ou "1" . Para maiores detalhes veja a seo Como Fazer uma Anlise-Estimao de Propores.

AMOSTRAGEM ALEATRIA SIMPLES


AMOSTRAGEM ALEATRIA SIMPLES
Na Amostragem Aleatria Simples uma amostra de n elementos selecionada atravs de um mecanismo aleatrio de uma populao constituda de N unidades amostrais, n<N. O mecanismo de seleco das unidades deve ser tal que cada uma das N unidades amostrais populacionais tenha a mesma probabilidade de pertencer a amostra de pertencer a amostra final. A seleo pode ser feita com ou sem reposio. Quando este tipo de procedimento amostral utilizado na coleta de dados, o software Sampling permite que o usurio obtenha as estimativas pontual e por intervalo da mdia ( Y ) e do total (Y ) e propores populacionais usando os estimadores no-viciados usuais, os de Razo e os de Regresso. Alm disso, o usurio poder calcular o tamanho da amostra necessrio para obter uma preciso e erro de estimao fixos.

No que segue ser utilizada a seguinte notao:

N y s2 Y Y Y Y
2

: tamanho da populao : tamanho da amostra : mdia da amostra : varincia da amostra : mdia populacional : estimador da mdia populacional : total populaciomal : estimador do total populacional : varincia populacional : razo populacional : estimador da razo populacional : estimador de razo da mdia populacional : estimador de razo do total populacional

R R YR

YR y lr : estimador de regresso da mdia populacional Ylr : estimador de regresso do total populacional

Amostragem Aleatria Simples Sem Reposio


Suponha que uma amostra de tamanho n tenha sido selecionada de uma populao constituda de N elementos atravs do procedimento de Amostragem Aleatria Simples sem reposio. Neste caso, os estimadores no viciados da mdia e total populacionais so respectivamente:

Y =y

As varincias estimadas de Y e de Y so respectivamente:

Var ( Y ) =

s2 n

N n N

Var ( Y ) = N 2

Os intervalos de confiana para a mdia e total populacional so construdos de acordo com o nvel de significncia escolhido pelo usurio. Para amostras pequenas (n<30) utiliza-se a distribuio t de Student. Para amostras maiores utiliza-se a distribuio normal.

Y =N y

s2 n

N n N

Amostragem Aleatria Simples com Reposio


No caso da amostra ter sido obtida atravs do procedimento de Amostragem Aleatria Simples Com Reposio, os estimadores no viciados da mdia e total populacionais so respectivamente:

As varincias estimadas de Y e de Y so respectivamente:

Estimao de uma Proporo Populacional


A proporo populacional P estimada por p a frao de elementos na amostra que possui a caracterstica de interesse e pode ser vista como uma mdia de valores zeros e uns da amostra. Assim, p = y e o tratamento anlogo ao da estimao da mdia populacional. Para maiores detalhes de entrada de dados e a forma de sada de resultados veja Como Fazer uma Anlise.

Determinao do Tamanho da Amostra na Amostragem Aleatria Simples


Se o usurio deseja estimar Y com um erro de estimao de no mximo d (tolerncia), e com uma probabilidade de que o erro de estimao seja maior que d no mximo igual a , 0 < < 1, isto :

P(| Y Y |> d ]
o tamanho da amostra no procedimento de Amostragem Aleatria Simples sem Reposio calculado atravs da seguinte frmula:

n= ( N 1)

N 2 d +2 z /2
2

e no caso de Amostragem Aleatria Simples com Reposio:

z n= /2 d

O Sampling solicitar ao usurio os valores das constantes d, e uma estimativa do desvio padro populacional . Veja exemplos em Como Fazer uma Anlise.

Var ( Y ) =

s2 n

Var ( Y ) = N 2

Y =y

Y= Ny

s2 n

Estimadores de Razo na Amostragem Aleatria Simples


Suponha que uma amostra aleatria de tamanho n tenha sido retirada, sem reposio, de uma populao finita contendo N elementos. Deseja-se estimar a razo, a mdia e o total populacionais utilizando-se a informao amostral da varivel resposta Y e de uma varivel auxiliar X escolhida previamente.Neste caso, o estimador da razo populacional R =

Y definido por: X

y R = i =1 = n x xi
i =1 onde y i , xi , i = 1,2 ,...,n , denotam respectivamente os valores amostrais das variveis Y e X para o i-simo elemento amostral coletado. Seja f a frao de amostragem, f = n / N . A varincia estimada de R calculada por:

yi

n 2 ( yi R xi ) ( 1 f ) ( 1 f ) i =1 2 = Var ( R ) s 2 + R 2 s x 2 R s yx onde: y 2 n 1 n X nX
2 ( xi x ) n 2 ( yi y ) n

s 2 = i =1 x

No clculo da varincia no software Sampling, perguntado ao usurio se ele deseja entrar com o valor da mdia da varivel auxiliar X . Em caso negativo, a varincia calculada substituindo X por x , ou seja a mdia amostral da varivel X. Os estimadores de razo do total populacional YR e da mdia populacional YR so respectivamente,

y YR = X x

e suas varincias so estimadas respectivamente por:

n 2 ( yi R xi ) N 2 ( 1 f ) 2 N ( 1 f ) i =1 2 = Var ( YR ) s 2 + R 2 s x 2 R s yx y n n 1 n

n 1

s 2 = i =1 y

n 1

e s 2 = i =1 yx

( yi y )( xi x ) n 1 .

y YR = X x

n 2 ( yi R xi ) ( 1 f ) ( 1 f ) i =1 2 = Var ( YR ) s 2 + R 2 s x 2 R s yx y n n 1 n

Para utilizar os estimadores de razo da mdia e total populacionais necessrio que o usurio fornea o valor da mdia da varivel auxiliar X . Caso este valor no seja fornecido, o Sampling utilizar os estimadores usuais no viciados de mdia e total populacionais para a varivel X. As frmulas apresentadas para as varincias de R , YR e YR so aproximadas e as aproximaes so satisfatrias somente quando o tamanho da amostra maior que 30 e os coeficientes de variao de x e y so menores que 10%. O Sampling calcula os coeficientes de variao de x e y e d um aviso de alerta ao usurio quando algum destes coeficientes de variao no satisfaz a condio exigida. Os intervalos de confiana para R , YR e YR so construdos com base na aproximao normal. No caso da Amostragem Aleatria Simples com reposio as frmulas para a varincia dos estimadores de razo so obtidas retirando o fator de correo para populao finita (1 f ) . Na seo Como Fazer Uma Anlise - Amostragem Aleatria Simples o usurio encontrar um exemplo de aplicao dos estimadores de razo.

. Mtodo de Regresso na Amostragem Aleatria Simples


Um outro mtodo de estimao que incorpora a informao de variveis auxiliares o mtodo de Regresso (Cochran,1977; Thompson,1992). Suponha que se disponha de uma varivel auxiliar X linearmente relacionada com a varivel resposta de interesse Y, isto ,

Yi = 0 + 1 X i
onde ( X i ,Yi ) o par de valores observados para a i-sima unidade amostral populacional, i=1,2,,n. Neste caso, uma estimativa da mdia populacional dada por:

y lr = y + ( X x )

onde a estimativa da inclinao da reta obtida pelo mtodo de mnimos quadrados ordinrios (Draper & Smith,1981), isto ,
i =1

( y i y ) ( xi x )
2 ( xi x ) n

i =1

X a mdia populacional da varivel auxiliar X , x a mdia amostral da varivel X.


Para grandes amostras uma estimativa da varincia de y lr dada por: 10

Var ( y lr ) =

n N [ ( y y ) ( x x ) ]2 = i i n ( n 2 ) i =1

1 n

O estimador do total populacional dado por:

Ylr = N y lr
e para amostras grandes a varincia deste estimador dada por:

Var ( Ylr ) = N 2 Var( y lr )


Intervalos de confiana para os parmetros populacionais so construdos da forma usual ou atravs

da distribuio t-Student ou atravs da distribuio Normal. Os estimadores y lr e Y so viciados (Cochran, 1977).

11

AMOSTRAGEM SISTEMTICA

O software Sampling permite que o usurio proceda as estimaes pontual e por intervalo dos parmetros populacionais de interesse no caso em que o procedimento de amostragem sistemtica for utilizado. As estimativas das varincias dos estimadores da mdia, total e proporo populacionais, podem ser obtidas por trs mtodos diferentes: Mtodo 1: o da aproximao pela Amostragem Aleatria Simples Mtodo 2: o da Amostragem Sistemtica Repetida e o Mtodo 3: o das Diferenas Sucessivas. A seguir descrevemos brevemente os procedimentos disponveis no mdulo de amostragem sistemtica. A notao utilizada ser semelhante quela do mdulo de Amostragem Aleatria Simples. Suponha que o procedimento de Amostragem Sistemtica tenha sido utilizado para obteno de uma amostra aleatria de tamanho n de uma populao com N unidades amostrais. Neste caso, os estimadores no-viciados da mdia e do total populacionais so dados respectivamente por:

Y = y sy =

i =1

yi n
(estimador da mdia populacional )

Y = N y sy
Uma estimativa das varincia de

(estimador do total populacional)

ysy

pode ser obtidas pelos seguintes mtodos:

Mtodo 1 : Aproximao pela Amostragem Aleatria Simples (Cochran,1977);

2 ar( y ) = s N n V sy n N 2 onde s uma estimativa do quadrado mdio populacional descrita no mdulo de Amostragem Aleatria Simples Sem Reposio. A qualidade desta aproximao pode ser verificada pelo usurio se ele assim o desejar. Considerando-se a forma alternativa de expressar-se a varincia de y sy , dada por:

2 [1 + ( n 1 ) w ], Var( y sy ) = n
onde

o varincia populacional e

elementos dentro da mesma amostra sistemtica (correlao intra-classe), tem-se que se w for prximo de 1, os elementos da amostra so todos bastante semelhantes com relao caracterstica que foi medida nas unidades amostrais e, consequentemente a varincia de varincia de

uma medida da correlao entre os pares de

ysy

ser maior que a for negativo, a 12

da Amostragem Aleatria Simples sem Reposio. Se

Amostragem Sistemtica poder ser mais precisa que a Amostragem Aleatria Simples. A correlao pode ser negativa se os elementos da amostra forem extremamente diferentes. Quando N for muito grande e

w for muito prximo de 0, a amostragem sistemtica aproximadamente equivalente Amostragem Aleatria Simples.
A critrio do usurio, o software Sampling calcula uma estimativa de

dada por:

w =

i =1 j =1 j i

( yi y sy ) ( y j y sy ) n( n 1 ) N 1 2 2 N s

Mtodo 2: Amostragem Sistemtica Repetida (Scheaffer, Mendenhall e Ott,1996) Neste mtodo, considera-se que a Amostra Sistemtica de tamanho n e perodo de seleo k fornecida pelo usurio, possa ser dividida em duas ou trs amostras sistemticas distintas. No primeiro caso, a amostra de tamanho n tratada como tendo vindo de c=2 amostras sistemticas de perodo de seleo igual a k* = 2 k . No segundo caso, a amostra de tamanho n tratado como vindo de c=3 amostras sistemticas de perodo k* =3 k. Neste caso, as estimativas das varincias de

ysy

so dadas por: c c

Var( y sy ) =

i =1

2 ( y syi y s )

c( c 1)

onde

ys =

i=1

y syi c

e y syi

a mdia da

i-sima amostra sitemtica repetida, i=1,2. O software Sampling escolhe automaticamente o valor de c conveniente dependendo do tamanho n da amostra fornecida pelo usurio. importante ressaltar que esta estimativa pode ser bastante imprecisa especialmente quando o tamanho da amostra n for pequeno.

Mtodo 3: Mtodo das Diferenas Sucessivas (Mingoti e Aguiar,1988)


Neste mtodo uma estimativa da varincia de

ysy

calculada atravs da seguinte frmula:

n1

N n Var( y sy ) = n

j =1

2 ( y j +1 y j )

2n ( n 1)

, onde y j e y j +1

so as observaes sucessivas da amostra sistemtica de tamanho n fornecida pelo usurio.

13

Nos trs mtodos de estimao a varincia estimada do estimador do total populacional ser dada por:

Var ( Y ) = N 2 Var ( y sy )
Nota: Uma outra possibilidade de obter-se uma estimativa da varincia de ysy sem a necessidade
de utilizar-se algum tipo de aproximao, aquela em que o usurio dispe de vrias amostras sistemticas da populao que est sendo investigada. Suponha que se disponha de m amostras sistemticas de tamanho n e de perodo de seleo k. Ento, um estimador no viciado da mdia amostral ser dado por (Scheaffer, Mendenhall e Ott,1996):

ys =

1 m , onde y syi y m i = 1 syi

so as respectivas mdias amostrais das m

amostras sistemticas observadas.

Uma estimativa no-viciada da varincia deste estimador dada por:

Var ( y s ) =

m 1 2 ( y syi y s ) m ( m 1 ) i =1

No software Sampling este procedimento de estimao pode ser obtido no mdulo que trata de Amostragem por Conglomerados em Um Estgio - Conglomerados de Tamanhos Iguais. Veja o mdulo Como fazer uma anlise para exemplos de Amostragem Sistemtica no Sampling .

14

AMOSTRAGEM DO TIPO P.P.S.


Suponha que a populao de interesse tenha sido dividida em N unidades amostrais aqui denotadas por U 1 ,U 2 ,.. . ,U N . Seja i a probabilidade de seleo da unidade amostral i =1 desta populao de acordo com estas probabilidades de seleo, ento os estimadores no-viciados para o total e a mdia populacional seriam dados por:

U i , i = 1,2 , ... , N , i = 1. Se uma amostra aleatria de tamanho n for retirada com reposio

1 n yi n i =1 i

para o total populacional com varincia estimada dada por:

Var ( ) =

n y 1 2 ( i ) n ( n 1 ) i =1 i

y =

1 n yi n N i =1 i

para a mdia populacional com varincia estimada dada por:

Var ( y ) =

1
2

N n ( n 1 ) i =1

yi ) 2 i

Estes estimadores so no-viciados para qualquer escolha de valores das probablidades de seleo i . Um caso particular aquele em que as probabilidades de seleo das unidades amostrais so escolhidas proporcionalmente ao tamanho das unidades, onde tamanho tem que ser definido por algum critrio (porte econmico, nmero de empregados, rea cultivada, etc.). A ttulo de ilustrao, se por exemplo U i tem um certo nmero M i de elementos amostrais, ento uma escolha lgica N onde M = M i seria o nmero total de elementos entre todas as i =1 unidades amostrais do Frame. Este procedimento amostral chamado de P.P.S., ou seja as probabilidades de seleo so escolhidas de modo proporcional ao tamanho das unidades amostrais populacionais. Em geral, quando o mtodo P.P.S. utilizado os estimadores dados anteriormente so denotados por: para

i seria i =

Mi M

y = y pps e = pps = Y pps

Os intervalos de Confiana para os parmetros populacionais so construdos de modo similar ao descrito no mdulo de Amostragem Aleatria Simples. 15

Quando as probabilidades so escolhidas por este procedimento, ou seja P.P.S., a amostragem com probabilidades de seleo diferentes resulta em maior preciso se comparada com a Amostragem Aleatria Simples ou Sistemtica. Entretanto, para outras escolhas de i os estimadores podero ter varincias maiores que aqueles produzidas por estes dois procedimentos amostrais (ver Scheaffer, Mendenhal e Ott,1996, para maiores detalhes. No software Sampling a Amostragem do Tipo P.P.S. executada dentro do mdulo de Amostragem por Conglomerados, Subamostragem e Subamostragem Estratificada, pois trata-se de uma opo para estes mtodos. Veja Como fazer uma Anlise para maiores detalhes.

16

AMOSTRAGEM ESTRATIFICADA
Amostragem Estratificada
Uma amostra estratificada obtida dividindo-se a populao de N elementos em L grupos distintos chamados de estratos e escolhendo-se em seguida uma amostra de elementos de cada estrato. Quando o procedimento amostral utilizado na seleo das amostras de cada estrato for o de Amostragem Aleatria Simples, o procedimento chamado de Amostragem Aleatria Estratificada. Outro procedimento muito comum utilizado na seleo da amostra de cada estrato o de Amostragem Sistemtica. A estratificao pode ainda estar combinada com a Amostragem por Conglomerados ou a Amostragem em Vrios Estgios e com mtodos de estimao de parmetros como o de Razo e o de Regresso. A estratificao essencial na estimao de parmetros de populaes que apresentam grande heterogeneidade dos elementos no que se refere s variveis resposta de interesse. Deste modo, uma maior preciso pode ser obtida atravs da partio dos N elementos populacionais em L grupos, ou estratos, de forma que haja homogeneidade dos elementos em cada estrato e heterogeneidade entre os estratos formados. Os estratos precisam ser disjuntos. Alm disso, o custo da coleta dos dados pode ser reduzido. Para que a partio da populao seja feita de forma eficiente necessrio que se tenha conhecimento de variveis auxiliares que possam estar relacionadas, ou correlacionadas com as variveis respostas de interesse. As variveis auxiliares so em geral denominadas de fatores de estratificao . Alguns exemplos comuns so sexo, idade, classe social, linhas e turno de produo diferentes, etc. No caso da amostragem estratificada, os estimadores da mdia e total populacionais so obtidos atravs de combinaes lineares dos respectivos estimadores de cada estrato individualmente. Partindo-se do pressuposto de que h independncia entre as amostras obtidas nos vrios estratos os estimadores so construdos usando-se a informao correspondente ao procedimento amostral usado em cada estrato. A seguir apresentamos os estimadores disponveis no software Sampling para o caso em que a amostra em cada estrato selecionada atravs da Amostragem Aleatria Simples com ou sem reposio. Neste caso, os estimadores obtidos so no viciados. No que segue a seguinte notao ser adotada:

L : nmero de estratos, em que a populao foi dividida, N h : numero de unidades amostrais em cada estrato (h=1,2,..., L), N : nmero de unidades amostrais na populao,

N
h =1

=N,

Wh =

Nh : peso do estrato h (h=1,2,..., L) N

nh : tamanho amostral no estrato h ( h=1, 2, ..., L), y hj : valor da varivel resposta para a j-sima observao no estrato h Yh Y Y Yh yh

(h=1,2,..., L : j=1,2,..., Nh), : total populacional do estrato h : total da populao : mdia da populao, : mdia populacional do estrato h (h=1,2,..., . L), : mdia amostral do estrato h ( h=1, 2, ..., L).

17

A . Amostragem Aleatria Simples sem Reposio em Cada Estrato


O estimador da mdia populacional dado por

y st =
onde

h =1

Wh y h

y h a media amostral do estrato h, h=1,2,..., L

A varincia estimada de y st dada por

V ( y st ) =

h =1 L

Wh2V ( y h )

2 nh s h 2 = Wh ( 1 ) N h nh h =1

2 onde s h a varincia amostral do estrato h, definida por

Nh 1 2 sh = ( y hj y h ) 2 nh 1 h=1

O estimador no-viciado do total populacional dado por Y = N y st . A varincia estimada de Y dada por V ( Y ) = N 2V ( y st )
Intervalos de Confiana para a mdia e total populacionais podem ser construdos de acordo com o nvel de significncia escolhido pelo usurio. Para amostras grandes utiliza-se a distribuio normal enquanto que para amostras pequenas utiliza-se a distribuio t de Student sendo os graus de liberdade calculados de acordo com a frmula dada em Cochran (1977, pag. 96).

B. Amostragem Aleatria SImples com Reposio em cada Estrato


Neste caso, a mdia populacional continua sendo estimada por y st como dado anteriormente. Entretanto, a varincia estimada deste estimador torna-se igual a :

L s2 ( y ) = W 2 h V st h n h =1 h

18

Tamanho da Amostra
A escolha do valor de n e os valores de nh , (h=1,2,..., L,

nh = n ), pode ser feita levando em h=1 considerao a preciso especificada para a estimao dos parmetros populacionais e o custo total da pesquisa. Para o que se segue considere a funo custo dada por: C = C0 +

h=1

c h nh

onde C 0 um custo inicial para implementao da pesquisa e c h o custo unitrio para a observao de uma unidade amostral do estrato h (h=1,2,..., L). Seja V ( y st ) a varincia do estimador da mdia populacional. Duas solues so possveis: a primeira encontrar-se a alocao ( n , n1 , n 2 ,...,n L ) que minimiza V ( y st ) para um custo fixo; a segunda encontrar a alocao que minimiza o custo C para um valor de V ( y st ) fixo. Para os dois casos a soluo da alocao a mesma e dada por:

nh = n(

N h h

ch ch

h=1,2, ..., L

N h h

2 onde N h o tamanho do h-simo estrato, h a varincia e c h o custo para obter uma unidade de observao no h-simo estrato. Esta forma de alocao denominada de Alocao tima. Se o custo C for fixado, e a varincia minimizada, o valor de n dado por

n=

( C c0 ) N h h
h=1

ch

N h h

ch

Se a varincia for fixada isto , V ( y st ) =V , e o custo minimizado, o valor de n dado por :

n = h=1

Wh h c h
V+

1 2 W h h N h=1

h=1 L

Wh h

ch

Na prtica nem sempre possvel utilizar-se as frmulas de alocao tima de imediato uma vez que estas dependem dos valores populacionais dos desvios padres dos estratos, que operacionalmente so substituidos por estimativas. Na falta destas estimativas uma outra forma de se proceder a escolha dos tamanhos amostrais dos estratos a partir da Alocao Proporcional. Para um dado valor de n , os valores nh so escolhidos da forma :

n h = Wh n =

Nh n N
19

Estimao de Propores
No software Sampling a estimao de uma proporo considerada como um caso particular de estimao de uma mdia populacional. A varivel resposta Y discutida assume apenas os valores 0 e 1. Portanto a proporo populacional igual a mdia populacional, o mesmo ocorrendo para a mdia e proporo amostral. Para maiores detalhes veja Como Fazer uma Anlise.

Ps - Estratificao
A Ps-Estratificao aparece com grande frequncia em situaes nas quais a amostra inicial foi coletada sem levar-se em considerao a priori fatores importantes de estratificao. A no estratificao a priori pode ocorrer por falha humana quando da escolha do plano amostral para a coleta de dados, ou por desconhecimento ocasionado pela dificuldade de observao inicial de fatores relacionados com o problema, ou seja fatores de estratificao ocultos e que tornam-se visveis aps a anlise estatstica da amostra coletada sem estratificao. Deste modo, uma alternativa para tentar reparar o erro da no estratificao inicial realizar a estratificao da populao a posteriori. Assim os estratos populacionais so determinados aps a coleta da amostra de n unidades amostrais. Neste caso, os tamanhos dos estratos, nh , no so fixados a priori e so variveis aleatrias. No software Sampling o usurio poder fazer as estimaes de parmetros considerando a PsEstratificao se a amostra inicial de n elementos tiver sido coletada pelos mtodos de Amostragem Aleatria Simples ou por Amostragem Sistemtica. Suponha que os pesos Wh dos estratos formados a posteriori sejam conhecidos, h = 1,2,, L. Neste caso, um estimador da mdia populacional dado por

y st = Wh y h , como definido anteriomente. Entretanto, este estimador


h =1

no tem a varincia como discutido anteriormente devido a aleatoriedade dos valores varincia estimada de y st neste caso ser dada por :

nh . A

N n L 1 L 2 2 V ( y st ) = Wh s h + 2 ( 1 Wh )s h Nn h=1 n h=1
Esta frmula obtida como sugerido em Scheaffer, Mendenhal e Ott (1996) e Cochran(1977). Para fazer a anlise de dados pela Ps-Estratificao no software Sampling, o usurio dever proceder a entrada de dados como se estivesse fazendo uma anlise pela Amostragem Estratificada. Na srie de perguntas iniciais que so feitas pelo software o usurio dever ento informar que se trata de uma Ps-Estratificao para que o Sampling possa fazer a correpondente anlise procedendo as devidas correes. A estimao considerando-se a Ps-Estratificao pode a vir resultar em estimativas menos precisas que aquelas obtidas atravs da Amostragem Aleatria Simples e Amostragem Sistemtica quando os pesos dos estratos no forem conhecidos ou estiverem muito distantes dos valores populacionais. Veja Como fazer uma Anlise.

20

Estimadores de Razo e Estratificao


No caso de amostragem estratificada a estimativa do total populacional quando o mtodo de razo utilizado pode ser obtida por duas formas diferentes descritas a seguir:

. Mtodo Separado
Neste mtodo uma estimativa do total populacional dada por:

YRs =
onde,

yh

h =1 x h

Xh

y h , x h e X h so respectivamente as mdias amostrais das variveis Y e X e o total


Para grandes amostras a varincia

populacional da varivel auxiliar X para o h-simo estrato. estimada deste estimador dada por:

Var ( YRs ) =
onde

2 N h ( 1 nh

Nh

nh

2 2 ( s 2 + Rh s xh 2 Rh h s yh s xh ) yh

y Rh = h
xh

s2 = yh

nh 1 2 ( y hj y h ) nh 1 j = 1 e

2 s xh =

nh 1 2 ( x hj x h ) nh 1 j =1

s2 = yxh

nh 1 ( y hj y h )( x hj x h ) nh 1 j = 1

h =

s yxh s yh s xh

. Mtodo Combinado
Neste mtodo o total populacional estimado por:

y Yst = st X x st

onde

y st = Wh y h e
h =1

x st = Wh x h
h =1

e X o total populacional da varivel auxiliar X considerando todos os estratos conjuntamente. Para grandes amostras a varincia estimada deste estimador dada por: 2 N h ( 1 nh

Var ( YRs ) =

Nh

h =1

nh

2 ( s 2 + R 2 s xh 2 R h s yh s xh ) yh
mdia populacionais so similares ao

Em ambos os mtodos as estimaes para a razo e apresentado para o total populacional (Cochran,1977).

21

Mtodo de Regresso Linear e Estratificao


Para amostras obtidas pelo procedimento de Amostragem Aleatria Estratificada,os estimadores de regresso dos parmetros populacionais, podem ser obtidos pelos mtodos separado e combinado (Cochran,1977). A seguir descrevemos brevemente estes dois mtodos.

. Mtodo Separado
Neste mtodo a mdia populacional estimada por:

y lrs = Wh y lrh , onde


i =1 onde ,

y lrh = y h + h ( X h x h )

X h e x h so respectivamente as mdias populacional e amostral da varivel auxiliar X , e

a estimativa de mnimos quadrados da inclinao da reta relativa ao h-simo estrato (Amostragem Aleatria Simples Mtodo de Regresso). Para amostras grandes a varincia deste estimador pode ser estimada por:

n 2 Wh ( 1 h N ) h ( s2 2 s 2 2 Var ( y lrs ) = yh h yxh + h s xh ) nh h =1


L onde

s yh , s yxh e s xh so os quadrados mdios como definidos anteriormente e so calculados

individualmente para cada estrato populacional. Este mtodo apropriado quando presume-se que a relao linear entre as variveis Y e X difere de estrato para estrato, ou seja tem-se diferentes valores de h .

. Mtodo Combinado
Neste mtodo define-se:

y st = y h
h =1

x st = x h
h =1

A estimativa da mdia populacional dada por:

y lrc = y st + ( X x st )
onde X a mdia populacional da varivel auxiliar considerando todos os estratos conjuntamente, e a inclinao da reta dada por:

nh nh 2 2 L Wh ( 1 L Wh ( 1 Nh ) Nh ) 2 =[ s xyh ] / s xh ] h =1 nh ( nh 1 ) h =1 nh ( nh 1 )

22

Para grandes amostras a varincia deste estimador estimada por:

Var ( y lrc ) =

2 Wh ( 1 n h

h =1

Nh nh ( nh 1 )

) nh 2 [ ( y hi y h ) ( xhi x h ) ]
i =1

Este mtodo apropriado quando presume-se que a relao linear entre as variveis Y e X so aproximadamente iguais de estrato para estrato, ou seja tem-se o mesmo valor de para cada estrato. Em ambos os mtodos as estimaes para a razo e mdia populacionais so similares ao apresentado para o total populacional (Cochran,1977). Para maiores detalhes de aplicao veja seo Como Fazer uma Anlise.

23

AMOSTRAGEM POR CONGLOMERADOS EM 1, 2 OU 3 ESTGIOS SUBAMOSTRAGEM

O software Sampling permite que o usurio obtenha as estimativas pontual e por intervalo, da mdia ( Y ), o total ( Y ) e proporo ( P ) populacionais, quando o procedimento amostral o de Amostragem por Conglomerados em 1, 2 ou 3 estgios. Nos casos de 1 ou 2 estgios, as unidades amostrais do segundo estgio podem ter ou no o mesmo tamanho. Se as unidades amostrais tm o mesmo tamanho e todos os conglomerados da amostra so completamente inspecionados, ou seja no existe a subamostragem, ento os estimadores utilizados so os no-viciados usuais (Scheaffer, Mendenhall e Ott,1996). Quando os conglomerados tm tamanhos diferentes, a amostra de conglomerados selecionada pelo procedimento da Amostragem Aleatria Simples com ou sem reposio e ocorre ou no a subamostragem, o usurio tem a sua disposio dois mtodos de estimao diferentes para a estimao de parmetros: o mtodo de estimadores no-viciados e o mtodo de razo (Scheaffer, Mendenhal e Ott,1996). A estimao de parmetros tambm possvel de ser executada quando o procedimento utilizado para a escolha dos conglomerados do tipo P.P.S. com reposio, isto , quando as probabilidades de seleo dos conglomerados so proporcionais ao tamanho dos mesmos. O software Sampling permite tambm a estimao de mdia e total populacional no caso em que os dados provm de esquemas amostrais com Subamostragem estratificada, isto , esquemas nos quais a populao de interesse est dividida em estratos e de cada estrato uma amostra selecionada atravs de amostragem por conglomerados em 1, 2 ou 3 estgios. A entrada de dados est diretamente relacionada com a escolha do nmero de estgios do procedimento amostral e com o mtodo de estimao de parmetros escolhido pelo usurio. A seguir apresentamos os planos amostrais disponveis no software Sampling para Amostragem por Conglomerados. Para facilitar a exposio a seguinte notao ser utilizada :

N n

: nmero de conglomerados na populao ; : nmero de conglomerados na amostra ;

M i : nmero de unidades amostrais secundrias do i-simo conglomerado populacional ,


i = 1, 2, . . . , N ; mi : nmero de unidades amostrais secundrias selecionadas do i-simo conglomerado selecionado na amostra do primeiro estgio , i = 1, 2, . . . , n ; Pi j : nmero de unidades amostrais do terceiro estgio que pertencem j-sima unidade amostral secundria do i-simo conglomerado populacional, i = 1, 2, . . . , N ; j = 1, 2, . . . , M i

pi j : nmero de unidades amostrais selecionadas no terceiro estgio que pertencem


j-sima unidade amostral secundria selecionada no segundo estgio e i-simo conglomerado selecionado no primeiro estgio.

y i : mdia amostral do i-simo conglomerado da amostra , i = 1, 2,, n y : estimador da mdia populacional ; Y : estimador do total populacional ;

24

(1) Amostragem por Conglomerados em um Estgio . Conglomerados de Tamanhos iguais


Suponha que o procedimento de Amostragem Aleatria Simples sem reposio tenha sido utilizado para a escolha dos conglomerados pertencentes a amostra. Considerando-se que neste caso M i = M para todo i = 1, 2, , N, tem-se que os estimadores para a mdia e total populacional so dados respectivamente por :

y =

1 n y n i =1 i

( para a mdia populacional )

Y = NM y

( para o total populacional )

A varincia estimada de y dada por :

n Var ( y ) = ( 1 ) N

2 sb n

onde

2 sb =

n 1 ( yi y ) 2 . n 1 i =1

e a varincia estimada de Y respectivamente, Var ( Y ) = ( N M )2 Var ( y )


Os intervalos de confiana para a mdia e total populacionais so construdos atravs do uso da aproximao pela distribuio normal quando n M 30 e pela distribuio t- Student caso contrrio.

. Conglomerados de Tamanhos Diferentes No caso em que os conglomerados tm tamanhos M i diferentes , i = 1,2,..., N so considerados dois casos :

Caso 1. Os n conglomerados so selecionados atravs de AAS-SR


Para esta situao o usurio dispe de dois mtodos de estimao diferentes : o de estimadores no-viciados e os estimadores de razo. Mtodo dos Estimadores No-Viciados Os estimadores pontuais para a mdia e total populacional so dados respectivamente por :

y =

1 nM
N

i =1

M i yi

onde

M =

1 N Mi N i =1

Y = ( Mi ) y = N M y
i =1

25

A varincia estimada de y dada por :

'2 ar ( y ) = ( 1 n ) sb onde V N n

sb =

1 (n 1) M
2

i =1

( M i yi M y ) 2

A varincia estimada de Y dada por :

Var ( Y ) = ( N M ) 2 Var( y )
Caso o usurio no fornea a informao do valor da constante M , o software Sampling estima o valor desta constante atravs da frmula :

1 n m = Mi n i =1
ou seja, o tamanho mdio amostral dos conglomerados. Mtodo de Estimao de Razo De acordo com este procedimento os estimadores da mdia e total populacional so dados por :

y=

i =1 n i =1

yi =

Mi

i =1 n

M i yi
i =1

i =1

M i yi nm

Mi

Y =(

i =1

Mi ) y = N M y

O estimador da varincia de y dada por :

n sb Var ( y ) = ( 1 ) N n

'' 2 onde

s'b'

1 ( n 1 )M
2

i =1

2 ( yi M i y )

Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por m . 26

Caso 2. A amostra de n conglomerados selecionada pelo mtodo p.p.s com reposio.


Suponha que a probabilidade de seleo de cada conglomerado seja igual a

pi =

Mi
i =1

Mi

Mi NM

, i = 1, 2, . . . , N. Suponha ainda que a amostra seja

selecionada com reposio. Ento, os estimadores de mdia e total populacional so dados por :

y =

1 n y n i =1 i

( para a mdia populacional )

Y = NM y

( para o total populacional )

A varincia estimada de y dada por :

n Var ( y ) = ( 1 ) N

2 sb n

onde

2 sb =

n 1 ( yi y ) 2 . n 1 i =1

e a varincia estimada de Y respectivamente, Var ( Y ) = ( N M )2 Var ( y ) .


Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por m .

(2) Amostragem por Conglomerados em 2 Estgios . Unidades Primrias de Mesmo Tamanho


Suponha que a amostra de conglomerados no primeiro estgio tenha sido selecionada por AAS-SR, e que para cada conglomerado selecionado sejam observadas m unidades secundrias. A seleo das unidades secundrias feita por AAS-SR. Neste caso, os estimadores no viciados para a mdia e total populacional so dados por :

y=

1 n y n i =1 i

( para a mdia populacional )

Y = NM y
A varincia estimada de y dada por :

( para o total populacional )

27

n s2 Var ( y ) = ( 1 ) b N n
onde n 1 2 sb = ( yi y ) 2 n 1 i =1

1 m sw + ( 1 ) N M m
2 1 sw =

n i =1

si

sendo

s i2 =

m 1 ( yi j yi ) 2 ( m 1 ) i =1

a varincia amostral das unidades secundrias observadas do conglomerado i pertencente a amostra do primeiro estgio , i = 1, 2, . . . , n.

A varincia estimada de Y respectivamente, Var ( Y ) = ( N M )2 Var ( y )


Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por :

m =

1 n Mi n i =1

. Unidades Primrias de Tamanhos Diferentes


No caso em que os conglomerados tm tamanhos so considerados dois casos :

Mi

diferentes , i = 1,2,..., N

Caso 1. AAS no Primeiro e Segundo Estgios


Os n conglomerados do primeiro estgio so selecionados atravs de AAS-SR. Para cada conglomerado i selecionado toma-se uma amostra constituda de mi unidades secundrias escolhidas atravs de AAS-SR. Para esta situao o usurio dispe de dois mtodos de estimao diferentes: o de de estimadores no-viciados e os estimadores de razo.

Mtodo dos Estimadores No-Viciados


Os estimadores pontuais para a mdia e total populacional so dados respectivamente por :

y=

1 nM

i =1

M i yi

onde

M =

1 N Mi N i =1
28

Y = ( Mi ) y = N M y
i =1

A varincia estimada de y dada por :

n sb Var ( y ) = ( 1 ) N n
onde

'2

s i2 mi 2 + Mi ( 1 ) 2 Mi mi n N ( M ) i =1 1

s'b2 =

1 ( n 1) M
2

i =1

( M i yi M y ) 2 ;

s i2 =

m 1 ( yi j yi ) 2 ( m 1 ) i =1

A varincia estimada de Y dada por : Var ( Y ) = ( N M ) 2 Var ( y )

Caso o usurio no fornea a informao do valor da constante M , o software Sampling estima o valor desta constante atravs da frmula :

m =

1 n Mi n i =1

Mtodo de Estimao de Razo


Neste procedimento a mdia e o total populacional so estimados por :

y=

i =1 n

yi = mi

i =1 n

mi y i
i =1

i =1

mi y i nm

i =1

mi

Y = ( Mi ) y = N M y
i =1 A varincia de y estimada por :

29

n 1 Var ( y ) = ( 1 ) ( yi mi y ) 2 2 N n M ( n 1 ) i =1
Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por m .

Caso 2. Procedimento de Amostragem p.p.s. no Primeiro Estgio e AAS no Segundo Estgio.


A amostra de n conglomerados selecionada pelo mtodo p.p.s. com reposio. Para cada conglomerado i na amostra seleciona-se mi unidades amostrais atravs de AAS-SR. Suponha que a probabilidade de seleo de cada conglomerado seja igual a

pi =

Mi
i =1

Mi

Mi NM

, i = 1, 2, . . . , N.

Ento, os estimadores de mdia e total populacional so dados por :

y =

1 n y n i =1 i

( para a mdia populacional )

Y = NM y

( para o total populacional )

A varincia estimada de y dada por :

n Var ( y ) = ( 1 ) N
e a varincia estimada de

2 sb n

onde

2 sb =

n 1 ( yi y ) 2 . n 1 i =1

respectivamente,

Var ( Y ) = ( N M )2 Var ( y ) .

Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por

m.

30

(3)

Amostragem por Conglomerados em Trs Estgios


No caso de Amostragem por Conglomerados em 3 estgios dois casos so considerados : Amostragem Aleatria Simples e a Amostragem p.p.s.

. AAS-SR em todos os Estgios de Seleo


Suponha que todas as unidades do primeiro estgio tenham o mesmo nmero de unidades secundrias, isto , M i = M , e as unidades secundrias tenham todas o mesmo nmero de unidades amostrais (unidades do terceiro estgio), isto ,

Pi j = P , i , j .

Seja n o nmero

de conglomerados selecionados por AAS-SR no primeiro estgio e seja m o nmero de unidades secundrias selecionadas por AAS-SR de cada conglomerado pertencente a amostra do primeiro estgio. Seja p o nmero de unidades amostrais selecionadas por AAS-SR de cada unidade secundria escolhida no segundo estgio. Neste caso, os estimadores no-viciados da mdia e do total populacional so respectivamente,

y=

p n m 1 1 n yi j k = yi n m p i =1 j =1 k =1 n i =1

Y = N M P y
A varincia estimada de y dada por :

n Var ( y ) = ( 1 ) N
onde : 2 sb =

2 2 2 sb 1 m sw 1 p sp + (1 ) + (1 ) n N M m NM P p

2 1 n 1 n 2 1 m 2 2 2 ( yi . . y ) ; s w = s i ; s i = ( y i j . y i .. ) ; n 1 i = 1 n i =1 n 1 j = 1

sp =

1 m 2 si j ; n m j =1

si j =

p 1 2 ( yi j k y i j . ) ; p 1 k =1

. Amostragem p.p.s com Reposio no Primeiro Estgio de Seleo e AAS-SR

nos outros dois Estgios Unidades Amostrais Populacionais de Tamanhos Diferentes.


Suponha que a populao em estudo seja tal que N conglomerados populacionais tenham tamanhos diferentes, ou seja M i , i = 1, 2, . . . , N. Para cada uma das M i unidades amostrais secundrias seja Pi j o nmero de unidades amostrais populacionais do terceiro estgio. Suponha que os n conglomerados do primeiro estgio sejam selecionados atravs do mtodo P.P.S. com reposio, enquanto que as unidades amostrais do segundo e terceiro estgio sejam selecionadas por AAS-SR.

31

Mi Seja

pi =

i =1 j =1

j =1 N Mi

Pi j
a probabilidade de seleo de cada conglomerado

Pi j

populacional no primeiro estgio. Sejam

mi e pi j ,

repectivamente, o nmero de unidades

secundrias selecionadas de cada unidade primria no segundo estgio, e o nmero de unidades amostrais selecionadas de cada unidade secundria no terceiro estgio. Ento, neste caso os estimadores no-viciados para a mdia e o total populacional so respectivamente :

y=

1 n y n i =1 i
N Mi

( para a mdia populacional )

Y = ( Pi j ) y
i =1 j =1

( para o total populacional )

A varincia estimada de

dada por : n 1 2 ( yi . . y ) n 1 i =1

2 ar ( y ) = ( 1 n ) s b V N n

onde

2 sb =

e a varincia estimada de Y respectivamente,


i Var ( Y ) = ( Pi j ) Var ( y ) . i =1 j =1 N M 2

Caso o valor da constante estimada por ( N

( Pi j ) no
i =1 j =1

Mi

seja fornecida pelo usurio esta ser

m p
m=

) , onde

1 n mi e n i =1

p=

1 n n i =1

mi

j =1

pi j

Se o procedimento amostral utilizado nos segundos e terceiros estgios forem do tipo AAS com reposio a varincia estimada de y torna-se : 2 sb Var ( y ) = n

32

Nota: Os casos em que as unidades amostrais so selecionadas por Amostragem Aleatria Simples com reposio em umm ou mais estgios dos procedimentos amostrais tratados, as frmulas de varincia simplificam. Nestes casos, bastar eliminar das f'rmulas os fatores de correes finitas correposndentes aos estgios em que a Amostragem Aleatria Simples com reposio foi utilizada. No software Sampling estas estimativas so obtidas por meio da aproximao para o caso de amostragem em populaes infinitas, no havendo portanto, uma opo em separado para tratamento destes planos amostrais.

(4) Subamostragem estratificada


O software Sampling permite ao usurio a estimao da mdia e do total populacional quando a Subamostragem estratificada utilizada. Os estimadores utilizados so aqueles usuais de Amostragem Estratificada. Supondo-se que a populao esteja dividida em L estratos, e que as amostras sejam selecionadas de cada estrato de forma independente, os estimadores da mdia e do total populacional so dados por :

y st = Wh y h
h =1

onde Wh representa o pso do h-simo estrato da populao e y h representa o estimador da mdia populacional do h-simo estrato. Este estimador pode ser selecionado de acordo com aqueles disponveis para os casos de Amostragem por Conglomerados em 1,2 ou 3 estgios descritos anteriormente.

A varincia estimada de y st dada por :

Var ( y st ) = W h2 Var ( y h )
h =1

sendo que a Var ( y h ) calculada de acordo com o esquema amostral utilizado para a coleta de amostra em cada estrato e de acordo com as opes de estimao disponveis no software Sampling.
Os valores de Wh so dados respectivamente por : Nh

Wh =

h=1 i =1

i =1 L Nh

Mi
no caso de Amostragem por Conglomerados em 2 estgios ;

Mi

33

Nh

Wh =

h =1 i =1 j =1

i =1 j =1 L Nh Mi

Mi

Pi j
no caso de Amostragem por Conglomerados em 3 estgios.

Pi j

A constante N h representa o nmero total de conglomerados da populao do h-simo estrato. O estimador do total populacional dado por :

Yst = (

Nh Mi

h =1 i =1 j =1

Pi j ) y st

A varincia estimada de Yst dada por : Var ( y st ) = (


L Nh Mi

h =1 i =1 j =1

2 Pi j ) V ar ( y st )

34

Como Fazer uma Anlise


Este tpico tem como objetivo intensificar a relao entre o Sampling e o usurio. Desta forma, perguntas tais como: quais os comandos devem ser utilizados para se fazer uma anlise, como os dados devem estar estruturados ou como interpretar os resultados, sero naturalmente respondidas atravs de exemplos aplicados s mais variadas reas. Os exemplos citados ilustraro de forma clara e objetiva a utilizao das diversas tcnicas de amostragem implementadas no Sampling. Escolha uma das opes abaixo: Amostragem Aleatria Simples Amostragem Sistemtica Amostragem Tipo P.P.S. Amostragem por Conglomerados Subamostragem Amostragem Estratificada Clculo do Tamanho da Amostra Trabalhando Com Propores

35

Exemplo de Amostragem Aleatria Simples


Considerando o esquema de amostragem aleatria simples, duas situaes distintas podem ser avaliadas: Amostragem Aleatria Simples Com Reposio Amostragem Aleatria Simples Sem Reposio

36

Exemplo de Amostragem Aleatria Simples


Escolha o tipo de estimador com o qual voc deseja trabalhar: Estimador No Viciado Usual Estimador Razo Estimador Regresso

37

Amostragem Aleatria Simples Com Reposio


A forma de anlise dos dados provenientes de uma Amostragem Aleatria Simples Com Reposio muito semelhante demonstrada para a Amostragem Aleatria Simples Sem Reposio, entretanto, necessrio que se faa a seguinte modificao:

Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 1

38

Exemplo de Amostragem Aleatria Simples Sem Reposio


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem aleatria simples sem reposio e estimador no viciado usual. Um tcnico est interessado em estimar o nmero total de rvores, maiores do que um certo tamanho especificado, em uma plantao de 150 hectares. Esta informao ser utilizada para determinar o volume total de madeira das rvores da plantao. Uma amostra aleatria simples de 20 pontos, cada um contendo 1 hectare, foi selecionada a partir do mapa da regio e o nmero de rvores maiores do que a especificao foram contadas em cada ponto. 1. Abra o arquivo EX_AASSREU.MTW. Observe a estrutura dos dados, na primeira coluna, temos o nmero dos pontos selecionados a partir do mapa, a segunda coluna contm os valores da varivel resposta e na terceira coluna so apresentados o tamanho da populao e o tamanho da amostra, respectivamente. Sero utilizadas para a anlise a segunda e a terceira coluna. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C2; SUBC > Tamanho C3.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2

Escolha o tipo de estimador: 1) Usual 2) Razo 3) Regresso Digite a opo 1

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

39

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global

. Tipo de Amostragem : Aleatria Simples Sem Reposio . Estimadores : Usuais

N 150

Mean 17.3500

StDev 0.8550315

I.C. ( 15.8715, 18.8285 )

Total 2602.5000

StDev 128.2547321

I.C. ( 2380.73, 2824.27 )

. T Value :

1.72914

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

40

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao estimador selecionado. No exemplo acima, os pontos de coleta dos dados foram selecionados por amostragem aleatria simples sem reposio sendo o estimador no viciado usual. N = 150. Representa o tamanho da populao. No exemplo, corresponde ao tamanho da plantao. Mean = 17.35. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 17.35 uma estimativa do nmero mdio de rvores maiores do que o tamanho especificado por ponto (1 hectare). StDev = 0.8550315. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 15.8715 , 18.8285 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 15.8715 representa o limite inferior e 18.8285 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio populacional de rvores com tamanho superior ao especificado por ponto.

Total = 2602.5000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de rvores com tamanho maior do que o especificado na plantao de 150 hectares. StDev = 128.2547321. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 2380.73, 2824.27 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 2380.73 representa o limite inferior e 2824.27 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total populacional de rvores com tamanho maior do que o especificado na plantao de 150 hectares. T Value = 1.72914. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 19 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

39

Exemplo de Amostragem Aleatria Simples Sem Reposio


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem aleatria simples sem reposio e estimador razo. Uma empresa deseja estimar a quantidade mdia de dinheiro gasto em despesas mdicas com empregados durante o primeiro trimestre do ano. Relatrios fiscais do ano anterior mostram que a quantidade mdia de dinheiro gasto no primeiro quadrimestre do ano passado foi de $32,50. Uma amostra aleatria simples de 100 registros foi retirada a partir de uma populao de 1000 empregados. 1. Abra o arquivo EX_AASSRERZ.MTW. Observe a estrutura dos dados, na primeira coluna, temos o nmero dos registros selecionados a partir da populao de 1000 empregados, a segunda coluna contm os valores da varivel auxiliar, a terceira coluna apresenta os valores da varivel resposta e na quarta coluna so apresentados o tamanho da populao e o tamanho da amostra, respectivamente. Sero utilizadas para a anlise a segunda, a terceira e a quarta coluna. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C3; SUBC > Auxiliar C2; SUBC > Tamanho C4.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2

Escolha o tipo de estimador: 1) Usual 2) Razo 3) Regresso Digite a opo 2

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

40

Deseja entrar com o(s) valor(es) da Mdia da Varivel Auxiliar? Digite YES Digite o(s) valor(es) de Mx: Digite 32.5

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global

. Tipo de Amostragem : Aleatria Simples Sem Reposio . Estimadores : Razo

N 1000

Mean 34.0532

StDev 0.8273509

I.C. ( 32.6923, 35.4140 )

Total 34053.1661

StDev 827.3509010

I.C. ( 32692.3, 35414.0 )

Ratio 1.0478

StDev 0.0254570

I.C. ( 1.00592, 1.08966 )

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

41

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao estimador selecionado. No exemplo acima, os registros dos empregados foram selecionados por amostragem aleatria simples sem reposio sendo o estimador razo. N = 1000. Representa o tamanho da populao. No exemplo, corresponde ao nmero de empregados da empresa. Mean = 34.0532. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 34.0532 uma estimativa da quantidade mdia de dinheiro gasto pela empresa em despesas mdicas com empregados no primeiro trimestre do ano. StDev = 0.8273509. Representa uma estimativa do desvio padro da mdia populacional da varivel resposta. I.C. = ( 32.6923, 35.4140 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 32.6923 representa o limite inferior e 35.4140 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade mdia populacional de dinheiro gasto pela empresa em despesas mdicas com os empregados no primeiro trimestre do ano. Total = 34053.1661. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da quantidade total de dinheiro gasto pela empresa em despesas mdicas com os empregados no primeiro trimestre do ano. StDev = 827.3509010. Representa uma estimativa do desvio padro do total populacional da varivel resposta. I.C. = ( 32692.3, 35414.0 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 32692.3 representa o limite inferior e 35414.0 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade total de dinheiro gasto pela empresa em despesas mdicas com os empregados no primeiro trimestre do ano. Ratio = 1.0478. Representa uma estimativa da razo populacional entre os totais populacionais da varivel resposta e da varivel auxiliar. No exemplo, corresponde a razo entre a quantidade total de dinheiro gasto pela empresa em despesas mdicas com empregados no primeiro trimestre deste ano e o primeiro quadrimestre do ano passado. StDev = 0.0254570. Representa uma estimativa do desvio padro da razo amostral entre os totais populacionais da varivel resposta e da varivel auxiliar. I.C. = ( 1.00592, 1.08966 ). Este um intervalo de confiana de 95% para a razo populacional entre os totais populacionais da varivel resposta e da varivel auxiliar baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1.00592 representa o limite inferior e 1.08966 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a razo entre a quantidade total de dinheiro gasto pela empresa em despesas mdicas com empregados no primeiro trimestre deste ano e o primeiro quadrimestre do ano passado. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.

42

Exemplo de Amostragem Aleatria Simples Sem Reposio


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem aleatria simples sem reposio e estimador regresso. O Ministrio da Educao e Cultura interessado em avaliar o reflexo de algumas caractersticas do ensino mdio sobre o ensino superior, aplica uma prova de matemtica nos 486 estudantes aprovados no vestibular para a rea de cincias exatas de uma universidade. A nota mdia obtida na prova foi de 52 pontos. Atravs do procedimento de amostragem aleatria simples sem reposio, dos 486 estudantes, 10 foram selecionados e tiveram o seu rendimento avaliado na disciplina clculo I. O objetivo do Ministrio estimar a nota mdia obtida pelos estudantes aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. 1. Abra o arquivo EX_AASSRERG.MTW. Observe a estrutura dos dados, na primeira coluna, temos o nmero dos estudantes selecionados a partir dos 486 aprovados no vestibular, a segunda coluna contm os valores da varivel auxiliar, a terceira apresenta os valores da varivel resposta e na quarta coluna so apresentados o tamanho da populao e o tamanho da amostra, respectivamente. Sero utilizadas para a anlise a segunda, a terceira e a quarta coluna. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C3; SUBC > Auxiliar C2; SUBC > Tamanho C4.

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2

Escolha o tipo de estimador: 1) Usual 2) Razo 3) Regresso Digite a opo 3

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

43

Digite o(s) valor(es) da Mdia da Varivel Auxiliar: Digite 52.

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global

. Tipo de Amostragem : Aleatria Simples Sem Reposio . Estimadores : Regresso

. Coef. Angular

: 0.7656

N 486

Mean 80.5934

StDev 2.7238672

I.C. ( 75.6002, 85.5865 )

Total 39168.3783

StDev 1323.7994582

I.C. ( 36741.7, 41595.1 )

. T Value :

1.83311

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao estimador selecionado. No exemplo acima, os registros dos empregados foram selecionados por amostragem aleatria simples sem reposio sendo o estimador regresso. Coef. Angular = 0.7656. Representa uma estimativa da mudana ocasionada na varivel resposta ao se acrescentar uma unidade a varivel auxiliar. N = 486. Representa o tamanho da populao. No exemplo, corresponde ao nmero de estudantes aprovados no vestibular para a rea de cincias exatas. Mean = 80.5934. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 80.5934 uma estimativa da nota mdia obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. StDev = 2.7238672. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

44

I.C. = ( 75.6002, 85.5865 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 75.6002 representa o limite inferior e 85.5865 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. Total = 39168.3783. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da nota total obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. StDev = 1323.7994582. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 36741.7, 41595.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 36741.7 representa o limite inferior e 41595.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota total obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. T Value = 1.83311. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 9 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

45

Exemplo de Amostragem Sistemtica


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem sistemtica. Os administradores de um parque florestal desejam estimar o nmero mdio de pessoas por automvel que visitam a rea em um certo feriado nacional. Experincias passadas mostraram que aproximadamente 400 automveis entram no parque nesta data. Os administradores decidem tomar uma amostra sistemtica de 80 automveis. Desta forma, os funcionrios iro contar o nmero de pessoas, a cada cinco automveis, que passarem pela portaria, a comear pelo segundo automvel (escolhido aleatoriamente). 1. Abra o arquivo EX_AS.MTW. Observe a estrutura dos dados, na primeira coluna, temos a ordem de passagem dos automveis selecionados pela portaria, a segunda coluna contm os valores da varivel resposta e na terceira coluna so apresentados o tamanho da populao e o tamanho da amostra, respectivamente. Apenas a segunda e a terceira coluna sero utilizadas para a anlise. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C2; SUBC > Tamanho C3.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 3

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

Deseja correlao entre elementos da mesma amostra? Digite YES

46

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global

. . . .

Tipo de Amostragem : Amostragem Sistemtica Mtodo 1 : Amostragem Aleatria Simples Mtodo 2 : Amostragem Sistemtica Repetida Mtodo 3 : Diferena

N 400

Mean 4.1625

Total 1665.0000

StDev Mean Method 1 0.1649271 Method 2 0.1625000 Method 3 0.1680115

StDev Total Method 1 65.9708413 Method 2 65.0000000 Method 3 67.2045809

IC Mean Method 1 ( 3.89122, 4.43378 ) Method 2 ( 3.89521, 4.42979 ) Method 3 ( 3.88615, 4.43885 )

IC Total Method 1 ( 1556.49, 1773.51 ) Method 2 ( 1558.08, 1771.92 ) Method 3 ( 1554.46, 1775.54 )

Estrato -------

Correlation -----------

-0.0125313

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05. 47

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao mtodo de estimao da varincia. No exemplo acima, os automveis foram selecionados por amostragem sistemtica sendo a varincia estimada pelos mtodos 1, 2 e 3. N = 400. Representa o tamanho da populao. No exemplo, corresponde ao nmero de automveis que visitaram o parque em um certo feriado nacional. Mean = 4.1625. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.1625 uma estimativa do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional. StDev Mean Method 1 = 0.1649271. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 0.1625000. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 0.1680115. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 3. Total = 1665.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde ao nmero total de pessoas que visitaram o parque em um certo feriado nacional. StDev Total Method 1 = 65.9708481. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 65.0000000. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 67.2045822. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 3. I.C. Mean Method 1 = ( 3.89122, 4.43378 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.89122 representa o limite inferior e 4.43378 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional. Method 2 = ( 3.89521, 4.42979 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.89521 representa o limite inferior e 4.42979 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional. Method 3 = ( 3.88615, 4.43885 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.88615 representa o limite inferior e 4.43885 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional.

48

I.C. Total Method 1 = ( 1556.49, 1773.51 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1556.49 representa o limite inferior e 1773.51 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de pessoas que visitaram o parque em um certo feriado nacional. Method 2 = ( 1558.08, 1771.92 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1558.08 representa o limite inferior e 1771.92 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de pessoas que visitaram o parque em um certo feriado nacional. Method 3 = ( 1554.46, 1775.54 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1554.46 representa o limite inferior e 1775.54 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de pessoas que visitaram o parque em um certo feriado nacional. estimativa da correlao intra-classe das unidades Correlacion = -0.0125313. Representa uma populacionais, e neste exemplo indica que a aproximao pela amostragem aleatria simples sem reposio razovel. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.

OBS: A estimao da varincia populacional e por conseqncia a construo dos intervalos de confiana via mtodo 2 considera somente parties em que o tamanho da amostra (n) um mltiplo de m=2 ou m=3. Portanto, caso isto no ocorra, todas as estatsticas baseadas no mtodo 2 no sero apresentadas.

49

Exemplo de Clculo do Tamanho da Amostra


Escolha o tipo de procedimento amostral utilizado para a coleta dos dados: Amostragem Aleatria Simples Amostragem Sistemtica Amostragem Estratificada

50

Exemplo de Amostragem Sistemtica


Para calcular o tamanho da amostra quando o planejamento utilizado na coleta dos dados o de Amostragem Sistemtica, o Sampling faz uso das mesmas expresses da Amostragem Aleatria Simples. As caractersticas desta aproximao podem ser avaliadas na seo Clculo do Tamanho da Amostra Amostragem Sistemtica. Portanto, a forma de anlise para este caso exatamente a mesma proposta em Clculo do Tamanho da Amostra - Amostragem Aleatria Simples.

51

Exemplo de Amostragem Aleatria Simples


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo clculo do tamanho da amostra quando as unidades amostrais so selecionadas pelo procedimento de amostragem aleatria simples sem reposio. Um pesquisador est interessado em estimar o peso mdio ganho, em 4 semanas, por 1000 galinhas alimentadas com um novo tipo de rao. Utilizando dados de estudos anteriores, o pesquisador decide 2 aproximar a varincia populacional por 36 gr . Determine o nmero de galinhas que devem ser selecionadas 2 para que se tenha uma varincia global de estimao igual a 0.25 gr . 1. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 2. Session: MTB > %Sampling

3. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 1 Digite o nmero de elementos na populao: Digite 1000 Digite a varincia global: Digite 0.25 Digite o(s) desvio(s) padro amostral(is): Digite 6

52

4. Impresso dos Resultados

________________________________________________________________________ Estimao do Tamanho da Amostra

. Mtodo de Amostragem . Varincia Global escolhida

: Aleatria Simples Sem Reposio : 0.25

Tamanho Total da Amostra

126

________________________________________________________________________
OBS: Para o caso em que o planejamento utilizado na coleta dos dados o de amostragem aleatria simples com reposio, o Sampling utiliza uma aproximao pela amostragem aleatria simples sem reposio. Portanto, o procedimento para clculo do tamanho da amostra para este caso o mesmo descrito acima. Maiores detalhes podem ser vistos em Clculo do Tamanho da Amostra - Amostragem Aleatria Simples Com Reposio.

53

Exemplo de Amostragem Estratificada


Aps o clculo do tamanho total da amostra (n) existem vrias formas de se distribuir as observaes entre os estratos. Cada configurao resultante tm caractersticas particulares que podem ser avaliadas em Clculo do Tamanho da Amostra - Amostragem Estratificada. Escolha o mtodo de alocao do tamanho total da amostra: Alocao tima Minimizando Custo e Alocao tima Minimizando Varincia Alocao Proporcional Minimizando Custo e Alocao Proporcional Minimizando Varincia

54

Exemplo de Amostragem Estratificada - Alocao tima


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo clculo do tamanho da amostra e alocao tima, quando as unidades amostrais so selecionadas pelo procedimento de amostragem estratificada combinada a amostragem aleatria simples sem reposio. Uma agncia de publicidade est interessada em determinar o quanto ela deve enfatizar em propagandas de televiso em uma certa cidade. Para isso, ela decidiu conduzir uma pesquisa para estimar o nmero mdio de horas por semana que os moradores assistem televiso. A cidade est dividida em trs reas: rea A, rea B e rea rural. A rea A foi construda em torno de uma indstria. A maioria de seus moradores trabalha nela e tm crianas em idade escolar. A rea B subrbio de uma cidade vizinha. Os moradores so mais velhos e tem poucas crianas em casa. Existem 155 moradores na rea A, 62 na rea B e 93 na rea rural. A agncia acha que obter alguma informao referente a um morador da rea rural mais caro do que obter alguma informao referente a um morador da rea A ou B. O custo por morador na rea A e B foi estimado como sendo de $9.00 e o custo por morador na rea rural como $16.00. Atravs de um estudo piloto, os desvios padro de cada estrato foram aproximados por 1 = 5h , 2 = 15h e 3 = 10h . Qual o tamanho total da amostra e o tamanho de cada um dos estratos para que: o custo seja mnimo e a varincia global igual a 1h2.
 

1. Abra o arquivo EX_CTAEAO.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).

3. Session:

MTB > %Sampling; SUBC > Tamanho C1.

4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 1

55

Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 1 Deseja atribuir valor ao custo da unidade amostral? Digite YES Digite o custo por unidade amostral: Digite 9 9 16 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter

Digite a varincia global: Digite 1 Digite os desvios padro amostrais: Digite 5 15 10 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter

Deseja calcular o valor do tamanho total da amostra? Digite YES

56

5. Impresso dos Resultados

________________________________________________________________________ Estimao do Tamanho da Amostra

. . . .

Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos

: : : : :

tima Custo Estratificada Aleatria Simples Sem Reposio 1

. Varincia Global escolhida

Tamanho Total da Amostra

57

Alocao

Estrato 1

Tamanho 18

22

17

________________________________________________________________________

57

6. Interpretao dos Resultados

Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem e a varincia global escolhida. No exemplo acima, a agncia selecionar os moradores pelo mtodo de amostragem estratificada com amostragem aleatria simples sem reposio em cada rea, alm disso, foi utilizada a alocao tima minimizando custo para distribuir o 2 tamanho total da amostra entre as reas e uma varincia global de 1h . Tamanho Total da Amostra = 57. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com varincia global igual a V. No exemplo, corresponde a uma estimativa do nmero total de moradores que devem ser entrevistados para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso 2 seja 1h . Alocao Estrato 1 - Tamanho = 18. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea A para que o custo total final da pesquisa seja mnimo. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea B para que o custo total final da pesquisa seja mnimo. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea rural para que o custo total final da pesquisa seja mnimo.

58

A varincia global seja mnima e o custo total final igual a $1000.

1. Abra o arquivo EX_CTAEAO.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).

3. Session:

MTB > %Sampling; SUBC > Tamanho C1.

4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 1 Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 2 Digite o custo total final: Digite 1000 Deseja atribuir valor ao custo da unidade amostral? Digite YES Digite o custo por unidade amostral: Digite 9 9 16 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter

59

Digite os desvios padro amostrais: Digite 5 15 10 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter

Deseja calcular o valor do tamanho total da amostra? Digite YES

5. Impresso dos Resultados

________________________________________________________________________ Estimao do Tamanho da Amostra

. . . .

Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos

: : : :

tima Varincia Global Estratificada Aleatria Simples Sem Reposio 1000

. Valor de custo total escolhido :

Tamanho Total da Amostra

90

Alocao

Estrato 1

Tamanho 29

35

26

________________________________________________________________________

60

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem e o custo total final escolhido. No exemplo acima, a agncia selecionar os moradores pelo mtodo de amostragem estratificada com amostragem aleatria simples sem reposio em cada rea, alm disso, foi utilizada a alocao tima minimizando a varincia global para distribuir o tamanho total da amostra entre as reas e um custo total final igual a $1000. Tamanho Total da Amostra = 90. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com custo total final igual a C. No exemplo, corresponde a uma estimativa do nmero total de moradores que devem ser entrevistados para que o custo total final da pesquisa seja $1000. Alocao Estrato 1 - Tamanho = 29. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea A para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso seja mnima. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea B para que para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso seja mnima. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea rural para que para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso seja mnima. OBS: Para o caso em que o planejamento utilizado na coleta dos dados o amostragem estratificada combinada a amostragem aleatria simples com reposio, o Sampling utiliza uma aproximao pela amostragem aleatria simples sem reposio. Portanto, o procedimento para clculo do tamanho da amostra para este caso o mesmo descrito acima. Maiores detalhes podem ser vistos em Clculo do Tamanho da Amostra - Amostragem Estratificada.

Exemplo de Amostragem Estratificada - Alocao Proporcional


61

O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo clculo do tamanho da amostra e alocao proporcional quando as unidades amostrais so selecionadas pelo procedimento de amostragem estratificada combinada a amostragem aleatria simples sem reposio. Uma indstria siderrgica est interessada em estimar o teor mdio de ferro do Sinter Feed B, que ser empilhado em 24 horas, atravs das estimativas do teor mdio de ferro do Sinter Feed 1, Sinter Feed (2+3) e Sinter Feed 4. Experincias anteriores indicam que uma boa estimativa do desvio padro do teor mdio de ferro do Sinter Feed 1 1 = 1.4% , do Sinter Feed (2+3) 2 = 1.2% , do Sinter Feed 4 3 = 11% . Alm . disso, a quantidade de minrio de ferro normalmente produzida no perodo : Sinter Feed 1 Sinter Feed (2+3) Sinter Feed 4 13800 t; 23400 t; 22800 t.
  

Qual o nmero total de incrementos da amostra e o nmero em cada que estrato devem ser selecionados de forma que: o custo seja mnimo e a varincia global igual a 0.02%2.

1. Abra o arquivo EX_CTAEAP.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Tamanho C1.

4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 2

62

Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 1 Deseja atribuir valor ao custo da unidade amostral? Digite NO Digite a varincia global: Digite 0.02 Digite os desvios padro amostrais: Digite 1.4 1.2 1.1 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter

Deseja calcular o valor do tamanho total da amostra? Digite YES

63

5. Impresso dos Resultados

________________________________________________________________________ Estimao do Tamanho da Amostra

. . . .

Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos

: : : :

Proporcional Custo Estratificada Aleatria Simples Sem Reposio 1

. Custo Unid. Amostral Constante :

. Varincia Global escolhida

0.02

Tamanho Total da Amostra

73

Alocao

Estrato 1

Tamanho 17

28

28

________________________________________________________________________

64

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem, ao custo da unidade amostral e a varincia global escolhida. No exemplo acima, a indstria selecionar os incrementos pelo mtodo de amostragem estratificada combinada a amostragem aleatria simples sem reposio, alm disso, foi utilizada a alocao proporcional minimizando custo para distribuir o tamanho total da amostra entre os tipos de Sinter Feed. O custo para 2 se amostrar o minrio em cada tipo foi considerado constante e a varincia global escolhida foi de 0.02% . Tamanho Total da Amostra = 73. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com varincia global igual a V. No exemplo, corresponde a uma estimativa do nmero total de incrementos que devem ser amostrados para que a 2 varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja 0.02% . Alocao Estrato 1 - Tamanho = 18. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 1 que devem ser selecionados para que o custo total final seja mnimo. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de incrementos do Sinter Feed (2+3) que devem ser selecionados para que o custo total final seja mnimo. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 4 que devem ser selecionados para que o custo total final seja mnimo.

65

A varincia global seja mnima e o custo total final igual a $100. Suponha que o custo para se amostrar um incremento do Sinter Feed 1 $0.90, do Sinter Feed (2+3) $1.80 e do Sinter Feed 4 $1.30.

1. Abra o arquivo EX_CTAEAP.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).

3. Session:

MTB > %Sampling; SUBC > Tamanho C1.

4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 2 Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 2

Digite o custo total final: Digite 100 Deseja atribuir valor ao custo da unidade amostral? Digite YES

66

Digite o custo por unidade amostral: Digite 0.90 1.80 1.30 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter

Digite os desvios padro amostrais: Digite 1.4 1.2 1.1 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter

Deseja calcular o valor do tamanho total da amostra? Digite YES

67

5. Impresso dos Resultados

________________________________________________________________________ Estimao do Tamanho da Amostra

. . . .

Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos

: : : :

Proporcional Varincia Global Estratificada Aleatria Simples Sem Reposio 100

. Valor de custo total escolhido :

Tamanho Total da Amostra

75

Alocao

Estrato 1

Tamanho 17

29

29

________________________________________________________________________

68

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem e o custo total final escolhido. No exemplo acima, a indstria selecionar o minrio de ferro pelo mtodo de amostragem estratificada com amostragem aleatria simples sem reposio em cada tipo de Sinter Feed, alm disso, foi utilizada a alocao proporcional minimizando a varincia global para distribuir o tamanho total da amostra entre os tipos e um custo total final igual a $100. Tamanho Total da Amostra = 90. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com custo total final igual a C. No exemplo, corresponde a uma estimativa do nmero total de incrementos que devem ser amostrados que para que o custo total final seja $100. Alocao Estrato 1 - Tamanho = 29. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 1 que devem ser selecionados para que a varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja mnima. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de incrementos do Sinter Feed (2+3) que devem ser selecionados para que a varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja mnima. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 4 que devem ser selecionados para que a varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja mnima. OBS: Para o caso em que o planejamento utilizado na coleta dos dados o amostragem estratificada combinada a amostragem aleatria simples com reposio, o Sampling utiliza uma aproximao pela amostragem aleatria simples sem reposio. Portanto, o procedimento para clculo do tamanho da amostra para este caso o mesmo descrito acima. Maiores detalhes podem ser vistos em Clculo do Tamanho da Amostra - Amostragem Estratificada.

69

Exemplo de Amostragem por Conglomerados


Considerando o esquema de amostragem por conglomerados, trs situaes distintas podem ser avaliadas: 1 Estgio 2 Estgios 3 Estgios

70

(Para 1 e 2 estgios.)

Exemplo de Amostragem por Conglomerados


Escolha o tipo de estimador com o qual voc deseja trabalhar: Estimador P.P.S. Estimador Razo Estimador No Viciado - Unidades de mesmo tamanho em cada estgio Estimador No Viciado - Unidades de tamanho diferente em cada estgio

71

(Para 3 estgios.)

Exemplo de Amostragem por Conglomerados


Escolha o tipo de estimador com o qual voc deseja trabalhar: Estimador P.P.S. Estimador No Viciado - Unidades de mesmo tamanho em cada estgio

72

Exemplo de Amostragem por Conglomerados - 1 Estgio


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em um estgio e estimador P.P.S. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. Existem 5000 moradores na rea e eles esto distribudos em 40 setores censitrios. Sabe-se que o nmero de jornais comprados altamente correlacionado com o nmero de moradores do setor. Uma amostra de 4 setores selecionada pelo procedimento de amostragem proporcional ao tamanho e todos os seus moradores so entrevistados. 1. Abra o arquivo EX1_AC1E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o nmero de jornais comprados no ltimo bimestre por cada morador dos conglomerados selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao e o nmero populacional de elementos em cada um dos conglomerados selecionados, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 100 primeiras observaes da coluna Nmero de Jornais Comprados so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 125 Pressione a tecla Enter Pressione a tecla Enter

73

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Um : P.P.S. 125.00

. Tamanho Mdio Populacional dos Congl. :

N 40

Mean 5.1242

StDev 0.7761477

I.C. ( 3.84752, 6.40082 )

n 4

Total 25620.8333

StDev 3880.7386942

I.C. ( 19237.6, 32004.1 )

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

74

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador P.P.S. Alm disso, o tamanho mdio populacional dos conglomerados de 125 moradores. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 5.1242. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 5.1242 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.7761477. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 3.84752, 6.40082 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.84752 representa o limite inferior e 6.40082 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 25620.8333. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 3880.7386942. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 19237.6, 32004.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 19237.6 representa o limite inferior e 32004.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

75

Exemplo de Amostragem por Conglomerados - 1 Estgio


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em um estgio e estimador razo. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. Existem 5000 moradores na rea e eles esto distribudos em 40 setores censitrios. Uma amostra de 4 setores selecionada pelo procedimento de amostragem aleatria simples sem reposio e todos os seus moradores so entrevistados. 1. Abra o arquivo EX1_AC1E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o nmero de jornais comprados no ltimo bimestre por cada morador dos conglomerados selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao e o nmero populacional de elementos em cada um dos conglomerados selecionados, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 100 primeiras observaes da coluna Nmero de Jornais Comprados so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 125 Pressione a tecla Enter Pressione a tecla Enter

76

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Um : Razo 125.00

. Tamanho Mdio Populacional dos Congl. :

N 40

Mean 5.1514

StDev 0.5520147

I.C. ( 4.24345, 6.05941 )

n 4

Total 25757.1429

StDev 2760.0735749

I.C. ( 21217.2, 30297.1 )

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

77

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador razo. Alm disso, o tamanho mdio populacional dos conglomerados de 125 moradores. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 5.1514. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 5.1514 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.5520147. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.24345, 6.05941 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.24345 representa o limite inferior e 6.05941 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 25757.1429. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 2760.0735749. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 21217.2, 30297.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 21217.2 representa o limite inferior e 30297.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

78

Exemplo de Amostragem por Conglomerados - 1 Estgio


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em um estgio e estimador no viciado - unidades de mesmo tamanho. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. Existem 4000 moradores na rea e eles esto distribudos em 40 setores censitrios cada um contendo 100 moradores. Uma amostra de 4 setores selecionada pelo procedimento de amostragem aleatria simples sem reposio e todos os seus moradores so entrevistados. 1. Abra o arquivo EX2_AC1E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o nmero de jornais comprados no ltimo bimestre por cada morador dos conglomerados selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao, o nmero de conglomerados amostrados e seu nmero populacional de elementos, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

79

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Um : No Viciado Unidades de Mesmo Tamanho 100.00

. Tamanho Mdio Populacional dos Congl. :

N 40

Mean 5.0125

StDev 0.4295412

I.C. ( 4.30597, 5.71903 )

n 4

Total 20050.0000

StDev 1718.1647185

I.C. ( 17223.9, 22876.1 )

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

80

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador no viciado - unidades de mesmo tamanho. Neste caso, todos os conglomerados tm o mesmo tamanho populacional. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 5.0125. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 5.0125 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.4295412. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.30597, 5.71903 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.30597 representa o limite inferior e 5.71903 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 20050.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 1718.1647185. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 17223.9, 22876.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 17223.9 representa o limite inferior e 22876.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

81

Exemplo de Amostragem por Conglomerados - 1 Estgio


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em um estgio e estimador no viciado - unidades de tamanho diferente. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. Existem 5000 moradores na rea e eles esto distribudos em 40 setores censitrios. Uma amostra de 4 setores selecionada pelo procedimento de amostragem aleatria simples sem reposio e todos os seus moradores so entrevistados. 1. Abra o arquivo EX1_AC1E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o nmero de jornais comprados no ltimo bimestre por cada morador dos conglomerados selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao e o nmero populacional de elementos em cada um dos conglomerados selecionados, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 100 primeiras observaes da coluna Nmero de Jornais Comprados so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 125 Pressione a tecla Enter Pressione a tecla Enter

82

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Um : No Viciado Unidades de Tamanho Diferente 125.00

. Tamanho Mdio Populacional dos Congl. :

N 40

Mean 3.6060

StDev 0.6090547

I.C. ( 2.60419, 4.60781 )

n 4

Total 18030.0000

StDev 3045.2733867

I.C. ( 13021.0, 23039.0 )

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

83

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador no viciado - unidades de tamanho diferente. Alm disso, o tamanho mdio populacional dos conglomerados de 125 moradores. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 3.6060. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 3.6060 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.6090547. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 2.60419, 4.60781 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 2.60419 representa o limite inferior e 4.60781 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 18030.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 3045.2733867. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 13021.0, 23039.0 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 13021.0 representa o limite inferior e 23039.0 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

84

Exemplo de Amostragem por Conglomerados - 2 Estgios


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador P.P.S. Os tcnicos de uma indstria de minerao desejam estimar o teor mdio de ferro (%) das 3600 toneladas do Sinter Feed B que ser carregado em 60 vages. Os vages tm capacidades de armazenamento diferentes variando de 20 a 100 toneladas. Sabe-se que o carregamento bastante homogneo e existe uma alta correlao entre a capacidade do vago e o teor de ferro do minrio. Selecionou-se 10 vages atravs de uma amostragem proporcional ao tamanho e de cada um dos vages selecionados retirou-se, aleatoriamente, uma amostra de incrementos: Vago 01 02 03 04 05 06 07 08 09 10 Nmero de incrementos retirados 3 6 5 3 4 4 4 5 3 5

1. Abra o arquivo EX1_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o teor de ferro (%) dos incrementos pertencentes aos vages selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao e o nmero de elementos amostrados em cada um dos conglomerados selecionados, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 3 primeiras observaes da coluna Teor de Ferro (%) so referentes ao 1 conglomerado, as 6 subseqentes ao 2, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2

85

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES Pressione a tecla Enter 100000 Pressione a tecla Enter Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Dois : P.P.S. 100000.00

. Tamanho Mdio Populacional dos Congl. :

N 60

Mean 64.0683

StDev 0.0034816

I.C. ( 64.0625, 64.0740 )

n 10

Total 384409600.0000

StDev 20889.5685469

I.C. ( 3.84E+08, 3.84E+08 )

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

86

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os vages foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador P.P.S. Alm disso, o tamanho mdio populacional dos conglomerados de 100000 incrementos. N = 60. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de vages do carregamento. Mean = 64.0683. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 64.0683 uma estimativa do teor mdio de ferro (%) do Sinter Feed B. StDev = 0.0034816. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 64.0625, 64.0740 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 64.0625 representa o limite inferior e 64.0740 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o teor mdio de ferro(%) do minrio carregado nos vages. n = 10. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de vages selecionados. Total = 384409600.0000. Representa uma estimativa do total populacional da varivel resposta. StDev = 20889.5685469. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 3.84E+08, 3.84E+08 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

Exemplo de Amostragem por Conglomerados - 2 Estgios


87

O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador razo. Os tcnicos de uma indstria siderrgica desejam estimar o teor mdio de ferro (%) das 3600 toneladas do Sinter Feed B que ser carregado em 60 vages. Para isto, selecionou-se 10 vages atravs de uma amostragem aleatria simples e de cada um dos vages selecionados retirou-se, aleatoriamente, uma amostra de incrementos: Vago 01 02 03 04 05 06 07 08 09 10 Nmero de incrementos retirados 3 6 5 3 4 4 4 5 3 5

1. Abra o arquivo EX1_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o teor de ferro (%) dos incrementos pertencentes aos vages selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao e o nmero de elementos amostrados em cada um dos conglomerados selecionados, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 3 primeiras observaes da coluna Teor de Ferro (%) so referentes ao 1 conglomerado, as 6 subseqentes ao 2, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).

3. Session:

MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2

88

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES Pressione a tecla Enter 100000 Pressione a tecla Enter Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Dois : Razo 100000.00

. Tamanho Mdio Populacional dos Congl. :

N 60

Mean 64.0700

StDev 0.0000001

I.C. ( 64.0700, 64.0700 )

n 10

Total 384420000.0000

StDev 0.8640988

I.C. ( 3.84E+08, 3.84E+08 )

. Z Value :

1.64485

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

89

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os vages foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador razo. Alm disso, o tamanho mdio populacional dos conglomerados de 100000 incrementos. N = 60. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de vages do carregamento. Mean = 64.0700. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 64.0700 uma estimativa do teor mdio de ferro (%) do Sinter Feed B. StDev = 0.0000001. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 64.0700, 64.0700 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 64.0700 representa o limite inferior e 64.0700 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o teor mdio de ferro (%) do minrio carregado nos vages. n = 10. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de vages selecionados. Total = 384420000.0000. Representa uma estimativa do total populacional da varivel resposta. StDev = 0.8640988. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 3.84E+08, 3.84E+08 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

Exemplo de Amostragem por Conglomerados - 2 Estgios


90

O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador no viciado - unidades de mesmo tamanho. Um socilogo est interessado em estimar o nmero total de pessoas aposentadas que residem em uma certa regio. Ele decide retirar atravs do procedimento de amostragem aleatria simples uma amostra de 4 setores censitrios a partir dos 30 que compem a regio e de cada um deles selecionar 6 domiclios, como apresentado na tabela a seguir: Setor Censitrio 6 19 24 29 Nmero de Domiclios 18 18 18 18 Nmero de domiclios selecionados 6 6 6 6 Nmero de pessoas aposentadas em cada domiclio selecionado 2, 0, 1, 3, 0, 1 1, 1, 0, 3, 2, 0 0, 0, 1, 1, 1, 2 3, 0, 2, 0, 2, 2

1. Abra o arquivo EX2_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados populacional e amostral e o nmero de unidades em cada conglomerado populacional e amostral, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).

3. Session:

MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2

91

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Dois : No Viciado Unidades de Mesmo Tamanho 18.00

. Tamanho Mdio Populacional dos Congl. :

N 30

Mean 1.1667

StDev 0.1431567

I.C. ( 0.921314, 1.41202 )

n 4

Total 630.0000

StDev 77.3045924

I.C. ( 497.509, 762.491 )

. T Value :

1.71388

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

92

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador no viciado - unidades de mesmo tamanho. Alm disso, o tamanho mdio populacional dos conglomerados de 18 residentes. N = 30. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios que compe a regio. Mean = 1.1667. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 1.1667 uma estimativa do nmero mdio de residentes aposentados por domiclio. StDev = 0.1431567. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 0.921314, 1.41202 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 0.921314 representa o limite inferior e 1.41202 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio de residentes aposentados por domiclio. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 630.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de pessoas aposentados que residem na regio. StDev = 77.3045924. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 497.509, 762.491 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 497.509 representa o limite inferior e 762.491 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total de pessoas aposentados que residem na regio. T Value = . Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 23 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

93

Exemplo de Amostragem por Conglomerados - 2 Estgios


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador no viciado - unidades de tamanho diferente. Um socilogo est interessado em estimar o nmero total de pessoas aposentadas que residem em uma certa regio. Ele decide retirar atravs do procedimento de amostragem aleatria simples uma amostra de 4 setores censitrios a partir dos 30 que compem a regio e de cada um deles selecionar um certo nmero de domiclios, como apresentado na tabela a seguir: Setor Censitrio 6 19 24 29 Nmero de Domiclios 18 14 9 12 Nmero de domiclios selecionados 6 3 3 4 Nmero de pessoas aposentadas em cada domiclio selecionado 2, 0, 1, 3, 0, 1 1, 1, 0 0, 0, 1 3, 0, 2, 0

Sabe-se que, em mdia, cada setor censitrio da regio contm 15 domiclios. 1. Abra o arquivo EX3_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados na populao, o nmero de unidades secundrias amostradas e o nmero de unidades secundrias populacional para cada conglomerado, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 6 primeiras observaes da coluna Nmero de Pessoas Aposentadas so referentes ao 1 conglomerado que apresenta tamanho populacional igual a 18, as 3 subseqentes ao 2 com tamanho populacional igual a 14, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2

94

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 Pressione a tecla Enter Pressione a tecla Enter

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

________________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Dois : No Viciado Unidades de Tamanho Diferente 15.00

. Tamanho Mdio Populacional dos Congl. :

N 30

Mean 0.8056

StDev 0.2486780

I.C. ( 0.369610, 1.24150 )

n 4

Total 362.5000

StDev 111.9050937

I.C. ( 166.324, 558.676 )

. T Value :

1.75305

________________________________________________________________________
OBS: Nvel de significncia igual 0.05.

95

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador no viciado - unidades de tamanho diferente. Alm disso, o tamanho mdio populacional dos conglomerados de 15 domiclios. N = 30. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios que compe a regio. Mean = 0.8056. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 0.2417 uma estimativa do nmero mdio de residentes aposentados por domiclio. StDev = 0.2486780. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 0.369610, 1.24150 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 0.369610 representa o limite inferior e 1.24150 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio de residentes aposentados por domiclio. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 362.5000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de pessoas aposentados que residem na regio. StDev = 111.9050937. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 166.324, 558.676 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 166.324 representa o limite inferior e 558.676 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total de pessoas aposentados que residem na regio. T Value = 1.75305. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 15 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

Exemplo de Amostragem por Conglomerados - 3 Estgios


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em trs estgios e estimador P.P.S. Um pesquisador est interessado em estimar o nmero total de operaes cesarianas realizadas no primeiro bimestre do ano em uma certa cidade. A cidade est subdividida em 4 regies contendo no total 20 maternidades. Como as regies apresentam uma grande variao de tamanho, o pesquisador resolveu amostr-las com probabilidade proporcional ao nmero de habitantes. Em cada regio selecionada ser retirada uma amostra de maternidades e de cada uma destas uma amostra de alas e ento ser verificado o nmero de cesarianas realizadas no primeiro bimestre do ano. Sabe-se que existem no total 400 alas, considerando-se as 20 maternidades. Regio Maternidade 2 3 5 1 2 Nmero de alas selecionadas 8 4 6 9 5 Nmero de cesarianas 21, 37, 38, 47, 33, 30, 43, 30 42, 34, 42, 37 35, 34, 41, 38, 47, 34 40, 49, 44, 52, 42, 50, 46, 50, 48 52, 44, 46, 47, 45

1 3

1. Abra o arquivo EX1_AC3E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados na populao e na amostra, o nmero de unidades secundrias amostradas em cada conglomerado e o nmero de unidades do terceiro estgio retiradas de cada unidade secundria, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 8 primeiras observaes da coluna Nmero de Cesarianas so referentes ao 1 conglomerado e a sua 1 unidade secundria, as 4 subseqentes ao 1 conglomerado e a sua 2 unidade secundria, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3

97

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 1 Deseja entrar com o nmero de elementos da populao? Digite YES 400 Pressione a tecla Enter Pressione a tecla Enter

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores . Nmero de elementos da populao : Conglomerados : Trs : P.P.S. : 400.00

N 4

Mean 41.8095

StDev 3.5186980

I.C. ( 36.0218, 47.5973 )

n 2

Total 16723.8095

StDev 1407.4792121

I.C. ( 14408.7, 19038.9 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

98

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao nmero de elementos da populao. No exemplo acima, as regies foram selecionados pelo procedimento de amostragem por conglomerados em trs estgios sendo o estimador P.P.S. Alm disso, existem no total 400 alas de hospital na cidade. N = 4 Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de regies em que a cidade est dividida. Mean = 41.8095. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 41.8095 uma estimativa do nmero mdio de operaes cesarianas realizadas por ala de hospital. StDev = 3.5186980. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 36.0218, 47.5973 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 36.0218 representa o limite inferior e 47.5973 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de operaes cesarianas realizadas por ala de hospital. n = 2. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de regies da cidade selecionadas. Total = 16723.8095. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de operaes cesarianas realizadas na cidade no primeiro bimestre do ano. StDev = 1407.4792121. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 14408.7, 19038.9 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 14408.7 representa o limite inferior e 19038.9 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de operaes cesarianas realizadas na cidade no primeiro bimestre do ano. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

99

Exemplo de Amostragem por Conglomerados - 3 Estgios


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em trs estgios e estimador no viciado - unidades de mesmo tamanho. Com o objetivo de melhorar o servio telefnico, um dos diretores executivos de uma empresa decide estimar o nmero total de chamadas telefnicas efetuadas por secretrias durante um dia de trabalho. A empresa composta por uma matriz e trs filiais, cada uma contendo 12 departamentos, e elas efetuam aproximadamente o mesmo nmero de chamadas telefnicas dirias. Cada departamento emprega 20 secretrias e o nmero de chamadas efetuadas varia consideravelmente entre elas. Firma Departamento 2 6 11 20 5 6 13 18 Nmero de secretrias 20 20 20 20 20 20 20 20 Nmero de secretrias selecionadas 10 10 10 10 10 10 10 10 Nmero de chamadas efetuadas 5, 10, 0, 20, 11, 6, 3, 15, 5, 0 15, 2, 7, 11, 0, 25, 30, 5, 9, 15 10, 35, 21, 12, 3, 8, 15, 0, 21, 30 1, 14, 5, 50, 12, 2, 21, 13, 1, 10 15, 0, 0, 29, 10, 6, 3, 15, 5, 1 25, 2, 7, 1, 0, 35, 30, 5, 0, 9 40, 15, 21, 2, 3, 14, 15, 0, 11, 38 21, 4, 59, 5, 21, 12, 1, 13, 1, 10

Matriz

Filial 2

1. Abra o arquivo EX2_AC3E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados na populao e na amostra, o nmero de unidades secundrias na populao e na amostra e o nmero de unidades do terceiro estgio na populao e na amostra, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 8 primeiras observaes da coluna Nmero de Cesarianas so referentes ao 1 conglomerado e a sua 1 unidade secundria, as 4 subseqentes ao 1 conglomerado e a sua 2 unidade secundria, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3

100

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 1 Deseja entrar com o nmero de elementos da populao? Digite YES 400 Pressione a tecla Enter Pressione a tecla Enter

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

101

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. Tipo de Amostragem . Nmero de Estgios . Estimadores : Conglomerados : Trs : No Viciado Unidades de Mesmo Tamanho

Tamanho Populacional . Unidades do segundo estgio : 12.00

. Unidades do terceiro estgio Tamanho Amostral . Unidades do segundo estgio

20.00

4.00

. Unidades do terceiro estgio

10.00

N 4

Mean 12.2750

StDev 0.8262214

I.C. ( 10.9160, 13.6340 )

n 2

Total 11784.0000

StDev 793.1725327

I.C. ( 10479.3, 13088.7 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

102

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho populacional e amostral das unidades do segundo e do terceiro estgios. No exemplo acima, as firmas foram selecionados pelo procedimento de amostragem por conglomerados em trs estgios sendo o estimador no viciado unidades de mesmo tamanho. Alm disso, existem 12 departamentos em cada firma, destes, 4 foram amostrados. Em cada departamento h 20 secretrias, sendo que 10 foram sorteadas. N = 4 Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de firmas que compe a empresa. Mean = 12.2750. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 12.2750 uma estimativa do nmero mdio de chamadas telefnicas efetuadas por secretria em um dia de trabalho. StDev = 0.8262214. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 10.9160, 13.6340 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 10.9160 representa o limite inferior e 13.6340 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de chamadas telefnicas efetuadas por secretria em um dia de trabalho. n = 2. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de firmas da empresa selecionadas. Total = 11784.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de ligaes telefnicas efetuadas pelas secretrias da empresa em um dia de trabalho. StDev = 793.1725327. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 10479.3, 13088.7 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 10479.3 representa o limite inferior e 13088.7 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de ligaes telefnicas efetuadas pelas secretrias da empresa em um dia de trabalho. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
 

103

Exemplo de Amostragem Estratificada


Considerando o procedimento de amostragem estratificada necessrio indicar qual o mtodo utilizado na coleta dos dados dentro de cada estrato: Amostragem Aleatria Simples Amostragem Sistemtica Amostragem por Conglomerados

104

Exemplo de Amostragem Estratificada


Considerando o esquema de amostragem estratificada com amostragem aleatria simples em cada estrato, duas situaes distintas podem ser avaliadas: Amostragem Estratificada com Amostragem Aleatria Simples Com Reposio Amostragem Estratificada com Amostragem Aleatria Simples Sem Reposio

105

Amostragem Estratificada com Amostragem Aleatria Simples


A forma de anlise dos dados provenientes de uma Amostragem Estratificada com Amostragem Aleatria Simples Com Reposio muito semelhante demonstrada para a Amostragem Estratificada com Amostragem Aleatria Simples Sem Reposio, entretanto, necessrio que se faa a seguinte modificao:

Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 1

106

Exemplo Amostragem Estratificada


Escolha o tipo de estimador com o qual voc deseja trabalhar: Estimador No Viciado Usual Estimador Razo Estimador Regresso

107

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem aleatria simples sem reposio e estimador no viciado usual. Uma agncia de publicidade est interessada em determinar o quanto ela deve enfatizar em propagandas de televiso em uma certa cidade. Para isso, ela decidiu conduzir uma pesquisa para estimar o nmero mdio de horas por semana que os moradores assistem televiso. A cidade est dividida em trs reas: rea A, rea B e rea rural. A rea A foi construda em torno de uma indstria. A maioria de seus moradores trabalha nela e tm crianas em idade escolar. A rea B subrbio de uma cidade vizinha. Os moradores so mais velhos e tem poucas crianas em casa. Existem 155 moradores na rea A, 62 na rea B e 93 na rea rural. 1. Abra o arquivo EX_AEEU.MTW. Observe a estrutura dos dados, as trs primeiras colunas contm os valores da varivel resposta para cada estrato, ou seja, o tempo (h) em que os moradores entrevistados declararam assistir televiso em uma semana para a cidade A, cidade B e para a rea rural; na quarta coluna so apresentados o nmero de elementos na populao e o nmero populacional de elementos nos estratos 1, 2 e 3; respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1 - C3; SUBC > Tamanho C4.

3. Session:

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2

Escolha os tipos de estimadores: 1) Usuais 2) Razo 3) Regresso Digite a opo 1

Existe Ps-Estratificao? Digite NO

Escolha o nvel de significncia desejado: 1) 0.010 2) 0.025 3) 0.050 4) 0.100 Digite uma das opes: 1, 2, 3 ou 4 108

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. Tipo de Amostragem : Estratificada . Tipo de Amostragem dentro do estratos : Aleatria Simples Sem Reposio . Estimadores : Usuais

N 310

Mean 27.6750 Total 8579.2500

StDev 1.4033956 StDev 435.0526503

I.C. ( 25.2601, 30.0899 ) I.C. ( 7830.63, 9327.87 )

. T Value : 1.72075

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao estimador selecionado. No exemplo acima, os moradores foram selecionados por amostragem estratificada com amostragem aleatria simples sem reposio sendo o estimador no viciado usual. N = 310. Representa o tamanho da populao. No exemplo, corresponde ao nmero de moradores no condado. Mean = 27.6750. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 27.6750 uma estimativa do nmero mdio de horas por semana que os moradores do condado assistem televiso. StDev = 1.4033956. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 25.2601, 30.0899 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 25.2601 representa o limite inferior e 30.0899 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio de horas por semana que os moradores do condado assistem televiso. Total = 8579.2500. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de horas por semana que os moradores do condado assistem televiso. 109

StDev = 435.0526503. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 7830.63, 9327.87 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7830.63 representa o limite inferior e 9327.87 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total de horas por semana que os moradores do condado assistem televiso. T Value = 1.72075. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

110

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem aleatria simples sem reposio e estimador razo. Um estudo nutricional est sendo realizado com 180 coelhos, 60 da raa A, 80 da raa B e 40 da raa C. Na 1 etapa, cada coelho teve seu peso avaliado e a mdia obtida foi: 3,2 Kg raa A; 3,5 Kg raa B e 2,5 Kg raa C. Aps dois meses de tratamento a base de uma nova rao, o pesquisador est interessado em estimar o peso mdio dos coelhos. Considerando cada raa como um estrato, ele decide utilizar a amostragem estratificada selecionando pelo procedimento de amostragem aleatria simples sem reposio, 15 coelhos da raa A, 20 da raa B e 10 da raa C. Estime o peso mdio dos coelhos observando o procedimento adotado na coleta dos dados e utilizando o estimador razo. 1. Abra o arquivo EX_AEER.MTW. Observe a estrutura dos dados, as trs primeiras colunas contm os valores da varivel auxiliar para cada estrato, as trs colunas subseqentes os valores da varivel resposta para cada estrato e a stima coluna apresentada o nmero de elementos na populao e o nmero populacional de elementos nos estratos 1, 2 e 3; respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C4-C6; SUBC > Auxiliares C1-C3; SUBC > Tamanho C7.

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2

Escolha os tipos de estimadores: 1) Usuais 2) Razo 3) Regresso Digite a opo 2

Existe Ps-Estratificao? Digite NO Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

111

Deseja entrar com o(s) valor(es) da Mdia da Varivel Auxiliar? Digite YES Digite o(s) valor(es) de Mx: Digite 3.2 3.5 2.5 Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. Tipo de Amostragem : Estratificada . Tipo de Amostragem dentro do estratos : Aleatria Simples Sem Reposio . Estimadores : Razo

Mtodo Separado N 180 Mean 4.1392 Total 745.0591 StDev 0.0486880 StDev 8.7638377 I.C. ( 4.05723, 4.22120 ) I.C. ( 730.302, 759.816 )

Mtodo Combinado N 180 Mean 4.1375 Total 744.7511 StDev 0.0494995 StDev 8.9099176 I.C. ( 4.05416, 4.22086 ) I.C. ( 729.748, 759.754 )

. T Value :

1.68385

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao estimador selecionado. No exemplo acima, os moradores foram selecionados por amostragem estratificada com amostragem aleatria simples sem reposio sendo o estimador razo. Mtodo Separado

N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.1392. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.1392 uma estimativa do peso mdio dos coelhos. 112

StDev = 0.0486880. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.05723, 4.22120 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.05723 representa o limite inferior e 4.22120 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 745.0591. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 8.7638377. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 730.302, 759.816 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 730.302 representa o limite inferior e 759.816 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. Mtodo Combinado

N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.1375. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.1375 uma estimativa do peso mdio dos coelhos. StDev = 0.0494995. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.05416, 4.22086 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.05416 representa o limite inferior e 4.22086 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 744.7511. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 8.9099176. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 729.748, 759.754 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 729.748 representa o limite inferior e 759.754 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. T Value = 1.68385. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada. 113

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem aleatria simples sem reposio e estimador regresso. Um estudo nutricional est sendo realizado com 180 coelhos, 60 da raa A, 80 da raa B e 40 da raa C. Na 1 etapa, cada coelho teve seu peso avaliado e a mdia obtida foi: 3,2 Kg raa A; 3,5 Kg raa B e 2,5 Kg raa C. Aps dois meses de tratamento a base de uma nova rao, o pesquisador est interessado em estimar o peso mdio dos coelhos. Considerando cada raa como um estrato, ele decide utilizar a amostragem estratificada selecionando pelo procedimento de amostragem aleatria simples sem reposio, 15 coelhos da raa A, 20 da raa B e 10 da raa C. Estime o peso mdio dos coelhos observando o procedimento adotado na coleta dos dados e utilizando o estimador razo. 1. Abra o arquivo EX_AEER.MTW. Observe a estrutura dos dados, as trs primeiras colunas contm os valores da varivel auxiliar para cada estrato, as trs colunas subseqentes os valores da varivel resposta para cada estrato e a stima coluna apresentada o nmero de elementos na populao e o nmero populacional de elementos nos estratos 1, 2 e 3; respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C4-C6; SUBC > Auxiliares C1-C3; SUBC > Tamanho C7.

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2 Escolha os tipos de estimadores: 1) Usuais 2) Razo 3) Regresso Digite a opo 3 Existe Ps-Estratificao? Digite NO Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

114

Digite o(s) valor(es) de Mx: Digite 3.2 3.5 2.5 Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. Tipo de Amostragem : Estratificada . Tipo de Amostragem dentro do estratos : Aleatria Simples Sem Reposio . Estimadores : Regresso

Mtodo Separado Estratos -------1 Coeficiente Angular -------------------0.7695

1.3529

1.1078

N 180

Mean 4.0951 Total 737.1251

StDev 0.0527310 StDev 9.4915846

I.C. ( 4.00635, 4.18393 ) I.C. ( 721.143, 753.108 )

Mtodo Combinado ATENO : PRESSUPE COEFICIENTES IGUAIS PARA TODOS OS ESTRATOS . Coef. Angular Combinado N 180 : 0.9912 StDev 0.0523715 StDev 9.4268638 I.C. ( 3.95224, 4.12861 ) I.C. ( 711.403, 743.150 )

Mean 4.0404 Total 727.2761

. T Value :

1.68385

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

115

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao estimador selecionado. No exemplo acima, os moradores foram selecionados por amostragem estratificada com amostragem aleatria simples sem reposio sendo o estimador regresso. Mtodo Separado Coef. Angular. Representa uma estimativa da mudana ocasionada na varivel resposta ao se acrescentar uma unidade a varivel auxiliar. Estrato 1 = 0.7695 Estrato 2 = 1.3529 Estrato 3 = 1.1078 N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.0951. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.0951 uma estimativa do peso mdio dos coelhos. StDev = 0.0527310. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.00635, 4.18393 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.00635 representa o limite inferior e 4.18393 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 737.1251. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 9.4915846. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 721.143, 753.108 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 721.143 representa o limite inferior e 753.108 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. Mtodo Combinado Coef. Angular Combinado = 0.9912. Representa uma estimativa da mudana ocasionada na varivel resposta ao se acrescentar uma unidade a varivel auxiliar. N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.0404. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.0404 uma estimativa do peso mdio dos coelhos.

116

StDev = 0.0523715. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 3.95224, 4.12861 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.95224 representa o limite inferior e 4.12861 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 727.2761. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 9.4268638. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 711.403, 743.150 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 711.403 representa o limite inferior e 743.150 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. T Value = 1.68385. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

117

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem sistemtica. Um instituto de pesquisas de mercado foi contratado para estimar a quantidade de dinheiro gasta por empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Baseandose na renda declarada no ano passado, 300 empresas foram alocadas em trs categorias; 60 na A, 100 na B e 140 na C. Para cada uma delas foi montada uma lista em ordem alfabtica e atravs do procedimento de amostragem sistemtica foram selecionadas 20 empresas da categoria A, 24 da categoria B e 50 da C. As empresas sorteadas receberam a visita de um coordenador que coletou as informaes necessrias. 1. Abra o arquivo EX_AEAS.MTW. Observe a estrutura dos dados, as trs primeiras colunas contm os valores da varivel auxiliar para cada estrato, as trs colunas subseqentes os valores da varivel resposta para cada estrato e a stima coluna apresentada o nmero de elementos na populao e o nmero populacional de elementos nos estratos 1, 2 e 3; respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 1. Session: MTB > %Sampling; SUBC > Estrato C1-C3; SUBC > Tamanho C4.

4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

Deseja correlao entre elementos da mesma amostra? Digite YES

118

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. . . . . Tipo de Amostragem : Amostragem Estratificada Tipo de Amostragem dentro dos estratos : Sistemtica Mtodo 1 : Amostragem Aleatria Simples Mtodo 2 : Amostragem Sistemtica Repetida Mtodo 3 : Diferena N 300 StDev Mean Method 1 1358.0726116 StDev Total Method 1 407421.7834704 IC Mean Method 1 ( 24226.5, 28805.8 ) Method 2 ( 23837.9, 29194.4 ) Method 3 ( 23902.9, 29129.5 ) Estrato ------1 2 3 . T Value : 1.68596 Method 2 476567.9048846 Method 3 465018.6374227 IC Total Method 1 ( 7267962, 8641752 ) Method 2 ( 7151384, 8758329 ) Method 3 ( 7170856, 8738858 ) Correlation -----------0.0508475 -0.0420875 -0.0201439 Method 2 1588.5596829 Method 3 1550.0621247 Mean 26516.1892 Total 7954856.7667

___________________________________________________________________
OBS: Nvel de significncia igual 0.05. 6. Interpretao dos Resultados

119

Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao mtodo de estimao da varincia. No exemplo acima, as empresas foram selecionadas pelo procedimento de amostragem estratificada com amostragem sistemtica sendo a varincia estimada pelos mtodos 1, 2 e 3. N = 300. Representa o tamanho da populao. No exemplo, corresponde ao nmero de empresas da regio sudeste. Mean = 26516.1892. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 26516.1892 uma estimativa da quantidade mdia de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. StDev Mean Method 1 = 1358.0726116. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 1588.5596829. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 1550.0621247. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 3. Total = 7954856.7667. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. StDev Total Method 1 = 407421.7834704. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 476567.9048846. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 465018.6374227. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 3. I.C. Mean Method 1 = ( 24226.5, 28805.8 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 24226.5 representa o limite inferior e 28805.8 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade mdia de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 2 = ( 23837.9, 29194.4 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 23837.9 representa o limite inferior e 29194.4 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade mdia de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 3 = ( 23902.9, 29129.5 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 23902.9 representa o limite inferior e 29129.5 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade mdia de 120

dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. I.C. Total Method 1 = ( 7267962, 8641752 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7267962 representa o limite inferior e 8641752 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 2 = ( 7151384, 8758329 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7151384 representa o limite inferior e 8758329 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 3 = ( 7170856, 8738858 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7170856 representa o limite inferior e 8738858 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Correlacion . Representa uma estimativa da correlao intra-classe das unidades populacionais. Estrato 1 = -0.0508475 Estrato 2 = -0.0420875 Estrato 3 = -0.0201439 T Value = 1.68596. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada. OBS: A estimao da varincia populacional e por conseqncia a construo dos intervalos de confiana via mtodo 2 considera somente parties em que o tamanho da amostra (n) um mltiplo de m=2 ou m=3. Portanto, caso isto no ocorra, todas as estatsticas baseadas no mtodo 2 no sero apresentadas.

Exemplo de Amostragem Estratificada


121

O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem por conglomerados em um estgio e estimador P.P.S. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. A cidade est dividida em trs regionais, a primeira contm 20 setores censitrios, a segunda 25 e a terceira 10. Sabe-se que o nmero de jornais comprados altamente correlacionado com o nmero de moradores do setor. Atravs do procedimento de amostragem proporcional ao tamanho selecionada uma amostra de setores de cada uma das regionais e todos os seus moradores so entrevistados. Regional 1 2 3 Nmero de setores censitrios selecionados 4 6 3

1. Abra o arquivo EX1_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. As 100 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2 Coluna - contm o nmero populacional de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. As 60 primeiras observaes so referentes ao 1 conglomerado, as 110 subseqentes ao 2, as 90 subseqentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. As 65 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2 e as 75 restantes ao 3. 6 Coluna - contm o nmero populacional de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).

3. Session:

MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

122

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 200 230 110 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

123

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. . . . Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Um Estimadores : P.P.S. : 3

. Nmero de Estratos Analisados

N 10850

Mean 12.6970

StDev 0.2734650

I.C. ( 12.2472, 13.1468 )

n 1150

Total 137762.1013

StDev 2967.0952087

I.C. ( 132882, 142643 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador P.P.S. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 12.6970. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 12.6970 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.2734650. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

124

I.C. = ( 12.2472, 13.1468 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 12.2472 representa o limite inferior e 13.1468 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 1150. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 137762.1013. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 2967.0952087. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 132882, 142643 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 132882 representa o limite inferior e 142643 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.

125

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem por conglomerados em um estgio e estimador razo. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. A cidade est dividida em trs regionais, a primeira contm 20 setores censitrios, a segunda 25 e a terceira 10. Atravs do procedimento de amostragem aleatria simples sem reposio selecionada uma amostra de setores de cada uma das regionais e todos os seus moradores so entrevistados. Regional 1 2 3 Nmero de setores censitrios selecionados 4 6 3

1. Abra o arquivo EX1_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. As 100 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2 Coluna - contm o nmero populacional de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. As 60 primeiras observaes so referentes ao 1 conglomerado, as 110 subseqentes ao 2, as 90 subseqentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. As 65 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2 e as 75 restantes ao 3. 6 Coluna - contm o nmero populacional de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

3. Session:

126

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 200 230 110 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

127

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. . . . Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Um Estimadores : Razo : 3

. Nmero de Estratos Analisados

N 10850

Mean 12.7044

StDev 0.1218289

I.C. ( 12.5040, 12.9048 )

n 1150

Total 137843.1281

StDev 1321.8430703

I.C. ( 135669, 140017 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador razo. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 12.7044. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 12.7044 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.1218289. resposta. Representa uma estimativa do desvio padro da mdia amostral varivel

128

I.C. = ( 12.5040, 12.9048 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 12.5040 representa o limite inferior e 12.9048 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 1150. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 137843.1281. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 1321.8430703. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 135669, 140017 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 135669 representa o limite inferior e 140017 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
! !

129

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em um estgio e estimador no viciado - unidades de mesmo tamanho. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. A cidade est dividida em trs regionais e estas subdivididas em setores censitrios com o mesmo nmero de moradores. Atravs do procedimento de amostragem aleatria simples sem reposio selecionada uma amostra de setores de cada uma das regionais e todos os seus moradores so entrevistados. Regional 1 2 3 Nmero de setores censitrios 20 25 10 Nmero de moradores em cada setor censitrio 200 230 110 Nmero de setores censitrios selecionados 4 6 3

1. Abra o arquivo EX2_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. 2 Coluna - contm o nmero populacional e amostral de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. 4 Coluna - contm o nmero populacional e amostral de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. 6 Coluna - contm o nmero populacional e amostral de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

3. Session:

130

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

131

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. . . . Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Um Estimadores : No Viciado Unidades de Mesmo Tamanho : 3

. Nmero de Estratos Analisados

N 10850

Mean 19.5542

StDev 0.2183551

I.C. ( 19.1951, 19.9134 )

n 2510

Total 212163.3333

StDev 2369.1526849

I.C. ( 208266, 216060 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador no viciado - unidades de mesmo tamanho. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 19.5542. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.2183551. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

132

I.C. = ( 19.1951, 19.9134 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 19.1951 representa o limite inferior e 19.9134 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 2510. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 212163.3333. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 2369.1526849. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 208266, 216060 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 208266 representa o limite inferior e 216060 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
" "

133

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em um estgio e estimador no viciado - unidades de tamanho diferente. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. A cidade est dividida em trs regionais, a primeira contm 20 setores censitrios, a segunda 25 e a terceira 10. Atravs do procedimento de amostragem aleatria simples sem reposio selecionada uma amostra de setores de cada uma das regionais e todos os seus moradores so entrevistados. Regional 1 2 3 Nmero de setores censitrios selecionados 4 6 3

1. Abra o arquivo EX1_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. As 100 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2 Coluna - contm o nmero populacional de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. As 60 primeiras observaes so referentes ao 1 conglomerado, as 110 subseqentes ao 2, as 90 subseqentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. As 65 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2 e as 75 restantes ao 3. 6 Coluna - contm o nmero populacional de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

3. Session:

134

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 200 230 110 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

135

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global


. . . . Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Um Estimadores : No Viciado Unidades de Tamanho Diferente : 3

. Nmero de Estratos Analisados

N 10850

Mean 5.6121

StDev 0.3409291

I.C. ( 5.05136, 6.17291 )

n 1150

Total 60891.6667

StDev 3699.0808168

I.C. ( 54807.2, 66976.1 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador razo. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 5.6121. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.3409291. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

136

I.C. = ( 5.05136, 6.17291 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 5.05136 representa o limite inferior e 6.17291 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 1150. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 60891.6667. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 3699.0808168. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 54807.2, 66976.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 54807.2 representa o limite inferior e 66976.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
# #

137

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem por conglomerados em dois estgios e estimador P.P.S. A prefeitura de uma certa cidade est interessada em avaliar o nvel de conhecimento geral dos alunos matriculados nas escolas do Sistema Municipal de Ensino. Com esta finalidade, o estatstico responsvel pelo estudo decide dividir a cidade em 3 regies scio-econmicas e retirar, atravs do procedimento de amostragem com probabilidade proporcional ao tamanho, uma amostra de escolas de cada regio. A partir das escolas selecionadas sorteou-se um conjunto de salas de aula, sendo aplicado um teste a todos os seus alunos. Regio 1 2 3 Nmero de escolas 30 10 50 Nmero de escolas selecionadas 8 3 11

Sabe-se que o nmero mdio de salas de aula nas escolas das regies 1, 2 e 3 15, 20 e 10, respectivamente. 1. Abra o arquivo EX1_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 6 primeiras observaes so referentes ao 1 conglomerado (escola), as 8 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional de conglomerados (escolas) no primeiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 7 primeiras observaes so referentes ao 1 conglomerado (escola) e as 8 subseqentes ao 2. 4 Coluna - contm o nmero populacional de conglomerados (escolas) no segundo estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 6 subseqentes ao 2, as 4 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional de conglomerados (escolas) no terceiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados.

138

2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 20 10 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

139

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global

. . . .

Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : P.P.S. : 3

. Nmero de Estratos Analisados

N 1150

Mean 49.5092

StDev 3.1246170

I.C. ( 44.3333, 54.6851 )

n 135

Total 56935.5833

StDev 3593.3095529

I.C. ( 50983.3, 62887.8 )

. T Value :

1.65648

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador P.P.S. Alm disso, trs estratos foram analisados. N = 1150. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 49.5092. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 3.1246170. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

140

I.C. = ( 44.3333, 54.6851 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 44.3333 representa o limite inferior e 54.6851 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 56935.5833. Representa uma estimativa do total populacional da varivel resposta. StDev = 3593.3095529. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 50983.3, 62887.8 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 50983.3 representa o limite inferior e 62887.8 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

141

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem por conglomerados em dois estgios e estimador razo. A prefeitura de uma certa cidade est interessada em avaliar o nvel de conhecimento geral dos alunos matriculados nas escolas do Sistema Municipal de Ensino. Com esta finalidade, o estatstico responsvel pelo estudo decide dividir a cidade em 3 regies scio-econmicas e retirar, atravs do procedimento de amostragem aleatria simples, uma amostra de escolas de cada regio. A partir das escolas selecionadas sorteou-se um conjunto de salas de aula, sendo aplicado um teste a todos os seus alunos. Regio 1 2 3 Nmero de escolas 30 10 50 Nmero de escolas selecionadas 8 3 11

Sabe-se que o nmero mdio de salas de aula nas escolas das regies 1, 2 e 3 15, 20 e 10, respectivamente. 1. Abra o arquivo EX1_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 6 primeiras observaes so referentes ao 1 conglomerado (escola), as 8 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional de conglomerados (escolas) no primeiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 7 primeiras observaes so referentes ao 1 conglomerado (escola) e as 8 subseqentes ao 2. 4 Coluna - contm o nmero populacional de conglomerados (escolas) no segundo estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 6 subseqentes ao 2, as 4 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional de conglomerados (escolas) no terceiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados.

142

2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 20 10 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

143

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global

. . . .

Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : Razo : 3

. Nmero de Estratos Analisados

N 1150

Mean 48.4510

StDev 1.2327308

I.C. ( 46.4090, 50.4930 )

n 135

Total 55718.6901

StDev 1417.6403954

I.C. ( 53370.4, 58067.0 )

. T Value :

1.65648

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador razo. Alm disso, trs estratos foram analisados. N = 1150. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 48.4510. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 1.2327308. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

144

I.C. = ( 46.4090, 50.4930 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 46.4090 representa o limite inferior e 50.4930 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 55718.6901. Representa uma estimativa do total populacional da varivel resposta. StDev = 1417.6403954. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 53370.4, 58067.0 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 53370.4 representa o limite inferior e 58067.0 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

145

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador no viciado - unidades de mesmo tamanho. A prefeitura de uma certa cidade est interessada em avaliar o nvel de conhecimento geral dos alunos matriculados nas escolas do Sistema Municipal de Ensino. Com esta finalidade, o estatstico responsvel pelo estudo decide dividir a cidade em 3 regies scio-econmicas e retirar, atravs do procedimento de amostragem aleatria simples, uma amostra de escolas de cada regio. A partir das escolas selecionadas sorteou-se um conjunto de salas de aula, sendo aplicado um teste a todos os seus alunos. Regio 1 2 3 Nmero de escolas 30 10 50 No. de escolas selecionadas 8 3 11 No. de salas em cada escola 10 15 8 No. de salas selecionadas em cada escola 5 7 3

1. Abra o arquivo EX2_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 5 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional e amostral de conglomerados (escolas) no primeiro estrato (regio) e o nmero populacional e amostral de elementos (salas) em cada um dos conglomerados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 3 primeiras observaes so referentes ao 1 conglomerado (escola), as 3 subsequentes ao 2 , as 3 subsequentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional e amostral de conglomerados (escolas) no segundo estrato (regio) e o nmero populacional e amostral de elementos (salas) em cada um dos conglomerados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 5 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional e amostral de conglomerados (escolas) no terceiro estrato (regio) e o nmero populacional e amostral de elementos (salas) em cada um dos conglomerados.

146

2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

147

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global

. . . .

Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : No Viciado Unidades de Mesmo Tamanho : 3

. Nmero de Estratos Analisados

N 850

Mean 48.1536

StDev 2.0972890

I.C. ( 44.6795, 51.6277 )

n 135

Total 40930.5425

StDev 1782.6956137

I.C. ( 37977.5, 43883.5 )

. T Value :

1.65648

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador no viciado unidades de mesmo tamanho. Alm disso, trs estratos foram analisados. N = 850. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 48.1536. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 2.0972890. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

148

I.C. = ( 44.6795, 51.6277 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 44.6795 representa o limite inferior e 51.6277 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 40930.5425. Representa uma estimativa do total populacional da varivel resposta. StDev = 1782.6956137. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 37977.5, 43883.5 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 37977.5 representa o limite inferior e 43883.5 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

149

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador no viciado - unidades de tamanho diferente. A prefeitura de uma certa cidade est interessada em avaliar o nvel de conhecimento geral dos alunos matriculados nas escolas do Sistema Municipal de Ensino. Com esta finalidade, o estatstico responsvel pelo estudo decide dividir a cidade em 3 regies scio-econmicas e retirar, atravs do procedimento de amostragem aleatria simples, uma amostra de escolas de cada regio. A partir das escolas selecionadas sorteou-se um conjunto de salas de aula, sendo aplicado um teste a todos os seus alunos. Regio 1 2 3 Nmero de escolas 30 10 50 Nmero de escolas selecionadas 8 2 14

Sabe-se que o nmero mdio de salas de aula nas escolas das regies 1, 2 e 3 15, 20 e 10, respectivamente. 1. Abra o arquivo EX3_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 6 primeiras observaes so referentes ao 1 conglomerado (escola), as 8 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional de conglomerados (escolas) no primeiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 7 primeiras observaes so referentes ao 1 conglomerado (escola) e as 8 subseqentes ao 2. 4 Coluna - contm o nmero populacional de conglomerados (escolas) no segundo estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 6 subseqentes ao 2, as 4 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional de conglomerados (escolas) no terceiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados.

150

2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 20 10 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)

Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

151

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global

. . . .

Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : No Viciado Unidades de Tamanho Diferente : 3

. Nmero de Estratos Analisados

N 1150

Mean 47.1256

StDev 4.9141527

I.C. ( 38.9854, 55.2658 )

n 135

Total 54194.4452

StDev 5651.2755600

I.C. ( 44833.2, 63555.7 )

. T Value :

1.65648

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador no viciado unidades de tamanho diferente. Alm disso, trs estratos foram analisados. N = 1150. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 47.1256. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 4.9141527. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.

152

I.C. = ( 38.9854, 55.2658 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 38.9854 representa o limite inferior e 55.2658 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 54194.4452. Representa uma estimativa do total populacional da varivel resposta. StDev = 5651.2755600. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 44833.2, 63555.7 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 44833.2 representa o limite inferior e 63555.7 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.

153

Exemplo de Amostragem Estratificada


O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em trs estgios e estimador P.P.S. Uma pesquisa scio-econmica est sendo realizada com o objetivo de estimar o gasto mdio com ligaes telefnicas, por domiclio, em uma determinada regio. Como no h um cadastro centralizado contendo informaes referentes a todos os domiclio, o estatstico responsvel pelo estudo decidiu adotar o seguinte procedimento: a regio foi dividida em 2 reas economicamente distintas, A e B; selecionou-se, atravs do procedimento de amostragem com probabilidade proporcional ao tamanho, um certo nmero de setores censitrios em cada rea; em cada setor sorteou-se, de forma aleatria, um certo nmero de quarteires; em cada quarteiro sorteou-se, de forma aleatria, um certo nmero de domiclios para receberem a visita do pesquisador. 1. Abra o arquivo EX1_AEC3E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, a quantidade de dinheiro gasto com ligaes telefnicas para cada domiclio pertencente a rea A. As 4 primeiras observaes representam o 1 quarteiro do 1 setor censitrio da rea A, as observaes de ordem 47 a 52 representam o 1 quarteiro do 2 setor censitrio da rea A e assim por diante. 2 Coluna - contm o nmero populacional e amostral de conglomerados (setores) no primeiro estrato (rea), o nmero amostral de unidades do segundo estgio (quarteires) e o nmero amostral de unidades do terceiro estgio (domiclios) em cada um dos conglomerados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, a quantidade de dinheiro gasto com ligaes telefnicas para cada domiclio pertencente a rea B. As 3 primeiras observaes representam o 1 quarteiro do 1 setor censitrio da rea B, as observaes de ordem 28 a 32 representam o 1 quarteiro do 2 setor censitrio da rea B e assim por diante. 4 Coluna - contm o nmero populacional e amostral de conglomerados (setores) no segundo estrato (rea), o nmero amostral de unidades do segundo estgio (quarteires) e o nmero amostral de unidades do terceiro estgio (domiclios) em cada um dos conglomerados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3; SUBC > Conglomerados C2 C4.
$ $ $ $

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3

154

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 1 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4 Escolha uma das opes abaixo: 1) Entrar com os fatores de ponderao dos estratos 2) Entrar com o nmero de elementos da populao para cada estrato Digite 1 ou 2 Opo 2 Digite o nmero de elementos da populao para cada estrato: Digite 2000 1000 Pressione a tecla Enter (refere-se ao nmero de unidades do 3 estgio no 1 estrato) Pressione a tecla Enter (refere-se ao nmero de unidades do 3 estgio no 2 estrato)

155

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global

. . . .

Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Trs Estimadores : P.P.S.

. Nmero de Estratos Analisados

N 3000

Mean 294.8705

StDev 5.2180080

I.C. ( 286.288, 303.453 )

n 838

Total 884611.4353

StDev 15654.0239955

I.C. ( 858863, 910360 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em trs estgios sendo o estimador P.P.S. Alm disso, dois estratos foram analisados. N = 3000. Representa o nmero de elementos do terceiro estgio na populao. No exemplo, corresponde ao nmero de domiclios da regio. Mean = 294.8705. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da quantidade mdia de dinheiro gasto com ligaes telefnicas por domiclio. StDev = 5.2180080. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 286.288, 303.453 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 286.288 representa o limite inferior e 303.453 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade media de dinheiro gasto com ligaes telefnicas por domiclio. 156

n = 838. Representa o nmero total de elementos do terceiro estgio amostrados. No exemplo, corresponde ao nmero total de domiclios da regio que foram amostrados. Total = 884611.4353. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da quantidade total de dinheiro gasto com ligaes telefnicas na regio. StDev = 15654.0239955. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 858863, 910360 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 858863 representa o limite inferior e 910360 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto com ligaes telefnicas na regio. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.

Exemplo de Amostragem Estratificada


157

O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em trs estgios e estimador no viciado - unidades de mesmo tamanho. Uma pesquisa scio-econmica est sendo realizada com o objetivo de estimar o gasto mdio com ligaes telefnicas, por domiclio, em uma determinada regio. Como no h um cadastro centralizado contendo informaes referentes a todos os domiclio, o estatstico responsvel pelo estudo decidiu adotar o seguinte procedimento: a regio foi dividida em 2 reas economicamente distintas, A e B; selecionou-se, de forma aleatria, 20 setores censitrios na rea A e 10 na rea B; em cada setor, 5 quarteires foram sorteados na rea A e 3 na rea B; em cada quarteiro, 2 domiclios foram sorteados em ambas as reas para receberem a visita do pesquisador. 1. Abra o arquivo EX2_AEC3E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, a quantidade de dinheiro gasto com ligaes telefnicas para cada domiclio pertencente a rea A. As 2 primeiras observaes representam o 1 quarteiro do 1 setor censitrio da rea A, as observaes de ordem 11 e 12 representam o 1 quarteiro do 2 setor censitrio da rea A e assim por diante. 2 Coluna - contm o nmero populacional e amostral de conglomerados (setores) no primeiro estrato (rea), o nmero populacional e amostral de unidades do segundo estgio (quarteires) e o nmero populacional e amostral de unidades do terceiro estgio (domiclios) em cada um dos conglomerados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, a quantidade de dinheiro gasto com ligaes telefnicas para cada domiclio pertencente a rea B. As 2 primeiras observaes representam o 1 quarteiro do 1 setor censitrio da rea B, as observaes de ordem 6 e 7 representam o 1 quarteiro do 2 setor censitrio da rea B e assim por diante. 4 Coluna - contm o nmero populacional e amostral de conglomerados (setores) no segundo estrato (rea), o nmero populacional e amostral de unidades do segundo estgio (quarteires) e o nmero populacional e amostral de unidades do terceiro estgio (domiclios) em cada um dos conglomerados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3; SUBC > Conglomerados C2 C4.
% % % %

4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3

158

Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 2 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100

Digite uma das opes: 1, 2, 3 ou 4

5. Impresso dos Resultados

___________________________________________________________________ Estimao Global

. . . .

Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Trs Estimadores : No Viciado Unidades de Mesmo Tamanho : 2

. Nmero de Estratos Analisados

N 16750

Mean 113.8525

StDev 5.0039652

I.C. ( 105.622, 122.083 )

n 260

Total 1907030.1046

StDev 83816.4172794

I.C. ( 1769164, 2044896 )

. Z Value :

1.64485

___________________________________________________________________
OBS: Nvel de significncia igual 0.05.

159

6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em trs estgios sendo o estimador no viciado unidades de mesmo tamanho. Alm disso, dois estratos foram analisados. N = 16750. Representa o nmero de elementos do terceiro estgio na populao. No exemplo, corresponde ao nmero de domiclios da regio. Mean = 113.8525. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da quantidade mdia de dinheiro gasto com ligaes telefnicas por domiclio. StDev = 5.0039652. Representa uma estimativa do desvio padro da mdia populacional da varivel resposta. I.C. = (105.622, 122.083 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 105.622 representa o limite inferior e 122.083 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade media de dinheiro gasto com ligaes telefnicas por domiclio. n = 260. Representa o nmero total de elementos do terceiro estgio amostrados. No exemplo, corresponde ao nmero total de domiclios da regio que foram amostrados. Total = 1907030.1046. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da quantidade total de dinheiro gasto com ligaes telefnicas na regio. StDev = 83816.4172794. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 1769164, 2044896 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1769164 representa o limite inferior e 2044896 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto com ligaes telefnicas na regio. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.

Trabalhando com Propores


160

Apesar dos exemplos aqui expostos no fazerem referncia ao caso em que a varivel resposta apresenta uma caracterstica dicotmica, ou seja, uma observao sempre classificada como pertencente ou no a categoria de interesse, o software Sampling est totalmente habilitado a trabalh-lo. A forma pela qual os dados devem estar estruturados bem como os comandos que devem ser utilizados so exatamente os mesmos ilustrados pelas sees anteriores, no sendo, portanto, necessrio maiores discusses.

Como Fazer uma Anlise - Perguntas


161

Inicialmente, ao se executar o Sampling, uma srie de perguntas so realizadas. Estas perguntas tm como objetivo abortar o programa caso seja detectado algum erro na especificao dos parmetros, direcionar a anlise e fornecer uma maior explorao dos dados. Para continuar digite "yes" ou digite "no" para parar o processamento: Se uma ou mais colunas foram incorretamente especificadas na linha de comando, ou por algum outro motivo seja necessrio parar a execuo do programa, basta digitar no, de modo contrrio, digite yes.

Deseja estimar o tamanho da amostra? Se o objetivo estimar o tamanho da amostra e/ou calcular alocaes digite yes, caso contrrio, digite no. Esta pergunta tem a finalidade de desviar o processamento diretamente para o mdulo de clculo do tamanho da amostra e no estar disponvel para a amostragem por conglomerados. Sendo a resposta afirmativa, as demais perguntas no sero realizadas. Deseja estatstica descritiva por estrato? Deseja anlise grfica por estrato? Respondendo yes : Digite (1) para anlise de todos os estratos ou (2) para escolha dos estratos: Se o plano amostral utilizado na coleta dos dados no foi a amostragem estratificada, existe apenas um estrato, portanto, digite 1. Se o plano amostral utilizado na coleta dos dados foi a amostragem estratificada, digite 1 se todos os estratos devem ser analisados ou 2 para selecionar os estratos de interesse. No caso da seleo de estratos: Digite o nmero de estratos para anlise: Digite o nmero total de estratos que devem ser analisados. Digite o nmero dos estratos para anlise: Digite o nmero dos estratos que devero ser analisados (seguido da tecla enter) observe que cada estrato referenciado pela ordem em que aparece na linha de comando inicial. EX: %Sampling; Estratos C2 C1 C3; Tamanho C4.

Indica que o estrato nmero 1 est em C2, o nmero 2 em C1 e o nmero 3 em C3.

162

Deseja estatstica descritiva global? Responda yes ou no.

Deseja anlise grfica Global?

Se o plano amostral utilizado na coleta dos dados foi a amostragem estratificada esta opo permite que seja feita uma anlise da situao geral, isto , desconsiderando a existncia dos estratos. Caso o procedimento utilizado no seja a amostragem estratificada a anlise global fornece exatamente os mesmos resultados da anlise por estrato.

Digite "Yes" para continuar ou "No" para parar a anlise: Se algum problema foi detectado digite yes para abortar o programa, caso contrrio, digite no para continuar a anlise.

(1) Todas as perguntas acima no estaro disponveis quando o procedimento utilizado na coleta dos dados for a amostragem por conglomerados. (2) As perguntas realizadas com relao a anlise descritiva da varivel resposta tambm sero feitas para a varivel auxiliar, caso ela exista. (3) Se no existir varivel auxiliar a estatstica corr ser substituda pelo smbolo *.

OBS:

163

REFERNCIAS BIBLIOGRFICAS
COCHRAN, W.G.,Sampling techniques, 3a. ed., New York:John Wiley & 1977. Sons,

MINITAB Inc. User's guide 1: Data, Graphics, and Macros, version 13.0, Pennsilvania, 2000. MINITAB Inc. User's guide 2: Data Analysis and Quality Tools, version 13.0, Pennsilvania, 2000. MINGOTI, S.A. e AGUIAR, S., Elementos bsicos de estatstica e com enfoque em minerao, So Paulo: ABM, 1988. amostragem

SCHEAFFER, R.A. , MENDENHALL, W. e OTT, L., Elementary survey sampling, 5a. ed., Belmont: Duxbury Press, 1996. SUKHATME, P. V. e SUKHATME, B. V. Sampling theory of surveys with applications, Ames: Iowa State University Press, 1970. THOMPSON, S. K. Sampling, New York: John Wiley.

164

Вам также может понравиться