Академический Документы
Профессиональный Документы
Культура Документы
AUTORES: SUELI APARECIDA MINGOTI (*) GREGRIO SARAVIA ATUNCAR (*) MARIA LOURDES GRANHA NOGUEIRA(**) RODRIGO CARAZOLLI DA SILVA (***)
(*) PROFS. ADJUNTO DO DEPARTAMENTO DE ESTATSTICA DA UFMG (**) PROFA. APOSENTADA DO DEPARTAMENTO DE ESTATSTICA DA UFMG (***) BACHAREL E MESTRANDO EM ESTATSTICA PELA UFMG 2001
SAMPLING
UM SOFTWARE NA REA DE AMOSTRAGEM INTEGRADO AO SOFTWARE ESTATSTICO MINITAB FOR WINDOWS
AGRADECIMENTO
OS AUTORES AGRADECEM FAPEMIG PELO APOIO FINANCEIRO QUE POSSIBILITOU A PRODUO DO SOFTWARE SAMPLING.
SAMPLING
UM SOFTWARE NA REA DE AMOSTRAGEM INTEGRADO AO SOFTWARE ESTATSTICO MINITAB FOR WINDOWS
NDICE
O SOFTWARE SAMPLING AMOSTRAGEM ALEATRIA SIMPLES AMOSTRAGEM SISTEMTICA AMOSTRAGEM DO TIPO P.P.S AMOSTRAGEM ESTRATIFICADA AMOSTRAGEM POR CONGLOMERADOS EM 1, 2 OU 3 ESTGIOS SUBAMOSTRAGEM COMO FAZER UMA ANLISE REFERNCIAS BIBLIOGRFICAS 03 07 12 15 17 24 35 164
O SOFTWARE "SAMPLING"
Introduo
O software Sampling foi desenvolvido como parte de um projeto de pesquisa financiado pela FAPEMIG, uma instituio de fomento pesquisa do estado de Minas Gerais. Sua estrutura foi concebida de modo a permitir que o usurio execute facilmente a anlise estatstica de dados atravs de mtodos estatsticos que levem em considerao o procedimento amostral utilizado na coleta destes dados. Este programa funciona como um complemento do popular software estatstico Minitab For Windows (2000). Tal opo pela criao do Sampling como um complemento de outro software deve-se principalmente grande difuso, baixo custo e facilidade de manipulao do Minitab For Windows. Sampling um programa muito simples de ser usado, funcionando de forma totalmente interativa. Seu manuseio requer do usurio conhecimentos bsicos sobre o Minitab For Windows alm de, claro, conhecimento das tcnicas de amostragem. O programa funciona em um sistema de vrias macros interligadas a uma macro mestre onde as informaes so armazenadas. As perguntas so feitas passo a passo em uma seqncia lgica de anlise. Por funcionar a partir do Minitab, o usurio, alm dos recursos disponveis no Sampling, tem a grande vantagem de desfrutar de todos os outros recursos estatsticos importantes `a uma anlise estatstica, sem precisar sair do software. Em termos do espao ocupado no disco rgido, o Sampling bem econmico. Tecnicamente, para se obter uma boa performance, o programa requer no mnimo um computador com processador Pentium 100 e 16 MB de memria RAM. Cabe salientar que no sistema Windows 95 (ou superior), a capacidade de armazenamento de dados limitada apenas pela quantidade de memria disponvel (Minitab verso 11.0 ou superior). Configuraes inferiores podem ser utilizadas, porm o processamento torna-se mais lento. O programa tambm pode ser utilizado com verses anteriores do Minitab a partir da verso 10.0. Os procedimentos amostrais disponveis no software Sampling so : . Amostragem Aleatria Simples com ou sem reposio . . Amostragem Sistemtica. . Amostragem Estratificada.; . Amostragem do Tipo P.P.S. . Amostragem por Conglomerados. . Amostragem em Dois ou Trs Estgios - Subamostragem . Subamostragem Estratificada. . Ps- Estratificao. O software Sampling foi desenhado tendo a Amostragem Estratificada como seu procedimento amostral base. Deste modo, as anlises estatsticas para os casos em que se tem apenas uma amostra proveniente de um procedimento amostral como, Amostragem Aleatria Simples, Amostragem Sistemtica e Amostragem por Conglomerados so obtidas como casos particulares da Amostragem Estratficada quando se tem apenas um estrato na populao, o que significa dizer que o estrato a prpria populao. A Amostragem do tipo P.P.S. tratada como um caso particular da Subamostragem. De um modo geral o software Sampling permite ao usurio a estimao dos parmetros populacionais (mdia, total e propores) atravs dos mtodos estatsticos no-viciados usuais de estimao pontual e intervalar (Cochran, 1977) ou pelos mtodos de Razo e Regresso, sendo que neste caso a varincia dos estimadores poder ser obtida pelo mtodo separado ou mtodo combinado. A estimao por intervalo executada para 4 diferentes valores do nvel de significncia , isto , 1, 2,5, 5 e 10 %. Para a construo dos intervalos utilizada a distribuio t-Student para o 3
caso de amostras pequenas (amostras com tamanho menor que 30 unidades amostrais) e a distribuio Normal para caso de amostras grandes. Nos mdulos de Amosrtragem Aleatria Simples, Amostragem Sistemtica e Amostragem Estratificada, o usurio tambm poder proceder a uma anlise descritiva de seus dados (opcional) ou calcular o tamanho n da amostra necessrio para obter-se uma preciso especificada priori com a respectiva alocao tima ou proporcional. Exemplos de uso do software Sampling esto apresentados na seo Como Fazer uma Anlise. Uma breve descrio dos recursos disponveis em cada um dos planos amostrais existentes no Sampling apresentada a seguir.
. Amostragem Sistemtica
Neste mdulo o usurio poder estimar pontualmente os parmetros populacionais usando os estimadores usuais da Amostragem Sistemtica (Thompson,1992) como tambm fazer a estimao por intervalo. Neste caso, o clculo da varincia dos estimadores feita atravs de 3 procedimentos diferentes: . Mtodo 1: A varincia estimada utilizando-se a aproximao pela Amostragem Aleatria Simples (Cochran, 1977);
. Mtodo 2: A varincia estimada utilizando-se o mtodo das diferenas (Mingoti e Aguiar,1988). . Mtodo 3: A varincia estimada pelo mtodo da amostragem sistemtica repetida (Scheaffer, Mendenhall e Ott, 1996) . Neste caso, so considerados parties em que o tamanho da amostra n um mltiplo de m=2 ou m=3 ; Como uma forma do usurio avaliar se a aproximao pela Amostragem Aleatria Simples apropriada para a estimao da varincia dos estimadores, o software Sampling fornece uma estimativa da correlao intra-classe das unidades amostrais populacionais para avaliao. Valores prximos de zero indicariam que a aproximao seria razovel. Uma anlise descritiva dos dados amostrais (opcional) tambm est disponvel neste mdulo. Para maiores detalhes sobre entrada de dados e forma de sada de resultados veja a seo Como Fazer uma Anlise- Amostragem Sistemtica.
. Amostragem Estratificada
Neste mdulo presume-se que as unidades amostrais da populao estejam previamente divididas em L estratos disjuntos. Alm da estimao de parmetros populacionais atravs dos mtodos no-viciados usuais ou pelos mtodos de Razo e Regresso, o usurio poder tambm fazer uma anlise descritiva dos dados para cada estrato individualmente ou para amostra global. Os planos amostrais permitidos no software Sampling para seleo de unidades amostrais dentro de cada estrato so o da Amostragem Aleatria Simples (Amostragem Aleatria Estratificada) e o da Amostragem Sistemtica. No caso em que as unidades amostrais de cada estrato esto divididas em conglomerados ou ocorre a subamostragem dentro de cada estrato, os planos amostrais permitidos so o da Amostragem Aleatria Simples, o da Amostragem tipo P.P.S. e o de 4
Amostragem Sistemtica no qual a estimao da varincia dos estimadores feita pela aproximao da Amostragem Aleatria Simples. Os mtodos de estimao considerados em cada estrato so : o mtodo no-viciado usual, os mtodos de Razo e o de Regresso. No caso da estimao por intervalo para amostras pequenas a distribuio t-Student utilizada com os graus de liberdade dados pela frmula sugerida por Cochran (1977, pg.96). O software Sampling permite tambm que o usurio proceda ao clculo do tamanho global da amostra n e a respectiva alocao dos tamanhos amostrais dos estratos populacionais, isto ( n1 , n 2 , ... , n L ) . So consideradas a Alocao tima e a Alocao Proporcional. No caso da Alocao tima dois casos so considerados: a determinao do tamanho da amostra levando-se em considerao a minimizao do custo final de coleta de dados ou a minimizao da variabilidade dos estimadores no-viciados usuais dos parmetros populacionais considerando-se que o plano amostral utilizado em cada estrato o de Amostragem Aleatria Simples ou a Amostragem Sistemtica com varincia aproximada pela Amostragem Aleatria Simples.Para maiores detalhes sobre a entrada de dados e a forma de sada de resultados veja a seo Como Fazer uma AnliseAmostragem Estratificada.
Amostragem Aleatria Simples sem reposio e o de Amostragem Sistemtica com estimativas aproximadas pela Amostragem Aleatria Simples . Entretanto, o caso da Amostragem Aleatria Simples com reposio pode ser obtido atravs da aproximao para populaes com tamanhos grandes (populao infinita) O software Sampling executa a estimao de parmetros para os casos de unidades primrias de tamanhos iguais ou diferentes combinados com os casos de unidades secundrias e de terceiro estgio de tamanhos iguais ou diferentes. Os mtodos de estimao de parmetros utilizado so o dos estimadores no-viciados usuais e o mtodo de Razo (Sukhatme e Sukhatme, 1970). Para maiores detalhes sobre a entrada de dados e a sada de resultados veja a seo de Como Fazer uma Anlise-Amostragem em Dois ou Trs Estgios.
. Subamostragem Estratificada
A subamostragem estratificada, isto a Amostragem Estratificada combinada com a Amostragem por Conglomerados ou a Amostragem em Dois ou Trs Estgios em cada estrato tambm est disponvel no software Sampling. A estimao de parmetros feita pelo mtodo usual de estimadores no-viciados ou pelo mtodo da Razo. Para maiores detalhes sobre a entrada de dados e a forma de sada dos resultados veja a seo de Como Fazer uma Anlise.
. Ps-Estratificao
A Ps-Estratificao (Scheaffer, Mendenhall e Ott, 1996), aparece com grande frequncia em situaes nas quais a amostra inicial foi coletada sem levar em considerao priori fatores importantes de estratificao (planos como Amostragem Aleatria Simples ou Sistemtica). Assim os estratos populacionais so determinados aps a coleta da amostra de n unidades amostrais. Neste caso, os tamanhos amostrais dos estratos ( nh ) deixam de ser fixos e passam a ser variveis aleatrias. Devido a este fato correes so necessrias no clculo das estimativas das varincias dos estimadores dos parmetros populacionais. No software Sampling estas correes seguem as sugestes indicadas em Scheaffer, Mendenhall e Ott (1996, e Cochran, 1977). Para maiores detalhes sobre a entrada de dados e a forma de sada de resultados veja a seo Como Fazer uma Anlise.
. Estimao de Propores
No software Sampling a estimao de propores populacionais considerada como um caso particular da estimao de mdias populacionais. A varivel resposta Y so pode assumir valores do tipo "0" ou "1" . Para maiores detalhes veja a seo Como Fazer uma Anlise-Estimao de Propores.
N y s2 Y Y Y Y
2
: tamanho da populao : tamanho da amostra : mdia da amostra : varincia da amostra : mdia populacional : estimador da mdia populacional : total populaciomal : estimador do total populacional : varincia populacional : razo populacional : estimador da razo populacional : estimador de razo da mdia populacional : estimador de razo do total populacional
R R YR
Y =y
Var ( Y ) =
s2 n
N n N
Var ( Y ) = N 2
Os intervalos de confiana para a mdia e total populacional so construdos de acordo com o nvel de significncia escolhido pelo usurio. Para amostras pequenas (n<30) utiliza-se a distribuio t de Student. Para amostras maiores utiliza-se a distribuio normal.
Y =N y
s2 n
N n N
P(| Y Y |> d ]
o tamanho da amostra no procedimento de Amostragem Aleatria Simples sem Reposio calculado atravs da seguinte frmula:
n= ( N 1)
N 2 d +2 z /2
2
z n= /2 d
O Sampling solicitar ao usurio os valores das constantes d, e uma estimativa do desvio padro populacional . Veja exemplos em Como Fazer uma Anlise.
Var ( Y ) =
s2 n
Var ( Y ) = N 2
Y =y
Y= Ny
s2 n
Y definido por: X
y R = i =1 = n x xi
i =1 onde y i , xi , i = 1,2 ,...,n , denotam respectivamente os valores amostrais das variveis Y e X para o i-simo elemento amostral coletado. Seja f a frao de amostragem, f = n / N . A varincia estimada de R calculada por:
yi
n 2 ( yi R xi ) ( 1 f ) ( 1 f ) i =1 2 = Var ( R ) s 2 + R 2 s x 2 R s yx onde: y 2 n 1 n X nX
2 ( xi x ) n 2 ( yi y ) n
s 2 = i =1 x
No clculo da varincia no software Sampling, perguntado ao usurio se ele deseja entrar com o valor da mdia da varivel auxiliar X . Em caso negativo, a varincia calculada substituindo X por x , ou seja a mdia amostral da varivel X. Os estimadores de razo do total populacional YR e da mdia populacional YR so respectivamente,
y YR = X x
n 2 ( yi R xi ) N 2 ( 1 f ) 2 N ( 1 f ) i =1 2 = Var ( YR ) s 2 + R 2 s x 2 R s yx y n n 1 n
n 1
s 2 = i =1 y
n 1
e s 2 = i =1 yx
( yi y )( xi x ) n 1 .
y YR = X x
n 2 ( yi R xi ) ( 1 f ) ( 1 f ) i =1 2 = Var ( YR ) s 2 + R 2 s x 2 R s yx y n n 1 n
Para utilizar os estimadores de razo da mdia e total populacionais necessrio que o usurio fornea o valor da mdia da varivel auxiliar X . Caso este valor no seja fornecido, o Sampling utilizar os estimadores usuais no viciados de mdia e total populacionais para a varivel X. As frmulas apresentadas para as varincias de R , YR e YR so aproximadas e as aproximaes so satisfatrias somente quando o tamanho da amostra maior que 30 e os coeficientes de variao de x e y so menores que 10%. O Sampling calcula os coeficientes de variao de x e y e d um aviso de alerta ao usurio quando algum destes coeficientes de variao no satisfaz a condio exigida. Os intervalos de confiana para R , YR e YR so construdos com base na aproximao normal. No caso da Amostragem Aleatria Simples com reposio as frmulas para a varincia dos estimadores de razo so obtidas retirando o fator de correo para populao finita (1 f ) . Na seo Como Fazer Uma Anlise - Amostragem Aleatria Simples o usurio encontrar um exemplo de aplicao dos estimadores de razo.
Yi = 0 + 1 X i
onde ( X i ,Yi ) o par de valores observados para a i-sima unidade amostral populacional, i=1,2,,n. Neste caso, uma estimativa da mdia populacional dada por:
y lr = y + ( X x )
onde a estimativa da inclinao da reta obtida pelo mtodo de mnimos quadrados ordinrios (Draper & Smith,1981), isto ,
i =1
( y i y ) ( xi x )
2 ( xi x ) n
i =1
Var ( y lr ) =
n N [ ( y y ) ( x x ) ]2 = i i n ( n 2 ) i =1
1 n
Ylr = N y lr
e para amostras grandes a varincia deste estimador dada por:
11
AMOSTRAGEM SISTEMTICA
O software Sampling permite que o usurio proceda as estimaes pontual e por intervalo dos parmetros populacionais de interesse no caso em que o procedimento de amostragem sistemtica for utilizado. As estimativas das varincias dos estimadores da mdia, total e proporo populacionais, podem ser obtidas por trs mtodos diferentes: Mtodo 1: o da aproximao pela Amostragem Aleatria Simples Mtodo 2: o da Amostragem Sistemtica Repetida e o Mtodo 3: o das Diferenas Sucessivas. A seguir descrevemos brevemente os procedimentos disponveis no mdulo de amostragem sistemtica. A notao utilizada ser semelhante quela do mdulo de Amostragem Aleatria Simples. Suponha que o procedimento de Amostragem Sistemtica tenha sido utilizado para obteno de uma amostra aleatria de tamanho n de uma populao com N unidades amostrais. Neste caso, os estimadores no-viciados da mdia e do total populacionais so dados respectivamente por:
Y = y sy =
i =1
yi n
(estimador da mdia populacional )
Y = N y sy
Uma estimativa das varincia de
ysy
2 ar( y ) = s N n V sy n N 2 onde s uma estimativa do quadrado mdio populacional descrita no mdulo de Amostragem Aleatria Simples Sem Reposio. A qualidade desta aproximao pode ser verificada pelo usurio se ele assim o desejar. Considerando-se a forma alternativa de expressar-se a varincia de y sy , dada por:
2 [1 + ( n 1 ) w ], Var( y sy ) = n
onde
o varincia populacional e
elementos dentro da mesma amostra sistemtica (correlao intra-classe), tem-se que se w for prximo de 1, os elementos da amostra so todos bastante semelhantes com relao caracterstica que foi medida nas unidades amostrais e, consequentemente a varincia de varincia de
ysy
Amostragem Sistemtica poder ser mais precisa que a Amostragem Aleatria Simples. A correlao pode ser negativa se os elementos da amostra forem extremamente diferentes. Quando N for muito grande e
w for muito prximo de 0, a amostragem sistemtica aproximadamente equivalente Amostragem Aleatria Simples.
A critrio do usurio, o software Sampling calcula uma estimativa de
dada por:
w =
i =1 j =1 j i
( yi y sy ) ( y j y sy ) n( n 1 ) N 1 2 2 N s
Mtodo 2: Amostragem Sistemtica Repetida (Scheaffer, Mendenhall e Ott,1996) Neste mtodo, considera-se que a Amostra Sistemtica de tamanho n e perodo de seleo k fornecida pelo usurio, possa ser dividida em duas ou trs amostras sistemticas distintas. No primeiro caso, a amostra de tamanho n tratada como tendo vindo de c=2 amostras sistemticas de perodo de seleo igual a k* = 2 k . No segundo caso, a amostra de tamanho n tratado como vindo de c=3 amostras sistemticas de perodo k* =3 k. Neste caso, as estimativas das varincias de
ysy
so dadas por: c c
Var( y sy ) =
i =1
2 ( y syi y s )
c( c 1)
onde
ys =
i=1
y syi c
e y syi
a mdia da
i-sima amostra sitemtica repetida, i=1,2. O software Sampling escolhe automaticamente o valor de c conveniente dependendo do tamanho n da amostra fornecida pelo usurio. importante ressaltar que esta estimativa pode ser bastante imprecisa especialmente quando o tamanho da amostra n for pequeno.
ysy
n1
N n Var( y sy ) = n
j =1
2 ( y j +1 y j )
2n ( n 1)
, onde y j e y j +1
13
Nos trs mtodos de estimao a varincia estimada do estimador do total populacional ser dada por:
Var ( Y ) = N 2 Var ( y sy )
Nota: Uma outra possibilidade de obter-se uma estimativa da varincia de ysy sem a necessidade
de utilizar-se algum tipo de aproximao, aquela em que o usurio dispe de vrias amostras sistemticas da populao que est sendo investigada. Suponha que se disponha de m amostras sistemticas de tamanho n e de perodo de seleo k. Ento, um estimador no viciado da mdia amostral ser dado por (Scheaffer, Mendenhall e Ott,1996):
ys =
Var ( y s ) =
m 1 2 ( y syi y s ) m ( m 1 ) i =1
No software Sampling este procedimento de estimao pode ser obtido no mdulo que trata de Amostragem por Conglomerados em Um Estgio - Conglomerados de Tamanhos Iguais. Veja o mdulo Como fazer uma anlise para exemplos de Amostragem Sistemtica no Sampling .
14
U i , i = 1,2 , ... , N , i = 1. Se uma amostra aleatria de tamanho n for retirada com reposio
1 n yi n i =1 i
Var ( ) =
n y 1 2 ( i ) n ( n 1 ) i =1 i
y =
1 n yi n N i =1 i
Var ( y ) =
1
2
N n ( n 1 ) i =1
yi ) 2 i
Estes estimadores so no-viciados para qualquer escolha de valores das probablidades de seleo i . Um caso particular aquele em que as probabilidades de seleo das unidades amostrais so escolhidas proporcionalmente ao tamanho das unidades, onde tamanho tem que ser definido por algum critrio (porte econmico, nmero de empregados, rea cultivada, etc.). A ttulo de ilustrao, se por exemplo U i tem um certo nmero M i de elementos amostrais, ento uma escolha lgica N onde M = M i seria o nmero total de elementos entre todas as i =1 unidades amostrais do Frame. Este procedimento amostral chamado de P.P.S., ou seja as probabilidades de seleo so escolhidas de modo proporcional ao tamanho das unidades amostrais populacionais. Em geral, quando o mtodo P.P.S. utilizado os estimadores dados anteriormente so denotados por: para
i seria i =
Mi M
Os intervalos de Confiana para os parmetros populacionais so construdos de modo similar ao descrito no mdulo de Amostragem Aleatria Simples. 15
Quando as probabilidades so escolhidas por este procedimento, ou seja P.P.S., a amostragem com probabilidades de seleo diferentes resulta em maior preciso se comparada com a Amostragem Aleatria Simples ou Sistemtica. Entretanto, para outras escolhas de i os estimadores podero ter varincias maiores que aqueles produzidas por estes dois procedimentos amostrais (ver Scheaffer, Mendenhal e Ott,1996, para maiores detalhes. No software Sampling a Amostragem do Tipo P.P.S. executada dentro do mdulo de Amostragem por Conglomerados, Subamostragem e Subamostragem Estratificada, pois trata-se de uma opo para estes mtodos. Veja Como fazer uma Anlise para maiores detalhes.
16
AMOSTRAGEM ESTRATIFICADA
Amostragem Estratificada
Uma amostra estratificada obtida dividindo-se a populao de N elementos em L grupos distintos chamados de estratos e escolhendo-se em seguida uma amostra de elementos de cada estrato. Quando o procedimento amostral utilizado na seleo das amostras de cada estrato for o de Amostragem Aleatria Simples, o procedimento chamado de Amostragem Aleatria Estratificada. Outro procedimento muito comum utilizado na seleo da amostra de cada estrato o de Amostragem Sistemtica. A estratificao pode ainda estar combinada com a Amostragem por Conglomerados ou a Amostragem em Vrios Estgios e com mtodos de estimao de parmetros como o de Razo e o de Regresso. A estratificao essencial na estimao de parmetros de populaes que apresentam grande heterogeneidade dos elementos no que se refere s variveis resposta de interesse. Deste modo, uma maior preciso pode ser obtida atravs da partio dos N elementos populacionais em L grupos, ou estratos, de forma que haja homogeneidade dos elementos em cada estrato e heterogeneidade entre os estratos formados. Os estratos precisam ser disjuntos. Alm disso, o custo da coleta dos dados pode ser reduzido. Para que a partio da populao seja feita de forma eficiente necessrio que se tenha conhecimento de variveis auxiliares que possam estar relacionadas, ou correlacionadas com as variveis respostas de interesse. As variveis auxiliares so em geral denominadas de fatores de estratificao . Alguns exemplos comuns so sexo, idade, classe social, linhas e turno de produo diferentes, etc. No caso da amostragem estratificada, os estimadores da mdia e total populacionais so obtidos atravs de combinaes lineares dos respectivos estimadores de cada estrato individualmente. Partindo-se do pressuposto de que h independncia entre as amostras obtidas nos vrios estratos os estimadores so construdos usando-se a informao correspondente ao procedimento amostral usado em cada estrato. A seguir apresentamos os estimadores disponveis no software Sampling para o caso em que a amostra em cada estrato selecionada atravs da Amostragem Aleatria Simples com ou sem reposio. Neste caso, os estimadores obtidos so no viciados. No que segue a seguinte notao ser adotada:
L : nmero de estratos, em que a populao foi dividida, N h : numero de unidades amostrais em cada estrato (h=1,2,..., L), N : nmero de unidades amostrais na populao,
N
h =1
=N,
Wh =
nh : tamanho amostral no estrato h ( h=1, 2, ..., L), y hj : valor da varivel resposta para a j-sima observao no estrato h Yh Y Y Yh yh
(h=1,2,..., L : j=1,2,..., Nh), : total populacional do estrato h : total da populao : mdia da populao, : mdia populacional do estrato h (h=1,2,..., . L), : mdia amostral do estrato h ( h=1, 2, ..., L).
17
y st =
onde
h =1
Wh y h
V ( y st ) =
h =1 L
Wh2V ( y h )
2 nh s h 2 = Wh ( 1 ) N h nh h =1
Nh 1 2 sh = ( y hj y h ) 2 nh 1 h=1
O estimador no-viciado do total populacional dado por Y = N y st . A varincia estimada de Y dada por V ( Y ) = N 2V ( y st )
Intervalos de Confiana para a mdia e total populacionais podem ser construdos de acordo com o nvel de significncia escolhido pelo usurio. Para amostras grandes utiliza-se a distribuio normal enquanto que para amostras pequenas utiliza-se a distribuio t de Student sendo os graus de liberdade calculados de acordo com a frmula dada em Cochran (1977, pag. 96).
L s2 ( y ) = W 2 h V st h n h =1 h
18
Tamanho da Amostra
A escolha do valor de n e os valores de nh , (h=1,2,..., L,
nh = n ), pode ser feita levando em h=1 considerao a preciso especificada para a estimao dos parmetros populacionais e o custo total da pesquisa. Para o que se segue considere a funo custo dada por: C = C0 +
h=1
c h nh
onde C 0 um custo inicial para implementao da pesquisa e c h o custo unitrio para a observao de uma unidade amostral do estrato h (h=1,2,..., L). Seja V ( y st ) a varincia do estimador da mdia populacional. Duas solues so possveis: a primeira encontrar-se a alocao ( n , n1 , n 2 ,...,n L ) que minimiza V ( y st ) para um custo fixo; a segunda encontrar a alocao que minimiza o custo C para um valor de V ( y st ) fixo. Para os dois casos a soluo da alocao a mesma e dada por:
nh = n(
N h h
ch ch
h=1,2, ..., L
N h h
2 onde N h o tamanho do h-simo estrato, h a varincia e c h o custo para obter uma unidade de observao no h-simo estrato. Esta forma de alocao denominada de Alocao tima. Se o custo C for fixado, e a varincia minimizada, o valor de n dado por
n=
( C c0 ) N h h
h=1
ch
N h h
ch
n = h=1
Wh h c h
V+
1 2 W h h N h=1
h=1 L
Wh h
ch
Na prtica nem sempre possvel utilizar-se as frmulas de alocao tima de imediato uma vez que estas dependem dos valores populacionais dos desvios padres dos estratos, que operacionalmente so substituidos por estimativas. Na falta destas estimativas uma outra forma de se proceder a escolha dos tamanhos amostrais dos estratos a partir da Alocao Proporcional. Para um dado valor de n , os valores nh so escolhidos da forma :
n h = Wh n =
Nh n N
19
Estimao de Propores
No software Sampling a estimao de uma proporo considerada como um caso particular de estimao de uma mdia populacional. A varivel resposta Y discutida assume apenas os valores 0 e 1. Portanto a proporo populacional igual a mdia populacional, o mesmo ocorrendo para a mdia e proporo amostral. Para maiores detalhes veja Como Fazer uma Anlise.
Ps - Estratificao
A Ps-Estratificao aparece com grande frequncia em situaes nas quais a amostra inicial foi coletada sem levar-se em considerao a priori fatores importantes de estratificao. A no estratificao a priori pode ocorrer por falha humana quando da escolha do plano amostral para a coleta de dados, ou por desconhecimento ocasionado pela dificuldade de observao inicial de fatores relacionados com o problema, ou seja fatores de estratificao ocultos e que tornam-se visveis aps a anlise estatstica da amostra coletada sem estratificao. Deste modo, uma alternativa para tentar reparar o erro da no estratificao inicial realizar a estratificao da populao a posteriori. Assim os estratos populacionais so determinados aps a coleta da amostra de n unidades amostrais. Neste caso, os tamanhos dos estratos, nh , no so fixados a priori e so variveis aleatrias. No software Sampling o usurio poder fazer as estimaes de parmetros considerando a PsEstratificao se a amostra inicial de n elementos tiver sido coletada pelos mtodos de Amostragem Aleatria Simples ou por Amostragem Sistemtica. Suponha que os pesos Wh dos estratos formados a posteriori sejam conhecidos, h = 1,2,, L. Neste caso, um estimador da mdia populacional dado por
no tem a varincia como discutido anteriormente devido a aleatoriedade dos valores varincia estimada de y st neste caso ser dada por :
nh . A
N n L 1 L 2 2 V ( y st ) = Wh s h + 2 ( 1 Wh )s h Nn h=1 n h=1
Esta frmula obtida como sugerido em Scheaffer, Mendenhal e Ott (1996) e Cochran(1977). Para fazer a anlise de dados pela Ps-Estratificao no software Sampling, o usurio dever proceder a entrada de dados como se estivesse fazendo uma anlise pela Amostragem Estratificada. Na srie de perguntas iniciais que so feitas pelo software o usurio dever ento informar que se trata de uma Ps-Estratificao para que o Sampling possa fazer a correpondente anlise procedendo as devidas correes. A estimao considerando-se a Ps-Estratificao pode a vir resultar em estimativas menos precisas que aquelas obtidas atravs da Amostragem Aleatria Simples e Amostragem Sistemtica quando os pesos dos estratos no forem conhecidos ou estiverem muito distantes dos valores populacionais. Veja Como fazer uma Anlise.
20
. Mtodo Separado
Neste mtodo uma estimativa do total populacional dada por:
YRs =
onde,
yh
h =1 x h
Xh
populacional da varivel auxiliar X para o h-simo estrato. estimada deste estimador dada por:
Var ( YRs ) =
onde
2 N h ( 1 nh
Nh
nh
2 2 ( s 2 + Rh s xh 2 Rh h s yh s xh ) yh
y Rh = h
xh
s2 = yh
nh 1 2 ( y hj y h ) nh 1 j = 1 e
2 s xh =
nh 1 2 ( x hj x h ) nh 1 j =1
s2 = yxh
nh 1 ( y hj y h )( x hj x h ) nh 1 j = 1
h =
s yxh s yh s xh
. Mtodo Combinado
Neste mtodo o total populacional estimado por:
y Yst = st X x st
onde
y st = Wh y h e
h =1
x st = Wh x h
h =1
e X o total populacional da varivel auxiliar X considerando todos os estratos conjuntamente. Para grandes amostras a varincia estimada deste estimador dada por: 2 N h ( 1 nh
Var ( YRs ) =
Nh
h =1
nh
2 ( s 2 + R 2 s xh 2 R h s yh s xh ) yh
mdia populacionais so similares ao
Em ambos os mtodos as estimaes para a razo e apresentado para o total populacional (Cochran,1977).
21
. Mtodo Separado
Neste mtodo a mdia populacional estimada por:
y lrh = y h + h ( X h x h )
a estimativa de mnimos quadrados da inclinao da reta relativa ao h-simo estrato (Amostragem Aleatria Simples Mtodo de Regresso). Para amostras grandes a varincia deste estimador pode ser estimada por:
individualmente para cada estrato populacional. Este mtodo apropriado quando presume-se que a relao linear entre as variveis Y e X difere de estrato para estrato, ou seja tem-se diferentes valores de h .
. Mtodo Combinado
Neste mtodo define-se:
y st = y h
h =1
x st = x h
h =1
y lrc = y st + ( X x st )
onde X a mdia populacional da varivel auxiliar considerando todos os estratos conjuntamente, e a inclinao da reta dada por:
nh nh 2 2 L Wh ( 1 L Wh ( 1 Nh ) Nh ) 2 =[ s xyh ] / s xh ] h =1 nh ( nh 1 ) h =1 nh ( nh 1 )
22
Var ( y lrc ) =
2 Wh ( 1 n h
h =1
Nh nh ( nh 1 )
) nh 2 [ ( y hi y h ) ( xhi x h ) ]
i =1
Este mtodo apropriado quando presume-se que a relao linear entre as variveis Y e X so aproximadamente iguais de estrato para estrato, ou seja tem-se o mesmo valor de para cada estrato. Em ambos os mtodos as estimaes para a razo e mdia populacionais so similares ao apresentado para o total populacional (Cochran,1977). Para maiores detalhes de aplicao veja seo Como Fazer uma Anlise.
23
O software Sampling permite que o usurio obtenha as estimativas pontual e por intervalo, da mdia ( Y ), o total ( Y ) e proporo ( P ) populacionais, quando o procedimento amostral o de Amostragem por Conglomerados em 1, 2 ou 3 estgios. Nos casos de 1 ou 2 estgios, as unidades amostrais do segundo estgio podem ter ou no o mesmo tamanho. Se as unidades amostrais tm o mesmo tamanho e todos os conglomerados da amostra so completamente inspecionados, ou seja no existe a subamostragem, ento os estimadores utilizados so os no-viciados usuais (Scheaffer, Mendenhall e Ott,1996). Quando os conglomerados tm tamanhos diferentes, a amostra de conglomerados selecionada pelo procedimento da Amostragem Aleatria Simples com ou sem reposio e ocorre ou no a subamostragem, o usurio tem a sua disposio dois mtodos de estimao diferentes para a estimao de parmetros: o mtodo de estimadores no-viciados e o mtodo de razo (Scheaffer, Mendenhal e Ott,1996). A estimao de parmetros tambm possvel de ser executada quando o procedimento utilizado para a escolha dos conglomerados do tipo P.P.S. com reposio, isto , quando as probabilidades de seleo dos conglomerados so proporcionais ao tamanho dos mesmos. O software Sampling permite tambm a estimao de mdia e total populacional no caso em que os dados provm de esquemas amostrais com Subamostragem estratificada, isto , esquemas nos quais a populao de interesse est dividida em estratos e de cada estrato uma amostra selecionada atravs de amostragem por conglomerados em 1, 2 ou 3 estgios. A entrada de dados est diretamente relacionada com a escolha do nmero de estgios do procedimento amostral e com o mtodo de estimao de parmetros escolhido pelo usurio. A seguir apresentamos os planos amostrais disponveis no software Sampling para Amostragem por Conglomerados. Para facilitar a exposio a seguinte notao ser utilizada :
N n
y i : mdia amostral do i-simo conglomerado da amostra , i = 1, 2,, n y : estimador da mdia populacional ; Y : estimador do total populacional ;
24
y =
1 n y n i =1 i
Y = NM y
n Var ( y ) = ( 1 ) N
2 sb n
onde
2 sb =
n 1 ( yi y ) 2 . n 1 i =1
. Conglomerados de Tamanhos Diferentes No caso em que os conglomerados tm tamanhos M i diferentes , i = 1,2,..., N so considerados dois casos :
y =
1 nM
N
i =1
M i yi
onde
M =
1 N Mi N i =1
Y = ( Mi ) y = N M y
i =1
25
'2 ar ( y ) = ( 1 n ) sb onde V N n
sb =
1 (n 1) M
2
i =1
( M i yi M y ) 2
Var ( Y ) = ( N M ) 2 Var( y )
Caso o usurio no fornea a informao do valor da constante M , o software Sampling estima o valor desta constante atravs da frmula :
1 n m = Mi n i =1
ou seja, o tamanho mdio amostral dos conglomerados. Mtodo de Estimao de Razo De acordo com este procedimento os estimadores da mdia e total populacional so dados por :
y=
i =1 n i =1
yi =
Mi
i =1 n
M i yi
i =1
i =1
M i yi nm
Mi
Y =(
i =1
Mi ) y = N M y
n sb Var ( y ) = ( 1 ) N n
'' 2 onde
s'b'
1 ( n 1 )M
2
i =1
2 ( yi M i y )
Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por m . 26
pi =
Mi
i =1
Mi
Mi NM
selecionada com reposio. Ento, os estimadores de mdia e total populacional so dados por :
y =
1 n y n i =1 i
Y = NM y
n Var ( y ) = ( 1 ) N
2 sb n
onde
2 sb =
n 1 ( yi y ) 2 . n 1 i =1
y=
1 n y n i =1 i
Y = NM y
A varincia estimada de y dada por :
27
n s2 Var ( y ) = ( 1 ) b N n
onde n 1 2 sb = ( yi y ) 2 n 1 i =1
1 m sw + ( 1 ) N M m
2 1 sw =
n i =1
si
sendo
s i2 =
m 1 ( yi j yi ) 2 ( m 1 ) i =1
a varincia amostral das unidades secundrias observadas do conglomerado i pertencente a amostra do primeiro estgio , i = 1, 2, . . . , n.
m =
1 n Mi n i =1
Mi
diferentes , i = 1,2,..., N
y=
1 nM
i =1
M i yi
onde
M =
1 N Mi N i =1
28
Y = ( Mi ) y = N M y
i =1
n sb Var ( y ) = ( 1 ) N n
onde
'2
s i2 mi 2 + Mi ( 1 ) 2 Mi mi n N ( M ) i =1 1
s'b2 =
1 ( n 1) M
2
i =1
( M i yi M y ) 2 ;
s i2 =
m 1 ( yi j yi ) 2 ( m 1 ) i =1
Caso o usurio no fornea a informao do valor da constante M , o software Sampling estima o valor desta constante atravs da frmula :
m =
1 n Mi n i =1
y=
i =1 n
yi = mi
i =1 n
mi y i
i =1
i =1
mi y i nm
i =1
mi
Y = ( Mi ) y = N M y
i =1 A varincia de y estimada por :
29
n 1 Var ( y ) = ( 1 ) ( yi mi y ) 2 2 N n M ( n 1 ) i =1
Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por m .
pi =
Mi
i =1
Mi
Mi NM
, i = 1, 2, . . . , N.
y =
1 n y n i =1 i
Y = NM y
n Var ( y ) = ( 1 ) N
e a varincia estimada de
2 sb n
onde
2 sb =
n 1 ( yi y ) 2 . n 1 i =1
respectivamente,
Var ( Y ) = ( N M )2 Var ( y ) .
Caso o valor da constante M no seja fornecida pelo usurio esta ser estimada por
m.
30
(3)
Pi j = P , i , j .
Seja n o nmero
de conglomerados selecionados por AAS-SR no primeiro estgio e seja m o nmero de unidades secundrias selecionadas por AAS-SR de cada conglomerado pertencente a amostra do primeiro estgio. Seja p o nmero de unidades amostrais selecionadas por AAS-SR de cada unidade secundria escolhida no segundo estgio. Neste caso, os estimadores no-viciados da mdia e do total populacional so respectivamente,
y=
p n m 1 1 n yi j k = yi n m p i =1 j =1 k =1 n i =1
Y = N M P y
A varincia estimada de y dada por :
n Var ( y ) = ( 1 ) N
onde : 2 sb =
2 2 2 sb 1 m sw 1 p sp + (1 ) + (1 ) n N M m NM P p
2 1 n 1 n 2 1 m 2 2 2 ( yi . . y ) ; s w = s i ; s i = ( y i j . y i .. ) ; n 1 i = 1 n i =1 n 1 j = 1
sp =
1 m 2 si j ; n m j =1
si j =
p 1 2 ( yi j k y i j . ) ; p 1 k =1
31
Mi Seja
pi =
i =1 j =1
j =1 N Mi
Pi j
a probabilidade de seleo de cada conglomerado
Pi j
mi e pi j ,
secundrias selecionadas de cada unidade primria no segundo estgio, e o nmero de unidades amostrais selecionadas de cada unidade secundria no terceiro estgio. Ento, neste caso os estimadores no-viciados para a mdia e o total populacional so respectivamente :
y=
1 n y n i =1 i
N Mi
Y = ( Pi j ) y
i =1 j =1
A varincia estimada de
dada por : n 1 2 ( yi . . y ) n 1 i =1
2 ar ( y ) = ( 1 n ) s b V N n
onde
2 sb =
( Pi j ) no
i =1 j =1
Mi
m p
m=
) , onde
1 n mi e n i =1
p=
1 n n i =1
mi
j =1
pi j
Se o procedimento amostral utilizado nos segundos e terceiros estgios forem do tipo AAS com reposio a varincia estimada de y torna-se : 2 sb Var ( y ) = n
32
Nota: Os casos em que as unidades amostrais so selecionadas por Amostragem Aleatria Simples com reposio em umm ou mais estgios dos procedimentos amostrais tratados, as frmulas de varincia simplificam. Nestes casos, bastar eliminar das f'rmulas os fatores de correes finitas correposndentes aos estgios em que a Amostragem Aleatria Simples com reposio foi utilizada. No software Sampling estas estimativas so obtidas por meio da aproximao para o caso de amostragem em populaes infinitas, no havendo portanto, uma opo em separado para tratamento destes planos amostrais.
y st = Wh y h
h =1
onde Wh representa o pso do h-simo estrato da populao e y h representa o estimador da mdia populacional do h-simo estrato. Este estimador pode ser selecionado de acordo com aqueles disponveis para os casos de Amostragem por Conglomerados em 1,2 ou 3 estgios descritos anteriormente.
Var ( y st ) = W h2 Var ( y h )
h =1
sendo que a Var ( y h ) calculada de acordo com o esquema amostral utilizado para a coleta de amostra em cada estrato e de acordo com as opes de estimao disponveis no software Sampling.
Os valores de Wh so dados respectivamente por : Nh
Wh =
h=1 i =1
i =1 L Nh
Mi
no caso de Amostragem por Conglomerados em 2 estgios ;
Mi
33
Nh
Wh =
h =1 i =1 j =1
i =1 j =1 L Nh Mi
Mi
Pi j
no caso de Amostragem por Conglomerados em 3 estgios.
Pi j
A constante N h representa o nmero total de conglomerados da populao do h-simo estrato. O estimador do total populacional dado por :
Yst = (
Nh Mi
h =1 i =1 j =1
Pi j ) y st
h =1 i =1 j =1
2 Pi j ) V ar ( y st )
34
35
36
37
Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 1
38
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2
39
N 150
Mean 17.3500
StDev 0.8550315
Total 2602.5000
StDev 128.2547321
. T Value :
1.72914
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
40
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao estimador selecionado. No exemplo acima, os pontos de coleta dos dados foram selecionados por amostragem aleatria simples sem reposio sendo o estimador no viciado usual. N = 150. Representa o tamanho da populao. No exemplo, corresponde ao tamanho da plantao. Mean = 17.35. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 17.35 uma estimativa do nmero mdio de rvores maiores do que o tamanho especificado por ponto (1 hectare). StDev = 0.8550315. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 15.8715 , 18.8285 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 15.8715 representa o limite inferior e 18.8285 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio populacional de rvores com tamanho superior ao especificado por ponto.
Total = 2602.5000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de rvores com tamanho maior do que o especificado na plantao de 150 hectares. StDev = 128.2547321. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 2380.73, 2824.27 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 2380.73 representa o limite inferior e 2824.27 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total populacional de rvores com tamanho maior do que o especificado na plantao de 150 hectares. T Value = 1.72914. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 19 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
39
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2
40
Deseja entrar com o(s) valor(es) da Mdia da Varivel Auxiliar? Digite YES Digite o(s) valor(es) de Mx: Digite 32.5
N 1000
Mean 34.0532
StDev 0.8273509
Total 34053.1661
StDev 827.3509010
Ratio 1.0478
StDev 0.0254570
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
41
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao estimador selecionado. No exemplo acima, os registros dos empregados foram selecionados por amostragem aleatria simples sem reposio sendo o estimador razo. N = 1000. Representa o tamanho da populao. No exemplo, corresponde ao nmero de empregados da empresa. Mean = 34.0532. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 34.0532 uma estimativa da quantidade mdia de dinheiro gasto pela empresa em despesas mdicas com empregados no primeiro trimestre do ano. StDev = 0.8273509. Representa uma estimativa do desvio padro da mdia populacional da varivel resposta. I.C. = ( 32.6923, 35.4140 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 32.6923 representa o limite inferior e 35.4140 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade mdia populacional de dinheiro gasto pela empresa em despesas mdicas com os empregados no primeiro trimestre do ano. Total = 34053.1661. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da quantidade total de dinheiro gasto pela empresa em despesas mdicas com os empregados no primeiro trimestre do ano. StDev = 827.3509010. Representa uma estimativa do desvio padro do total populacional da varivel resposta. I.C. = ( 32692.3, 35414.0 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 32692.3 representa o limite inferior e 35414.0 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade total de dinheiro gasto pela empresa em despesas mdicas com os empregados no primeiro trimestre do ano. Ratio = 1.0478. Representa uma estimativa da razo populacional entre os totais populacionais da varivel resposta e da varivel auxiliar. No exemplo, corresponde a razo entre a quantidade total de dinheiro gasto pela empresa em despesas mdicas com empregados no primeiro trimestre deste ano e o primeiro quadrimestre do ano passado. StDev = 0.0254570. Representa uma estimativa do desvio padro da razo amostral entre os totais populacionais da varivel resposta e da varivel auxiliar. I.C. = ( 1.00592, 1.08966 ). Este um intervalo de confiana de 95% para a razo populacional entre os totais populacionais da varivel resposta e da varivel auxiliar baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1.00592 representa o limite inferior e 1.08966 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a razo entre a quantidade total de dinheiro gasto pela empresa em despesas mdicas com empregados no primeiro trimestre deste ano e o primeiro quadrimestre do ano passado. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
42
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2
43
. Coef. Angular
: 0.7656
N 486
Mean 80.5934
StDev 2.7238672
Total 39168.3783
StDev 1323.7994582
. T Value :
1.83311
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao estimador selecionado. No exemplo acima, os registros dos empregados foram selecionados por amostragem aleatria simples sem reposio sendo o estimador regresso. Coef. Angular = 0.7656. Representa uma estimativa da mudana ocasionada na varivel resposta ao se acrescentar uma unidade a varivel auxiliar. N = 486. Representa o tamanho da populao. No exemplo, corresponde ao nmero de estudantes aprovados no vestibular para a rea de cincias exatas. Mean = 80.5934. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 80.5934 uma estimativa da nota mdia obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. StDev = 2.7238672. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
44
I.C. = ( 75.6002, 85.5865 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 75.6002 representa o limite inferior e 85.5865 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. Total = 39168.3783. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da nota total obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. StDev = 1323.7994582. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 36741.7, 41595.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 36741.7 representa o limite inferior e 41595.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota total obtida pelos alunos aprovados no vestibular para a rea de cincias exatas na disciplina clculo I. T Value = 1.83311. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 9 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
45
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 3
46
. . . .
Tipo de Amostragem : Amostragem Sistemtica Mtodo 1 : Amostragem Aleatria Simples Mtodo 2 : Amostragem Sistemtica Repetida Mtodo 3 : Diferena
N 400
Mean 4.1625
Total 1665.0000
IC Mean Method 1 ( 3.89122, 4.43378 ) Method 2 ( 3.89521, 4.42979 ) Method 3 ( 3.88615, 4.43885 )
IC Total Method 1 ( 1556.49, 1773.51 ) Method 2 ( 1558.08, 1771.92 ) Method 3 ( 1554.46, 1775.54 )
Estrato -------
Correlation -----------
-0.0125313
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05. 47
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem e ao mtodo de estimao da varincia. No exemplo acima, os automveis foram selecionados por amostragem sistemtica sendo a varincia estimada pelos mtodos 1, 2 e 3. N = 400. Representa o tamanho da populao. No exemplo, corresponde ao nmero de automveis que visitaram o parque em um certo feriado nacional. Mean = 4.1625. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.1625 uma estimativa do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional. StDev Mean Method 1 = 0.1649271. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 0.1625000. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 0.1680115. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 3. Total = 1665.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde ao nmero total de pessoas que visitaram o parque em um certo feriado nacional. StDev Total Method 1 = 65.9708481. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 65.0000000. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 67.2045822. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 3. I.C. Mean Method 1 = ( 3.89122, 4.43378 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.89122 representa o limite inferior e 4.43378 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional. Method 2 = ( 3.89521, 4.42979 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.89521 representa o limite inferior e 4.42979 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional. Method 3 = ( 3.88615, 4.43885 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.88615 representa o limite inferior e 4.43885 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para do nmero mdio de pessoas por automvel que visitaram o parque em um certo feriado nacional.
48
I.C. Total Method 1 = ( 1556.49, 1773.51 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1556.49 representa o limite inferior e 1773.51 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de pessoas que visitaram o parque em um certo feriado nacional. Method 2 = ( 1558.08, 1771.92 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1558.08 representa o limite inferior e 1771.92 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de pessoas que visitaram o parque em um certo feriado nacional. Method 3 = ( 1554.46, 1775.54 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1554.46 representa o limite inferior e 1775.54 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de pessoas que visitaram o parque em um certo feriado nacional. estimativa da correlao intra-classe das unidades Correlacion = -0.0125313. Representa uma populacionais, e neste exemplo indica que a aproximao pela amostragem aleatria simples sem reposio razovel. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
OBS: A estimao da varincia populacional e por conseqncia a construo dos intervalos de confiana via mtodo 2 considera somente parties em que o tamanho da amostra (n) um mltiplo de m=2 ou m=3. Portanto, caso isto no ocorra, todas as estatsticas baseadas no mtodo 2 no sero apresentadas.
49
50
51
3. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 1 Digite o nmero de elementos na populao: Digite 1000 Digite a varincia global: Digite 0.25 Digite o(s) desvio(s) padro amostral(is): Digite 6
52
126
________________________________________________________________________
OBS: Para o caso em que o planejamento utilizado na coleta dos dados o de amostragem aleatria simples com reposio, o Sampling utiliza uma aproximao pela amostragem aleatria simples sem reposio. Portanto, o procedimento para clculo do tamanho da amostra para este caso o mesmo descrito acima. Maiores detalhes podem ser vistos em Clculo do Tamanho da Amostra - Amostragem Aleatria Simples Com Reposio.
53
54
1. Abra o arquivo EX_CTAEAO.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 1
55
Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 1 Deseja atribuir valor ao custo da unidade amostral? Digite YES Digite o custo por unidade amostral: Digite 9 9 16 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter
Digite a varincia global: Digite 1 Digite os desvios padro amostrais: Digite 5 15 10 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter
56
. . . .
Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos
: : : : :
57
Alocao
Estrato 1
Tamanho 18
22
17
________________________________________________________________________
57
Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem e a varincia global escolhida. No exemplo acima, a agncia selecionar os moradores pelo mtodo de amostragem estratificada com amostragem aleatria simples sem reposio em cada rea, alm disso, foi utilizada a alocao tima minimizando custo para distribuir o 2 tamanho total da amostra entre as reas e uma varincia global de 1h . Tamanho Total da Amostra = 57. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com varincia global igual a V. No exemplo, corresponde a uma estimativa do nmero total de moradores que devem ser entrevistados para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso 2 seja 1h . Alocao Estrato 1 - Tamanho = 18. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea A para que o custo total final da pesquisa seja mnimo. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea B para que o custo total final da pesquisa seja mnimo. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea rural para que o custo total final da pesquisa seja mnimo.
58
1. Abra o arquivo EX_CTAEAO.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 1 Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 2 Digite o custo total final: Digite 1000 Deseja atribuir valor ao custo da unidade amostral? Digite YES Digite o custo por unidade amostral: Digite 9 9 16 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter
59
Digite os desvios padro amostrais: Digite 5 15 10 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter
. . . .
Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos
: : : :
90
Alocao
Estrato 1
Tamanho 29
35
26
________________________________________________________________________
60
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem e o custo total final escolhido. No exemplo acima, a agncia selecionar os moradores pelo mtodo de amostragem estratificada com amostragem aleatria simples sem reposio em cada rea, alm disso, foi utilizada a alocao tima minimizando a varincia global para distribuir o tamanho total da amostra entre as reas e um custo total final igual a $1000. Tamanho Total da Amostra = 90. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com custo total final igual a C. No exemplo, corresponde a uma estimativa do nmero total de moradores que devem ser entrevistados para que o custo total final da pesquisa seja $1000. Alocao Estrato 1 - Tamanho = 29. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea A para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso seja mnima. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea B para que para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso seja mnima. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de moradores que devem ser entrevistados na rea rural para que para que a varincia global da estimativa do nmero mdio de horas por semana que os moradores assistem televiso seja mnima. OBS: Para o caso em que o planejamento utilizado na coleta dos dados o amostragem estratificada combinada a amostragem aleatria simples com reposio, o Sampling utiliza uma aproximao pela amostragem aleatria simples sem reposio. Portanto, o procedimento para clculo do tamanho da amostra para este caso o mesmo descrito acima. Maiores detalhes podem ser vistos em Clculo do Tamanho da Amostra - Amostragem Estratificada.
O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo clculo do tamanho da amostra e alocao proporcional quando as unidades amostrais so selecionadas pelo procedimento de amostragem estratificada combinada a amostragem aleatria simples sem reposio. Uma indstria siderrgica est interessada em estimar o teor mdio de ferro do Sinter Feed B, que ser empilhado em 24 horas, atravs das estimativas do teor mdio de ferro do Sinter Feed 1, Sinter Feed (2+3) e Sinter Feed 4. Experincias anteriores indicam que uma boa estimativa do desvio padro do teor mdio de ferro do Sinter Feed 1 1 = 1.4% , do Sinter Feed (2+3) 2 = 1.2% , do Sinter Feed 4 3 = 11% . Alm . disso, a quantidade de minrio de ferro normalmente produzida no perodo : Sinter Feed 1 Sinter Feed (2+3) Sinter Feed 4 13800 t; 23400 t; 22800 t.
Qual o nmero total de incrementos da amostra e o nmero em cada que estrato devem ser selecionados de forma que: o custo seja mnimo e a varincia global igual a 0.02%2.
1. Abra o arquivo EX_CTAEAP.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Tamanho C1.
4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 2
62
Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 1 Deseja atribuir valor ao custo da unidade amostral? Digite NO Digite a varincia global: Digite 0.02 Digite os desvios padro amostrais: Digite 1.4 1.2 1.1 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter
63
. . . .
Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos
: : : :
0.02
73
Alocao
Estrato 1
Tamanho 17
28
28
________________________________________________________________________
64
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem, ao custo da unidade amostral e a varincia global escolhida. No exemplo acima, a indstria selecionar os incrementos pelo mtodo de amostragem estratificada combinada a amostragem aleatria simples sem reposio, alm disso, foi utilizada a alocao proporcional minimizando custo para distribuir o tamanho total da amostra entre os tipos de Sinter Feed. O custo para 2 se amostrar o minrio em cada tipo foi considerado constante e a varincia global escolhida foi de 0.02% . Tamanho Total da Amostra = 73. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com varincia global igual a V. No exemplo, corresponde a uma estimativa do nmero total de incrementos que devem ser amostrados para que a 2 varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja 0.02% . Alocao Estrato 1 - Tamanho = 18. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 1 que devem ser selecionados para que o custo total final seja mnimo. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de incrementos do Sinter Feed (2+3) que devem ser selecionados para que o custo total final seja mnimo. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que o custo total final seja mnimo. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 4 que devem ser selecionados para que o custo total final seja mnimo.
65
A varincia global seja mnima e o custo total final igual a $100. Suponha que o custo para se amostrar um incremento do Sinter Feed 1 $0.90, do Sinter Feed (2+3) $1.80 e do Sinter Feed 4 $1.30.
1. Abra o arquivo EX_CTAEAP.MTW. Observe a estrutura dos dados, existe apenas uma coluna. Nessa coluna so apresentados o tamanho total da populao, o tamanho populacional do primeiro estrato, o tamanho populacional do segundo estrato e o tamanho populacional do terceiro estrato, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Deseja estimar o tamanho da amostra? Digite YES Digite o nmero de estratos para anlise: Digite 3 Qual o tipo de Alocao: 1) Alocao tima 2) Alocao Proporcional Digite a opo 2 Calcular a estimativa minimizando: 1) Custo 2) Varincia Global Digite a opo 2
Digite o custo total final: Digite 100 Deseja atribuir valor ao custo da unidade amostral? Digite YES
66
Digite o custo por unidade amostral: Digite 0.90 1.80 1.30 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter
Digite os desvios padro amostrais: Digite 1.4 1.2 1.1 Pressione a tecla Enter Pressione a tecla Enter Pressione a tecla Enter
67
. . . .
Tipo de Alocao Estimativa Minimizando Mtodo de Amostragem Amostragem dentro dos estratos
: : : :
75
Alocao
Estrato 1
Tamanho 17
29
29
________________________________________________________________________
68
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de alocao, ao critrio de minimizao, ao mtodo de amostragem e o custo total final escolhido. No exemplo acima, a indstria selecionar o minrio de ferro pelo mtodo de amostragem estratificada com amostragem aleatria simples sem reposio em cada tipo de Sinter Feed, alm disso, foi utilizada a alocao proporcional minimizando a varincia global para distribuir o tamanho total da amostra entre os tipos e um custo total final igual a $100. Tamanho Total da Amostra = 90. Representa uma estimativa do tamanho total da amostra necessrio para se estimar a mdia populacional da varivel resposta com custo total final igual a C. No exemplo, corresponde a uma estimativa do nmero total de incrementos que devem ser amostrados que para que o custo total final seja $100. Alocao Estrato 1 - Tamanho = 29. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 1 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 1 que devem ser selecionados para que a varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja mnima. Estrato 2 - Tamanho = 22. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 2 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de incrementos do Sinter Feed (2+3) que devem ser selecionados para que a varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja mnima. Estrato 3 - Tamanho = 17. Representa uma estimativa do nmero de observaes que devem ser coletadas no estrato 3 para que a varincia global seja mnima. No exemplo, corresponde ao nmero de incrementos do Sinter Feed 4 que devem ser selecionados para que a varincia global da estimativa do teor mdio de ferro do Sinter Feed B seja mnima. OBS: Para o caso em que o planejamento utilizado na coleta dos dados o amostragem estratificada combinada a amostragem aleatria simples com reposio, o Sampling utiliza uma aproximao pela amostragem aleatria simples sem reposio. Portanto, o procedimento para clculo do tamanho da amostra para este caso o mesmo descrito acima. Maiores detalhes podem ser vistos em Clculo do Tamanho da Amostra - Amostragem Estratificada.
69
70
(Para 1 e 2 estgios.)
71
(Para 3 estgios.)
72
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 125 Pressione a tecla Enter Pressione a tecla Enter
73
N 40
Mean 5.1242
StDev 0.7761477
n 4
Total 25620.8333
StDev 3880.7386942
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
74
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador P.P.S. Alm disso, o tamanho mdio populacional dos conglomerados de 125 moradores. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 5.1242. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 5.1242 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.7761477. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 3.84752, 6.40082 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.84752 representa o limite inferior e 6.40082 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 25620.8333. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 3880.7386942. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 19237.6, 32004.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 19237.6 representa o limite inferior e 32004.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
75
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 125 Pressione a tecla Enter Pressione a tecla Enter
76
N 40
Mean 5.1514
StDev 0.5520147
n 4
Total 25757.1429
StDev 2760.0735749
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
77
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador razo. Alm disso, o tamanho mdio populacional dos conglomerados de 125 moradores. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 5.1514. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 5.1514 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.5520147. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.24345, 6.05941 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.24345 representa o limite inferior e 6.05941 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 25757.1429. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 2760.0735749. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 21217.2, 30297.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 21217.2 representa o limite inferior e 30297.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
78
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
79
N 40
Mean 5.0125
StDev 0.4295412
n 4
Total 20050.0000
StDev 1718.1647185
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
80
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador no viciado - unidades de mesmo tamanho. Neste caso, todos os conglomerados tm o mesmo tamanho populacional. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 5.0125. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 5.0125 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.4295412. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.30597, 5.71903 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.30597 representa o limite inferior e 5.71903 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 20050.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 1718.1647185. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 17223.9, 22876.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 17223.9 representa o limite inferior e 22876.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
81
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 125 Pressione a tecla Enter Pressione a tecla Enter
82
N 40
Mean 3.6060
StDev 0.6090547
n 4
Total 18030.0000
StDev 3045.2733867
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
83
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em um estgio sendo o estimador no viciado - unidades de tamanho diferente. Alm disso, o tamanho mdio populacional dos conglomerados de 125 moradores. N = 40. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios na rea. Mean = 3.6060. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 3.6060 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.6090547. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 2.60419, 4.60781 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 2.60419 representa o limite inferior e 4.60781 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 18030.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na rea no ltimo bimestre. StDev = 3045.2733867. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 13021.0, 23039.0 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 13021.0 representa o limite inferior e 23039.0 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na rea no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
84
1. Abra o arquivo EX1_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o teor de ferro (%) dos incrementos pertencentes aos vages selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao e o nmero de elementos amostrados em cada um dos conglomerados selecionados, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 3 primeiras observaes da coluna Teor de Ferro (%) so referentes ao 1 conglomerado, as 6 subseqentes ao 2, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2
85
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES Pressione a tecla Enter 100000 Pressione a tecla Enter Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
N 60
Mean 64.0683
StDev 0.0034816
n 10
Total 384409600.0000
StDev 20889.5685469
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
86
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os vages foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador P.P.S. Alm disso, o tamanho mdio populacional dos conglomerados de 100000 incrementos. N = 60. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de vages do carregamento. Mean = 64.0683. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 64.0683 uma estimativa do teor mdio de ferro (%) do Sinter Feed B. StDev = 0.0034816. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 64.0625, 64.0740 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 64.0625 representa o limite inferior e 64.0740 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o teor mdio de ferro(%) do minrio carregado nos vages. n = 10. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de vages selecionados. Total = 384409600.0000. Representa uma estimativa do total populacional da varivel resposta. StDev = 20889.5685469. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 3.84E+08, 3.84E+08 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador razo. Os tcnicos de uma indstria siderrgica desejam estimar o teor mdio de ferro (%) das 3600 toneladas do Sinter Feed B que ser carregado em 60 vages. Para isto, selecionou-se 10 vages atravs de uma amostragem aleatria simples e de cada um dos vages selecionados retirou-se, aleatoriamente, uma amostra de incrementos: Vago 01 02 03 04 05 06 07 08 09 10 Nmero de incrementos retirados 3 6 5 3 4 4 4 5 3 5
1. Abra o arquivo EX1_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, ou seja, o teor de ferro (%) dos incrementos pertencentes aos vages selecionados; na segunda coluna so apresentados o nmero de conglomerados na populao e o nmero de elementos amostrados em cada um dos conglomerados selecionados, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 3 primeiras observaes da coluna Teor de Ferro (%) so referentes ao 1 conglomerado, as 6 subseqentes ao 2, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).
3. Session:
MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2
88
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES Pressione a tecla Enter 100000 Pressione a tecla Enter Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
N 60
Mean 64.0700
StDev 0.0000001
n 10
Total 384420000.0000
StDev 0.8640988
. Z Value :
1.64485
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
89
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os vages foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador razo. Alm disso, o tamanho mdio populacional dos conglomerados de 100000 incrementos. N = 60. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de vages do carregamento. Mean = 64.0700. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 64.0700 uma estimativa do teor mdio de ferro (%) do Sinter Feed B. StDev = 0.0000001. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 64.0700, 64.0700 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 64.0700 representa o limite inferior e 64.0700 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o teor mdio de ferro (%) do minrio carregado nos vages. n = 10. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de vages selecionados. Total = 384420000.0000. Representa uma estimativa do total populacional da varivel resposta. StDev = 0.8640988. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 3.84E+08, 3.84E+08 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em dois estgios e estimador no viciado - unidades de mesmo tamanho. Um socilogo est interessado em estimar o nmero total de pessoas aposentadas que residem em uma certa regio. Ele decide retirar atravs do procedimento de amostragem aleatria simples uma amostra de 4 setores censitrios a partir dos 30 que compem a regio e de cada um deles selecionar 6 domiclios, como apresentado na tabela a seguir: Setor Censitrio 6 19 24 29 Nmero de Domiclios 18 18 18 18 Nmero de domiclios selecionados 6 6 6 6 Nmero de pessoas aposentadas em cada domiclio selecionado 2, 0, 1, 3, 0, 1 1, 1, 0, 3, 2, 0 0, 0, 1, 1, 1, 2 3, 0, 2, 0, 2, 2
1. Abra o arquivo EX2_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados populacional e amostral e o nmero de unidades em cada conglomerado populacional e amostral, respectivamente. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).
3. Session:
MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2
91
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
N 30
Mean 1.1667
StDev 0.1431567
n 4
Total 630.0000
StDev 77.3045924
. T Value :
1.71388
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
92
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador no viciado - unidades de mesmo tamanho. Alm disso, o tamanho mdio populacional dos conglomerados de 18 residentes. N = 30. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios que compe a regio. Mean = 1.1667. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 1.1667 uma estimativa do nmero mdio de residentes aposentados por domiclio. StDev = 0.1431567. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 0.921314, 1.41202 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 0.921314 representa o limite inferior e 1.41202 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio de residentes aposentados por domiclio. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 630.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de pessoas aposentados que residem na regio. StDev = 77.3045924. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 497.509, 762.491 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 497.509 representa o limite inferior e 762.491 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total de pessoas aposentados que residem na regio. T Value = . Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 23 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
93
Sabe-se que, em mdia, cada setor censitrio da regio contm 15 domiclios. 1. Abra o arquivo EX3_AC2E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados na populao, o nmero de unidades secundrias amostradas e o nmero de unidades secundrias populacional para cada conglomerado, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 6 primeiras observaes da coluna Nmero de Pessoas Aposentadas so referentes ao 1 conglomerado que apresenta tamanho populacional igual a 18, as 3 subseqentes ao 2 com tamanho populacional igual a 14, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2
94
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 Pressione a tecla Enter Pressione a tecla Enter
N 30
Mean 0.8056
StDev 0.2486780
n 4
Total 362.5000
StDev 111.9050937
. T Value :
1.75305
________________________________________________________________________
OBS: Nvel de significncia igual 0.05.
95
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho mdio populacional dos conglomerados. No exemplo acima, os setores foram selecionados pelo procedimento de amostragem por conglomerados em dois estgios sendo o estimador no viciado - unidades de tamanho diferente. Alm disso, o tamanho mdio populacional dos conglomerados de 15 domiclios. N = 30. Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de setores censitrios que compe a regio. Mean = 0.8056. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 0.2417 uma estimativa do nmero mdio de residentes aposentados por domiclio. StDev = 0.2486780. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 0.369610, 1.24150 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 0.369610 representa o limite inferior e 1.24150 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio de residentes aposentados por domiclio. n = 4. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de setores censitrios selecionados. Total = 362.5000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de pessoas aposentados que residem na regio. StDev = 111.9050937. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 166.324, 558.676 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 166.324 representa o limite inferior e 558.676 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total de pessoas aposentados que residem na regio. T Value = 1.75305. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student com 15 graus de liberdade. Neste caso, se o tamanho da amostra fosse maior ou igual 30 ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
1 3
1. Abra o arquivo EX1_AC3E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados na populao e na amostra, o nmero de unidades secundrias amostradas em cada conglomerado e o nmero de unidades do terceiro estgio retiradas de cada unidade secundria, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 8 primeiras observaes da coluna Nmero de Cesarianas so referentes ao 1 conglomerado e a sua 1 unidade secundria, as 4 subseqentes ao 1 conglomerado e a sua 2 unidade secundria, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3
97
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 1 Deseja entrar com o nmero de elementos da populao? Digite YES 400 Pressione a tecla Enter Pressione a tecla Enter
N 4
Mean 41.8095
StDev 3.5186980
n 2
Total 16723.8095
StDev 1407.4792121
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
98
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao nmero de elementos da populao. No exemplo acima, as regies foram selecionados pelo procedimento de amostragem por conglomerados em trs estgios sendo o estimador P.P.S. Alm disso, existem no total 400 alas de hospital na cidade. N = 4 Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de regies em que a cidade est dividida. Mean = 41.8095. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 41.8095 uma estimativa do nmero mdio de operaes cesarianas realizadas por ala de hospital. StDev = 3.5186980. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 36.0218, 47.5973 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 36.0218 representa o limite inferior e 47.5973 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de operaes cesarianas realizadas por ala de hospital. n = 2. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de regies da cidade selecionadas. Total = 16723.8095. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de operaes cesarianas realizadas na cidade no primeiro bimestre do ano. StDev = 1407.4792121. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 14408.7, 19038.9 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 14408.7 representa o limite inferior e 19038.9 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de operaes cesarianas realizadas na cidade no primeiro bimestre do ano. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
99
Matriz
Filial 2
1. Abra o arquivo EX2_AC3E.MTW. Observe a estrutura dos dados, a primeira coluna contm os valores da varivel resposta, na segunda coluna so apresentados o nmero de conglomerados na populao e na amostra, o nmero de unidades secundrias na populao e na amostra e o nmero de unidades do terceiro estgio na populao e na amostra, respectivamente. Existe uma ordem lgica para entrada dos dados, portanto, as 8 primeiras observaes da coluna Nmero de Cesarianas so referentes ao 1 conglomerado e a sua 1 unidade secundria, as 4 subseqentes ao 1 conglomerado e a sua 2 unidade secundria, e assim por diante. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1; SUBC > Conglomerados C2.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3
100
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 1 Deseja entrar com o nmero de elementos da populao? Digite YES 400 Pressione a tecla Enter Pressione a tecla Enter
101
20.00
4.00
10.00
N 4
Mean 12.2750
StDev 0.8262214
n 2
Total 11784.0000
StDev 793.1725327
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
102
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem, ao nmero de estgios, ao estimador selecionado e ao tamanho populacional e amostral das unidades do segundo e do terceiro estgios. No exemplo acima, as firmas foram selecionados pelo procedimento de amostragem por conglomerados em trs estgios sendo o estimador no viciado unidades de mesmo tamanho. Alm disso, existem 12 departamentos em cada firma, destes, 4 foram amostrados. Em cada departamento h 20 secretrias, sendo que 10 foram sorteadas. N = 4 Representa o nmero de conglomerados na populao. No exemplo, corresponde ao nmero de firmas que compe a empresa. Mean = 12.2750. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 12.2750 uma estimativa do nmero mdio de chamadas telefnicas efetuadas por secretria em um dia de trabalho. StDev = 0.8262214. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 10.9160, 13.6340 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 10.9160 representa o limite inferior e 13.6340 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de chamadas telefnicas efetuadas por secretria em um dia de trabalho. n = 2. Representa o nmero de conglomerados amostrados. No exemplo, corresponde ao nmero de firmas da empresa selecionadas. Total = 11784.0000. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de ligaes telefnicas efetuadas pelas secretrias da empresa em um dia de trabalho. StDev = 793.1725327. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 10479.3, 13088.7 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 10479.3 representa o limite inferior e 13088.7 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de ligaes telefnicas efetuadas pelas secretrias da empresa em um dia de trabalho. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
103
104
105
Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 1
106
107
3. Session:
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2
Escolha o nvel de significncia desejado: 1) 0.010 2) 0.025 3) 0.050 4) 0.100 Digite uma das opes: 1, 2, 3 ou 4 108
N 310
. T Value : 1.72075
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao estimador selecionado. No exemplo acima, os moradores foram selecionados por amostragem estratificada com amostragem aleatria simples sem reposio sendo o estimador no viciado usual. N = 310. Representa o tamanho da populao. No exemplo, corresponde ao nmero de moradores no condado. Mean = 27.6750. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 27.6750 uma estimativa do nmero mdio de horas por semana que os moradores do condado assistem televiso. StDev = 1.4033956. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 25.2601, 30.0899 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 25.2601 representa o limite inferior e 30.0899 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero mdio de horas por semana que os moradores do condado assistem televiso. Total = 8579.2500. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de horas por semana que os moradores do condado assistem televiso. 109
StDev = 435.0526503. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 7830.63, 9327.87 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7830.63 representa o limite inferior e 9327.87 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o nmero total de horas por semana que os moradores do condado assistem televiso. T Value = 1.72075. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
110
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2
Existe Ps-Estratificao? Digite NO Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
111
Deseja entrar com o(s) valor(es) da Mdia da Varivel Auxiliar? Digite YES Digite o(s) valor(es) de Mx: Digite 3.2 3.5 2.5 Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
Mtodo Separado N 180 Mean 4.1392 Total 745.0591 StDev 0.0486880 StDev 8.7638377 I.C. ( 4.05723, 4.22120 ) I.C. ( 730.302, 759.816 )
Mtodo Combinado N 180 Mean 4.1375 Total 744.7511 StDev 0.0494995 StDev 8.9099176 I.C. ( 4.05416, 4.22086 ) I.C. ( 729.748, 759.754 )
. T Value :
1.68385
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao estimador selecionado. No exemplo acima, os moradores foram selecionados por amostragem estratificada com amostragem aleatria simples sem reposio sendo o estimador razo. Mtodo Separado
N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.1392. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.1392 uma estimativa do peso mdio dos coelhos. 112
StDev = 0.0486880. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.05723, 4.22120 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.05723 representa o limite inferior e 4.22120 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 745.0591. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 8.7638377. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 730.302, 759.816 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 730.302 representa o limite inferior e 759.816 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. Mtodo Combinado
N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.1375. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.1375 uma estimativa do peso mdio dos coelhos. StDev = 0.0494995. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.05416, 4.22086 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.05416 representa o limite inferior e 4.22086 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 744.7511. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 8.9099176. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 729.748, 759.754 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 729.748 representa o limite inferior e 759.754 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. T Value = 1.68385. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada. 113
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 2 Escolha os tipos de estimadores: 1) Usuais 2) Razo 3) Regresso Digite a opo 3 Existe Ps-Estratificao? Digite NO Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
114
Digite o(s) valor(es) de Mx: Digite 3.2 3.5 2.5 Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
1.3529
1.1078
N 180
Mtodo Combinado ATENO : PRESSUPE COEFICIENTES IGUAIS PARA TODOS OS ESTRATOS . Coef. Angular Combinado N 180 : 0.9912 StDev 0.0523715 StDev 9.4268638 I.C. ( 3.95224, 4.12861 ) I.C. ( 711.403, 743.150 )
. T Value :
1.68385
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
115
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao estimador selecionado. No exemplo acima, os moradores foram selecionados por amostragem estratificada com amostragem aleatria simples sem reposio sendo o estimador regresso. Mtodo Separado Coef. Angular. Representa uma estimativa da mudana ocasionada na varivel resposta ao se acrescentar uma unidade a varivel auxiliar. Estrato 1 = 0.7695 Estrato 2 = 1.3529 Estrato 3 = 1.1078 N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.0951. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.0951 uma estimativa do peso mdio dos coelhos. StDev = 0.0527310. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 4.00635, 4.18393 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 4.00635 representa o limite inferior e 4.18393 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 737.1251. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 9.4915846. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 721.143, 753.108 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 721.143 representa o limite inferior e 753.108 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. Mtodo Combinado Coef. Angular Combinado = 0.9912. Representa uma estimativa da mudana ocasionada na varivel resposta ao se acrescentar uma unidade a varivel auxiliar. N = 180. Representa o tamanho da populao. No exemplo, corresponde ao nmero de coelhos que fizeram parte do estudo nutricional. Mean = 4.0404. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 4.0404 uma estimativa do peso mdio dos coelhos.
116
StDev = 0.0523715. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 3.95224, 4.12861 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 3.95224 representa o limite inferior e 4.12861 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso mdio dos coelhos. Total = 727.2761. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do peso total dos coelhos que fizeram parte do estudo nutricional. StDev = 9.4268638. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 711.403, 743.150 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 711.403 representa o limite inferior e 743.150 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para o peso total dos coelhos que fizeram parte do estudo nutricional. T Value = 1.68385. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
117
4. A seguir o programa dever fazer uma srie de perguntas, entre elas: Digite o mtodo de amostragem utilizado dentro dos estratos: 1) Amostragem Aleatria Simples com Reposio 2) Amostragem Aleatria Simples sem Reposio 3) Amostragem Sistemtica Digite a opo 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
118
___________________________________________________________________
OBS: Nvel de significncia igual 0.05. 6. Interpretao dos Resultados
119
Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos e ao mtodo de estimao da varincia. No exemplo acima, as empresas foram selecionadas pelo procedimento de amostragem estratificada com amostragem sistemtica sendo a varincia estimada pelos mtodos 1, 2 e 3. N = 300. Representa o tamanho da populao. No exemplo, corresponde ao nmero de empresas da regio sudeste. Mean = 26516.1892. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 26516.1892 uma estimativa da quantidade mdia de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. StDev Mean Method 1 = 1358.0726116. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 1588.5596829. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 1550.0621247. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta calculado atravs do mtodo 3. Total = 7954856.7667. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. StDev Total Method 1 = 407421.7834704. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 1. Method 2 = 476567.9048846. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 2. Method 3 = 465018.6374227. Representa uma estimativa do desvio padro do total amostral da varivel resposta calculado atravs do mtodo 3. I.C. Mean Method 1 = ( 24226.5, 28805.8 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 24226.5 representa o limite inferior e 28805.8 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade mdia de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 2 = ( 23837.9, 29194.4 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 23837.9 representa o limite inferior e 29194.4 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade mdia de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 3 = ( 23902.9, 29129.5 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 23902.9 representa o limite inferior e 29129.5 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade mdia de 120
dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. I.C. Total Method 1 = ( 7267962, 8641752 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7267962 representa o limite inferior e 8641752 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 2 = ( 7151384, 8758329 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7151384 representa o limite inferior e 8758329 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Method 3 = ( 7170856, 8738858 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 7170856 representa o limite inferior e 8738858 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto pelas empresas da regio sudeste com investimentos em cultura no primeiro semestre do ano. Correlacion . Representa uma estimativa da correlao intra-classe das unidades populacionais. Estrato 1 = -0.0508475 Estrato 2 = -0.0420875 Estrato 3 = -0.0201439 T Value = 1.68596. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada. OBS: A estimao da varincia populacional e por conseqncia a construo dos intervalos de confiana via mtodo 2 considera somente parties em que o tamanho da amostra (n) um mltiplo de m=2 ou m=3. Portanto, caso isto no ocorra, todas as estatsticas baseadas no mtodo 2 no sero apresentadas.
O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem estratificada com amostragem por conglomerados em um estgio e estimador P.P.S. O gerente de vendas de um jornal est interessado em estimar o nmero mdio de exemplares comprados por morador no ltimo bimestre. A cidade est dividida em trs regionais, a primeira contm 20 setores censitrios, a segunda 25 e a terceira 10. Sabe-se que o nmero de jornais comprados altamente correlacionado com o nmero de moradores do setor. Atravs do procedimento de amostragem proporcional ao tamanho selecionada uma amostra de setores de cada uma das regionais e todos os seus moradores so entrevistados. Regional 1 2 3 Nmero de setores censitrios selecionados 4 6 3
1. Abra o arquivo EX1_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. As 100 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2 Coluna - contm o nmero populacional de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. As 60 primeiras observaes so referentes ao 1 conglomerado, as 110 subseqentes ao 2, as 90 subseqentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. As 65 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2 e as 75 restantes ao 3. 6 Coluna - contm o nmero populacional de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado).
3. Session:
MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
122
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 200 230 110 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
123
N 10850
Mean 12.6970
StDev 0.2734650
n 1150
Total 137762.1013
StDev 2967.0952087
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador P.P.S. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 12.6970. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 12.6970 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.2734650. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
124
I.C. = ( 12.2472, 13.1468 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 12.2472 representa o limite inferior e 13.1468 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 1150. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 137762.1013. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 2967.0952087. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 132882, 142643 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 132882 representa o limite inferior e 142643 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
125
1. Abra o arquivo EX1_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. As 100 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2 Coluna - contm o nmero populacional de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. As 60 primeiras observaes so referentes ao 1 conglomerado, as 110 subseqentes ao 2, as 90 subseqentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. As 65 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2 e as 75 restantes ao 3. 6 Coluna - contm o nmero populacional de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
3. Session:
126
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 200 230 110 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
127
N 10850
Mean 12.7044
StDev 0.1218289
n 1150
Total 137843.1281
StDev 1321.8430703
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador razo. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 12.7044. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, 12.7044 uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.1218289. resposta. Representa uma estimativa do desvio padro da mdia amostral varivel
128
I.C. = ( 12.5040, 12.9048 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 12.5040 representa o limite inferior e 12.9048 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 1150. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 137843.1281. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 1321.8430703. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 135669, 140017 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 135669 representa o limite inferior e 140017 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
! !
129
1. Abra o arquivo EX2_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. 2 Coluna - contm o nmero populacional e amostral de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. 4 Coluna - contm o nmero populacional e amostral de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. 6 Coluna - contm o nmero populacional e amostral de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
3. Session:
130
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
131
N 10850
Mean 19.5542
StDev 0.2183551
n 2510
Total 212163.3333
StDev 2369.1526849
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador no viciado - unidades de mesmo tamanho. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 19.5542. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.2183551. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
132
I.C. = ( 19.1951, 19.9134 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 19.1951 representa o limite inferior e 19.9134 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 2510. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 212163.3333. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 2369.1526849. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 208266, 216060 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 208266 representa o limite inferior e 216060 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
" "
133
1. Abra o arquivo EX1_AEC1E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato. As 100 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2, as 80 subseqentes ao 3 e as 90 restantes ao 4. 2 Coluna - contm o nmero populacional de conglomerados no primeiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato. As 60 primeiras observaes so referentes ao 1 conglomerado, as 110 subseqentes ao 2, as 90 subseqentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional de conglomerados no segundo estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato. As 65 primeiras observaes so referentes ao 1 conglomerado, as 80 subseqentes ao 2 e as 75 restantes ao 3. 6 Coluna - contm o nmero populacional de conglomerados no terceiro estrato e o nmero populacional de elementos em cada um dos conglomerados selecionados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
3. Session:
134
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 1 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 200 230 110 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
135
N 10850
Mean 5.6121
StDev 0.3409291
n 1150
Total 60891.6667
StDev 3699.0808168
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os moradores foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em um estgio sendo o estimador razo. Alm disso, trs estratos foram analisados. N = 10850. Representa o nmero de elementos na populao. No exemplo, corresponde ao nmero de habitantes da cidade. Mean = 5.6121. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa do nmero mdio de jornais comprados por morador no ltimo bimestre. StDev = 0.3409291. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
136
I.C. = ( 5.05136, 6.17291 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 5.05136 representa o limite inferior e 6.17291 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero mdio de jornais comprados por morador no ltimo bimestre. n = 1150. Representa o nmero total de elementos amostrados. No exemplo, corresponde ao nmero de habitantes da cidade que foram entrevistados. Total = 60891.6667. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa do nmero total de jornais vendidos na cidade no ltimo bimestre. StDev = 3699.0808168. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 54807.2, 66976.1 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio normal (n 30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 54807.2 representa o limite inferior e 66976.1 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para o nmero total de jornais vendidos na cidade no ltimo bimestre. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30, em todos os estratos, ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
# #
137
Sabe-se que o nmero mdio de salas de aula nas escolas das regies 1, 2 e 3 15, 20 e 10, respectivamente. 1. Abra o arquivo EX1_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 6 primeiras observaes so referentes ao 1 conglomerado (escola), as 8 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional de conglomerados (escolas) no primeiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 7 primeiras observaes so referentes ao 1 conglomerado (escola) e as 8 subseqentes ao 2. 4 Coluna - contm o nmero populacional de conglomerados (escolas) no segundo estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 6 subseqentes ao 2, as 4 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional de conglomerados (escolas) no terceiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados.
138
2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 1 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 20 10 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
139
. . . .
Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : P.P.S. : 3
N 1150
Mean 49.5092
StDev 3.1246170
n 135
Total 56935.5833
StDev 3593.3095529
. T Value :
1.65648
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador P.P.S. Alm disso, trs estratos foram analisados. N = 1150. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 49.5092. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 3.1246170. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
140
I.C. = ( 44.3333, 54.6851 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 44.3333 representa o limite inferior e 54.6851 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 56935.5833. Representa uma estimativa do total populacional da varivel resposta. StDev = 3593.3095529. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 50983.3, 62887.8 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 50983.3 representa o limite inferior e 62887.8 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
141
Sabe-se que o nmero mdio de salas de aula nas escolas das regies 1, 2 e 3 15, 20 e 10, respectivamente. 1. Abra o arquivo EX1_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 6 primeiras observaes so referentes ao 1 conglomerado (escola), as 8 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional de conglomerados (escolas) no primeiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 7 primeiras observaes so referentes ao 1 conglomerado (escola) e as 8 subseqentes ao 2. 4 Coluna - contm o nmero populacional de conglomerados (escolas) no segundo estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 6 subseqentes ao 2, as 4 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional de conglomerados (escolas) no terceiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados.
142
2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 2 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 20 10 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
143
. . . .
Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : Razo : 3
N 1150
Mean 48.4510
StDev 1.2327308
n 135
Total 55718.6901
StDev 1417.6403954
. T Value :
1.65648
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador razo. Alm disso, trs estratos foram analisados. N = 1150. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 48.4510. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 1.2327308. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
144
I.C. = ( 46.4090, 50.4930 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 46.4090 representa o limite inferior e 50.4930 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 55718.6901. Representa uma estimativa do total populacional da varivel resposta. StDev = 1417.6403954. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 53370.4, 58067.0 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 53370.4 representa o limite inferior e 58067.0 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
145
1. Abra o arquivo EX2_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 5 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional e amostral de conglomerados (escolas) no primeiro estrato (regio) e o nmero populacional e amostral de elementos (salas) em cada um dos conglomerados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 3 primeiras observaes so referentes ao 1 conglomerado (escola), as 3 subsequentes ao 2 , as 3 subsequentes ao 3 e assim por diante. 4 Coluna - contm o nmero populacional e amostral de conglomerados (escolas) no segundo estrato (regio) e o nmero populacional e amostral de elementos (salas) em cada um dos conglomerados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 5 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional e amostral de conglomerados (escolas) no terceiro estrato (regio) e o nmero populacional e amostral de elementos (salas) em cada um dos conglomerados.
146
2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 3 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
147
. . . .
Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : No Viciado Unidades de Mesmo Tamanho : 3
N 850
Mean 48.1536
StDev 2.0972890
n 135
Total 40930.5425
StDev 1782.6956137
. T Value :
1.65648
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador no viciado unidades de mesmo tamanho. Alm disso, trs estratos foram analisados. N = 850. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 48.1536. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 2.0972890. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
148
I.C. = ( 44.6795, 51.6277 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 44.6795 representa o limite inferior e 51.6277 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 40930.5425. Representa uma estimativa do total populacional da varivel resposta. StDev = 1782.6956137. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 37977.5, 43883.5 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 37977.5 representa o limite inferior e 43883.5 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
149
Sabe-se que o nmero mdio de salas de aula nas escolas das regies 1, 2 e 3 15, 20 e 10, respectivamente. 1. Abra o arquivo EX3_AEC2E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 1. As 6 primeiras observaes so referentes ao 1 conglomerado (escola), as 8 subseqentes ao 2, as 5 subseqentes ao 3 e assim por diante. 2 Coluna - contm o nmero populacional de conglomerados (escolas) no primeiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 2. As 7 primeiras observaes so referentes ao 1 conglomerado (escola) e as 8 subseqentes ao 2. 4 Coluna - contm o nmero populacional de conglomerados (escolas) no segundo estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados. 5 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do terceiro estrato, ou seja, as notas mdias, por turma, dos alunos pertencentes as escolas da regio 3. As 5 primeiras observaes so referentes ao 1 conglomerado (escola), as 6 subseqentes ao 2, as 4 subseqentes ao 3 e assim por diante. 6 Coluna - contm o nmero populacional de conglomerados (escolas) no terceiro estrato (regio) e o nmero amostral de elementos (salas) em cada um dos conglomerados selecionados.
150
2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3 C5; SUBC > Conglomerados C2 C4 C6.
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 2 Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador de Razo 3) Estimador No Viciado Unidades de mesmo tamanho em cada estgio 4) Estimador No Viciado Unidades de tamanho diferente em cada estgio Digite 4 Deseja entrar com o tamanho mdio populacional dos conglomerados? Digite YES 15 20 10 Pressione a tecla Enter Pressione a tecla Enter (refere-se ao 1 estrato) Pressione a tecla Enter (refere-se ao 2 estrato) Pressione a tecla Enter (refere-se ao 3 estrato)
151
. . . .
Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Dois Estimadores : No Viciado Unidades de Tamanho Diferente : 3
N 1150
Mean 47.1256
StDev 4.9141527
n 135
Total 54194.4452
StDev 5651.2755600
. T Value :
1.65648
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em dois estgios sendo o estimador no viciado unidades de tamanho diferente. Alm disso, trs estratos foram analisados. N = 1150. Representa o nmero de elementos do segundo estgio na populao. No exemplo, corresponde ao nmero de salas de aula na cidade. Mean = 47.1256. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da nota mdia dos alunos por sala de aula. StDev = 4.9141527. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta.
152
I.C. = ( 38.9854, 55.2658 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 38.9854 representa o limite inferior e 55.2658 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a nota mdia dos alunos por sala de aula. n = 135. Representa o nmero total de elementos do segundo estgio amostrados. No exemplo, corresponde ao nmero de salas de aula da cidade que foram amostradas. Total = 54194.4452. Representa uma estimativa do total populacional da varivel resposta. StDev = 5651.2755600. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 44833.2, 63555.7 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 44833.2 representa o limite inferior e 63555.7 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student. T Value = 1.65648. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio t-student. Neste caso, se o tamanho da amostra fosse maior ou igual 30, em todos os estratos, ao invs de T Value teramos Z Value que corresponde ao ponto crtico baseado em uma distribuio normal padronizada.
153
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3
154
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 1 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
Digite uma das opes: 1, 2, 3 ou 4 Escolha uma das opes abaixo: 1) Entrar com os fatores de ponderao dos estratos 2) Entrar com o nmero de elementos da populao para cada estrato Digite 1 ou 2 Opo 2 Digite o nmero de elementos da populao para cada estrato: Digite 2000 1000 Pressione a tecla Enter (refere-se ao nmero de unidades do 3 estgio no 1 estrato) Pressione a tecla Enter (refere-se ao nmero de unidades do 3 estgio no 2 estrato)
155
. . . .
Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Trs Estimadores : P.P.S.
N 3000
Mean 294.8705
StDev 5.2180080
n 838
Total 884611.4353
StDev 15654.0239955
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em trs estgios sendo o estimador P.P.S. Alm disso, dois estratos foram analisados. N = 3000. Representa o nmero de elementos do terceiro estgio na populao. No exemplo, corresponde ao nmero de domiclios da regio. Mean = 294.8705. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da quantidade mdia de dinheiro gasto com ligaes telefnicas por domiclio. StDev = 5.2180080. Representa uma estimativa do desvio padro da mdia amostral da varivel resposta. I.C. = ( 286.288, 303.453 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 286.288 representa o limite inferior e 303.453 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade media de dinheiro gasto com ligaes telefnicas por domiclio. 156
n = 838. Representa o nmero total de elementos do terceiro estgio amostrados. No exemplo, corresponde ao nmero total de domiclios da regio que foram amostrados. Total = 884611.4353. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da quantidade total de dinheiro gasto com ligaes telefnicas na regio. StDev = 15654.0239955. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 858863, 910360 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 858863 representa o limite inferior e 910360 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto com ligaes telefnicas na regio. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
O exemplo a seguir ilustra a utilizao do Sampling em um problema envolvendo a amostragem por conglomerados em trs estgios e estimador no viciado - unidades de mesmo tamanho. Uma pesquisa scio-econmica est sendo realizada com o objetivo de estimar o gasto mdio com ligaes telefnicas, por domiclio, em uma determinada regio. Como no h um cadastro centralizado contendo informaes referentes a todos os domiclio, o estatstico responsvel pelo estudo decidiu adotar o seguinte procedimento: a regio foi dividida em 2 reas economicamente distintas, A e B; selecionou-se, de forma aleatria, 20 setores censitrios na rea A e 10 na rea B; em cada setor, 5 quarteires foram sorteados na rea A e 3 na rea B; em cada quarteiro, 2 domiclios foram sorteados em ambas as reas para receberem a visita do pesquisador. 1. Abra o arquivo EX2_AEC3E.MTW. Observe a estrutura dos dados: 1 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do primeiro estrato, ou seja, a quantidade de dinheiro gasto com ligaes telefnicas para cada domiclio pertencente a rea A. As 2 primeiras observaes representam o 1 quarteiro do 1 setor censitrio da rea A, as observaes de ordem 11 e 12 representam o 1 quarteiro do 2 setor censitrio da rea A e assim por diante. 2 Coluna - contm o nmero populacional e amostral de conglomerados (setores) no primeiro estrato (rea), o nmero populacional e amostral de unidades do segundo estgio (quarteires) e o nmero populacional e amostral de unidades do terceiro estgio (domiclios) em cada um dos conglomerados. 3 Coluna - contm os valores da varivel resposta para cada um dos conglomerados selecionados a partir do segundo estrato, ou seja, a quantidade de dinheiro gasto com ligaes telefnicas para cada domiclio pertencente a rea B. As 2 primeiras observaes representam o 1 quarteiro do 1 setor censitrio da rea B, as observaes de ordem 6 e 7 representam o 1 quarteiro do 2 setor censitrio da rea B e assim por diante. 4 Coluna - contm o nmero populacional e amostral de conglomerados (setores) no segundo estrato (rea), o nmero populacional e amostral de unidades do segundo estgio (quarteires) e o nmero populacional e amostral de unidades do terceiro estgio (domiclios) em cada um dos conglomerados. 2. Digite o comando SWAP (caso ele ainda no tenha sido digitado). 3. Session: MTB > %Sampling; SUBC > Estrato C1 C3; SUBC > Conglomerados C2 C4.
% % % %
4. A seguir o programa dever fazer uma srie de perguntas: Digite o nmero de estgios: 1) Um estgio 2) Dois estgios 3) Trs estgios Digite 3
158
Escolha o tipo de estimador: 1) Estimador P.P.S. 2) Estimador No Viciado Unidades de mesmo tamanho em cada estgio Digite 2 Escolha o nvel de significncia desejado: 1) 2) 3) 4) 0.010 0.025 0.050 0.100
. . . .
Tipo de Amostragem : Estratificada Tipo de Amostragem dentro dos Estratos: Conglomerados Nmero de Estgios : Trs Estimadores : No Viciado Unidades de Mesmo Tamanho : 2
N 16750
Mean 113.8525
StDev 5.0039652
n 260
Total 1907030.1046
StDev 83816.4172794
. Z Value :
1.64485
___________________________________________________________________
OBS: Nvel de significncia igual 0.05.
159
6. Interpretao dos Resultados Inicialmente o programa apresenta algumas informaes referentes ao tipo de amostragem global e dentro dos estratos, ao nmero de estgios, ao estimador selecionado e ao nmero de estratos analisados. No exemplo acima, os alunos foram selecionados pelo procedimento de amostragem estratificada com amostragem por conglomerados em trs estgios sendo o estimador no viciado unidades de mesmo tamanho. Alm disso, dois estratos foram analisados. N = 16750. Representa o nmero de elementos do terceiro estgio na populao. No exemplo, corresponde ao nmero de domiclios da regio. Mean = 113.8525. Representa uma estimativa da mdia populacional da varivel resposta. No exemplo, uma estimativa da quantidade mdia de dinheiro gasto com ligaes telefnicas por domiclio. StDev = 5.0039652. Representa uma estimativa do desvio padro da mdia populacional da varivel resposta. I.C. = (105.622, 122.083 ). Este um intervalo de confiana de 95% para a mdia populacional da varivel resposta baseado na distribuio normal (n30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 105.622 representa o limite inferior e 122.083 o limite superior de um intervalo de 95% de confiana, baseado na distribuio normal, para a quantidade media de dinheiro gasto com ligaes telefnicas por domiclio. n = 260. Representa o nmero total de elementos do terceiro estgio amostrados. No exemplo, corresponde ao nmero total de domiclios da regio que foram amostrados. Total = 1907030.1046. Representa uma estimativa do total populacional da varivel resposta. No exemplo, corresponde a uma estimativa da quantidade total de dinheiro gasto com ligaes telefnicas na regio. StDev = 83816.4172794. Representa uma estimativa do desvio padro do total amostral da varivel resposta. I.C. = ( 1769164, 2044896 ). Este um intervalo de confiana de 95% para o total populacional da varivel resposta baseado na distribuio t-student (n<30). O nvel de significncia pode ser selecionado a partir de uma lista de opes, a qual sempre fornecida. No exemplo, 1769164 representa o limite inferior e 2044896 o limite superior de um intervalo de 95% de confiana, baseado na distribuio t-student, para a quantidade total de dinheiro gasto com ligaes telefnicas na regio. Z Value = 1.64485. Representa o ponto crtico que deixa uma probabilidade de 2,5% em cada uma das caudas de uma distribuio normal. Neste caso, se o tamanho da amostra fosse menor do que 30 ao invs de Z Value teramos T Value que corresponde ao ponto crtico baseado em uma distribuio t-student.
Apesar dos exemplos aqui expostos no fazerem referncia ao caso em que a varivel resposta apresenta uma caracterstica dicotmica, ou seja, uma observao sempre classificada como pertencente ou no a categoria de interesse, o software Sampling est totalmente habilitado a trabalh-lo. A forma pela qual os dados devem estar estruturados bem como os comandos que devem ser utilizados so exatamente os mesmos ilustrados pelas sees anteriores, no sendo, portanto, necessrio maiores discusses.
Inicialmente, ao se executar o Sampling, uma srie de perguntas so realizadas. Estas perguntas tm como objetivo abortar o programa caso seja detectado algum erro na especificao dos parmetros, direcionar a anlise e fornecer uma maior explorao dos dados. Para continuar digite "yes" ou digite "no" para parar o processamento: Se uma ou mais colunas foram incorretamente especificadas na linha de comando, ou por algum outro motivo seja necessrio parar a execuo do programa, basta digitar no, de modo contrrio, digite yes.
Deseja estimar o tamanho da amostra? Se o objetivo estimar o tamanho da amostra e/ou calcular alocaes digite yes, caso contrrio, digite no. Esta pergunta tem a finalidade de desviar o processamento diretamente para o mdulo de clculo do tamanho da amostra e no estar disponvel para a amostragem por conglomerados. Sendo a resposta afirmativa, as demais perguntas no sero realizadas. Deseja estatstica descritiva por estrato? Deseja anlise grfica por estrato? Respondendo yes : Digite (1) para anlise de todos os estratos ou (2) para escolha dos estratos: Se o plano amostral utilizado na coleta dos dados no foi a amostragem estratificada, existe apenas um estrato, portanto, digite 1. Se o plano amostral utilizado na coleta dos dados foi a amostragem estratificada, digite 1 se todos os estratos devem ser analisados ou 2 para selecionar os estratos de interesse. No caso da seleo de estratos: Digite o nmero de estratos para anlise: Digite o nmero total de estratos que devem ser analisados. Digite o nmero dos estratos para anlise: Digite o nmero dos estratos que devero ser analisados (seguido da tecla enter) observe que cada estrato referenciado pela ordem em que aparece na linha de comando inicial. EX: %Sampling; Estratos C2 C1 C3; Tamanho C4.
162
Se o plano amostral utilizado na coleta dos dados foi a amostragem estratificada esta opo permite que seja feita uma anlise da situao geral, isto , desconsiderando a existncia dos estratos. Caso o procedimento utilizado no seja a amostragem estratificada a anlise global fornece exatamente os mesmos resultados da anlise por estrato.
Digite "Yes" para continuar ou "No" para parar a anlise: Se algum problema foi detectado digite yes para abortar o programa, caso contrrio, digite no para continuar a anlise.
(1) Todas as perguntas acima no estaro disponveis quando o procedimento utilizado na coleta dos dados for a amostragem por conglomerados. (2) As perguntas realizadas com relao a anlise descritiva da varivel resposta tambm sero feitas para a varivel auxiliar, caso ela exista. (3) Se no existir varivel auxiliar a estatstica corr ser substituda pelo smbolo *.
OBS:
163
REFERNCIAS BIBLIOGRFICAS
COCHRAN, W.G.,Sampling techniques, 3a. ed., New York:John Wiley & 1977. Sons,
MINITAB Inc. User's guide 1: Data, Graphics, and Macros, version 13.0, Pennsilvania, 2000. MINITAB Inc. User's guide 2: Data Analysis and Quality Tools, version 13.0, Pennsilvania, 2000. MINGOTI, S.A. e AGUIAR, S., Elementos bsicos de estatstica e com enfoque em minerao, So Paulo: ABM, 1988. amostragem
SCHEAFFER, R.A. , MENDENHALL, W. e OTT, L., Elementary survey sampling, 5a. ed., Belmont: Duxbury Press, 1996. SUKHATME, P. V. e SUKHATME, B. V. Sampling theory of surveys with applications, Ames: Iowa State University Press, 1970. THOMPSON, S. K. Sampling, New York: John Wiley.
164