Академический Документы
Профессиональный Документы
Культура Документы
paramétricos
Em um ano
Guy Shapira/Shutterstock
11.1 Teste dos sinais recente, a forma
mais comum de
11.2 Testes de Wilcoxon roubo de identidade
•• Estudo de caso relatada foi fraude
de documentos/
benefícios do
11.3 Teste de Kruskal-Wallis governo, que
representou 46%
11.4 Correlação de postos dos casos. A
segunda forma
mais comum foi
11.5 Teste de corridas fraude de cartão
•• Usos e abusos de crédito, que
•• Estatística real – Decisões reais respondeu por
•• Tecnologia 13% dos casos.
Onde estamos
Até este ponto no livro, você estudou dezenas de fór- ro de vítimas de roubo de identidade também aumen-
mulas e testes estatísticos diferentes que podem ajudar ta. Essa crença pode ser confirmada por dados reais?
em um processo de tomada de decisão. Condições es- A Tabela 11.1 mostra os números de reclamações de
pecíficas tinham de ser satisfeitas a fim de usar essas fraude e vítimas de roubo de identidade para 25 estados
fórmulas e testes. selecionados aleatoriamente em um ano recente. (Fonte:
Suponha que se acredite que, conforme o número de Federal Trade Commission.)
reclamações de fraude em um estado aumenta, o núme-
Tabela 11.1
Reclamações de fraude 19.470 33.434 28.285 15.906 5.165 58.543 5.973 6.693
Vítimas de roubo de identidade 5.060 7.032 4.864 2.915 902 19.232 658 905
Reclamações de fraude 10.644 5.224 33.199 49.501 3.729 15.446 6.600 82.289
Vítimas de roubo de identidade 2.077 666 6.178 12.075 501 3.032 782 21.538
Reclamações de fraude 50.128 13.173 18.399 4.549 2.427 28.091 9.907 33.720 6.204
Vítimas de roubo de identidade 8.891 2.586 2.467 963 330 5.690 1.586 5.373 1.002
madamente 0,965, então há uma correlação positiva for- podem-se questionar os resultados porque os dados não
te. Você pode determinar que a correlação é significativa se encaixam nos requisitos para o teste. Você estudará
usando a Tabela B.11 no Apêndice B. Uma análise mais testes similares neste capítulo, como o teste de correla-
profunda dos dados, contudo, pode mostrar que as vari- ção de postos de Spearman, que lhe darão informações
áveis não parecem ter uma distribuição normal bivariada, adicionais. O coeficiente de correlação de postos de
o que é um dos requisitos para usar o coeficiente de cor- Spearman para esses dados é aproximadamente 0,965.
relação de Pearson. Com a = 0,01, há de fato uma correlação significativa
Assim, embora um simples teste de correlação pos- entre o número de reclamações de fraude e o número
sa indicar uma relação entre o número de reclamações de vítimas de roubo de identidade para cada estado (veja
de fraude e o número de vítimas de roubo de identidade, a Figura 11.1).
Figura 11.1 Número de reclamações de fraude e vítimas de roubo de identidade para 25 estados.
y
Vítimas de roubo de identidade
25.000
20.000
15.000
10.000
5.000
x
20.000 40.000 60.000 80.000 100.000
Reclamações de fraude
Definição
Um teste não paramétrico é um teste de hipótese que não requer quaisquer
condições específicas acerca das formas das distribuições populacionais ou
dos valores de parâmetros populacionais.
Definição
O teste dos sinais é um teste não paramétrico que pode ser usado para testar
uma mediana populacional contra um valor hipotético k.
O teste dos sinais para uma mediana populacional pode ser unilateral
à esquerda, unilateral à direita ou bilateral. As hipóteses nula e alternativa Entenda
para cada tipo de teste são as seguintes: Para testes não paramétricos, os
Teste unilateral à esquerda: estatísticos testam a mediana
H0: mediana ≥ k e Ha: mediana < k em vez
da média.
Teste unilateral à direita:
H0: mediana ≤ k e Ha: mediana > k
Teste bilateral:
H0: mediana = k e Ha: mediana ≠ k.
Para usar o teste de sinais, primeiro compare cada valor na amostra
com a mediana hipotética k. Quando o valor estiver abaixo da media-
na, atribua-lhe um sinal –; quando o valor estiver acima da mediana,
atribua-lhe um sinal + e, quando o valor for igual à mediana, atribua-lhe
um 0. Então, compare o número de sinais + e – (os zeros são ignorados).
Quando houver uma grande diferença entre o número de sinais + e o
número de sinais –, é provável que a mediana seja diferente do valor
hipotético e você deve rejeitar a hipótese nula.
A Tabela B.8 no Apêndice B lista os valores críticos para o teste dos
sinais para níveis de significância selecionados e tamanhos de amostras.
Quando o teste de sinais é usado, o tamanho da amostra n é o número total
de sinais + e –. Quando o tamanho da amostra é maior que 25, você pode
usar a distribuição normal padrão para encontrar os valores críticos.
Entenda
Estatística de teste para o teste dos sinais Já que os zeros são ignorados, há
dois resultados possíveis quando
Quando n ≤ 25, a estatística de teste para o teste dos sinais é x, o menor comparamos uma entrada
número dos sinais + ou –. de dados com uma mediana
Quando n > 25, a estatística de teste para o teste de sinais é: hipotética: um sinal + ou um –. Se
1x + 0,52 - 0,5n a mediana for k, então cerca da
z= metade dos valores estará acima
1n
2 de k e metade estará abaixo.
Como tal, a probabilidade para
em que x é o menor número de sinais + ou – e n é o tamanho da amostra, isto cada sinal é 0,5. A Tabela B.8 no
é, o número total dos sinais + e –. Apêndice B é construída usando
a distribuição binomial em que p
= 0,5.
Uma vez que x é definido como o menor número dos sinais + ou –, a
Quando n > 25, você pode usar
região de rejeição está sempre na lateral esquerda. Consequentemente,
a aproximação normal (com uma
o teste dos sinais para uma mediana populacional é sempre um teste
correção de continuidade) para a
unilateral à esquerda ou um teste bilateral. Quando o teste for bilateral,
binomial. Neste caso, use m = np
use apenas o valor crítico da lateral à esquerda. (Quando x é definido
= 0,5n e
como o maior número dos sinais + ou –, a região de rejeição está sempre
1n
na lateral direita. Testes dos sinais unilaterais à direita são apresentados s = 1npq = .
nos exercícios.) 2
4 Estatística aplicada
Instruções
Realizando um teste dos sinais para uma mediana populacional
EM PALAVRAS EM SÍMBOLOS
1. Verifique se a amostra é aleatória.
2. Identifique a afirmação. Declare as Formule H0 e Ha.
hipóteses nula e alternativa.
3. Especifique o nível de Identifique a.
significância.
4. Determine o tamanho da amostra n = número total de sinais + e –
n, atribuindo sinais +, sinais – e
zeros aos dados da amostra.
5. Determine o valor crítico. Quando n ≤ 25, use a Tabela B.8
no Apêndice B. Quando n > 25,
use a Tabela B.4 no Apêndice B.
6. Encontre a estatística de teste. Quando n ≤ 25, use x = o menor
número dos sinais + ou –. Quando
1x + 0,52 - 0,5n
n > 25, use z =
1n
2
7. Tome uma decisão para rejeitar ou Se a estatística de teste é menor
não rejeitar a hipótese nula. ou igual ao valor crítico, então
rejeite H0. Caso contrário, não
rejeite H0.
8. Interprete a decisão no contexto
da afirmação original.
Exemplo 1
Solução
A afirmação é “o número mediano de visitantes, por dia, do site da
empresa é de não mais de 1.500”.Então, as hipóteses nula e alternativa são:
H0: mediana ≤ 1.500 (Afirmação) e Ha: mediana > 1.500.
Os resultados da comparação de cada dado com a mediana hipotéti-
ca 1.500 são mostrados a seguir:
– – + + 0
– – + + –
– + + + +
+ + + – +
Capítulo 11 Testes não paramétricos 5
Exemplo 2
Solução
A afirmação é “a frequência mediana anual dos museus dos Estados
Unidos é de pelo menos 39.000 visitantes”. Então, as hipóteses nula e
alternativa são:
H0: mediana ≥ 39.000 (Afirmação) e Ha: mediana < 39.000.
Como n > 25, use a Tabela B.4 no Apêndice B, a Tabela Normal Pa-
drão, para encontrar o valor crítico. Uma vez que o teste é unilateral à
esquerda com a = 0,01, o valor crítico é z0 = –2,33. Dos 125 museus, há
79 com sinal – e 42 com sinal +. Uma vez que os zeros são ignorados, o
tamanho da amostra é:
n = 79 + 42 = 121 e x = 42.
6 Estatística aplicada
Consumo de doces Figura 11.2 Distribuição normal, região de rejeição e estatística de teste.
Consumo (em libras por pessoa)
26
25
24
23
a = 0,01
22
21
z ≈ − 3,27
1998 2002 2006 2010
z
Ano -4 -3 -2 -1 0 1 2 3 4
z0 = -2,33
Você usaria um teste paramétrico
ou um teste não paramétrico
para testar a afirmação do Interpretação Há evidência suficiente, ao nível de significância de
Departamento de Comércio dos 1%, para rejeitar a afirmação da organização de que a frequência mediana
EUA a respeito do consumo de anual para museus nos Estados Unidos é de pelo menos 39.000 visitantes.
doces? Que fatores devem ser
considerados?
Tente você mesmo 2
Uma organização afirma que a idade mediana dos funcionários de
museus nos Estados Unidos é 40 anos. Uma amostra aleatória de 95 fun-
cionários de museus revela que 46 deles têm menos de 40 anos, 45 têm
mais de 40 anos e 4 têm 40 anos. Com a = 0,10, você pode rejeitar a afirma-
Dica de estudo ção da organização? (Adaptado de American Association of Museums.)
Quando realizar um teste dos a. Identifique a afirmação e declare H0 e Ha.
sinais bilateral, lembre-se de usar b. Identifique o nível de significância a.
apenas o valor crítico da lateral à c. Determine o tamanho da amostra n.
esquerda.
d. Encontre o valor crítico.
e. Encontre a estatística de teste z.
f. Decida se rejeita a hipótese nula.
g. Interprete a decisão no contexto da afirmação original.
Instruções
Realizando um teste dos sinais para amostras pareadas
EM PALAVRAS EM SÍMBOLOS
1. Verifique se as amostras são aleató-
rias e dependentes.
2. Identifique a afirmação. Declare as Formule H0 e Ha.
hipóteses nula e alternativa.
3. Especifique o nível de significância. Identifique a.
4. Determine o tamanho da amostra n n = número total de sinais + e –
encontrando a diferença para cada
par de dados. Atribua um sinal + a
uma diferença positiva, um sinal – a
uma diferença negativa e 0 a nenhu-
ma diferença.
5. Determine o valor crítico. Use a Tabela B.8 no Apêndice B.
6. Encontre a estatística de teste. x = o menor número dos sinais
+ ou –
7. Decida se rejeita ou não rejeita a hi- Se a estatística de teste é menor
pótese nula. ou igual ao valor crítico, então
rejeite H0. Caso contrário, não
rejeite H0.
8. Interprete a decisão no contexto da
afirmação original.
Exemplo 3
Presídio 1 2 3 4 5 6 7 8 9 10
Antes 21 34 9 45 30 54 37 36 33 40
Depois 19 22 16 31 21 30 22 18 17 21
Solução
Para testar a afirmação do psicólogo, use as hipóteses nula e alter-
nativa a seguir:
H0: O número de infratores reincidentes não diminuirá.
Ha: O número de infratores reincidentes diminuirá. (Afirmação)
A Tabela 11.3 mostra o sinal das diferenças entre os dados “antes”
e “depois”.
Presídio 1 2 3 4 5 6 7 8 9 10
Antes 21 34 9 45 30 54 37 36 33 40
Depois 19 22 16 31 21 30 22 18 17 21
Sinal + + – + + + + + + +
11.1 Exercícios
Construindo habilidades básicas e vocabulário ou menos. Os preços de venda (em dólares) de 10 ca-
sas selecionadas aleatoriamente estão listados a seguir.
1. O que é um teste não paramétrico? Como um teste Para um nível de significância a = 0,05, há evidência sufi-
não paramétrico difere de um teste paramétrico? Quais ciente para rejeitar a afirmação do corretor? (Adaptado
são as vantagens e desvantagens de usar um teste não de National Association of Realtors.)
paramétrico?
200.800 229.500 205.900 190.700 140.200
2. Quando o teste dos sinais é usado, qual parâmetro po- 193.900 249.000 170.900 184.500 207.500
pulacional está sendo testado?
10. Temperatura Durante uma previsão do tempo, um
3. Descreva a estatística de teste para o teste dos sinais
meteorologista afirma que a temperatura mediana má-
quando o tamanho da amostra n é inferior ou igual a 25
xima diária para o mês de janeiro em San Diego é de
e quando n é superior a 25.
66º Fahrenheit. As temperaturas máximas (em graus
4. Com suas palavras, explique por que o teste de hipótese
Fahrenheit) para 16 dias de janeiro selecionados aleato-
discutido nesta seção é chamado de teste dos sinais.
riamente em San Diego estão listadas a seguir. Com a =
5. Explique como usar o teste dos sinais para testar uma 0,01, você pode rejeitar a afirmação do meteorologista?
mediana populacional. (Adaptado de U.S. National Oceanic and Atmospheric
6. Liste as duas condições que devem ser atendidas de Administration.)
modo a usar o teste dos sinais com amostras pareadas. 78 74 72 72 70 70 72 78 74 71 72 74 77 79 75 73
15. Tamanho da unidade Uma organização de locatários 20. Dor nas costas Um médico afirma que as pontua-
afirma que o número mediano de cômodos em unidades ções da intensidade de dor nas costas diminuirão após
alugadas é quatro. Você seleciona aleatoriamente 120 tomar medicamentos anti-inflamatórios. A tabela a
unidades alugadas e obtém os resultados mostrados a seguir mostra as pontuações da intensidade de dor nas
seguir. Para o nível de significância a = 0,05, você pode costas para 12 pacientes antes e depois de tomarem
rejeitar a afirmação da organização? (Adaptado de U.S. medicamentos anti-inflamatórios por 8 semanas. Com
a = 0,05, há evidência suficiente para concordar com a
Census Bureau.)
afirmação do médico? (Adaptado de Archives of Inter-
Tamanho da unidade Número de unidades nal Medicine.)
23. Sentindo sua idade Uma empresa de pesquisa conduz é menor ou igual ao valor crítico da lateral à esquerda,
um levantamento selecionando aleatoriamente adultos em que x é o menor número de sinais + ou –. Para um
e perguntando a cada um: “Como você se sente em re- teste unilateral à direita, você pode rejeitar a hipótese
lação à sua idade?” Os resultados são apresentados na nula quando a estatística de teste
figura a seguir: (Adaptado de Pew Research Center.) 1x - 0,52 - 0,5n
z=
Minha idade 1n
Mais novo
2
9
11 é maior ou igual ao valor crítico da lateral à direita,
3 em que x é o maior número de sinais + ou –.
Mais velho
Nos exercícios 25 a 28, use um teste unilateral à direita e
(a) Use um teste dos sinais para testar a hipótese nula
(a) identifique a afirmação e declare H0 e Ha, (b) encon-
de que a proporção de adultos que se sentem mais
tre o valor crítico, (c) encontre a estatística de teste, (d)
velhos é igual à proporção de adultos que se sen-
decida se rejeita ou não a hipótese nula e (e) interprete
tem mais novos. Atribua um sinal + a cada adulto
a decisão no contexto da afirmação original.
que respondeu “mais velho”, atribua um sinal – a 25. Salário semanal Uma organização trabalhista afirma
cada adulto que respondeu “mais novo” e atribua que o salário mediano semanal de trabalhadores do sexo
um 0 a cada adulto que respondeu “minha idade”. feminino é inferior ou igual a US$ 704. Para testar essa
Use a = 0,05. afirmação, você seleciona aleatoriamente 50 trabalhado-
(b) O que você pode concluir? ras e pede que cada uma forneça seu salário semanal. A
tabela a seguir mostra os resultados. Com nível de signi-
24. Contatando os pais Uma empresa de pesquisa conduz
ficância a = 0,01, você pode rejeitar a afirmação da orga-
uma pesquisa selecionando aleatoriamente adultos e
nização? (Adaptado de U.S. Bureau of Labor Statistics.)
perguntando a cada um: “com que frequência você en-
tra em contato com seus pais por telefone?” Os resulta- Salário semanal Número de trabalhadoras
dos são mostrados na figura a seguir. (Adaptado de Pew
Menos de US$ 704 18
Research Center.)
US$ 704 3
Outro Semanalmente Mais de US$ 704 29
Definição
O teste dos postos sinalizados de Wilcoxon é um teste não paramétrico
que pode ser usado para determinar se duas amostras dependentes foram
selecionadas de populações que possuem a mesma distribuição.
Instruções
Realizando um teste dos postos sinalizados de Wilcoxon
EM PALAVRAS EM SÍMBOLOS
1. Verifique se as amostras são aleató-
rias e dependentes.
2. Identifique a afirmação. Declare as hi- Formule H0 e Ha.
póteses nula e alternativa.
3. Especifique o nível de significância. Identifique a.
4. Determine o tamanho da amostra n,
que é o número de pares de dados
cuja diferença não é 0.
5. Determine o valor crítico. Use a Tabela B.9 no Apêndice B.
6. Encontre a estatística de teste ws. Cabeçalhos: Amostra 1,
a. Complete uma tabela usando os Amostra 2, Diferença, Valor
cabeçalhos listados à direita. absoluto, Posto e Posto
sinalizado. Posto sinalizado
b. Encontre a soma dos postos positi-
adota o mesmo sinal de sua
vos e a soma dos postos negativos.
diferença correspondente.
Dica de estudo c. Selecione o menor valor absoluto
Lembre-se de que o valor absoluto das somas.
de um número é o seu valor, 7. Decida se rejeita ou não a hipótese Se ws é menor ou igual ao valor
desconsiderando seu sinal. Um nula. crítico, então rejeite H0. Caso
par de barras verticais, | |, é usado contrário, não rejeite H0.
para denotar o valor absoluto. Por 8. Interprete a decisão no contexto da
exemplo, |3| = 3 e |–7| = 7. afirmação original.
Capítulo 11 Testes não paramétricos 13
Exemplo 1
Solução
A afirmação é “os jogadores podem diminuir suas pontuações”. Para
testar essa afirmação, use as seguintes hipóteses nula e alternativa:
H0: O novo modelo não diminui as pontuações.
Ha: O novo modelo diminui as pontuações. (Afirmação)
Esse teste dos postos sinalizados de Wilcoxon é um teste unilateral
com a = 0,05 e, como um par de dados tem uma diferença 0, n = 9 em vez
de 10. Da Tabela B.9 no Apêndice B, o valor crítico é 8. Para encontrar a
estatística de teste ws, complete conforme mostra a Tabela 11.6.
Estatística de teste para o teste da soma dos postos de Wilcoxon Dica de estudo
Use o teste dos postos
Para duas amostras independentes, a estatística de teste z para o teste de
sinalizados de Wilcoxon para
soma dos postos de Wilcoxon é:
amostras dependentes e o teste
R - mR da soma dos postos de Wilcoxon
z=
sR para amostras independentes.
em que
R = soma dos postos para a menor amostra,
n1 1n1 + n2 + 12
mR = ,
2
e
n1 n2 1n1 + n2 + 12
sR = .
B 12
Instruções
Realizando um teste dos postos sinalizados de Wilcoxon
EM PALAVRAS EM SÍMBOLOS
1. Verifique que as amostras são aleató-
rias e independentes.
2. Identifique a afirmação. Declare as hi- Formule H0 e Ha.
póteses nula e alternativa.
3. Especifique o nível de significância. Identifique a.
4. Determine o(s) valor(es) crítico(s) e a(s) Use a Tabela B.4 no Apêndice B.
região(ões) de rejeição.
5. Determine os tamanhos das amostras. n1 ≤ n2
6. Encontre a soma dos postos para a me- R
nor amostra.
a. Liste os dados combinados em or-
dem crescente.
b. Classifique os dados combinados.
c. Adicione a soma dos postos para a
menor amostra, n1.
7. Encontre a estatística de teste e esbo- R - mR
ce a distribuição amostral. z=
sR
8. Decida se rejeita ou não a hipótese nula. Se z está na região de rejeição,
então rejeite H0.
Caso contrário, não rejeite H0.
9. Interprete a decisão no contexto da
afirmação original.
Exemplo 2
Solução
A afirmação é “há diferença entre o salário dos homens e das mulhe-
res”.Para testar essa afirmação, use as hipóteses nula e alternativa a seguir:
H0: Não há diferença entre o salário de homens e mulheres.
Dica de estudo Ha: Há diferença entre o salário de homens e mulheres. (Afirmação)
Lembre-se, no caso de um Como o teste é bilateral com a = 0,10, os valores críticos são –z0 =
empate entre os valores dos –1,645 e z0 = 1,645. As regiões de rejeição são z < –1,645 e z > 1,645.
dados, use a média dos postos O tamanho da amostra para os homens é 10 e para as mulheres é 12.
correspondentes. Uma vez que 10 < 12, n1 = 10 e n2 = 12. Antes de calcular a estatística de
teste, você deve encontrar os valores de R, mR e sR. A Tabela 11.9 mostra
os dados combinados em ordem crescente e os postos correspondentes.
≈ 15,17
Capítulo 11 Testes não paramétricos 17
≈ 1,52.
1 − a = 0,90
1 1
a = 0,05 a = 0,05
2 2
z
-3 -1 0 1 2 3
-z0 = -1,645 z0 = 1,645
z ≈ 1,52
11.2 Exercícios
Construindo habilidades básicas e vocabulário res) de uma amostra aleatória de 10 trabalhadores
do mercado atacadista e 10 trabalhadores da indús-
1. Como você sabe se deve usar um teste dos postos sina- tria. Com a = 0,10, você pode rejeitar a afirmação
lizados de Wilcoxon ou um teste da soma dos postos de do analista? (Adaptado de U.S. Bureau of Econo-
mic Analysis.)
Wilcoxon?
2. Qual é a condição para o tamanho de cada amostra ao Mercado atacadista 69 62 63 77 60
usar o teste da soma dos postos de Wilcoxon? Fabricação 69 65 54 72 52
Mercado atacadista 66 71 74 72 69
Usando e interpretando conceitos
Fabricação 63 74 56 62 50
Realizando um teste de Wilcoxon Nos exercícios 3 a 8, 5. Salário por grau Um administrador de faculdade
afirma que há uma diferença no salário de pessoas
(a) identifique a afirmação e declare H0 e Ha. com grau de bacharel e aquelas com grau de pós-gra-
duação. A tabela a seguir mostra os salários (em mi-
(b) decida se deve usar um teste dos postos sinalizados
lhares de dólares) de uma amostra aleatória de 11
de Wilcoxon ou um teste da soma dos postos de bacharéis e 10 pessoas pós-graduadas. Com a = 0,05,
Wilcoxon. há evidência suficiente para confirmar a afirmação do
(c) encontre o(s) valor(es) crítico(s). administrador? (Adaptado de U.S. Census Bureau.)
(f)
interprete a decisão no contexto da afirmação Bacharel 46 58 62 54 56
original. Pós-graduação 93 93 90 82
3. Suplementos de cálcio e pressão sanguínea Em um
estudo testando os efeitos de suplementos de cálcio 6. Dores de cabeça Um médico pesquisador quer determi-
na pressão sanguínea masculina, 12 homens foram es- nar se um novo remédio afeta o número de horas de dor
colhidos aleatoriamente e receberam um suplemento de cabeça pelas quais passam pessoas que sofrem desse
de cálcio por 12 semanas. A tabela a seguir mostra as mal. Para tanto, o pesquisador seleciona aleatoriamente
medições da pressão sanguínea diastólica, para cada sete pacientes e pede que cada um informe o número de
indivíduo, tirada antes e depois do período de 12 se- horas de dor de cabeça (por dia) que cada um sente antes
manas de tratamento. Com a = 0,01, você pode rejei-
e depois de tomar o remédio. A tabela a seguir mostra os
tar a afirmação de que não houve redução na pressão
sanguínea diastólica? (Adaptado de The Journal of resultados. Com nível de significância a = 0,05, o pesqui-
American Medical Association.) sador pode concluir que o novo remédio afeta o número
de horas de dor de cabeça?
Paciente 1 2 3 4
Paciente 1 2 3 4
Antes do tratamento 108 109 120 129
Horas de dor de cabeça (antes) 0,8 2,4 2,8 2,6
Depois do tratamento 99 115 105 116
Horas de dor de cabeça (depois) 1,6 1,3 1,6 1,4
Paciente 5 6 7 8
Paciente 5 6 7
Antes do tratamento 112 111 117 135
Horas de dor de cabeça (antes) 2,7 0,9 1,2
Depois do tratamento 115 117 108 122
Horas de dor de cabeça (depois) 1,5 1,6 1,7
Paciente 9 10 11 12
7. Salários de professores Um representante do sindi-
Antes do tratamento 124 118 130 115
cato de professores afirma que há uma diferença nos
Depois do tratamento 120 126 128 106 salários recebidos por professores em Wisconsin e Mi-
chigan. A tabela a seguir mostra os salários (em milha-
4. Comércio atacadista e fabricação Um analista de res de dólares) de uma amostra aleatória de 11 profes-
indústria privada afirma que não há diferença nos sores em Wisconsin e 12 professores em Michigan.
salários recebidos por trabalhadores do comércio Com a = 0,05, há evidência suficiente para aceitar a
atacadista e das indústrias manufatureiras. A tabe- afirmação do representante? (Adaptado de National
la a seguir mostra os salários (em milhares de dóla- Education Association.)
Capítulo 11 Testes não paramétricos 19
Wisconsin 55 61 53 47 52 Carro 1 2 3 4 5 6
Michigan 64 70 62 56 61 79 Sem aditivo 36,4 36,4 36,6 36,6 36,8 36,9
Com aditivo 36,7 36,9 37,0 37,5 38,0 38,1
8. Frequência cardíaca Um médico quer determinar se
uma medicação experimental afeta a frequência cardí- Carro 7 8 9 10 11 12
aca de um indivíduo. O médico seleciona aleatoriamen-
te 15 pacientes e mede a frequência cardíaca de cada Sem aditivo 37,0 37,1 37,2 37,2 36,7 37,5
um. Os indivíduos tomam, então, o medicamento e têm Com aditivo 38,4 38,7 38,8 38,9 36,3 38,9
suas frequências cardíacas medidas novamente após
uma hora. A tabela a seguir mostra os resultados. Para Carro 13 14 15 16 17 18
um nível de significância a = 0,05, o médico pode con-
Sem aditivo 37,6 37,8 37,9 37,9 38,1 38,4
cluir que a medicação experimental afeta a frequência
cardíaca de um indivíduo? Com aditivo 39,0 39,1 39,4 39,4 39,5 39,8
Paciente 1 2 3 4 5 Carro 19 20 21 22 23 24
Frequência cardíaca (antes) 72 81 75 76 79 Sem aditivo 40,2 40,5 40,9 35,0 32,7 33,6
Frequência cardíaca (depois) 73 80 75 79 74 Com aditivo 40,0 40,0 40,1 36,3 32,8 34,2
Paciente 6 7 8 9 10 Carro 25 26 27 28 29 30
Frequência cardíaca (antes) 74 65 67 76 83 Sem aditivo 34,2 35,1 35,2 35,3 35,5 35,9
Frequência cardíaca (depois) 76 73 67 74 77 Com aditivo 34,7 34,9 34,9 35,3 35,9 36,4
Paciente 11 12 13 14 15 Carro 31 32 33
Frequência cardíaca (antes) 66 75 76 78 68 Sem aditivo 36,0 36,1 37,2
Frequência cardíaca (depois) 70 77 76 75 74 Com aditivo 36,6 36,6 38,3
B 24 Com aditivo 34,2 34,9 34,9 34,9 35,7 36,0 36,2 36,5
Carro 17 18 19 20 21 22 23 24
Nos exercícios 9 e 10, realize o teste dos postos sinaliza- Sem aditivo 35,7 36,1 36,1 36,6 36,6 36,8 37,1 37,1
dos de Wilcoxon indicado usando a estatística de teste
Com aditivo 37,8 38,1 38,2 38,3 38,3 38,7 38,8 38,9
para n > 30.
9. Aditivo de combustível Um engenheiro de petróleo Carro 25 26 27 28 29 30 31 32
quer saber se certo aditivo de combustível melhora o
Sem aditivo 37,2 37,9 37,9 38,0 38,0 38,4 38,8 42,1
desempenho de um carro. Para decidir, o engenheiro
registra o desempenho (em milhas por galão) de 33 Com aditivo 39,1 39,1 39,2 39,4 39,8 40,3 40,8 43,2
carros selecionados aleatoriamente com e sem o aditi-
20 Estatística aplicada
Estudo de caso
Classificação das faculdades
A cada ano, a Forbes e o Center for College Affordability and Productivi-
ty lançam uma lista das melhores instituições de ensino superior nos Estados
Unidos. Seiscentas e cinquenta instituições de ensino superior são classificadas
de acordo com a qualidade da educação, proporção de graduação em 4 anos,
resultados da pós-graduação, dívida média do estudante após 4 anos e número
de estudantes que ganharam prêmios competitivos, tais como bolsas de estudos.
A tabela a seguir mostra o total de estudantes de instituições de ensino supe-
rior selecionadas aleatoriamente, por região, na lista de 2012.
Total de estudantes em cada uma das 40 instituições
Nordeste Centro-Oeste Sul Oeste
1.778 14.399 6.224 1.474
14.754 14.697 13.893 1.041
8.768 3.547 29.617 30.467
2.632 2.231 16.198 72.254
21.067 5.324 2.454 18.004
1.619 12.554 27.386 33.395
4.991 11.528 811 1.596
822 23.863 4.188 1.859
15.128 3.082 24.753 12.925
18.055 1.407 44.616 7.155
Exercícios
1. Construa um boxplot lado a lado para as quatro 4. A população total mediana de estudantes em ins-
regiões. Apenas observando o gráfico, é possível tituições no Sul é 10.000.
perceber duas ou mais medianas “próximas” ? Al- 5. A população total mediana de estudantes em ins-
guma parece ser diferente? tituições no Oeste é diferente de 8.000.
Nos exercícios 2 a 5, use o teste dos sinais para testar Nos exercícios 6 e 7, use o teste da soma dos postos
a afirmação. O que você pode concluir? Use a = 0,05. de Wilcoxon para testar a afirmação. Use a = 0,01.
2. A população total mediana de estudantes em ins- 6. Não há diferença entre a população total de estudan-
tituições no Nordeste é menor ou igual a 7.000. tes para as instituições no Centro-Oeste e no Oeste.
3. A população total mediana de estudantes em insti- 7. Há diferença entre a população total de estudan-
tuições no Centro-Oeste é maior ou igual a 8.000. tes para as instituições no Nordeste e no Sul.
Definição
O teste de Kruskal-Wallis é um teste não paramétrico que pode ser usado
para determinar se três ou mais amostras independentes foram selecionadas
de populações que possuem a mesma distribuição.
em que
k é o número de amostras,
ni é o tamanho da i-ésima amostra,
N é a soma dos tamanhos das amostras,
e
Ri é a soma dos postos da i-ésima amostra.
Instruções
Realizando um teste de Kruskal-Wallis
EM PALAVRAS EM SÍMBOLOS
1. Verifique se as amostras são aleatórias
e independentes, e cada tamanho de
amostra é pelo menos 5.
2. Identifique a afirmação. Declare as hi- Formule H0 e Ha.
póteses nula e alternativa.
3. Especifique o nível de significância. Identifique a.
4. Identifique os graus de liberdade g.l. = k – 1
5. Determine o valor crítico e a região de Use a Tabela B.6 no Apêndice B.
rejeição.
6. Encontre a soma dos postos para cada
amostra.
a. Liste os dados combinados em or-
dem crescente.
b. Classifique os dados combinados.
7. Encontre a estatística de teste e esbo- 12
H= #
ce a distribuição amostral. N 1N + 12
R12 R22 R2k
a + + c+ b
n1 n2 nk
- 3 1N + 12
8. Decida se rejeita ou não rejeita a hipó- Se H está na região de
tese nula. rejeição, então rejeite H0.
Caso contrário, não rejeite H0.
9. Interprete a decisão no contexto da
afirmação original.
Exemplo 1
Figura 11.4 D
istribuição qui-quadrado, região de rejeição e estatística
de teste.
a = 0,01
x2
2 4 6 8 10 12 14
H ≈ 12,521
x2 = 9,210
0
24 Estatística aplicada
11.3 Exercícios
Construindo habilidades básicas e vocabulário 3. Seguro residencial A tabela a seguir mostra os prê-
mios anuais para uma amostra aleatória de apólices de
1. Quais são as condições para usar um teste de seguro residencial em Connecticut, Massachusetts e Vir-
Kruskal-Wallis? ginia. Para um nível de significância a = 0,05, você pode
concluir que a distribuição dos prêmios anuais em pelo
2. Explique por que o teste de Kruskal-Wallis é sempre menos um estado é diferente das demais? (Adaptado de
um teste unilateral à direita. National Association of Insurance Commissioners.)
Definição
O coeficiente de correlação de postos de Spearman rs é uma medida da
força da relação entre duas variáveis. O coeficiente de correlação de postos de
Spearman é calculado usando-se os postos dos valores de amostras pareadas.
Se não houver empates nos postos de ambas as variáveis, a fórmula para o
coeficiente de correlação de postos de Spearman será:
6Σd 2
rs = 1 -
n (n 2 - 1)
Instruções
Testando a significância do coeficiente de correlação de postos de
Spearman
EM PALAVRAS EM SÍMBOLOS
1. Identifique a afirmação. Declare as
Formule H0 e Ha.
hipóteses nula e alternativa.
2. Especifique o nível de significância. Identifique a.
3. Determine o valor crítico. Use a Tabela B.10 no Apêndice B.
4. Encontre a estatística de teste. 6Σd 2
rs = 1 -
n (n 2 - 1)
5. Tome uma decisão para rejeitar ou não Se |rs| é maior que o valor crítico,
rejeitar a hipótese nula. então rejeite H0. Caso contrário,
não rejeite H0.
6. Interprete a decisão no contexto da
afirmação original.
Exemplo 1
Tabela 11.14 N
úmeros de homens e de mulheres matriculados
em 10 faculdades.
Homem Mulher
1.786 2.182
4.246 4.415
1.419 1.537
1.188 1.236
2.394 2.182
1.079 919
4.049 4.209
3.595 3.741
1.102 1.086
1.345 1.282
Solução
A afirmação é “há uma correlação significativa entre o número de
homens e o número de mulheres matriculados em uma faculdade”. As
hipóteses nula e alternativa estão listadas a seguir.
H0: rs = 0 (Não há correlação entre o número de homens e o número
de mulheres matriculados em uma faculdade.)
Ha: rs ≠ 0 (Há correlação significativa entre o número de homens e
o número de mulheres matriculados em uma faculdade.)
(Afirmação)
28 Estatística aplicada
11.4 Exercícios
Construindo habilidades básicas e vocabulário 0,05, você pode concluir que há uma correlação signifi-
cativa entre a pontuação geral e o preço? (Fonte: Con-
1. Cite algumas vantagens do coeficiente de correlação de sumer Report.)
postos de Spearman sobre o coeficiente de correlação
de Pearson. Pontuação geral 77 75 73
2. Descreva os limites do coeficiente de correlação de postos Preço (em dólares) 3.700 1.700 1.300
de Spearman e do coeficiente de correlação de Pearson.
Pontuação geral 71 66 66
3. O que significa quando rs é igual a 1? O que significa quan-
do rs é igual a –1? O que significa quando rs é igual a 0? Preço (em dólares) 900 1.000 1.400
4. Explique, com suas palavras, o que rs e rs representam
Pontuação geral 64 62 58
no Exemplo 1.
Preço (em dólares) 1.800 1.000 700
Horas trabalhadas 42 41 42 41 41 41 41
9. Ciências e RNB Com a = 0,10, você pode concluir que
há uma correlação significativa entre as notas alcança- Acidentes 23 22 23 21 19 18 18
das em ciências e a RNB?
Horas trabalhadas 40 39 38 39 39
10. Matemática e RNB Com a = 0,10, você pode concluir
Acidentes 17 16 16 16 16
que há uma correlação significativa entre as notas alcan-
çadas em matemática e a RNB?
14. Acidentes de trabalho na construção A tabela a se-
11. Ciências e matemática Com a = 0,10, você pode con- guir mostra a média de horas trabalhadas por semana
cluir que há uma correlação significativa entre as notas e o número de acidentes no local de trabalho para
alcançadas em ciências e matemática? uma amostra aleatória de empresas de construção dos
Estados Unidos em um ano recente. Com a = 0,05,
12. Escrevendo um resumo Use os resultados dos exercí-
você pode concluir que há uma correlação significati-
cios 9 a 11 para escrever um resumo sobre a correlação va entre a média de horas trabalhadas e o número de
(ou falta de correlação) entre as notas dos testes e a RNB. acidentes no local de trabalho?
Horas trabalhadas 38 38 37 38 38 40 39
Expandindo conceitos
Acidentes 11 11 9 10 10 17 15
Definição
Uma corrida é uma série de dados que possuem a mesma característica.
Cada corrida é precedida e seguida por dados com uma característica diferen-
te ou por nenhum dado. O número de dados em uma corrida é chamado de
extensão da corrida.
Exemplo 1
Solução
1. Há duas corridas. Os primeiros 8 Ps formam uma corrida de exten-
são 8 e os primeiros 8 Fs formam outra corrida de extensão 8, con-
forme mostrado a seguir:
P P P P P P P P FFFFFFFF
1ª corrida 2ª corrida
2. Há 16 corridas, cada uma com extensão 1, conforme mostrado a seguir:
P F P F P F P F P F P F P F P F
1ª 2ª 16ª
3. Há 5 corridas, a primeira de extensão 2, a segunda de extensão 4, a
terceira de extensão 1, a quarta de extensão 3 e a quinta de extensão
6, conforme mostrado a seguir:
P P F F F F P F F F P P P P P P
1ª corrida 2ª corrida 3ª corrida 4ª corrida 4ª corrida
Definição
O teste de corridas para aleatoriedade é um teste não paramétrico que pode
ser usado para determinar se uma sequência de dados amostrais é aleatória.
em que
Instruções
Testando a significância do coeficiente de correlação de postos de
Spearman
EM PALAVRAS EM SÍMBOLOS
1. Identifique a afirmação. Declare as Formule H0 e Ha.
hipóteses nula e alternativa.
2. Especifique o nível de significância. Identifique a.
(Use a = 0,05 para o teste de corridas.)
3. Determine o número de dados que Determine n1, n2 e G.
possui cada característica e o número
de corridas.
4. Determine os valores críticos. Quando n1 ≤ 20 e n2 ≤ 20,
use a Tabela B.12 no Apêndice B.
Quando n1 > 20 ou n2 > 20, use
a Tabela B.4 no Apêndice B.
5. Encontre a estatística de teste. Quando n1 ≤ 20 e n2 ≤ 20, use G.
Quando n1 > 20 ou n2 > 20, use
G - mG
z= s
G .
Exemplo 2
Solução
A afirmação é “a sequência de locais de assento não é aleatória”.
Para testar essa afirmação, use as hipóteses nula e alternativa.
H0: A sequência de locais de assento é aleatória.
Exemplo 3
M M M M M F F F M M M M F M M F M
Solução
A afirmação é: “a sequência de funcionários não é aleatória”. Para
testar essa afirmação, use as hipóteses nula e alternativa.
H0: A sequência de funcionários é aleatória.
Conferência
Conferência
z0 = 1,96.
Ano
Ano
Antes de calcular a estatística de teste, encontre os valores de mG e
sG, como a seguir:
2n1 n2 1967 N 1991 N
mG = +1
n1 + n2 1968 N 1992 N
2 1142 1222 1969 A 1993 N
= +1
14 + 22 1970 A 1994 N
Figura 11.5 Distribuição normal, de janeiro são mostrados a seguir. Com a = 0,05, você pode concluir que
regiões de rejeição a série não é aleatória?
e estatística de teste.
N N N S S N N S N S N N N N N S
1 - a = 0,95
N S N S N N S N S S N N N N N
1
a = 0,025 1
a = 0,025 a. Identifique a afirmação e declare H0 e Ha.
2 2
b. Identifique o nível de significância a.
c. Determine n1, n2, e G.
z
−3 −2 −1 0 1 2 3 d. Encontre os valores críticos.
z ≈ -2,53 − z0 = -1,96 z0 = 1,96 e. Encontre a estatística de teste z.
f. Decida se rejeita a hipótese nula.
g. Interprete a decisão no contexto da afirmação original.
Quando n1 ou n2 é maior que 20, você também pode usar o valor p para
concluir um teste de hipótese para a aleatoriedade dos dados. No Exemplo
3, você pode calcular o valor p como 0,0114. Já que p < a, você rejeita a
hipótese nula.
11.5 Exercícios
Construindo habilidades básicas e vocabulário 11. T F T F T F T F T F T F
12. M F M M M M M M F F M M
1. Com suas palavras, explique por que o teste de hipótese
13. N S S S N N N N N S N S N S S N N N
discutido nesta seção é chamado de teste de corridas.
2. Descreva a estatística de teste para o teste de corridas 14. X X X X X X X Y Y Y Y Y Y Y Y Y Y Y Y Y Y
quando os tamanhos de amostra n1 e n2 são menores ou Realizando um teste de corridas Nos exercícios 15
iguais a 20 e quando ou n1 ou n2 são maiores que 20. a 20, (a) identifique a afirmação e declare H0 e Ha, (b)
encontre os valores, (c) encontre a estatística de teste, (d)
Usando e interpretando conceitos decida se rejeita ou não a hipótese nula e (e) interprete a
decisão no contexto da afirmação original. Use a = 0,05.
Encontrando o número de corridas Nos exercícios 15. Lançamento de moeda Um treinador registra os resul-
3 a 6, determine o número de corridas na série dada. tados do lançamento de moeda no início de cada jogo
Então encontre a extensão de cada corrida. de futebol em uma temporada. Os resultados estão a
seguir: H representa cara e T representa coroa. O trei-
3. T F T F T T T F F F T F
nador afirmou que os lançamentos não eram aleatórios.
4. U U D D U D U U D D U D U U Teste a afirmação do treinador.
5. M F M F M F F F F F F M M M F F M M
H T T T H T H H T T T T H T H H
M M
16. Senado A sequência mostra o partido majoritário do
6. A A A B B B A B B A A A A A A B A A Senado americano após cada eleição para um grupo
B A B B de anos recente, R representa o partido Republicano e
7. Encontre os valores de n1 e n2 no Exercício 3. D representa o partido Democrata. Você pode con-
8. Encontre os valores de n1 e n2 no Exercício 4. cluir que a série não é aleatória? (Fonte: U.S. Senate.)
R D D D R R R R R R R D D D D D D D
9. Encontre os valores de n1 e n2 no Exercício 5.
R D D R D D D D D D D D D D D D D
10. Encontre os valores de n1 e n2 no Exercício 6. R R R D D D D R R R D R R D D D D
17. Beisebol A sequência mostra o time vencedor de
Encontrando os valores críticos Nos exercícios 11
cada Série Mundial da Liga Principal de Beisebol, de
a 14, use a série e a Tabela B.12 no Apêndice B para de- 1969 a 2012, N representa a Liga Nacional e A repre-
terminar o número de corridas consideradas muito altas senta a Liga Americana. Você pode concluir que a sé-
e o daquelas consideradas muito baixas para os dados rie de times vencedores da Série Mundial não é alea-
estarem em ordem aleatória. tória? (Fonte: Major League Baseball.)
Capítulo 11 Testes não paramétricos 37
Abusos
Evidência insuficiente É necessária evidência mais zada. Pode ser que uma amostra maior produza resul-
forte para rejeitar a hipótese nula em um teste não tados diferentes.
paramétrico do que em um correspondente teste pa- Usando um teste inapropriado Em geral, quando
ramétrico. Isto é, quando você está tentando apoiar informações sobre a população (tais como a condição
uma afirmação representada pela hipótese alternativa, de normalidade) são conhecidas, é mais eficiente usar
você pode precisar de uma amostra maior ao realizar um teste paramétrico. Quando informações sobre a
um teste não paramétrico. Quando o resultado de um população não são conhecidas, no entanto, os testes
teste não paramétrico leva à não rejeição da hipótese não paramétricos podem ser úteis.
nula, você deve investigar o tamanho da amostra utili-
38 Estatística aplicada
Exercícios
1. Evidência insuficiente Dê um exemplo de um teste não paramétrico
no qual não há evidência suficiente para rejeitar a hipótese nula.
2. Usando um teste inapropriado Discuta os testes não paramétricos
descritos neste capítulo e relacione cada teste com seu correspondente
paramétrico, que você estudou em capítulos anteriores.
Resumo do capítulo
Exercícios
O que você aprendeu Exemplo(s) de revisão
Seção 11.1
•• Como usar o teste dos sinais para testar uma mediana populacional
1x + 0,52 - 0,5n
z= 1e2 1–3 e 6
1n
2
•• Como usar o teste dos sinais para amostras pareadas para testar a dife-
3 4e5
rença entre duas medianas populacionais (amostras dependentes)
Seção 11.2
•• Como usar o teste dos postos sinalizados de Wilcoxon e o teste da soma
dos postos de Wilcoxon para determinar se duas amostras são seleciona-
das de populações que possuem a mesma distribuição
1e2 7e8
R - mR n1 1n1 + n2 + 12 n1n2 1n1 + n2 + 12
z= , mR = , sR =
sR 2 B 12
Seção 11.3
•• Como usar o teste de Kruskal-Wallis para determinar se três ou mais
amostras foram selecionadas de populações que apresentam a mesma
distribuição
1 9 e 10
12 R21 R22 R2k
H= a + + c+ b - 3 1N + 12
N 1N + 12 n1 n2 nk
Seção 11.4
•• Como usar o coeficiente de correlação de postos de Spearman para de-
terminar se a correlação entre duas variáveis é significativa
1 11 e 12
6Σd 2
rs = 1 -
n (n2 - 1)
Seção 11.5
•• Como usar o teste de corridas para determinar se uma sequência de da-
1e3 13 e 14
dos é aleatória
Exercícios de revisão
Seção 11.1 3. Uma agência governamental afirma que a duração me-
diana da sentença para todos os prisioneiros federais é
Nos exercícios 1 a 6, use um teste dos sinais para testar de 2 anos. Em uma amostra aleatória de 180 prisionei-
a afirmação seguindo as etapas. ros federais, 65 possuem durações de sentença que são
inferiores a 2 anos, 109 possuem durações de sentença
(a) Identifique a afirmação e declare H0 e Ha. que são superiores a dois anos e 6 possuem durações de
(b) Encontre o valor crítico. sentença que são de 2 anos. Com a = 0,10, você pode
rejeitar a afirmação da agência? (Adaptado de U.S. Sen-
(c) Encontre a estatística de teste. tencing Commision.)
(d) Decida se rejeita ou não a hipótese nula. 4. Em um estudo testando os efeitos de suplementos de
cálcio na pressão sanguínea masculina, 10 homens sele-
(e) Interprete a decisão no contexto da afirmação cionados aleatoriamente tomaram um suplemento de
original. cálcio por 12 semanas. A tabela a seguir mostra as medi-
ções da pressão sanguínea diastólica para cada indiví-
1. Um gerente de banco afirma que o número mediano de
duo, tiradas antes e depois do período de 12 semanas de
clientes, por dia, não passa de 650. Os números de clientes tratamento. Com a = 0,05, você pode rejeitar a afirmação
bancários, por dia, para 17 dias selecionados aleatoriamen- de que não houve redução na pressão sanguínea diastó-
te estão listados a seguir. Para nível de significância a = lica? (Adaptado de American Medical Association.)
0,01, você pode rejeitar a afirmação do gerente de banco?
Paciente 1 2 3 4 5
675 665 601 642 554 653 639 650 645
550 677 569 650 660 682 689 590 Antes do tratamento 107 110 123 129 112
Depois do tratamento 100 114 105 112 115
2. Uma empresa afirma que a pontuação mediana de cré-
dito para adultos americanos é de pelo menos 710. As Paciente 6 7 8 9 10
pontuações de crédito de 13 adultos americanos sele- Antes do tratamento 111 107 112 136 102
cionados aleatoriamente estão listadas a seguir. Com
Depois do tratamento 116 106 102 125 104
a = 0,05, você pode rejeitar a afirmação da empresa?
(Adaptado de Fair Isaac Corporation.)
5. Em um estudo testando os efeitos de um suplemento
750 782 805 695 700 706 625 de ervas na pressão sanguínea masculina, 11 homens
589 690 772 745 704 710 selecionados aleatoriamente tomaram um suplemento
de ervas por 12 semanas. A tabela a seguir mostra as
40 Estatística aplicada
medições da pressão sanguínea diastólica para cada in- 8. Um pesquisador médico afirma que um novo remé-
divíduo, tiradas antes e depois do período de 12 sema- dio afeta o número de horas sentindo dor de cabe-
nas de tratamento. Para um nível de significância a = ça que as pessoas que sofrem desse mal passaram. O
0,05, você pode rejeitar a afirmação de que não houve número de horas com dor de cabeça (por dia) de 8
redução na pressão sanguínea diastólica? (Adaptado
pacientes selecionados aleatoriamente antes e depois
de The Journal of the American Medical Association.)
de tomar o remédio é mostrado na tabela a seguir.
Paciente 1 2 3 4 Com a = 0,05, você pode confirmar a afirmação do
Antes do tratamento 123 109 112 102 pesquisador?
Antes do tratamento 98 114 119 112 Horas de dor de cabeça (depois) 1,4 1,5 1,4 1,8
Problemas
Faça estes problemas como se estivesse fazendo em sala. tatística de teste, (e) decida se rejeita ou não a hipótese
Depois, compare suas respostas com as respostas dadas nula e (f) interprete a decisão no contexto da afirmação
no final do livro. original.
Nos exercícios 1 a 5, (a) identifique a afirmação e decla- 1. Uma organização afirma que o número mediano de ho-
re H0 e Ha, (b) decida qual teste não paramétrico usar, ras anuais de voluntariado é 50. Em uma amostra alea-
(c) encontre o(s) valor(es) crítico(s), (d) encontre a es- tória de 75 pessoas que realizaram trabalho voluntário
42 Estatística aplicada
no ano passado, 47 trabalharam por menos de 50 horas, Sul 127,2 102,6 101,5 116,3
23 trabalharam por mais de 50 horas e 5 trabalharam
Oeste 154,7 138,1 191,9 166,2
por 50 horas. Com a = 0,05, você pode rejeitar a afir-
mação da organização? (Adaptado de U.S. Bureau of Nordeste 255,6 239,7 249,1 228,3
Labor Statistics.)
Centro-Oeste 132,8 154,2 147,6 149,4
2. Uma organização trabalhista afirma que há diferença
no salário por hora de trabalhadores sindicalizados e Sul 121,2 142,2 124,3 112,7
não sindicalizados nos governos municipais e esta- Oeste 126,1 161,9 156,2 142,5
duais. A tabela a seguir mostra os salários por hora (em
dólares) para uma amostra aleatória de 10 trabalhado- 4. A tabela a seguir mostra o número de e-mails enviados
res sindicalizados e 10 trabalhadores não sindicaliza-
e o número de e-mails recebidos em uma semana para
dos nos governos municipal e estadual. Com a = 0,10,
uma amostra aleatória de nove pessoas. Considerando
você pode concordar com a afirmação da organização?
(Adaptado de U.S. Bureau of Labor Statistics.) nível de significância a = 0,01, você pode concluir que
há uma correlação significativa entre o número de e-
29,75 28,15 32,30 35,52 32,88 -mails enviados e recebidos?
Sindicalizado
27,85 27,35 29,05 27,60 26,75
E-mails enviados 30 30 25 26 24
26,15 23,10 21,20 26,95 22,05
Não sindicalizado E-mails recebidos 32 36 21 22 20
24,75 22,50 22,25 21,40 20,45
E-mails enviados 18 18 25 28
3. A tabela a seguir mostra os preços de venda para uma
E-mails recebidos 20 22 23 23
amostra aleatória de condomínios de apartamentos em
quatro regiões dos Estados Unidos. Com a = 0,01, você
5. Um meteorologista quer determinar se os dias com
pode concluir que a distribuição dos preços de venda
chuva ocorrem aleatoriamente em abril em sua cidade
em pelo menos uma região é diferente das demais?
natal. Para isso, o meteorologista registra se chove, em
(Adaptado de National Association of Realtors.)
cada dia de abril. Os resultados são mostrados a seguir,
Preço de venda R representa um dia com chuva e N representa um dia
Região sem chuva. Com a = 0,05, o meteorologista pode con-
(em milhares de dólares)
cluir que os dias com chuva não são aleatórios?
Nordeste 242,2 235,2 227,6 259,9 N R R N N N N R N R R N R R R
Centro-Oeste 151,2 167,4 163,2 138,2 N R R R R N N N N R N R N N R
Teste do capítulo
Faça este teste como se estivesse fazendo uma prova em significância a = 0,01, o representante pode concluir
sala. que a distribuição da renda familiar anual em pelo me-
nos uma região é diferente das demais? (Adaptado de
Nos exercícios 1 a 5, (a) identifique a afirmação e decla- U.S. Census Bureau.)
re H0 e Ha, (b) decida qual teste não paramétrico usar,
(c) encontre o(s) valor(es) crítico(s), (d) encontre a es- Renda familiar anual
Região
tatística de teste, (e) decida se rejeita ou não a hipótese (em milhares de dólares)
nula e, (f) interprete a decisão no contexto da afirmação Nordeste 55,9 48,7 57,3 56,4
original. Centro-Oeste 47,7 52,8 43,6 46,9
1. O prefeito convocou os membros do conselho em uma Sul 45,1 46,3 49,9 42,2
reunião na ordem mostrada, em que R representa um
Oeste 55,0 52,9 49,6 51,7
membro do conselho republicano e D representa um
membro do conselho democrata. Com a = 0,05, você pode Nordeste 51,6 54,1 53,2
concluir que a seleção dos membros não foi aleatória?
R D D D R R D R D D R D D D R R D Centro-Oeste 49,1 50,2 50,4
R R R R D R R R D D D R D R D R R Sul 47,1 49,9 47,7
2. Um representante de uma agência de emprego quer Oeste 50,6 52,2 54,1
determinar se há diferença na renda familiar anual em
quatro regiões dos Estados Unidos. O representante 3. Uma empresa de investimentos afirma que a idade me-
seleciona aleatoriamente diversas famílias em cada re- diana das pessoas com fundos mútuos é 51 anos. As
gião e registra a renda familiar anual de cada uma. A idades (em anos) de 20 proprietários de fundos mútuos
tabela a seguir mostra os resultados. Para o nível de selecionados aleatoriamente estão listadas a seguir.
Capítulo 11 Testes não paramétricos 43
Exercícios
1. Como você faria isso?
(a) Qual técnica de amostragem você usaria para selecionar a amostra para o
CPS?
(b) Você acha que a técnica na parte (a) lhe dará uma amostra que é represen-
tativa da população dos Estados Unidos? Por que ou por que não?
(c) Identifique possíveis falhas ou vieses na pesquisa com base na técnica que
você escolheu na parte (a).
2. Há diferença?
Um representante do congresso afirma que a mediana da estabilidade Tabela 11.18 Estabilidade de
para trabalhadores do seu distrito é menor que a mediana nacional de emprego para 20
4,6 anos. A afirmação é baseada nos dados do representante, que são trabalhadores
mostrados na Tabela 11.18. (Suponha que os empregados foram sele-
cionados aleatoriamente.) 4,6 2,6 3,3
(a) É possível que a afirmação seja verdadeira? Quais perguntas você deveria 2,8 1,5 1,9
fazer sobre como os dados foram coletados? 4,0 5,0 3,9
(b) Como você testaria a afirmação do representante? Você poderia usar um 5,1 3,7 5,4
teste paramétrico ou precisaria usar um teste não paramétrico? 3,6 3,9 6,2
(c) Declare a hipótese nula e a hipótese alternativa. 1,7 4,6 3,1
(d) Teste a afirmação usando a = 0,05. O que você pode concluir? 4,4 3,6
44 Estatística aplicada
(a) Como você testaria a afirmação do representante? Você pode usar um tes-
te paramétrico ou precisa usar um teste não paramétrico?
(b) Declare a hipótese nula e a hipótese alternativa.
(c) Teste a afirmação usando a = 0,05. O que você pode concluir?
Tabela 11.20 R
enda anual de pessoas
Renda nos Estados Unidos e pesquisa econômica (em dólares).
O National Bureau of Economic Research (NBER) é uma orga- Nordeste Centro-Oeste Sul Oeste
nização privada de pesquisa, sem fins lucrativos, não partidária. O 39.766 22.272 18.264 33.178
NBER fornece informação para um melhor entendimento de como 27.911 24.470 32.177 27.295
a economia nos Estados Unidos funciona. Pesquisadores no NBER
24.263 23.247 30.514 21.111
se concentram em quatro tipos de pesquisa empírica: desenvolver
20.266 29.898 32.972 28.167
novas medidas estatísticas, estimar modelos quantitativos de com-
portamento econômico, avaliar os efeitos de políticas públicas na 21.250 28.461 16.510 30.555
economia dos Estados Unidos e projetar os efeitos de propostas po- 28.168 27.747 22.206 19.678
líticas alternativas. 26.574 26.772 22.509 25.082
Um dos interesses do NBER é a renda mediana de pessoas em 25.266 38.285 29.307 36.927
diferentes regiões dos Estados Unidos. A Tabela 11.20 mostra a ren- 22.716 15.568 33.964 21.405
da anual (em dólares) de uma amostra aleatória de pessoas (15 anos 17.871 36.450 31.011 18.177
de idade ou mais) em um ano recente em quatro regiões dos Esta- 35.465 21.644 19.913 24.953
dos Unidos: Nordeste, Centro-Oeste, Sul e Oeste. 42.723 23.932 24.105 32.741
Capítulo 11 Testes não paramétricos 45