Вы находитесь на странице: 1из 87

Universidade Federal de Minas Gerais

Instituto de Cincias Exatas


Departamento de Estatstica

















Exerccios Resolvidos em
Introduo Bioestatstica







Edna Afonso Reis
Ilka Afonso Reis










Relatrio Tcnico RTE-03/2000
Quinta Edio janeiro/2009


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



2
ndice Geral



Primeira Parte - Enunciado dos Exerccios 5

Segunda Parte - Soluo dos Exerccios 38

Referncias Bibliogrficas 86






















Agradecimento

Gostaramos de agradecer ao Prof. Alosio J. F. Ribeiro, do departamento de
Estatstica da UFMG, pela reviso cuidadosa deste trabalho e pelas valiosas
contribuies, principalmente na complementao da soluo dos exerccios da
seo 11.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



3





















Primeira Parte:

Enunciado dos Exerccios







Se ouo, esqueo; se vejo, recordo; se fao, aprendo.
(Provrbio chins)




Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



4
ndice da Primeira Parte - Enunciado dos Exerccios



Seo 1: Tipos de Estudos e Variveis 5
Seo 2.1: Anlise Descritiva e Exploratria de Dados (Tabelas e Grficos) 8
Seo 2.2: Anlise Descritiva e Exploratria de Dados (Sntese Numrica) 10
Seo 3: Probabilidade 13
Seo 4: Avaliao da Qualidade de Testes Clnicos 15
Seo 5: Distribuies de Probabilidade: Binomial e Poisson 19
Seo 6: Distribuies de Probabilidade: Normal 20
Seo 7: Intervalos de Confiana 22
Seo 8: Conceitos Bsicos de Testes de Hipteses 23
Seo 9: Testes de Hipteses para uma Populao 23
Seo 10: Testes de Hipteses para Duas Populaes 24
Seo 11: Teste Qui-Quadrado 27
Resumo: sees 7 a 10 28
Tabelas 30








Observao: Os exerccios marcados com asterisco (*) foram adaptados da apostila
Introduo Bioestatstica, de Nogueira et alli, Edio de 1997.











Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



5
Seo 1: Tipos de Estudos e Variveis


1.1) Classifique as seguintes variveis em :
Quantitativas (Discretas ou Contnuas) ou Qualitativas (Nominais ou Ordinais).


a) A cor da pele de pessoas (ex.: branca, negra, amarela).

Varivel do tipo _______________________ e _______________________


b) O nmero de consultas mdicas feitas por ano por um associado de certo plano de sade.

Varivel do tipo _______________________ e _______________________


c) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianas de 1 a 3 anos de
idade.

Varivel do tipo _______________________ e _______________________


d) O tipo de droga que os participantes de certo estudo tomaram, registrados como: Droga A,
Droga B e placebo.

Varivel do tipo _______________________ e _______________________


e) A presso intra-ocular, medida em mmHg, em pessoas.

Varivel do tipo _______________________ e _______________________


f) O nmero de filhos das pacientes participantes de certo estudo.

Varivel do tipo _______________________ e _______________________



1.2) Classifique os seguintes estudos como observacionais ou experimentais.

a) Viagra para os diabticos (Revista Isto n
o
1535 de 03/03/1999)
A famosa plula azul pode tambm ser eficaz para diabticos que tm a funo ertil
comprometida. Estudos preliminares haviam descartado a eficincia do Viagra nesses casos. Mas
uma pesquisa realizada com 268 homens pela Universidade de Creighton, nos Estados Unidos,
mostrou que 56% dos pacientes que tomaram Viagra tiveram melhora contra 10% dos que
ingeriram placebo (plula incua). Mas em hiptese nenhuma se recomenda o uso do
medicamento sem orientao mdica.

Estudo do tipo _________________________________

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



6

b) Sexo feliz (Revista Isto n
o
1537 de 17/03/1999)
Ter relaes sexuais trs vezes por semana rejuvenesce. Um estudo do Hospital Real de Edimburgo
(Reino Unido), feito com 3,5 mil europeus e americanos, revelou que a qualidade e a freqncia
das relaes sexuais influem diretamente na aparncia fsica. Todos os selecionados para a
pesquisa afirmavam sentirem-se mais jovens do que realmente eram. E essas pessoas faziam sexo
pelo menos trs vezes por semana. "Durante o ato sexual o organismo produz substncias qumicas
como a endorfina que causam sensao de bem-estar e melhoram a condio do corpo e da
mente", explica o neuropsiclogo David Weeks, coordenador do estudo.

Estudo do tipo _________________________________

c) Alerta da pele (Revista Isto n
o
1537 de 17/03/1999)
Quem j teve cncer de pele deve redobrar os cuidados para no ser vtima de um outro tipo de
tumor. Um estudo publicado no Jornal da Associao Mdica Americana revelou que aqueles que
tiveram cncer dermatolgico esto 25% a 30% mais propensos a desenvolver um outro cncer at
12 anos depois de se terem curado. Acredita-se que o tumor de pele aumente a suscetibilidade
geral do organismo a novos episdios da doena.

Estudo do tipo _________________________________

d) Gene da gordura (Revista Isto n
o
1537 de 17/03/1999)
Cientistas americanos anunciaram na semana passada ter descoberto em ratos o primeiro gene
que suprime a obesidade e regula a queima de calorias. Essa pode ser a chave para o
desenvolvimento de uma droga para manter as pessoas em forma. Na verdade, esse o sexto
gene relacionado com a obesidade, mas, de acordo com os pesquisadores, o primeiro que age
no metabolismo e consegue gastar energia. Eles submeteram dois grupos de ratos a testes com
alimentos gordurosos. Aqueles com uma mutao nesse gene no ganharam peso enquanto que
os normais engordaram.

Estudo do tipo _________________________________

e) Colesterol na medida (Revista Isto n
o
1536 de 10/3/1999)
Nveis muito baixos de colesterol podem ser prejudiciais, afirma um estudo divulgado na semana
passada, no congresso da American Heart Association. A pesquisa comparou 714 vtimas de
derrame com 3.743 pessoas saudveis. Quem tinha colesterol acima de 280 estava duas vezes mais
suscetvel a sofrer derrame isqumico (bloqueio de vaso sangneo). Aqueles com colesterol abaixo
de 180 estavam duas vezes mais propensos a ter derrame hemorrgico. Explica-se: o colesterol
ajuda na estrutura das veias e evita que elas se rompam. O ideal mant-lo no nvel mdio (200),
como recomendam os rgos de sade.

Estudo do tipo _________________________________

f) Efeito protetor da vacina BCG em crianas (Boletim OPAS 1986)
Para avaliar o efeito protetor da vacina BCG em crianas com menos de 15 anos de idade, na
cidade de Buenos Aires (Argentina), estudaram-se as crianas que receberam algum tratamento
antituberculose durante o ano de 1981, tanto internados em hospitais ou tratados na forma
ambulatorial. Para cada uma destas crianas, encontrou-se outra criana de mesma idade, sexo,
condio scio-econmica e que tinha tido alguma doena aguda, diferente da tuberculose, no
mesmo perodo e que havia sido tratada no mesmo estabelecimento. Em ambos os grupos,
considerou-se como vacinados os que tinham a cicatriz correspondente vacina BCG em uma ou
ambas regies deltoidianas.

Estudo do tipo _________________________________


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



7
g) Torcida bastante eficaz (Revista Isto n 1581 de 19/01/2000)
O sabor de vitria tem um efeito qumico muito mais benfico para a alma do que se acreditava. A
concluso de uma equipe de pesquisadores americanos. Eles mediram o nvel de testosterona
(hormnio masculino) em torcedores de futebol e basquete e constataram um aumento de 20% do
hormnio quando seus times vencem (quando os times perdem h uma queda de 20%). Como o
hormnio regula o humor, a sensao de bem-estar e o interesse sexual, uma dose extra de
testosterona vai bem.

Estudo do tipo _________________________________

h) Animais contra alergia (Revista Isto n 1569 de 27/10/1999)
Brincar na fazenda, onde vivem animais como vacas, galinhas e outros bichos, diminui as chances
de a criana desenvolver alergias. A constatao de pesquisadores austracos, que estudaram
2.283 crianas. Aquelas que tinham contato com animais eram trs vezes menos sensveis a
problemas alrgicos e respiratrios, como a asma, do que as que vivem na zona urbana. A hiptese
a de que o contato precoce com os animais aumente a tolerncia das clulas de defesa do
organismo a bactrias e caros.

Estudo do tipo _________________________________

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



8
Seo 2.1: Anlise Descritiva e Exploratria de Dados
(Tabelas e Grficos)



2.1.1)

As Tabelas 2.1 e 2.2 mostram a Distribuio de Freqncias do nmero de erros cometidos
na traduo de um texto do ingls para o portugus por 150 estudantes da escola A e 200
estudantes da escola B, respectivamente.

Complete as tabelas, faa um histograma e uma ogiva para cada uma e compare os
estudantes das duas escolas quanto varivel nmero de erros cometidos na traduo de
um texto do ingls para o portugus.

Tabela 2.1: Nmero de erros de traduo de 150 estudantes da escola A
N
o
de
erros
Ponto
Mdio
Freqncia
Absoluta
Freqncia
Relativa (%)
Freqncia
Absoluta
Acumulada
Freqncia
Relativa
Acumulada (%)
10 |- 15 5
15 |- 20 57
20 |- 25 42
25 |- 30 28
30 |- 35 17
35 |- 40 1
Total 150


Tabela 2.2: Nmero de erros de traduo de 200 estudantes da escola B
N
o
de
erros
Ponto
Mdio
Freqncia
Absoluta
Freqncia
Relativa (%)
Freqncia
Absoluta
Acumulada
Freqncia
Relativa
Acumulada (%)
10 |- 15 4
15 |- 20 18
20 |- 25 43
25 |- 30 76
30 |- 35 43
35 |- 40 16
Total 200
Obs: lembre-se de que a ogiva deve ser feita com o limite superior de cada classe no eixo X.


2.1.2) Num estudo sobre a associao entre tromboembolismo e tipo sangneo, participaram 200
usurias de contraceptivo oral. Dessas mulheres, 55 tinham tromboembolismo. Quanto ao
grupo sanguneo, o tipo A foi o mais numeroso, com 83 mulheres, seguido dos grupos O e B,
com 79 e 27 mulheres, respectivamente. Das pacientes sadias, 70 eram do grupo O, 51 do
grupo A e 19 do grupo B.

a) A partir dessas informaes, preencha a Tabela 2.3 abaixo (Dica: comece encontrando
os totais de linha e coluna)
b) Utilizando a tabela preenchida no item a), compare os dois grupos de mulheres (sadias e
doentes) de forma grfica e/ou numrica.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



9
Tabela 2.3
Grupo
Sangneo
Tromboembolismo

Total
Doente Sadia
A
B
AB
O
Total 200





















2.1.3) *Analisando os histogramas apresentados a seguir, comente sobre a distribuio da
presso ocular e do nvel de cido rico srico.

Figura 2.1
48 44 40 36 32 28 24 20 16 12 8
35
30
25
20
15
10
5
0
Presso Ocular (mmHg)
F
r
e
q
u

n
c
i
a

(
%
)

2.9 3.5 4.1 4.7 5.3 5.9 6.5 7.1 7.7 8.3 8.9
0
10
20
30
cido rico Srico (mg/100ml)
F
r
e
q
u

n
c
i
a

(
%
)








2.1.4) *O tempo (em meses) entre a remisso (cura) de uma doena e a recidiva (volta) de 48
pacientes de uma determinada clnica mdica foi registrado. Os dados ordenados so
apresentados a seguir, para homens e mulheres

Homens: 2 2 3 4 4 4 4 7 7 7 8 9 9 10 12 15 15 15 16 18 18 22 22 24

Mulheres: 2 2 3 3 4 4 5 5 6 6 7 7 7 7 8 8 8 8 10 10 11 11 12 18

a) Construa o diagrama de pontos para cada sexo e comente-os.
b) Construa um ramo-e-folhas para cada sexo usando 10 meses como escala e outro usando 5
meses.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



10
Seo 2.2: Anlise Descritiva e Exploratria de Dados
(Sntese Numrica e Boxplot)



2.2.1) Com os dados apresentados no exerccio 2.1.4 (Parte 1) :

a) Calcule a mdia, o desvio padro, a mediana e o coeficiente de variao do tempo entre a
cura e a recidiva da doena para cada sexo. Comente essas estatsticas descritivas,
comparando os grupos.
b) Repita os clculos pedidos em (a) para todos os 48 pacientes, sem distino de sexo. Compare
com os resultados em (a)

2.2.2) *Utilizando a ogiva apresentada a seguir (Figura 2.2), estime a mediana, o primeiro e o
terceiro quartis e o percentil de ordem 95. Interprete estes valores.

Figura 2.2
Ogiva para dados de Presso Intraocular
0
10
20
30
40
50
60
70
80
90
100
5 10 15 20 25 30 35 40 45
Presso Intraocular (mmHg)
F
r
e
q
u

n
c
i
a

A
c
u
m
u
l
a
d
a

(
%
)



2.2.3) *A mdia do nvel de colesterol de um grupo de jovens recrutas 205 mg/dl e o desvio
padro 22 mg/dl. Para um grupo de oficiais, entretanto, a mdia obtida foi 244 mg/dl e o
desvio padro 45 mg/dl. Compare os dois grupos quanto homogeneidade da varivel
nvel de colesterol.


2.2.4)
*
Considere as alturas dos cascos de uma amostra de 48 tartarugas pintadas (24 machos e
24 fmeas).

Machos

35 35 35 37 37 38 38 39 39 40 40 40
40 41 41 41 42 43 44 45 45 45 46 47
Fmeas

38 38 42 42 44 46 48 49 50 51 51 51
51 51 53 55 56 57 60 61 62 63 63 67

a) Complete a tabela de estatsticas descritivas para a varivel altura de casco, segundo o sexo
da tartaruga.

Grupo Mdia Desvio
padro
Coeficiente
de Variao
Mediana Primeiro
Quartil
Terceiro
Quartil
Percentil de
ordem 10
Macho 40,54 3,54
Fmea 52,04 8,05


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



11


b) Construa um box-plot para as medidas de altura de casco de cada grupo (Utilize a mesma
escala nos dois grficos para que eles sejam comparveis).
c) Usando os resultados do item (a) e os box-plots em (b), compare os dois grupos de tartaruga
pintada quanto a varivel altura do casco.



Exemplo de uso de percentis: Faixa de Referncia

Uma Faixa de Referncia um intervalo de valores de determinada caracterstica que contm
uma certa porcentagem de indivduos da populao sadia. Por exemplo, uma faixa de referncia
de 90% para a taxa de glicose no sangue de homens adultos vai de 80 a 100 mg/dl. Isto quer dizer
que 90% dos homens adultos sadios possuem taxa de glicose entre 80 e 100 mg/dl.

Uma das maneiras de construir uma faixa de referncia usar percentis como os limites inferior e
superior da faixa. A abordagem mais comum construir uma faixa de referncia simtrica, de
modo que a proporo de indivduos abaixo do limite inferior seja igual proporo de indivduos
acima do limite superior da faixa. Assim, se desejamos uma faixa de referncia de 90%, ento 10%
dos indivduos sadios ficaro de fora da faixa. Destes, 5% tero valores inferiores ao limite inferior e
5% tero valores acima do limite superior.

Isto nos remete idia de percentil. O limite inferior da faixa deve ser o valor que deixa 5% abaixo
dele, ou seja, o percentll de ordem 5. Do mesmo modo, o limite superior da faixa deve ser o valor
que deixa 5% acima dele, ou seja, 95% abaixo dele, isto , o percentil de ordem 95.

De modo geral, se desejarmos uma Faixa de Referncia de (100-)%, onde a porcentagem de
indivduos que ficaro do lado de fora da faixa, ento os limites inferior e superior da faixa sero
dados, respectivamente, pelos percentis de ordem /2 e de ordem (100-/2).

Faixa de Referncia de (100-)% = [P
/2 ; P
(100-/2) ]

Este o chamado Mtodo dos Percentis para o clculo de uma Faixa de Referncia.
Exemplo: Faixa de Referncia de 95% = [P
2.5 ; P
97.5 ], pois = 5, /2 = 2.5 e 100-/2=97.5
Faixa de Referncia de 99% = [P
0.5 ; P
99.5 ], pois = 1, /2 = 0.5 e 100-/2=99.5



2.2.5) *Um pesquisador deseja criar um padro para identificao de infeco bacteriana
(pseudomonas sp) no trato respiratrio, atravs de cultura de escarro. Para isto, coletou
dados de pessoas sabidamente sadias e determinou o nmero de colnias encontradas em
cada cultura de escarro. Os resultados foram os seguintes:



17 22 23 23 23 23 24 24 24 24 24 24 25 25 25 25 25 25 25 26 28 28
29 30 30 31 31 35 35 35 36 40 41 41 41 42 51 54 56 56 58 60 68 79


(n = 44 pessoas;
x
= 34,3 colnias por cultura de escarro; s =14,2 colnias por cultura de escarro)


Construa um ramo-e-folhas para representar graficamente estes dados e determine uma faixa de
referncia de 95% para o nmero de colnias de bactrias no trato respiratrio de pessoas sadias,
usando o Mtodo dos Percentis.



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



12
2.2.6) Um dos parmetros hematolgicos de uso rotineiro na clnica mdica para diagnstico da
anemia o valor de hemoglobina. A figura abaixo apresenta a ogiva de propores
acumuladas para 1000 mulheres sadias de uma amostra, na qual o valor mdio de
hemoglobina foi de 14 g/dl e o desvio padro de 2 g/dl.


Construa uma Faixa de Referncia de 80% para o valor de hemoglobina em mulheres sadias
usando o Mtodo dos Percentis. Interprete o resultado obtido.


Figura 2.3 - Ogiva de propores acumuladas para hemoglobina (g/dl)
em uma amostra de 1000 mulheres sadias
10 15 20
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
Hemoglobina (g/dl)
P
r
o
p
o
r

o

A
c
u
m
u
l
a
d
a




2.2.7) *Como resultado de um programa de fortificao isomtrica desenvolvido em 10 semanas,
alunos da oitava srie foram avaliados em duas ocasies, antes e aps o programa, quanto
a sua habilidade em executar abdominais em dois minutos. Os dados so apresentados a
tabela a seguir. Quanto maior o escore, maior a habilidade do aluno em executar
abdominais de dois minutos.

Analise graficamente a efetividade ou no do programa isomtrico no aumento da
habilidade em executar abdominais nestes alunos. (Use o grfico de disperso Antes X
Depois [grfico XY] e desenhe a reta x=y).

Tabela 2.4
No do
aluno
Escores de abdominais
Antes Depois
1 12 15
2 10 9
3 23 25
4 25 25
5 29 31
6 32 30
7 14 16
8 17 20
9 19 22
10 20 22


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



13
Seo 3: Probabilidade


3.1) Considere um baralho com 52 cartas numeradas, 13 para cada um dos naipes (ouros, copas,
espada e paus). Seja o experimento de retirar uma carta aleatoriamente, observando seu
naipe, nmero e/ou cor (vermelha ou preta).
Sejam os seguintes eventos:
A = [a carta retirada um s];
V = [a carta retirada vermelha] e
E = [a carta retirada de espada].
Calcule:
a) P(A), P(V) e P(E).

b) P(A V), P(A E) e P(V E).

c) P(A V), P(A E) e P(V E).

d) P(A|V) . Os eventos A e V so independentes ?

e) P(V|E). Os eventos V e E so independentes ?

f) Suponha que voc retire do baralho, aleatoriamente, duas cartas do seguinte modo: retira
uma, observa seu naipe, nmero e cor, e a coloca de volta. Em seguida, retira a segunda carta,
observa seu naipe, nmero e cor, e a coloca de volta. Sejam os eventos:
A1 = [a primeira carta retirada um s] e A2 = [a segunda carta retirada um s].

f.1) Sem fazer clculos, voc acha que os eventos A1 e A2 so independentes ? Ou seja, voc
acha que o fato da primeira carta retirada ter sido um s altera a probabilidade de que a segunda
carta seja um s ? Ento, qual o valor de P(A2|A1) ?

f.2) Qual a probabilidade das duas cartas retiradas serem um s ? Ou seja, calcule P(A1 A2).



3.2) * bem conhecido que o daltonismo hereditrio. Devido ao fato do gene responsvel ser
ligado ao sexo, o daltonismo ocorre mais freqentemente nos homens do que nas mulheres.
As 10.000 pessoas de uma amostra aleatria de uma populao foram classificadas de
acordo com seu sexo e se sofrem ou no de daltonismo da cor vermelha-verde. Os resultados
so mostrados na Tabela 3.1.

Tabela 3.1

Daltonismo
Sexo

Total
Masculino Feminino
Presente 423 65
Ausente 4848 4664
Total 10.000

Notao: Sexo Masculino: M Daltonismo Presente: D
Sexo Feminino: F Daltonismo Ausente: D

I) Complete a Tabela 3.1.

II) Uma pessoa escolhida ao acaso desta populao. Estime a probabilidade desta pessoa ser:

a) Daltnica
b) No daltnica
c) Do sexo masculino

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



14
d) Do sexo feminino
e) Daltnica e do sexo masculino
f) Daltnica e do sexo feminino
g) No daltnica e do sexo masculino
h) No daltnica e do sexo feminino
i) Daltnica dado que do sexo masculino
j) Daltnica dado que do sexo feminino
k) No daltnica dado que do sexo masculino
l) No daltnica dado que do sexo feminino

III) Os eventos ser daltnica e ser do sexo masculino so independentes ?


3.3) A deteco precoce do cncer cervical crucial para o tratamento e cura da paciente. As
600 mulheres de amostra aleatria foram classificadas em um de dois grupos: com cncer
ou sem cncer atravs de bipsia cervical (Tabela 3.2). Outro teste que pode ser usado no
diagnstico do cncer cervical o papanicolau, mais barato e mais rpido que a bipsia
cervical. Para avaliar a qualidade de diagnstico do papanicolau, as 600 mulheres
mencionadas anteriormente foram submetidas a este teste. Os resultados do teste
papanicolau so mostrados na Tabela 3.2 (Positivo indica que o teste classifica a paciente
como portadora do cncer; negativo, caso contrrio). Assuma que o resultado da bipsia
cervical certo.

Tabela 3.2
Situao
da paciente
Resultado do Papanicolau

Total
Positivo Negativo
Com cncer 94 6 100
Sem cncer 250 250 500
Total 344 256 600

a) Estime a proporo de mulheres que tm cncer cervical na populao de onde foi retirada
esta amostra (ou seja, a prevalncia do cncer na populao).

b) Para quantas pacientes o teste papanicolau acertou o diagnstico ?

c) Para quantas pacientes o teste papanicolau errou o diagnstico ?

d) Qual a probabilidade do teste papanicolau ter resultado positivo dentre as pacientes que
realmente tm cncer ? (Esta probabilidade chamada sensibilidade do teste)

e) Qual a probabilidade do teste papanicolau ter resultado negativo dentre as pacientes que
no tm cncer ? (Esta probabilidade chamada especificidade do teste)

f) Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado
positivo no teste papanicolau? (Esta probabilidade chamada valor de predio positiva do
teste)

g) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com
resultado negativo no teste papanicolau? (Esta probabilidade chamada valor de predio
negativa do teste)

h) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com
resultado positivo no teste papanicolau? (Esta a proporo de falsos positivos do teste)

i) Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado
negativo no teste papanicolau? (Esta a proporo de falsos negativos do teste)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



15
Seo 4: Avaliao da Qualidade de Testes Clnicos


4.1) No contexto da avaliao da qualidade de um teste clnico, associe as definies a seguir
com: sensibilidade, especificidade, valor de predio positiva, valor de predio negativa,
proporo de falsos positivos ou proporo de falsos negativos.


a) A probabilidade de um paciente com resultado positivo no estar doente.

Definio de: __________________________________________


b) A probabilidade do paciente no estar doente dado que seu resultado no teste foi negativo.

Definio de: __________________________________________


c) A probabilidade do resultado do teste ser negativo dentre os pacientes realmente no doentes.

Definio de: __________________________________________


d) A probabilidade do paciente realmente estar doente dado que seu resultado no teste foi
positivo.

Definio de: __________________________________________


e) A probabilidade de um paciente com resultado negativo estar doente.

Definio de: __________________________________________


f) A probabilidade do resultado do teste ser positivo dentre os pacientes realmente doentes.

Definio de: __________________________________________



4.2) Um dos testes utilizados para detectar a doena de Aujelski em sunos, tambm conhecida
como pseudo-raiva, o teste ELISA. Na tabela abaixo so apresentados os resultados deste
teste para 52 sunos portadores da doena e 238 no portadores da doena.

Tabela 4.1

Doena de Aujelski
Teste ELISA
Doente (D)
No doente D

Total
Positivo (+)
51 6 57
Negativo (- )
1 232 233
Total 52 238 290

a) Calcule a sensibilidade e a especificidade do teste.

b) Se a prevalncia dessa doena (na populao) de 17,9%, voc pode calcular o VPP e o VPN
diretamente da tabela ? Por que ? Calcule estes ndices.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



16
c) Suponha que a prevalncia da doena seja bem menor que 17,9%. Sabendo que o
tratamento da pseudo-raiva relativamente caro, qual atitude deveria ser tomada para um
suno que apresentasse resultado positivo no teste ELISA ?



4.3) *A creatinina fosfacinase (CFC) um marcador para o diagnstico de infarto agudo do
miocrdio. Pacientes com infarto agudo do miocrdio apresentam valores elevados de CFC.
A tabela a seguir apresenta os valores de CFC para 360 pacientes de um hospital do corao,
sendo 230 com infarto agudo do miocrdio. Considere que a prevalncia de infarto agudo do
miocrdio em hospitais do corao seja igual a desse estudo.


Tabela 4.2
Valores de CFC Infarto agudo
do miocrdio CFC < 80 80 CFC < 280 CFC 280

Total
Doente (D) 15 118 97 230
No doente
) (D

114 15 1 130
Total
129 133 98 360


Sejam dois testes de diagnstico de infarto agudo do miocrdio baseados no valor de CFC do
paciente:

Teste 1: O resultado positivo se os valores de CFC so 80 e negativo caso contrrio;
Teste 2: O resultado positivo se os valores de CFC so 280 e negativo caso contrrio.


a) Calcule a sensibilidade e a especificidade do Teste 1 e do Teste 2. Comente.

b) Calcule o VPP, VPN, PFP e PFN do Teste 1 e do Teste 2. Comente.



4.4) Sabe-se que o Valor de Predio Positiva (VPP) e o Valor de Predio Negativa (VPN) de um
teste clnico de diagnstico de uma doena depende da Prevalncia (p) da doena na
populao, da Sensibilidade (s) e da Especificidade (e) do teste.

Estas relaes podem ser expressas atravs das equaes:

) 1 )( 1 ( p e sp
sp
VPP
+
=
e
p s p e
p e
VPN
) 1 ( ) 1 (
) 1 (
+

=


A Figura 4.1 mostra a relao entre VPP e Especificidade e entre VPN e Especificidade para
vrios valores de Sensibilidade, mantendo-se p=0,05. Analogamente, estas mesmas relaes
so mostradas Figura 4.2, com p=0,5.

a) Considere as figuras 4.1(a) e 4.2(a). Para um valor fixo de prevalncia e sensibilidade, o que
acontece com o VPP medida que a especificidade aumenta ?


b) Considere as figuras 4.1(b) e 4.2(b). Para um valor fixo de prevalncia e sensibilidade, o que
acontece com o VPN medida que a especificidade aumenta ?






Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



17
c) Considere a Figura 4.2(a), onde a prevalncia est fixada em p=0,5.

i. Para um valor fixo de sensibilidade, qual , aproximadamente, o aumento que se tem no
VPP quando se passa de e=0,7 para e=0,95 ?


ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no
VPP quando se passa de s=0,7 para s=0,95 ?


iii. O teste ser poderoso para confirmar a presena da doena se ele tiver PFP grande ou
pequena?


iv. Suponha que se queria que o teste seja poderoso para confirmar a presena da doena
em uma populao com p=0,5. Baseado na sua resposta em (iii) e comparando suas respostas
em (i) e (ii), voc acha melhor trabalhar para aumentar a sensibilidade ou a especificidade do
teste ?

d) Considere a Figura 4.1(b), onde a prevalncia est fixa em p=0,05


i. Para um valor fixo de sensibilidade, qual , aproximadamente, o aumento que se tem no
VPN quando se passa de e=0,7 para e=0,95 ?


ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no
VPN quando se passa de s=0,7 para s=0,95 ?


iii. O teste ser poderoso para descartar a presena da doena se ele tiver PFN grande ou
pequena?


iv. Suponha que se queira que o teste seja poderoso para descartar a presena da doena
em uma populao com p=0,05. Baseado na sua resposta em (iii) e comparando suas
respostas em (i) e (ii), voc acha melhor trabalhar para aumentar a sensibilidade ou a
especificidade do teste ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



18


Figura 4.1
(a) (b)
Prevalncia = 0,05
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7 0,8 0,9 0,95
Especificidade
VPP
Prevalncia = 0,05
0,96
0,97
0,98
0,99
1
0,70 0,80 0,90 0,95
Especificidade
VPN
s= 0.7
s = 0.8
s = 0.9
s = 0.95




Figura 4.2
(a) (b)
Prevalncia = 0,5
0,6
0,7
0,8
0,9
1
0,7 0,8 0,9 0,95
Especificidade
VPP
Prevalncia = 0,5
0,6
0,7
0,8
0,9
1
0,7 0,8 0,9 0,95
Especificidade
VPN
s= 0.7
s = 0.8
s = 0.9
s = 0.95





4.5) Considere a Faixa de Referncia calculada no exerccio 2.2.6 (Seo 2.2)

A partir da interpretao da faixa de referncia no exerccio, responda:
a) qual seria a especificidade de um mtodo de diagnstico de anemia baseado nessa faixa
de referncia?
b) qual seria a sensibilidade?


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



19
Seo 5: Distribuies de Probabilidade: Binomial e Poisson


5.1) *Em uma determinada populao, a probabilidade de um indivduo ter sangue Rh negativo
de 0,10. Qual a probabilidade de 4 indivduos dessa populao que se apresentarem para o
exame de sangue serem todos Rh negativo ?


5.2)
*
A probabilidade de que um casal com olhos azuis escuros tenha filhos com olhos azuis de
. Se esse casal tiver 3 filhos, qual a probabilidade de que pelo menos 2 tenham olhos
azuis?


5.3) *Suponha que o nmero de unidades vendidas de um medicamento por dia numa rede de
drogarias tenha uma distribuio de Poisson com mdia 3 ( = 3).

a) Construa o grfico para a distribuio de probabilidade do nmero de unidades vendidas
desse medicamento por dia (use a tabela de Poisson).
b) Calcule a probabilidade de que sejam vendidas entre 7 e 11 unidades por dia.
c) Qual distribuio do nmero de unidades vendidas desse medicamento por semana ?
d) Qual a probabilidade de que 100 unidades desses medicamento sejam vendidas em uma
semana ?


5.4)
*
Em uma certa populao, a probabilidade de um menino ser daltnico 0,08. Num grupo de
4 meninos vindos dessa populao, qual a probabilidade de 3 no serem daltnicos ?


5.5)
*
A probabilidade de um animal sobreviver durante um experimento cirrgico 2/3.
Seja X o nmero de animais que sobrevivem quando 5 animais so submetidos cirurgia.

a) Determine a distribuio de probabilidade de X.

b) Determine a probabilidade de :
i. Exatamente 3 animais sobreviverem
ii. No mnimo 1 animal sobreviver
iii. Mais de 2 animais no sobreviverem

c) Se 60 animais se submeterem a essa cirurgia, espera-se que, em mdia, quantos no
sobrevivam?


5.6)
*
Um produtor de sementes vende pacotes com 10 sementes cada. Os pacotes que
apresentam mais de quatro sementes sem germinar sero indenizados. A probabilidade de
uma semente germinar 0,8.

a) Qual a probabilidade de um pacote ser indenizado ?

b) Se o produtor vende 1000 pacotes, qual o nmero esperado de pacotes indenizados ?


5.7)
*
Suponha que o nmero mdio de colnias de bactrias por 10 ml de gua de um lago seja 3.

a) Qual a probabilidade de no se achar nenhuma colnia em 10 ml de gua desse lago ?

b) Qual a probabilidade de se achar pelo menos duas colnias em 10 ml de gua desse lago ?

c) Qual a probabilidade de que 5 ou mais colnias sejam achadas em uma amostra de 30 ml de
gua desse lago ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



20
Seo 6: Distribuies de Probabilidade: Normal


6.1) Suponha que a quantidade de ferro srico de indivduos sadios de uma populao (varivel
X) tenha distribuio Normal com parmetros = 100 mcg/dl e = 25 mcg/ dl.

a) Qual o valor da quantidade mdia de ferro srico em indivduos desta populao ?
E qual o valor do desvio padro da quantidade de ferro srico nesta populao ?

b) Faa um esboo da curva normal X definida no enunciado, representando os intervalos
simtricos em torno da mdia correspondentes s probabilidades 0,683, 0,954 e 0,997 ( ;
2; 3).

c) Como a equao da varivel normal padro Z neste caso ?

d) Complete o quadro a seguir:

Um valor de X
igual a ...
Corresponde a
Z igual a ...
P(X x ) = Um valor de X
igual a ...
Corresponde a
Z igual a ...
P(X x ) =
25

3
-2

0,022750


0,158655 125
59

1,64
-1,28

0,100273


0,248252 117
90

0,4
Obs: Use duas casas decimais para Z, nenhuma para X e seis para P(X x ) e P(X x )

i. Qual a probabilidade de X assumir um valor entre 68 e 110 mcg/dl ?
Se tomarmos uma amostra aleatria de 500 indivduos sadios desta populao, quantos
indivduos podemos esperar que tenham quantidade de ferro srio entre 68 e 110 mcg/dl ?

ii. Qual o intervalo [x
1
;x
2
] simtrico em torno da mdia, que contm 50% dos valores de X ?

iii. Qual o intervalo [x
3
;x
4
] simtrico em torno da mdia, que contm 95% dos valores de X ?


6.2) *Suponha que a concentrao srica de tiroxina T4(D) em ces machos sadios tenha
distribuio Normal com mdia 2,04 mcg/100ml e desvio padro 0,78 mcg/100ml.

a) Determine a probabilidade de um co macho sadio apresentar concentrao srica de
tiroxina:

i Inferior a 2,81 mcg/100ml
ii Superior a 1,8 mcg/100ml
iii Entre 1,01 e 2,50 mcg/100ml

b) Se considerarmos 200 desses ces, quantos se poderia esperar que tivessem uma concentrao
srica entre 2,20 e 3,80 mcg/100ml ?

c) Qual intervalo de valores, simtrico em torno da mdia, abrange 98% dos ces sadios ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



21
6.3)
1
Os prazos de durao de gravidez tm distribuio Gaussiana com mdia de 268 dias e
desvio-padro de 15 dias. Definindo como prematura uma criana que nascer com menos
de 247 dias de gestao, responda :

a) Qual a porcentagem de crianas nascidas prematuramente?

b) Se desejssemos mudar a definio de uma criana prematura como sendo aquela cujo o
perodo de gestao est entre os 4% menores, qual seria o tempo mnimo de gestao para
que uma criana no fosse considerada prematura?


6.4)
1
Os escores de Q.I. tm distribuio Gaussiana com mdia 100 pontos e desvio-padro 15
pontos. Uma organizao s admite pessoas de Q.I. elevado, para ela, maiores do que 131,5 .
Com base nessas informaes, responda:

a) Escolhida uma pessoa aleatoriamente, qual a probabilidade de que ela seja admita por essa
organizao?

b) Definindo como gnio uma pessoa que tenha seu escore de Q.I. situado entre os 1% mais altos,
qual seria o valor para o escore de Q.I. que separaria os gnios das pessoas comuns?


6.5) Considere o problema e os dados apresentados no exerccio 2.2.5 (Seo 2.2)


a) Verifique a suposio de normalidade destes dados.

b) Determine uma faixa de normalidade de 95% para o nmero de colnias de bactrias no trato
respiratrio de pessoas sadias, usando:

i. Mtodo dos Percentis (j construda no exerccio 2.2.5)
ii. Mtodo da Curva de Gauss

c) Qual dos dois mtodos o mais indicado nesse caso? Justifique.

1
Exerccio adaptado de Triola, M. F. (1999) - Introduo Estatstica - 7
a
Edio - LTC

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



22
Seo 7: Intervalos de Confiana


7.1) Num estudo para descrever o perfil dos pacientes adultos atendidos no ambulatrio de um
posto de sade, uma amostra de 70 pacientes adultos foi selecionada ao acaso entre o total
de pacientes atendidos no posto durante os ltimos trs anos, coletando-se dos pronturios
desses pacientes dados relativos idade, escolaridade e a outros fatores de interesse.

Para a varivel idade, observou-se uma mdia amostral de 36,86 anos com um desvio padro
amostral de 17,79 anos. Para a varivel escolaridade, observou-se que 19 pacientes da
amostra eram analfabetos.


a) Defina a populao e a amostra.

b) Fornea uma estimativa pontual, um intervalo de 90% de confiana e um intervalo de 95% de
confiana para a idade mdia dos adultos atendidos neste ambulatrio nos ltimos trs anos.
Interprete e compare os intervalos de confiana.

c) Fornea uma estimativa pontual, um intervalo de 90% de confiana e um intervalo de 95% de
confiana para proporo de analfabetos dentre os adultos atendidos neste ambulatrio nos
ltimos trs anos. Interprete e compare os intervalos de confiana.



7.2) A produo de leite na primeira lactao foi medida em 20 vacas selecionadas
aleatoriamente dentre as vacas de uma fazenda. A produo mdia nesta amostra de 1500
litros e o desvio padro de 300 litros. Construa e interprete um intervalo de 98% de confiana
para a produo mdia de leite na primeira lactao das vacas dessa fazenda.



7.3) Considere o Intervalo de 100(1- )% Confiana para a mdia ( ) de uma varivel com
distribuio Normal e desvio-padro ( ) conhecido :
(

n
z x
n
z x IC

2 / 2 /
)% 1 ( 100
;
.
Note que o intervalo simtrico em torno da mdia amostral x e que, quanto menor a
parcela n z


2 /
, menor ser a amplitude do intervalo.

a) Por que um intervalo com grande amplitude no til para o pesquisador fazer inferncia
sobre a mdia da varivel estudada ?

b) Mantendo fixos o tamanho de amostra (n) e o desvio-padro (), o que aconteceria com esta
parcela se reduzirmos o nvel de confiana (100(1-)) requerido para o intervalo ?

c) Mantendo fixos o tamanho de amostra (n) e o nvel de confiana (100(1-)) requerido para o
intervalo, o que aconteceria com esta parcela se o desvio-padro () fosse menor ?

d) Mantendo fixos o desvio-padro () e o nvel de confiana (100(1-)) requerido para o intervalo,
o que aconteceria com esta parcela se o tamanho de amostra (n) fosse maior ?

e) Qual(is) dos trs elementos que compem esta parcela (n, e ), o pesquisador capaz de
alterar para conseguir um intervalo mais curto para a mdia da varivel estudada ?

f) Caso o pesquisador queira um intervalo curto e com nvel de confiana alto (ex. 98%, 99%), o
que ele deveria fazer ?


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



23
Seo 8: Conceitos Bsicos de Testes de Hipteses


Para cada uma das situaes abaixo, identifique:
a) O parmetro que est sendo testado (mdia ou proporo);
b) As hipteses nula e alternativa;
c) Os erros Tipo I e Tipo II.

Situao 1 - Um mtodo padro para identificao de bactrias em hemoculturas vem sendo
utilizado h muitos anos e seu tempo mdio de execuo (desde a etapa de preparo das
amostras at a identificao do gnero e espcie) de 40,5 horas. Um microbiologista props
uma nova tcnica que ele afirma ter menor tempo de execuo que o mtodo padro. A
nova tcnica foi aplicada em uma amostra de 18 hemoculturas e para cada uma mediu-se o
tempo de execuo. A mdia amostral foi 39,42 horas e o desvio padro amostral foi 1,96 horas.

Situao 2 - Estudos sobre mortalidade de homens com idade superior a 65 anos de uma cidade
mostram que 4% deles morrem dentro de um ano. Num grupo de 1000 indivduos selecionados
dessa populao, 60 morreram no perodo de um ano. Suspeita-se de que houve um aumento
da mortalidade anual nessa populao.

Situao 3 - Um restaurante compra frangos abatidos inteiros com peso mdio de 3 quilos h vrios
anos de um fornecedor. Outro fornecedor prope ao gerente do restaurante vender frangos
com peso mdio maior que 3 quilos ao mesmo preo do fornecedor antigo. Antes de mudar de
fornecedor, o gerente do restaurante decidiu comprar 25 frangos do novo fornecedor e pes-
los. Encontrou um peso mdio de 3,2 quilos com um desvio padro de 0,4 quilos.

Situao 4 - Uma indstria farmacutica especifica que em certo analgsico a quantidade mdia
de cido acetil saliclico deve ser 5,5 mg por comprimido. A indstria suspeita que houve
problemas na produo de um determinado lote e que, nesse lote, a quantidade mdia dessa
substncia est diferente da especificada. Para verificar essa suspeita, a indstria selecionou
uma amostra aleatria de 40 comprimidos desse lote, observando uma quantidade mdia de
cido acetil saliclico igual a 5,2 mg e um desvio padro de 0,7 mg.

Situao 5 - Um vendedor de sementes de milho garantiu a um agricultor que a proporo de
sementes de sua marca que realmente chegam a germinar 95%. O agricultor desconfia que
na verdade esta proporo menor do que a anunciada pelo vendedor. Antes de efetuar
uma grande compra, o agricultor comprou um pacote com 1000 sementes e plantou,
observando mais tarde que 940 sementes germinaram.



Seo 9: Testes de Hipteses para Uma Populao


Para cada uma das situaes descritas na Seo 9, responda as questes abaixo, utilizando:
a) Mtodo Tradicional de Teste de Hipteses ;
b) Mtodo do Valor P;
c) Mtodo do Intervalo de Confiana, quando for adequado.
Utilize um nvel de significncia =0,05.

Situao 1 - A nova tcnica reduz o tempo para identificao de bactrias ?

Situao 2 - Existe evidncia de que houve um aumento da mortalidade anual nesta populao ?

Situao 3 - A afirmao do novo fornecedor confirmada pelos dados coletados pelo gerente ?

Situao 4 - Os dados confirmam a suspeita da indstria ?

Situao 5 - O resultado do experimento do agricultor confirma sua desconfiana ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



24
Seo 10: Testes de Hipteses para Duas Populaes


10.1) Como resultado de um programa de fortificao isomtrica desenvolvido em 10 semanas,
alunos da oitava srie foram avaliados em duas ocasies, antes e aps o programa, quanto a
sua habilidade em executar abdominais em dois minutos. Os dados so apresentados a
tabela abaixo. Quanto maior o escore, maior a habilidade do aluno em executar
abdominais de dois minutos.

Tabela 10.1
No do
aluno
Escores de abdominais
Antes Depois
1 12 15
2 10 9
3 23 25
4 25 25
5 29 31
6 32 30
7 14 16
8 17 20
9 19 22
10 20 22


a) Faa um teste de hipteses (ao nvel de significncia = 5%) para verificar se o programa de
fortificao isomtrica aumenta a habilidade em executar abdominais em dois minutos.
(Dica: tome a diferena de depois-antes e teste se depois > antes )

b) Calcule o valor p do teste de hipteses acima. Como voc chegaria concluso do teste do
item (a) usando a informao do valor p ?

c) Construa e interprete um Intervalo de 95% de Confiana para a diferena entre a habilidade
mdia depois do programa e a habilidade mdia antes do programa.



10.2) *Em um experimento, dois grupos de ratos fmeas foram alimentados com dietas
apresentando alto e baixo contedo de protena. O quadro abaixo fornece, para cada rato,
o ganho de peso, em gramas, entre o 28
o
e o 84
o
dia de vida.


Contedo de
protena

Ganho de peso
Alto 123 134 146 104 119 124 161 107 83 113 129 97
Baixo 70 118 101 85 107 132 94


a) Ao nvel de significncia de 1%, h evidncia estatstica de que a dieta com alto contedo de
protena aumenta o ganho de peso?

b) Calcule o valor P e use-o para responder pergunta do item (a).

c) Construa e interprete um intervalo de 95% de confiana para a diferena entre os ganhos
mdios de peso com as dietas de alto e baixo contedo de protena.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



25

10.3) *Em um estudo sobre a influncia do uso de cocana no peso de crianas nascidas de mes
dependentes, pesquisadores trabalharam com dois grupos de crianas nascidas a termo: o
primeiro grupo era composto de mes que usaram regularmente a droga durante toda a
gravidez (Grupo I) e o segundo, de mes que no tinham histria ou evidncia de uso de
cocana (Grupo II). A hiptese dos pesquisadores era de que o peso mdio de crianas de
mes dependentes menor do que o peso mdio de crianas de mes no-dependentes.
Os resultados so apresentados abaixo:.


Grupo Tamanho da amostra Peso mdio (g) Desvio padro (g)
I 36 2829 708
II 39 3436 628
Fonte: Chanoff, I. J. et al. (1989) Temporal patterns of cocaine
use in pregnancy - perinatal outcome, JAMA, maro.


a) Usando um nvel de significncia igual a 5%, teste a hiptese dos pesquisadores. (Para isso,
estabeleas as hipteses nula e alternativa adequadas, construa a regio de rejeio, calcule
o valor da estatstica de teste e conclua).

b) Calcule o Valor P do teste. Use o Valor P obtido para responder questo formulada no
enunciado do problema, com nvel de significncia de 1%.






10.4) *Em um estudo publicado no Canadian Medical Association Journal em novembro de 1972,
procurou-se investigar o efeito do uso da vitamina C na preveno de resfriados. Para isso,
realizou-se o seguinte experimento: por um determinado perodo de tempo, 407 indivduos
tomaram fortes doses de vitamina C e 411 receberam placebo. No grupo da vitamina, 105
participantes ficaram livres de doenas do trato respiratrio, enquanto, no grupo placebo,
esse nmero foi de apenas 76 participantes. O que os pesquisadores puderam concluir? (Use
= 0,05 e calcule o Valor P)


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



26

10.5) Em um estudo para determinar se o tratamento com estrognio e progestina altera o risco de
eventos de doena coronariana (DC) em mulheres na ps-menopausa com doena
coronariana estabelecida, um total de 2.763 destas mulheres foram divididas aleatoriamente
em dois grupos: 1.380 fizeram uso desses hormnios e o restante fez uso de um placebo.

A Figura 11.1 mostra os resultados publicados na edio brasileira do Journal of American
Medical Association em setembro de 1999. Para cada desfecho considerado nas linhas da
tabela, corresponde, na ltima coluna, o Valor P do teste:
H
0
: O desfecho no est associado ao uso dos hormnios;
H
1
: O desfecho est associado ao uso dos hormnios.

Analisando o Valor P, quais os desfechos podem ser considerados associados ao uso de
reposio hormonal, ao nvel de significncia de 5% ?


Figura 10.1

Fonte: JAMABrasil, set 1999, v.3, n. 8

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



27
Seo 11: Teste Qui-Quadrado

11.1) Desejando verificar se duas vacinas contra brucelose* (uma
padro e um nova) so igualmente eficazes, pesquisadores
realizaram o seguinte experimento: um grupo de 14 bezerras
tomou a vacina padro e outro grupo de 16 bezerras tomou a
vacina nova. Considerando que os dois grupos estavam
igualmente expostos ao risco de contrair a doena, aps
algum tempo, verificou-se quantos animais, em cada grupo,
havia contrado a doena. Do grupo que tomou a vacina nova,
5 animais ficaram doentes. No outro grupo, 10 animais ficaram
doentes.

Construa uma tabela para organizar os dados descritos acima
e responda:

Existe diferena estatisticamente significativa entre as
propores de bezerras que contraram brucelose usando a
nova vacina e a vacina padro? (Use o teste Qui-Quadrado,
com nvel de significncia de 5%, e calcule o valor P).
*A brucelose uma doena
crnica causada pela bactria
Brucella, cuja principal
espcie atinge os rebanhos
bovino, suno, ovino, e
caprino. Incurvel, leva as
fmeas a abortarem seus
filhotes e provoca, nos
machos, inflamaes nos
testculos. Tambm atinge o
homem, causando febre,
leses articulares e insnia.


Tabela 11.2

Contaminao

Fertilizante
Sim No
Total

Nenhum 16 85 101

Nitrognio 10 85 95

Esterco 4 109 113

Nitrognio e esterco 14 127 141

Total 44 406 450
11.2) *Com o objetivo de examinar a
existncia do efeito de determinado
fertilizante na incidncia da
Bacterium phithotherum em
plantao de batatas, foi realizado o
seguinte experimento: ps de batata
tratados com diferentes fertilizantes
foram classificados, ao final do
estudo, como contaminados ou livres
de contaminao (Tabela 11.2).

Existe efeito de fertilizante na incidncia desse tipo de bactria nas plantaes de batata? (Use o
teste Qui-Quadrado, com nvel de significncia de 5%, e calcule o valor P).

11.3) Pesquisadores de doenas parasitrias em animais de grande porte suspeitam que a
incidncia de certos parasitas esteja associada raa do animal, pura ou no-pura. Num
estudo para verificar essa suspeita, 1200 animais selecionados aleatoriamente de uma
grande fazenda foram classificados segundo sua raa e incidncia de parasitose (berne).
Dos 805 animais de raa pura, 105 tiveram parasitose. Nos 550 animais restantes (raa no-
pura), 50 tiveram parasitose.
Construa uma tabela para organizar os dados descritos acima e responda:

Existem evidncias estatsticas suficientes nesses dados para verificar a hiptese de que a raa do
animal e a incidncia de parasitas estejam associadas? (Use nvel de significncia igual a 1% e
calcule o valor P).


Tabela 11.4

Tromboembolismo

Grupo
Sangneo
Doente Sadia
Total

A 32 47 79

B 8 19 27

AB 7 14 21

O 9 64 73

Total 56 144 200
11.4) Num estudo da associao entre a
ocorrncia de tromboembolismo e grupo
sanguneo, 200 mulheres usurias de
contraceptivo oral foram classificadas quanto
presena de tromboembolismo - doente ou
sadia, e quanto ao grupo sangneo - A, B,
AB ou O (Tabela 11.4). Existem evidncias
estatsticas suficientes para a hiptese de que
a presena do tromboembolismo e o grupo
sanguneo estejam associados ? (Use nvel de
significncia igual a 1% e calcule o valor P).





Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



28







Intervalos de Confiana

Uma populao

IC p z
p p
n
p
100 1
2
1
( )%
/

( )

n
s
z x IC
2 /
)% 1 ( 100




IC x t
s
n
n

100 1
1 2
( )%
( ; / )

(



Duas populaes (amostras emparelhadas ou dependentes)

(

n
s
z d IC
d
2 /
)% 1 ( 100
2 1



IC d t
s
n
n
d

1 2
100 1
1 2

(
( )%
( ; / )


Duas populaes (amostras independentes)


IC x y z
s
n
s
n

1 2
100 1
2
1
2
1
2
2
2

= +

(
(
( )%
/
( )




IC x y t s
n n
n n comb

1 2 1 2
100 1
2 2
2
1 2
1 1

+
= +
|
\

(
(
( )%
( ; / )
( )

onde
s
n s n s
n n
comb
2 1 1
2
2 2
2
1 2
1 1
2
=
+
+
( ) ( )






IC p p z
p p
n
p p
n
p p
1 2
100 1
1 2 2
1 1
1
2 2
2
1 1

=

+

(
( )%
/
( )
( ) ( )






Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



29


Testes de Hipteses


Teste de Hipteses para uma Mdia (amostra grande)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: = 0
Ha: < 0

Z Z
obs
< P(Z < Zobs)
H0: = 0
Ha: > 0

Z Z
obs
> P(Z > Zobs )
H0: = 0
Ha: 0
n s
x
Z
o
obs

=

2

Z Z
obs
< ou
2

Z Z
obs
>
2 x P(Z >|Zobs|)


Teste de Hipteses para uma Mdia (amostra pequena)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: = 0
Ha: < 0
) ; 1 (
<
n
t T
obs P(T(n-1) < Tobs )
H0: = 0
Ha: > 0
) ; 1 (
>
n
t T
obs P(T(n-1) > Tobs )
H0: = 0
Ha: 0
n s
x
T
o
obs

=

)
2
; 1 (

<
n
t T
obs ou
)
2
; 1 (

>
n
t T
obs
2 x P(T(n-1) >|Tobs|)


Teste de Hipteses para uma Proporo (amostra grande)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: p = p0
Ha: p < p0

Z Z
obs
< P( Z < Zobs )
H0: p = p0
Ha: p > p0

Z Z
obs
> P( Z > Zobs )
H0: p = p0
Ha: p p0
n
p p
p p
Z
o o
o
obs
) 1 (

=

2

Z Z
obs
< ou
2

Z Z
obs
>
2 x P( Z >|Zobs|)


Teste de Hipteses para duas Mdias (amostra emparelhada e grande)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: D = 0
Ha: D < 0

Z Z
obs
< P(Z < Zobs)
H0: D = 0
Ha: D > 0

Z Z
obs
> P(Z > Zobs )
H0: D = 0
Ha: D 0
n s
d
Z
d
obs
=

2

Z Z
obs
< ou
2

Z Z
obs
>
2 x P(Z >|Zobs|)


Teste de Hipteses para duas Mdias (amostra emparelhada e pequena)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: D = 0
Ha: D < 0
) ; 1 (
<
n
t T
obs P(T(n-1) < Tobs )
H0: D = 0
Ha: D > 0
) ; 1 (
>
n
t T
obs P(T(n-1) > Tobs )
H0: D = 0
Ha: D 0
n s
d
T
d
obs
=

)
2
; 1 (

<
n
t T
obs ou
)
2
; 1 (

>
n
t T
obs
2 x P(T(n-1) >|Tobs|)


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



30



Teste de Hipteses para duas Mdias (amostras independentes e grandes)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: 1 = 2
Ha: 1 < 2

Z Z
obs
< P(Z < Zobs)
H0: 1 = 2
Ha: 1 > 2

Z Z
obs
> P(Z > Zobs )
H0: 1 = 2
Ha: 1 2
Z
x y
s
n
s
n
obs
=

+
1
2
1
2
2
2

2

Z Z
obs
< ou
2

Z Z
obs
>
2 x P(Z >|Zobs|)


Teste de Hipteses para duas Mdias (amostras independentes e pequenas)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: 1 = 2
Ha: 1 < 2
) ; ( gl
t T
obs
< P(Tgl < Tobs )
H0: 1 = 2
Ha: 1 > 2
) ; ( gl
t T
obs
> P(Tgl > Tobs )
H0: 1 = 2
Ha: 1 2
T
x y
s
n n
obs
comb
=

+
|
\

|
2
1 2
1 1

s
n s n s
n n
comb
2 1 1
2
2 2
2
1 2
1 1
2
=
+
+
( ) ( )
)
2
; (

gl
t T
obs
<
ou
)
2
; (

gl
t T
obs
>

2 x P(Tgl >|Tobs|)
gl = n1 + n2 - 1


Teste de Hipteses para duas Propores (amostras independentes e grandes)
Hipteses Estatstica de Teste Regio de Rejeio de H0 Valor P
H0: p1 = p2
Ha: p1 < p2

Z Z
obs
< P( Z < Zobs )
H0: p1 = p2
Ha: p1 > p2

Z Z
obs
> P( Z > Zobs )
H0: p1 = p2
Ha: p1 p2
Z
p p
p p
n
p p
n
obs
=

+


( ) ( )
1 2
1 1
1
2 2
2
1 1

2

Z Z
obs
< ou
2

Z Z
obs
>
2 x P( Z >|Zobs|)


Tabela de Poisson (acumulada)





Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



32


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



33

Tabela Normal Padro: Normal ( = 0; = 1)










Obs: os nmeros dentro da tabela referem-se as 4 quatro casas decimais de P[Z < x]. Ex: 0179 leia-se 0,0179 .

x 0
Z
Tabela t-Student



g.l.
0.25 0.20 0.15 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1
1.000 1.376 1.963 3.078 6.314 12.71 31.82 63.66 127.3 318.3 636.6
2
0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.09 22.33 31.60
3
0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.21 12.92
4
0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5
0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6
0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7
0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8
0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9
0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10
0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11
0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12
0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13
0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14
0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15
0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16
0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17
0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18
0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19
0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20
0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21
0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22
0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23
0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24
0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25
0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26
0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27
0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28
0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29
0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30
0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40
0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50
0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60
0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
80
0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
100
0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
120
0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



35


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



36























Segunda Parte:

Resoluo dos Exerccios

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



37
ndice



Seo 1: Tipos de Estudos e Variveis 38
Seo 2.1: Anlise Descritiva e Exploratria de Dados (Tabelas e Grficos) 40
Seo 2.2: Anlise Descritiva e Exploratria de Dados (Sntese Numrica) 44
Seo 3: Probabilidade 50
Seo 4: Avaliao da Qualidade de Testes Clnicos 53
Seo 5: Distribuies de Probabilidade: Binomial e Poisson 57
Seo 6: Distribuies de Probabilidade: Normal 62
Seo 7: Intervalos de Confiana 68
Seo 8: Conceitos Bsicos de Testes de Hipteses 71
Seo 9: Testes de Hipteses para Uma Populao 73
Seo 10: Testes de Hipteses para Duas Populaes 76
Seo 11: Teste Qui-Quadrado 80
Referncias Bibliogrficas 87



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



38
Seo 1: Tipos de Estudos e Variveis


Exerccio (1.1)

a) Qualitativa e Nominal

b) Quantitativa e Discreta

c) Quantitativa e Contnua

d) Qualitativa e Nominal

e) Quantitativa e Contnua

f) Quantitativa e Discreta



Exerccio (1.2)

a) Estudo do tipo experimental.

Varivel resposta: Alguma medida da disfuno ertil.

Grupos comparados: - Grupo Tratamento, formado pelos pacientes que tomaram Viagra;
- Grupo Controle, formado pelos pacientes que tomaram
placebo.


b) Estudo do tipo observacional.

Varivel resposta: Sensao de ter aparncia fsica mais jovem do que a
realidade.

Na verdade, no comparam grupos, apenas estudaram quem tinha vida sexual intensa dentre
os que tinham a varivel resposta positiva (sentiam-se jovens). O que deveria ter sido feito era
entrevistar dois grupos: pessoas com vida sexual intensa e pessoas com vida sexual fraca. Para
cada grupo, classificar os componentes em pessoas que sentem-se jovens e pessoas que no se
sentem jovens. Finalmente, verificar se h (ou no) maior proporo de pessoas que sentem-se
jovens dentre os de vida sexual intensa do que entre aquelas de vida sexual fraca.


c) Estudo do tipo observacional.

Varivel resposta: Ocorrncia de algum tumor no dermatolgico.

Grupos comparados: - Pessoas que tiveram cncer dermatolgico;
- Pessoas que no tiveram cncer dermatolgico.


d) Estudo do tipo experimental, se a mutao no gene foi feita no laboratrio;
Estudo do tipo observacional, caso contrrio.

Varivel resposta: Ganho de peso

Grupos comparados: - Ratos com mutao no tal gene;
- Ratos sem mutao no tal gene.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



39

e) Estudo do tipo observacional.

Para a varivel resposta ocorrncia de derrame isqumico, temos a comparao entre os
seguintes grupos:

Pessoas com nvel de colesterol acima de 280;
Pessoas com nvel de colesterol abaixo de 280.


Para a varivel resposta ocorrncia de derrame hemorrgico temos a comparao entre os
seguintes grupos:

Pessoas com nvel de colesterol abaixo de 180;
Pessoas com nvel de colesterol acima de 180.


f) Estudo do tipo observacional.

Varivel resposta: Ocorrncia de tuberculose

Grupos comparados: - Crianas com a marca da vacina BCG;
- Crianas sem a marca da vacina BCG .


g) Estudo do tipo observacional.

Varivel resposta: Nvel de testosterona

Grupos comparados: - Torcedores de futebol e basquete quando seus times ganharam;
- Torcedores de futebol e basquete quando seus times
perderam;


h) Estudo do tipo observacional.

Varivel resposta: Ocorrncia de problemas respiratrios e/ou alergias.

Grupos comparados: - Crianas que tinham contato com animais;
- Crianas que viviam na zona urbana.




Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



40
Seo 2.1: Anlise Descritiva e Exploratria de Dados



Exerccio (2.1.1)


Tabela 2.1: Nmero de erros de traduo de 150 estudantes da escola A

N
o
de
Erros

Ponto
Mdio

Freqncia
Absoluta

Freqncia
Relativa (%)
Freqncia
Absoluta
Acumulada
Freqncia
Relativa
Acumulada (%)
10 |- 15 12,5 5 3,33 5 3,33
15 |- 20 17,5 57 38,00 62 41,33
20 |- 25 22,5 42 28,00 104 69,33
25 |- 30 27,5 28 18,67 132 88,00
30 |- 35 32,5 17 11,33 149 99,33
35 |- 40 37,5 1 0,67 150 100,00
Total 150 100,00 ------ ------


Tabela 2.2: Nmero de erros de traduo de 200 estudantes da escola B

N
o
de
erros

Ponto
Mdio

Freqncia
Absoluta

Freqncia
Relativa (%)
Freqncia
Absoluta
Acumulada
Freqncia
Relativa
Acumulada (%)
10 |- 15 12,5 4 2,00 4 2,00
15 |- 20 17,5 18 9,00 22 11,00
20 |- 25 22,5 43 21,50 65 32,50
25 |- 30 27,5 76 38,00 141 70,50
30 |- 35 32,5 43 21,50 184 92,00
35 |- 40 37,5 16 8,00 200 100,00
Total 200 100,00 ------ -----


Observao: a soma da coluna Frequncia Relativa (%) tem que ser 100,00 . No entanto, por
causa de arredondamentos, algumas vezes os valores dessa coluna somaro 100,01 (ou 99,99).
Para corrigir o problema, podemos subtrair (ou somar) 0,01 frequncia relativa da classe com
maior frequncia. A mesma observao vale para quando estivermos usando somente uma
casa decimal aps a vrgula. Nesse caso, o total da coluna Frequncia Relativa (%) tem que
ser 100,0 e, se ocorrer o problema, a correo pode ser feita subtraindo-se (ou somando-se) 0,1
frequncia relativa da classe com maior frequncia.





Como podemos notar pela anlise dos histogramas a seguir, a distribuio de frequncia dos
erros de digitao da Escola A assimtrica com concentrao esquerda, enquanto a
distribuio de frequncia dos erros de digitao da Escola B razoavelmente simtrica em torno
da classe 25

a 30 erros. A assimetria com concentrao esquerda dos dados da Escola A tambm
pode ser percebida atravs da sua ogiva, que cresce mais rpido do que a ogiva da Escola B,
que tem distribuio simtrica. Atravs desses grficos, podemos observar que os alunos da Escola
A tendem a errar menos do que os alunos do que os alunos a Escola B.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



41
40 35 30 25 20 15 10
40
30
20
10
0
Nmero de Erros
F
r
e
q
u

n
c
i
a

(
%
)
Escola A

40 35 30 25 20 15 10
40
30
20
10
0
Nmero de Erros
F
r
e
q
u

n
c
i
a

(
%
)
Escola B


Ogiva para a Escola A
0
20
40
60
80
100
5 10 15 20 25 30 35 40
Nmero de erros
F
r
e
q
u

n
c
i
a

(
%
)

A
c
u
m
u
l
a
d
a

Ogiva para a Escola B
0
20
40
60
80
100
5 10 15 20 25 30 35 40
Nmero de Erros
F
r
e
q
u

n
c
i
a

(
%
)

A
c
u
m
u
l
a
d
a



Observao 1: Como gostaramos de comparar as duas escolas, os histogramas e as ogivas foram
feitos usando a frequncia relativa, pois os tamanhos das amostras so diferentes. Se os tamanhos
das amostras fossem iguais, a frequncia absoluta poderia ser usada, embora o uso da frequncia
relativa torna os grficos mais, digamos, teis, pois eles podero ser comparados com outros que
tambm usem a frequncia relativa, mesmo que as amostras sejam de tamanhos diferentes.
Observao 2: O primeiro ponto na ogiva deve ser o limite inferior da primeira classe, que
corresponde frequncia acumulada igual a 0, ou seja, abaixo desse limite no existe nenhum
dado.




Exerccio (2.1.2)

a)
Tabela 2.3
Tromboembolismo Grupo
Sangneo Doente Sadia
Total
A 32 51 83
B 8 19 27
AB 6 5 11
O 9 70 79
Total 55 145 200


Percebe-se que grande parte das pessoas nesse estudo sadia (72,5%).
Como as variveis em questo (presena de tromboembolismo e grupo sanguneo) so do tipo
qualitativas, poderemos usar os grficos de colunas (barras) ou de setores (torta) para representar
esses dados.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



42
O grfico abaixo revela que a maioria dos pacientes da amostra tem o sangue do tipo A, seguido
pelas pessoas de sangue tipo O e tipo B, sendo que a minoria tem o sangue do tipo AB.


Distribuio dos pacientes segundo grupo
sanguneo
41%
14%
6%
39%
A
B
AB
O



O grfico a seguir representa a frequncia relativa da doena dentro de cada grupo sanguneo.
A frequncia relativa tem que ser usada porque os grupos de sangue tm tamanhos diferentes.
Usamos o grfico de colunas por ser de melhor visualizao, nesse caso em que temos 4 categorias
(os tipos sanguneos), ao invs de usarmos quatro grficos de setores.


0
20
40
60
80
100
A B AB O
grupo sanguneo
f
r
e
q
u
e

n
c
i
a

r
e
l
a
t
i
v
a

(
%
) Doente
Sadio


Pela tabela do exerccio, temos que os pacientes sadios representam a maioria (72,5%) dos 200
pacientes amostrados. No grfico acima, podemos observar que, nos grupos sanguneos A, B e O,
essa maioria se mantm, embora em propores diferentes (no grupo O, por exemplo, em torno de
90% das pessoas so sadias). No entanto, no grupo AB, essas propores se invertem, sendo as
pessoas doentes mais frequentes. Isso pode ser um indcio de que a distribuio de frequncias do
estado do paciente depende do tipo sanguneo, ou seja, de que as variveis tipo sanguneo e
presena de tromboembolismo podem estar associadas. Esses conceitos sero melhor elaborados
mais adiante, quando tratarmos de independncia de eventos e associao de variveis.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



43

Exerccio (2.1.3)

Os valores de presso intraocular tm distribuio de frequncias assimtrica com concentrao
esquerda. Isso significa que a maioria das pessoas avaliadas possui valores pequenos para a
presso intraocular e algumas poucas pessoas possuem valores mais altos.
J os valores de cido rico srico tm distribuio de frequncias que pode ser considerada
simtrica em torno dos valores de 5,3 a 5,9 mg/100ml. Isto , a maioria das pessoas possui medidas
de cido rico srico em torno desses valores, que podem ser considerados tpicos. Algumas
poucas pessoas possuem valores mais altos (cauda direita do histograma) e outras poucas pessoas
possuem valores mais baixos (cauda esquerda). Essa questo dos valores que podem ser
considerados tpicos ser mais bem discutida mais adiante quando tratarmos do conceito e
construo das Faixas de Referncia.


Exerccio (2.1.4)

a) Diagrama de Pontos para os Tempos entre a Remisso e a Recidiva de uma Doena (em meses)


: . .
: . : : . : . . : . : : .
-----+---------+---------+---------+---------+---------+- Homens

: :
: : : : : : : : : . .
-----+---------+---------+---------+---------+---------+- Mulheres
4,0 8,0 12,0 16,0 20,0 24,0



O grupo de mulheres tem, em geral, tempos entre a remisso e a recidiva dessa doena
menores do que os dos homens , sendo esses tempos mais homogneos no grupo feminino do que
no grupo masculino.

b)
Ramo-e-folhas usando escala de 10 meses
Homens

0 | 2234444777899 0 | 223344556677778888
1 | 02555688 1 | 001128
2 | 224
Legenda: 0|2 : leia-se 2 meses


Ramo-e-folhas usando escala de 5 meses
Homens

0 | 2234444 0 | 223344
0 | 777899 0 | 556677778888
1 | 02 1 | 00112
1 | 555688 1 | 8
2 | 224
Legenda: 0|2 : leia-se 2 meses


Comentrio: Atravs do ramo-e-folhas com escala de 10 meses, a distribuio de frequncias dos
tempos nos dois grupos poderiam ser consideradas assimtricas com concentrao esquerda. No
entanto, o ramo-e-folhas com escala mais refinada (5 meses) permite um melhor detalhamento da

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



44
distribuio dos tempos nos dois grupos. A distribuio dos tempos no grupo feminino ainda pode
ser considerada assimtrica com concentrao esquerda. Porm, a anlise do ramo-e-folhas do
grupo masculino nos revela que o grupo dos homens parece ser a unio de dois grupos : um, que
tem tempos baixose, outro grupo que tem tempos altos. O ponto de corte para a definio de
um tempo baixo ou alto ficaria a critrio do pesquisador, mas poderia ser, por exemplo, 12
meses. Essa subdiviso do grupo masculino tambm pode ser notada no diagrama de pontos,
embora de maneira mais sutil.
A escolha da escala a ser usado num grfico deve ser guiada pelo bom senso: nem muito
grande, o que tornaria a representao grosseira; nem muito pequena, o que diminuiria o poder
de resumo da representao grfica.


Seo 2.2: Anlise Descritiva e Exploratria de Dados


Exerccio (2.2.1)

a)
Grupo Mdia Mediana Desvio-padro Coeficiente de Variao
Homens 10,71 9,00 6,82 0,64
Mulheres 7,17 7,00 3,67 0,51

Os homens possuem tempos entre a remisso e a recidiva da doena maiores, em mdia e em
mediana, do que os tempos das mulheres. A anlise do coeficiente de variao confirma o que j
havamos observado no diagrama de pontos: o grupo feminino possui tempos mais homogneos
(C.V. menor) do que o grupo masculino.


b)
Grupo Mdia Mediana Desvio-padro Coeficiente de Variao
Todos 8,94 7,5 5,71 0,64



Exerccio (2.2.2)

Queremos encontrar a mediana, que o valor que deixa 50% dos dados abaixo dela. Essa
tambm a definio do percentil de ordem 50. O primeiro quartil o valor que deixa um quarto
dos dados (25%) abaixo dele e, portanto, o percentil de ordem 25. O terceiro quartil o valor que
deixa trs quartos dos dados (75%) abaixo dele e, portanto, o percentil de ordem 75. O percentil
de ordem 90 o valor que deixa 90% dos dados abaixo dele.
O clculo de percentis atravs da ogiva aproximado, pois os dados foram agrupados para que
o ogiva pudesse ser construda. Para encontrar o percentil de ordem 50, por exemplo, devemos
traar no grfico, a partir do valor 50 no eixo das frequncias acumuladas, uma reta paralela ao eixo
dos valores (eixo X) at que essa reta encontre a curva (veja no grfico). No ponto em que a
primeira reta encontrar a curva, devemos traar uma outra reta, agora vertical, paralela ao eixo das
frequncias (eixo Y), at que essa reta encontre o eixo dos valores (eixo X). O ponto em que essa
segunda reta encontrar o eixo X ser o percentil de ordem 50. No grfico, ele aproximadamente o
valor 19,0. Usamos o mesmo raciocnio para encontrar qualquer outro percentil. No grfico, tambm
esto ilustrados os procedimentos para encontrar os valores dos percentis de ordem 25, 75 e 90
(P25, P75 e P90, respectivamente). Os valores aproximados para esses percentis so P25 igual a 16,5
, P75 igual a 22,5 e P95 igual a 34,5.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



45
Ogiva para dados de Presso Intraocular
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
5 10 15 20 25 30 35 40 45
Presso Intraocular (mmHg)
F
r
e
q
u

n
c
i
a

A
c
u
m
u
l
a
d
a

(
%
)
P95 P75(Q3)
P50 (mediana)
P25(Q2)


Observe que o primeiro e o terceiro quartis (que deixam a mesma porcentagem de dados, 25%,
abaixo e acima deles, respectivamente) esto praticamente mesma distncia da mediana. Isso
um ndicio de que a distribuio desses dados de presso intraocular pode ser considerada
simtrica. Outro indcio de simetria que o percentil de ordem 5 (calcule!!!) e percentil de ordem 95
(que deixam a mesma porcentagem de dados, 5%, abaixo e acima deles, respectivamente)
tambm esto praticamente mesma distncia da mediana.



Exerccio (2.2.3)

Para comparar a homogeneidade de dois grupos com mdias diferentes, precisamos
calcular o coeficiente de variao, que uma medida de variabilidade que considera a
escala em que a varivel est sendo medida.

Coeficiente de variao no grupo de recrutas: 22/205 = 0,11
Coeficiente de variao no grupo de oficiais: 45/244 = 0,18

O grupo de oficiais, alm de ter um nvel mdio de colesterol maior do que o nvel mdio dos
recrutas, tambm um grupo mais heterogneo com respeito a essa varivel (C.V. maior do
que o dos recrutas). Lembrando que o nvel de colesterol de um indivduo est relacionado
tambm ao seu grau de sedentarismo, a maior heterogeneidade do nvel de colesterol entre os
oficiais pode ser explicada pela diversidade de funes que esses oficiais desempenham ,
podendo implicar em maior ou menor sedentarismo. J os jovens recrutas passam por
constantes treinamentos e exerccios, o que diminui a heterogeneidade entre eles desse
importante fator associado ao nvel de colesterol.



Exerccio (2.2.4)

a)
Grupo Mdia Desvio
padro
Coeficiente
de Variao
Mediana Primeiro
Quartil
Terceiro
Quartil
P10
Macho 40,54 3,54 0,09 40,00 38,00 43,50 35
Fmea 52,04 8,05 0,15 51,00 47,00 58,50 42


Exemplos de clculo dos percentis:

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



46

Clculo do 1
o
quartil (grupo das tartarugas machos):
0,25 x 24 = 6 (nmero inteiro). O 1
o
quartil est o 6
o
valor e o 7
o
valor, os nmeros 38 e 38,
respectivamente. Tomaremos a mdia desses valores, que o prprio 38.

Clculo do 3
o
quartil (grupo das tartarugas fmeas):
075 x 24 = 18 (nmero inteiro). O 3
o
quartil est o 18
o
valor e o 19
o
valor, os nmeros 57 e 60,
respectivamente. Tomaremos a mdia desses valores, que 58,50.

Clculo do Percentil de ordem 10 (grupo das tartarugas fmeas):
0,10 x 24 = 2,4 (nmero fracionrioarredondar para cima) O percentil de ordem 10 o 3
o
valor, o
nmero 42. (isto significa que aproximadamente 10% das tartarugas fmeas possuem cascos com
alturas inferiores ou iguais a 42).

Clculo do Percentil de ordem 90 (grupo das tartarugas fmeas):
0,90 x 24 = 21,6 (nmero fracionrioarredondar para cima) O percentil de ordem 90 o 22
o
valor,
o nmero 63 (isto significa que aproximadamente 90% das tartarugas fmeas possuem cascos com
alturas inferiores ou iguais a 63.


Observao: existem vrios mtodos para o clculo de percentis e todos resultaro em valores
aproximados. O mtodo apresentado acima o mais simples de todos.



b)
65 55 45 35
2
1
G
r
u
p
o
Altura do casco
Grupo 1: macho
Grupo 2: fmea

c) As fmeas tm, em geral, cascos mais altos
que os machos, pois os valores da mdia e da
mediana so maiores para as fmeas. Isto
tambm pode ser visto nos box-plots, onde a
maior parte das medidas das fmeas
encontram-se acima das medidas dos machos:
o terceiro quartil dos machos menor que o
primeiro quartil das fmeas. Alm disso, os box-
plots mostram que a altura do casco bem mais
varivel para as fmeas do que para os machos
(a largura da caixa maior para as fmeas), o
que confirmado comparando-se os
coeficientes de variao. O grupo de fmeas
menos homogneo quanto altura do casco.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



47

Exerccio (2.2.5)

Ramo-e-Folhas para nmero colnias por cultura de escarro

n = 44 Escala: |1|7 = 17

|1|7
|2|23333444444
|2|55555556889
|3|0011
|3|5556
|4|01112
|4|
|5|14
|5|668
|6|0
|6|8
|7|
|7|9



Podemos ver que a distribuio de
freqncia do nmero de colnias por
cultura de escarro muito assimtrica.



Faixa de Referncia de 95%

(100- )% = 95%
= 5
/2 = 5/2 = 2,5
100 /2 = 100 2,5 = 97,5

Faixa de Referncia de (100- )% : [Percentil de ordem /2 ; Percentil de ordem (100- /2)]
Assim, a Faixa de Referncia de 95% : [Percentil de ordem 2,5; Percentil de ordem 97,5]

Percentil de ordem 2,5 (2,5%): 44 x 0,025 = 1,1 (arredonda para 2)
O 2
o
valor (em ordem crescente) X = 22
Portanto: P
2,5
= 22

Percentil de ordem 97,5 (97,5%): 44 x 0,975 = 42,9 (arredonda para 43)
O 43
o
valor (em ordem crescente) X = 68
Pontanto: P
97,5
= 68

Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em
pessoas sadias [22; 68] colnias, pelo mtodo dos percentis.


Observao: Fazendo pelo mtodo dos percentis ensinado na apostila Introduo
Bioestatstica.

Na tabela a seguir, vemos que as ordem de percentis que mais se aproximam de 0,025 e 0,975
so, respectivamente 0,034091 e 0,965909 correspondendo aos valores de X (n
o
de colnias por
cultura de escarro) X = 22 e X = 68.

Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em
pessoas sadias [22 ; 68], pelo mtodo dos percentis da Apostila.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



48

N
o
de ordem
i
X: n
o
de colnias por
culura de escarro
Ordem do percentil
( i- 0,5)/44

1 17 0,011364
2 22 0,034091 Mais prximo do P
2,5

3 23 0,056818
..... ..... .....
42 60 0,943182
43 68 0,965909 Mais prximo do P
97,5

44 79 0,988636


Observao: Note que, na verdade, a faixa de referncia encontrada acima de
(96, 5909 - 3,4091) 93%



Exerccio (2.2.6)

A Faixa de Referncia de 80% ser dada por FR(80%) = [P
10
; P
90
], pois:

(100-)% = 80%
= 100- 80 = 20
/2 = 20/2 = 10
100 /2 = 100- 10 = 90

O percentil de ordem 10% (P
10
) pode ser encontrado procurando-se o valor de hemoglobina ao
qual corresponde a proporo acumulada igual a 0,10 na ogiva. Este valor aproximadamente 11
g/dl.

O percentil de ordem 90% (P
90
) pode ser encontrado procurando-se o valor de hemoglobina ao
qual corresponde a proporo acumulada igual a 0,90 na ogiva. Este valor aproximadamente 17
g/dl.

A Faixa de Referncia de 80% so os valores de hemoglobina de 11 a 17 g/dl. Isto significa que
aproximadamente 80% das mulheres sadias desta populao tm valor de hemoglobina entre 11 e
17 g/dl.





Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



49
Exerccio (2.2.7)

No grfico abaixo, verificamos que a habilidade aumenta aps o programa de fortificao
para a maioria dos alunos (pontos acima da linha x=y). Para apenas trs deles, a habilidade igual
ou menor aps o programa. Portanto, o programa se mostrou eficaz para a maioria dos alunos.
Note que os pontos tendem a se posicionar ao longo de uma linha reta (no caso, a linha x=y).



Grfico de Disperso
30 20 10
30
20
10
Antes
D
e
p
o
i
s
10 9
8
7
6
5
4 3
2
1
Escores de abdominais antes e depois do programa
(Linha x=y)


Algumas consideraes sobre o relacionamento entre variveis quantitativas : no problema
acima, dizemos que os escores antes e depois do programa esto linearmente correlacionados. O
Diagrama de Disperso um modo de visualizar essa correlao. Para medir o grau de correlao,
usa-se o Coeficiente de Correlao Linear, que um nmero entre -1 e 1. Um coeficiente de
correlao positivo (> 0) acontece se a relao entre as duas variveis do tipo: quando o valor
de uma varivel aumenta, o valor da outra aumenta tambm; ou, quando o valor de uma varivel
diminui, o valor da outra tambm diminui. J um coeficiente de correlao negativo (< 0)
acontece se a relao entre as duas variveis do tipo: quando o valor de uma varivel
aumenta, o valor da outra diminui; ou vice-versa. Um coeficiente de correlao linear igual a zero
significa que as duas variveis no possuem nenhuma correlao do tipo linear, mas podem estar
relacionadas de uma maneira no linear (quadrtica, por exemplo). Isso poder ser percebido
atravs do exame do Diagrama de Disperso. Assim, o Coeficiente de Correlao Linear e o
Diagrama de Disperso so ferramentas que devem ser usadas conjuntamente. Para mais detalhes
sobre correlao, veja Soares, J. F. e colegas (Introduo Estatstica) e tambm Triola, M. F.
(Introduo Estatstica, Editora LTC) . O coeficiente de correlao entre os escores antes e depois
nesse exerccio de 0,97, indicando uma forte correlao positiva entre as medidas antes e depois
do programa de fortificao isomtrica.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



50
Seo 3: Probabilidade


Exerccio (3.1)

g) Existem quatro ases em um baralho de 52 cartas. Assim P(A) = 4/52 = 1/13.
Metade as cartas (as de naipe ouros e copas) so vermelhas. Assim, P(V) = 26/52 = 1/2.
Cada naipe tem 13 cartas. Assim, P(E) = 13/52 = 1/4.

h) H duas cartas que so, ao mesmo tempo, ases e vermelhas (s de ouros e s de copas). Assim,
P(A V) = 2/52 = 1/26.
H somente uma carta que , ao mesmo tempo, s e de espada. Assim, P(A E) = 1/52.
Nenhuma carta , ao mesmo tempo, vermelha e de espada. Assim, P(V E) = 0, ou seja, os
eventos V e E so mutuamente exclusivos.

i) P(A V) = P(A) + P(V) - P(A V) = 1/13 + 1/2 - 1/26 = (2 + 13 - 1)/26 = 14/26 = 7/13.
P(A E) = P(A) + P(E) - P(A E) = 1/13 + 1/4 - 1/52 = (4 + 13 +1)/52 = 18/52 = 9/26.
P(V E) = P(V) + P(E) - P(V E) = 1/2 + 1/4 - 0 = (2+1)/4 = 3/4.

j) P(A|V) = P(A V)/P(V) = (1/26)/(1/2) = 1/13. Ou seja, como, das 26 cartas vermelhas, duas so
ases, ento P(A|V) = 2/26 = 1/13.
Como P(A|V) = P(A), os eventos A e V so independentes.

k) P(V|E) = P(V E)/P(E) = 0/(1/4) = 0. Ou seja, como nenhuma carta de espada vermelha, ento
P(V|E) = 0.
Como P(V|E) P(V), os eventos V e E no so independentes.

f.1) O fato da primeira carta retirada ter sido um s no altera a probabilidade de que a segunda
carta seja um s, pois a primeira carta foi devolvida ao baralho, tornando, assim, a segunda
retirada um experimento idntico quele da primeira retirada. Ento, os eventos A1 e A2 so
independentes: P(A2|A1) = P(A2) = 4/52 = 1/13.

f.2) Como os eventos A1 e A2 so independentes, P(A1 A2) = P(A1) x P(A2) = 1/13 x 1/13 = 1/169.


Exerccio (3.2)


Tabela 3.1

Daltonismo
Sexo
Total
Masculino Feminino
Presente 423 65 488
Ausente 4848 4664 9512
Total 5271 4729 10.000



Sejam os eventos: D = {a pessoa escolhida Daltnica}
ND = {a pessoa escolhida No Daltnica}
M = {a pessoa escolhida do sexo Masculino}
F = {a pessoa escolhida do sexo Feminino}


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



51

Item (I)


a) P(D) = 488/10.000 = 0,0488
b) P(ND) = 9512/10.000 = 0,9512


Observe que P(D) + P(ND) = 1


c) P(M) = 5271/10.000 = 0,5271
d) P(F) = 4729/10.000 = 0,4729


Observe que P(M) + P(F) = 1


e) P(DM) = 423/10.000 = 0,0423
f) P(DF) = 65/10.000 = 0,0065

g) P(NDM) = 4848/10.000 = 0,4848
h) P(NDF) = 4664/10.000 = 0,4664


Observe que:

P(DM) + P(DF) +

+ P(NDM) + P(NDF) = 1



i) P(D|M) = P(DM)/ P(M) = 0,0423/0,5271 = 0,0803
j) P(D|F) = P(DF)/ P(F) = 0,0065/0,4729 = 0,0137

k) P(ND|M) = P(NDM)/ P(M) = 0,4848/0,5271 = 0,9197
l) P(ND|F) = P(NDF)/ P(F) = 0,4664/0,4729 = 0,9863


Observe que:

P(D|M) + P(ND|M) = 1

P(D|F) + P(ND|F) = 1




Item (II)

P(D) = 0,0488
P(D|M) = 0,0803 P(D)

Portanto, os eventos ser daltnica e ser do sexo masculino no so independentes


Exerccio (3.3)


Tabela 3.2
Situao
da paciente
Resultado do Papanicolau
Total
Positivo Negativo
Com cncer 94 6 100
Sem cncer 250 250 500
Total 344 256 600



Sejam os eventos: C = {ter cncer}
S = {no ter cncer}
P = {teste papanicolau positivo}
N = {teste papanicolau negativo}



a) Prevalncia do cncer = 100/600 = 0,1617



b) (Pessoas com cncer e teste positivo) + (Pessoas sem cncer e teste negativo) = 94 + 250 = 344


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



52
c) (Pessoas com cncer e teste negativo) + (Pessoas sem cncer e teste positivo) = 6 + 250 = 256



d) Sensibilidade: P(P|C) = 94/100 = 0,94

e) Especificidade: P(N|S) = 250/500 = 0,50



f) Valor de Predio Positiva: P(C|P) = 94/344 = 0,27

g) Valor de Predio Negativa: P(S|N) = 250/256 = 0,98



h) Proporo de Falsos Positivos: P(S|P) = 250/344 = 0,73

i) Proporo de Falsos Negativos: P(C|N) = 6/256 = 0,02



Observe que:


Valor de Predio Positiva + Proporo de Falsos Positivos = 1

Valor de Predio Negativa + Proporo de Falsos Negativos = 1

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



53
Seo 4: Avaliao da Qualidade de Testes Clnicos


Exerccio (4.1)

a) Proporo de falsos positivos: PFP = P( D| + )

b) Valor de Predio Negativa: VPN = P( D| - )

c) Especificidade: e = P( - | D)

d) Valor de Predio Positiva: VPP = P( D|+ )

e) Proporo de falsos negativos: PFN = P( D| - )

f) Sensibilidade: s = P( + |D )



Exerccio (4.2)

a) Sensibilidade : 98 , 0
52
51
) | ( = = + = D p s
Especificidade:
97 , 0
238
232
) | ( = = = D P e



b) Prevalncia na populao: p = 0,179


Prevalncia na amostra: p = = 1793 , 0
290
52
amostra da total tamanho
amostra na doentes de nmero



Como a prevalncia da doena na amostra prxima da prevalncia na populao, podemos
calcular VPP e VPN diretamente da tabela.


89 , 0
57
51
) | ( = = + = D P VPP
PFP = 1-VPP = 0,11
996 , 0
233
232
) | ( = = = D P VPN
PFN = 1-VPN = 0,004


c) Suponha que p <<0,179. Ento, VPP << 0,89 e, da, PFP >>0,11. Portanto, um resultado positivo no
teste tem uma probabilidade considervel de ser um falso positivo. Como o tratamento caro,
no podemos correr um risco de estar tratando um falso positivo como muita frequncia
(PFP). Assim, o melhor procedimento diante de um resultado positivo fazer mais investigaes
com outros testes de diagnstico.



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



54
Exerccio (4.3)

Resultados do Teste 1
Infarto agudo Diagnstico do Teste Total
do miocrdio Positivo (CFC 80) Negativo (CFC<80)
Doente (D) 215 15 230
No doente ) (D
16 114 130
Total
231 129 360


Resultados do Teste 2
Infarto agudo Diagnstico do Teste Total
do miocrdio Positivo (CFC 280) Negativo (CFC<280)
Doente (D) 97 133 230
No doente ) (D
1 129 130
Total
98 262 360


a)


Teste 1:

93 , 0
230
215
) | (
1
= = + = D P s




Teste 2:

42 , 0
230
97
) | (
2
= = + = D P s


88 , 0
130
114
) | (
1
= = = D P e

99 , 0
130
129
) | (
2
= = = D P e



O Teste 1 tem sensibilidade e especificidade bastante altas, o que no ocorre com o Teste 2, que
tem uma especificidade muito alta e uma sensibilidade muito baixa. Assim, o Teste 1 o teste mais
sensvel dentre os dois e o Teste 2 o teste mais especfico. A qualidade do diagnstico baseado
nesses testes, medida pelos Valores de Predio Positiva e Negativa, depende da prevalncia da
doena na populao onde eles sero usados. Conforme for o objetivo do procedimento
(descartar ou confirmar a presena da doena), um ou outro teste ser mais til, como veremos no
prximo item.


b) Considerando que os testes seriam aplicados numa populao cuja a prevalncia de infarto
agudo no corao aproximadamente igual prevalncia da amostra (230/360=0,64),
poderemos calcular os valores de predio positiva e negativa diretamente da tabela.

Teste 1:
93 , 0
231
215
) | (
1
= = + = D P VPP
PFP
1
= 1 0,93 = 0,07

88 , 0
129
114
) | (
1
= = = D P VPN
PFN
1
= 1 0,88 = 0,12

Observao: a coincidncia do valor da sensibilidade com o valor do VPP, assim como do valor
da especificidade com o valor do VPN, para o teste 1, no regra. Apenas aconteceu porque os
denominadores so muito parecidos. Isso no ocorrer com o teste 2, como veremos a seguir.

Teste 2:
99 , 0
98
97
) | (
2
= = + = D P VPP
PFP
2
= 1 0,99 = 0,01

49 , 0
262
129
) | (
2
= = = D P VPN
PFN
2
= 1 0,49 = 0,51

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



55
Comentrios sobre os testes: na escolha de qual teste deve ser usado, devemos estar atento ao
objetivo do procedimento e prevalncia da doena na populao onde ele for aplicado. Nesta
anlise, vamos considerar que a populao de trabalho tem uma prevalncia de infarto no
corao aproximadamente igual prevalncia desse estudo (64%). Se o objetivo do procedimento
diagnstico for o de confirmar a doena, o Teste 2 deve ser usado, pois seu VPP bastante alto
(99%), isto , um paciente que tenha o resultado positivo no Teste 2 tem grande probabilidade de
estar doente. Por outro lado, se o objetivo for o de descartar a doena, o Teste 2 no deve ser mais
usado, pois seu VPN muito baixo, levando a uma Proporo de Falsos Negativos muito alta (51%).
Assim, ser prefervel usar o Teste 1, que apesar de ter uma Proporo de Falsos Negativos
considervel (12%), melhor do que o Teste 2 nesse ponto. Numa populao onde a prevalncia
de infarto for menor do que 64%, os valores de VPN para os dois testes vo aumentar e, ento, a
utilizao do Teste 1 para descartar a presena da doena ser mais confivel (a proporo de
falsos negativos ir diminuir). Como j sabemos, quanto menor a prevalncia, maior o valor de
VPN e menor o valor de VPP.


Exerccio (4.4)

a) O VPP aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia
fixas.

b) O VPN aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia
fixas.

c)
i) VPP aumenta aproximadamente em 0,23 quando se passa de um teste com especificidade
igual a 0,7 para 0,95, com p = 0,5.

ii) VPP aumenta aproximadamente entre 0,02 e 0,06, dependendo do valor da especificidade,
quando se passa de um teste com sensibilidade igual a 0,7 para 0,95, com p = 0,5.

iii) O teste ser poderoso para confirmar a presena da doena se ele tiver uma PFP pequena, o
que significa que seu VPP grande. Ou seja, haver uma alta probabilidade de um paciente
ser doente dado que seu resultado no teste foi positivo.

iv) Deseja-se, neste caso, um teste com VPP alto. Desse modo, devemos aumentar a
especificidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da
especificidade provoca um maior acrscimo no VPP.

d)
i) VPN aumenta aproximadamente em 0,003 quando se passa de um teste com especificidade
igual a 0,7 para 0,95, com p = 0,05.

ii) VPN aumenta aproximadamente em 0,019, quando se passa de um teste com sensibilidade
igual a 0,7 para 0,95, com p = 0,05.

iii) O teste ser poderoso para descartar a presena da doena se ele tiver uma PFN pequena, o
que significa que seu VPN grande. Ou seja, haver uma alta probabilidade de um paciente
no ser doente dado que seu resultado no teste foi negativo.

iv) Deseja-se, neste caso, um teste com VPN alto. Desse modo, devemos aumentar a
sensibilidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da
sensibilidade provoca um maior acrscimo no VPN.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



56

Exerccio (4.5)


a) Um mtodo para diagnstico de anemia baseado nesta faixa de referncia daria resultado:

negativo, se a paciente tivesse valor de hemoglobina entre 11 e 17 g/dl;
positivo, se a paciente tivesse esse valor menor do que 11 g/dl ou maior do que 17 g/dl.

Como sabemos, a especificidade de um teste estimada como sendo a frequncia de negativos
entre as pessoas sadias. Nesse problema, todas as mulheres so sadias, e 80% tm valores entre 11 e
17 g/dl, sendo consideradas negativas. Assim, estimativa da especificidade justamente 80%. Esse
um valor aproximado, j que a prpria faixa aproximada.


b) Como tambm sabemos, a sensibilidade de um teste estimada como sendo a frequncia de
positivos entre as pessoas doentes. Aqui, a sensibilidade desse mtodo no pode ser calculada
somente com esses dados, pois precisamos de uma amostra de pessoas doentes para sabermos
quantas delas sero consideradas positivas pelo mtodo.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



57
Seo 5: Distribuies de Probabilidade: Binomial e Poisson


Exerccio (5.1)

X: n
o
de pessoas com Rh negativo em um grupo de n=4

Valores que X pode assumir: x = 0,1,2,3 ou 4
Probabilidade de uma pessoa ser Rh negativo: p = 0,10

Desse modo, X ~ Binomial (n=4,p=0,10)

Assim,
x x
x
x X P


|
|

\
|
= =
4
) 10 , 0 1 ( 10 , 0
4
) ( para x = 0,1,2, 3 ou 4

Estamos interessados em saber qual a probabilidade de que todas as 4 pessoas desse grupo
sejam Rh negativo, ou seja, estamos interessados em saber qual a probabilidade da varivel X
assumir o valor 4 (P[X=4]).

0001 , 0 1 0001 , 0 1 ) 90 , 0 ( 10 , 0
! 0 ! 4
! 4
) 10 , 0 1 ( 10 , 0
4
4
) 4 (
0 4 4 4 4
= = =
|
|

\
|
= =

X P

Quando a probabilidade de uma pessoa ser Rh negativo 10%, a probabilidade de que todas
as 4 pessoas de um grupo sejam Rh negativo 0,01%.


Exerccio (5.2)

Y: n
o
de crianas com olhos azuis numa famlia de 3 filhos (n=3)

Valores que Y pode assumir: y = 0,1,2 ou 3
Probabilidade de uma criana ter olhos azuis: p = 0,25

Desse modo, Y ~ Binomial (n=3,p=0,25)

Assim,
y y
y
y Y P


|
|

\
|
= =
3
) 25 , 0 1 ( 25 , 0
3
) (
para y = 0,1,2 ou 3

Pelo menos duas crianas devem ter olhos azuis, ou seja, 2 ou todas as 3 crianas. Assim, estamos
interessados na probabilidade de Y assumir valores maiores ou iguais a 2, ou seja, os valores 2 ou 3.

P[Y2] = {P[Y=2]+P[Y=3]} =
2 3 2
) 25 , 0 1 ( 25 , 0
2
3


|
|

\
|
+
3 3 3
) 25 , 0 1 ( 25 , 0
3
3


|
|

\
|

=
1 2
) 75 , 0 ( 25 , 0
! 1 ! 2
! 3
+
0 3
) 75 , 0 ( 25 , 0
! 0 ! 3
! 3

= 3 . 0,0625 . 0,75 + 1 . 0,0156 . 1 = 0,1406 + 0,0156 = 0,1562

A probabilidade de que pelo menos 2 das 3 crianas de um casal de olhos azuis tambm
tenham olhos azuis de 15,62 %.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



58
Exerccio (5.3)

X: n
o
de unidades do medicamento vendidas em 1 dia

Valores que X pode assumir: x = 0, 1, 2, ... (at um limite mximo desconhecido)
Nmero mdio de unidades do medicamento vendidas por dia: 3 ( = 3)

Supondo X ~ Poisson ( = 3)

Assim,
!
3
) (
3
x
e
x X P
x

= =

para x = 0, 1, 2, ... (e 2,72)



a)
0
.
0
4
9
8
0
.
1
4
9
4
0
.
2
2
4
0
0
.
2
2
4
0
0
.
1
0
1
0
0
.
0
5
0
4
0
.
0
2
1
6
0
.
0
0
8
1
0
.
0
0
2
7
0
.
0
0
0
8
0
.
0
0
0
2
0
.
0
0
0
0
0
.
1
6
9
0
0.00
0.03
0.05
0.08
0.10
0.13
0.15
0.18
0.20
0.23
0.25
0.28
0.30
0 1 2 3 4 5 6 7 8 9
1
0
1
1
1
2
Nmero de partculas emitidas por segundo
P
r
o
b
a
b
i
l
i
d
a
d
e


Note que a distribuio de probabilidade do nmero unidades do medicamento vendidas por dia
assimtrica com concentrao esquerda, isto , nos valores mais prximos do valor esperado
(3). Para valores maiores ou iguais a 12, a probabilidade to pequena que pode ser considerada
igual a zero.


b) P[X entre 7 e 11] = P[7 X 11] = {P[X=7]+ P[X=8]+ P[X=9]+ P[X=10]+ P[X=11]}

Do grfico em a), temos que :

P[X entre 7 e 11] = 0,0216 + 0,0081 + 0,0027 + 0,0008 + 0,0002 = 0,0334

A probabilidade de que sejam vendidas entre 7 e 11 unidades do medicamento por dia de
3,34%.


c) Considerando que a procura pelo medicamento durante os dias da semana se mantm
constante e que o que ocorre em um dia independente do que ocorre em outro dia, podemos
concluir que o nmero mdio de unidades do medicamento vendidas em 1 semana de 7 x 3 = 21
unidades. Assim, o nmero de unidades do medicamento vendidas em 1 semana tem distribuio
de Poisson com mdia igual a 21.


Nmero de unidades vendidas por dia

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



59
d) Y: n
o
de unidades do medicamento vendidas em 1 semana (7 dias)

Valores que Y pode assumir: y = 0, 1, 2, ... (at um limite mximo desconhecido)
Nmero mdio de unidades do medicamento vendidas em 1 semana: 21 ( = 21)

Supondo Y~ Poisson ( = 21).


Assim,
P Y y
e
y
y
( )
!
= =

21
21
, para y = 0, 1, 2, ... (e 2,72)

P Y
e
( ) = =

100
21
100!
21 100
= 0,0000000000000000000000000000000000135 (1,35 x 10
-35
)
(uma probabilidade baixssima!!!)


Exerccio (5.4)

X: n
o
de meninos de daltnicos em um grupo de n=4
Valores que X pode assumir: x = 0,1,2,3 ou 4
Probabilidade de um menino ser daltnico: p = 0,08

Portanto, X ~ Binomial (n=4,p=0,08)

Assim,
x x
x
x X P


|
|

\
|
= =
4
) 08 , 0 1 ( 08 , 0
4
) ( para x = 0,1,2, 3 ou 4

A probabilidade de 3 meninos no serem daltnicos num grupo de 4 meninos igual
probabilidade de 1 menino ser daltnico num grupo de 4 meninos, ou seja P(X=1):

25 , 0 78 , 0 08 , 0 4 ) 92 , 0 ( 08 , 0
! 3 ! 1
! 4
) 08 , 0 1 ( 08 , 0
1
4
) 1 (
3 1
= = =
|
|

\
|
= = X P


Exerccio (5.5)

X: n
o
de animais que sobrevivem em n animais submetidos ao experimento cirrgico
Valores que X pode assumir: x = 0,1,2,...,n
Probabilidade de um animal sobreviver p = 2/3.

a) Distribuio de probabilidade de X: X ~ Binomial (n=5 , p=2/3)


004 , 0
243
1
1
243
1
1
! 5 ! 0
! 5
3
1
3
2
0
5
) 0 (
5 0
= = = |

\
|
|

\
|

|
|

\
|
= = X P
041 , 0
243
2
5
81
1
3
2
! 4 ! 1
! 5
3
1
3
2
1
5
) 1 (
4 1
= = = |

\
|
|

\
|

|
|

\
|
= = X P
165 , 0
243
4
10
27
1
9
4
! 3 ! 2
! 5
3
1
3
2
2
5
) 2 (
3 2
= = = |

\
|
|

\
|

|
|

\
|
= = X P
329 , 0
9
1
27
8
10
9
1
27
8
! 2 ! 3
! 5
3
1
3
2
3
5
) 3 (
2 3
= = = |

\
|
|

\
|

|
|

\
|
= = X P

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



60
329 , 0
243
16
5
3
1
81
16
! 1 ! 4
! 5
3
1
3
2
4
5
) 4 (
1 4
= = = |

\
|
|

\
|

|
|

\
|
= = X P
132 , 0
243
32
1 1
243
32
! 0 ! 5
! 5
3
1
3
2
5
5
) 5 (
0 5
= = = |

\
|
|

\
|

|
|

\
|
= = X P


Note que P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1


b)

i. P(X = 3) = 0,33
ii. P(X 1) = 1- P(X = 0) = 1- 0,004 = 0,996
iii. Mais de 2 animais no sobreviverem o mesmo que no no mximo 2 animais sobreviverem:
P(X 2 ) = P(X = 0) + P(X = 1) +P(X = 2) = 0,004 + 0,041 + 0,165 = 0,210


c) Se 60 animais se submeterem a essa cirurgia, espera-se que, em mdia, 60 x p = 60 x 1/3 = 20 no
sobrevivam.


Exerccio (5.6)

X: n
o
de sementes que no germinam em um pacote com 10 sementes

Valores que X pode assumir: x = 0,1,2,...,10
Probabilidade de uma semente no germinar: p = 0,2

X ~ Binomial (n=10,p=0,2)

Assim,
x x
x
x X P


|
|

\
|
= =
10
8 , 0 2 , 0
10
) ( para x = 0,1,2,...,10


a) ( ) ) 4 ( ) 3 ( ) 2 ( ) 1 ( ) 0 ( 1 ) 4 ( 1 ) 4 ( = + = + = + = + = = = > X P X P X P X P X P X P X P
= 1 - 0,9672 = 0,0328

1074 , 0 8 , 0 2 , 0
0
10
) 0 (
10 0
=
|
|

\
|
= = X P

2684 , 0 8 , 0 2 , 0
1
10
) 1 (
9 1
=
|
|

\
|
= = X P

3020 , 0 8 , 0 2 , 0
2
10
) 2 (
8 2
=
|
|

\
|
= = X P

2013 , 0 8 , 0 2 , 0
3
10
) 3 (
7 3
=
|
|

\
|
= = X P

0881 , 0 8 , 0 2 , 0
4
10
) 4 (
6 4
=
|
|

\
|
= = X P



b) O nmero esperado de pacotes indenizados quando 1000 so vendidos 1000 vezes a
probabilidade de um pacote ser indenizado, ou seja, 1000 x 0, 0328 33 pacotes.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



61
Exerccio (5.7)

X: n
o
de colnias de bactrias por 10 ml de gua de um lago.
Valores que X pode assumir: x = 0, 1, 2, ... (at um limite mximo desconhecido)

Supondo X ~ Poisson ( = 3)

Assim,
!
3
) (
3
x
e
x X P
x

= =

para x = 0, 1, 2, ... (e 2,72)



a) Qual a probabilidade de no se achar nenhuma colnia em 10 ml de gua desse lago ?

05 , 0
72 , 2
1
1
1 72 , 2
! 0
3
) 0 (
3
3 0 3
= =

= =

e
X P

b) Qual a probabilidade de se achar pelo menos duas colnias em 10 ml de gua desse lago ?

( ) 80 , 0 20 , 0 1 ) 15 , 0 05 , 0 ( 1 ) 1 ( ) 0 ( 1 ) 1 ( 1 ) 2 ( = = + = = + = = = X P X P X P X P

05 , 0 ) 0 ( = = X P pelo item (a)
15 , 0
72 , 2
3
1
3 72 , 2
! 1
3
) 1 (
3
3 1 3
= =

= =

e
X P


c) O volume de gua triplicou.
X: n
o
de colnias de bactrias por 30 ml de gua de um lago.
Portanto, a mdia de X passa a ser = 3 x 3 = 9 colnias por 30 ml de gua.

Assim,
!
9
) (
9
x
e
x X P
x

= =

para x = 0, 1, 2, ... (e 2,72)



( )
943926 , 0 056074 , 0 1 ) 033737 , 0 014994 , 0 004998 , 0 001111 , 0 000123 , 0 ( 1
! 4
9
! 3
9
! 2
9
! 1
9
! 0
9
1
) 4 ( ) 3 ( ) 2 ( ) 1 ( ) 0 ( 1 ) 4 ( 1 ) 5 (
4 9 3 9 2 9 1 9 0 9
= = + + + +
=
|
|

\
|
+

=
= + = + = + = + = = =

e e e e e
X P X P X P X P X P X P X P




Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



62
Seo 6: Distribuies de Probabilidade: Normal


Exerccio (6.1)

X: quantidade de ferro srico de indivduos sadios
X ~ Normal ( = 100 ; = 25)


a) Quantidade mdia de ferro srico em indivduos desta populao: = 100 mcg/dl
Desvio padro da quantidade de ferro srico nesta populao: = 25 mcg/dl


b) Representao grfica da funo de densidade de probabilidade da varivel X:

68,3% dos valores de X esto dentro do intervalo [ ] = [100 25] = [75 ; 125] mcg/dl
95,4% dos valores de X esto dentro do intervalo [ 2] = [100 50] = [50 ; 150] mcg/dl
99,7% dos valores de X esto dentro do intervalo [ 3] = [100 75] = [25 ; 175] mcg/dl


94,5%
68,3%
99,7%
150 175 125 75 50 25



c) Equao da varivel normal padro Z:


=
X
Z
.

Neste caso,
25
100
=
X
Z





Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



63
d)

Um valor de X
igual a ...
Corresponde
a
Z igual a ...
P(X x ) = Um valor de X
igual a ...
Corresponde
a
Z igual a ...
P(X x ) =

25
3
25
100 25
=


P(Z -3) =
0,001350
100 + 3 x 25
= 175

3
P(Z3) = P(Z-3)
= 0,001350
100 2 x 25
= 50

-2
P(Z -2) =
0,022750
100 + 2 x 25
= 150
Da tabela
Z = 2

0,022750
100 1 x 25
= 75
Da tabela
Z = -1

0,158655

125
1
25
100 125
=


P(Z1) = P(Z-1)
= 0,158655

59
64 , 1
25
100 59
=


P(Z -1,64) =
0,050503
100 + 1,64 x 25
= 141

1,64
P(Z1,64)=P(Z-1,64)
= 0,050503
100 1,28 x 25
= 68

-1,28
P(Z -1,28) =
0,100273
100 + 1,28 x 25
= 132
Da tabela
Z = 1,28

0,100273
100 0,68 x 25
= 83
Da tabela
Z = -0,68

0,248252

117
68 , 0
25
100 117
=


P(Z0,68) = P(Z-0,68)
0,248252

90
4 , 0
25
100 90
=


P(Z -0,4) =
0,344578
100 + 0,4 x 25
= 110

0,4
P(Z0,4) = P(Z-0,4)
= 0,344578


(i)
( ) ( )
( ) ( ) 555149 , 0 100273 , 0 655422 , 0 28 , 1 40 , 0
40 , 0 28 , 1
25
100 110
25
100 68
110 68
= = =
= |

\
|

=
Z P Z P
Z P Z P X P


Em uma amostra aleatria de 500 indivduos sadios desta populao, esperamos que
500 x 0,555149 276
tenham quantidade de ferro srio entre 68 e 110 mcg/dl.


(ii)

Devemos ter P(x
1
< X < x
2
)= 0,50 e (100 x
1
) = (x
2
100??pela simetria em torno da mdia.

( ) ( ) 50 , 0
25
100
25
100
2 1
2 1
2 1
= < < = |

\
|
< <

= < < z Z z P
x
Z
x
P x X x P

Pela simetria de Z em torno da mdia, z
1
= -z
2
e ento: ( ) 50 , 0
2 2
= < < z Z z P

25 , 0
2
50 , 0
2
50 , 0 1
) ( ) (
2 2
= =

= < = > z Z P z Z P

Na Tabela Z vemos que P(Z < -0,67) = 0,251429 0,25. Portanto, -z
2
= -0,67 e z
2
= 0,67.

Assim:
83 17 100 25 67 , 0 100 25 100
25
100
2 1 2
1
= = = = =

z x z
x

117 17 100 25 67 , 0 100 25 100
25
100
2 2 2
2
= + = + = + = =

z x z
x


Portanto, o intervalo simtrico em torno da mdia 100 que abrange 50% das quantidades de
ferro em indivduos sadios [83;117] mcg/dl.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



64

(iii)

Devemos ter P(x
1
< X < x
2
)= 0,95 e (100 x
1
) = (x
2
100) pela simetria em torno da mdia.

( ) ( ) 95 , 0
25
100
25
100
2 1
2 1
2 1
= < < = |

\
|
< <

= < < z Z z P
x
Z
x
P x X x P

Pela simetria de Z em torno da mdia, z
1
= -z
2
e ento: ( ) 95 , 0
2 2
= < < z Z z P

025 , 0
2
05 , 0
2
95 , 0 1
) ( ) (
2 2
= =

= < = > z Z P z Z P

Na Tabela Z vemos que P(Z < -1,96) = 0,024998 0,025. Portanto, -z
2
= -1,96 e z
2
= 1,96.

Assim:

51 49 100 25 96 , 1 100 25 100
25
100
2 1 2
1
= = = = =

z x z
x

149 49 100 25 96 , 01 100 25 100
25
100
2 2 2
2
= + = + = + = =

z x z
x


Portanto, o intervalo simtrico em torno da mdia 100 que abrange 95% das quantidades de ferro
em indivduos sadios [51;149] mcg/dl.


Exerccio (6.2)

X: concentrao srica de tiroxina T4(D) em ces machos sadios
X ~ Normal ( = 2,04 ; = 0,78)

a)
i) ( ) ( ) 838913 , 0 99 , 0
78 , 0
04 , 2 81 , 2
81 , 2 = < = |

\
|
< = < Z P Z P X P

ii) ( ) ( ) ( ) 621719 , 0 31 , 0 31 , 0
78 , 0
04 , 2 8 , 1
8 , 1 = < = > = |

\
|
> = > Z P Z P Z P X P

iii)
( ) ( )
( ) ( ) 628987 , 0 093418 , 0 722405 , 0 32 , 1 59 , 0
59 , 0 32 , 1
78 , 0
04 , 2 50 , 2
78 , 0
04 , 2 01 , 1
50 , 2 01 , 1
= = =
= |

\
|

=
Z P Z P
Z P Z P X P



b)

( ) ( )
( ) ( ) 404923 , 0 583166 , 0 988089 , 0 21 , 0 26 , 2
26 , 2 21 , 0
78 , 0
04 , 2 80 , 3
78 , 0
04 , 2 20 , 2
80 , 3 20 , 2
= = =
= |

\
|

=
Z P Z P
Z P Z P X P


Assim, em 200 ces sadios, esperamos 200 x 0,404923 81 ces com concentrao srica entre
2,20 e 3,80 mcg/100ml.



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



65
c)

Devemos ter P(x
1
< X < x
2
)= 0,98 e (2,04 x
1
) = (x
2
2,04) pela simetria em torno da mdia.

( ) ( ) 98 , 0
78 , 20
04 , 2
78 , 0
04 , 2
2 1
2 1
2 1
= < < = |

\
|
< <

= < < z Z z P
x
Z
x
P x X x P


Pela simetria de Z em torno da mdia, z
1
= -z
2
e ento: ( ) . 98 , 0
2 2
= < < z Z z P

01 , 0
2
02 , 0
2
98 , 0 1
) ( ) (
2 2
= =

= < = > z Z P z Z P

Na Tabela Z vemos que P(Z < -2,33) = 0,009903 0,01. Portanto, -z
2
= -2,33 e z
2
= 2,33.

Assim:

22 , 0 82 , 1 04 , 2 78 , 0 33 , 2 04 , 2 78 , 0 04 , 2
78 , 0
04 , 2
2 1 2
1
= = = = =

z x z
x

86 , 3 82 , 1 04 , 2 78 , 0 33 , 2 04 , 2 78 , 0 04 , 2
78 , 0
04 , 2
2 2 2
2
= + = + = + = =

z x z
x


Portanto, o intervalo simtrico em torno da mdia 2,04 que abrange 98% das concentraes sricas
em ces sadios [0,22 ; 3,86] mcg/100ml.


Exerccio (6.3)

X: tempo de gestao de um beb, em dias.
X ~ Normal ( = 268 ; = 15)

a) Uma criana ser considerada prematura se o seu tempo de gestao for inferior a 247 dias, ou
seja, se X<247. Ento, devemos calcular P[X<247].

P X P
X
P Z
padronixando
( ) ( , ) , < =

<

|
\

|
= < = 247
268
15
247 268
15
1 40 0 0808

Assim, a porcentagem de crianas nascidas prematuramente ser de 8,08% .


b) Para que uma criana no seja considerada prematura, seu tempo de gestao tem que ser
maior do que um valor, digamos a . E o valor a aquele que deixa 4% dos tempos de gestao
abaixo dele. Ou seja, o valor a tal que P(X < a) = 0,04. O valor a o percentil de ordem 4 (ou
4%).
Encontrando o valor de a
P X P
X
P Z
padronixando
( ) , < =

<

|
\

|
= <
|
\

|
= a
a a - 268
15
268
15
268
15
0 04


Na tabela Z, o valor que deixa, aproximadamente, 4% da rea abaixo dele o -1,75.
Assim, (a - 268)/15 = -1,75. Ento, a = (-1,75 x 15) + 268 = 241,75.

Desse modo, para que uma criana no seja considerada prematura pelo novo critrio, seu tempo
de gestao tem que ser, no mnimo, de 242 dias.



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



66

Exerccio (6.4)

X: escore de Q.I.
X ~ Normal ( = 100 ; = 15)

a) Uma pessoa ser admitida nessa organizao se o seu escore de Q.I. for superior a 131,5 pontos,
ou seja, se X>131,5. Ento, devemos calcular P[X>131,5].

P X P
X
P Z P Z
( , )
,
( , ) ( , ) ,
> =

>

|
\

|
=
= > = < =
1 3 1 5
1 0 0
1 5
1 3 1 5 1 0 0
1 5
2 1 0 2 1 0 0 0 1 7 9
p a d r o n i z a n d o
p o r s i m e t r i a n a t a b e l a


Assim, a probabilidade de uma pessoa escolhida aleatoriamente ser aceita nessa organizao
de apenas 1,79%.


b) Para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a um valor,
digamos b . Esse valor b aquele que deixa 1% dos escores de Q.I. acima dele. Ou seja, o valor b
tal que P(X > b) = 0,01 e, portanto, P(X < b) = 0,99. O valor b o percentil de ordem 99 (ou 99%).
Encontrando o valor b

P X P
X
P Z
padronixando
( ) , < =

<

|
\

|
= <
|
\

|
= b
b b - 100
15
100
15
100
15
0 99


O valor, na tabela Z, que deixa, aproximadamente, 99% da rea abaixo dele o 2,33.
Assim, (b - 100)/15 = 2,33. Ento, b = (2,33 x 15) + 100 = 134,95.

Desse modo, para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a
134,95 pontos.


Exerccio (6.5)


X: nmero de colnias por cultura de escarro em pessoas sadias

a) Ramo-e-Folhas para nmero colnias por cultura de escarro

n = 44 Escala: |1|7 = 17

|1|7
|2|23333444444
|2|55555556889
|3|0011
|3|5556
|4|01112
|4|
|5|14
|5|668
|6|0
|6|8
|7|
|7|9



Podemos ver que a distribuio de
freqncia do nmero de colnias por
cultura de escarro muito assimtrica.
Portanto, no podemos supor que siga
uma esta varivel siga a distribuio
Normal



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



67
b)
Faixa de Referncia de 95%

(100- )% = 95%
= 5
/2 = 5/2 = 2,5
100 /2 = 100 2,5 = 97,5


(i) Mtodo dos Percentis

Calculada no exerccio 2.2.5.

Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em
pessoas sadias [22; 68] colnias, pelo mtodo dos percentis.

(ii) Mtodo da Curva de Gauss

Faixa de Referncia de 100(1- )% : [ z
(/2)
.
; + z
(/2)
.
]

Como e s so desconhecidos, vamos estim-los por x = 34,3 e s =14,2 e, assim, a Faixa de
Referncia de 95% torna-se: [ x - z
(/2)
.
s ; x - z
(s/2)
.
s ] = [34,3 - z
(0,025)
(14,2) ; 34,3 + z
(0,025)
(14,2)]

Vamos descobrir na Tabela da Distribuio Normal Padronizada (Tabela Z) quem z
(0,025)
:
Pela definio, z
(0,025)
o valor de Z tal que P(Z > z
(0,025)
) = 0,025.
Pela simetria em torno de zero da distribuio de Z, temos: P(Z < -z
(0,025)
) = 0,025.
Na tabela Z temos que P(Z < -1,96) = 0,024998 0,025
Portanto, -z
(0,025)
= -1,96 e assim, z
(0,025)
= 1,96.

A Faixa de Referncia de 95% torna-se:
[34,3 - z
(0,025)
(14,2) ; 34,3 + z
(0,025)
(14,2)] = [34,3 1,96(14,2) ; 34,3 + 1,96(14,2)] = [6 ; 62] colnias

Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em
pessoas sadias [6; 62], pelo mtodo da curva de Gauss.

Note que as Faixas de Referncia de 95% para o nmero de colnias por cultura de escarro em
pessoas sadias fornecida pelo dois mtodos diferem bastante no limite inferior:

Mtodo da Curva de Gauss: FR(95%) : [ 6; 62] colnias
Mtodo dos Percentis: FR(95%): [22 ; 68] colnias

Como vimos no item (a) a Curva Normal (Curva de Gauss) no se ajusta bem a esses dados. Assim,
o mtodo mais indicado neste caso o Mtodo dos Percentis.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



68
Seo 7: Intervalos de Confiana


Exerccio (7.1)

a) Populao: todos os pacientes atendidos no posto durante os ltimos trs anos.
Amostra: os 70 pacientes adultos selecionados.

b) Varivel X: idade dos pacientes desta populao (varivel contnua)
Parmetro : idade mdia dos pacientes desta populao


Estimativa Pontual para : 36,86 x= anos (mdia amostral)


Intervalo de 100(1-)% de Confiana para :
(

+
n
s
Z x
n
s
Z x
) 2 / ( ) 2 / (
;

com 0<<1

s = 17,79 anos (desvio padro amostral)
n = 70 (tamanho da amostra)


Intervalo de 90% de Confiana para : (a amostra grande n = 70 > 30)

100(1- ) = 90
1- = 0,90
= 0,10
/2 = 0,05
Z
0,05
= 1,64 pois P( Z > 1,64 ) 0,05
[ ] [ ] 35 , 40 ; 37 , 33 49 , 3 86 , 36 ; 49 , 3 86 , 36
70
79 , 17
64 , 1 86 , 36 ;
70
79 , 17
64 , 1 86 , 36
) 05 , 0 ( ) 05 , 0 (
% 90
;
= +
+
=
(

=
(

+ =
n
s
Z x
n
s
Z x IC



Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 33,37 e 40,35
anos com 90% de confiana.


Intervalo de 95% de Confiana para :

100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z
0,025
= 1,96 pois P( Z > 1,96 ) 0,025
[ ] [ ] 03 , 41 ; 69 , 32 17 , 4 86 , 36 ; 17 , 4 86 , 36
70
79 , 17
96 , 1 86 , 36 ;
70
79 , 17
96 , 1 86 , 36
) 025 , 0 ( ) 025 , 0 (
% 95
;
= +
+
=
(

=
(

+ =
n
s
Z x
n
s
Z x IC



Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 32,69 e 41,03
anos com 95% de confiana.

Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



69

c) Varivel Y: ser ou no analfabeto (varivel categrica)
Parmetro p: proporo de analfabetos nesta populao


Estimativa Pontual para p: 0,27 70 19 p = =
ou seja, 27% dos pacientes deste posto so analfabetos


Intervalo de 90% de Confiana para p: (a amostra grande n = 70 > 30)

100(1- ) = 90
1- = 0,90
= 0,10
/2 = 0,05
Z
0,05
= 1,64 pois P( Z > 1,64 ) 0,05
[ ] [ ] 36 , 0 ; 18 , 0 09 , 0 27 , 0
70
) 73 , 0 ( 27 , 0
64 , 1 27 , 0
) 1 (

) 2 / (
% 90
= =
(

=
(


=
n
p p
Z p IC
p


Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre
18% e 36% com 90% de confiana.


Intervalo de 95% de Confiana para p:

100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z
0,025
= 1,96 pois P( Z > 1,96 ) 0,025
[ ] [ ] 37 , 0 ; 17 , 0 10 , 0 27 , 0
70
) 73 , 0 ( 27 , 0
96 , 1 27 , 0
% 95
= =

=
p
IC


Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre
17% e 37% com 95% de confiana.

Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.


Exerccio (7.2)

Varivel X: produo de leite (em litros) na primeira lactao de vacas desta fazenda
(varivel contnua)
Parmetro : produo mdia de leite na primeira lactao de vacas desta fazenda

Estimativa Pontual para : 1500 x= litros (mdia amostral)

s = 300 litros (desvio padro amostral)
n = 20 (tamanho da amostra)


Intervalo de 98% de Confiana para : (a amostra pequena n = 20 < 30)

100(1-) = 98
1- = 0,98
= 0,02
/2 = 0,01
gl = n-1 = 20-1 =19
t
(19; 0,01)
= 2,539

[ ] [ ] litros. 1670 ; 1330 170 1500
20
300
539 , 2 1500
) 01 , 0 ; 19
% 98
= =

(

=
(

=
n
s
t x IC



Interpretao: A produo mdia de leite na primeira lactao de vacas desta fazenda est
entre 1330 e 1670 litros, com 98% de confiana.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



70


Exerccio (7.3)

a) Porque a informao sobre o parmetro (neste caso, a mdia da varivel na populao)
muito vaga. Por exemplo, se o intervalo de confiana para a altura mdia das pessoas adultas
de uma cidade vai de 1 a 2,50 metros, no saberemos dizer se esta cidade habitada por
adultos que tendem a ser altos ou baixos. Alm disso, no seria necessrio um estudo para obter
esta informao, pois j sabemos que os adultos no medem menos que um metro nem mais
que 2,50 metros.

b) Reduzir o nvel de confiana 100(1-) significa aumentar o valor de , o que leva a valor menor
de z
/2
, reduzindo a amplitude do intervalo.
Por exemplo: passar de 100(1-) = 95 para 100(1-) = 90 significa passar de = 0,05 para = 0,10.
Assim, passamos de Z
/2
= Z
0,025
= 1,96 para Z
/2
= Z
0,05
= 1,64.
Desse modo, quanto menor o nvel de confiana requerido, menor ser a amplitude do
intervalo.

c) Esta parcela seria menor. Desse modo, quanto menor a variabilidade da varivel, menor ser a
amplitude do intervalo.

d) Esta parcela seria menor. Desse modo, quanto maior o tamanho da amostra, menor ser a amplitude
do intervalo.

e) Apenas o tamanho da amostra (n), que ele pode aumentar, e o nvel de confiana do intervalo
(100(1- )), que ele pode reduzir. O pesquisador no tem controle sobre a variabilidade ( ) da
caracterstica estudada.

f) Aumentar o tamanho da amostra (n).



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



71
Seo 8: Conceitos Bsicos de Testes de Hipteses


Situao 1:

a) Parmetro a ser testado : tempo mdio (em horas) da execuo de uma nova
tcnica para identificar bactrias em hemoculturas.

b) Hiptese Nula H
0
: = 40,5 horas
Hiptese Alternativa H
a
: < 40,5 horas

c) Erro Tipo I: Concluir que o novo mtodo tem tempo mdio de execuo menor do que
40,5 horas quando, na verdade, seu tempo mdio igual a 40,5 horas.
Erro Tipo II: Concluir que novo mtodo tem tempo mdio de execuo igual a 40,5 horas
quando, na verdade, seu tempo mdio menor do que 40,5 horas.


Situao 2:

a) Parmetro a ser testado p: proporo de homens com mais de 65 anos de uma cidade
que morrem dentro de um ano.

b) Hiptese Nula H
0
: p = 0,04
Hiptese Alternativa H
a
: p > 0,04

c) Erro Tipo I: Concluir que a proporo de homens com mais de 65 anos que morrem dentro de
um ano nessa cidade maior do que 0,04 quando, na verdade, essa proporo
igual a 0,04.
Erro Tipo II: Concluir que a proporo de homens com mais de 65 anos que morrem dentro de
um ano nessa cidade igual a 0,04 quando, na verdade, essa proporo
aumentou.


Situao 3:

a) Parmetro a ser testado : peso mdio (em quilos) de frangos vendidos pelo fornecedor
novo

b) Hiptese Nula H
0
: = 3 quilos
Hiptese Alternativa H
a
: > 3 quilos

c) Erro Tipo I: Concluir que o peso mdio dos frangos do novo fornecedor maior do que 3
quilos quando, na verdade, o peso mdio igual a 3 quilos.
Erro Tipo II: Concluir que o peso mdio dos frangos do novo fornecedor igual a 3 quilos
quando, na verdade, peso mdio maior do que 3 quilos.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



72

Situao 4:

a) Parmetro a ser testado : quantidade mdia de cido acetil saliclico (mg por
comprimido) de certo analgsico.

b) Hiptese Nula H
0
: = 5,5 mg
Hiptese Alternativa H
a
: 5,5 mg

c) Erro Tipo I: Concluir que a quantidade mdia de cido acetil saliclico nos comprimidos do
analgsico diferente da especificada quando, na verdade, ela igual a 5,5 mg.
d) Erro Tipo II: Concluir que a quantidade mdia de cido acetil saliclico nos comprimidos do
analgsico igual especificada quando, na verdade, ela diferente de 5,5 mg.


Situao 5:

a) Parmetro a ser testado: p: proporo de sementes que germinam

b) Hiptese Nula H
0
: p = 0,95
Hiptese Alternativa H
a
: p < 0,95

c) Erro Tipo I: Concluir que a proporo de sementes que germinam menor de 0,95 quando,
na verdade, essa proporo igual a 0,95.
Erro Tipo II: Concluir que a proporo de sementes que germinam igual a 0,95 quando, na
verdade, essa proporo menor do que 0,95.



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



73

Seo 9: Testes de Hipteses para Uma Populao


Situao 1:

H
0
: = 40,5 horas n = 18 (amostra pequena)
H
a
: < 40,5 horas mdia amostral = 39,42;
desvio-padro amostral = 1,96

obs T
=

=
39 42 40 50
196 18
2 34
, ,
,
,
RR: T
obs
< -t
(17;0,05)
que seja

T
obs
< -1,74

Como o valor de T
obs
est na Regio de Rejeio, rejeitamos H
0
, ao nvel de significncia de 5%.

Valor P = P[t
17
< -2,34] = ?
Deve-se encontrar a P[t
17
> 2,34], que, por simetria, igual a P[t
17
< -2,34]).
Na linha 17 da tabela t-student, no existe o valor 2,34. Ele est entre os valores 2,110 e 2,567, que
correspondem s colunas 0,025 e 0,01, respectivamente. Assim, P[t
17
> 2,34] est entre 0,01 e 0,025.
Consequentemente, o valor P est entre 1% e 2,5%.

Concluso: Rejeita-se a hiptese de que o tempo mdio de execuo do novo mtodo igual a
40,5 horas, em favor da hiptese de que ele menor do que 40,5 horas, ao nvel de significncia de
5% (0,01 < valor P < 0,025).


Situao 2:

H
0
: p = 0,04
H
a
: p > 0,04 n = 1000 (amostra grande); proporo amostral = 60/1000 = 0,06

obs Z
=

=
0 06 0 04
0 04 1 0 04
1000
3 23
, ,
, ( , )
,
RR: Z
obs
> z
0,05

Z
obs
> 1,64

Como o valor de Z
obs
est na Regio de Rejeio, rejeitamos H
0
, ao nvel de significncia de 5%.

Valor P = P[Z > 3,23] = ?
O ltimo valor da tabela Z 3,10. Como 3,23 > 3,10, podemos concluir que P[Z > 3,23] 0,000.

Concluso: rejeitamos a hiptese de que a proporo de idosos que morrem por ano nessa cidade
igual a 4%, em favor da hiptese de que essa proporo maior 4%, ao nvel de significncia de
5% (valor P 0,000).


Situao 3:

H
0
: = 3 quilos
H
a
: > 3 quilos n = 25 (amostra pequena); mdia amostral = 3,2; desvio-padro amostral = 0,4

obs
T
=

=
3 2 3 0
0 4 25
2 5
, ,
,
,
RR: T
obs
> t
24;0,05

T
obs
> 1,711

Como o valor de T
obs
est na Regio de Rejeio, rejeitamos H
0
, ao nvel de significncia de 5%.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



74

Valor P = P[t
24
> 2,5] = ?
Na linha 24 da tabela t-student, no existe o valor 2,5. Ele est entre as colunas do 0,01 e 0,005.
Assim, 0,005 < P[t
24
> 0,016] < 0,01. Consequentemente, 0,005 < valor P < 0,01.

Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que o peso mdio de frangos
vendidos pelo fornecedor novo igual a 3 quilos, em favor da hiptese de que o peso mdio
desses frangos maior do que 3 quilos (0,005 < valor P < 0,01).




Situao 4:

H
0
: = 5,5 mg
H
a
: 5,5 mg n = 40 (amostra grande); mdia amostral = 5,2 ; desvio-padro amostral = 0,7

obs
Z
=

=
5 2 5 5
0 7 40
2 71
, ,
,
, RR: Z
obs
< -z
0,025
ou Z
obs
> z
0,025

Z
obs
< -1,96 ou Z
obs
> 1,96

Como o valor de Z
obs
est na Regio de Rejeio, rejeitamos H
0
, ao nvel de significncia de 5%.

Valor P = 2 x P[Z > |-2,71|] = 2 x P[Z > 2,71] = (por simetria) 2 x P[Z <-2,71] = 2 x 0,0034 = 0,0068.

Concluso: rejeitamos a hiptese de que a quantidade mdia de cido acetil saliclico (mg por
comprimido) de certo analgsico igual a 5,5 mg ao nvel de significncia de 5% (valor P = 0,0068).

Nessa situao, podemos usar o intervalo de confiana para realizar o teste de hipteses, pois a
hiptese alternativa bilateral. Como queremos um teste a 5% de significncia, calcularemos um
intervalo de 95% de confiana para a quantidade mdia de cido acetil saliclico, por comprimido.

Intervalo de 95% de Confiana para : (a amostra grande n = 40 > 30)

100(1-) = 95
1- = 0,95
= 0,05
/2 = 0,025
Z
0,025
= 1,96

9 5 %
0 0 2 5
9 5 %
9 5 %
5 2 1 9 6
0 7
4 0
5 2 0 2
5 0
I C z
I C
I C
x
s
n
=

(
=

(
=
=
,
, ,
,
[ , , ]
[ , ; 5 , 4 ]


Interpretao: A quantidade mdia de cido acetil saliclico, por comprimido, est entre 5,0 e 5,4
mg, com 95% de confiana.

Teste de hipteses baseado no intervalo de confiana: como o valor 5,5 no pertence ao intervalo
de 95% de confiana para a quantidade mdia de cido acetil saliclico, por comprimido,
rejeitamos a hiptese de que a quantidade mdia de cido acetil saliclico de certo analgsico
igual a 5,5 mg ao nvel de significncia de 5%.


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



75

Situao 5:

H
0
: p = 0,95
H
a
: p < 0,95 n = 1000 (amostra grande); proporo amostral = 940/1000 = 0,94

obs Z
=

=
0 94 0 95
0 95 1 0 95
1000
1 45
, ,
, ( , )
,
RR: Z
obs
< -z
0,05

Z
obs
< -1,64
Como o valor de Z
obs
no est na Regio de Rejeio, no rejeitamos H
0
, ao nvel de significncia
de 5%.

Valor P = P[Z < -1,45] = 0,0735

Concluso: no rejeitamos a hiptese de que a proporo de sementes que germinam igual a
95% (valorP=0,0735).



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



76
Seo 10: Testes de Hipteses para Duas Populaes


Exerccio (10.1)

a)
H0: a mdia da diferena dos escores depois e antes do programa igual a zero
(o programa no funciona);
Ha: a mdia da diferena dos escores depois e antes do programa maior do que zero
(o programa aumenta a habilidade);

N
o
do Escores de abdominais Diferenas (d)
aluno Antes Depois (Depois Antes)
1 12 15 15 - 12 = 3
2 10 9 9 - 10 = -1
3 23 25 25 - 23 = 2
4 25 25 25 - 25 = 0
5 29 31 31 - 29 = 2
4 , 1 = d
6 32 30 30 - 32 = -2 s
d
= 1,8
7 14 16 16 - 14 = 2
8 17 20 20 - 17 = 3
9 19 22 22 - 19 = 3
10 20 22 22 - 20 = 2


Mdia das diferenas:
4 , 1
10
14
10
2 3 3 2 2 2 0 2 1 3
= =
+ + + + + + +
= d


Desvio padro das diferenas:
8 , 1
1 10
) 4 , 1 2 ( ) 4 , 1 3 ( ... ) 4 , 1 1 ( ) 4 , 1 3 (
2 2 2 2
=

+ + + +
=
d
s


obs T
=

=
14 0
18 10
2 45
,
,
,
RR: T
obs
> t
(10-1);0,05 =
1,833

Como T
obs
est na regio de rejeio, rejeitamos H
0
ao nvel de 5% de significncia.

b) Valor P = P[t
9
>2,45] = ? O valor 2,45 no existe na linha 9 da tabela t-Student. Ele est entre os
valores 2,262 e 2,821, correspondentes s colunas 0,025 e 0,01. Assim, a P[t
9
>2,45] est entre 1% e
2,5% .
Como o valor P menor do que o nvel de significncia (5%), rejeitamos H0.

Concluso: Ao nvel de 5% de significncia, rejeitamos a hiptese de que a mdia dos escores
depois do programa igual mdia dos escores antes do programa, em favor da hiptese de que
a mdia dos escores depois do programa maior do que mdia dos escores antes do programa
(0,01< valor p < 0,025).

c) 100(1-)% = 95%; 1- = 0,95 ; =0,05 ; /2 = 0,025;
t
9;0,025
= 2,262
[ , , , / ] [ , , , ] [ , , ] 1 4 2 262 18 10 1 4 2 262 0 57 1 4 1 28 = =
[0,12 ; 2,68]

A diferena mdia entre os escores depois e antes do programa est entre 0,12 e 2,68, com 95% de
confiana.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



77

Exerccio (10.2)

1 : peso mdio no grupo I;
2 : peso mdio no grupo II;

a)
H0: 1 = 2
Ha: 1 > 2

x
1
120 =
s = 21,39 n1 = 12
x
2
101 =
s = 20,62 n2 = 7

obs T
=

+
=
120 101
2112
1
12
1
7
189
,
,

comb s
=
+
+
=
( )( , ) ( )( , )
,
12 1 21 29 7 1 20 62
12 7 2
2112
2 2


RR: T
obs
> t
(12+7-2);0,01

T
obs
> 2,57

Como Tobs no est na regio de rejeio, no rejeitamos H0, ao nvel de 1% de significncia.

Concluso: Ao nvel de 1% de significncia, no rejeitamos a hiptese de que o ganho mdio de
peso no grupo alimentado com dieta de alto contedo proteico igual ao ganho mdio de peso
no grupo alimentado com dieta de baixo contedo proteico.

b) Valor P= P[t
17
> 1,89] = ? Na linha 17 da tabela t-Student, no existe o valor 1,89. Ele est entre os
valores 1,74 e 2,11, correspondentes s colunas 0,05 e 0,025, respectivamente. Assim, P[t
17
> 1,89]
est entre 2,5% e 5%. O valor P est entre 0,025 e 0,05.
Como o valor P maior do que 1%, no rejeitamos H0.

Concluso: Ao nvel de 1% de significncia, no existem evidncias para rejeitarmos a hiptese de
que o ganho mdio de peso no grupo alimentado com dieta de alto contedo proteico igual ao
ganho mdio de peso no grupo alimentado com dieta de baixo contedo proteico (0,025 < valor P
< 0,05).

c)
( ) , , [ , ] 120 101 2 11 2112
1
12
1
7
19 2118 +

(
=


[ -2,18 ; 40,18]

A diferena entre o ganho mdio de peso no grupo alimentado com dieta de alto contedo
proteico e o ganho mdio de peso no grupo alimentado com dieta de baixo contedo proteico
est entre -2,18 gramas e 40,18 gramas, com 95% de confiana.


Observao para todo o exerccio: se estivssemos testando a H0: 1 = 2, a 5% de significncia, ns
rejeitaramos H0 em favor de H1: 1 > 2, pois o valor P < 0,05. Porm, se estivssemos testando a
H1: 1 2, no teramos evidncias suficientes para rejeitar H0, a 5% de significncia, pois o
intervalo de 95% de confiana para a diferena entre as duas mdias contm o valor zero. Isso
mostra que a no indicao de uma direo para o valor da diferena entre as duas mdias
(maior ou menor do que zero) reduz o poder do teste para rejeitar H0. Ou seja, quando o teste
unilateral, estamos fornecendo uma informao a mais para o teste, e no precisaremos de
evidncias amostrais to fortes para rejeitar H0 quanto precisaramos se o teste fosse bilateral, onde
no fornecemos nenhuma informao a mais.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



78

Exerccio (10.3)

1 : peso mdio dos bebs no grupo de mes que usaram cocana durante toda a gravidez;
2 : peso mdio dos bebs no grupo de mes que no tm histria de uso de cocana;

a)
H0: 1 = 2
Ha: 1 < 2

x
1
2829 =
s = 708 n1 = 36
x
2
3436 =
s = 628 n2 = 39

obs T
=

+
=

=
2829 3436
708
36
628
39
607
155 04
3 92
2 2
,
,


RR: Z
obs
< -z
0,05

Z
obs
< -1,64

Como Z
obs
est na regio de rejeio, rejeitamos a hiptese de que o peso mdio dos bebs no
grupo de mes que usaram cocana durante toda a gravidez igual ao peso mdio dos bebs no
grupo de mes que no tm histria de uso de cocana, em favor da hiptese de que o peso
mdio dos bebs do primeiro grupo de mes menor do que o peso mdio dos bebs do segundo
grupo de mes, ao nvel de 5 % de significncia.

b) Valor P = P[Z < -3,92] 0,000 , pois o menor valor da tabela Normal padro -3,10.

Concluso: ao nvel de 1% de significncia, rejeitamos a hiptese de que o peso mdio dos bebs
no grupo de mes que usaram cocana durante toda a gravidez igual ao peso mdio dos bebs
no grupo de mes que no tm histria de uso de cocana, em favor da hiptese de que o peso
mdio dos bebs do primeiro grupo de mes menor do que o peso mdio dos bebs do segundo
grupo de mes (valor P 0,000).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



79
Exerccio (10.4)

p
C
: proporo de pessoas que tomaram vitamina C e ficaram livres de doenas
do trato respiratrio
p
P
: proporo de pessoas que tomaram o placebo e ficaram livres de doenas do trato
respiratrio

H0: p
C
= p
P
26 , 0
407
105
= =
p
C
18 , 0
411
76
= = p
p

Ha: p
C
> p
P



obs Z
=

+

= =
0 26 0 18
0 26 1 0 26
407
0 18 1 018
411
0 07
0 028
2 77
, ,
, ( , ) , ( , )
,
,
,
RR: Z
obs
> z
0,025

RR: Z
obs
> 1,64



Como Z
obs
est na regio de rejeio, rejeitamos H0, ao nvel de significncia de 5%.

Valor P = P[Z>2,77] = P[Z < -2,77] = 0,0028.

Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que a proporo de pessoas
que tomaram vitamina C e ficaram livres de doenas do trato respiratrio igual proporo de
pessoas que tomaram placebo e ficaram livres de doenas do trato respiratrio, em favor da
hiptese de que a proporo de pessoas livres de doenas no trato respiratrio entre as que
tomaram vitamina C maior do que essa proporo entre as que tomaram placebo (valor P =
0,0028).

Observao: Tambm rejeitaramos a hiptese nula se o nvel de significncia fosse 1%.


Exerccio (10.5)

Para que um desfecho possa ser considerado associado ao uso de reposio hormonal, devemos
rejeitar a hipotse nula no seu teste, ou seja, o Valor P de seu teste deve ser menor que o nvel de
significncia, neste caso, 5%.

Assim, qualquer evento tromboemblico pode ser considerado, ao nvel de significncia de 5%,
associado ao uso de reposio hormonal (Valor P = 0,002). Em especial, a trombose venosa
profunda (Valor P = 0,004).

Observaes:

1) O evento doena da vescula biliar tem Valor P igual a 5%, e pode ser considerado sob
suspeita.
2) Note que 34 das 1.380 (2,46%) mulheres que fizeram uso desses hormnios tiveram algum evento
tromboemblico, contra apenas 12 das 1383 (0,87%) mulheres do grupo placebo. Assim, o risco
de ter algum evento tromboemblico 2,46/0,87= 2,84 vezes maior para as mulheres que usam
reposio hormonal. O valor 2,84 aproximadamente aquele que est na coluna do Risco
Relativo (RR). A mesma concluso pode ser feita para o desfecho trombose venosa profunda,
cujo risco 3,18 vezes maior entre as mulheres que fizeram reposio hormonal do que entre as
mulheres do grupo placebo.



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



80
Seo 11: Teste Qui-Quadrado


Exerccio (11.1)


Tabela de contingencia para os dados do exerccio 11.1

Brucelose

Vacina
Sim No
Total

Padro 10 4 14

Nova 5 11 16

Total 15 15 30


Este um Teste de Homogeneidade, pois deseja comparar a eficcia das vacinas padro e nova.

H
0
: As propores de animais que contraram a doena so iguais para as duas vacinas
H
a
: As propores de animais que contraram a doena so diferentes para as duas vacinas


Tabela de valores esperados sob a hiptese de homogeneidade

Vacina
Brucelose

Total
Sim No
Padro 14x15/30 =7 14x15/30=7 14
Nova 16x15/30=8 16x15/30=8 16
Total 15 15 30


Estatstica de Teste:
2
2 2 2 2
2
10 7
7
4 7
7
8
8
11 8
8
1 286 1 286 1125 1125 4 821
X
X
=

+

+

+

= + + + =
( ) ( ) (5 ) ( )
, , , , ,


Regio de Rejeio: X
2
obs
> 3,84 (X
2
1;0,05
= 3,84)


Verificao: Como 4,821 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de
significncia.

Clculo do Valor P: Valor P = P[X
2
1
> 4,821] = ?
Na tabela Qui-quadrado, na linha 1, no existe o valor 4,821. Ele est entre os valores 3,84 e 5,024,
correspondentes s colunas do 5% e 2,5%, respectivamente. Assim, P[X
2
1
> 4,821] est entre 0,025 e
0,05.

Concluso: ao nvel de significncia de 5%, rejeitamos a hiptese de homogeneidade entre as
propores de animais que contraram a doena nos grupos vacina padro e vacina nova, em
favor da hiptese de que essas propores so diferentes (0,025 < valor P < 0,05).

Medindo a associao entre variveis: o Risco Relativo

O risco (probabilidade) de uma bezerra que recebeu a vacina padro contrair brucelose
estimado em 10/14=0,71. Para as bezerras que receberam a vacina nova, este risco estimado por
5/16=0,31. Logo, as bezerras vacinadas com vacina padro apresentam um risco de desenvolver
brucelose 2,29 (0,71/0,31) vezes o risco das bezerras vacinadas com a vacina nova. O valor 2,29
uma estimativa do risco relativo (RR). O risco relativo definido como RR=p1/p2, onde p1 e a
probabilidade de ocorrncia do evento (brucelose) no grupo 1 (vacina padro) e p2 a
probabilidade de ocorrncia do evento (brucelose) no grupo 2 (vacina nova). O risco relativo
calculado somente para estudos prospectivos, onde a ocorrncia do evento de interesse

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



81
(brucelose) precedida pelos tratamentos (vacina nova e vacina padro). As hipteses de teste
2

podem ser escritas em funo de RR como :

H0 : RR = 1 x Ha: RR 1,

pois, se no existe associao entre as variveis (H0), os riscos nos dois grupos so iguais e RR=1.


Exerccio (11.2)


Teste de Homogeneidade

H
0
: As propores de contaminao so iguais para todos os tipos de fertilizantes
H
a
: As propores de contaminao so diferentes para todos os tipos de fertilizantes


Tabela de valores esperados sob a hiptese de homogeneidade

Fertilizante
Contaminao

Total
Sim No
Nenhum 101x44/450=9,88 101x406/450=91,12 101
Nitrognio 95x44/450=9,29 95x406/450=85,71 95
Esterco 113x44/450=11,05 113x406/450=101,95 113
Nitrognio e Esterco 141x44/450=13,79 141x406/450=127,21 141
Total 44 406 450


Estatstica de Teste:
2
2 2 2 2
2 2 2 2
2
16 9 88
9 88
9112
9112
10 9 29
9 29
85 71
85 71
4 1105
1105
109 101 95
10195
14 13 79
13 79
127 127 21
127 21
X
X
=

+

+

+

+
+

+

+

+

=
( , )
,
(85 , )
,
( , )
,
(85 , )
,
( , )
,
( , )
,
( , )
,
( , )
,
3.798+0.412 +0.054 +0.006+4.497 +0.487 +0.003+ 0.000 = 9.258


Regio de Rejeio: X
2
obs
> X
2
(4-1)(2-1);0,05
X
2
obs
> X
2
3;0,05
X
2
obs
> 7,82


Verificao: Como 9,258 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de
significncia.

Concluso: ao nvel de significncia de 5%, rejeitamos a hiptese de homogeneidade entre as
propores de contaminao dos tipos de fertilizantes estudados, em favor da hiptese de que
essas propores so diferentes (0,025<valorP<0,05).

Clculo do Valor P: Valor P = P[X
2
3
> 9,258] = ?.
Na tabela Qui-quadrado, na linha 3, no existe o valor 9,258.
Ele est entre os valores 7,82 e 9,35, correspondentes s colunas do 5%e 2,5%, respectivamente.
Assim, P[X
2
3
> 9,258] est entre 0,025 e 0,05.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



82

Observao
Os tratamentos Nenhum, Nitrognio, Esterco e Nitrognio e Esterco podem ser vistos como
a combinao de dois fatores: Nitrognio (presente e ausente) e Esterco (presente e ausente), pois

Tratamento
Nitrognio ausente + Esterco ausente = Nenhum
Nitrognio ausente + Esterco presente = Esterco
Nitrognio presente + Esterco ausente = Nitrognio
Nitrognio presente + Esterco presente = Nitrognio e Esterco

A estrutura desse experimento chamada fatorial 2 a 2, pois existem dois fatores (Nitrognio e
Esterco), cada um com dois nveis (ausente e presente).
Os experimentos fatoriais so muito comuns nas reas industrial, agronmica e de experimentao
animal. Uma boa referncia nessa rea o livro

O grfico a seguir mostra as porcentagens de contaminao para os 4 tratamentos.

Porcentagens de contaminao por Bacterium
Phithotherum em plantao de batatas segundo
tipo de adubao
0
0.05
0.1
0.15
0.2
0.25
Ausente Presente
Nitrognio
%

d
e

c
o
n
t
a
m
i
n
a

o
Esterco presente
Esterco ausente


O grfico indica que, na ausncia de esterco (linha cheia), a adio de nitrognio diminui a
porcentagem de contaminao, mas, na presena do esterco (linha pontilhada), a adio do
nitrognio aumenta a porcentagem de contaminao. Em outras palavras, o efeito do nitrognio
de aumentar a porcentagem de contaminao quanto o esterco presente e de diminuir essa
porcentagem quanto o esterco ausente. Esse fato caracteriza a interao entre os fatores Esterco
e Nitrognio, isto , o efeito do Nitrognio na porcentagem de contaminao no o mesmo nos
dois nveis de Esterco. Se no houvesse interao entre esse dois fatores, as retas do grfico seriam
paralelas.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



83

Exerccio (11.3)

Tabela de contingncia para os dados do exerccio 11.3
Incidncia de parasitas
Raa
Sim No
Total
Pura 105 700 805
No-pura 50 500 550
Total 155 1200 1355

Esse um teste de independncia entre as variveis incidncia de parasitose e raa.

Hipteses:

H
0
: A incidncia de parasitose independe da raa do animal
(ou seja, as duas variveis no esto associadas)

H
a
: A incidncia de parasitose depende da raa do animal
(ou seja, as duas variveis esto associadas)


Tabela de valores esperados sob a hiptese de independncia (H
0
)

Raa
Incidncia de parasitas

Total
Sim No
Pura 700x155/1200=90,42 700x1045/1200=609,58 700
No-pura 500x155/1200=64,58 500x1045/1200=435,42 500
Total 155 1045 1200


Estatstica de Teste:
2
2 2 2 2
2
105 90 42
90 42
609 58
609 58
64 58
64 58
450 435 42
435 42
2 352 0 349 3 293 0 488 6 482
X
X
=

+

+

+

= + + + =
( , )
,
(595 , )
,
(50 , )
,
( , )
,
, , , , ,


Regio de Rejeio: Rejeita-se H
0
se X
2
obs
>
2
1;0,01
= 6,64




Verificao: Como 6,482 no est na regio de rejeio (6,482 > 6,64), no rejeitamos a hiptese
nula ao nvel de significncia de 1%.

Concluso: Ao nvel de significncia de 1%, no rejeitamos a hiptese de independncia entre a
incidncia de parasitose e a raa do animal (0,01 < valor P < 0,025).

Clculo do Valor P: Valor P = P[X
2
1
> 6,482] = ?

Na tabela Qui-Quadrado, na linha 1, no existe o valor 6,482.
Mas 6,482 est entre os valores 5,024 e 6,635, correspondentes s colunas de 2,5% e 1% de
probabilidade, respectivamente. Assim, P[X
2
1
> 6,482] est entre 0,01 e 0,025.
Desse modo, 0,01 < Valor P < 0,025.
Como Valor P > 0,01 (), no rejeitamos a hiptese nula ao nvel de significncia de 1%,
confirmando (como esperado) a concluso anterior.


Medindo a associao entre variveis: a Razo das Chances

Atravs de teste Qui-quadrado verificou-se a existncia de associao entre a incidncia de
parasitose e raa. Como quantificar esta associao? Quando as variveis so quantitativas,

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



84
pode-se medir a associao linear entre duas variveis atravs do coeficiente de correlao.
Quando duas variveis so qualitativas, essa medida seria o Risco Relativo. Porm, o Risco Relativo
s pode ser calculado em estudos prospectivos, que no o caso do estudo desse problema, pois
os animais foram classificados simultaneamente quanto raa e incidncia de parasitose (os
grupos de raa no-pura e pura no foram fixados previamente e depois contada a incidncia de
parasitose). A medida alternativa ao Risco Relativo nesses casos a Razo das Chances (RC).
Chance definido como razo de probabilidades. A chance de ter parasitose no grupo de raa
pura, por exemplo, definido como a razo entre a probabilidade de ter parasitose e a
probabilidade de no ter parasitose, ou seja, (105/700) / (595/700) = 105/595 = 0,18. No grupo de
raa no-pura, a chance de ter parasitose 50/450 = 0,11. Comparando as chances nos dois
grupos, temos que 0,176/0,111 = 1,59. Essa a estimativa da Razo das Chances de parasitose entre
os grupos de raa pura e no-pura. Interpretando esse nmero, vemos que a chance de parasitose
no grupo de raa pura 59% maior do que no grupo de raa no-pura. De maneira geral, no caso
de tabelas 2x2 como a que apresentamos a seguir

Resposta de Interesse
Grupo Sucesso Fracasso Total
A a b a+b
B c d c+d
Total a+c b+d a+b+c+d

a razo das chances de sucesso entre o grupo A e B estimada como

RC
a
a b
b
a b
c
c d
d
c d
a
b
c
d
a d
b c
= =
+
+
+
+
= =

chance de sucesso no grupo A


chance de sucesso no grupo B
.

No caso do problema, RC = = =

=
chance de parasitose no grupo raca pura
chance de parasitose no grupo raca nao - pura
105
595
50
450
105 450
50 595
159 ,

O termo Razo de Chances vem do ingls Odds Ratio. Alguns autores preferem no traduzir odds
por chance e acabam por trabalhar com o termo em ingls, ou com sua abreviatura, OR, ou
ainda com uma mistura de termos (Razo de Odds).


Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



85


Exerccio (11.4)

Esse um teste de independncia entre as variveis ocorrncia de tromboembolismo e grupo
sanguneo.

Hipteses:

H
0
: A ocorrncia de tromboembolismo independe do grupo sanguneo
(ou seja, as duas variveis no esto associadas)

H
a
: A ocorrncia de tromboembolismo depende do grupo sanguneo
(ou seja, as duas variveis esto associadas)


Tabela de valores esperados sob a hiptese de independncia (H
0
)

Grupo
Ocorrncia de tromboembolismo

Total
Sanguneo Sim No
A 79 x 56/1200 = 22,12 79 x 144/1200 = 56,88 79
B 21 x 56/1200 = 7,56 21 x 144/1200 = 19,44 21
AB 27 x 561200 = 5,88 27 x 144/1200 = 5,12 27
O 73 x 56/1200 = 20,44 73 x 144/1200 = 52,56 73
Total 56 144 200


Estatstica de Teste:
2
2 2 2 2
2 2 2 2
32 22 12
22 12
47 56 88
56 88
7 56
7 56
19 19 44
19 44
7 5 88
5 88
14 5 12
5 12
9 20 44
20 44
64 52 56
52 56
X
=

+

+

+

+
+

+

+

+

( , )
,
( , )
,
(8 , )
,
( , )
,
( , )
,
( , )
,
( , )
,
( , )
,


X
2
= 4.413 + 1.716 + 0.026 + 0.010 + 0.213 + 0.083 + 6.403 + 2.490 = 15.354


Regio de Rejeio: Rejeita-se H
0
se X
2
obs
>
2
3;0,01
= 11,345


Verificao: Como 15,354 est na regio de rejeio (15,354 > 11,345), rejeitamos a hiptese nula
ao nvel de significncia de 1%.

Concluso: Ao nvel de significncia de 1%, rejeitamos a hiptese de independncia a ocorrncia
de tromboembolismo e o grupo sanguneo (Valor P < 0,005).

Clculo do Valor P: Valor P = P[X
2
3
> 15,354] = ?

Na tabela Qui-Quadrado, na linha 3, no existe o valor 15,354.
Ele maior do que o ltimo valor (12,838), correspondente coluna do 0,5%. Assim, P[X
2
3
> 15,354]
menor do que 0,5%. Desse modo, Valor P < 0,005.



Medindo a associao entre variveis: a Razo das Chances

Neste caso, h quatro grupos de comparao. Para calcular a razo das chances, devemos
escolher um grupo para ser o grupo de referncia, com o qual todos os outros grupos sero
comparados. Se escolhermos o grupo O como referncia, teremos a seguinte tabela:



Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



86


Grupo Clculo Razo de Chances
A (32 x 64)/ (9 x 47) 4,84
B (8 x 64) / (9 x 19) 2,99
AB (7 x 64) / (9 x 14) 3,57
O ---------------------- 1

Interpretando a tabela, vimos que a chance de tromboembolismo das mulheres do grupo
sanguneo A 4,84 vezes a chance de tromboembolismo das mulheres de sangue tipo O. As
mulheres do grupo B tem uma chance de tromboembolismo que quase 3 vezes essa chance no
grupo O. J as mulheres do grupo AB tm uma chance de tromboembolismo que 3,57 vezes a
chance das mulheres do grupo O.
Se quisssemos o grupo AB com referncia, a tabela ficaria

Grupo Clculo Razo de Chances
A (32 x 14)/ (7 x 47) 1,36
B (8 x 14) / (7 x 19) 0,84
AB ---------------------- 1
O (9 x 14) / (7 x 64) 0,28

Em relao ao grupo AB, as mulheres do grupo B tm uma chance de tromboembolismo 16%
menor [ (0,84 1,00) x 100% = -16% ] . J as mulheres do grupo A tm uma chance 36% maior em
relao s mulheres do grupo AB [ (1,36 1,00) x 100% = +36%)
O valor 1 para os grupos O e AB indicam que eles so o grupo de referncia em suas
respectivas tabelas. Assim, poderamos colocar todas essas informaes numa s tabela e ainda
saberamos qual o grupo de referncia.

Grupo Razo de Chances Razo de Chances
A 4,84 1,36
B 2,99 0,84
AB 3,57 1
O 1 0,28





Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG



87

Referncias Bibliogrficas



Nogueira, M. L. G. et alli (1997), Introduo Bioestatstica, apostila do Instituto de Cincias Exatas
da UFMG.

Montgomery, D. C. (2001), Design and Analysis of Experiments, 5

Edio, John Wiley and Sons, New


York.

Soares, J. F. et alli ( ), Introduo Estatstica, Editora Guanabara Dois

Triola, M. F. (1998), Introduo Estatstica, 7

Edio, LTC.

Вам также может понравиться