Вы находитесь на странице: 1из 78

  !

"#$ % & ' (") 021&35476)498@4BA  C D EF6HG 1PI 6)Q3 RTSQ49Q3 U V WX`Ya9Xb V c&aBd eV fhg5aiXa7p)g5a7qHrsX

t uxwByhwi5w7 v dfexghyikjmlonB prqwigsBgtgtuos vwxwByz2{u|PzP}~wxwByz2{u| iBtu ouB (xB5m

fBBH ( H BH @

Universidade Federal de Minas Gerais Instituto de Cincias Exatas Departamento de Estatstica

Exerccios Resolvidos em Introduo Bioestatstica

Edna Afonso Reis Ilka Afonso Reis

Segunda Edio Novembro/2000

ndice Geral
Primeira Parte - Enunciado dos Exerccios Segunda Parte - Soluo dos Exerccios Referncias Bibliogrficas 5 31 77

Agradecimento
Gostaramos de agradecer ao Prof. Alosio J. F. Ribeiro, do departamento de Estatstica da UFMG, pela reviso cuidadosa deste trabalho e pelas valiosas contribuies, principalmente na complementao da soluo dos exerccios da seo 12.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Primeira Parte: Enunciado dos Exerccios

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

ndice da Primeira Parte - Enunciado dos Exerccios

Seo 1: Seo 2: Seo 3: Seo 4: Seo 5: Seo 6: Seo 7: Seo 8: Seo 9: Seo 10: Seo 11: Seo 12:

Tipos de Estudos e Variveis Anlise Descritiva e Exploratria de Dados Probabilidade Avaliao da Qualidade de Testes Clnicos Distribuies de Probabilidade: Binomial e Poisson Distribuies de Probabilidade: Normal Faixas de Referncia Intervalos de Confiana Conceitos Bsicos de Testes de Hipteses Testes de Hipteses para uma Populao Testes de Hipteses para Duas Populaes Teste Qui-Quadrado

5 8 12 14 18 19 21 22 23 23 24 27

Observao: Os exerccios marcados com asterisco (*) foram adaptados da apostila Introduo Bioestatstica, de Nogueira et alli, Edio de 1997.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Seo 1: Tipos de Estudos e Variveis


1.1) Classifique as seguintes variveis em : Quantitativas (Discretas ou Contnuas) ou Qualitativas (Nominais ou Ordinais).

a) A cor da pele de pessoas (ex.: branca, negra, amarela). Varivel do tipo _______________________ e _______________________

b) O nmero de consultas mdicas feitas por ano por um associado de certo plano de sade. Varivel do tipo _______________________ e _______________________

c) O teor de gordura, medido em gramas por 24 horas, nas fezes de crianas de 1 a 3 anos de idade. Varivel do tipo _______________________ e _______________________

d) O tipo de droga que os participantes de certo estudo tomaram, registrados como: Droga A, Droga B e placebo. Varivel do tipo _______________________ e _______________________

e) A presso intra-ocular, medida em mmHg, em pessoas. Varivel do tipo _______________________ e _______________________

f)

O nmero de filhos das pacientes participantes de certo estudo. Varivel do tipo _______________________ e _______________________

1.2) Classifique os seguintes estudos como observacionais ou experimentais. a) Viagra para os diabticos (Revista Isto n 1535 de 03/03/1999) A famosa plula azul pode tambm ser eficaz para diabticos que tm a funo ertil comprometida. Estudos preliminares haviam descartado a eficincia do Viagra nesses casos. Mas uma pesquisa realizada com 268 homens pela Universidade de Creighton, nos Estados Unidos, mostrou que 56% dos pacientes que tomaram Viagra tiveram melhora contra 10% dos que ingeriram placebo (plula incua). Mas em hiptese nenhuma se recomenda o uso do medicamento sem orientao mdica. Estudo do tipo _________________________________
o

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

b) Sexo feliz (Revista Isto n 1537 de 17/03/1999) Ter relaes sexuais trs vezes por semana rejuvenesce. Um estudo do Hospital Real de Edimburgo (Reino Unido), feito com 3,5 mil europeus e americanos, revelou que a qualidade e a freqncia das relaes sexuais influem diretamente na aparncia fsica. Todos os selecionados para a pesquisa afirmavam sentirem-se mais jovens do que realmente eram. E essas pessoas faziam sexo pelo menos trs vezes por semana. "Durante o ato sexual o organismo produz substncias qumicas como a endorfina que causam sensao de bem-estar e melhoram a condio do corpo e da mente", explica o neuropsiclogo David Weeks, coordenador do estudo. Estudo do tipo _________________________________ c) Alerta da pele (Revista Isto n 1537 de 17/03/1999) Quem j teve cncer de pele deve redobrar os cuidados para no ser vtima de um outro tipo de tumor. Um estudo publicado no Jornal da Associao Mdica Americana revelou que aqueles que tiveram cncer dermatolgico esto 25% a 30% mais propensos a desenvolver um outro cncer at 12 anos depois de se terem curado. Acredita-se que o tumor de pele aumente a suscetibilidade geral do organismo a novos episdios da doena. Estudo do tipo _________________________________ d) Gene da gordura (Revista Isto n 1537 de 17/03/1999) Cientistas americanos anunciaram na semana passada ter descoberto em ratos o primeiro gene que suprime a obesidade e regula a queima de calorias. Essa pode ser a chave para o desenvolvimento de uma droga para manter as pessoas em forma. Na verdade, esse o sexto gene relacionado com a obesidade, mas, de acordo com os pesquisadores, o primeiro que age no metabolismo e consegue gastar energia. Eles submeteram dois grupos de ratos a testes com alimentos gordurosos. Aqueles com uma mutao nesse gene no ganharam peso enquanto que os normais engordaram. Estudo do tipo _________________________________ e) Colesterol na medida (Revista Isto n 1536 de 10/3/1999) Nveis muito baixos de colesterol podem ser prejudiciais, afirma um estudo divulgado na semana passada, no congresso da American Heart Association. A pesquisa comparou 714 vtimas de derrame com 3.743 pessoas saudveis. Quem tinha colesterol acima de 280 estava duas vezes mais suscetvel a sofrer derrame isqumico (bloqueio de vaso sangneo). Aqueles com colesterol abaixo de 180 estavam duas vezes mais propensos a ter derrame hemorrgico. Explica-se: o colesterol ajuda na estrutura das veias e evita que elas se rompam. O ideal mant-lo no nvel mdio (200), como recomendam os rgos de sade. Estudo do tipo _________________________________ f) Efeito protetor da vacina BCG em crianas (Boletim OPAS 1986) Para avaliar o efeito protetor da vacina BCG em crianas com menos de 15 anos de idade, na cidade de Buenos Aires (Argentina), estudaram-se as crianas que receberam algum tratamento antituberculose durante o ano de 1981, tanto internados em hospitais ou tratados na forma ambulatorial. Para cada uma destas crianas, encontrou-se outra criana de mesma idade, sexo, condio scio-econmica e que tinha tido alguma doena aguda, diferente da tuberculose, no mesmo perodo e que havia sido tratada no mesmo estabelecimento. Em ambos os grupos, considerou-se como vacinados os que tinham a cicatriz correspondente vacina BCG em uma ou ambas regies deltoidianas. Estudo do tipo _________________________________
o o o

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

g) Torcida bastante eficaz (Revista Isto n 1581 de 19/01/2000) O sabor de vitria tem um efeito qumico muito mais benfico para a alma do que se acreditava. A concluso de uma equipe de pesquisadores americanos. Eles mediram o nvel de testosterona (hormnio masculino) em torcedores de futebol e basquete e constataram um aumento de 20% do hormnio quando seus times vencem (quando os times perdem h uma queda de 20%). Como o hormnio regula o humor, a sensao de bem-estar e o interesse sexual, uma dose extra de testosterona vai bem. Estudo do tipo _________________________________ h) Animais contra alergia (Revista Isto n 1569 de 27/10/1999) Brincar na fazenda, onde vivem animais como vacas, galinhas e outros bichos, diminui as chances de a criana desenvolver alergias. A constatao de pesquisadores austracos, que estudaram 2.283 crianas. Aquelas que tinham contato com animais eram trs vezes menos sensveis a problemas alrgicos e respiratrios, como a asma, do que as que vivem na zona urbana. A hiptese a de que o contato precoce com os animais aumente a tolerncia das clulas de defesa do organismo a bactrias e caros. Estudo do tipo _________________________________

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Seo 2: Anlise Descritiva e Exploratria de Dados


2.1) As Tabelas 2.1 e 2.2 mostram a Distribuio de Freqncias do nmero de erros cometidos na traduo de um texto do ingls para o portugus por 150 estudantes da escola A e 200 estudantes da escola B, respectivamente. Complete as tabelas, faa um histograma e uma ogiva para cada uma e compare os estudantes das duas escolas quanto varivel nmero de erros cometidos na traduo de um texto do ingls para o portugus. Tabela 2.1: Nmero de erros de traduo de 150 estudantes da escola A Ponto Freqncia Freqncia Freqncia Freqncia Mdio Absoluta Relativa (%) Absoluta Relativa Acumulada Acumulada (%) 10 |- 15 5 15 |- 20 57 20 |- 25 42 25 |- 30 28 30 |- 35 17 35 |- 40 1 Total 150 N de erros
o

Tabela 2.2: Nmero de erros de traduo de 200 estudantes da escola B Ponto Freqncia Freqncia Freqncia Freqncia Mdio Absoluta Relativa (%) Absoluta Relativa Acumulada Acumulada (%) 10 |- 15 4 15 |- 20 18 20 |- 25 43 25 |- 30 76 30 |- 35 43 35 |- 40 16 Total 200 Obs: lembre-se de que a ogiva deve ser feita com o limite superior de cada classe no eixo X. N de erros
o

2.2)

Num estudo sobre a associao entre tromboembolismo e tipo sangneo, participaram 200 usurias de contraceptivo oral . Dessas mulheres, 55 tinham tromboembolismo. Quanto ao grupo sanguneo, o tipo A foi o mais numeroso, com 83 mulheres, seguido dos grupos O e B, com 79 e 27 mulheres, respectivamente. Das pacientes sadias, 70 eram do grupo O, 51 do grupo A e 19 do grupo B. a) A partir dessas informaes, preencha a Tabela 2.3 abaixo (Dica: comece encontrando os totais de linha e coluna) b) Utilizando a tabela preenchida no item a), compare os dois grupos de mulheres (sadias e doentes) de forma grfica e/ou numrica. Tabela 2.3 Tromboembolismo Doente A B AB O Total Sadia

Grupo Sangneo

Total

200

2.3)

*Analisando os histogramas apresentados a seguir, comente sobre a distribuio da presso ocular e do nvel de cido rico srico. 8

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Figura 2.1

35 30

Frequncia (%)

25 20 15 10 5 0 8 12 16 20 24 28 32 36 40 44 48

Presso Ocular (mmHg)

30

Frequncia (%)

20

10

0 2.9 3.5 4.1 4.7 5.3 5.9 6.5 7.1 7.7 8.3 8.9

cido rico Srico (mg/100ml)

2.4)

*Utilizando a ogiva apresentada a seguir (Figura 2.2), estime a mediana, o primeiro e o terceiro quartis e o percentil de ordem 95. Interprete estes valores

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Ogiva para dados de Presso Intraocular


100 90 Frequncia Acumulada (%) 80 70 60 50 40 30 20 10 0 5 10 15 20 25 30 35 40 45 Presso Intraocular (mmHg)

Figura 2.2 2.5)

*O tempo (em meses) entre a remisso de uma doena e a recidiva de 48 pacientes de uma
determinada clnica mdica foi registrado. Os dados ordenados so apresentados a seguir, para homens e mulheres

Homens: Mulheres:

2 2 3 4 4 4 4 7 7 7 8 9 9 10 12

15 15 15

16

18

18

22 22 24

2 2 3 3 4 4 5 5 6 6 7 7 7 7 8 8 8 8 10 10 11 11 12 18

a) Construa o diagrama de pontos para cada sexo e comente-os. b) Construa um ramo-e-folhas para cada sexo usando 10 meses como escala e outro usando 5 meses c) Calcule a mdia, o desvio padro, a mediana e o coeficiente de variao para cada sexo. Comente essas estatsticas descritivas, comparando os grupos. d) Repita os clculos pedidos em (c) para todos os 48 pacientes, sem distino de sexo. Compare com os resultados em (c) 2.6) *A mdia do nvel de colesterol de um grupo de jovens recrutas 205 mg/dl e o desvio padro 22 mg/dl. Para um grupo de oficiais, entretanto, a mdia obtida foi 244 mg/dl e o desvio padro 45 mg/dl. Compare os dois grupos quanto homogeneidade da varivel nvel de colesterol.
*

2.7)

Considere as alturas dos cascos de uma amostra de 48 tartarugas pintadas (24 machos e 24 fmeas). Machos Fmeas 35 40 38 51 35 41 38 51 35 41 42 53 37 41 42 55 37 42 44 56 38 43 46 57 38 44 48 60 39 45 49 61 39 45 50 62 40 45 51 63 40 46 51 63 40 47 51 67

a) Complete a tabela de estatsticas descritivas para a varivel altura de casco , segundo o sexo da tartaruga. Grupo Macho Fmea Mdia 40,54 52,04 Desvio padro 3,54 8,05 Coeficiente de Variao Mediana Primeiro Quartil Terceiro Quartil

b) Construa um box-plot para as medidas de altura de casco de cada grupo (Utilize a mesma escala nos dois grficos para que eles sejam comparveis). c) Usando os resultados do item (a) e os box-plots em (b), compare os dois grupos de tartaruga pintada quanto a varivel altura do casco. 10 Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

2.8)

*Como resultado de um programa de fortificao isomtrica desenvolvido em 10 semanas, alunos da oitava srie foram avaliados em duas ocasies, antes e aps o programa, quanto a sua habilidade em executar abdominais em dois minutos. Os dados so apresentados a tabela a seguir. Quanto maior o escore, maior a habilidade do aluno em executar abdominais de dois minutos. Analise graficamente a efetividade ou no do programa isomtrico no aumento da habilidade em executar abdominais nestes alunos. (Use o grfico de disperso Antes X Depois [grfico XY] e desenhe a reta x=y). Tabela 2.4 Escores de abdominais Antes 12 10 23 25 29 32 14 17 19 20 Depois 15 9 25 25 31 30 16 20 22 22

No do aluno 1 2 3 4 5 6 7 8 9 10

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

11

Seo 3: Probabilidade
3.1) Considere um baralho com 52 cartas numeradas, 13 para cada um dos naipes (ouros, copas, espada e paus). Seja o experimento de retirar uma carta aleatoriamente, observando seu naipe, nmero e/ou cor (vermelha ou preta). Sejam os seguintes eventos: A = [a carta retirada um s]; V = [a carta retirada vermelha] e E = [a carta retirada de espada]. Calcule:

a) P(A), P(V) e P(E). b) P(A V), P(A E) e P(V E). c) P(A V), P(A E) e P(V E). d) P(A|V) . Os eventos A e V so independentes ? e) P(V|E). Os eventos V e E so independentes ? f) Suponha que voc retire do baralho, aleatoriamente, duas cartas do seguinte modo: retira uma, observa seu naipe, nmero e cor, e a coloca de volta. Em seguida, retira a segunda carta, observa seu naipe, nmero e cor, e a coloca de volta. Sejam os eventos: A1 = [a primeira carta retirada um s] e A2 = [a segunda carta retirada um s].

f.1) Sem fazer clculos, voc acha que os eventos A1 e A2 so independentes ? Ou seja, voc acha que o fato da primeira carta retirada ter sido um s altera a probabilidade de que a segunda carta seja um s ? Ento, qual o valor de P(A2|A1) ? f.2) Qual a probabilidade das duas cartas retiradas serem um s ? Ou seja, calcule P(A1 A2).

3.2)

* bem conhecido que o daltonismo hereditrio. Devido ao fato do gene responsvel ser ligado ao sexo, o daltonismo ocorre mais freqentemente nos homens do que nas mulheres. As 10.000 pessoas de uma amostra aleatria de uma populao foram classificadas de acordo com seu sexo e se sofrem ou no de daltonismo da cor vermelha-verde. Os resultados so mostrados na Tabela 3.1. Tabela 3.1 Sexo Masculino 423 4848 Feminino 65 4664 10.000

Daltonismo Presente Ausente Total

Total

Notao:

Sexo Masculino: M Sexo Feminino: F

Daltonismo Presente: D Daltonismo Ausente: D

I) Complete a Tabela 3.1. II) Uma pessoa escolhida ao acaso desta populao. Estime a probabilidade desta pessoa ser:

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

12

a) b) c) d) e) f) g) h) i) j) k) l)

Daltnica No daltnica Do sexo masculino Do sexo feminino Daltnica e do sexo masculino Daltnica e do sexo feminino No daltnica e do sexo masculino No daltnica e do sexo feminino Daltnica dado que do sexo masculino Daltnica dado que do sexo feminino No daltnica dado que do sexo masculino No daltnica dado que do sexo feminino

III) Os eventos ser daltnica e ser do sexo masculino so independentes ?

3.3)

A deteco precoce do cncer cervical crucial para o tratamento e cura da paciente. As 600 mulheres de amostra aleatria foram classificadas em um de dois grupos: com cncer ou sem cncer atravs de bipsia cervical (Tabela 3.2). Outro teste que pode ser usado no diagnstico do cncer cervical o papanicolau, mais barato e mais rpido que a bipsia cervical. Para avaliar a qualidade de diagnstico do papanicolau, as 600 mulheres mencionadas anteriormente foram submetidas a este teste. Os resultados do teste papanicolau so mostrados na Tabela 3.2 (Positivo indica que o teste classifica a paciente como portadora do cncer; negativo, caso contrrio). Assuma que o resultado da bipsia cervical certo. Tabela 3.2 Resultado do Papanicolau Positivo 94 250 344 Negativo 6 250 256

Situao da paciente Com cncer Sem cncer Total

Total 100 500 600

a) Estime a proporo de mulheres que tm cncer cervical na populao de onde foi retirada esta amostra (ou seja, a prevalncia do cncer na populao). b) Para quantas pacientes o teste papanicolau acertou o diagnstico ? c) Para quantas pacientes o teste papanicolau errou o diagnstico ? d) Qual a probabilidade do teste papanicolau ter resultado positivo dentre as pacientes que realmente tm cncer ? (Esta probabilidade chamada sensibilidade do teste) e) Qual a probabilidade do teste papanicolau ter resultado negativo dentre as pacientes que no tm cncer ? (Esta probabilidade chamada especificidade do teste) f) Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado positivo no teste papanicolau? (Esta probabilidade chamada valor de predio positiva do teste)

g) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com resultado negativo no teste papanicolau? (Esta probabilidade chamada valor de predio negativa do teste) h) Qual a probabilidade de uma paciente realmente no ter cncer dentre aquelas com resultado positivo no teste papanicolau? (Esta a proporo de falsos positivos do teste) i) Qual a probabilidade de uma paciente realmente ter cncer dentre aquelas com resultado negativo no teste papanicolau? (Esta a proporo de falsos negativos do teste)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

13

Seo 4: Avaliao da Qualidade de Testes Clnicos


4.1) No contexto da avaliao da qualidade de um teste clnico, associe as definies a seguir com: sensibilidade, especificidade, valor de predio positiva, valor de predio negativa, proporo de falsos positivos ou proporo de falsos negativos.

a) A probabilidade de um paciente com resultado positivo no estar doente. Definio de: __________________________________________

b) A probabilidade do paciente no estar doente dado que seu resultado no teste foi negativo. Definio de: __________________________________________

c) A probabilidade do resultado do teste ser negativo dentre os pacientes realmente no doentes. Definio de: __________________________________________

d) A probabilidade do paciente realmente estar doente dado que seu resultado no teste foi positivo. Definio de: __________________________________________

e) A probabilidade de um paciente com resultado negativo estar doente. Definio de: __________________________________________

f)

A probabilidade do resultado do teste ser positivo dentre os pacientes realmente doentes. Definio de: __________________________________________

4.2)

Um dos testes utilizados para detectar a doena de Aujelski em sunos, tambm conhecida como pseudo-raiva, o teste ELISA. Na tabela abaixo so apresentados os resultados deste teste para 52 sunos portadores da doena e 238 no portadores da doena. Tabela 4.1 Teste ELISA

Doena de Aujelski No doente D

Total

Doente (D) Positivo (+) Negativo (- ) Total 51 1 52

6 232 238

57 233 290

a) Calcule a sensibilidade e a especificidade do teste. b) Se a prevalncia dessa doena (na populao) de 17,9%, voc pode calcular o VPP e o VPN diretamente da tabela ? Por que ? Calcule estes ndices. c) Suponha que a prevalncia da doena seja bem menor que 17,9%. Sabendo que o tratamento da pseudo-raiva relativamente caro, qual atitude deveria ser tomada para um suno que apresentasse resultado positivo no teste ELISA ? Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG 14

4.3)

*A creatinina fosfacinase (CFC) um marcador para o diagnstico de infarto agudo do miocrdio. Pacientes com infarto agudo do miocrdio apresentam valores elevados de CFC. A tabela a seguir apresenta os valores de CFC para 360 pacientes de um hospital do corao, sendo 230 com infarto agudo do miocrdio. Considere que a prevalncia de infarto agudo do miocrdio em hospitais do corao seja igual a desse estudo.

Infarto agudo do miocrdio CFC < 80 Doente (D) No doente ( D ) Total 15 114 129

Tabela 4.2 Valores de CFC 80 CFC < 280 118 15 133 CFC 280 97 1 98

Total

230 130 360

Sejam dois testes de diagnstico de infarto agudo do miocrdio baseados no valor de CFC do paciente: Teste 1: O resultado positivo se os valores de CFC so 80 e negativo caso contrrio; Teste 2: O resultado positivo se os valores de CFC so 280 e negativo caso contrrio. a) Calcule a sensibilidade e a especificidade do Teste 1 e do Teste 2. Comente. b) Calcule o VPP, VPN, PFP e PFN do Teste 1 e do Teste 2. Comente.

4.4)

Sabe-se que o Valor de Predio Positiva (VPP) e o Valor de Predio Negativa (VPN) de um teste clnico de diagnstico de uma doena depende da Prevalncia (p) da doena na populao, da Sensibilidade (s) e da Especificidade (e) do teste. Estas relaes podem ser expressas atravs das equaes:

VPP =

sp sp + (1 e)(1 p)

VPN =
e

e(1 p) e(1 p) + (1 s) p

A Figura 4.1 mostra a relao entre VPP e Especificidade e entre VPN e Especificidade para vrios valores de Sensibilidade, mantendo-se p=0,05. Analogamente, estas mesmas relaes so mostradas Figura 4.2, com p=0,5. a) Considere as figuras 4.1(a) e 4.2(a). Para um valor fixo de prevalncia e sensibilidade, o que acontece com o VPP medida que a especificidade aumenta ?

b) Considere as figuras 4.1(b) e 4.2(b). Para um valor fixo de prevalncia e sensibilidade, o que acontece com o VPN medida que a especificidade aumenta ?

c) Considere a Figura 4.2(a), onde a prevalncia est fixada em p=0,5. i. Para um valor fixo de sensibilidade, qual , aproximadamente, o aumento que se tem no VPP quando se passa de e=0,7 para e=0,95 ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

15

ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no VPP quando se passa de s=0,7 para s=0,95 ? iii. O teste ser poderoso para confirmar a presena da doena se ele tiver PFP grande ou pequena?

iv. Suponha que se queria que o teste seja poderoso para confirmar a presena da doena em uma populao com p=0,5. Baseado na sua resposta em (iii) e comparando suas respostas em (i) e (ii), voc acha melhor trabalhar para aumentar a sensibilidade ou a especificidade do teste ? d) Considere a Figura 4.1(b), onde a prevalncia est fixa em p=0,05 i. Para um valor fixo de sensibilidade, qual , aproximadamente, o aumento que se tem no VPN quando se passa de e=0,7 para e=0,95 ? ii. Para um valor fixo de especificidade, qual , aproximadamente, o aumento que se tem no VPN quando se passa de s=0,7 para s=0,95 ? iii. O teste ser poderoso para descartar a presena da doena se ele tiver PFN grande ou pequena? iv. Suponha que se queira que o teste seja poderoso para descartar a presena da doena em uma populao com p=0,05. Baseado na sua resposta em (iii) e comparando suas respostas em (i) e (ii), voc acha melhor trabalhar para aumentar a sensibilidade ou a especificidade do teste ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

16

(a)
Prevalncia = 0,05
0,6

Figura 4.1 (b)


Prevalncia = 0,05
1

0,5 0,4 VPP 0,3


VPN 0,98 0,99 s= 0.7 s = 0.8 s = 0.9 s = 0.95 0,97

0,2 0,1 0 0,7 0,8 0,9 0,95 Especificidade

0,96 0,70

0,80

0,90

0,95

Especificidade

(a)
Prevalncia = 0,5
1

Figura 4.2 (b)

Prevalncia = 0,5
1

0,9
0,9

VPP 0,8
VPN 0,8

s= 0.7 s = 0.8 s = 0.9

0,7
0,7

s = 0.95

0,6 0,7 0,8 0,9 0,95 Especificidade

0,6 0,7 0,8 0,9 0,95 Especificidade

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

17

Seo 5: Distribuies de Probabilidade: Binomial e Poisson


5.1) *Em uma determinada populao, a probabilidade de um indivduo ter sangue Rh negativo de 0,10. Qual a probabilidade de 4 indivduos dessa populao que se apresentarem para o exame de sangue serem todos Rh negativo ?
*

5.2)

A probabilidade de que um casal com olhos azuis escuros tenha filhos com olhos azuis de . Se esse casal tiver 3 filhos, qual a probabilidade de que pelo menos 2 tenham olhos azuis?

5.3)

*Suponha que o nmero de unidades vendidas de um medicamento por dia numa rede de drogarias tenha uma distribuio de Poisson com mdia 3 ( = 3).

a) Construa o grfico para a distribuio de probabilidade do nmero de unidades vendidas desse medicamento por dia (use a tabela de Poisson). b) Calcule a probabilidade de que sejam vendidas entre 7 e 11 unidades por dia. c) Qual distribuio do nmero de unidades vendidas desse medicamento por semana ? d) Qual a probabilidade de que 100 unidades desses medicamento sejam vendidas em uma semana ?
*

5.4)

Em uma certa populao, a probabilidade de um menino ser daltnico 0,08. Num grupo de 4 meninos vindos dessa populao, qual a probabilidade de 3 no serem daltnicos ?
*

5.5)

A probabilidade de um animal sobreviver durante um experimento cirrgico 2/3. Seja X o nmero de animais que sobrevivem quando 5 animais so submetidos cirurgia.

a) Determine a distribuio de probabilidade de X. b) Determine a probabilidade de : i. Exatamente 3 animais sobreviverem ii. No mnimo 1 animal sobreviver iii. Mais de 2 animais no sobreviverem c) Se 60 animais se submeterem a essa cirurgia, espera-se que, em mdia, quantos no sobrevivam?
*

5.6)

Um produtor de sementes vende pacotes com 10 sementes cada. Os pacotes que apresentam mais de quatro sementes sem germinar sero indenizados. A probabilidade de uma semente germinar 0,8.

a) Qual a probabilidade de um pacote ser indenizado ? b) Se o produtor vende 1000 pacotes, qual o nmero esperado de pacotes indenizados ?
*

5.7)

Suponha que o nmero mdio de colnias de bactrias por 10 ml de gua de um lago seja 3.

a) Qual a probabilidade de no se achar nenhuma colnia em 10 ml de gua desse lago ? b) Qual a probabilidade de se achar pelo menos duas colnias em 10 ml de gua desse lago ? c) Qual a probabilidade de que 5 ou mais colnias sejam achadas em uma amostra de 30 ml de gua desse lago ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

18

Seo 6: Distribuies de Probabilidade: Normal


6.1) Suponha que a quantidade de ferro srico de indivduos sadios de uma populao (varivel X) tenha distribuio Normal com parmetros = 100 mcg/dl e = 25 mcg/ dl.

a) Qual o valor da quantidade mdia de ferro srico em indivduos desta populao ? E qual o valor do desvio padro da quantidade de ferro srico nesta populao ? b) Faa um esboo da curva normal X definida no enunciado, representando os intervalos simtricos em torno da mdia correspondentes s probabilidades 0,683, 0,954 e 0,997 ( ; 2; 3). c) Como a equao da varivel normal padro Z neste caso ? d) Complete o quadro a seguir: Um valor de X igual a ... 25 Corresponde a Z igual a ... P(X x ) = Um valor de X igual a ... Corresponde a Z igual a ... 3 P(X x ) =

-2 0,158655 59 -1,28 0,248252 90 117 0,4 125 1,64

0,022750

0,100273

Obs: Use duas casas decimais para Z, nenhuma para X e seis para P(X x ) e P(X x ) i. Qual a probabilidade de X assumir um valor entre 68 e 110 mcg/dl ? Se tomarmos uma amostra aleatria de 500 indivduos sadios desta populao, quantos indivduos podemos esperar que tenham quantidade de ferro srio entre 68 e 110 mcg/dl ? ii. Qual o intervalo [x1;x2] simtrico em torno da mdia, que contm 50% dos valores de X ? iii. Qual o intervalo [x3;x4] simtrico em torno da mdia, que contm 95% dos valores de X ? 6.2) *Suponha que a concentrao srica de tiroxina T4(D) em ces machos sadios tenha distribuio Normal com mdia 2,04 mcg/100ml e desvio padro 0,78 mcg/100ml.

a) Determine a probabilidade de um co macho sadio apresentar concentrao srica de tiroxina: i ii iii Inferior a 2,81 mcg/100ml Superior a 1,8 mcg/100ml Entre 1,01 e 2,50 mcg/100ml

b) Se considerarmos 200 desses ces, quantos se poderia esperar que tivessem uma concentrao srica entre 2,20 e 3,80 mcg/100ml ? c) Qual intervalo de valores, simtrico em torno da mdia, abrange 98% dos ces sadios ? 6.3) 1Os prazos de durao de gravidez tm distribuio Gaussiana com mdia de 268 dias e desvio-padro de 15 dias. Definindo como prematura uma criana que nascer com menos de 247 dias de gestao, responda :

Exerccio adaptado de Triola, M. F. (1999) - Introduo Estatstica - 7a Edio - LTC Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

19

a) Qual a porcentagem de crianas nascidas prematuramente? b) Se desejssemos mudar a definio de uma criana prematura como sendo aquela cujo o perodo de gestao est entre os 4% menores, qual seria o tempo mnimo de gestao para que uma criana no fosse considerada prematura?
1

6.4)

Os escores de Q.I. tm distribuio Gaussiana com mdia 100 pontos e desvio-padro 15 pontos. Uma organizao s admite pessoas de Q.I. elevado, para ela, maiores do que 131,5 . Com base nessas informaes, responda:

a) Escolhida uma pessoa aleatoriamente, qual a probabilidade de que ela seja admita por essa organizao? b) Definindo como gnio uma pessoa que tenha seu escore de Q.I. situado entre os 1% mais altos, qual seria o valor para o escore de Q.I. que separaria os gnios das pessoas comuns?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

20

Seo 7: Faixas de Referncia


7.1) *Um pesquisador deseja criar um padro para identificao de infeco bacteriana (pseudomonas sp) no trato respiratrio, atravs de cultura de escarro. Para isto, coletou dados de pessoas sabidamente sadias e determinou o nmero de colnias encontradas em cada cultura de escarro. Os resultados foram os seguintes:

17 22 23 23 23 23 24 24 24 24 24 24 25 25 25 25 25 25 25 26 28 28 29 30 30 31 31 35 35 35 36 40 41 41 41 42 51 54 56 56 58 60 68 79
(n = 44 pessoas;

x = 34,3 colnias por cultura de escarro; s =14,2 colnias por cultura de escarro)

a) Verifique a suposio de normalidade deste dados. b) Determine uma faixa de normalidade de 95% para o nmero de colnias de bactrias no trato respiratrio de pessoas sadias, usando: i. Mtodo dos Percentis ii. Mtodo da Curva de Gauss c) Qual dos dois mtodos o mais indicado nesse caso ? Justifique.

7.2)

Um dos parmetros hematolgicos de uso rotineiro na clnica mdica para diagnstico da anemia o valor de hemoglobina. A figura abaixo apresenta a ogiva de propores acumuladas para 1000 mulheres sadias de uma amostra, na qual o valor mdio de hemoglobina foi de 14 g/dl e o desvio padro de 2 g/dl.

a) Construa uma Faixa de Referncia de 80% para o valor de hemoglobina em mulheres sadias usando o Mtodo dos Percentis. Interprete o resultado obtido. b) A partir da interpretao da faixa de referncia calculada em a), responda: b.1) qual seria a especificidade de um mtodo de diagnstico de anemia baseado nessa faixa de referncia? b.2) qual seria a sensibilidade?

Figura 7.1Ogiva de propores acumuladas para hemoglobina (g/dl) em uma amostra de 1000 mulheres sadias

1,0 0,9

Proporo Acumulada

0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 10 15 20

Hemoglobina (g/dl)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

21

Seo 8: Intervalos de Confiana


8.1) Num estudo para descrever o perfil dos pacientes adultos atendidos no ambulatrio de um posto de sade, uma amostra de 70 pacientes adultos foi selecionada ao acaso entre o total de pacientes atendidos no posto durante os ltimos trs anos, coletando-se dos pronturios desses pacientes dados relativos idade, escolaridade e a outros fatores de interesse. Para a varivel idade, observou-se uma mdia amostral de 36,86 anos com um desvio padro amostral de 17,79 anos. Para a varivel escolaridade, observou-se que 19 pacientes da amostra eram analfabetos.

a) Defina a populao e a amostra. b) Fornea uma estimativa pontual, um intervalo de 90% de confiana e um intervalo de 95% de confiana para a idade mdia dos adultos atendidos neste ambulatrio nos ltimos trs anos. Interprete e compare os intervalos de confiana. c) Fornea uma estimativa pontual, um intervalo de 90% de confiana e um intervalo de 95% de confiana para proporo de analfabetos dentre os adultos atendidos neste ambulatrio nos ltimos trs anos. Interprete e compare os intervalos de confiana.

8.2)

A produo de leite na primeira lactao foi medida em 20 vacas selecionadas aleatoriamente dentre as vacas de uma fazenda. A produo mdia nesta amostra de 1500 litros e o desvio padro de 300 litros. Construa e interprete um intervalo de 98% de confiana para a produo mdia de leite na primeira lactao das vacas dessa fazenda.

8.3)

Considere o Intervalo de 100(1-)% Confiana para a mdia () de uma varivel com distribuio Normal e desvio-padro () conhecido :

100(1 )% + IC x z x z ; /2 /2 . n n
Note que o intervalo simtrico em torno da mdia amostral x e que, quanto menor a parcela

z / 2 n , menor ser a amplitude do intervalo.


a) Por que um intervalo com grande amplitude no til para o pesquisador fazer inferncia sobre a mdia da varivel estudada ? b) Mantendo fixos o tamanho de amostra (n) e o desvio-padro (), o que aconteceria com esta parcela se reduzirmos o nvel de confiana (100(1-)) requerido para o intervalo ? c) Mantendo fixos o tamanho de amostra (n) e o nvel de confiana (100(1-)) requerido para o intervalo, o que aconteceria com esta parcela se o desvio-padro () fosse menor ? d) Mantendo fixos o desvio-padro () e o nvel de confiana (100(1-)) requerido para o intervalo, o que aconteceria com esta parcela se o tamanho de amostra (n) fosse maior ? e) Qual(is) dos trs elementos que compem esta parcela (n, e ), o pesquisador capaz de alterar para conseguir um intervalo mais curto para a mdia da varivel estudada ? f) Caso o pesquisador queira um intervalo curto e com nvel de confiana alto (ex. 98%, 99%), o que ele deveria fazer ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

22

Seo 9: Conceitos Bsicos de Testes de Hipteses


Para cada uma das situaes abaixo, identifique: a) O parmetro que est sendo testado (mdia ou proporo); b) As hipteses nula e alternativa; c) Os erros Tipo I e Tipo II. Situao 1 - Um mtodo padro para identificao de bactrias em hemoculturas vem sendo utilizado h muitos anos e seu tempo mdio de execuo (desde a etapa de preparo das amostras at a identificao do gnero e espcie) de 40,5 horas. Um microbiologista props uma nova tcnica que ele afirma ter menor tempo de execuo que o mtodo padro. A nova tcnica foi aplicada em uma amostra de 18 hemoculturas e para cada uma mediu-se o tempo de execuo. A mdia amostral foi 39,42 horas e o desvio padro amostral foi 1,96 horas. Situao 2 - Estudos sobre mortalidade de homens com idade superior a 65 anos de uma cidade mostram que 4% deles morrem dentro de um ano. Num grupo de 1000 indivduos selecionados dessa populao, 60 morreram no perodo de um ano. Suspeita-se de que houve um aumento da mortalidade anual nessa populao. Situao 3 - Um restaurante compra frangos abatidos inteiros com peso mdio de 3 quilos h vrios anos de um fornecedor. Outro fornecedor prope ao gerente do restaurante vender frangos com peso mdio maior que 3 quilos ao mesmo preo do fornecedor antigo. Antes de mudar de fornecedor, o gerente do restaurante decidiu comprar 25 frangos do novo fornecedor e pes-los. Encontrou um peso mdio de 3,2 quilos com um desvio padro de 0,4 quilos. Situao 4 - Uma indstria farmacutica especifica que em certo analgsico a quantidade mdia de cido acetil saliclico deve ser 5,5 gramas por comprimido. A indstria suspeita que houve problemas na produo de um determinado lote e que, nesse lote, a quantidade mdia dessa substncia est diferente da especificada. Para verificar essa suspeita, a indstria selecionou uma amostra aleatria de 40 comprimidos desse lote, observando uma quantidade mdia de cido acetil saliclico igual a 5,2 gramas e um desvio padro de 0,7 gramas. Situao 5 - Um vendedor de sementes de milho garantiu a um agricultor que a proporo de sementes de sua marca que realmente chegam a germinar 95%. O agricultor desconfia que na verdade esta proporo menor do que a anunciada pelo vendedor. Antes de efetuar uma grande compra, o agricultor comprou um pacote com 1000 sementes e plantou, observando mais tarde que 940 sementes germinaram.

Seo 10: Testes de Hipteses para Uma Populao


10.1) Para cada uma das situaes descritas na Seo 9, responda as questes abaixo, utilizando: a) Mtodo Tradicional de Teste de Hipteses ; b) Mtodo do Valor P; c) Mtodo do Intervalo de Confiana, quando for adequado. Utilize um nvel de significncia =0,05. Situao 1 - A nova tcnica reduz o tempo para identificao de bactrias ? Situao 2 - Existe evidncia de que houve um aumento da mortalidade anual nesta populao ? Situao 3 - A afirmao do novo fornecedor confirmada pelos dados coletados pelo gerente ? Situao 4 - Os dados confirmam a suspeita da indstria ? Situao 5 - O resultado do experimento do agricultor confirma sua desconfiana ?

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

23

Seo 11: Testes de Hipteses para Duas Populaes


11.1) Como resultado de um programa de fortificao isomtrica desenvolvido em 10 semanas, alunos da oitava srie foram avaliados em duas ocasies, antes e aps o programa, quanto a sua habilidade em executar abdominais em dois minutos. Os dados so apresentados a tabela abaixo. Quanto maior o escore, maior a habilidade do aluno em executar abdominais de dois minutos. Tabela 11.1 Escores de abdominais Antes 12 10 23 25 29 32 14 17 19 20 Depois 15 9 25 25 31 30 16 20 22 22

No do aluno 1 2 3 4 5 6 7 8 9 10

a) Faa um teste de hipteses (ao nvel de significncia = 5%) para verificar se o programa de fortificao isomtrica aumenta a habilidade em executar abdominais em dois minutos. (Dica: tome a diferena de depois-antes e teste se depois > antes ) b) Calcule o valor p do teste de hipteses acima. Como voc chegaria concluso do teste do item (a) usando a informao do valor p ? c) Construa e interprete um Intervalo de 95% de Confiana para a diferena entre a habilidade mdia depois do programa e a habilidade mdia antes do programa.

11.2) *Em um experimento, dois grupos de ratos fmeas foram alimentados com dietas apresentando alto e baixo contedo de protena. O quadro abaixo fornece, para cada rato, o ganho de peso, o o em gramas, entre o 28 e o 84 dia de vida.

Contedo de protena Alto Baixo

Ganho de peso 123 134 146 104 119 124 161 107 83 113 129 97 70 118 101 85 107 132 94

a) Ao nvel de significncia de 1%, h evidncia estatstica de que a dieta com alto contedo de protena aumenta o ganho de peso? b) Calcule o valor P e use-o para responder pergunta do item (a). c) Construa e interprete um intervalo de 95% de confiana para a diferena entre os ganhos mdios de peso com as dietas de alto e baixo contedo de protena.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

24

11.3) *Em um estudo sobre a influncia do uso de cocana no peso de crianas nascidas de mes dependentes, pesquisadores trabalharam com dois grupos de crianas nascidas a termo: o primeiro grupo era composto de mes que usaram regularmente a droga durante toda a gravidez (Grupo I) e o segundo, de mes que no tinham histria ou evidncia de uso de cocana (Grupo II). A hiptese dos pesquisadores era de que o peso mdio de crianas de mes dependentes menor do que o peso mdio de crianas de mes no-dependentes. Os resultados so apresentados abaixo:.

Grupo I II

Tamanho da amostra 36 39

Peso mdio (g) 2829 3436

Desvio padro (g) 708 628

Fonte: Chanoff, I. J. et al. (1989) Temporal patterns of cocaine use in pregnancy - perinatal outcome, JAMA, maro.

a) Usando um nvel de significncia igual a 5%, teste a hiptese dos pesquisadores. (Para isso, estabeleas as hipteses nula e alternativa adequadas, construa a regio de rejeio, calcule o valor da estatstica de teste e conclua). b) Calcule o Valor P do teste. Use o Valor P obtido para responder questo formulada no enunciado do problema, com nvel de significncia de 1%.

11.4) *Em um estudo publicado no Canadian Medical Association Journal em novembro de 1972, procurou-se investigar o efeito do uso da vitamina C na preveno de resfriados. Para isso, realizou-se o seguinte experimento: por um determinado perodo de tempo, 407 indivduos tomaram fortes doses de vitamina C e 411 receberam placebo. No grupo da vitamina, 105 participantes ficaram livres de doenas do trato respiratrio, enquanto, no grupo placebo, esse nmero foi de apenas 76 participantes. O que os pesquisadores puderam concluir? (Use = 0,05 e calcule o Valor P)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

25

11.5) Em um estudo para determinar se o tratamento com estrognio e progestina altera o risco de eventos de doena coronariana (DC) em mulheres na ps-menopausa com doena coronariana estabelecida, um total de 2.763 destas mulheres foram divididas aleatoriamente em dois grupos: 1.380 fizeram uso desses hormnios e o restante fez uso de um placebo. A Figura 11.1 mostra os resultados publicados na edio brasileira do Journal of American Medical Association em setembro de 1999. Para cada desfecho considerado nas linhas da tabela, corresponde, na ltima coluna, o Valor P do teste: H0: O desfecho no est associado ao uso dos hormnios; H1: O desfecho est associado ao uso dos hormnios. Analisando o Valor P, quais os desfechos podem ser considerados associados ao uso de reposio hormonal, ao nvel de significncia de 5% ?

Figura 11.1

Fonte: JAMABrasil, set 1999, v.3, n. 8

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

26

Seo 12: Teste Qui-Quadrado


12.1) Desejando-se verificar se duas vacinas contra brucelose (uma padro e um nova) so igualmente eficazes, pesquisadores realizaram o seguinte experimento: um grupo de 14 bezerras tomou a vacina padro e outro grupo de 16 bezerras tomou a vacina nova. Considerando que os dois grupos estavam igualmente expostos ao risco de contrair a doena, aps algum tempo, verificou-se quantos animais, em cada grupo, havia contrado a doena. Os resultados esto na Tabela 12.1.

Vacina Padro Nova Total

Tabela 12.1 Brucelose Sim 10 5 15 No 4 11 15

Total 14 16 30

Existe diferena estatisticamente significativa entre as propores de bezerras que contraram brucelose usando a nova vacina e a vacina padro? (Use o teste Qui-Quadrado, com nvel de significncia de 5%, e calcule o valor P).

12.2) *Com o objetivo de examinar a existncia do efeito de determinado fertilizante na incidncia da Bacterium phithotherum em plantao de batatas, foi realizado o seguinte experimento: ps de batata tratados com diferentes fertilizantes foram classificados, ao final do estudo, como contaminados ou livres de contaminao. Os resultados esto na Tabela 12.2.

Fertilizante Nenhum Nitrognio Esterco Nitrognio e Esterco Total

Tabela 12.2 Contaminao Sim 16 10 4 14 44 No 85 85 109 127 406

Total 101 95 113 141 450

Existe efeito de fertilizante na incidncia desse tipo de bactria nas plantaes de batata? (Use o teste QuiQuadrado, com nvel de significncia de 5%, e calcule o valor P).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

27

12.3) Pesquisadores de doenas parasitrias em animais de grande porte suspeitam que a incidncia de certos parasitas esteja associada raa do animal, pura ou no-pura. Num estudo para verificar essa suspeita, 1200 animais selecionados aleatoriamente de uma grande fazenda foram classificados segundo sua raa e incidncia de parasitose (berne), dando origem aos dados na Tabela 12.3.

Raa Pura No-pura Total

Tabela 12.3 Incidncia de parasitas Sim 105 50 155 No 595 450 1045

Total 700 500 1200

Existem evidncias estatsticas suficientes nesses dados para verificar a hiptese de que a raa do animal e a incidncia de parasitas estejam associadas ? (Use nvel de significncia igual a 1% e calcule o valor P).

12.4)

Num estudo da associao entre a ocorrncia de tromboembolismo e grupo sanguneo, 200 mulheres usurias de contraceptivo oral foram classificadas quanto presena de tromboembolismo (doente ou sadia) e quanto ao grupo sangneo (A, B, AB ou O). Os resultados dessa classificao foram reproduzidos na Tabela 12.4 Tabela 12.4 Tromboembolismo Doente 32 8 7 9 56 Sadia 47 19 14 64 144

Grupo Sangneo A B AB O Total

Total 79 27 21 73 200

Existem evidncias estatsticas suficientes nesses dados para verificar a hiptese de que a presena do tromboembolismo e o grupo sanguneo estejam associados ? (Use nvel de significncia igual a 1% e calcule o valor P).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

28

Segunda Parte: Resoluo dos Exerccios

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

29

ndice

Seo 1: Seo 2: Seo 3: Seo 4: Seo 5: Seo 6: Seo 7: Seo 8: Seo 9: Seo 10: Seo 11: Seo 12:

Tipos de Estudos e Variveis Anlise Descritiva e Exploratria de Dados Probabilidade Avaliao da Qualidade de Testes Clnicos Distribuies de Probabilidade: Binomial e Poisson Distribuies de Probabilidade: Normal Faixas de Referncia Intervalos de Confiana Conceitos Bsicos de Testes de Hipteses Testes de Hipteses para Uma Populao Testes de Hipteses para Duas Populaes Teste Qui-Quadrado

31 33 41 44 47 51 57 60 63 65 68 72

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

30

Seo 1: Tipos de Estudos e Variveis


Exerccio (1.1)
a) Qualitativa e Nominal b) Quantitativa e Discreta c) Quantitativa e Contnua d) Qualitativa e Nominal e) Quantitativa e Contnua f) Quantitativa e Discreta

Exerccio (1.2)
a) Estudo do tipo experimental. Varivel resposta: Grupos comparados: Alguma medida da disfuno ertil. - Grupo Tratamento, formado pelos pacientes que tomaram Viagra; - Grupo Controle, formado pelos pacientes que tomaram placebo.

b) Estudo do tipo observacional. Varivel resposta: Sensao de ter aparncia fsica mais jovem do que a realidade.

Na verdade, no comparam grupos, apenas estudaram quem tinha vida sexual intensa dentre os que tinham a varivel resposta positiva (sentiam-se jovens). O que deveria ter sido feito era entrevistar dois grupos: pessoas com vida sexual intensa e pessoas com vida sexual fraca. Para cada grupo, classificar os componentes em pessoas que sentem-se jovens e pessoas que no se sentem jovens. Finalmente, verificar se h (ou no) maior proporo de pessoas que sentem-se jovens dentre os de vida sexual intensa do que entre aquelas de vida sexual fraca.

c) Estudo do tipo observacional. Varivel resposta: Grupos comparados: Ocorrncia de algum tumor no dermatolgico. - Pessoas que tiveram cncer dermatolgico; - Pessoas que no tiveram cncer dermatolgico.

d) Estudo do tipo experimental, se a mutao no gene foi feita no laboratrio; Estudo do tipo observacional, caso contrrio. Varivel resposta: Grupos comparados: Ganho de peso - Ratos com mutao no tal gene; - Ratos sem mutao no tal gene.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

31

e) Estudo do tipo observacional. Para a varivel resposta ocorrncia de derrame isqumico, temos a comparao entre os seguintes grupos: Pessoas com nvel de colesterol acima de 280; Pessoas com nvel de colesterol abaixo de 280.

Para a varivel resposta ocorrncia de derrame hemorrgico temos a comparao entre os seguintes grupos: f) Pessoas com nvel de colesterol abaixo de 180; Pessoas com nvel de colesterol acima de 180.

Estudo do tipo observacional. Varivel resposta: Grupos comparados: Ocorrncia de tuberculose - Crianas com a marca da vacina BCG; - Crianas sem a marca da vacina BCG .

g) Estudo do tipo observacional. Varivel resposta: Grupos comparados: Nvel de testosterona - Torcedores de futebol e basquete quando seus times ganharam; - Torcedores de futebol e basquete quando seus times perderam;

h) Estudo do tipo observacional. Varivel resposta: Grupos comparados: Ocorrncia de problemas respiratrios e/ou alergias. - Crianas que tinham contato com animais; - Crianas que viviam na zona urbana.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

32

Seo 2: Anlise Descritiva e Exploratria de Dados


Exerccio (2.1)
Tabela 2.1: Nmero de erros de traduo de 150 estudantes da escola A Freqncia Freqncia o N de Ponto Freqncia Freqncia Absoluta Relativa erros Mdio Absoluta Relativa (%) Acumulada Acumulada (%) 10 |- 15 12,5 5 3,33 5 3,33 15 |- 20 17,5 57 38,00 62 41,33 20 |- 25 22,5 42 28,00 104 69,33 25 |- 30 27,5 28 18,67 132 88,00 30 |- 35 32,5 17 11,33 149 99,33 35 |- 40 37,5 1 0,67 150 100,00 Total 150 100,00 -----------

Tabela 2.2: Nmero de erros de traduo de 200 estudantes da escola B Freqncia Freqncia o N de Ponto Freqncia Freqncia Absoluta Relativa erros Mdio Absoluta Relativa (%) Acumulada Acumulada (%) 10 |- 15 12,5 4 2,00 4 2,00 15 |- 20 17,5 18 9,00 22 11,00 20 |- 25 22,5 43 21,50 65 32,50 25 |- 30 27,5 76 38,00 141 70,50 30 |- 35 32,5 43 21,50 184 92,00 35 |- 40 37,5 16 8,00 200 100,00 Total 200 100,00 ----------

Observao: a soma da coluna Frequncia Relativa (%) tem que ser 100,00 . No entanto, por causa de arredondamentos, algumas vezes os valores dessa coluna somaro 100,01 (ou 99,99). Para corrigir o problema, podemos subtrair (ou somar) 0,01 frequncia relativa da classe com maior frequncia. A mesma observao vale para quando estivermos usando somente uma casa decimal aps a vrgula. Nesse caso, o total da coluna Frequncia Relativa (%) tem que ser 100,0 e, se ocorrer o problema, a correo pode ser feita subtraindo-se (ou somando-se) 0,1 frequncia relativa da classe com maior frequncia.

Como podemos notar pela anlise dos histogramas a seguir, a distribuio de frequncia dos erros de digitao da Escola A assimtrica com concentrao esquerda, enquanto a distribuio de frequncia dos erros de digitao da Escola B razoavelmente simtrica em torno da classe 25 a 30 erros. A assimetria com concentrao esquerda dos dados da Escola A tambm pode ser percebida atravs da sua ogiva, que cresce mais rpido do que a ogiva da Escola B, que tem distribuio simtrica. Atravs desses grficos, podemos observar que os alunos da Escola A tendem a errar menos do que os alunos do que os alunos a Escola B.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

33

Escola A
40 40

Escola B

Frequncia (%)

20

Frequncia (%)
10 15 20 25 30 35 40

30

30

20

10

10

0 10 15 20 25 30 35 40

Nmero de Erros

Nmero de Erros

Ogiva para a Escola A


100 Frequncia (%) Acumulada 80 60 40 20 0 5 10 15 20 25 30 35 40 Frequncia (%) Acumulada 100 80 60 40 20 0 5

Ogiva para a Escola B

10

15

20

25

30

35

40

Nm ero de erros

Nm ero de Erros

Observao 1: Como gostaramos de comparar as duas escolas, os histogramas e as ogivas foram feitos usando a frequncia relativa, pois os tamanhos das amostras so diferentes. Se os tamanhos das amostras fossem iguais, a frequncia absoluta poderia ser usada, embora o uso da frequncia relativa torna os grficos mais, digamos, teis, pois eles podero ser comparados com outros que tambm usem a frequncia relativa, mesmo que as amostras sejam de tamanhos diferentes. Observao 2: O primeiro ponto na ogiva deve ser o limite inferior da primeira classe, que corresponde frequncia acumulada igual a 0, ou seja, abaixo desse limite no existe nenhum dado.

Exerccio (2.2)
a) Grupo Sangneo A B AB O Total Tabela 2.3 Tromboembolismo Doente Sadia 32 51 8 19 6 5 9 70 55 145 Total 83 27 11 79 200

Percebe-se que grande parte das pessoas nesse estudo sadia (72,5%). Como as variveis em questo (presena de tromboembolismo e grupo sanguneo) so do tipo qualitativas, poderemos usar os grficos de colunas (barras) ou de setores (torta) para representar esses dados. O grfico abaixo revela que a maioria dos pacientes da amostra tem o sangue do tipo A, seguido pelas pessoas de sangue tipo O e tipo B, sendo que a minoria tem o sangue do tipo AB. 34 Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Distribuio dos pacientes segundo grupo sanguneo

39%

41%

A B AB O

6%

14%

O grfico a seguir representa a frequncia relativa da doena dentro de cada grupo sanguneo. A frequncia relativa tem que ser usada porque os grupos de sangue tm tamanhos diferentes. Usamos o grfico de colunas por ser de melhor visualizao, nesse caso em que temos 4 categorias (os tipos sanguneos), ao invs de usarmos quatro grficos de setores.

frequencia relativa (%)

100 80 60 40 20 0 A B AB O grupo sanguneo Doente Sadio

Pela tabela do exerccio, temos que os pacientes sadios representam a maioria (72,5%) dos 200 pacientes amostrados. No grfico acima, podemos observar que, nos grupos sanguneos A, B e O, essa maioria se mantm, embora em propores diferentes (no grupo O, por exemplo, em torno de 90% das pessoas so sadias). No entanto, no grupo AB, essas propores se invertem, sendo as pessoas doentes mais frequentes. Isso pode ser um indcio de que a distribuio de frequncias do estado do paciente depende do tipo sanguneo, ou seja, de que as variveis tipo sanguneo e presena de tromboembolismo podem estar associadas. Esses conceitos sero melhor elaborados mais adiante, quando tratarmos de independncia de eventos e associao de variveis.

Exerccio (2.3)
Os valores de presso intraocular tm distribuio de frequncias assimtrica com concentrao esquerda. Isso significa que a maioria das pessoas avaliadas possui valores pequenos para a presso intraocular e algumas poucas pessoas possuem valores mais altos. J os valores de cido rico srico tm distribuio de frequncias que pode ser considerada simtrica em torno do valores de 5,3 a 5,9 mg/100ml. Isto , a maioria das pessoas possui medidas de cido rico srico em torno desses valores, que podem ser considerados tpicos. Algumas poucas pessoas possuem valores mais altos (cauda direita do histograma) e outras poucas pessoas possuem valores mais baixos (cauda esquerda). Essa questo dos valores que podem ser considerados tpicos ser melhor discutida mais adiante quando tratarmos do conceito e construo das Faixas de Referncias . 35

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

Exerccio (2.4)
Queremos encontrar a mediana, que o valor que deixa 50% dos dados abaixo dela. Essa tambm a definio do percentil de ordem 50. O primeiro quartil o valor que deixa um quarto dos dados (25%) abaixo dele e, portanto, o percentil de ordem 25. O terceiro quartil o valor que deixa trs quartos dos dados (75%) abaixo dele e, portanto, o percentil de ordem 75. O percentil de ordem 90 o valor que deixa 90% dos dados abaixo dele. O clculo de percentis atravs da ogiva aproximado, pois os dados foram agrupados para que o ogiva pudesse ser construda. Para encontrar o percentil de ordem 50, por exemplo, devemos traar no grfico, a partir do valor 50 no eixo das frequncias acumuladas, uma reta paralela ao eixo dos valores (eixo X) at que essa reta encontre a curva (veja no grfico). No ponto em que a primeira reta encontrar a curva, devemos traar uma outra reta, agora vertical, paralela ao eixo das frequncias (eixo Y), at que essa reta encontre o eixo dos valores (eixo X). O ponto em que essa segunda reta encontrar o eixo X ser o percentil de ordem 50. No grfico, ele aproximadamente o valor 19,0. Usamos o mesmo raciocnio para encontrar qualquer outro percentil. No grfico, tambm esto ilustrados os procedimentos para encontrar os valores dos percentis de ordem 25, 75 e 90 (P25, P75 e P90, respectivamente). Os valores aproximados para esses percentis so P25 igual a 16,5 , P75 igual a 22,5 e P95 igual a 34,5.

Ogiva para dados de Presso Intraocular


100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 5 10 15

Frequncia Acumulada (%)

P50 (mediana) P75(Q3) P95

P25(Q2)

20

25

30

35

40

45

Presso Intraocular (mmHg)

Observe que o primeiro e o terceiro quartis (que deixam a mesma porcentagem de dados, 25%, abaixo e acima deles, respectivamente) esto praticamente mesma distncia da mediana. Isso um ndicio de que a distribuio desses dados de presso intraocular pode ser considerada simtrica. Outro indcio de simetria que o percentil de ordem 5 (calcule!!!) e percentil de ordem 95 (que deixam a mesma porcentagem de dados, 5%, abaixo e acima deles, respectivamente) tambm esto praticamente mesma distncia da mediana.

Exerccio (2.5)
a) Diagrama de Pontos para os Tempos entre a Remisso e a Recidiva de uma Doena (em meses)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

36

: . . : .: :. :. . :. : : . -----+---------+---------+---------+---------+---------+- Homens :: : :: :: :: : :. . -----+---------+---------+---------+---------+---------+- Mulheres


4,0 8,0 12,0 16,0 20,0 24,0

O grupo de mulheres tem, em geral, tempos entre a remisso e a recidiva dessa doena menores do que os dos homens , sendo esses tempos mais homogneos no grupo feminino do que no grupo masculino. b) Ramo-e-folhas usando escala de 10 meses Homens 0 | 2234444777899 0 | 223344556677778888 1 | 02555688 1 | 001128 2 | 224 Legenda: 0|2 : leia-se 2 meses

Ramo-e-folhas usando escala de 5 meses Homens 0 | 2234444 0 | 777899 1 | 02 1 | 555688 2 | 224 0 | 223344 0 | 556677778888 1 | 00112 1|8 Legenda: 0|2 : leia-se 2 meses

Comentrio: Atravs do ramo-e-folhas com escala de 10 meses, a distribuio de frequncias dos tempos nos dois grupos poderiam ser consideradas assimtricas com concentrao esquerda. No entanto, o ramo-efolhas com escala mais refinada (5 meses) permite um melhor detalhamento da distribuio dos tempos nos dois grupos. A distribuio dos tempos no grupo feminino ainda pode ser considerado assimtrico com concentrao esquerda. Porm, a anlise do ramo-e-folhas do grupo masculino nos revela que o grupo dos homens parece ser a unio de dois grupos : um, que tem tempos baixose, outro grupo que tem tempos altos. O ponto de corte para a definio de um tempo baixo ou alto ficaria a critrio do pesquisador, mas poderia ser, por exemplo, 12 meses. Essa subdiviso do grupo masculino tambm pode ser notada no diagrama de pontos, embora de maneira mais sutil. A escolha da escala a ser usado num grfico deve ser guiada pelo bom senso: nem muito grande, o que tornaria a representao grosseira; nem muito pequena, o que diminuiria o poder de resumo da representao grfica.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

37

c) Grupo Homens Mulheres Mdia 10,71 7,17 Mediana 9,00 7,00 Desvio-padro 6,82 3,67 Coeficiente de Variao 0,64 0,51

Os homens possuem tempos entre a remisso e a recidiva da doena maiores, em mdia e em mediana, do que os tempos das mulheres. A anlise do coeficiente de variao confirma o que j havamos observado no diagrama de pontos: o grupo feminino possui tempos mais homogneos (C.V. menor) do que o grupo masculino. d) Grupo Todos Mdia 8,94 Mediana 7,5 Desvio-padro 5,71 Coeficiente de Variao 0,64

Exerccio (2.6)
Para comparar a homogeneidade de dois grupos com mdias diferentes, precisamos calcular o coeficiente de variao, que uma medida de variabilidade que considera a escala em que a varivel est sendo medida. Coeficiente de variao no grupo de recrutas: Coeficiente de variao no grupo de oficiais: 22/205 = 0,11 45/244 = 0,18

O grupo de oficiais, alm de ter um nvel mdio de colesterol maior do que o nvel mdio dos recrutas, tambm um grupo mais heterogneo com respeito a essa varivel (C.V. maior do que o dos recrutas). Lembrando que o nvel de colesterol de um indivduo est relacionado tambm ao seu grau de sedentarismo, a maior heterogeneidade do nvel de colesterol entre os oficiais pode ser explicada pela diversidade de funes que esses oficiais desempenham , podendo implicar em maior ou menor sedentarismo. J os jovens recrutas passam por constantes treinamentos e exerccios, o que diminui a heterogeneidade entre eles desse importante fator associado ao nvel de colesterol.

Exerccio (2.7)
a) Grupo Macho Fmea Mdia 40,54 52,04 Desvio padro 3,54 8,05 Coeficiente de Variao 0,09 0,15 Mediana 40,00 51,00 Primeiro Quartil 38,00 47,00 Terceiro Quartil 43,50 58,50 P10 35 42

Exemplos de clculo dos percentis: Clculo do 1 quartil (grupo das tartarugas machos): o o o 0,25 x 24 = 6 (nmero inteiro). O 1 quartil est o 6 valor e o 7 valor, os nmeros 38 e 38, respectivamente. Tomaremos a mdia desses valores, que o prprio 38. Clculo do 3 quartil (grupo das tartarugas fmeas): o o o 075 x 24 = 18 (nmero inteiro). O 3 quartil est o 18 valor e o 19 valor, os nmeros 57 e 60, respectivamente. Tomaremos a mdia desses valores, que 58,50.
o o

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

38

Clculo do Percentil de ordem 10 (grupo das tartarugas fmeas): o 0,10 x 24 = 2,4 (nmero fracionrioarredondar para cima) O percentil de ordem 10 o 3 valor, o nmero 42. (isto significa que aproximadamente 10% das tartarugas fmeas possuem cascos com alturas inferiores ou iguais a 42). Clculo do Percentil de ordem 90 (grupo das tartarugas fmeas): o 0,90 x 24 = 21,6 (nmero fracionrioarredondar para cima) O percentil de ordem 90 o 22 valor, o nmero 63 (isto significa que aproximadamente 90% das tartarugas fmeas possuem cascos com alturas inferiores ou iguais a 63.

Observao: existem vrios mtodos para o clculo de percentis e todos resultaro em valores aproximados. O mtodo apresentado acima o mais simples de todos.

b)

c) As fmeas tm, em geral, cascos mais altos que os machos, pois os valores da mdia e da mediana so maiores para as fmeas. Isto tambm pode ser visto nos box-plots, onde a maior parte das medidas das fmeas encontram-se acima das medidas dos machos: o terceiro quartil dos machos menor que o primeiro quartil das fmeas. Alm disso, os box-plots mostram que a altura do casco bem mais varivel para as fmeas do que para os machos (a largura da caixa maior para as fmeas), o que confirmado comparando-se os coeficientes de variao. O grupo de fmeas menos homogneo quanto altura do casco.
35 45 55 65

Grupo

Grupo 1: macho Grupo 2: fmea

Altura do casco

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

39

Exerccio (2.8)
No grfico abaixo, verificamos que a habilidade aumenta aps o programa de fortificao para a maioria dos alunos (pontos acima da linha x=y). Para apenas trs deles, a habilidade igual ou menor aps o programa. Portanto, o programa se mostrou eficaz para a maioria dos alunos. Note que os pontos tendem a se posicionar ao longo de uma linha reta (no caso, a linha x=y).

Grfico de Disperso

Esc ores de abdominais antes e depois do programa


(Linha x=y) 5 30 3 9 10 4

Depois

20 1 7

10

10

20

30

Antes

Algumas consideraes sobre o relacionamento entre variveis quantitativas : no problema acima, dizemos que os escores antes e depois do programa esto linearmente correlacionados. O Diagrama de Disperso um modo de visualizar essa correlao. Para medir o grau de correlao, usa-se o Coeficiente de Correlao Linear, que um nmero entre -1 e 1. Um coeficiente de correlao positivo (> 0) acontece se a relao entre as duas variveis do tipo: quando o valor de uma varivel aumenta, o valor da outra aumenta tambm; ou, quando o valor de uma varivel diminui, o valor da outra tambm diminui. J um coeficiente de correlao negativo (< 0) acontece se a relao entre as duas variveis do tipo: quando o valor de uma varivel aumenta, o valor da outra diminui; ou vice-versa. Um coeficiente de correlao linear igual a zero significa que as duas variveis no possuem nenhuma correlao do tipo linear, mas podem estar relacionadas de uma maneira no linear (quadrtica, por exemplo). Isso poder ser percebido atravs do exame do Diagrama de Disperso. Assim, o Coeficiente de Correlao Linear e o Diagrama de Disperso so ferramentas que devem ser usadas conjuntamente. Para mais detalhes sobre correlao, veja Soares, J. F. e colegas (Introduo Estatstica) e tambm Triola, M. F. (Introduo Estatstica, Editora LTC) . O coeficiente de correlao entre os escores antes e depois nesse exerccio de 0,97, indicando uma forte correlao positiva entre as medidas antes e depois do programa de fortificao isomtrica.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

40

Seo 3: Probabilidade
Exerccio (3.1)
g) Existem quatro ases em um baralho de 52 cartas. Assim P(A) = 4/52 = 1/13. Metade as cartas (as de naipe ouros e copas) so vermelhas. Assim, P(V) = 26/52 = 1/2. Cada naipe tem 13 cartas. Assim, P(E) = 13/52 = 1/4. h) H duas cartas que so, ao mesmo tempo, ases e vermelhas (s de ouros e s de copas). Assim, P(A V) = 2/52 = 1/26. H somente uma carta que , ao mesmo tempo, s e de espada. Assim, P(A E) = 1/52. Nenhuma carta , ao mesmo tempo, vermelha e de espada. Assim, P(V E) = 0, ou seja, os eventos V e E so mutuamente exclusivos. i) P(A V) = P(A) + P(V) - P(A V) = 1/13 + 1/2 + 1/26 = (2 + 13 + 1)/26 = 16/26 = 8/13. P(A E) = P(A) + P(E) - P(A E) = 1/13 + 1/4 - 1/52 = (4 + 13 +1)/52 = 18/52 = 9/26. P(V E) = P(V) + P(E) - P(V E) = 1/2 + 1/4 - 0 = (2+1)/4 = 3/4. P(A|V) = P(A V)/P(V) = (1/26)/(1/2) = 1/13. Ou seja, como, das 26 cartas vermelhas, duas so ases, ento P(A|V) = 2/26 = 1/13. Como P(A|V) = P(A), os eventos A e V so independentes.

j)

k) P(V|E) = P(V E)/P(E) = 0/(1/4) = 0. Ou seja, como nenhuma carta de espada vermelha, ento P(V|E) = 0. Como P(V|E) P(V), os eventos V e E no so independentes. f.1) O fato da primeira carta retirada ter sido um s no altera a probabilidade de que a segunda carta seja um s, pois a primeira carta foi devolvida ao baralho, tornando, assim, a segunda retirada um experimento idntico quele da primeira retirada. Ento, os eventos A1 e A2 so independentes: P(A2|A1) = P(A2) = 4/52 = 1/13. f.2) Como os eventos A1 e A2 so independentes, P(A1 A2) = P(A1) x P(A2) = 1/13 x 1/13 = 1/169.

Exerccio (3.2)
Tabela 3.1 Sexo Daltonismo Presente Ausente Total Masculino 423 4848 5271 Feminino 65 4664 4729 Total 488 9512 10.000

Sejam os eventos:

D= ND = M= F =

{a pessoa escolhida Daltnica} {a pessoa escolhida No Daltnica} {a pessoa escolhida do sexo Masculino} {a pessoa escolhida do sexo Feminino}

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

41

Item (I)

a) b) c) d) e) f) g) h) i) j)

P(D) = 488/10.000 = 0,0488 P(ND) = 9512/10.000 = 0,9512 P(M) = 5271/10.000 = 0,5271 P(F) = 4729/10.000 = 0,4729 P(DM) = 423/10.000 = 0,0423 P(DF) = 65/10.000 = 0,0065 P(NDM) = 4848/10.000 = 0,4848 P(NDF) = 4664/10.000 = 0,4664 P(D|M) = P(DM)/ P(M) = 0,0423/0,5271 = 0,0803 P(D|F) = P(DF)/ P(F) = 0,0065/0,4729 = 0,0137

Observe que P(D) + P(ND) = 1

Observe que P(M) + P(F) = 1

Observe que: P(DM) + P(DF) + + P(NDM) + P(NDF) = 1

Observe que: P(D|M) + P(ND|M) = 1

k) P(ND|M) = P(NDM)/ P(M) = 0,4848/0,5271 = 0,9197 l) P(ND|F) = P(NDF)/ P(F) = 0,4664/0,4729 = 0,9863

P(D|F) + P(ND|F) = 1

Item (II) P(D) = 0,0488 P(D|M) = 0,0803 P(D) Portanto, os eventos ser daltnica e ser do sexo masculino no so independentes

Exerccio (3.3)
Tabela 3.2 Resultado do Papanicolau Total Positivo 94 250 344 Negativo 6 250 256 100 500 600

Situao da paciente Com cncer Sem cncer Total

Sejam os eventos: C = {ter cncer} S = {no ter cncer} P= {teste papanicolau positivo} N = {teste papanicolau negativo}

a) Prevalncia do cncer = 100/600 = 0,1617

b) (Pessoas com cncer e teste positivo) + (Pessoas sem cncer e teste negativo) = 94 + 250 = 344 c) (Pessoas com cncer e teste negativo) + (Pessoas sem cncer e teste positivo) = 6 + 250 = 256

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

42

d) Sensibilidade: P(P|C) = 94/100 = 0,94 e) Especificidade: P(N|S) = 250/500 = 0,50

f)

Valor de Predio Positiva:

P(C|P) = 94/344 = 0,27

g) Valor de Predio Negativa: P(S|N) = 250/256 = 0,98

h) Proporo de Falsos Positivos: i) Proporo de Falsos Negativos:

P(S|P) = 250/344 = 0,73 P(C|N) = 6/256 = 0,02

Observe que:

Valor de Predio Positiva + Proporo de Falsos Positivos

=1

Valor de Predio Negativa + Proporo de Falsos Negativos = 1

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

43

Seo 4: Avaliao da Qualidade de Testes Clnicos


Exerccio (4.1)
a) Proporo de falsos positivos: b) Valor de Predio Negativa: c) Especificidade: d) Valor de Predio Positiva: e) Proporo de falsos negativos: f) Sensibilidade: PFP = P( D | + )

VPN = P( D | - ) e = P( - | D ) VPP = P( D| + ) PFN = P( D | - ) s = P( + |D )

Exerccio (4.2)
a) Sensibilidade : Especificidade:

s = p (+ | D ) =
e = P ( | D ) =

51 = 0,98 52

232 = 0,97 238

b)

Prevalncia na populao: p = 0,179

Prevalncia na amostra:

nmero de doentes na amostra tamanho total da amostra

52 = 0,1793 p 290

Como a prevalncia da doena na amostra prxima da prevalncia na populao, podemos calcular VPP e VPN diretamente da tabela.

51 = 0,89 57 232 VPN = P ( D | ) = = 0,996 233 VPP = P ( D | + ) =

PFP = 1-VPP = 0,11 PFN = 1-VPN = 0,004

c) Suponha que p <<0,179. Ento, VPP << 0,89 e, da, PFP >>0,11. Portanto, um resultado positivo no teste tem uma probabilidade considervel de ser um falso positivo. Como o tratamento caro, no podemos correr um risco de estar tratando um falso positivo como muita frequncia (PFP). Assim, o melhor procedimento diante de um resultado positivo fazer mais investigaes com outros testes de diagnstico.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

44

Exerccio (4.3)
Infarto agudo do miocrdio Doente No doente Total (D) Resultados do Teste 1 Diagnstico do Teste Negativo (CFC<80) Positivo (CFC 80) 215 16 231 15 114 129 Total 230 130 360

(D)

Infarto agudo do miocrdio Doente No doente Total (D)

Resultados do Teste 2 Diagnstico do Teste Negativo (CFC<280) Positivo (CFC 280) 97 1 98 133 129 262

Total 230 130 360

(D)

a) Teste 1:

215 = 0,93 230 114 = 0,88 e1 = P ( | D ) = 130 s1 = P ( + | D ) =

Teste 2:

97 = 0,42 230 129 = 0,99 e 2 = P( | D ) = 130 s 2 = P (+ | D ) =

O Teste 1 tem sensibilidade e especificidade bastante altas, o que no ocorre com o Teste 2, que tem uma especificidade muito alta e uma sensibilidade muito baixa. Assim, o Teste 1 o teste mais sensvel dentre os dois e o Teste 2 o teste mais especfico. A qualidade do diagnstico baseado nesses testes, medida pelos Valores de Predio Positiva e Negativa, depende da prevalncia da doena na populao onde eles sero usados. Conforme for o objetivo do procedimento (descartar ou confirmar a presena da doena), um ou outro teste ser mais til, como veremos no prximo item.

b) Considerando que os testes seriam aplicados numa populao cuja a prevalncia de infarto agudo no corao aproximadamente igual prevalncia da amostra (230/360=0,64), poderemos calcular os valores de predio positiva e negativa diretamente da tabela. Teste 1:

VPP1 = P ( D | + ) = VPN 1 = P ( D | ) =

215 = 0,93 231

PFP1 = 1 0,93 = 0,07

114 = 0,88 129

PFN1 = 1 0,88 = 0,12

Observao: a coincidncia do valor da sensibilidade com o valor do VPP, assim como do valor da especificidade com o valor do VPN, para o teste 1, no regra. Apenas aconteceu porque os denominadores so muito parecidos. Isso no ocorrer com o teste 2, como veremos a seguir. Teste 2:

VPP2 = P ( D | +) = VPN 2 = P ( D | ) =

97 = 0,99 98

PFP2 = 1 0,99 = 0,01

129 = 0, 49 262

PFN2 = 1 0,49 = 0,51

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

45

Comentrios sobre os testes: na escolha de qual teste deve ser usado, devemos estar atento ao objetivo do procedimento e prevalncia da doena na populao onde ele for aplicado. Nesta anlise, vamos considerar que a populao de trabalho tem uma prevalncia de infarto no corao aproximadamente igual prevalncia desse estudo (64%). Se o objetivo do procedimento diagnstico for o de confirmar a doena, o Teste 2 deve ser usado, pois seu VPP bastante alto (99%), isto , um paciente que tenha o resultado positivo no Teste 2 tem grande probabilidade de estar doente. Por outro lado, se o objetivo for o de descartar a doena, o Teste 2 no deve ser mais usado, pois seu VPN muito baixo, levando a uma Proporo de Falsos Negativos muito alta (51%). Assim, ser prefervel usar o Teste 1, que apesar de ter uma Proporo de Falsos Negativos considervel (12%), melhor do que o Teste 2 nesse ponto. Numa populao onde a prevalncia de infarto for menor do que 64%, os valores de VPN para os dois testes vo aumentar e, ento, a utilizao do Teste 1 para descartar a presena da doena ser mais confivel (a proporo de falsos negativos ir diminuir). Como j sabemos, quanto menor a prevalncia, maior o valor de VPN e menor o valor de VPP.

Exerccio (4.4)
a) O VPP aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia fixas. b) O VPN aumenta medida que a especificidade aumenta, com sensibilidade e prevalncia fixas. c) i) VPP aumenta aproximadamente em 0,23 quando se passa de um teste com especificidade igual a 0,7 para 0,95, com p = 0,5. ii) VPP aumenta aproximadamente entre 0,02 e 0,06, dependendo do valor da especificidade, quando se passa de um teste com sensibilidade igual a 0,7 para 0,95, com p = 0,5. iii) O teste ser poderoso para confirmar a presena da doena se ele tiver uma PFP pequena, o que significa que seu VPP grande. Ou seja, haver uma alta probabilidade de um paciente ser doente dado que seu resultado no teste foi positivo. iv) Deseja-se, neste caso, um teste com VPP alto. Desse modo, devemos aumentar a especificidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da especificidade provoca um maior acrscimo no VPP. d) i) VPN aumenta aproximadamente em 0,003 quando se passa de um teste com especificidade igual a 0,7 para 0,95, com p = 0,05. ii) VPN aumenta aproximadamente em 0,019, quando se passa de um teste com sensibilidade igual a 0,7 para 0,95, com p = 0,05. iii) O teste ser poderoso para descartar a presena da doena se ele tiver uma PFN pequena, o que significa que seu VPN grande. Ou seja, haver uma alta probabilidade de um paciente no ser doente dado que seu resultado no teste foi negativo. iv) Deseja-se, neste caso, um teste com VPN alto. Desse modo, devemos aumentar a sensibilidade do teste, pois, como foi mostrado nos itens (i) e (ii), o aumento da sensibilidade provoca um maior acrscimo no VPN.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

46

Seo 5: Distribuies de Probabilidade: Binomial e Poisson


Exerccio (5.1)
X: n de pessoas com Rh negativo em um grupo de n=4 Valores que X pode assumir: x = 0,1,2,3 ou 4 Probabilidade de uma pessoa ser Rh negativo: p = 0,10 Desse modo, X ~ Binomial (n=4,p=0,10)
o

Assim,

4 x 4 x P( X = x) = x 0,10 (1 0,10) para x = 0,1,2, 3 ou 4

Estamos interessados em saber qual a probabilidade de que todas as 4 pessoas desse grupo sejam Rh negativo, ou seja, estamos interessados em saber qual a probabilidade da varivel X assumir o valor 4 (P[X=4]).

4 4! 4 4 4 4 0 P( X = 4) = 4 0,10 (1 0,10) = 4!0! 0,10 (0,90) = 1 0,0001 1 = 0,0001


Quando a probabilidade de uma pessoa ser Rh negativo 10%, a probabilidade de que todas as 4 pessoas de um grupo sejam Rh negativo 0,01%.

Exerccio (5.2)
Y: n de crianas com olhos azuis numa famlia de 3 filhos (n=3) Valores que Y pode assumir: y = 0,1,2 ou 3 Probabilidade de uma criana ter olhos azuis: p = 0,25 Desse modo, Y ~ Binomial (n=3,p=0,25)
o

Assim,

3 y 3 y P(Y = y) = y 0,25 (1 0,25)

para y = 0,1,2 ou 3

Pelo menos duas crianas devem ter olhos azuis, ou seja, 2 ou todas as 3 crianas. Assim, estamos interessados na probabilidade de Y assumir valores maiores ou iguais a 2, ou seja, os valores 2 ou 3.

P[Y2] = {P[Y=2]+P[Y=3]} = =

3 2 3 2 2 0,25 (1 0,25)

3 3 3 3 3 0,25 (1 0,25)

3! 3! 0,25 2 (0,75) 1 + 0,25 3 (0,75) 0 2!1! 3!0!

= 3 . 0,0625 . 0,75 + 1 . 0,0156 . 1 = 0,1406 + 0,0156 = 0,1562 A probabilidade de que pelo menos 2 das 3 crianas de um casal de olhos azuis tambm tenham olhos azuis de 15,62 %.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

47

Exerccio (5.3)
X: n de unidades do medicamento vendidas em 1 dia Valores que X pode assumir: x = 0, 1, 2, ... (at um limite mximo desconhecido) Nmero mdio de unidades do medicamento vendidas por dia: 3 ( = 3) Supondo X ~ Poisson ( = 3)
o

Assim, a)

P( X = x ) =

e 3 3 x x!

para x = 0, 1, 2, ...

(e 2,72)

0.30 0.2240 0.25 0.23 Probabilidade 0.18 0.15 0.13 0.0498 0.10 0.08 0.05 0.03 0.00 10 0 1 2 3 4 5 6 7 8 Nm ero de partculas emvendidas itidas porpor segundo Nmero de unidades dia 9 0.1494 0.20 0.2240 0.1690 0.1010 0.0504 0.28

0.0216

0.0081

0.0027

0.0008

0.0002 11

Note que a distribuio de probabilidade do nmero unidades do medicamento vendidas por dia assimtrica com concentrao esquerda, isto , nos valores mais prximos do valor esperado (3). Para valores maiores ou iguais a 12, a probabilidade to pequena que pode ser considerada igual a zero. b) P[X entre 7 e 11] = P[7 X 11] = {P[X=7]+ P[X=8]+ P[X=9]+ P[X=10]+ P[X=11]} Do grfico em a), temos que : P[X entre 7 e 11] = 0,0216 + 0,0081 + 0,0027 + 0,0008 + 0,0002 = 0,0334 A probabilidade de que sejam vendidas entre 7 e 11 unidades do medicamento por dia de 3,34%.

c) Considerando que a procura pelo medicamento durante os dias da semana se mantm constante e que o que ocorre em um dia independente do que ocorre em outro dia, podemos concluir que o nmero mdio de unidades do medicamento vendidas em 1 semana de 7 x 3 = 21 unidades. Assim, o nmero de unidades do medicamento vendidas em 1 semana tem distribuio de Poisson com mdia igual a 21.

12

0.0000

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

48

d) Y: n de unidades do medicamento vendidas em 1 semana (7 dias) Valores que Y pode assumir: y = 0, 1, 2, ... (at um limite mximo desconhecido) Nmero mdio de unidades do medicamento vendidas em 1 semana: 21 ( = 21) Supondo Y~ Poisson ( = 21).

e 21 21 y Assim, P (Y = y ) = , para y = 0, 1, 2, ... y! P (Y = 100) = e 21 21100 = 100!

(e 2,72)

0,0000000000000000000000000000000000135 (1,35 x 10 ) (uma probabilidade baixssima!!!)

-35

Exerccio (5.4)
X: n de meninos de daltnicos em um grupo de n=4 Valores que X pode assumir: x = 0,1,2,3 ou 4 Probabilidade de um menino ser daltnico: p = 0,08 Portanto, X ~ Binomial (n=4,p=0,08) Assim,
o

4 x 4 x P( X = x) = x 0,08 (1 0,08) para x = 0,1,2, 3 ou 4

A probabilidade de 3 meninos no serem daltnicos num grupo de 4 meninos igual probabilidade de 1 menino ser daltnico num grupo de 4 meninos, ou seja P(X=1):

4 4! 1 3 P ( X = 1) = 1 0,08 (1 0,08) = 1!3! 0,08 (0,92) = 4 0,08 0,78 = 0,25

Exerccio (5.5)
X: n de animais que sobrevivem em n animais submetidos ao experimento cirrgico Valores que X pode assumir: x = 0,1,2,...,n Probabilidade de um animal sobreviver p = 2/3. a) Distribuio de probabilidade de X: X ~ Binomial (n=5 , p=2/3)
o

5 2 1 5! 1 1 P( X = 0) = 0 3 3 = 0!5! 1 243 = 1 243 = 0,004


0 5

5 2 1 5! 2 1 2 P( X = 1) = 1 3 3 = 1!4! 3 81 = 5 243 = 0,041 2 3 5 2 1 5! 4 1 4 P( X = 2) = 2 3 3 = 2!3! 9 27 = 10 243 = 0,165


1 4

5 2 1 5! 8 1 8 1 P( X = 3) = 3 3 3 = 3!2! 27 9 = 10 27 9 = 0,329 4 1 5 2 1 5! 16 1 16 P( X = 4) = 4 3 3 = 4!1! 81 3 = 5 243 = 0,329


3 2

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

49

5 2 1 5! 32 32 P( X = 5) = 5 3 3 = 5!0! 243 1 = 1 243 = 0,132


5 0

Note que P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) = 1

b) i. P(X = 3) = 0,33 ii. P(X 1) = 1- P(X = 0) = 1- 0,004 = 0,996 iii. Mais de 2 animais no sobreviverem o mesmo que no no mximo 2 animais sobreviverem: P(X 2 ) = P(X = 0) + P(X = 1) +P(X = 2) = 0,004 + 0,041 + 0,165 = 0,210

c) Se 60 animais se submeterem a essa cirurgia, espera-se que, em mdia, 60 x p = 60 x 1/3 = 20 no sobrevivam.

Exerccio (5.6)
X: n de sementes que no germinam em um pacote com 10 sementes Valores que X pode assumir: x = 0,1,2,...,10 Probabilidade de uma semente germinar: p = 0,2 X ~ Binomial (n=10,p=0,2)
o

Assim,

10 x 10 x P ( X = x) = para x = 0,1,2,...,10 x 0,2 0,8

a) P ( X > 4) = 1 P ( X 4) = 1 (P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) ) = 1 - 0,9672 = 0,0328

10 0 10 P ( X = 0) = 0 0,2 0,8 = 0,1074 10 1 9 P ( X = 1) = 1 0,2 0,8 = 0,2684 10 2 8 P ( X = 2) = 2 0,2 0,8 = 0,3020 10 3 7 P ( X = 3) = 3 0,2 0,8 = 0,2013

10 4 6 P ( X = 4) = 4 0,2 0,8 = 0,0881


b) O nmero esperado de pacotes indenizados quando 1000 so vendidos 1000 vezes a probabilidade de um pacote ser indenizado, ou seja, 1000 x 0, 0328 33 pacotes.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

50

Exerccio (5.7)
X: n de colnias de bactrias por 10 ml de gua de um lago. Valores que X pode assumir: x = 0, 1, 2, ... (at um limite mximo desconhecido) Supondo X ~ Poisson ( = 3)
o

e 3 3 x Assim, P( X = x) = x!

para x = 0, 1, 2, ...

(e 2,72)

a) Qual a probabilidade de no se achar nenhuma colnia em 10 ml de gua desse lago ?

P( X = 0) =

e 3 30 2,72 3 1 1 = = = 0,05 0! 1 2,723

b) Qual a probabilidade de se achar pelo menos duas colnias em 10 ml de gua desse lago ?

P( X 2) = 1 P ( X 1) = 1 (P( X = 0) + P ( X = 1)) = 1 (0,05 + 0,15) = 1 0,20 = 0,80

P( X = 0) = 0,05 pelo item (a) e 3 31 2,72 3 3 3 P( X = 1) = = = = 0,15 1! 1 2,723


c) O volume de gua triplicou. o X: n de colnias de bactrias por 30 ml de gua de um lago. Portanto, a mdia de X passa a ser = 3 x 3 = 9 colnias por 30 ml de gua. Assim, P ( X = x) =

e 9 9 x x!

para x = 0, 1, 2, ...

(e 2,72)

P ( X 5) = 1 P ( X 4) = 1 (P ( X = 0) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4) ) e 9 9 0 e 9 91 e 9 9 2 e 9 9 3 e 9 9 4 = 1 0! + 1! + 2! + 3! + 4! = 1 (0,000123 + 0,001111 + 0,004998 + 0,014994 + 0,033737) = 1 0,056074 = 0,943926

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

51

Seo 6: Distribuies de Probabilidade: Normal


Exerccio (6.1)
X: quantidade de ferro srico de indivduos sadios X ~ Normal ( = 100 ; = 25) a) Quantidade mdia de ferro srico em indivduos desta populao: = 100 mcg/dl Desvio padro da quantidade de ferro srico nesta populao: = 25 mcg/dl b) Representao grfica da funo de densidade de probabilidade da varivel X: 68,3% dos valores de X esto dentro do intervalo [ ] = [100 25] = [75 ; 125] mcg/dl 95,4% dos valores de X esto dentro do intervalo [ 2] = [100 50] = [50 ; 150] mcg/dl 99,7% dos valores de X esto dentro do intervalo [ 3] = [100 75] = [25 ; 175] mcg/dl

25

50

75

125

150

175

c) Equao da varivel normal padro Z:

Z=

X .

Neste caso, Z =

X 100 25

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

52

d) Um valor de X igual a ... 25 100 2 x 25 = 50 100 1 x 25 = 75 59 100 1,28 x 25 = 68 100 0,68 x 25 = 83 90 Corresponde a Z igual a ... P(X x ) = P(Z -3) = 0,001350 P(Z -2) = 0,022750 0,158655 Um valor de X igual a ... 100 + 3 x 25 = 175 100 + 2 x 25 = 150 125 100 + 1,64 x 25 = 141 100 + 1,28 x 25 = 132 117 100 + 0,4 x 25 = 110 Corresponde a Z igual a ... 3 Da tabela Z=2 P(X x ) = P(Z3) = P(Z-3) = 0,001350 0,022750 P(Z1) = P(Z-1) = 0,158655 P(Z1,64)=P(Z-1,64) = 0,050503 0,100273 P(Z0,68) = P(Z-0,68) 0,248252 P(Z0,4) = P(Z-0,4) = 0,344578

25 100 = 3 25
-2 Da tabela Z = -1

P(Z -1,64) = 59100 = 1,64 0,050503 25 -1,28 Da tabela Z = -0,68 P(Z -1,28) = 0,100273 0,248252 P(Z -0,4) = 0,344578

100 125 =1 25
1,64 Da tabela Z = 1,28

90100 = 0,4 25

117100 = 0,68 25
0,4

(i)

110 100 68 100 Z P(68 X 110 ) = P = P( 1,28 Z 0,40 ) 25 25 = P (Z 0,40 ) P(Z 1,28) = 0,655422 0,100273 = 0,555149
Em uma amostra aleatria de 500 indivduos sadios desta populao, esperamos que 500 x 0,555149 276 tenham quantidade de ferro srio entre 68 e 110 mcg/dl.

(ii) Devemos ter P(x1 < X < x2)= 0,50 e (100 x1) = (x2 100??pela simetria em torno da mdia.

x 100 x 100 P(x1 < X < x 2 ) = P 1 <Z< 2 = P (z1< Z < z 2 ) = 0,50 25 25


Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,50

P(Z > z 2 ) = P( Z < z 2 ) =

1 0,50 0,50 = = 0,25 2 2

Na Tabela Z vemos que P(Z < -0,67) = 0,251429 0,25. Portanto, -z2 = -0,67 e z2 = 0,67. Assim:

x1 100 = z 2 x1 = 100 z 2 25 = 100 0,67 25 = 100 17 = 83 25 x 2 100 = z 2 x 2 = 100 + z 2 25 = 100 + 0,67 25 = 100 + 17 = 117 25
Portanto, o intervalo simtrico em torno da mdia 100 que abrange 50% das quantidades de ferro em indivduos sadios [83;117] mcg/dl. (iii) Devemos ter P(x1 < X < x2)= 0,95 e (100 x1) = (x2 100) pela simetria em torno da mdia. Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

53

x 100 x 100 P(x1 < X < x 2 ) = P 1 <Z< 2 = P (z1< Z < z 2 ) = 0,95 25 25


Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,95

P( Z > z 2 ) = P( Z < z 2 ) =

1 0,95 0,05 = = 0,025 2 2

Na Tabela Z vemos que P(Z < -1,96) = 0,024998 0,025. Portanto, -z2 = -1,96 e z2 = 1,96. Assim:

x1 100 = z 2 x1 = 100 z 2 25 = 100 1,96 25 = 100 49 = 51 25 x 2 100 = z 2 x 2 = 100 + z 2 25 = 100 + 01,96 25 = 100 + 49 = 149 25
Portanto, o intervalo simtrico em torno da mdia 100 que abrange 95% das quantidades de ferro em indivduos sadios [51;149] mcg/dl.

Exerccio (6.2)
X: concentrao srica de tiroxina T4(D) em ces machos sadios X ~ Normal ( = 2,04 ; = 0,78) a) i)

2,81 2,04 P(X < 2,81) = P Z < = P(Z < 0,99) = 0,838913 0,78 1,8 2,04 P(X > 1,8) = P Z > = P (Z > 0,31) = P (Z < 0,31) = 0,621719 0,78
2,50 2,04 1,01 2,04 P (1,01 X 2,50 ) = P Z = P ( 1,32 Z 0,59 ) 0,78 0,78 = P (Z 0,59 ) P (Z 1,32 ) = 0,722405 0,093418 = 0,628987

ii)

iii)

b)

3,80 2,04 2,20 2,04 P(2,20 X 3,80) = P Z = P(0,21 Z 2,26 ) 0,78 0,78 = P(Z 2,26 ) P(Z 0,21) = 0,988089 0,583166 = 0,404923
Assim, em 200 ces sadios, esperamos 200 x 0,404923 81 ces com concentrao srica entre 2,20 e 3,80 mcg/100ml.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

54

c) Devemos ter P(x1 < X < x2)= 0,98 e (2,04 x1) = (x2 2,04) pela simetria em torno da mdia.

x 2,04 x 2,04 P(x1 < X < x 2 ) = P 1 <Z< 2 = P (z1< Z < z 2 ) = 0,98 20,78 0,78
Pela simetria de Z em torno da mdia, z1= -z2 e ento: P ( z 2 < Z < z 2 ) = 0,98.

P( Z > z 2 ) = P( Z < z 2 ) =

1 0,98 0,02 = = 0,01 2 2

Na Tabela Z vemos que P(Z < -2,33) = 0,009903 0,01. Portanto, -z2 = -2,33 e z2 = 2,33. Assim:

x1 2,04 = z 2 x1 = 2,04 z 2 0,78 = 2,04 2,33 0,78 = 2,04 1,82 = 0,22 0,78 x 2 2,04 = z 2 x2 = 2,04 + z 2 0,78 = 2,04 + 2,33 0,78 = 2,04 + 1,82 = 3,86 0,78
Portanto, o intervalo simtrico em torno da mdia 2,04 que abrange 98% das concentraes sricas em ces sadios [0,22 ; 3,86] mcg/100ml.

Exerccio (6.3)
X: tempo de gestao de um beb, em dias. X ~ Normal ( = 268 ; = 15) a) Uma criana ser considerada prematura se o seu tempo de gestao for inferior a 247 dias, ou seja, se X<247. Ento, devemos calcular P[X<247].

X 268 247 268 padronixando P ( X < 247 ) = P < = P ( Z < 1,40 ) = 0,0808 15 15
Assim, a porcentagem de crianas nascidas prematuramente ser de 8,08% .

b) Para que uma criana no seja considerada prematura, seu tempo de gestao tem que ser maior do que um valor, digamos a . E o valor a aquele que deixa 4% dos tempos de gestao abaixo dele. Ou seja, o valor a tal que P(X < a) = 0,04. O valor a o percentil de ordem 4 (ou 4%). Encontrando o valor de a

a - 268 X 268 a 268 padronixando P( X < a) = P < = P Z < = 0,04 15 15 15


Na tabela Z, o valor que deixa, aproximadamente, 4% da rea abaixo dele o -1,75. Assim, (a - 268)/15 = -1,75. Ento, a = (-1,75 x 15) + 268 = 241,75. Desse modo, para que uma criana no seja considerada prematura pelo novo critrio, seu tempo de gestao tem que ser, no mnimo, de 242 dias.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

55

Exerccio (6.4)
X: escore de Q.I. X ~ Normal ( = 100 ; = 15) a) Uma pessoa ser admitida nessa organizao se o seu escore de Q.I. for superior a 131,5 pontos, ou seja, se X>131,5. Ento, devemos calcular P[X>131,5].

1 3 1 ,5 1 0 0 X 100 a d r o n iz a n d o = P > P ( X > 1 3 1 ,5 ) p = 15 15


o r s i m e tr i a a ta b e la = P ( Z > 2 ,1 0 ) p = P ( Z < 2 ,1 0 ) n = 0 ,0 1 7 9

Assim, a probabilidade de uma pessoa escolhida aleatoriamente ser aceita nessa organizao de apenas 1,79%.

b) Para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a um valor, digamos b . Esse valor b aquele que deixa 1% dos escores de Q.I. acima dele. Ou seja, o valor b tal que P(X > b) = 0,01 e, portanto, P(X < b) = 0,99. O valor b o percentil de ordem 99 (ou 99%). Encontrando o valor b

b - 100 X 100 b 100 padronixando = P < P ( X < b) = P Z < = 0,99 15 15 15


O valor, na tabela Z, que deixa, aproximadamente, 99% da rea abaixo dele o 2,33. Assim, (b - 100)/15 = 2,33. Ento, b = (2,33 x 15) + 100 = 134,95. Desse modo, para que uma pessoa seja considerada um gnio, ela deve ter um Q.I superior a 134,95 pontos.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

56

Seo 7: Faixas de Referncia


Exerccio (7.1)
X: nmero de colnias por cultura de escarro em pessoas sadias

a) Ramo-e-Folhas para nmero colnias por cultura de escarro

n = 44

Escala: |1|7 = 17

|1|7 |2|23333444444 |2|55555556889 |3|0011 |3|5556 |4|01112 |4| |5|14 |5|668 |6|0 |6|8 |7| |7|9

Podemos ver que a distribuio de freqncia do nmero de colnias por cultura de escarro muito assimtrica. Portanto, no podemos supor que siga uma esta varivel siga a distribuio Normal

b) Faixa de Normalidade de 95% 100(1- )% = 95% (1- ) = 95/100 = 0,95 = 1- 0,95 = 0,05 /2 = 0,05/2 = 0,025 1 /2 = 1 - 0,025 = 0,975

(i)

Mtodo dos Percentis

Faixa de Referncia de 100(1- )% : [Percentil de ordem /2 ; Percentil de ordem (1- /2)] Assim, a Faixa de Referncia de 95% : [Percentil de ordem 0,025; Percentil de ordem 0,975] Percentil de ordem 0,025 (2,5%): 44 x 0,025 = 1,1 (arredonda para 2) o O 2 valor (em ordem crescente) X = 22 Portanto: P2,5% = 22 Percentil de ordem 0,975 (97,5%): 44 x 0,975 = 42,9 (arredonda para 43) o O 43 valor (em ordem crescente) X = 68 Pontanto: P97,5% = 68

Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas sadias [22; 68] colnias, pelo mtodo dos percentis.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

57

Observao: Fazendo pelo mtodo dos percentis ensinado na apostila Introduo Bioestatstica. Na tabela a seguir, vemos que as ordem de percentis que mais se aproximam de 0,025 e 0,975 so, o respectivamente 0,034091 e 0,965909 correspondendo aos valores de X (n de colnias por cultura de escarro) X = 22 e X = 68. Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas sadias [22 ; 68], pelo mtodo dos percentis da Apostila.
o o

N de ordem i 1 2 3 ..... 42 43 44

X: n de colnias por culura de escarro 17 22 23 ..... 60 68 79

Ordem do percentil ( i- 0,5)/44 0,011364 0,034091 0,056818 ..... 0,943182 0,965909 0,988636

Mais prximo do P 0,025

Mais prximo do P 0,975

Observao: Note que, na verdade, a faixa de referncia encontrada acima de (96, 5909 - 3,4091) 93% (ii) Mtodo da Curva de Gauss
. .

Faixa de Referncia de 100(1- )% : [ z(/2) ; + z(/2) ] Como e s so desconhecidos, vamos estim-los por x = 34,3 e s =14,2 e, assim, a Faixa de Referncia de . . 95% torna-se: [ x - z(/2) s ; x - z(s/2) s ] = [34,3 - z(0,025)(14,2) ; 34,3 + z(0,025)(14,2)] Vamos descobrir na Tabela da Distribuio Normal Padronizada (Tabela Z) quem z(0,025): Pela definio, z(0,025) o valor de Z tal que P(Z > z(0,025)) = 0,025. Pela simetria em torno de zero da distribuio de Z, temos: P(Z < -z(0,025)) = 0,025. Na tabela Z temos que P(Z < -1,96) = 0,024998 0,025 Portanto, -z(0,025) = -1,96 e assim, z(0,025) = 1,96. A Faixa de Referncia de 95% torna-se: [34,3 - z(0,025)(14,2) ; 34,3 + z(0,025)(14,2)] = [34,3 1,96(14,2) ; 34,3 + 1,96(14,2)] = [6 ; 62] colnias Portanto, a Faixa de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas sadias [6; 62], pelo mtodo da curva de Gauss.

Note que as Faixas de Referncia de 95% para o nmero de colnias por cultura de escarro em pessoas sadias fornecida pelo dois mtodos diferem bastante no limite inferior: Mtodo da Curva de Gauss: Mtodo dos Percentis: FR(95%) : [ 6; 62] colnias FR(95%): [22 ; 68] colnias

Como vimos no item (a) a Curva Normal (Curva de Gauss) no se ajusta bem a esses dados. Assim, o mtodo mais indicado neste caso o Mtodo dos Percentis.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

58

Exerccio (7.2)
a) A Faixa de Referncia de 80% ser dada por FR(80%) = [P0,10; P0,90], pois: 100(1-)% = 80% (1- ) = 80/100 = 0,80 = 1- 0,80 = 0,20 /2 = 0,20/2 = 0,10 1 /2 = 1- 0,10 = 0,90 O percentil de ordem 10% (P0,10) pode ser encontrado procurando-se o valor de hemoglobina ao qual corresponde a proporo acumulada igual a 0,10 na ogiva. Este valor aproximadamente 11 g/dl. O percentil de ordem 90% (P0,90) pode ser encontrado procurando-se o valor de hemoglobina ao qual corresponde a proporo acumulada igual a 0,90 na ogiva. Este valor aproximadamente 17 g/dl. A Faixa de Referncia de 80% so os valores de hemoglobina de 11 a 17 g/dl. Isto significa que aproximadamente 80% das mulheres sadias desta populao tm valor de hemoglobina entre 11 e 17 g/dl.

b.1) Um mtodo de diagnstico para anemia baseado nessa faixa de referncia daria resultado: negativo, se a paciente tivesse valor de hemoglobina entre 11 e 17 g/dl; positivo, se a paciente tivesse esse valor menor do que 11 g/dl ou maior do que 17 g/dl. Como sabemos, a especificidade de um teste estimada como sendo a frequncia de negativos entre as pessoas sadias. Nesse problema, todas as mulheres so sadias, e 80% tem valores entre 11 e 17 g/dl, sendo consideradas negativas. Assim, estimativa da especificidade justamente 80%. Esse um valor aproximado, j que a prpria faixa aproximada. b.2) Como tambm sabemos, a sensibilidade de um teste estimada como sendo a frequncia de positivos entre as pessoas doentes. Aqui, a sensibilidade desse mtodo no pode ser calculada somente com esses dados, pois precisamos de uma amostra de pessoas doentes para sabermos quantas delas sero consideradas positivas pelo mtodo.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

59

Seo 8: Intervalos de Confiana


Exerccio (8.1)
a) Populao: todos os pacientes atendidos no posto durante os ltimos trs anos. Amostra: os 70 pacientes adultos selecionados. b) Varivel X: idade dos pacientes desta populao (varivel contnua) Parmetro : idade mdia dos pacientes desta populao Estimativa Pontual para :

x = 36,86 anos (mdia amostral)

Intervalo de 100(1-)% de Confiana para :

s s ; x + Z ( / 2 ) x Z ( / 2 ) com 0<<1 n n

s = 17,79 anos (desvio padro amostral) n = 70 (tamanho da amostra) Intervalo de 90% de Confiana para : (a amostra grande n = 70 > 30) 100(1- ) = 90 1- = 0,90 = 0,10 /2 = 0,05 Z0,05 = 1,64 pois P( Z > 1,64 ) 0,05

s s 90% IC = x Z ( 0, 05 ) ; x + Z ( 0 ,05 ) n n 17,79 17,79 = 36,86 1,64 ;36,86 + 1,64 70 70 = [36,86 3, 49;36,86 + 3, 49] = [33,37;40,35]

Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 33,37 e 40,35 anos com 90% de confiana. Intervalo de 95% de Confiana para :

100(1-) = 95 1- = 0,95 = 0,05 /2 = 0,025 Z0,025 = 1,96 pois P( Z > 1,96 ) 0,025

s s 95% IC = x Z ( 0 , 025) ; x + Z (0 , 025 ) n n 17,79 17,79 = 36,86 1,96 ;36,86 + 1,96 70 70 = [36,86 4,17;36,86 + 4,17] = [32,69;41,03]

Interpretao: A idade de mdia dos adultos que frequentam o posto est entre 32,69 e 41,03 anos com 95% de confiana. Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

60

c) Varivel Y: ser ou no analfabeto (varivel categrica) Parmetro p: proporo de analfabetos nesta populao

= 19 70 = 0,27 Estimativa Pontual para p: p ou seja, 27% dos pacientes deste posto so analfabetos
Intervalo de 90% de Confiana para p: (a amostra grande n = 70 > 30)

100(1- ) = 90 1- = 0,90 = 0,10 /2 = 0,05 Z0,05 = 1,64 pois P( Z > 1,64 ) 0,05

(1 p ) p 0,27(0,73) % Z ( / 2) IC 90 = p = 0,27 1,64 p n 70 = [0,27 0,09] = [0,18;0,36]

Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre 18% e 36% com 90% de confiana.

Intervalo de 95% de Confiana para p:

100(1-) = 95 1- = 0,95 = 0,05 /2 = 0,025 Z0,025 = 1,96 pois P( Z > 1,96 ) 0,025

= [0, 27 0,10] = [0,17;0,37]

0,27(0,73) % IC 95 = 0, 27 1,96 p 70

Interpretao: A proporo de frequentadores adultos do posto que so analfabetos est entre 17% e 37% com 95% de confiana. Comparando os dois intervalos: o IC de 95% mais amplo que o IC de 90%.

Exerccio (8.2)
Varivel X: produo de leite (em litros) na primeira lactao de vacas desta fazenda (varivel contnua) Parmetro : produo mdia de leite na primeira lactao de vacas desta fazenda Estimativa Pontual para :

x = 1500 litros (mdia amostral)

s = 300 litros (desvio padro amostral) n = 20 (tamanho da amostra) Intervalo de 98% de Confiana para : (a amostra pequena n = 20 < 30)

100(1-) = 98 1- = 0,98 = 0,02 /2 = 0,01 gl = n-1 = 20-1 =19 t(19; 0,01) = 2,539

=[ 1500 170] = [ 1330;1670] litros.

s 300 98% IC = x t19 ;0, 01) = 1500 2,539 20 n

Interpretao: A produo mdia de leite na primeira lactao de vacas desta fazenda est entre 1330 e 1670 litros, com 98% de confiana.

Exerccio (8.3)
Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG 61

a) Porque a informao sobre o parmetro (neste caso, a mdia da varivel na populao) muito vaga. Por exemplo, se o intervalo de confiana para a altura mdia das pessoas adultas de uma cidade vai de 1 a 2,50 metros, no saberemos dizer se esta cidade habitada por adultos que tendem a ser altos ou baixos. Alm disso, no seria necessrio um estudo para obter esta informao, pois j sabemos que os adultos no medem menos que um metro nem mais que 2,50 metros. b) Reduzir o nvel de confiana 100(1-) significa aumentar o valor de , o que leva a valor menor de z /2, reduzindo a amplitude do intervalo. Por exemplo: passar de 100(1-) = 95 para 100(1-) = 90 significa passar de = 0,05 para = 0,10. Assim, passamos de Z/2 = Z0,025= 1,96 para Z/2 = Z0,05 = 1,64. Desse modo, quanto menor o nvel de confiana requerido, menor ser a amplitude do intervalo. c) Esta parcela seria menor. Desse modo, quanto menor a variabilidade da varivel, menor ser a amplitude do intervalo. d) Esta parcela seria menor. Desse modo, quanto maior o tamanho da amostra, menor ser a amplitude do intervalo. e) Apenas o tamanho da amostra (n), que ele pode aumentar, e o nvel de confiana do intervalo (100(1)), que ele pode reduzir. O pesquisador no tem controle sobre a variabilidade () da caracterstica estudada. f) Aumentar o tamanho da amostra (n).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

62

Seo 9: Conceitos Bsicos de Testes de Hipteses


Situao 1:
a) Parmetro a ser testado : tempo mdio (em horas) da execuo de uma nova tcnica para identificar bactrias em hemoculturas. H0: = 40,5 horas Ha: < 40,5 horas

b) Hiptese Nula Hiptese Alternativa c) Erro Tipo I: Erro Tipo II:

Concluir que o novo mtodo tem tempo mdio de execuo menor do que 40,5 horas quando, na verdade, seu tempo mdio igual a 40,5 horas. Concluir que novo mtodo tem tempo mdio de execuo igual a 40,5 horas quando, na verdade, seu tempo mdio menor do que 40,5 horas.

Situao 2:
a) Parmetro a ser testado p: proporo de homens com mais de 65 anos de uma cidade que morrem dentro de um ano. H0: p = 0,04 Ha: p > 0,04

b) Hiptese Nula Hiptese Alternativa c) Erro Tipo I:

Erro Tipo II:

Concluir que a proporo de homens com mais de 65 anos que morrem dentro de um ano nessa cidade maior do que 0,04 quando, na verdade, essa proporo igual a 0,04. Concluir que a proporo de homens com mais de 65 anos que morrem dentro de um ano nessa cidade igual a 0,04 quando, na verdade, essa proporo aumentou.

Situao 3:
a) Parmetro a ser testado : peso mdio (em quilos) de frangos vendidos pelo fornecedor novo H0: = 3 quilos Ha: > 3 quilos

b) Hiptese Nula Hiptese Alternativa c) Erro Tipo I:

Concluir que o peso mdio dos frangos do novo fornecedor maior do que 3 quilos quando, na verdade, o peso mdio igual a 3 quilos. Erro Tipo II: Concluir que o peso mdio dos frangos do novo fornecedor igual a 3 quilos quando, na verdade, peso mdio maior do que 3 quilos.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

63

Situao 4:
a) Parmetro a ser testado : quantidade mdia de cido acetil saliclico (gramas por comprimido) de certo analgsico. H0: = 5,5 gramas Ha: 5,5 gramas

b) Hiptese Nula Hiptese Alternativa c) Erro Tipo I:

Concluir que a quantidade mdia de cido acetil saliclico nos comprimidos do analgsico diferente da especificada quando, na verdade, ela igual a 5,5 g. d) Erro Tipo II: Concluir que a quantidade mdia de cido acetil saliclico nos comprimidos do analgsico igual especificada quando, na verdade, ela diferente de 5,5 g.

Situao 5:
a) Parmetro a ser testado: b) Hiptese Nula Hiptese Alternativa c) Erro Tipo I: Erro Tipo II: p: proporo de sementes que germinam H0: p = 0,95 Ha: p < 0,95

Concluir que a proporo de sementes que germinam menor de 0,95 quando, na verdade, essa proporo igual a 0,95. Concluir que a proporo de sementes que germinam igual a 0,95 quando, na verdade, essa proporo menor do que 0,95.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

64

Seo 10: Testes de Hipteses para Uma Populao


Situao 1:
H0: = 40,5 horas Ha: < 40,5 horas n = 18 (amostra pequena) mdia amostral = 39,42; desvio-padro amostral = 1,96 RR: Tobs < -t(17;0,05) que seja Tobs < -1,74

obs

39,42 40,50 = 2,34 1,96 18

Como o valor de Tobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%. Valor P = P[t17 < -2,34] = ? Deve-se encontrar a P[t17 > 2,34], que, por simetria, igual a P[t17 < -2,34]). Na linha 17 da tabela t-student, no existe o valor 2,34. Ele est entre os valores 2,110 e 2,567, que correspondem s colunas 0,025 e 0,01, respectivamente. Assim, P[t17 > 2,34] est entre 0,01 e 0,025. Consequentemente, o valor P est entre 1% e 2,5%. Concluso: Rejeita-se a hiptese de que o tempo mdio de execuo do novo mtodo igual a 40,5 horas, em favor da hiptese de que ele menor do que 40,5 horas, ao nvel de significncia de 5% (0,01 < valor P < 0,025).

Situao 2:
H0: p = 0,04 Ha: p > 0,04 n = 1000 (amostra grande); proporo amostral = 60/1000 = 0,06 RR: Zobs > z0,05

obs

0,06 0,04 = 3,23 0,04(1 0,04) 1000

Zobs > 1,64 Como o valor de Zobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%. Valor P = P[Z > 3,23] = ? O ltimo valor da tabela Z 3,10. Como 3,23 > 3,10, podemos concluir que P[Z > 3,23] 0,000. Concluso: rejeitamos a hiptese de que a proporo de idosos que morrem por ano nessa cidade igual a 4%, em favor da hiptese de que essa proporo maior 4%, ao nvel de significncia de 5% (valor P 0,000).

Situao 3:
H0: = 3 quilos Ha: > 3 quilos n = 25 (amostra pequena); mdia amostral = 3,2; desvio-padro amostral = 0,4 RR: Tobs > t24;0,05 Tobs > 1,711 Como o valor de Tobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%. Valor P = P[t24 > 2,5] = ? Na linha 24 da tabela t-student, no existe o valor 2,5. Ele est entre as colunas do 0,01 e 0,005. Assim, 0,005 < P[t24 > 0,016] < 0,01. Consequentemente, 0,005 < valor P < 0,01. 65 Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

T obs = 0,4

3,2 3,0 = 2,5 25

Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que o peso mdio de frangos vendidos pelo fornecedor novo igual a 3 quilos, em favor da hiptese de que o peso mdio desses frangos maior do que 3 quilos (0,005 < valor P < 0,01).

Situao 4:
H0: = 5,5 gramas Ha: 5,5 gramasn = 40 (amostra grande); mdia amostral = 5,2 ; desvio-padro amostral = 0,7

Z obs = 0,7

5,2 5,5 = 2,71 40

RR: Zobs < -z0,025 ou Zobs > z0,025 Zobs < -1,96 ou Zobs > 1,96

Como o valor de Zobs est na Regio de Rejeio, rejeitamos H0, ao nvel de significncia de 5%. Valor P = 2 x P[Z > |-2,71|] = 2 x P[Z > 2,71] = (por simetria) 2 x P[Z <-2,71] = 2 x 0,0034 = 0,0068. Concluso: rejeitamos a hiptese de que a quantidade mdia de cido acetil saliclico (gramas por comprimido) de certo analgsico igual a 5,5 gramas ao nvel de significncia de 5% (valor P = 0,0068). Nessa situao, podemos usar o intervalo de confiana para realizar o teste de hipteses, pois a hiptese alternativa bilateral. Como queremos um teste a 5% de significncia, calcularemos um intervalo de 95% de confiana para a quantidade mdia de cido acetil saliclico, por comprimido. Intervalo de 95% de Confiana para : (a amostra grande n = 40 > 30) 100(1-) = 95 1- = 0,95 = 0,05 /2 = 0,025 Z 0,025 = 1,96

IC IC IC

95% 95% 95%

s = x z 0 ,0 2 5 n 0 ,7 = 5 ,2 1 ,9 6 = [ 5 ,2 0 ,2 ] 40 = [ 5 ,0 ; 5 , 4 ]

Interpretao: A quantidade mdia de cido acetil saliclico, por comprimido, est entre 5,0 e 5,4 gramas, com 95% de confiana. Teste de hipteses baseado no intervalo de confiana: como o valor 5,5 no pertence ao intervalo de 95% de confiana para a quantidade mdia de cido acetil saliclico, por comprimido, rejeitamos a hiptese de que a quantidade mdia de cido acetil saliclico de certo analgsico igual a 5,5 gramas ao nvel de significncia de 5%.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

66

Situao 5: H0: p = 0,95 Ha: p < 0,95

n = 1000 (amostra grande); proporo amostral = 940/1000 = 0,94 RR: Zobs < -z0,05

obs

0,94 0,95 = 1,45 0,95(1 0,95) 1000

Zobs < -1,64 Como o valor de Zobs no est na Regio de Rejeio, no rejeitamos H0, ao nvel de significncia de 5%. Valor P = P[Z < -1,45] = 0,0735 Concluso: no rejeitamos a hiptese de que a proporo de sementes que germinam igual a 95% (valorP=0,0735).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

67

Seo 11: Testes de Hipteses para Duas Populaes


Exerccio (11.1)
a) H0: a mdia da diferena dos escores depois e antes do programa igual a zero (o programa no funciona); Ha: a mdia da diferena dos escores depois e antes do programa maior do que zero (o programa aumenta a habilidade);
o

N do aluno 1 2 3 4 5 6 7 8 9 10

Escores de abdominais Antes Depois 12 15 10 9 23 25 25 25 29 31 32 14 17 19 20 30 16 20 22 22

Diferenas (d) (Depois Antes) 15 - 12 = 3 9 - 10 = -1 25 - 23 = 2 25 - 25 = 0 31 - 29 = 2 30 - 32 = -2 16 - 14 = 2 20 - 17 = 3 22 - 19 = 3 22 - 20 = 2

d = 1,4
sd = 1,8

Mdia das diferenas:

d =

3 1 + 2 + 0 + 2 2 + 2 + 3 + 3 + 2 14 = = 1,4 10 10

Desvio padro das diferenas:

sd =

(3 1,4) 2 + (1 1,4) 2 + ... + (3 1,4) 2 + ( 2 1,4) 2 = 1,8 10 1


RR: Tobs > t(10-1);0,05 = 1,833

obs

1,4 0 = 2,45 1,8 10

Como Tobs est na regio de rejeio, rejeitamos H0 ao nvel de 5% de significncia. b) Valor P = P[t9>2,45] = ? O valor 2,45 no existe na linha 9 da tabela t-Student. Ele est entre os valores 2,262 e 2,821, correspondentes s colunas 0,025 e 0,01. Assim, a P[t9>2,45] est entre 1% e 2,5% . Como o valor P menor do que o nvel de significncia (5%), rejeitamos H0. Concluso: Ao nvel de 5% de significncia, rejeitamos a hiptese de que a mdia dos escores depois do programa igual mdia dos escores antes do programa, em favor da hiptese de que a mdia dos escores depois do programa maior do que mdia dos escores antes do programa (0,01< valor p < 0,025). c) 100(1-)% = 95%; 1- = 0,95 ; =0,05 ; /2 = 0,025; t9;0,025 = 2,262

[1,4 2,262 1,8 / 10] = [1,4 0,57]


[0,83 ; 1,97]

A diferena mdia entre os escores depois e antes do programa est entre 0,83 e 1,97, com 95% de confiana.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

68

Exerccio (11.2)
1 : peso mdio no grupo I; 2 : peso mdio no grupo II; a) H0: 1 = 2 Ha: 1 > 2 s = 21,39 n1 = 12 s = 20,62 n2 = 7

x1 = 120 x2 = 101

T obs =

120 101 = 1,89 1 1 + 2112 , 12 7

comb

(12 1)(21,29) 2 + (7 1)(20,62) 2 = 2112 , 12 + 7 2

RR: Tobs > t(12+7-2);0,01 Tobs > 2,57 Como Tobs no est na regio de rejeio, no rejeitamos H0, ao nvel de 1% de significncia. Concluso: Ao nvel de 1% de significncia, no rejeitamos a hiptese de que o ganho mdio de peso no grupo alimentado com dieta de alto contedo proteico igual ao ganho mdio de peso no grupo alimentado com dieta de baixo contedo proteico. b) Valor P= P[t17 > 1,89] = ? Na linha 17 da tabela t-Student, no existe o valor 1,89. Ele est entre os valores 1,74 e 2,11, correspondentes s colunas 0,05 e 0,025, respectivamente. Assim, P[t17 > 1,89] est entre 2,5% e 5%. O valor P est entre 0,025 e 0,05. Como o valor P maior do que 1%, no rejeitamos H0. Concluso: Ao nvel de 1% de significncia, no existem evidncias para rejeitarmos a hiptese de que o ganho mdio de peso no grupo alimentado com dieta de alto contedo proteico igual ao ganho mdio de peso no grupo alimentado com dieta de baixo contedo proteico (0,025 < valor P < 0,05).
1 1 c) + = [19 21,18] (120 101) 2,11 21,12 12 7

[ -2,18 ; 40,18] A diferena entre o ganho mdio de peso no grupo alimentado com dieta de alto contedo proteico e o ganho mdio de peso no grupo alimentado com dieta de baixo contedo proteico est entre -2,18 gramas e 40,18 gramas, com 95% de confiana. Observao para todo o exerccio: se estivssemos testando a H0: 1 = 2, a 5% de significncia, ns rejeitaramos H0 em favor de H1: 1 > 2, pois o valor P < 0,05. Porm, se estivssemos testando a H1: 1 2, no teramos evidncias suficientes para rejeitar H0, a 5% de significncia, pois o intervalo de 95% de confiana para a diferena entre as duas mdias contm o valor zero. Isso mostra que a no indicao de uma direo para o valor da diferena entre as duas mdias (maior ou menor do que zero) reduz o poder do teste para rejeitar H0. Ou seja, quando o teste unilateral, estamos fornecendo uma informao a mais para o teste, e no precisaremos de evidncias amostrais to fortes para rejeitar H0 quanto precisaramos se o teste fosse bilateral, onde no fornecemos nenhuma informao a mais.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

69

Exerccio (11.3)
1 : peso mdio dos bebs no grupo de mes que usaram cocana durante toda a gravidez; 2 : peso mdio dos bebs no grupo de mes que no tm histria de uso de cocana; a) H0: 1 = 2 Ha: 1 < 2

x1 = 2829 x 2 = 3436

s = 708 s = 628

n1 = 36 n2 = 39

obs

2829 3436 708 2 628 2 + 36 39

607 = 3,92 155,04

RR: Zobs < -z0,05 Zobs < -1,64 Como Zobs est na regio de rejeio, rejeitamos a hiptese de que o peso mdio dos bebs no grupo de mes que usaram cocana durante toda a gravidez igual ao peso mdio dos bebs no grupo de mes que no tm histria de uso de cocana, em favor da hiptese de que o peso mdio dos bebs do primeiro grupo de mes menor do que o peso mdio dos bebs do segundo grupo de mes, ao nvel de 5 % de significncia. b) Valor P = P[Z < -3,92] 0,000 , pois o menor valor da tabela Normal padro -3,10. Concluso: ao nvel de 1% de significncia, rejeitamos a hiptese de que o peso mdio dos bebs no grupo de mes que usaram cocana durante toda a gravidez igual ao peso mdio dos bebs no grupo de mes que no tm histria de uso de cocana, em favor da hiptese de que o peso mdio dos bebs do primeiro grupo de mes menor do que o peso mdio dos bebs do segundo grupo de mes (valor P 0,000).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

70

Exerccio (11.4)
pC : proporo de pessoas que tomaram vitamina C e ficaram livres de doenas do trato respiratrio pP : proporo de pessoas que tomaram o placebo e ficaram livres de doenas do trato respiratrio H0: pC = pP Ha: pC > pP RR: Zobs > z0,025 = 0, 26 C = 105 p 407

p= p

76 = 0,18 411

obs

0,26 0,18 0,07 = = 2,77 0,26(1 0,26) 0,18(1 0,18) 0,028 + 407 411

RR: Zobs > 1,64

Como Zobs est na regio de rejeio, rejeitamos H0, ao nvel de significncia de 5%. Valor P = P[Z>2,77] = P[Z < -2,77] = 0,0028. Concluso: Ao nvel de significncia de 5%, rejeitamos a hiptese de que a proporo de pessoas que tomaram vitamina C e ficaram livres de doenas do trato respiratrio igual proporo de pessoas que tomaram placebo e ficaram livres de doenas do trato respiratrio, em favor da hiptese de que a proporo de pessoas livres de doenas no trato respiratrio entre as que tomaram vitamina C maior do que essa proporo entre as que tomaram placebo (valor P = 0,0028). Observao: Tambm rejeitaramos a hiptese nula se o nvel de significncia fosse 1%.

Exerccio (11.5)
Para que um desfecho possa ser considerado associado ao uso de reposio hormonal, devemos rejeitar a hipotse nula no seu teste, ou seja, o Valor P de seu teste deve ser menor que o nvel de significncia, neste caso, 5%. Assim, qualquer evento tromboemblico pode ser considerado, ao nvel de significncia de 5%, associado ao uso de reposio hormonal (Valor P = 0,002). Em especial, a trombose venosa profunda (Valor P = 0,004). Observaes: 1) O evento doena da vescula biliar tem Valor P igual a 5%, e pode ser considerado sob suspeita. 2) Note que 34 das 1.380 (2,46%) mulheres que fizeram uso desses hormnios tiveram algum evento tromboemblico, contra apenas 12 das 1383 (0,87%) mulheres do grupo placebo. Assim, o risco de ter algum evento tromboemblico 2,46/0,87= 2,84 vezes maior para as mulheres que usam reposio hormonal. O valor 2,84 aproximadamente aquele que est na coluna do Risco Relativo (RR). A mesma concluso pode ser feita para o desfecho trombose venosa profunda, cujo risco 3,18 vezes maior entre as mulheres que fizeram reposio hormonal do que entre as mulheres do grupo placebo.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

71

Seo 12: Teste Qui-Quadrado


Exerccio (12.1)
Este um Teste de Homogeneidade, pois deseja comparar a eficcia das vacinas padro e nova. H0: As propores de animais que contraram a doena so iguais para as duas vacinas Ha: As propores de animais que contraram a doena so diferentes para as duas vacinas Tabela de valores esperados sob a hiptese de homogeneidade Brucelose Vacina Total Sim No Padro 14x15/30 =7 14x15/30=7 14 Nova 16x15/30=8 16x15/30=8 16 Total 15 15 30

Estatstica de Teste:

(10 7) 2 ( 4 7) 2 (5 8) 2 (11 8) 2 + + + 7 7 8 8 2 = + + + = 1 , 286 1 , 286 1125 , 1125 , 4 , 821 X

X
2 obs

Regio de Rejeio:

> 3,84 (X

2 1;0,05

= 3,84)

Verificao: Como 4,821 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de significncia. Clculo do Valor P: Valor P = P[X 1 > 4,821] = ? Na tabela Qui-quadrado, na linha 1, no existe o valor 4,821. Ele est entre os valores 3,84 e 5,024, 2 correspondentes s colunas do 5% e 2,5%, respectivamente. Assim, P[X 1 > 4,821] est entre 0,025 e 0,05. Concluso: ao nvel de significncia de 5%, rejeitamos a hiptese de homogeneidade entre as propores de animais que contraram a doena nos grupos vacina padro e vacina nova, em favor da hiptese de que essas propores so diferentes (0,025 < valor P < 0,05). Medindo a associao entre variveis: o Risco Relativo O risco (probabilidade) de uma bezerra que recebeu a vacina padro contrair brucelose estimado em 11/14=0,71. Para as bezerras que receberam a vacina nova, este risco estimado por 5/16=0,31. Logo, as bezerras vacinadas com vacina padro apresentam um risco de desenvolver brucelose 2,29 (0,71/0,31) vezes maior que o risco das bezerras vacinadas com a vacina nova. O valor 2,29 uma estimativa do risco relativo. O risco relativo definido como RR=p1/p2, onde p1 e a probabilidade de ocorrncia do evento (brucelose) no grupo 1 (vacina padro) e p2 a probabilidade de ocorrncia do evento (brucelose) no grupo 2 (vacina nova). O risco relativo calculado somente para estudos prospectivos, onde a ocorrncia do evento de interesse 2 (brucelose) precedida pelos tratamentos (vacina nova e vacina padro). As hipteses de teste X podem ser escritas em funo de RR como : H0 : RR = 1 x Ha: RR 1, pois, se no existe associao entre as variveis (H0), os riscos nos dois grupos so iguais e RR=1.
2

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

72

Exerccio (12.2)
Teste de Homogeneidade H0: As propores de contaminao so iguais para todos os tipos de fertilizantes Ha: As propores de contaminao so diferentes para todos os tipos de fertilizantes Tabela de valores esperados sob a hiptese de homogeneidade Contaminao Fertilizante Sim No Nenhum 101x44/450=9,88 101x406/450=91,12 Nitrognio 95x44/450=9,29 95x406/450=85,71 Esterco 113x44/450=11,05 113x406/450=101,95 Nitrognio e Esterco 141x44/450=13,79 141x406/450=127,21 Total 44 406

Total 101 95 113 141 450

Estatstica de Teste:

(16 9,88) 2 (85 91,12) 2 (10 9,29) 2 (85 85,71) 2 + + + + X 9,88 9112 , 9,29 85,71 (4 11,05) 2 (109 101,95) 2 (14 13,79) 2 (127 127,21) 2 + + + + 11,05 101,95 13,79 127,21
2

X
Regio de Rejeio:
2

= 3.798 + 0.412 + 0.054 + 0.006 + 4.497 + 0.487 + 0.003 + 0.000 = 9.258


2

X obs > X (4-1)(2-1);0,05 2 2 X obs > X 3;0,05 2 X obs > 7,82

Verificao: Como 9,258 est na regio de rejeio, rejeitamos a hiptese nula ao nvel de 5% de significncia. Concluso: ao nvel de significncia de 5%, rejeitamos a hiptese de homogeneidade entre as propores de contaminao dos tipos de fertilizantes estudados, em favor da hiptese de que essas propores so diferentes (0,025<valorP<0,05). Clculo do Valor P: Valor P = P[X 3 > 9,258] = ?. Na tabela Qui-quadrado, na linha 3, no existe o valor 9,258. Ele est entre os valores 7,82 e 9,35, correspondentes s colunas do 5%e 2,5%, respectivamente. Assim, 2 P[X 3 > 9,258] est entre 0,025 e 0,05. Observao Os tratamentos Nenhum, Nitrognio, Esterco e Nitrognio e Esterco podem ser vistos como a combinao de dois fatores: Nitrognio (presente e ausente) e Esterco (presente e ausente), pois Tratamento Nitrognio ausente Nitrognio ausente Nitrognio presente Nitrognio presente + + + + Esterco ausente Esterco presente Esterco ausente Esterco presente = = = = Nenhum Esterco Nitrognio Nitrognio e Esterco
2

A estrutura desse experimento chamada fatorial 2 a 2, pois existem dois fatores (Nitrognio e Esterco), cada um com dois nveis (ausente e presente).

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

73

O grfico a seguir mostra as porcentagens de contaminao para os 4 tratamentos.

Porcentagens de contaminao por Bacterium Phithotherum em plantao de batatas segundo tipo de adubao
0.25 % de contaminao 0.2 0.15 0.1 0.05 0 Ausente Nitrognio Presente Esterco presente Esterco ausente

O grfico indica que, na ausncia de esterco (linha cheia), a adio de nitrognio diminui a porcentagem de contaminao, mas, na presena do esterco (linha pontilhada), a adio do nitrognio aumenta a porcentagem de contaminao. Em outras palavras, o efeito do nitrognio de aumentar a porcentagem de contaminao quanto o esterco presente e de diminuir essa porcentagem quanto o esterco ausente. Esse fato indica caracteriza a interao entre os fatores Esterco e Nitrognio, isto , o efeito do Nitrognio na porcentagem de contaminao no o mesmo nos dois nveis de Esterco. Se no houvesse interao entre esse dois fatores, as retas do grfico seriam paralelas.

Exerccio (12.3)
Esse um teste de independncia entre as variveis incidncia de parasitose e raa. Hipteses: H0: A incidncia de parasitose independe da raa do animal (ou seja, as duas variveis no esto associadas) Ha: A incidncia de parasitose depende da raa do animal (ou seja, as duas variveis esto associadas)

Raa Pura No-pura Total

Tabela de valores esperados sob a hiptese de independncia (H0) Incidncia de parasitas Sim 700x155/1200=90,42 500x155/1200=64,58 155 No 700x1045/1200=609,58 500x1045/1200=435,42 1045

Total 700 500 1200

Estatstica de Teste:

X X

(105 90,42) 2 (595 609,58) 2 (50 64,58) 2 (450 435,42) 2 + + + 90,42 609 ,58 64,58 435,42

= 2,352 + 0,349 + 3,293 + 0,488 = 6,482


2 obs

Regio de Rejeio: Rejeita-se H0 se X

>

2 1;0,01

= 6,64

Verificao: Como 6,482 no est na regio de rejeio (6,482 > 6,64), no rejeitamos a hiptese nula ao nvel de significncia de 1%. Concluso: Ao nvel de significncia de 1%, no rejeitamos a hiptese de independncia entre a incidncia de parasitose e a raa do animal (0,01 < valor P < 0,025). Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG 74

Clculo do Valor P:

Valor P = P[X

2 1

> 6,482] = ?

Na tabela Qui-Quadrado, na linha 1, no existe o valor 6,482. Mas 6,482 est entre os valores 5,024 e 6,635, correspondentes s colunas de 2,5% e 1% de probabilidade, 2 respectivamente. Assim, P[X 1 > 6,482] est entre 0,01 e 0,025. Desse modo, 0,01 < Valor P < 0,025. Como Valor P > 0,01 (), no rejeitamos a hiptese nula ao nvel de significncia de 1%, confirmando (como esperado) a concluso anterior.

Medindo a associao entre variveis: a Razo das Chances Atravs de teste Qui-quadrado verificou-se a existncia de associao entre a incidncia de parasitose e raa. Como quantificar esta associao? Quando as variveis so quantitativas, pode-se medir a associao linear entre duas variveis atravs do coeficiente de correlao. Quando duas variveis so qualitativas, essa medida seria o Risco Relativo. Porm, o Risco Relativo s pode ser calculado em estudos prospectivos, que no o caso do estudo desse problema, pois os animais foram classificados simultaneamente quanto raa e incidncia de parasitose (os grupos de raa no-pura e pura no foram fixados previamente e depois contada a incidncia de parasitose). A medida alternativa ao Risco Relativo nesses casos a Razo das Chances (RC). Chance definido como razo de probabilidades. A chance de ter parasitose no grupo de raa pura, por exemplo, definido como a razo entre a probabilidade de ter parasitose e a probabilidade de no ter parasitose, ou seja, (105/700) / (595/700) = 105/595 = 0,18. No grupo de raa no-pura, a chance de ter parasitose 50/450 = 0,11. Comparando as chances nos dois grupos, temos que 0,176/0,111 = 1,59. Essa a estimativa da Razo das Chances de parasitose entre os grupos de raa pura e no-pura. Interpretando esse nmero, vemos que a chance de parasitose no grupo de raa pura 59% maior do que no grupo de raa nopura. De maneira geral, no caso de tabelas 2x2 como a que apresentamos a seguir Resposta de Interesse Sucesso Fracasso a b c d a+c b+d

Grupo A B Total

Total a+b c+d a+b+c+d

a razo das chances de sucesso entre o grupo A e B estimada como


a a+b chance de sucesso no grupo A RC = = chance de sucesso no grupo B

b a a + b = b = ad . c c b c d c+d d c+d

No caso do problema, RC =

105 chance de parasitose no grupo raca pura 595 = 105 450 = 1,59 = chance de parasitose no grupo raca nao - pura 50 50 595 450

Exerccio (12.4)
Esse um teste de independncia entre as variveis ocorrncia de tromboembolismo e grupo sanguneo. Hipteses: H0: A ocorrncia de tromboembolismo independe do grupo sanguneo (ou seja, as duas variveis no esto associadas) Ha: A ocorrncia de tromboembolismo depende do grupo sanguneo (ou seja, as duas variveis esto associadas)

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

75

Grupo Sanguneo A B AB O Total

Tabela de valores esperados sob a hiptese de independncia (H0) Ocorrncia de tromboembolismo Sim 79 x 56/1200 = 22,12 21 x 56/1200 = 7,56 27 x 561200 = 5,88 73 x 56/1200 = 20,44 56 No 79 x 144/1200 = 56,88 21 x 144/1200 = 19,44 27 x 144/1200 = 5,12 73 x 144/1200 = 52,56 144

Total 79 21 27 73 200

Estatstica de Teste:

X
+

( 32 22 ,12 ) 2 ( 47 56 ,88 ) 2 (8 7 ,56 ) 2 (19 19 ,44 ) 2 + + + + 22 ,12 56 ,88 7 ,56 19 ,44

 "!#!%$& !!!"!'$(!#!%)01230!%($'546!78@96A9B


Regio de Rejeio: Rejeita-se H0 se X
2 obs

( 7 5,88 ) 2 (14 5,12 ) 2 ( 9 20 ,44 ) 2 ( 64 52 ,56 ) 2 + + + 5,88 5,12 20 ,44 52 ,56

>

2 3;0,01

= 11,345

Verificao: Como 15,354 est na regio de rejeio (15,354 > 11,345), rejeitamos a hiptese nula ao nvel de significncia de 1%. Concluso: Ao nvel de significncia de 1%, rejeitamos a hiptese de independncia a ocorrncia de tromboembolismo e o grupo sanguneo (Valor P < 0,005). Clculo do Valor P: Valor P = P[X
2 3

> 15,354] = ?

Na tabela Qui-Quadrado, na linha 3, no existe o valor 15,354. 2 Ele maior do que o ltimo valor (12,838), correspondente coluna do 0,5%. Assim, P[X 3 > 15,354] menor do que 0,5%. Desse modo, Valor P < 0,005.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

76

Referncias Bibliogrficas

Nogueira, M. L. G. et alli (1997), Introduo Bioestatstica, apostila do Instituto de Cincias Exatas da UFMG. Soares, J. F. et alli ( ), Introduo Estatstica, Editora Guanabara Dois Triola, M. F. (1998), Introduo Estatstica, 7 Edio, LTC.

Edna A. Reis e Ilka A. Reis - Departamento de Estatstica - UFMG

77

Вам также может понравиться