Вы находитесь на странице: 1из 111

Sum ario

1 Deni c oes e Conceitos em Bioestat stica Aplicada 1.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Estat stica M edica . . . . . . . . . . . . . . . . . . . 1.3 Dados Biom etricos . . . . . . . . . . . . . . . . . . . 1.4 Os Conceitos da Bioestat stica . . . . . . . . . . . . 1.4.1 Popula c ao . . . . . . . . . . . . . . . . . . . . 1.4.2 Censo . . . . . . . . . . . . . . . . . . . . . . 1.4.3 Amostra . . . . . . . . . . . . . . . . . . . . . 1.4.4 Par ametros . . . . . . . . . . . . . . . . . . . 1.4.5 Estimativas dos Par ametros ou Estat stica . . 1.4.6 Unidade de Amostragem . . . . . . . . . . . . 1.4.7 Vari aveis . . . . . . . . . . . . . . . . . . . . 1.4.8 Vari aveis Aleat orias (v.a.) . . . . . . . . . . . 2 Experimenta c ao Biom etrica 2.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . 2.2 O Racioc nio Indutivo da Biometria . . . . . 2.3 Delineamentos Experimentais . . . . . . . . . 2.3.1 Etapa de um levantamento estat stico 2.4 Aspectos Estat sticos dos Estudos Etiol ogicos 2.4.1 Estudo de Caso-Controle . . . . . . . 2.4.2 Estudo de Coorte . . . . . . . . . . . . 2.4.3 Ensaios Cl nicos Aleatorizados . . . . 2.4.4 Estudos Descritivos . . . . . . . . . . 2.4.5 Seccionais ou Transversais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 2 3 5 5 5 5 5 5 5 6 7 7 7 7 8 10 11 13 16 17 18 20 20 20 21 23 24 26 27 27 30 32 32 34 36

3 Estat stica Descritiva 3.1 Organiza c ao de Dados Estat sticos . . . . . . . . . . . 3.1.1 Normas para a Apresenta c ao Tabular de Dados 3.2 Distribui c ao de Freq u encias . . . . . . . . . . . . . . . 3.3 Gr acos . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Diagramas . . . . . . . . . . . . . . . . . . . . . 3.3.2 Histograma . . . . . . . . . . . . . . . . . . . . 3.4 Medidas Descritivas . . . . . . . . . . . . . . . . . . . 3.4.1 Medidas de Tend encia Central ou de Posi c ao . 3.4.2 Medida de Variabilidade ou de dispers ao . . . . 3.5 Medidas Separatrizes . . . . . . . . . . . . . . . . . . . 3.5.1 Quartis, Decis e Percentis . . . . . . . . . . . . 3.5.2 Medidas de Simetria . . . . . . . . . . . . . . . 3.5.3 Medidas de Curtose . . . . . . . . . . . . . . .

4 Infer encia Estat stica 4.1 Introdu c ao . . . . . . . . . . . . . . . . . . . 4.2 Problemas de Infer encia . . . . . . . . . . . 4.3 Distribui c ao Amostral . . . . . . . . . . . . 4.4 Distribui c oes de Probabilidade . . . . . . . 4.4.1 Distribui c ao Binomial . . . . . . . . 4.4.2 Distribui c ao de Poisson . . . . . . . 4.4.3 Distribui c ao Normal . . . . . . . . . 4.5 Verica c ao da Adequa c ao do Modelo . . . . 4.6 Faixas de Refer encia . . . . . . . . . . . . . 4.7 Teorema do Limite Central . . . . . . . . . 4.8 Tamanho da Amostra . . . . . . . . . . . . 4.8.1 M etodo simples . . . . . . . . . . . . 4.8.2 M etodo inferencial . . . . . . . . . . 4.9 Testes de Hip oteses . . . . . . . . . . . . . . 4.9.1 Constru c ao de um Teste de Hip otese 4.9.2 O p-valor . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . .

38 38 38 39 39 39 40 40 42 42 44 45 45 46 48 48 50

5 An alise em Tabelas 2x2 e LxC 51 5.1 Tabelas de Conting encia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 5.2 Teste de Independ encia e de Homogeneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6 Compara c oes Entre Grupos 6.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Resposta Dicot omica: Amostras Independentes . . . . . . . . . . . . . . . . 6.2.1 Teste Qui-Quadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 Teste Exato de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.3 Teste z para Compara c ao de Propor c oes . . . . . . . . . . . . . . . . 6.3 Resposta Dicot omica: Amostras Pareadas . . . . . . . . . . . . . . . . . . . 6.3.1 Teste de McNemar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Resposta Cont nua - Teste de M edias para Amostras Independentes . . . . 6.4.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Teste z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Resposta Cont nua - Teste de M edias para Amostras Pareadas . . . . . . . 6.5.1 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 Testes N ao-Param etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6.1 Teste U de Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . 6.6.2 Teste H de Kruskal-Wallis para k amostras . . . . . . . . . . . . . . 6.6.3 Teste de Wilcoxon (Amostras Pareadas ou dependentes) . . . . . . . 6.6.4 Teste de Friedman para k tratamentos . . . . . . . . . . . . . . . . . 6.7 Outros Testes N ao-Param etricos . . . . . . . . . . . . . . . . . . . . . . . . 6.7.1 Teste de Concord ancia ou de Replicabilidade (Coeciente de Kappa) 6.7.2 Teste de Cochran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 An alise de Vari ancia 7.1 An alise de Vari ancia para Experimentos ao Acaso . . . . . 7.2 Teste Param etrico para Compara c oes M ultiplas . . . . . . 7.2.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . 7.2.2 Teste Dunnett . . . . . . . . . . . . . . . . . . . . 7.3 Teste N ao-Param etrico para Compara c oes M ultiplas . . . 7.3.1 Teste Dunn-Bonferroni . . . . . . . . . . . . . . . . 7.4 An alise de Vari ancia com N umero Diferente de Repeti c oes 7.4.1 Teste Tukey . . . . . . . . . . . . . . . . . . . . . . 7.4.2 Teste t . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.3 Teste Dunnett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 61 61 63 65 65 66 67 67 68 69 69 71 71 74 75 78 79 79 80 83 83 86 86 88 89 89 91 93 94 94

8 Testes Cl nicos 8.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . 8.2 Testes Diagn osticos . . . . . . . . . . . . . . . . . . 8.2.1 Sensibilidade e Especicidade . . . . . . . . 8.2.2 Valor das Predi c oes: VPP e VPN . . . . . . 8.2.3 Decis oes Incorretas: PFP e PFN . . . . . . 8.2.4 Combina c ao de Testes Diagn osticos . . . . 8.2.5 Escolha entre Testes Diagn osticos . . . . . . 8.2.6 Rela c ao entre Sensibilidade e Especicidade 8.2.7 Curva ROC . . . . . . . . . . . . . . . . . . Refer encias Bibliogr acas

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

95 . 95 . 95 . 96 . 97 . 98 . 98 . 101 . 104 . 104 107

Cap tulo 1

Deni c oes e Conceitos em Bioestat stica Aplicada


1.1 Introdu c ao

O objetivo deste cap tulo e ilustrar o papel que conceitos e t ecnicas estat sticas t em na forma c ao do estat stico especializado na area biom etrica, na sua pr atica prossional e de modo especial no avan co do conhecimento nesta area espec ca. Este objetivo ser a alcan cado principalmente atrav es da apresenta c ao e discuss ao dos resultados de estudos relevantes. Atrav es destes exemplos, argumenta-se que conceitos estat sticos t em importante papel a desempenhar, tanto no estudo da sa ude de popula c oes, como nos tratamentos individuais.

1.2

Estat stica M edica

A m a utiliza c ao de dados m edicos ou de outras ci encias, com interpreta c oes err oneas ou mal intencionadas, tem produzido um grande ceticismo em rela c ao ` a estat stica. Podemos encontrar muitos professores, cl nicos ou mesmo prossionais de ci encias b asicas, que acham que bom senso e suciente para tratar desses dados, que qualquer coisa que exija prova estat stica n ao pode ter valor pr atico ou que procurar ao um matem atico se tiverem algum problema estat stico em seu trabalho. importante compreender, no entanto, que cada v E ez que se toma a m edia de duas leituras de pipeta, por exemplo, ou o n umero m edio de dias de interna c ao no hospital de pacientes com determinada doen ca, se est a usando um m etodo estat stico. Do mesmo modo, usamos m etodos estat sticos para concluir que a press ao arterial do paciente est a normal ou que um tratamento cir urgico e melhor que outro. Deste modo, a Estat stica M edica se constitui realmente nos princ pios da Medicina Quantitativa. Muito da medicina depende, direta ou indiretamente, de contagem ou mensura c ao. Isto e obvio em pesquisa e verdadeiro tamb em no diagn ostico. Quando um m edico, examinando um n odulo no seio de uma paciente, leva em considera c ao sua idade e hist oria familiar, logo est a usando dados quantitativos, ou seja, a incid encia de tumores por idade e por fam lia. Convencionou-ser chamar de Bioestat stica o conjunto de conceitos e m etodos cient cos usados no tratamento da variabilidade nas ci encias m edicas e biol ogicas. A Bioestat stica fornece m etodos para se tomar decis oes otimas na presen ca de incerteza, estabelecendo faixas de conan ca para a ec acia dos tratamentos e vericando a inu encia de fatores de risco no aparecimento de doen cas. Dentro da area biol ogica, compreende-se por Biometria a ci encia que estuda as medidas de seres vivos. A enfase crescente do papel dos m etodos quantitativos na pr atica da medicina torna imperativo que o estudante de medicina assim como o m edico tenham algum conhecimento de estat stica. O estudante aprende na escola o melhor m etodo de diagnose e terap eutica; depois de formado depender a necessariamente de trabalhos apresentados em reuni oes, jornais e revistas m edicas, para aprender novos m etodos de terapia, assim como os progressos em diagnose e t ecnica cir urgica. Portanto, dever a estar apto a avaliar por si pr oprio os resultados de outros pesquisadores, dever a decidir quando uma nova t ecnica ou m etodo pode substituir os antigos. Dever a estar apto a responder ` a pergunta da m ae que o consulta

1.3

Dados Biom etricos

ROSSI, Robson M. 2

sobre a vacina mais recente e, com a mesma seguran ca, aconselh a-la em rela c ao ` a vacina antip olio ou antisarampo. Dever a estar apto a dar ` a fam lia do paciente seguran ca quanto ao diagn ostico, o que pode depender de sua capacidade de avaliar adequadamente os resultados de exames laboratoriais, como tamb em de seu conhecimento sobre a rela c ao da idade, sexo e outras condi c oes do paciente a uma determinada doen ca. Os novos conhecimentos vir ao atrav es do trabalho de pesquisa realizado por ele pr oprio ou por outros. Deve, portanto, ser capaz de selecionar, da massa de informa c oes, aquelas que forem v alidas e que resistirem a testes cient cos r gidos. Deve desenvolver um ceticismo sadio em rela c ao a tudo que l e. Uma no ca o b asica em planejamentos experimentais referentes ` a pesquisa m edica, e o reconhecimento de que os indiv duos diferem n ao apenas uns dos outros, mas tamb em em rela c ao a si pr oprios, de dia para dia ou mesmo de hora para hora. Uma certa quantidade de varia c ao e normal, mas a quest ao que desaa o m edico e determinar quando uma varia c ao espec ca se torna patol ogica (referente ` a doen ca). Para isso, o estudante deve aprender como medir a varia c ao em indiv duos normais e denir qual e o limite de varia c ao altamente normal. Deve aprender que h a algum erro aleat orio presente em cada medida ou contagem feita. E improv avel que duas contagens sucessivas de gl obulos, feitas na mesma amostra de sangue, sejam id enticas. Quando, por em, uma diferen ca se torna maior que o erro de mensura c ao? Para tratar seu paciente do melhor modo poss vel, o m edico deve saber responder ` a quest oes como essa. Para cada medida ou determina c ao fornecida pelo laborat orio, o m edico deve conhecer a varia c ao que e parte do pr oprio m etodo, para saber quando uma dada varia c ao representa uma mudan ca real no paciente. Sempre que novos m etodos de terapia s ao introduzidos, e necess ario saber se s ao realmente superiores, isto e, mais ecientes aos velhos m etodos. Ser a nacess ario fazer-se a avalia c ao cr tica do estudo experimental, vericando principalmente se as medidas foram realizadas de modo a produzir resultados dedignos, se o fator em prova foi o u nico fator de diferen ca entre o grupo experimental e o grupo controle, se a diferen ca entre os resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribu da ao acaso. Apenas depois da avalia c ao, atrav es de t ecnicas estat sticas adequadas, da dedignidade dos resultados, comparabilidade dos grupos experi encia e controle e, signic ancia da diferen ca encontrada e que podemos tirar as conclus oes relativas ao novo m etodo. O n umero de falhas encontradas em publica c oes m edicas enfatiza a necessidade de uma avalia c ao cr tica da literatura. Para ajudar o estudante a desenvolver tal atitude s ao necess arios certos conceitos estat sticos b asicos e uma certa familiaridade com a terminologia mais usada. M etodos estat sticos s ao essenciais no estudo de situa c oes em que as vari aveis de interesse est ao sujeitas, inerentemente, a utua c oes aleat orias. Este e o caso da area da sa ude principalmente na Medicina. Mesmo tomando-se um grupo de pacientes homog eneos, observa-se grande variabilidade, por exemplo, no tempo de sobrevida ap os um tratamento adequado. Dosagens de caracter sticas hematol ogicas utuam n ao s o entre indiv duos, como tamb em no mesmo indiv duo em ocasi oes diferentes. Na realidade, h a varia c oes entre diferentes pacientes para qualquer vari avel de interesse cl nico. Portanto, para se estudar problemas cl nicos, e necess aria uma metodologia capaz de tratar a variabilidade de forma adequada. Deve-se notar, entretanto, que ao tratar um paciente, o m edico se vale da experi encia de eventos anteriores, vivenciada pessoalmente ou transmitida por outros atrav es de livros e artigos. Assim, a Estat stica pode ser vista como ferramenta de organiza c ao e valida c ao do conhecimento m edico.

1.3

Dados Biom etricos

Nas areas m edica e biol ogica coletam-se dados de pessoas, de animais experimentais e de fen omenos f sicos e qu micos. Interessam aos pesquisadores dessas areas dados sobre mortalidade infantil, eci encia de medicamentos, incid encia de doen cas, causas de morte etc. Os dados referem-se a vari aveis, classicadas como qualitativas, ordinais e quantitativas. O dado qualitativo est a fortemente presente nas ci encias da sa ude. Caracter sticas de pessoas, ra ca, doen cas, etc, s ao freq uentemente medidas como vari aveis categ oricas. No entanto, merc e de sua tradi c ao escol astica, as ci encias da sa ude ainda mostram prefer encia pelas medidas cont nuas de alta precis ao: medir em miligramas, mil metros etc. Engajado no conhecimento do bi ologo, o cientista da sa ude tende a isentar-se de reex ao sobre a import ancia das estrat egias de mensura c ao e an alise providas por outras ci encias, como a estat stica. sticas de homens com Exemplo 1.1. Com o objetivo de levantar conhecimento sobre algumas caracter doen cas card acas da cl nica especializada de Honolulu, no Hava , decidiu-se pesquisar os pacientes com idade entre 45 e 67 anos. As caracter sticas de interesse eram:

1.4 1 2 3 4 5 6 7 8 9

Os Conceitos da Bioestat stica N vel de instru c ao Peso Altura - Idade Fumante Atividade f sica Taxa de glicose Taxa de colesterol s erico Press ao sang u nea sist olica.

ROSSI, Robson M. 3

1.4

Os Conceitos da Bioestat stica

A estat stica pode ser utilizada simplesmente para descrever conjuntos de dados, mostrando sua distribui c ao, m edia, dispers oes, etc. Mas, pode ir al em, pode estar presente nas diversas etapas de uma pesquisa, desde o seu planejamento, at e na interpreta c ao de seus resultados, podendo ainda, inuenciar na condu c ao do processo da pesquisa. Deni c ao: Estat stica e um conjunto de conceitos e m etodos cient cos para a coleta, a organiza c ao, a descri c ao, a an alise e a interpreta c ao de dados experimentais, que permitem conclus oes v alidas e tomadas de decis oes razo aveis. Classica c ao: Usualmente, a estat stica e dividida em tr es grandes areas que atuam em conjunto: Planejamentos de Experimentos e Amostragem, Estat stica Descritiva e, Estat stica Inferencial.

a parte que tem por objetivo planejar a pesquisa e se Amostragem e Planejamento de Experimentos : E preocupa com o mecanismo da coleta de dados. a parte que tem por objetivo organizar, apresentar e sintetizar dados observados Estat stica Descritiva : E de determinada popula c ao, sem preten c oes de tirar conclus oes de car ater extensivo. a parte que, baseando-se em estudos realizados sobre os dados de Estat stica Inferencial ou Indutiva : E uma amostra, procura inferir, induzir ou vericar leis de comportamento da popula c ao da qual a amostra foi retirada. A estat stica inferencial tem sua estrutura fundamentada na teoria matem atica das probabilidades. tamb E, em denida como um conjunto de m etodos para a tomada de decis oes.

1.4

Os Conceitos da Bioestat stica

ROSSI, Robson M. 4

A Estat stica est a presente em diversas areas e em diversas abordagens. Podemos citar alguns exemplos de suas aplica c oes: 1. Elei c oes : An uncio pr evio, em termos percentuais, de que o candidato A e o prov avel vencedor. (A previs ao pode ser feita ap os a contagem de 2% dos votos); 2. Ind ustria : Teste de l ampadas ash para m aquinas fotogr acas. O fabricante deve saber com anteced encia se o lote fabricado pode ser colocado no mercado ou n ao (Ele pode estar sujeito a riscos ! O Recall e um exemplo, onde ocorre a retirada ou troca de produtos devido a uma falha em algum est agio de fabrica c ao n ao detectado pelo controle de qualidade); 3. Meteorologia : Informa que a chance de chuva para hoje e de 30% (utiliza c ao de m etodos estat sticos de previs ao); 4. Mercado de Valores : Decis ao na compra ou venda de a c oes Risco; 5. Institui c oes Banc arias/Cr edito : An alise de cr edito; Seguro de Vida e/ou de autom oveis; 6. IBGE/ ndices : Censo; Taxa de desemprego; Ina c ao; Custo de vida; Valor do sal ario m nimo, cesta b asica, ndices de pre cos-INPC; Taxa de mortalidade/Natalidade; Indices de analfabetismo, etc. 7. Farm acia/Medicina : Analisar a entrada de um novo medicamento, vericando a sua ec acia. Deve-se tomar muito cuidado com a tomada de decis ao; 8. Pesquisas : Estudo sobre h abitos migrat orios de certo animal; Estima c ao do tamanho populacional de certas esp ecies; 9. Experimenta c ao Agr cola : Estudos de uma nova variedade de semente (modica c ao gen etica) ou de fertilizantes; 10. Telecomunica c oes : A utiliza c ao da Internet gera informa c oes preciosas de clientes ; Controle de tr afego telef onico, chamadas e consumo, for cam a utiliza c ao de modelos estat sticos complexos; c ao Zoot ecnica : Estudo do desenvolvimento de um animal e an alise de fatores que in11. Experimenta uenciam neste desenvolvimento tais como, alimenta c ao, cativeiro e outros; Melhoramento gen etico; Pesquisas com vacinas animais entre outros. A amostragem e naturalmente usada na vida di aria. Por exemplo, para vericar o tempero de um alimento em prepara c ao, pode-se provar (observar) uma pequena por c ao deste alimento. Desta forma, est a se fazendo uma amostragem, ou seja, extraindo do todo (popula c ao) uma parte (amostra), com o prop osito de avaliar (inferir) sobre a qualidade de tempero de todo o alimento. Nas pesquisas cient cas em que se quer conhecer algumas caracter sticas de uma popula c ao, tamb em e muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter valores aproximados, ou estimativas, para as caracter sticas populacionais de interesse. Este tipo de pesquisa e usualmente chamado de levantamento por amostragem. Num levantamento por amostragem, a sele c ao dos elementos que ser ao observados, deve ser feita sob uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar caracter sticas de toda a popula c ao. A popula c ao pode ser formada por pessoas da fam lia, indiv duos de uma certa esp ecie, estabelecimentos industriais, ou qualquer outro tipo de elementos, cujas vari aveis que se pretende estudar sejam pass veis de serem mensuradas. Os elementos de uma popula c ao diferem entre si com respeito a fatores tais como: sexo, idade, medidas f sicas, cor, susceptibilidade a doen ca, agressividade, etc. Desta forma o padr ao de comportamento no qual o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por estas raz oes, muitos trabalhos nas ci encias em geral tendem a ser de natureza comparativa, procurando lidar com as varia c oes inerentes.

1.4

Os Conceitos da Bioestat stica

ROSSI, Robson M. 5

1.4.1

Popula c ao

qualquer conjunto de elementos, tendo pelo menos uma vari E avel em comum (Pode ser nita ou innita).

1.4.2

Censo

Pesquisas utilizando todos os elementos da popula c ao. Obs. Desvantagem quando a popula c ao e muito grande Ex.: A popula c ao brasileira estimada em novembro/2004: 182.405.960 (Fonte: IBGE - http://www.ibge.gov.br/).

1.4.3

Amostra
Pesquisas utilizando amostras da popula c ao denominam-se

qualquer subconjunto da popula E c ao. pesquisas por amostragem.

1.4.4

Par ametros

S ao certas caracter sticas populacionais espec cas que se deseja descrever.

1.4.5

Estimativas dos Par ametros ou Estat stica

S ao os valores calculados a partir dos dados da amostra, com o objetivo de avaliar par ametros desconhecidos, por exemplo, m edia amostral.

1.4.6

Unidade de Amostragem

a unidade a ser selecionada para se chegar aos elementos da popula E c ao. Pode ser os pr oprios elementos da popula c ao, ou, outras unidades f aceis de serem selecionadas e que, de alguma forma, estejam associadas aos elementos da popula c ao.

1.4.7

Vari aveis

S ao as caracter sticas medidas. As vari aveis apresentam variabilidade dentro da popula c ao. Podem ser qualitativas ou quantitativas. Vari aveis Qualitativas Quando seus valores forem expressos por atributos (n ao-num ericos). Nominal quando tem nome (ex.: Cor dos olhos, sexo, ra ca, consumo de alcool (sim, n ao), gostar de estudar ... etc). Ordinal quando tem ordem (ex.: classe social, grau de instru c ao, consumo de alcool (pouco, m edio, muito) ... etc). Vari aveis Quantitativas Quando seus valores podem ser descritos numericamente. Discreta quando seus valores resultam de contagem (ex.: n umero de lhos, n umero de reprova c oes, n umero de copos de alcool consumidos... etc). nua quando seus valores resultam de medi c oes e podem assumir qualquer valor em um intervalo Cont da reta (ex.: estatura, nota na prova, imc, quantidade de alcool consumido ... etc).

1.4

Os Conceitos da Bioestat stica

ROSSI, Robson M. 6

1.4.8

Vari aveis Aleat orias (v.a.)

S ao provenientes de Experimentos Aleat orios (todos as possibilidades s ao equiprov aveis, isto e, tem a mesma chance de ocorr encia). As v.as. geralmente s ao representadas por letras mai usculas A, X, Y ou W, que podem assumir qualquer um dos conjuntos de valores que lhe s ao atribu dos. car uma moeda e observar a sua face, existem duas possibilExemplo 1.2. Em um experimento de lan idades:Cara ou Coroa. Considerando uma v.a. discreta X: n umero de caras em dois lan camentos, temos: Cara: c possibilidades {cc,ck,kc,kk}: X : {0, 1, 2}. Coroa: k

Cap tulo 2

Experimenta c ao Biom etrica


2.1 Introdu c ao

Na medicina como em outros campos da ci encia aplicada, o efeito geral da estat stica e tornar um observador mais cr tico e mais consciente quando, por falta de informa c ao segura, ele tem de agir com base em impress oes ou opini ao. Esta e a atitude cient ca, e o melhor modo de come car a adquir -la e procurar evid encias, e provar. Alguns princ pios dessa procura de evid encias ser ao estudadas neste cap tulo.

2.2

O Racioc nio Indutivo da Biometria

Quando realizamos um experimento, a observa c ao resultante e vista n ao como um resultado a esmo e irreprodut vel, mas como um resultado que poderia vir a ser obtido outras vezes, sempre que o experimento fosse repetido nas mesmas condi c oes. De fato, a generaliza c ao e feita sob a hip otese de que o resultado obtido e t pico de uma classe de experimentos similares e, se consegu ssemos repetir, exatemente, um experimento, uma u nica observa c ao constitui-se-ia em base suciente para fazermos arma c oes gerais. Na pr atica, obviamente, nunca podemos garantir que dois experimentos sejam exatamente iguais em cada min ucia de suas circunst ancias, de tal sorte que nunca podemos garantir resultados identicamente reprodut veis. As observa c oes v ao, de fato, variar em maior ou menor grau - aquilo que chamamos de erro experimental estar a presente - e, em lugar de um u nico resultado que se repete exatamente, teremos numerosos resultados que variam entre si, de acordo com o tamanho do erro experimental. As nossas generaliza c oes n ao podem ser absolutamente precisas: devem levar em considera c ao o erro experimental e conter, em si, um elemento de incerteza. Essa incerteza e caracter stica do racioc nio indutivo, e o grande problema no racioc nio do particular ao geral e levar em devida conta essa incerteza. Em Biologia, o problema da incerteza e muito s erio, pois organismos vivos e suas partes s ao coisas altamente vari aveis. Eles est ao inuenciados por uma riqueza de fatores - gen eticos, ambientais e de desenvolvimento - de tal modo que nenhuma situa c ao do sitema pode ser reproduzida exatamente; em geral elas n ao podem ser reproduzidas nem com muita aproxima c ao. Poucas (se e que algumas) circunst ancias de um experimento podem ser supostas triviais em seus efeitos sobre os resultados e raramente conseguimos identicar um ou dois fatores cujos controles reduziriam o erro experimental a propor c oes desprez veis. Efetivamente, com muita freq u encia o nosso problema e tentar distinguir um efeito que seja pouco maior do que o de outros fatores que provocam a varia c ao do sistema; devemos ent ao enfrentar o problema: Qual deve ser a dedignidade da mensura c ao? Ou mesmo: Ser a o efeito observado atribu vel ao fator em que estamos interessados, ou ser a conseq u encia de alguma outra causa de varia c ao que n ao pudemos reconhecer e certamente n ao pudemos controlar?

2.3

Delineamentos Experimentais

Muitos trabalhos em pesquisas m edicas s ao acometidos de v arios erros devido ao procedimento na coleta e no tratamento de dados. Um dos fen omenos mais comuns e a ocorr encia de diferen cas entre homens e mulheres, entre crian cas e adultos, entre as estaturas, pesos, cor dos olhos e comportamento de pessoas

2.3

Delineamentos Experimentais

ROSSI, Robson M. 8

da mesma ra ca, sexo e idade, entre diferentes amostras da mesma subst ancia qu mica pura. Todas essa diferen cas s ao coletivamente chamadas varia c ao e a estat stica pode ser descrita como ci encia de tratar a varia c ao. Os seres humanos s ao t ao innitamente vari aveis interna quanto o s ao externamente, mas algumas mat erias b asicas do curso m edico, como a Anatomia, parecem n ao reconhecer tal fato, deixando de destacar esse profundo sentido da varia c ao humana. A pseudoprecis ao anat omica, criando um conceito articial do corpo humano no in cio da carreira do estudante, parece que largamente partilham essa responsabilidade; e mesmo se todos os professores enfatizassem a import ancia da varia c ao, n ao iria ajudar muito, a n ao ser que o estudante adquirisse pr atica em enfrentar problemas que surgem da varia c ao - especialmente, pr atica na procura de evid encias e uma atitude cr tica em face dos assuntos que l e, ouve ou discute.

2.3.1

Etapa de um levantamento estat stico

A. Planejamento experimental. Consiste no planejamento da pesquisa que ser a realizada: Mainland, D. (1952) em Elementary medical statistics - The principles of quantitative medicine, sugere nove quest oes que constituem um roteiro valioso para desenvolvimento dessa atitude: 1. Quem?...(relativa ao pesquisador) 2. Para qu e?...(relativa ao objetivo da pesquisa) e?...(refere-se a pessoas, coisas ou fatos estudados) 3. O qu 4. Onde?...(refere-se ao local e ambiente) 5. Quando?...(refere-se ao tempo) 6. Como?...(relativa aos m etodos) as medidas) 7. Quanto?...(relativa ` 8. Quantos?...(relativa ` a enumera c ao) 9. Por qu e?...(referente ` a interpreta c ao causal) Tomadas as devidas precau c oes, alguns aspectos estat sticos dever ao ser analisados e o tipo de estudo adequado dever a ser abordado. Exemplo 2.1. Considere a seguinte hip otese: Associa c ao entre incid encia de luz solar e c ancer de mama. Compara c oes regionais, na antiga Uni ao sovi etica, mostraram correla c ao negativa entre incid encia de luz solar e de c ancer do seio: em locais de baixa luminosidade solar, foi encontrada alta incid encia deste tipo de neoplasia, e vice-versa. Em muitos pa ses, semelhante associa c ao tamb em foi detectada. A evid encia sugere, segundo os autores, que a vitamina D possa ter papel de relevo na redu c ao do risco de c ancer de mama, e estudos adicionais devem ser feitos para esclarecer a mat eria. (GOHAM et al, 1990). Os principais delineamentos experimentais para a realiza c ao destas pesquisas ser ao: 1. Quem? GOHAM et al. 2. Para qu e? Vericar a associa c ao entre a taxa de incid encia de luz solar sobre indiv duos em diferentes lugares com luminosidades desiguais e a incid encia de c ancer de mama. 3. O qu e? N umero de mulheres com c ancer de mama e incid encia de luminosidade no local destas onde habitam estas mulheres. Pelo fato de quanto maior a luminosidade maior a s ntese de vitamina D pela pele, h a evid encias que a vitamina D possa ter elevo na redu c ao do risco de c ancer de mama. 4. Onde? Regi oes diferentes que apresentam tamb em diferentes incid encias de luminosidade na antiga Uni ao Sovi etica. 5. Quando? 1990.

2.3

Delineamentos Experimentais

ROSSI, Robson M. 9

6. Como? (Metodologia): considerando que o c ancer de mama e o que mais mata nas mulheres, por em em rela c ao ` a popula c ao de mulheres e uma doen ca pouco prevalente, como, por exemplo, Transtorno Pr e-Menstrual. Assim, um estudo de caso-controle em mulheres com c ancer de mama j a diagnosticado exposto ` a luminosidade solar por um per odo de tempo predeterminado devendo ser razoavelmente grande, mas n ao saberia dizer quanto sem revis ao bibliogr aca. Na entrevista retrospectiva perguntaria as mulheres h a quanto tempo residiam naquela regi ao, e se tivessem dentro do tempo predeterminado entrariam no estudo. Faria tamb em um grupo controle de mulheres daquela regi ao para compara c ao dos dados. Repetindo este mesmo estudo em mulheres de diferentes regi oes com diferentes luminosidades, e comparando-se as taxas de fatores de riscos, poder-se-ia chegar a conclus ao de associa c ao e em seguida calcular o Odds Ratio, isto e, a raz ao de chances. umero de mulheres diagnosticadas com c ancer de mama comparadas 7. Quanto? As medidas seriam o n a um n umero semelhantes de mulheres sem o c ancer (controles) separadas ap os serem examinadas por m edicos. J a a luminosidade colheria as informa c oes com as centrais de meteriol ogicas locais ou algum centro de refer encia deste assunto para o estudo. 8. Quantos? A amostra tentaria ser a maior poss vel para melhorar a conabilidade dos resultados, j a que a doen ca e pouco prevalente. Procuraria os centros de sa udes locais (hospitais, cl nicas especializadas, etc) das respectivas regi oes a serem estudadas. Se o n umero de centros for muito grande e for muito dif cil abord a-los, sortearia os centros para amostragem. 9. Por qu e? Alguns cuidados t em que serem relevados como o v cio da sele c ao, de informa c ao e confundimento. Por exemplo, a ingest ao de alimentos ricos em precursores e da pr opria vitamina D bem como uso de suplementos alimentares com vitamina D (p lulas), poderia inuenciar os resultados dos estudos. Observa c ao: Outros tipos de estudos e delineamentos podem ser utilizados nesta pesquisa. Avalia ca o de informa c oes existentes. Inicialmente, deve-se realizar um levantamento bibliogr aco sobre o assunto para obter subs dios que podem representar valiosa colabora c ao para o estudo e, tamb em, serem aproveitados nas discuss oes posteriores. B. Formula c ao de hip oteses. Com exce c ao das pesquisas meramente descritivas, todas as pesquisas estat sticas comportam a formula c ao de hip oteses. Com base nos dados observados, a hip otese ser a rejeitada ou n ao. C. Verica c ao das hip oteses. A verica c ao das hip oteses ser a realizada no decorrer da pesquisa. D. Delineamento da pesquisa. Compreende o estudo (planejamento) detalhado da coleta de dados, da realiza c ao do trabalho e da an alise dos dados. Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados retirados por outros indiv duos. Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observa ca o direta, o question ario ou interrogat orio e a entrevista. Observa c ao: e a observa c ao direta dos fen omenos em laborat orios ou na natureza. Question ario: e uma seq u encia de perguntas previamente preparadas. O question ario e aplicado por meio de entrevista ou remetido pelo correio. Os valores observados podem ser complementados por observa c ao. Execu c ao da pesquisa. Coleta dos dados e realiza c ao da an alise estat stica. An alise e apresenta c ao dos resultados. Os dados coletados devem ser apresentados na forma de: gr acos e/ou de tabelas. A an alise dos dados deve ser realizada pelo pesquisador, com a ajuda de um estat stico, aplicando os recursos estat sticos necess arios para refutar ou n ao as hip oteses previamente formuladas. cas card acas em Honolulu, Exemplo 2.2. Objetivo geral: conhecer o perl dos homens portadores de doen Hava . Para dar seq u encia a esta pesquisa, e preciso especicar melhor o que se quer conhecer da popula c ao de portadores de doen cas card acas, ou seja, os objetivos espec cos. Exemplos de alguns desses objetivos. c ao do grau de instru c ao dos portadores de doen cas card acas. (a) conhecer a distribui

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 10

(b) Conhecer a idade e o peso m edio dos portadores de doen cas card acas. (c) Conhecer os h abitos dos portadores de doen cas card acas. (d) Avaliar a condi c ao de sa ude dos portadores de doen cas card acas. Exemplo 2.3. Delineamento da pesquisa: um levantamento de dados a partir do levantamento das informa c oes contidas em uma amostra dos prontu arios dos pacientes. Dados observados: resultados de diversos atributos e medidas relativas aos pacientes selecionados para participarem da amostra. Esquematicamente:
Populao: Todos os portadores de doenas cardacas de Honolulu. Levantamento de dados. Amostra: Parte dos portadores de doenas cardacas de Honolulu. Dados observados. Plano de amostragem.

Figura 2.1: Esquema 1. Exemplo 2.4. Objetivo geral: Comparar a eci encia de dois m etodos para detectar o bacilo causador de tuberculose. Em outras palavras, quer-se avaliar se os meios utilizados s ao equivalentes ou se um e mais eciente que o outro. Delineamento da pesquisa: s ao formados dois grupos de pacientes com tuberculose e amostras de saliva destes pacientes foram colocadas em duas culturas (A e B). Dados observados: a detec c ao ou n ao do bacilo foi registrada para cada amostra, resultando em dois conjuntos, relativos a cada m etodo. Esquematicamente:

Meio A.

Meio B.

Grupo 1 de pacientes. Amostra 1 de respostas Sim ou No.

Grupo 1 de pacientes. Amostra 2 de respostas Sim ou No.

Figura 2.2: Esquema 2. Este e um delineamento de pesquisa experimental, onde o pesquisador exerce controle sobre o m etodo utilizado.

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

O objetivo central da pesquisa etiol ogica (parte da medicina que trata das causas das doen cas) e determinar se o fato de uma pessoa contrair uma dada doen ca est a associado com um dado fator, o qual pode ser, por exemplo uma caracter stica pessoal, alguma especicidade do ambiente onde viveu ou uma experi encia

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 11

pela qual passou. Discutiremos maneiras de se organizar um estudo etiol ogico, m etodos estat sticos para se determinar quais fatores est ao associados com o contrair da doen ca e meios de se quanticar esta associa c ao. A pesquisa etiol ogica e baseada em dados coletados em pacientes convenientemente escolhidos. O pesquisador n ao controla quem ser a exposto ou n ao ao fator em quest ao, mas tem liberdade de determinar quem entrar a ou n ao no estudo. Para que os resultados tenham validade, a pesquisa tem de ser planejada segundo modelos bem denidos. Os principais tipos de planejamento para estudos etiol ogicos receberam os nomes de estudos tipo Caso-Controle, estudos tipo Coorte, Ensaios Cl nicos Aleatorizados, Estudos Descritivos e Seccionais ou Tranversais.

2.4.1

Estudo de Caso-Controle

Um estudo tipo caso-controle pode ser denido como um estudo no qual a determina c ao da associa c ao da doen ca com um fator e baseada na observa c ao de freq u encias muito altas ou muito pequenas do fator entre as pessoas doentes. Para isto um grupo de indiv duos afetados pela doen ca em quest ao e comparado com um grupo controle de indiv duos n ao afetados. Como as informa c oes s ao obtidas de maneira retrospectiva, freq uentemente, este tipo de planejamento recebe o nome de Estudo Retrospectivo. Um estudo retrospectivo come ca com um grupo de indiv duos, a serem chamados de casos, que tenham contra dos a doen ca em quest ao. O pesquisador escolhe como padr ao de compara c ao, um grupo controle constitu do de pacientes que n ao est ao sofrendo da doen ca. A seguir obtem a hist oria cl nica de todos os pacientes selecionados a m de averiguar a presen ca ou aus encia do fator de risco que est a sendo estudado. A quest ao e saber se o fator de risco est a presente mais freq uentemente ou em n vel mais elevados entre os casos do que entre os controles. Se a evid encia for suciente o pesquisador concluir a que existe uma associa c ao entre o fator de risco e a doen ca. Idealmente, os casos devem ser todos os que ocorreram durante um per odo de tempo em uma popula c ao nita. Os controles devem ser pessoas compar aveis aos casos, mas sem a doen ca, ou seja, pessoas que, se desenvolvessem a doen ca, seriam escolhidas como casos. Os grupos de casos e de controles podem ser formados de forma emparelhada ou de forma independente. No primeiro esquema, para cada caso ou mais controles semelhantes s ao escolhidos. J a na forma c ao de grupos de forma independente, os controles n ao escolhidos de forma associada a um caso espec co. Preocupa-se apenas em garantir que o grupo de casos seja, na sua totalidade, parecido com o grupo de controles. O caso particular do emparelhamento em que h a apenas um controle para cada caso e denominado pareamento. Os estudos de caso-controle s ao uma forma de pesquisa simples e eciente, por isso muito utilizada. Atrav es dela, j a se vericaram ou se conrmaram associa c oes entre fatores de risco e v arios tipos de c ancer. N ao h a diculdades eticas para sua implementa c ao e, portanto, os dados usados s ao os de seres humanos. Isto livra o pesquisador de dif ceis generaliza c oes inerentes aos estudos desenvolvidos em animais. O tempo gasto e os custos associados s ao relativamente pequenos, j a que, normalmente, s ao utilizados dados preexistentes. S ao particularmente adequados ao estudo de doen cas raras, porque o pesquisador come ca com um grupo de pessoas que comprovadamente t em a doen ca. Sua grande limita c ao e a suscetibilidade aos v cios de informa c ao e de sele c ao. Outra e que obtemos apenas informa c ao sobre associa c ao entre fatores e doen ca e n ao sobre causas da doen ca. O resultado de tais estudos deve ser considerado um elo a mais em uma cadeia de evid encias que levar a ao veredito de causalidade. Descreveremos abaixo alguns tipos de tendenciosidade aos quais os estudos caso-controle est ao sujeitos. O leitor deve, antes de se envolver no planejamento de um tal estudo, conhecer mais profundamente a literatura m edica da area. Esta experi encia e fundamental pois lhe dar a conhecimento das formas espec cas pelas quais estas tendenciosidades aparecem. Embora n ao existindo associa c ao entre o fator e a doen ca em quest ao, existem v arias maneiras pelas quais uma associa ca o pode aparecer em um estudo caso-controle. Uma delas e chamada V cio da Sele c ao. Ocorre quando os casos ou os controles s ao incluidos no estudo por causa de alguma caracter stica que possuam e que est a relacionada com o fator de risco sendo considerado. Chamamos de V cio de Informa c ao ` aquele introduzido pelos pesquisadores que, j a desconando da associa c ao a ser constatada, s ao mais cuidadosos ao levantar a hist oria cl nica dos casos que dos controles. Dizemos que houve V cio de Confundimento se a associa c ao observada e produto n ao do fator considerado mas de outros fatores n ao controlados no estudo. O grupo controle e usualmente constitu do de pacientes de hospitais, onde est ao sendo tratados os pacientes do grupo de casos. Deve-se escolher para o grupo controle pacientes de uma grande variedade de

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 12

doen cas. Isto protege os resultados de uma forma de v cio da sele c ao; o estudo n ao detecta uma associa c ao porque a doen ca dos pacientes-controle e a doen ca sendo estudada est ao ambas associadas com o fator de risco. Quando existe facilidade na coleta de dados o n umero de pacientes do grupo controle pode ser at e4 vezes maior que o n umero de pacientes do grupo de casos. O m etodo de sele c ao dos indiv duos do grupo controle e quase que inteiramente dependente das circunst ancias espec cas do estudo. Aqui tamb em e fundamental o conhecimento da literatura m edica da area, j a que e usual apresentar-se uma descri c ao detalhada dos controles utilizados. ancer de mama. Exemplo 2.5. Fatores de risco em c Gomes (1992), em tese de doutorado na Faculdade de Medicina da UFMG, realizou estudo caso-controle com o objetivo de avaliar a inu encia de fatores de risco no c ancer de mama, utilizando dados de nosso meio. Como casos foram escolhidas pacientes portadoras de c ancer de mama registradas no Hospital das Cl nicas da UFMG, que satiszeram os seguintes crit erios de inclus ao: idade na epoca do diagn ostico entre 25 e 75 anos, diagn ostico feito entre 1978-1987 e conrmado por exame an atomo-patol ogico, tumor origin ario do tecido epitelial e ter sido submetida a algum tipo de cirurgia na mama. Como controles foram escolhidas pacientes com idade igual ` a do caso (mais ou menos dois anos), data de admiss ao ao hospital igual ` a data de conrma c ao do diagn ostico do caso (mais ou menos seis meses) e exame cl nico da mama sem indica c ao de patologias mam arias. De acordo com esses crit erios, foram selecionados, atrav es de emparelhamento, dois controles para cada caso. O primeiro foi selecionado no ambulat orio de ginecologia e o segundo no registro geral do hospital. A an alise estat stica, entre v arias outras conclus oes, mostrou que a presen ca na paciente de hist oria familiar (retrospectivamente) de c ancer de mama aumenta o risco desta patologia em 8,84 vezes.
a EXPOSTOS

NO-EXPOSTOS

DOENTES (GRUPOS DE CASOS) AMOSTRA DE CASOS POPULAO DE CASOS E DE CONTROLES

ANLISE DE DADOS

EXPOSTOS NO-DOENTES (GRUPO DE CONTROLES) NO-EXPOSTOS

a, b, c, d : os quatro possveis resultados (note o carter retrospectivo)

MENSURAO DA EXPOSIO

FORMAO DOS GRUPOS POR OBSERVAO DA EXPOSIO

Figura 2.3: Esquema de Estudo Caso-Controle.

AMOSTRA DE CONTROLES

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos Vantagens do Estudo de Caso-Controle Baixo custo relativo; Alto potencial anal tico; Adequado para estudar doen cas raras. Desvantagens do Estudo de Caso-Controle Incapaz de estimar risco (reduzido poder descritivo); Vulner avel a in umeros biases (sele c ao, etc.) Complexidade anal tica.

ROSSI, Robson M. 13

2.4.2

Estudo de Coorte

Em contraste com um estudo retrospectivo, um estudo prospectivo avan ca no tempo e coloca enfase no fator de risco. O Estudo de Coorte e uma forma de pesquisa que visa vericar se indiv duos, selecionados porque foram expostos ao fator de risco, desenvolvem a doen ca em quest ao, em maior ou menor propor c ao do que um grupo de indiv duos, compar aveis, mas n ao expostos ao fator de risco. Identicam-se um grupo exposto ao fator e o grupo controle, constitu do de pessoas que n ao foram expostas a ele. Os dois grupos s ao acompanhados por um per odo de tempo e as taxas de incid encia da doen ca calculadas. Se essas taxas s ao signicativamente diferentes nos dois grupos, o pesquisador conclui que h a associa c ao signicativa entre a doen ca e o fator. Os epidemiologistas preferem o termo Estudo Tipo Coorte para este tipo de estudo, entretanto Estudo Prospectivo e a nomenclatura mais utilizada. Os Estudos de Coorte possuem v arias vantagens. O pesquisador tem a possibilidade de usar crit erios uniformes, tanto na identica c ao da presen ca ou n ao do fator de risco ao in cio do estudo, quanto na verica ca o da ocorr encia da doen ca nos v arios exames de acompamento. Nos dois grupos a comparabilidade pode ser vericada no in cio do estudo e identicadas as vari aveis para as quais s ao necess arios ajustamentos na an alise dos dados. Em um estudo prospectivo, o pesquisador tem muito mais liberdade sobre o que medir e como medir, j a que n ao se restringir a ao uso de dados j a coletados. Uma outra vantagem, que s o poder a ser completamente apreciada ao se estudar a metodologia de an alise de dados, e que os estudos de coorte nos permitem obter diretamente uma estimativa da magnitude do risco relativo. Isto signica que e poss vel quanticar o risco de desenvolver a doen ca comparando-se o grupo de expostos ao fator de risco com o grupo de n ao expostos. Estudos de Coorte s ao grandes, longos e normalmente caros. Quanto mais rara a doen ca em quest ao, maior o n umero de pacientes que precisam ser examinados, portanto n ao indicado para doen cas raras. Embora, do ponto de vista te orico, os Estudos de Coorte sejam melhores que os Estudos Caso-Controle, estes u ltimos s ao mais comuns.

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 14

Sele c ao das Coortes Grupos de pessoas s ao selecionadas para o Estudo de Coorte por uma variedade de raz oes. Apresentamos a seguir dois exemplos: ancer de pulm ao. Exemplo 2.6. Fumo e c O cl assico estudo de Doll & Hill (1964) sobre associa c ao entre c ancer no pulm ao e fumo ilustra a escolha da coorte pelo fato de o grupo possuir caracter sticas que facilitam a obten c ao dos dados sobre a exposi c ao ao fator e o seguimento dos pacientes. Foram acompanhados m edicos da Inglaterra desde o m dos anos 20, um grupo f acil de contactar e no qual todas as mortes s ao rotineiramente bem documentadas. Estas pesquisas iniciaram-se devido ao grande aumento da mortalidade causada por este c ancer. No primeiro estudo, publicado em 1950, compararam-se dois grupos de pacientes. O primeiro, constitu do de todos os casos de c ancer de pulm ao de um conjunto de hospitais londrinos. Assistentes sociais, especialmente treinadas para o estudo, entrevistaram todos os pacientes internados com diagn ostico de c ancer de pulm ao, levantando sua hist oria cl nica e seus h abitos tabagistas. O segundo grupo, chamado de controle, foi constitu do por pacientes dos mesmos hospitais, sem diagn ostico de c ancer, na mesma faixa et aria, do mesmo sexo e da mesma regi ao de resid encia que os casos anteriores. A Tabela 2.1 mostra os resultados obtidos. A associa c ao e clara e forte. Tabela 2.1: N umero de fumantes e n ao fumantes entre pacientes do sexo masculino com diagn ostico de c ancer pulmonar e controles. Grupo Fumantes N ao-Fumantes Total C ancer pulmonar 647 2 650 Controle 622 27 649 Total 1269 29 1299 ` A forma de organiza c ao deste estudo e chamada de Estudo Caso-Controle. A epoca, esta metodologia era muito criticada, pois, com facilidade, podia produzir associa c oes esp urias. Por isso, a evid encia, embora clara e forte, n ao foi convincente o suciente. Assim, os mesmos autores iniciaram um segundo estudo, cuja caracter stica b asica e o fato de que o acompanhamento dos pacientes foi prospectivo. Este tipo de planejamento e chamado de Estudo de Coorte. Em outubro de 1951, os pesquisadores enviaram um question ario simples a todos os m edicos da Inglaterra, aproximadamente 60.000 indiv duos. O question ario perguntava se o respondente j a havia fumado ou n ao. Em caso armativo, pedia informa c oes sobre o que e quanto. Mais de dois ter cos dos m edicos responderam com detalhe suciente para que seus dados pudessem ser inclu dos no estudo. As respostas possibilitaram aos pesquisadores classicar cada respondente como fumante ou n ao fumante. A deni c ao de n ao-fumante usada foi: um n ao fumante e uma pessoa que fumou at e no m aximo um cigarro di ario, em m edia, por um per odo inferior a um ano. Atrav es de complexo sistema de acompanhamento, observaram-se nos primeiros 10 anos, 136 mortes associadas ao c ancer pulmonar entre os m edicos inclu dos no estudo. Destas, apenas 3 eram de n ao-fumantes. Para equalizar os per odos de acompanhamento nos v arios grupos, trabalhou-se com a taxa de incid encia por 1.000 pessoas-ano de exposi c ao. Os valores desta taxa est ao na Tabela 2.2. O risco de morte por c ancer pulmonar das pessoas que fumam mais de 25 cigarros di arios e quase 32 vezes maior do que o mesmo risco para quem n ao fuma. Tabela 2.2: Taxa de mortalidade por 1.000 pessoas-ano devida a c ancer pulmonar (n umero de mortes entre par enteses) para n ao fumantes e fumantes. N ao-Fumantes Cigarros di arios (Fumantes) 1-14 5-24 25+ 0,07(3) 0,57(22) 1,39(54) 2,27(57) Estes dois planejamentos, estudo Caso-Controle e Estudo de Coorte, s ao as formas usuais de organiza c ao da pesquisa etiol ogica. Muitos outros estudos como os descritos anteriormente foram feitos em popula c oes variadas para se vericar o poss vel papel do fumo. Em todos, a evid encia foi clara. Hoje, o papel de agente

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 15

causador do c ancer de pulm ao e amplamente reconhecido e justica a milit ancia cada vez mais organizada contra o fumo. Em muitos Estudos de Coorte os grupos de compara c ao s ao obtidos ap os o in cio do estudo, de acordo com o n vel de exposi c ao ao fator. As coortes do estudo de Framingham sobre doen cas coran arias (Kannel et al., 1972), foram constru das dividindo-se o grupo acompanhado de acordo com h abitos de fumo, n veis de colesterol, etc. Nestes casos n ao h a necessidade de um grupo externo de compara c ao. ca coronariana. Exemplo 2.7. Personalidade e desenvolvimento de doen Um Estudo de Coorte com o objetivo de avaliar o poss vel efeito da personalidade no risco de desenvolvimento de doen ca coronariana foi conduzido entre 3.154 trabalhadores do sexo masculino com idade de 30 a 59 anos (Brand et al., 1976). Os indiv duos entraram no estudo entre 1960-61 e foram acompanhados por um per odo m edio de 8 anos e meio. Atrav es de entrevista no in cio do estudo, foram classicados em dois tipos de personalidade, A e B, sendo os primeiros mais agressivos, competitivos e ansiosos. Os resultados da Tabela 2.3 indicam que nas duas faixas et arias consideradas os percentuais de indiv duos do tipo A que desenvolveram doen ca coronariana s ao aproximadamente o dobro dos encontrados no outro grupo. Em outras situa c oes, particularmente quando um grupo submetido a uma exposi c ao pouco comum e estudado, e importante comparar o resultado observado com aquele esperado, caso os indiv duos n ao tivessem sido submetidos ao fator de risco. Usa-se a experi encia da popula c ao em geral, ao tempo em que a coorte e formada, como padr ao de compara c ao. Tabela 2.3: Percentual de indiv duos que desenvolveram doen ca coronariana segundo faixa et aria e tipo de personalidade. Faixa et aria Personalidade A B 39-49 8,9 4,2 50-59 15,9 7,6 Finalmente, usa-se tamb em como base de compara c oes outra coorte formada por pessoas n ao expostas, parecidas nas caracter sticas demogr acas com o grupo exposto. Por exemplo, considerando uma coorte de radiologistas, Seltser e Sartwell (1965) usaram como padr ao de compara c ao dados de oftalmologistas e otorrinolaringologistas.
DOENTES POPULAO EXPOSTOS ou grupo-experimental AMOSTRA PARA ESTUDO

NO-DOENTES

ANLISE DE DADOS

DOENTES NO-EXPOSTOS ou grupo-controle FORMAO DOS GRUPOS POR OBSERVAO DA EXPOSIO MEDIO DOS EFEITOS

NO-DOENTES

a, b, c, d : os quatro possveis resultados

Figura 2.4: Esquema de Estudo Coorte.

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos Vantagens do Estudo de Coorte Produz medidas diretas de risco; Alto poder anal tico; Facilidade de an alise. Desvantagens do Estudo de Coorte

ROSSI, Robson M. 16

Estudos de Coorte s ao grandes, longos e normalmente caros. Quanto mais rara a doen ca em quest ao, maior o n umero de pacientes que precisam ser examinados. Portanto este estudo e inadequado para doen cas de baixa freq u encia; Vulner avel a perdas (biases).

2.4.3

Ensaios Cl nicos Aleatorizados

O Ensaio Cl nico Aleatorizado e um experimento m edico, realizado com o objetivo de vericar, entre dois ou mais tratamentos, qual e o mais efetivo. S ao usados quando e incerto o valor de uma nova terapia ou os m eritos da terapia existente est ao em a metodologia apropriada para a compara disputa. E c ao de tratamentos. Ap os um crit erio de admiss ao ter sido denido, os pacientes s ao, ` a medida que entram no experimento, alocados de maneira aleat oria ao grupo controle, que recebe a terap eutica padr ao, ou ao grupo tratamento, que recebe a terap eutica sendo testada. Todo esfor co deve ser feito para oferecer os mesmos cuidados aos dois grupos. Terminado o experimento, t ecnicas estat sticas s ao usadas para se decidir se h a ou n ao diferen ca na ec acia das terapias envolvidas. Esta e uma forma experimental de pesquisa, isto e, o pesquisador interfere deliberadamente no curso natural dos acontecimentos, em contraposi c ao aos estudos observacionais, em que o pesquisador se restringe a coleta de dados, sem alterar a din ` amica do processo em considera c ao. Por isto est a sujeita a costrangimentos eticos, disciplinados pela conven c ao de Helsinque. O conhecimento pelo paciente ou pelo m edico do tratamento a ser administrado pode inuir na evolu c ao o efeito da doen ca, n ao atrav es de fatores estr nsecos, mas diretamente pelo processo de auto-sugest ao. E placebo, que traz v cios ao estudo cl nico. A u nica maneira de eliminar o efeito placebo nos grupos comparados e realizar, sempre que poss vel, experimentos cegos, nos quais o paciente ou o m edico n ao conhece o tratamento, ou duplo-cego, no qual ambas as parte desconhecem o tratamento. Este ideal, entretanto, nem sempre e fact vel. Exemplo 2.8. Tamoxifeno e c ancer de mama. Muitos avan cos no tratamento do c ancer de mama t em sido estabelecidos atrav es de estudos realizados pelo National Surgical Adjuvant Breast and Bowel Project (NSABP). Em 1985, discutia-se a necessidade de se submeter ` a quimioterapia ou hormonioterapia, pacientes de bom progn ostico, logo ap os a cirurgia. Em particular, havia evid encias de v arias origens de que o tamoxifeno poderia melhorar ainda mais o progn ostico dessas pacientes. Naquela epoca, o tamoxifeno j a era usado largamente no tratamento de pacientes com c ancer de mama. Diante disto, o NSABP iniciou o protocolo B-14 para determinar a ec acia do tamoxifeno em pacientes consideradas de bom progn ostico, isto e, aquelas com tumores com receptor de estr ogeno ancer de mama oper avel e linfonodos axilares negativos positivo (>10 fmol ), idade inferior a 70 anos, com c ao exame histol ogico. Foram criados dois grupos de pacientes atrav es de aleatoriza c ao feita dentro de estratos denidos por idade e tamanho do tumor na an alise cl nica, tipo de cirurgia e concentra c ao de receptor de estr ogeno. Um grupo recebeu tamoxifeno (10 mg por dia, via oral, duas vezes ao dia) e o outro, placebo, indistingu vel do tamoxifeno na apar encia e gosto. Al em disto, o ensaio foi organizado na forma duplo-cego. Ap os acompanhamento das pacientes por um per odo de at e 4 anos, constatou-se uma diferen ca signicativa em termos de tempo livre de doen ca em favor das pacientes que receberam o tamoxifeno. No grupo tratamento, 83% estavam livres da doen ca aos quatro anos ap os a cirurgia, enquanto que no grupo placebo esta porcentagem era de 73%. Este estudo, publicado por Fisher et al. (1989), contribuiu decisivamente para a ado c ao do tamoxifeno como quimioterapia adjuvante logo ap os a cirurgia em pacientes de bom progn ostico.

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 17

EFEITO: PRESENTE POPULAO EXPOSTOS INTERVENO ou grupo-experimental AMOSTRA PARA ESTUDO


EFEITO: AUSENTE

ANLISE DE DADOS

EFEITO: PRESENTE NO-EXPOSTOS INTERVENO ou grupo-controle FORMAO DOS GRUPOS POR ALEATORIZAO E APLICAO DOS TRATAMENTOS MEDIO DOS EFEITOS

EFEITO: AUSENTE

a, b, c, d : os quatro possveis resultados

Figura 2.5: Esquema de um Ensaio Cl nico Aleatorizado.

2.4.4

Estudos Descritivos

As investiga c oes de cunho descritivo, t em o objetivo de informar sobre a distribui c ao de um evento, na popula c ao, em termos quantitativos. Elas podem ser de incid encia ou de preval encia. Nelas, n ao h a forma c ao de grupo-controle para a compara c ao dos resultados, ao menos na forma como e feita nos estudos anal ticos - da serem considerados estudos n ao-controlados. Exemplos de temas de estudos descritivos A incid encia de infec c ao chag asica em habitantes rurais; encia da hepatite B entre os volunt arios ` a doa c ao de sangue; A preval As caracter sticas demogr acas e socioecon omicas dos pacientes que sofrem de artrite reumat oide ou das pessoas que fumam; As principais causas de obito da popula c ao residente em um dado munic pio; O estado imunit ario de pr e-escolares, de um munic pio, frente ` a poliomielite; Os padr oes de crescimento e desenvolvimento de crian cas normais ou daquelas acometidas por uma determinada doen ca; A varia c ao regional na utiliza c ao de servi cos de sa ude. A tend encia do coeciente de mortalidade por tuberculose, de uma cidade, nos u ltimos anos. Estudo de Caso Trata-se de observar um ou poucos indiv duos com uma mesma doen ca ou evento e, a partir de descri c ao dos respectivos casos, tra car um perl das suas principais caracter sticas. Muitas revistas cient cas apresentam uma se c ao de relato ou apresenta c ao de casos, para difundir os resultados destes estudos. O estudo de casos e empregado para enfocar grupos espec cos da popula c ao ou um particular aspecto de interesse, n ao devidamente investigados em pesquisas quantitativas ou que simplesmente necessitem de suplementa c ao de informa c oes, com maior riqueza de detalhes. Vantagens do Estudo de Casos Em geral, o estudo de caso e relativamente f acil de ser realizado e de baixo custo.

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 18

O relato pode restringir-se a uma simples descri c ao ou ir mais al em, de modo a sugerir explica c oes sobre elementos pouco conhecidos, tais como os fatores implicados na etiologia ou no curso de uma doen ca, sob vig encia ou n ao de terap eutica. Em cl nica, e poss vel acompanhar pacientes durante anos, e mesmo d ecadas, chegando-se a um quadro repleto de detalhes sobre aspectos evolutivos de uma dada condi c ao. O estudo de casos constitui-se em um verdadeiro invent ario do que acontece genericamente, ` a luz da observa c ao de poucos indiv duos. um enfoque qualitativo e explorat E orio, embora muitas facetas possam ser quanticadas. Um aspecto positivo, conv em real car, e a possibilidade de observa c ao intensiva de cada caso. Desvantagens do Estudo de Casos ` vezes, a observa Os indiv duos observados costumam ser altamente selecionados. As c ao restringe-se a situa c oes incomuns de enfermos graves, outras vezes, aos casos de evolu c ao at pica, de rea c ao inusitada ou de resultado terap eutico inesperado; muito raramente, abrange pacientes em todas as faces de manifesta c ao da doen ca. A falta de indiv duos-controle, para comparar resultados, pode fazer com que simples coincid encias sejam dif ceis de interpretar: por exemplo, em investiga c ao de um surto de diarr eia, se os casos beberam agua de um certo po co a evid encia e ainda fr agil para incriminar a agua do po co na etiologia da doen ca. Seria conveniente saber se os sadios tamb em beberam ou n ao agua do mesmo po co. Em s ntese, apesar das vantagens referentes ` a facilidade de realiza c ao e baixo custo, duas limita c oes principais est ao presentes no estudo de casos: a falta de controle - eles serviriam para contornar problemas de aferi c ao e compara c ao acima mencionados; o n umero pequeno de indiv duos inclu dos para observa c ao - o que aponta para a prud encia na interpreta c ao dos resultados de estudos de casos, especialmente, na generaliza c ao, como ele tem sido atualmente empregado na area cl nica, eu til para levantar problemas, muitos dos quais s ao complementarmente investigados com o aux lio de outros m etodos.

2.4.5

Seccionais ou Transversais

Investiga c oes que produzem instant aneos da situa c ao de sa ude de uma popula c ao ou comunidade, com base na avalia c ao individual do estado de sa ude de cada um dos membros do grupo, e da produzindo indicadores globais de sa ude para o grupo investigado, s ao chamadas de estudos seccionais ou de cortetransversal-seccional. O Estudo Seccional tamb em e conhecido como Estudo Transversal ou da Preval encia. Vantagens do Estudo Seccional Simplicidade e baixo custo; Rapidez; N ao h a necessidade de seguimento das pessoas; Alto potencial descritivo (subs dio ao planejamento); Boa op c ao para descrever as caracter sticas dos eventos na popula c ao, para identicar casos na comunidade e para detectar grupos de alto risco, aos quais pode ser oferecida aten c ao especial. Desvantagens do Estudo Seccional Vulnerabilidade a biases ou v cios (especialmente de sele c ao);

2.4

Aspectos Estat sticos dos Estudos Etiol ogicos

ROSSI, Robson M. 19

POPULAO

AMOSTRA PARA ESTUDO

FORMAO DOS GRUPOS POR OBSERVAO SIMULTNEA DE EXPOSIO E DOENA

EXPOSTOS E DOENTES a

EXPOSTOS E NO-DOENTES b

NO-EXPOSTOS E DOENTES c

NO-EXPOSTOS E NO-DOENTES d

ANLISE DOS DADOS

Figura 2.6: Esquema de um Estudo Seccional. Baixo poder anal tico (inadequado para testar hip oteses causais); Condi co es de baixa preval encia exigem amostra de grande tamanho, logo t em diculdades operacionais; N ao determina risco absoluto (ou seja, a incid encia); A associa c ao entre exposi c ao e doen ca, se detectada, refere-se ` a epoca de realiza c ao do estudo e pode n ao ser a mesma da epoca de aparecimento da doen ca. Exerc cio 2.1. Indique qual forma de pesquisa foi utilizada nos seguintes problemas: 1. (a) Viagra para os diab eticos (Revista isto e, no 1535 de 03/03/1999) - A famosa p lula azul pode tamb em ser ecaz para diab eticos que tem a fun c ao er etil comprometida. Estudos preliminares haviam descartados a eci encia do Viagra nesses casos. Mas uma pesquisa realizada com 268 homens pela Universidade de Creighton, nos Estados Unidos, mostrou que 56 % dos pacientes que tomaram Viagra tiveram melhoras contra 10 % dos que ingeriram placebo. (b) Um estudo foi conduzido em um grupo de g emeos monozigotos e dizigotos do mesmo sexo, sendo que um g emeo do par tinha c ancer no c olon e o outro n ao. Todos foram de universidades do sudoeste dos Estados Unidos durante um per odo de 5 anos. Informa c oes sobre o teor de bras da dieta foram coletadas para cada um dos indiv duos am de estimar seu efeito na ocorr encia do c ancer no c olon. (c) Durante o ano de 1982, identicou-se cada crian ca nascida na cidade de Pelotas e procedeu-se a ` revis ao dos registros de nascimento com o objetivo de conhecer, entre outras vari aveis, o peso ao nascimento. As crian cas eram classicadas em dois grupos (peso normal 2.300g e baixo peso <2.300g) sendo seguidas por um ano. Ao nal deste per odo comparou-se a mortalidade infantil nos dois grupos. vel associa c ao entre uso de reserpina e c ancer de mama, forma (d) Com o objetivo de avaliar uma poss identicadas 100 pacientes internadas por c ancer de mama (casos novos) em um hospital geral durante um per odo de dois anos. Estas pacientes foram entrevistadas sendo colhida a informa c ao quanto ao uso pr evio de reserpina. Para cada caso eram entrevistados quatro controles, selecionados aleatoriamente dentro do grupo de mulheres internadas por outros diagn osticos durante o mesmo per odo do caso. (e) 300 pacientes portadores de diabetes mellitus foram alocados aleatoriamente em dois grupos, cada um com 150. O primeiro grupo recebeu uma droga hipoglicemiante nova, enquanto os demais permaneceram em uso de clorpropamida. Os pacientes foram acompanhados por seis meses e o grau de controle metab olico dos pacientes nos dois grupos foi comparado atrav es das determina c oes de glicemia capilar (di arias) e da hemoglobina glicosilada (aferida a cada dois meses).

Cap tulo 3

Estat stica Descritiva


3.1
3.1.1

Organiza c ao de Dados Estat sticos


Normas para a Apresenta c ao Tabular de Dados

A representa c ao tabular e uma apresenta c ao num erica dos dados. Consiste em dispor os dados em linhas e colunas, distribu das de modo ordenado, segundo algumas regras pr aticas adotadas pelos diversos sistemas estat sticos. As regras que prevalecem no Brasil foram xadas pelo Conselho Nacional de Estat stica. Uma tabela estat stica comp oe-se de elementos essenciais e elementos complementares. 1. Elementos essenciais tulo: a. T a indica E c ao da natureza do fato estat stico observado, fazendo refer encia ao local e ao tempo em que foi observado. b. Cabe calho: S ao as indica c oes que especicam o conte udo das colunas. c. Coluna indicadora: S ao as indica c oes que especicam o conte udo das linhas. 2. Elementos complementares a. Fonte a entidade respons E avel pelos dados contidos na tabela. b. Nota S ao informa c oes que esclarecem crit erios usados na confec c ao da tabela. c. Chamada a informa E c ao de natureza espec ca, que serve para complementar determinado dado usado na confec c ao da tabela.

20

3.2

Distribui c ao de Freq u encias

ROSSI, Robson M. 21

Tabela 3.1: Popula c ao brasileira por faixa et aria. Idades (Anos) 1980 (%) 1991 (%) 0` a9 27.9 23.6 10 ` a 19 20.6 18.3 20 ` a 59 45.0 50.9 60 6.5 7.2 Fonte: IBGE

3.2

Distribui c ao de Freq u encias

Geralmente ap os a coleta de dados, estes s ao apresentados de forma desorganizada e de dif cil manipula c ao, logo f az-se necess ario organiz a-los. Para organizar os dados provenientes de uma vari avel qualitativa, e usual fazer uma Tabela de freq u encias. Tabela 3.2: Total de alunos matriculados na UEM em 2002. Sexo Freq u encia Feminino 7545 Masculino 5905 Total 13450 Fonte: UEM/2002. Quando a vari avel em estudo e do tipo cont nua e assume muitos valores distintos, o agrupamento dos dados em classes ser a sempre necess ario na constru c ao das tabelas de freq u encias. Em publica c oes mais antigas sobre constru c ao de tabelas de freq u encias, h a f ormulas para determina c ao do n umero de classes de acordo com o n umero de dados. Essas f ormulas eram u teis, pois a constru c ao dos gr acos era muito custosa sem o aux lio do computador. Esse procedimento e aconselh avel como uma primeira visualiza c ao da distribui c ao de freq u encias de uma vari avel. A seguir e apresentado um roteiro para constru c ao de distribui c oes de freq u encia. Exemplo 3.1. Considere uma amostra de 25 crian ca, das quais foram obtidas medidas de intoxica c ao alimentar por uma subst ancia desconhecida (g). 0,77 0,85 0,85 0,75 0,61 0,90 0,80 0,78 0,96 Dados brutos 0,78 0,75 0,65 1,05 0,58 0,52 0,78 1,02 0,79 0,55 Fonte: Dados hipot eticos 1,10 0,99 0,75 0,65 0,75 0,55

Os dados, como apresentados acima, s ao chamados brutos, pois n ao foram ainda submetidos a nenhum tipo de tratamento. Inicialmente, os dados devem ser colocados em ordem crescente: 0,52 0,75 0,96 0,55 0,77 0,99 Dados em ordem crescente 0,55 0,58 0,61 0,65 0,65 0,75 0,78 0,78 0,78 0,79 0,80 0,85 1,02 1,05 1,10 Fonte: Dados hipot eticos 0,75 0,85 0,75 0,90

Pode-se observar, agora, que das 25 observa c oes o menor valor e xm e xm n = 0, 55 e o maior ax = 1, 10. Amplitude (AT): e a diferen ca entre o maior e o menor valor do conjunto de dados observados. AT = xm ax xm n

3.2

Distribui c ao de Freq u encias

ROSSI, Robson M. 22

Para os dados acima: AT = 1, 10 0, 52 = 0, 58 Observe que esse exemplo cont em um n umero pequeno de observa c oes (n = 25), quando h a um grande n umero de dados observados o processo de ordena c ao e trabalhoso e a listagem nal pouco representar a. Nesses casos, pode-se simplicar o processo agrupando os dados em certo n umero de classes, cujos limites ser ao denominados limite inferior e limite superior. A quantidade de classes e a amplitude destas devem ser obtidas observando as seguintes normas: i) as classes devem cobrir a amplitude total; ii) o extremo superior de uma classe e o extremo inferior da classe seguinte; iii) cada valor observado deve enquadrar-se em apenas uma classe; umero total de classes n ao deve ser inferior a 5 e nem superior a 25; iv) o n O n umero de classes (k ), pode ser obtido de uma das f ormulas seguintes: i) k = n ;

ii) k = 1 + 3, 22 log n , (f ormula de Sturges). Para o exemplo 2.1: k = 25 = 5 ou k = 1 + 3, 22log (25) 5, 50. Dividindo a amplitude total (AT ) por k = 5 chega-se ao tamanho ou amplitude de cada uma das classes: h= AT 0, 58 = = 0, 12 k 5

Obs.: quando os valores observados s ao n umeros inteiros, os limites das classes tamb em devem ser AT n umeros inteiros. Para isso, aconselha-se escolher o n umero mais pr oximo de AT que resulte h = em k um n umero inteiro. Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes: i) o limite inferior da primeira classe pode ser o menor valor da s erie, neste caso : 0,52. ii) os demais limites ser ao obtidos somando aos limites inferiores o valor de h. Isto e, 0, 52 0, 64 0, 76 0, 88 1, 00 (0, 52 + h = 0, 52 + 0, 12) = 0, 64 (0, 64 + h) = 0, 76 (0, 76 + h) = 0, 88 (0, 88 + h) = 1, 00 (1, 00 + h) = 1, 12.

Lembrando que a nota c ao ( ) signica que se esta incluindo os valores iguais ao limite inferior e excluindo os valores iguais ou superiores ao limite superior. A partir da listagem ordenada das classes, pode-se construir os chamados quadros (ou tabelas) de freq u encia ou distribui c oes de freq u encia, que permitem uma melhor visualiza c ao dos dados. Freq u encia: e o n umero de valores que aparecem no dom nio de uma classe. Um quadro de freq u encias completo deve conter as seguintes informa c oes: i) xi e o ponto m edio da i- esima classe; representa a m edia dos pontos limites da classe; xi = li + Li ; li : limite inferior e Li : limite superior da classe i. 2

ii) n e o tamanho da amostra; e a freq u encia absoluta da i- esima classe; iv) Fi

3.3

Gr acos Fi ; n

ROSSI, Robson M. 23

v) fi e a freq u encia relativa da i- esima classe, fi = vi) Faci e a freq u encia acumulada da i- esima classe;

vii) faci e a freq u encia relativa acumulada da i- esima classe, faci =

Faci . n

Assim, no caso da amostra de 25 crian ca intoxicadas, a distribui c ao de freq u encia pode ser da seguinte forma:

Tabela 3.3: Distribui c ao do n vel de intoxica c ao. Classes xi Fi fi Fac 0,52 0,64 0,58 5 0,20 5 0,64 0,76 0,70 6 0,24 11 0,76 0,88 0,82 8 0,32 19 0,88 1,00 0,94 3 0,12 22 1,00 1,12 1,06 3 0,12 25 Total 25 1 Fonte: Dados hipot eticos

fac 0,20 0,44 0,76 0,88 1,00 -

Outras informa c oes: Nenhuma cela ( casa ) deve car em branco . H fen ( - ) , indica que o valor num erico e nulo. Retic encia ( ... ) , indica que n ao se disp oe do dado. Interroga c ao ( ? ) , indica d uvida quanto a exatid ao do valor num erico. Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em rela c ao a unidade utilizada.

3.3

Gr acos

Os gr acos s ao representa c oes pict oricas, de grande valia na compreens ao e visualiza c ao dos dados. Os principais gr acos utilizados na representa c ao estat stica s ao: 1. Diagramas; (a) Por Pontos; (b) Por Linhas; i. Poligonais; ii. Curvas; (c) Por Superf cies; i. ii. iii. iv. em em em em Colunas; Barras; Histogramas; Setores;

2. Cartogramas; 3. Estereogramas.

3.3

Gr acos

ROSSI, Robson M. 24

3.3.1

Diagramas

S ao representa c oes gr acas de s eries estat sticas por interm edio de linhas e superf cies. As linhas utilizadas s ao as poligonais e as curvas, e as superf cies s ao ret angulos, c rculos e quadrados. Para suas contru c oes pode-se utilizar a proporcionalidade entre s erie de n umeros ou do sistema retil nio ortogonal. Este sistema estabelece uma correspond encia biun voca entre os pares de n umeros reais e os pontos de um plano. Assim, de modo geral, num sistema retil neo ortogonal, um ponto P do plano est a determinado pelos n umeros reais X e Y, tomados sobre dois eixos divididos em segmentos unit arios. Diagramas por Pontos (Diagramas de Dispers ao): a representa E c ao gr aca dos dados de forma bruta e geral, o que pode fornecer uma id eia da variabilidade dos dados, pontos extremos tec.

y 0
0

10

4 x

Figura 3.1: Diagrama de Dispers ao de Pontos.

Diagramas por Linha Poligonal: a representa um dos mais imporE c ao gr aca de uma s erie estat stica por meio de uma linha poligonal. E tantes gr acos; representa observa c oes feitas ao longo do tempo, em intervalos iguais ou n ao. Tais conjuntos de dados constituem as chamadas s eries hist oricas ou s eries temporais. Traduzem o comportamento de um fen omeno em certo intervalo de tempo.

3.5

4.0

4.5

5.0

5.5

6.0

Jul

May

Jun

Oct

Nov

Aug

Figura 3.2: Gr aco para S eries Temporais.

Sep

Dec

Jan

Feb

Mar

Apr

3.3

Gr acos

ROSSI, Robson M. 25

O pol gono de freq u encia e um gr aco que se obt em unindo por uma poligonal os pontos correspondentes `s freq a u encias das diversas classes, centradas nos respectivos pontos m edios. Para obter as interse c oes do pol gono com o eixo, cria-se em cada extremo do histograma uma classe com freq u encia nula. Obs.: Suavizando a linha poligonal que dene o pol gono obt em-se uma curva que visualiza a tend encia de varia c ao dos dados.

Probabilidade

0.0
4

0.1

0.2

0.3

Amostra

Figura 3.3: Suaviza c ao do pol gono de freq u encia.

Ogiva A Ogiva ou Pol gono de Freq u encia Acumulada, consiste de uma linha poligonal das Fac ou das fac . Diagramas por Linha Curva: a representa E c ao de uma s erie estat stica por meio de uma linha curva. Pode ser utilizada para representar uma tend encia do tipo linear.

20

40

60

80

0 x

Figura 3.4: Diagrama por Linha Curva.

Diagrama por Superf cie em Colunas: a representa E c ao de uma s erie estat stica por interm edio de ret angulos em posi c oes verticais. Este tipo de gr aco proporciona comparar grandezas.

3.3

Gr acos

ROSSI, Robson M. 26

Os valores da vari avel dependente, dados pela s erie estat stica ou suas diferen cas, devem ser proporcionais `s a areas dos ret angulos a serem tra cados. Para tanto pode-se utilizar o sitema retil nio ortogonal marcandose os pontos de forma j a indicada, e a partir do eixo dos x, construir ret engulos de bases iguais e que tenham respectivamente, por meio de cada base, os valores da vari avel independente e os pontos marcados.

10

15

20

25

Figura 3.5: Gr aco em Barras Verticais.

3.3.2

Histograma

Diagrama por Superf cie em Histogramas: O Histograma e um conjunto de ret angulos com bases sobre um eixo dividido de acordo com os tamanhos de classe, centrados nos pontos m edios das classes e areas proporcionais ` as freq u encias.

Freqncia

0
3

10

15

20

amostra

Figura 3.6: Histograma.

Diagrama por Superf cie em Setores (Pizza): a representa E c ao gr aca de uma s erie estat stica por interm edio de superf cies setoriais. utilizado quando se pretende comparar os valores de uma s E erie com a sua soma total. A representa c ao e feita tomando como gura b asica um c rculo que e dividido em setores. O quociente entre a soma dos valores da s erie e a area do c rculo deve ser o mesmo que entre cada valor da vari avel dependente e a respectiva area do setor representativo. Por em em virtude da proporcionalidade das areas dos setores de um c rculo com seus angulos centrais, podem-se dividir os valores considerados na s erie proporcionalmente a estes angulos.

3.4

Medidas Descritivas

ROSSI, Robson M. 27

B A

Figura 3.7: Diagrama por Superf cie em Setores (Pizza).

3.4
3.4.1

Medidas Descritivas
Medidas de Tend encia Central ou de Posi c ao

S ao medidas que objetivam representar o ponto central de equil brio de uma distribui c ao de dados. Essas medidas representam quantitativamente os dados, sendo as mais utilizadas em an alise: M edia Representa o ponto de equil brio de um conjunto de dados. Seja (x1 , . . . , xn ) um conjunto de dados. A m edia ser a dada por:
N

i=1 n

xi ( dados populacionais ), para dados n ao-agrupados em tabelas de freq u encias.

N
i=1

xi ( dados amostrais ), para dados n ao-agrupados em tabelas de freq u encias.

x=

n
k i=1

xi Fi

( dados amostrais ), quando os dados agrupados em tabelas de freq u encias, com k classes. n Quando os dados s ao agrupados em intervalos de classes, xi corresponde ao ponto m edio do intervalo. Exemplo 3.2. Considere do Exemplo anterior, o conjunto de dados da amostra retirada da vari avel n vel de intoxa c ao, dado no in cio desta parte. A m edia ser a dada por:
25

x=

xA =

i=1

xi =

19, 53 = 0, 7812, para os dados brutos, ou 25

xB = Observe que x A

i=1

xi Fi =

19, 66 = 0, 7864, para os dados agrupados (Tabela 3.3). 25

x B .

3.4

Medidas Descritivas Propriedades da M edia:

ROSSI, Robson M. 28

1 - A soma alg ebrica dos desvios tomados em rela c ao a m edia e nula. Isto e,
k i=1

di =

k i=1 (xi

x) = 0 ,

i = 1 , 2, . . . , n

pela propriedade:

X = {2, 3, 7} x = 4, k i=1 di = (2 4) + (3 4) + (7 4) = 0.

2 - Somando-se ou subtraindo-se uma constante k , a todos os valores de uma vari avel, a m edia do conjunto ca aumentada ou diminu da dessa constante. yi = xi k y =xk

Para k = +2, tem-se: Y = {4, 5, 9} y = 6, pela propriedade: y = x + 2 = 4 + 2 = 6. avel por uma constante k , a m edia do 3 - Multiplicando-se ou dividindo-se todos os valores de uma vari conjunto ca multiplicada ou dividida por essa constante. yi = k xi y =kx e yi = xi k y= x ; .k = 0. k

Para k = +5, tem-se Y = {10, 15, 35} y = 20, pela propriedade: y = 5.x = 5.4 = 20. Vantagens e desvantagens da M edia: uma medida que, p 1- E or uniformizar os dados, n ao representa bem os conjuntos que revelam tend encias extremas, uma vez que a mesma ser a grandemente inuenciada pelos valores discrepantes. Suponha por exemplo, que durante um ano letivo, um aluno tenha as seguintes notas em uma disciplina: 30, 35, 25, 30, 25 35, 35, 95, 90, 100. 500 Um c alculo r apido nos mostra que sua m edia nal foi x = = 50. Como a m edia deve traduzir o 10 aproveitamento do aluno durante o ano e a m edia 50 s o foi conseguida ` a custa das tr es u ltimas notas, conclu mos que 50 e um valor falho para medir o aproveitamento do aluno. 2 - A m edia nem sempre tem exist encia real, isto e, ela nem sempre faz parte do conjunto de dados (x / X ). a medida de posi 3- E c ao mais conhecida e de maior emprego. facilmente calculada. 4- E 5 - Serve para compararmos conjuntos semelhantes. 6 - Depende de todos os valores do conjunto de dados. 7 - em geral n ao ocupa a posi c ao central do conjunto (ocupa a posi c ao do centro de equil brio). Moda A Moda (Mo ) e o valor que ocorre com maior freq u encia em uma s erie de dados. Existem s eries de dados em que nenhum valor aparece mais vezes que outros. Neste caso n ao apresenta moda. S ao s eries amodais. Em outros casos, pode aparecer dois ou mais valores de concentra c ao. Diz-se ent ao, que a s erie tem duas ou mais modas (bimodal, trimodal ou multimodal). X : {2, 2, 2, 2, 5, 5, 5, 6, 6, 7, 8} Mo = 2 (unimodal).

3.4

Medidas Descritivas

ROSSI, Robson M. 29

Quando os dados se apresentam agrupados em tabelas de freq u encias e necess ario utilizar a express ao de Czuber (a mais precisa), dada a seguir, para calcular o valor que representa a moda: ( onde i e a ordem da classe de maior freq u encia). Czuber: Mo = li + Outras modas: Pearson: Mo = 3.Md 2.x e King: Mo = li + h.Fi+1 . Fi1 + Fi+1 h(Fi Fi1 ) . (Fi Fi1 ) + (Fi Fi+1 )

Exemplo 3.3. Calcular a moda de Czuber, para os dados agrupados da amostra dada na Tabela 3.3. i = 3 (Classe de maior freq u encia) h = 0, 12 l3 = 0, 76 Fi = F3 = 8 Fi1 = F2 = 6 Fi+1 = F4 = 3 Mo = 0, 76 + 0, 12(8 6) (8 6) + (8 3) 0, 794

Isto signica que o n vel de toxicidade mais freq u ente e de 0,794 g. Mediana A mediana (Md ) de um conjunto de valores ordenados segundo uma ordem de grandeza, e o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo n umero de elementos ( e o valor que est a no meio !). Quando o conjunto de observa c oes tem um n umero mpar de valores, n ao-agrupados em classes, ent ao n+1 a mediana e dada pela express ao: Md = xp , onde p = . 2 x1 3 x2 5 x3 5 x4 6 x5 M d = 5. 7

Quando o conjunto de observa c oes tem um n umero par de valores, n ao-agrupados em classes, ent ao a xp + xp+1 mediana ser a, a m edia aritm etica dos dois n umeros que ocuparem o meio da s erie: Md = , onde 2 n p= . 2 x1 3 x2 5 x3 5 x4 6 x5 7 5+6 x6 Md = = 5, 5. 7 2

Quando o conjunto de observa c oes se apresenta agrupados em classes em uma tabela de freq u encias, e, a classe onde ent ao a mediana e dada pela express ao abaixo, onde onde i representa a classe mediana, isto n estar a presente o valor de p = . 2 h(p Fac1 ) Md = li + Fi Exemplo 3.4. Calcular a mediana para os dados agrupados da amostra da Tabela 3.3.

3.4

Medidas Descritivas

ROSSI, Robson M. 30

n = 25 n i = 3 p = = 12, 5 est a na terceira linha olhar em Fac 2 h = 0, 12 Fi = 8 Fac1 = 11 (freq u encia acumulada da classe anterior) l3 = 0, 76 0, 12(12, 5 11) Md = 0, 76 + 0, 783 8 Isto signica que o 50% das crian cas apresenta n vel de toxicidade acima de 0,783 g.

3.4.2

Medida de Variabilidade ou de dispers ao

S ao medidas estat sticas que indicam o grau de dispers ao, ou variabilidade do conjunto de observa c oes pesquisados, em rela c ao a uma medida de tend encia central, por exemplo, x . Uma u nica medida n ao e suciente para descrever de modo satisfat orio um conjunto de observa c oes. Por exemplo, dois conjuntos de dados podem ter a mesma m edia aritm etica e, no entanto, a dispers ao de um pode ser muito maior que a dispers ao do outro. As principais medidas de dispers ao s ao: amplitude total (AT), vari ancia ( 2 ou s2 ), desvio-padr ao ( ou s) e coeciente de varia c ao (CV). Amplitude total a diferen Amplitude total (AT): E ca entre o maior e o menor valor observado AT = xm ax xm n Desvio absoluto m edio a m Desvio absoluto m edio (Dm ): E edia aritm etica dos valores absolutos dos desvios tomados em rela c ao a uma das seguintes medidas de tend encia central: m edia ou mediana. Desvio m edio em rela c ao ` a m edia para dados n ao tabulados:
n

n Desvio m edio em rela c ao ` a m edia para dados tabulados:


n

Dm =

i=1

|xi x |

Dm = Vari ancia

i=1

|xi x | Fi n

a medida que fornece o grau de dispers Vari ancia [Var(X)]. E ao, ou variabilidade dos valores do conjunto de observa c oes em torno da m edia. Ela e calculada somando os quadrados dos desvios em rela c ao a m ` edia: Amostral
n

Populacional
2
N

D. Brutos

s =

i=1 k

(xi x ) n1

D. Agrupados

s =

i=1

(xi x ) Fi n1 ou s =
2

k i=1

(xi )2 N

i=1

1 n1

k Fi x2 i=1 i

xi Fi n

(xi )2 Fi N

i=1

3.4

Medidas Descritivas

ROSSI, Robson M. 31

Desvio-padr ao Desvio-padr ao [DP(X)]. Como a vari ancia calculada a partir do quadrados dos desvios, sua unidade e quadrada em rela c ao ` a vari avel estudada, o que, sob o ponto de vista pr atico e um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpreta c ao pr atica, denominada desvio padr ao, denida como a raiz quadrada da vari ancia e representada por: Amostral s = s2 Populacional = 2

Propriedades da Vari ancia e do Desvio-Padr ao 1 - V ar(X ) 0 = DP (X ) 0. 2 - Somando-se ou subtraindo-se uma constante k , a todos os valores de uma vari avel, a vari ancia e o desvio-padr ao do novo conjunto permanecem inalterados: Y =X k Y =X k X : Vari avel Aleat oria e k : constante real. 3 - Multiplicando-se ou dividindo-se todos os valores de uma vari avel por uma constante, k , a vari ancia e o desvio-padr ao do novo conjunto s ao alterados da seguinte forma: Y =kX Y =kX e para k = 0, Y = Y = X k X k V ar(Y ) = DP (Y ) = V ar(X ) k2 DP (X ) |k | V ar(Y ) = k 2 V ar(X ) DP (Y ) = |k | DP (X ) V ar(Y ) = V ar(X ) + 0 DP (Y ) = DP (X ) + 0

4 - Sejam X e W vari aveis aleat orias independentes, a e b constantes reais, tal que Y = aX bW, tem-se: Y = aX bW Vari ancia Relativa A vari ancia relativa de uma s erie X e indicada por VR(X) e denida por: V R (X ) = s2 ( x)
2

V ar(Y ) = V ar(aX bW ) = a2 V ar(X ) + b2 V ar(W ).

(amostral)

Note que o coeciente de varia c ao, como e uma divis ao de elementos de mesma unidade, e um n umero puro. Portanto, pode ser expresso em percentual. Coeciente de varia c ao uma medida relativa da dispers Coeciente de varia c ao (CV). E ao ou variabilidade dos dados: CV(x) = s (amostral) ou CV(x) = (populacional). x

Crit erios para interpreta c ao : Quanto menor for o coeciente de varia c ao (CV 25%), mais representativa dos dados ser a a m edia.

3.5

Medidas Separatrizes

ROSSI, Robson M. 32

Exemplo 3.5. Calcular a vari ancia, o desvio-padr ao e o coeciente de varia c ao para o conjunto de dados da amostra X: {2, 3, 5, 7}. Sabemos que x = 4, 25
n 2

4, 3, ent ao:

(xi x ) 2 2 2 2 (2 4, 3) + (3 4, 3) + (5 4, 3) + (7 4, 3) s2 = i=1 = 4, 92 3 n1 s = 4, 92 2, 12, assim: 2, 12 CV = 0, 522 (sendo CV=52,2% > 25%, h a indicativo de que a m edia n ao e representativa). 4, 25 Exemplo 3.6. Calcular a vari ancia, o desvio-padr ao e o coeciente de varia c ao para o conjunto de dados amostrais apresentados na tabela abaixo. Tabela 3.4: Exemplo de Tabela de Freq u encia. xi Fi 1 2 3 4 5 2 Total 8
3

sendo x =
k i=1

i=1

xi Fi =
2

1.2 + 3.4 + 5.2 = 3, temos 8 = (1 3) .2 + (3 3) .4 + (5 3) .2 7


k 2 i=1 2 2 2

(xi x ) Fi n1

s2 =

2, 29, ou

s2 =

1 n1

k Fi x2 i=1 i
2

x i Fi n

= s2

1 (24) 16 88 = 2, 29 81 8 7 logo, s = 2, 29 1, 51, assim: 1, 51 cv = 0, 50 (h a indicativo de que a m edia n ao e representativa). 3 =

3.5
3.5.1

Medidas Separatrizes
Quartis, Decis e Percentis

As medidas de posi c ao denominadas Separatrizes para valores agrupados s ao calculadas atrav es da express ao: Sk = li + h(p Fac1 ) Fi

onde SK : e a medida de posi c ao separatriz desejada (Md : M ediana, Qk : Quartil, Dk : Decil ou Pk : P ercentil de ordem k ); k: e a ordem da medida; w: e o divisor;

3.5

Medidas Separatrizes

ROSSI, Robson M. 33

Sk Md Q D P p: e a posi c ao da observa c ao, dado por:

k 1 1, 2, 3 1, 2, ...,9 1, 2, ...,99 n.k w

w 2 4 10 100

p=

Exemplo 3.7. Calcule o Q1 , Q2 , Q3 , D7 , P10 e P90 para os dados da Tabela 3.3.

Tabela 3.5: Distribui c ao do n vel de intoxica c ao (g) em 25 crian cas. Classes xi Fi fi Fac fac 0,52 0,64 0,58 5 0,20 5 0,20 0,64 0,76 0,70 6 0,24 11 0,44 0,76 0,88 0,82 8 0,32 19 0,76 0,88 1,00 0,94 3 0,12 22 0,88 1,00 1,12 1,06 3 0,12 25 1,00 Total 25 1 Fonte: Dados hipot eticos

Solu c ao: C alculo de Q1 : {k = 1; w = 4; } 25.1 p= = 6, 25 (i = 2 : olhar em Fac ) 4 h = 0, 12 Fi = F2 = 6 li = 0, 64 Fac1 = 5 0, 12(6, 25 5) Q1 = 0, 64 + = 0, 64 + 0, 025 = 0, 665 6 Obs.: O valor Q1 = 0, 665 representa o n vel de intoxica c ao que deixa 25% dos demais valores abaixo dele. C alculo de Q2 : {k = 2; w = 4; } 25.2 p= = 12, 5 (i = 3) 4 h = 0, 12 Fi = 8 li = 0, 76 Fac1 = 11 0, 12(12, 5 11) 0, 783 = Md Q2 = 0, 76 + 8 Obs.: O valor Q2 0, 783 representa o o n vel de intoxica c ao que deixa 50% dos demais valores abaixo dele, isto e, e o valor mediano. C alculo de Q3 : {k = 3; w = 4; } 25.3 p= = 18, 75 (i = 3) 4 h = 0, 12 Fi = 8 li = 0, 76 Fac1 = 11 0, 12(18, 75 11) Q3 = 0, 76 + 0, 876 8

3.5

Medidas Separatrizes

ROSSI, Robson M. 34

Obs.: O valor Q3 0, 876 representa o n vel de intoxica c ao que deixa 75% dos demais valores abaixo dele. C alculo de D7 : {k = 7; w = 10; } 25.7 p= = 17, 5 (i = 3) 10 h = 0, 12 Fi = 8 li = 0, 76 Fac1 = 11 0, 12(17, 5 11) D7 = 0, 76 + 0, 858 8 Obs.: O valor D7 0, 858 representa o o n vel de intoxica c ao que deixa 70% dos demais valores abaixo dele. C alculo de P10 : {k = 10; w = 100; } 25.10 = 2, 5 (i = 1) p= 100 h = 0, 12 Fi = 5 li = 0, 52 Fac1 = 0 0, 12(2, 5 0) P10 = 0, 52 + = 0, 58 5 Obs.: O valor P10 = 0, 58 representa o o n vel de intoxica c ao que deixa 10% dos demais valores abaixo dele. C alculo de P90 : {k = 90; w = 100; } 25.90 p= = 22, 5 (i = 1) 100 h = 0, 12 Fi = 3 li = 1, 00 Fac1 = 22 0, 12(22, 5 22) P90 = 1 + = 1, 02 3 Obs.: O valor P90 = 1, 02 representa o o n vel de intoxica c ao que deixa 90% dos demais valores abaixo dele ou 10% acima dele.

3.5.2

Medidas de Simetria

Tem por objetivo b asico medir o quanto a distribui c ao de freq u encias do conjunto de valores observados se afasta da condi c ao de simetria. c ao Assim etrica negativa. Quando a m edia e menor que a mediana que e menor que a (A) Distribui moda. (B) Distribui c ao Sim etrica. Quando a m edia, moda e mediana s ao iguais, ou muito pr oximas. (C) Distribui c ao Assim etrica positiva. Quando a m edia e maior que a mediana que e maior que a moda.

3.5

Medidas Separatrizes Gr aco das distribui c oes quanto ` a assimetria

ROSSI, Robson M. 35

Figura 3.8: (A) Assim etrica Negativa ( x < M d < Mo )

Figura 3.9: (B) Sim etrica ( x = Md = Mo )

Figura 3.10: (C) Assim etrica Positiva (Mo < Md < x ) Uma das medidas para quanticar a assimetria de uma distribui c ao pode ser dada pelo primeiro coeciente de assimetria de Pearson (Ap ) : Ap = x Mo 3 ( x Md ) ou Ap = s s

Outra e atrav es do coeciente quartil tico de Bowley (Ab ) : Ab = Q3 + Q1 2Md Q3 Q1

Em ambos temos: Se A < 0 a distribui c ao e assim etrica negativa. Se A = 0 a distribui c ao e distribui c ao sim etrica. Se A > 0 a distribui c ao e assim etrica positiva. Exemplo 3.8. Considerando o conjunto de dados da Tabela 3.3, obter Ap . sabemos que: x = 0, 7864; s = 0, 153 e Mo 0, 794, assim: x Mo 0, 786 0, 794 Ap = = 0, 04967 (Ap < 0 : assim etrica negativa ). s 0, 153

3.5

Medidas Separatrizes

ROSSI, Robson M. 36

3.5.3

Medidas de Curtose

A curtose ou achatamento mede a concentra c ao ou dispers ao dos valores de um conjunto de valores em rela c ao ` as medidas de tend encia central em uma distribui c ao de freq u encias conhecida (a distribui c ao Normal). (A) Distribui c ao Leptoc urtica. Quando a distribui c ao apresenta uma curva de freq u encia mais fechada que a da distribui c ao Normal. (B) Distribui c ao Mesoc urtica. Quando a distribui c ao apresenta uma curva de freq u encia id entica a da distribui c ao Normal. (C) Distribui c ao Platic urtica. Quando a distribui c ao apresenta uma curva de freq u encia mais aberta que a da distribui c ao Normal. Gr aco das distribui c oes quanto ` a curtose

Figura 3.11: Leptoc urtica

Figura 3.12: Mesoc urtica

Figura 3.13: Platic urtica As medidas de curtose podem ser calculadas atrav es da express ao: k= Obs1 : k : coeciente de curtose (Q3 Q1 ) 2(P90 P10 )

3.5

Medidas Separatrizes

ROSSI, Robson M. 37

Obs2 : Q3 Q1 e denominado Desvio Interquartil tico. Relativamente ` a curva da distribui c ao Normal, temos: Se k < 0, 263 ( leptoc urtica ) Se k = 0, 263 ( mesoc urtica ) Se k > 0, 263 ( platic urtica ) Podemos utilizar tamb em, o coeciente de curtose baseado nos momentos centrados (k4 ), para dados tabelados: (xi x )4 Fi Fi k4 = 3 4 Lembrando que 4 = 2 e s = s
4 2 2 2

(xi x )2 Fi N (xi x )2 Fi n1

(populacional).
2

(amostral).

Analogamente, temos: Se k4 > 0 a distribui c ao e leptoc urtica Se k4 = 0 a distribui c ao e mesoc urtica Se k4 < 0 a distribui c ao e platic urtica Exemplo 3.9. Considerando o conjunto de dados da Tabela 3.3, obter k, o coeciente de curtose interquartil tico. Sabemos que Q1 = 0, 665, Q3 = 0, 876, P10 = 0, 58 e P90 = 1, 02 , ent ao: (Q3 Q1 ) (0, 876 0, 665) k= = = 0, 2398 (k < 0, 263 : leptoc urtica). 2(P90 P10 ) 2(1, 02 0, 58)

Cap tulo 4

Infer encia Estat stica


4.1 Introdu c ao

Infer encia Estat stica ou Estat stica indutiva e a parte da estat stica que utiliza m etodos cient cos para fazer arma co es e tirar conclus oes sobre caracter sticas ou par ametros de uma popula c ao, baseando-se em resultados de uma amostra. O pr oprio termo indutiva decorre da exist encia de um processo de indu c ao, isto e, um processo de racioc nio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclus oes sobre a realidade no todo. O uso de informa c oes da amostra para concluir sobre o todo faz parte da atividade di aria da maioria das pessoas. Basta observar como uma cozinheira verica se o prato que ela est a preparando tem ou n ao a quantidade adequada de sal. Ou ainda, quando uma dona de casa, ap os experimentar um peda co de uma laranja numa banca de feira, decide se as compra ou n ao. Essas s ao decis oes baseadas em procedimentos amostrais. O objetivo e procurar a conceitua c ao formal desses princ pios intuitivos do dia-a-dia para que possam ser utilizados cienticamente em situa c oes mais complexas. f E acil perceber que um processo de infer encia ou indu c ao ( em estat stica) n ao pode ser exato. A Infer encia Estat stica, entretanto, ir a dizer at e que ponto pode-se estar errando nas infer encias, e com que probabilidade. Esse fato e fundamental para que uma infer encia possa ser considerada estat stica, e faz parte dos objetivos da Infer encia Estat stica. Em suma, a Infer encia Estat stica busca obter resultados sobre as popula c oes a partir das amostras, dizendo tamb em, qual a precis ao desses resultados e com que probabilidade se pode conar nas conclus oes obtidas. Evidentemente, a forma como as infer encias ser ao realizadas ir a depender de cada tipo de problema, conforme ser a estudado posteriormente. Segue-se que a teoria da Infer encia Estat stica recorre intensamente a conceitos e resultados do C alculo de Probabilidades.

4.2

Problemas de Infer encia

O objetivo da Infer encia Estat stica e obter arma c oes sobre uma dada caracter stica da popula c ao, na qual se tem interesse, a partir de informa c oes colhidas de uma amostra. Essa caracter stica de interesse pode ser representada por uma vari avel aleat oria. Se informa c oes completa sobre a distribui c ao de probabilidade da vari avel em estudo, fosse conhecida n ao haveria necessidade de colher uma amostra. Toda arma c ao desejada seria obtida atrav es da distribui c ao da vari avel, usando-se as propriedades estudadas anteriormente. Mas isso raramente acontece. A informa c ao que se tem a respeito da vari avel e parcial ou nada se conhece. Por exemplo, a altura dos brasileiros adultos, apresenta uma distribui c ao normal, mas os par ametros que a caracterizam (m edia e vari ancia) s ao desconhecidos. Em outros casos, pode-se ter uma id eia da m edia e vari ancia, mas se desconhece a forma da curva. Ou ainda, n ao h a informa c oes nem sobre os par ametros, nem sobre a forma da curva. Ent ao, o uso de uma amostra permite ter uma id eia sobre o comportamento da vari avel na popula c ao.

38

4.3

Distribui c ao Amostral

ROSSI, Robson M. 39

4.3

Distribui c ao Amostral

J a foi visto, que o problema da Infer encia Estat stica e fazer uma arma c ao sobre par ametros da popula c ao atrav es da amostra. Suponha que uma arma c ao deva ser feita sobre um par ametro populacional (m edia, vari ancia ou qualquer outra medida). Ser a utilizado uma amostra aleat oria simples, com reposi c ao, de n elementos sorteados dessa popula c ao. A decis ao ser a baseada em uma estat stica calculada em fun c ao da amostra, (X1 ,X2 ,.., Xn ). A validade da resposta seria melhor compreendida se fosse conhecido o que acontece com a estat stica, quando todas as amostras de uma popula c ao conhecida s ao retiradas, segundo o plano amostral adotado. Isto e, qual a distribui c ao da estat stica quando (X1 ,X2 ,.., Xn ) assume todos os valores poss veis. Esta distribui c ao e chamada de distribui c ao amostral da estat stica e desempenha papel fundamental na teoria de Infer encia Estat stica. Didaticamente, tem-se o seguinte esquema: 1. Uma popula c ao X, com um certo par ametro de interesse. 2. Todas as amostras retiradas da popula c ao, de acordo com um certo procedimento. 3. Para cada amostra, calcula-se o valor da estat stica. 4. Os valores da estat stica formam uma nova popula c ao, cuja distribui c ao recebe o nome de distribui c ao amostral da estat stica.

4.4

Distribui c oes de Probabilidade

O objetivo da Infer encia Estat stica e obter arma c oes sobre uma dada caracter stica da popula c ao, na qual se tem interesse, a partir de informa c oes colhidas de uma amostra. Essa caracter stica de interesse pode ser representada por uma vari avel aleat oria. Se informa c oes completa sobre a distribui c ao de probabilidade da vari avel em estudo, fosse conhecida n ao haveria necessidade de colher uma amostra. Ent ao, toda arma c ao desejada seria obtida atrav es desta distribui c ao. Mas isso raramente acontece. A informa c ao que se tem a respeito da vari avel e parcial ou nada se conhece. Exemplos: a altura dos brasileiros adultos, apresenta uma distribui c ao Normal? a preval encia (propor c ao) de uma determinada doen ca infecciosa segue uma distribui c ao Binomial? o n umero de lhos de um casal humano segue uma distribui c ao de Poisson ? o tempo de vida de pacientes soropositivos segue uma distribui c ao Exponencial? Se n ao h a informa c oes nem sobre os par ametros, nem sobre a forma da curva, ent ao, o uso de uma amostra nos d a uma id eia sobre o comportamento da vari avel na popula c ao. Atrav es de suas caracter sticas e atrav es de testes de ader encia, podemos vericar qual o modelo probabil stico (conhecido) ser a mais adequado aos dados. Muitas vezes isto n ao acontece. Nestes casos um novo modelo dever a ser produzido, ou a distribui c ao e produzida atrav es de simula c ao computacional.

4.4.1

Distribui c ao Binomial

Considere n ensaios independentes e todos com a mesma probabilidade de sucesso p. A vari avel aleat oria discreta que conta o n umero total de sucessos e denominada Binomial com par ametros n e p, isto e X Bin(n; p) onde sua fun c ao de probabilidade e dada por: P (X = x) = n x nx p q , q = 1 p; x = 0, 1, 2, ..., n. x

4.4

Distribui c oes de Probabilidade

ROSSI, Robson M. 40

Exemplo 4.1. Uma certa doen ca pode ser curada atrav es de procedimentos cir urgicos em 80% dos casos. Dentre os que t em essa doen ca, sorteamos 15 pacientes que ser ao submetidos ` a cirurgia. Fazendo alguma suposi c ao adicional que julgar necess aria. Qual a probabilidade de todos serem curados? X P (X = Bin(15; 0, 8) 15 15) = 0, 815 0, 21515 15 0, 0352 ou 3, 52%.

Obs.: Se X tem uma distribui c ao Binomial ent ao m edia : vari ancia : E (X ) = np V ar(X ) = npq

4.4.2
por

Distribui c ao de Poisson

Uma vari avel X tem distribui c ao de Poisson com par ametro > 0 se sua fun c ao de probabilidades e dada e , x = 0, 1, 2, ... x! com par ametro sendo usualmente referido como a taxa de ocorr encia. A nota c ao utilizada ser a P (X = x) = X P o(). O modelo Poisson e um modelo discreto muito utilizado em experimentos biol ogicos e, nesses casos, e a freq u encia m edia ou esperada de ocorr encias num determinado intervalo de tempo. Exemplo 4.2. Chegada de pacientes em um pronto socorro. Suponha que o n umero de pacientes que chegam a um pronto socorro de uma pequena cidade durante a madrugada tenha distribui c ao de Poisson com m edia 3 ( = 3). Calcular as probabilidades de chegadas desses pacientes: Tabela 4.1: Distribui c ao de Poisson com par ametro = 3. x P(X = x) x P(X = x) 0 0,050 7 0,022 1 0,149 8 0,008 2 0,224 9 0,003 3 0,224 10 0,001 4 0,168 11 0,000 5 0,101 12 0,000 13 0 6 0,050

4.4.3

Distribui c ao Normal

A maioria dos fen omenos da natureza, em especial os biol ogicos, apresenta varia c oes dentro de um intervalo denido. Se colet assemos os dados quanto ao peso de mil indiv duos, encontrar amos diversos valores, dos quais haveria pequena quantidade de baixos e altos, e grande quantidade em torno dos valores centrais. Numa representa c ao gr aca dos dados obtidos, encontrar amos uma distribui c ao normal, conforme gura abaixo. A Distribui ca o de Probabilidade Normal, ou Distribui c ao Gaussiana (curva de Gauss), se caracteriza por reunir um grande n umero de valores em torno da m edia, que diminuem gradualmente de freq u encia ` a medida que se afastam dela.

4.4

Distribui c oes de Probabilidade

ROSSI, Robson M. 41

Probabilidade

0.0
4

0.1

0.2

0.3

Amostra

Figura 4.1: Distribui c ao Normal. A distribui c ao de probabilidade e dada por: P (X = x) = 1 2 1 x e 2

< x < +

X N (, ) L e-se: O conjunto de dados X, t em distribui c ao Normal com m edia : e desvio-padr ao : . Devido a complexidade da fun c ao de probabilidade, fazemos uso da Tabela Normal-Padr ao ou NormalReduzida, constru da atrav es da transforma c ao na vari avel X: Z= Caracter sticas: 1. e cont nua; 2. a curva em forma de sino, que engloba o total de freq u encias ou 100%; e sim etrica: a m edia () = a moda (Mo ) = a mediana (Md ); 3. 4. e unimodal; 5. o desvio-padr ao e ; 6. a curva de inex ao ocorre nos pontos x = ; Como j a dissemos, a area subordinada ` a curva normal representa 100% das freq u encias. Em torno da m edia determinamos intervalos com utiliza c ao do desvio-padr ao, conforme abaixo: 2 3 = = = 68, 26% 95, 45% 99, 73% X N (0, 1)

Exemplo 4.3. Press ao sist olica em jovens saud aveis. Suponha que a press ao arterial sist olica em pessoas jovens gozando de boa sa ude tenha distribui c ao N (120, 10) mmHg. Qual e a probabilidade de se encontrar uma pessoa com press ao sist olica acima de 140 mmHg ? X 140 120 = =2 10 P (X 140) = P (Z 2) = P (Z 2) = 0, 0228 ou 2, 28%. Z= Isto e, 2, 28% das pessoas jovens e sadias t em press ao sist olica acima de 140 mmHg.

4.5

Verica c ao da Adequa c ao do Modelo

ROSSI, Robson M. 42

4.5

Verica c ao da Adequa c ao do Modelo

Na pr atica n ao podemos fazer suposi c oes arbitr arias a respeito da distribui c ao de probabilidade dos dados, logo usamos de t ecnicas para fazer uma verica c ao da adequa c ao do modelo suposto. A verica c ao pode ser baseada nas caracter sticas do modelo, em gr acos especiais e em testes de ader encia. Para a distribui c ao Normal, em especial, sabemos que: 2 3 = = = 68, 26% 95, 45% 99, 73%

Grandes discrep ancias entre as freq u encias relativas observadas e as probabilidades te oricas acima sitadas, indicam uma poss vel falta de adequa c ao ao modelo gaussiano. Outros crit erios: T ecnicas Gr acas: Normal-plot, Q-Q-plot e P-P-plot; Testes de ader encia: Kolmogorov-Smirnov (K-S) [ e conhecidos], Shapiro Wilks (W) e/ou Lilliefors (L) [ e desconhecidos e estimados pelos dados atrav es de x e s, respectivamente]. A hip otese de normalidade nos dados deve ser da seguinte forma: H0 : Ha : Os dados s ao normalmente distribu dos Os dados n ao s ao normalmente distribu dos

uentePor exemplo, para um n vel de signic ancia de 5%, se p-valor < 5% ent ao rejeitamos H0 , conseq mente os dados n ao s ao normalmente distribu dos. Na pr atica, se for vericado que pelo menos o p-valor de um teste e signicante (p < %), a hip otese de normalidade da distribui c ao deve ser rejeitada; e caso contr ario se houver concord ancia dos testes W e L, isto e, os dados s ao normalmente distribu dos.

4.6

Faixas de Refer encia

Toda medida laboratorial e analisada confrontando-se seu valor com uma faixa padr ao. Isto e t ao comum que, na pr opria apresenta c ao do resultado, muitos laborat orios j a indicam os limites inferiores e superiores para o valor da medida que devem servir de base ao racioc nio cl nico. Devemos xar, inicialmente, o n vel de conan ca (1 )% ou cobertura; Calculamos atrav es da amostra de pessoas supostamente saud aveis: x e s. Tabela 4.2: Faixas de Cobertura (1 )% 90% 95% 99% . . . (1 )% Refer encia. Faixa x 1, 64.s x 1, 96.s x 2, 58.s . . . x Z .s 2

4.6

Faixas de Refer encia

ROSSI, Robson M. 43

1-alfa

alfa/2

alfa/2

-Z alfa/2

+Z alfa/2

Figura 4.2: Faixa de Refer encia Exemplo 4.4. Faixa de refer encia para identicar o Pseudomonas sp. Um pesquisador deseja criar um padr ao para identicar presen ca de infec c ao bacteriana (Pseudomonas sp ) no trato respirat orio atrav es de cultura de escarro. Para isto, coletaram-se dados de pessoas sabidamente sadias e determinou-se o n umero de col onias encontradas em cada cultura. Foram encontrados os seguintes resultados, em duas etapas amostrais distintas. Amostra 1: 20 26 30 32 35 21 26 30 32 35 23 27 30 32 36 24 28 30 33 36 25 29 30 33 37 25 29 31 33 37 25 29 31 34 38 25 29 31 34 38 25 29 32 34 41 25 30 32 35 42

Amostra 2: 17 24 25 35 51 22 24 26 35 54 23 23 28 35 56 23 25 28 36 56 23 25 29 40 56 23 25 30 41 58 24 25 30 41 60 24 25 31 41 68 24 25 31 42 79

Observe atrav es da Figura 4.3 o ajuste dos dados (pontos) linearizados, indicando ajuste dos dados a distribui c ao Normal. Para a Amostra 1, foram realizados os testes de normalidade e indicaram ajuste dos dados j a que pLilliefors >.20 e p-W = 0,8892. (Software Statistica vers ao 6.0). Observe atrav es da Figura 4.4 uma assimetria do Histograma comparado ` a Normal assim como a n ao ader encia ou desajuste dos dados (pontos) sob a reta, indicando que os dados n ao seguem uma distribui c ao Normal. Os testes conrmam isto: Para a Amostra 2 obtemos p-Lilliefors <0,01 e p-W < 0,000013. Neste caso duas metodologias distintas dever ao ser utilizadas para construir faixas de refer encia: Met odo de Gauss para a Amostra 1: [ x 1, 96.s] : [30, 7 1, 96.4, 9] [21; 40] col onias. Adequado

Observe que devido a normalidade temos praticamente a mesma faixa, utilizando o m etodo dos percentis: [21; 41] col onias. Adequado

4.7

Teorema do Limite Central

ROSSI, Robson M. 44

0.10

0.08

Freqncias

0.06

amostra

0.04

0.0

0.02

20

25

30

35

40

Q-QPlot

20

25

30

35

40

-2

-1

+1

+2

Figura 4.3: Histograma e Q-Q Plot da Amostra 1


0.05

Q-=Q Plot

0.04

Freqncias 0.03

amostra2
20 40 60 80

0.02

0.01

0.00

20

30

40

50

60

70

-2

-1

Figura 4.4: Histograma e Q-Q Plot da Amostra 2 e Met odo dos Percentis para a Amostra 2, isto e, obter uma faixa de inclua, por exemplo, 95% dos elementos, excluindo os 2,5% valores menores e os 2,5 % maiores valores [22; 68] col onias. Adequado Observe que agora, se opt assemos pelo m etodo de gauss ter amos: [7; 63] col onias. Inadequado Um teste estat stico a ser usado depende do tipo de vari avel e do tipo de planejamento. A seguir ser ao apresentados os testes mais comuns para quatro situa c oes: vari avel dicot omica (amostras independentes e pareadas) e vari avel cont nua (amostras independentes e pareadas).

4.7

Teorema do Limite Central

Teorema. Para amostras aleat orias simples (X1 ,X2 ,.., Xn ), retiradas de uma popula c ao com m edia e vari ancia 2 , a distribui c ao amostral da m edia aproxima-se de uma distribui c ao normal com m edia e 2 vari ancia , quando n , isto e n 2 N ; . X n

4.8

Tamanho da Amostra

ROSSI, Robson M. 45

Utilizando-se deste teorema, podemos construir um Intervalo de Conan ca de (1 )% para , para um n vel de signic ancia, , xo: Z . IC () : X . 2 n Se a popula c ao original e pr oxima da normal, sua converg encia e r apida; j a, se a distribui c ao da popula c ao tem outra distribui c ao, essa converg encia e mais demorada. Como regra pr atica, aceita-se que para amostras com mais de 30 elementos a aproxima c ao j a pode ser considerada muito boa. No caso de amostras pequenas, usa-se uma aproxima c ao atrav es da distribui c ao t student : s t(n1; ) . IC () : X , 2 n onde s e o desvio-padr ao amostral, utilizado quando n ao se conhece , o desvio-padr ao populacional. Seja uma popula c ao em que a propor c ao de elementos portadores de uma certa caracter stica e p. Assim, a popula ca o pode ser considerada como a vari avel aleat oria X, tal que: X: 1, se o indiv duo possui a caracter stica; 0, se o indiv duo n ao possui a caracter stica p.

assim, para n sucientemente grande, pode-se considerar a distribui c ao amostral de p do seguinte modo: p N p; p.(1 p) n

onde a propor c ao de indiv duos portadores da caracter stica na amostra e dada por: p = Y n

sendo que Y e o total de indiv duos portadores da caracter stica na amostra. Analogamente ao processo de obten c ao do IC para a m edia, podemos obter um IC com uma conan ca de (1 )%, para a propor c ao populacional, considerando um n vel de signic ancia, , xo: . IC (p) : p Z 2 p .(1 p ) . n

4.8

Tamanho da Amostra

O assunto pertence ` a Teoria da Amostragem. Pode-se, entretanto, calcular, para algumas situa c oes especiais, o tamanho da amostra necess ario para se fazer infer encias.

4.8.1

M etodo simples

Tamanho de uma amostra aleat oria simples. Ser a abordado c alculo do tamanho da amostra para amostragem aleat oria simples. A diferen ca entre a estat stica descritiva dos elementos da amostra e o verdadeiro valor do par ametro que se deseja estimar como o erro amostral. Para determinar o tamanho da amostra o pesquisador deve especicar o erro amostral toler avel, ou seja, quanto ele admite errar na avalia c ao dos par ametros de interesse. A especica c ao do erro amostral toler avel deve ser feita sob um enfoque probabil stico, pois por maior que seja a amostra, existe sempre o risco do sorteio gerar uma amostra com caracter sticas bem diferentes da popula ca o de onde ela foi extra da. O calcular do tamanho m nimo de uma amostra aleat oria simples e dado por: Sejam: N: tamanho (n umero de elementos) da popula c ao; n: tamanho (n umero de elementos) da amostra; n0 : uma primeira aproxima c ao do tamanho da amostra, e E0 : erro amostral toler avel.

4.8

Tamanho da Amostra onde n0 =

ROSSI, Robson M. 46

1 . E0

Conhecendo N o tamanho da popula c ao, pode-se corrigir o c alculo: n= N.n0 . N + n0

Exemplo 4.5. Com objetivo de conhecer algumas caracter sticas dos pacientes de uma cl nica com 35 pacientes. Suponha que seja de interesse realizar um levantamento por amostragem para avaliar diversas caracter sticas da popula c ao de pacientes. Qual deve ser o tamanho m nimo da amostra aleat oria simples, tal que se possa admitir, com alta conan ca, que os erros amostrais n ao ultrapassem 4% (E0 = 0,04)? Solu c ao: Uma primeira aproxima c ao e dada por: n0 = 1 = 625 pacientes. 0, 042

Corrigindo, em fun c ao do tamanho N da popula c ao, tem-se: n= 35.625 35 + 625 34.

Exemplo 4.6. Suponha que na clinica do Exemplo anterior a popula c ao fosse de N = 200 pacientes. Qual deve ser o tamanho m nimo da amostra aleat oria simples, tal que se possa admitir, com alta conan ca, que os erros amostrais n ao ultrapassem 4% (E0 = 0,04)? Solu c ao: O valor de n0 continua sendo o mesmo do exemplo anterior, pois n ao depende de N. Fazendo a corre c ao em termos do novo valor de N, tem-se: n= 200.625 200 + 625 152.

Exemplo 4.7. Suponha agora que a popula c ao fosse de N = 200.000 pacientes. Solu c ao: Da mesma forma, o valor de n0 continua sendo o mesmo dos exemplos anteriores. E a corre c ao em termos do novo valor de N, e: n= 200.000.625 200.000 + 625 623 pacientes.

Observe que: Para manter o mesmo erro amostral, no Exemplo ?? foi necess aria uma amostra abrangendo quase 100% da popula c ao; enquanto no Exemplo 4.6 a amostra abrange 76%; e no Exemplo 4.7 abrange portanto, err 0,3% da popula c ao. E, onea a id eia de que para uma amostra ser representativa deva abranger uma percentagem xa da popula c ao. Tamanho da amostra em subgrupos da popula c ao muito comum termos interesse em estudar separadamente certos subgrupos da popula E c ao. Nesta situa c ao, e preciso calcular o tamanho da amostra para cada uma destas partes. O tamanho total da amostra vai corresponder ` a soma dos tamanhos das amostras de cada parte. O tamanho total da amostra cresce bastante quando se desejam estimativas isoladas para os diversos subgrupos da popula c ao, por isso, e comum o pesquisador n ao ser muito exigente na precis ao das estimativas nos subgrupos, tolerando erros amostrais maiores.

4.8.2

M etodo inferencial

Tamanho da amostra sem conhecimento de N : Tamanho da Popula c ao. Se o objetivo e estimar a m edia, ou uma propor c ao, pode-se usar os intervalos de conan ca anteriormente estabelecidos para obter n, o tamanho da amostra. Para isto, e preciso xar o maior erro aceit avel e o n vel de conan ca com que se quer trabalhar.

4.8

Tamanho da Amostra

ROSSI, Robson M. 47

Sendo o tamanho m aximo do erro aceit avel : e (xo), com probabilidade (1 ) (xo), o intervalo de conan ca de n vel 100(1 )% ser ao, respectivamente, para a m edia e para a propor c ao, considerando a popula c ao innita, tem-se: .so 2 Z 2 e Z . 2 2 n= .p 0 .(1 p 0 ) e n= onde ou s o e = Z 2 n 2 Z . 2 n 2e

onde p 0 e so s ao estimativas da propor c ao e da dispers ao, respectivamente, obtidos atrav es de uma amostra piloto. Exemplo 4.8. Numa amostra de classica c ao de veteranos de um col egio com. x = 2, 6 e so = 0, 3, qual deve ser o tamanho da amostra para que tenhamos 95% de conan ca em que erro da estimativa de n ao supere 0,05? Sol.: n = = Z .so 2 e
2

1, 96.0, 3 0, 05 139.

lias que possuem aparelho de televis ao em certa Exemplo 4.9. Suponha que, em uma amostra de 500 fam cidade, haja 340 com televisor em cores. Se o objetivo e estimar o n umero de fam lias que possuem televisor em cores, qual o tamanho da amostra necess ario para que tenhamos 95% de conan ca em que o erro da estimativa n ao seja superior a 0,02 ? Sol.: Trate as 500 fam lias como uma mostra preliminar que fornece a estimativa p 0 = 0, 68. Ent ao: n = = = Z . 2 e 1, 96 0, 02 2.090
2

.p 0 .(1 p 0 )
2

.0, 68.(0, 32)

Tamanho da amostra com o conhecimento de N : Tamanho da Popula c ao. Para o caso em que a popula c ao e nita e pequena, onde a amostragem e sem reposi c ao, temos as f ormulas para o c alculo do tamanho amostral, respectivamente, para a m edia e para a propor c ao: n= n= N. Z .so 2
2 2 2;

(N 1).e2 + Z .so 2 ou n

e N. Z 2
2

N.p 0 .q 0 . Z 2 p 0 .q 0 . Z 2
2

+ (N 1).e2

Z 2

+ 4(N 1).e2

Alternativamente, temos tanto para o caso em que estudamos vari aveis quantitativas discretas, quanto aculo de cont nuas, utilizamos as f ormula descritas anteriormente, e tomamos n = n0 , e conhecendo N , o c n, tamanho amostral poder a ser obtido atrav es de: n0 n= n0 . 1+ N Exemplo 4.10. Determinado trabalho, realizado para investigar a preval encia de hansen ase em trabalhadores rurais, apresentou um valor igual a 22%. Para estimar o tamanho da amostra para novo projeto sobre hansen ase, desejamos um n vel de conan ca de 95% e erro de amostragem de 5%. Determine n, o tamanho da amostra nescess aria para uma popula c ao de tamanho N = 100.000.

4.9

Testes de Hip oteses Sol.: n0 n0 n0 = = Z . 2 e 1, 96 0, 05 264


2

ROSSI, Robson M. 48

.p 0 .(1 p 0 )
2

.0, 22.(0, 78)

logo, o tamanho da amostra corresponder a a: n n n n0 n0 1+ N 264 = 264 1+ 100.000 = 263. =

4.9

Testes de Hip oteses

Freq uentemente e necess ario tomar decis oes sobre par ametros ou distribui c oes populacionais com base em informa c oes amostrais, as quais s ao denominadas decis oes estat sticas. Na tomada de decis oes, s ao formuladas hip oteses que ser ao rejeitadas ou n ao rejeitadas. Tais hip oteses, que podem ser verdadeiras ou n ao, chamam-se hip oteses estat sticas e, em geral, consistem de arma c oes sobre os par ametros populacionais ou sobre as distribui c oes de probabilidade das popula c oes, como por exemplo: 1. a m edia populacional da altura dos brasileiros e 1,65m; c ao de brasileiros com a doen ca X e 40% (p = 0, 40); 2. a propor 3. a distribui c ao dos pesos dos pacientes adultos do hospital X e normal. Os processos que nos permitem decidir por rejeitar ou n ao rejeitar uma hip otese, ou determinar se amostras observadas diferem signicativamente dos resultados esperados s ao chamados Testes de Hip oteses. O objetivo e fornecer ferramentas que nos permitam validar ou refutar uma hip otese, atrav es de resultados da amostra. Os Testes de Hip oteses podem ser de dois tipos: (a) N ao Param etricos: quando formulamos hip oteses com respeito ` a natureza da distribui c ao da popula c ao. Estes testes n ao dependem dos par ametros populacionais, nem de suas respectivas estimativas. Veja o item (3.) acima. (b) Param etricos: quando formulamos hip oteses com respeito ao valor de um par ametro populacional. Veja itens (1.) e (2.) acima.

4.9.1

Constru c ao de um Teste de Hip otese

Inicialmente, para a constru c ao de um teste, deve-se formular duas hip oteses a cerca da arma c ao: (a) Hip otese Nula (H0 ): e uma arma c ao que diz que o par ametro populacional e tal como especicado. (b) Hip otese alternativa (Ha ): e uma arma c ao que oferece uma alega c ao alternativa (isto e, o par ametro e diferente do valor alegado). As hip oteses estat sticas para um par ametro q, podem ser formuladas como segue: 1. Teste Bilateral: quando utilizamos ambas as caudas da distribui c ao. Teste Unilateral ` a Direita: quando utilizamos a cauda direita da distribui c ao. H0 : Ha : = 0 = 0

4.9

Testes de Hip oteses

ROSSI, Robson M. 49

2. Teste Unilateral ` a Direita: quando utilizamos a cauda direita da distribui c ao. H0 : Ha : = 0 > 0

3. Teste Unilateral ` a Esquerda: quando utilizamos a cauda esquerda da distribui c ao. H0 : Ha : = 0 < 0

Ao se testar uma hip otese, o que se deseja vericar e, atrav es de uma estat stica obtida de uma amostra, se a hip otese pode ou n ao rejeitada com o n vel de signic ancia pr e-xado, . Esta conclus ao e tomada com base na Regi ao Cr tica (RC: cuja area corresponde a ) que e constru da de modo que: P ( RC |H0 e e verdadeira) = . RA e denominada Regi ao de n ao rejei c ao cuja area corresponde a 1 . O procedimento que ser a utilizado para a constru c ao de um teste de hip otese e o que consiste em apresentar o n vel descritivo ou p-valor (p-value ).

1-alfa

alfa/2

alfa/2

-Zalfa/2

+Z alfa/2

Figura 4.5: Teste de Hip otese Bilateral. A seq u encia abaixo pode ser usada sistematicamente para qualquer teste de hip otese: 1. Passo 1: Denir as hip oteses H0 e Ha ; 2. Passo 2: Use a teoria estat stica e as informa c oes para decidir qual a distribui c ao da estat stica (estimador) que ser a utilizada no julgamento de H0 ; 3. Passo 3: Escolher o n vel de signic ancia a e utilizando as informa c oes fornecidas pela amostra para encontrar o valor do estimador do par ametro (estat stica) que est a sendo testado; stica observada na amostra encontrar a probabilidade (probabilidade 4. Passo 4: Com o valor da estat de signic ancia p-valor) de ocorrer amostras com valores mais extremos do que o valor obtido. 5. Passo 5: Conclus ao. Compare a probabilidade obtida, p-valor, com o valor de a. A hip otese nula ser a rejeitada para aqueles n veis de signic ancia cujos valores sejam maiores que a probabilidade calculada.

4.9

Testes de Hip oteses

ROSSI, Robson M. 50

4.9.2

O p-valor

O procedimento de teste de hip otese descrito acima fornece informa c ao sobre a for ca da evid encia contra H0 obtida a partir dos dados. Isto e, e informado se o valor observado para a estat stica de teste que levou ` a rejei c ao de H0 est a pr oxima da fronteira da RC regi ao cr tica (baixa evid encia contra H0 ) ou se est a muito afastada da fronteira (alta evid encia contra H0 ). O p-valor e a probabilidade de ocorr encia do valor particular observado para a estat stica de teste ou de valores mais extremos, na dire c ao da regi ao cr tica, quando a hip otese nula H0 e verdadeira. Quanto maior for a for ca da evid encia contra H0 , menor ser a o p-valor.

Cap tulo 5

An alise em Tabelas 2x2 e LxC


Neste t opico estudaremos a rela c ao entre duas vari aveis categ oricas (ou qualitativas), onde as observa c oes podem ser classicadas em uma das v arias categorias (n veis ou c elulas) mutuamente exclusivas. O problema de mensura c ao do grau de associa ca o entre dois conjuntos de escores e de car ater bem diferente do teste da simples exist encia de uma associa ca o em determinada popula c ao. Naturalmente, h a interesse em avaliar o grau de associa c ao entre dois conjuntos de escores referentes a um grupo de indiv duos. Mas e talvez de muito maior interesse podermos armar que determinada associa c ao observada em uma amostra de escores indica, ou n ao, probabilidade de associa c ao entre as vari aveis na popula c ao da qual se extraiu a amostra (Siegel, 1956).

5.1

Tabelas de Conting encia

Segundo o dicion ario Webster o termo contingency signica the quality or state of having a close connection or relationship. O termo contingency table se refere ao fato de que as tabelas constru das s ao usadas para testar a exist encia de rela c oes entre duas vari aveis. Observamos que infelizmente este termo em portugu es n ao tem o mesmo signicado. Segundo o Aur elio, conting encia signica qualidade do que e contingente, incerteza se uma coisa vai acontecer ou n ao e contingente signica que pode ou n ao suceder, eventual, incerto. Logo, em estat stica, quando nos referimos a palavra conting encia estamos tomando o mesmo signicado da l ngua inglesa. O teste chi-quadrado (2 ) pode ser usado para avaliar a rela c ao entre duas vari aveis qualitativas. Este teste e um teste n ao-param etrico, que e muito u til, pois n ao precisa da suposi c ao de normalidade das vari aveis para analisar o grau de associa c ao entre as duas vari aveis, por em este teste e menos poderoso que o teste param etrico. Dentro deste teste devemos distinguir dois tipos de testes: o de independ encia e o de homogeneidade. Vejamos quando estamos tratando de um teste de independ encia e quando estamos tratando com um teste de homogeneidade, atrav es de exemplos.

5.2

Teste de Independ encia e de Homogeneidade

Suponha que uma educadora quer analisar se existe rela c ao entre a participa c ao ativa dos pais dos alunos nos deveres extra-escolares e o desempenho dos alunos em Matem atica. Suponha que ela categoriza o desempenho dos alunos em tr es grupos: baixo, m edio, alto e, do mesmo modo, categoriza a participa c ao c ao ativa, participa c ao fraca. Suponha que ela deseja trabalhar com 300 dos pais em dois grupos: participa crian cas. Neste caso a educadora pode delinear sua pesquisa de duas formas:

51

5.2

Teste de Independ encia e de Homogeneidade

ROSSI, Robson M. 52

Caso 1. Selecionar uma amostra de crian cas aleatoriamente e examinar em que c elula cada uma est a alocada, logo o u nico valor xo ser a o total geral que ser a de 300. Mas os totais de colunas e de linhas ser ao frutos da pesquisa, portanto, aleat orios, neste caso estamos frente a um teste de independ encia de vari aveis. Logo a tabela de conting encia ser a: Tabela 5.1: Exemplo de tabela de conting encia. Desempenho do aluno em Matem atica Total Baixo M edio Alto Teste de Aleat orio = Independ encia Aleat orio Aleat orio Aleat orio Aleat orio 300

Participa c ao dos pais Ativa Fraca Total

Por em ela pode xar o n umero de alunos de acordo com seu desempenho. Caso 2. Pegar uma amostra aleat oria de tamanho 100 de cada grupo de alunos, logo os totais das colunas ser ao xos, mas os totais das linhas ser ao aleat orios e assim estaremos frente a um teste de homogeneidade: Logo a tabela de conting encia ser a: Tabela 5.2: Exemplo de tabela de conting encia. Desempenho do aluno em Matem atica Total Baixo M edio Alto Teste de Aleat orio = Homogeneidade Aleat orio 100 (xo) 100 (xo) 100 (xo) 300

Participa c ao dos pais Ativa Fraca Total

Os valores totais, das colunas e das linhas, s ao chamados de totais marginais. Quando os totais marginais variam livremente, o teste de associa c ao e chamado de independ encia, e quando um dos conjuntos, linha ou coluna e xado pelo pesquisador ent ao e chamado de teste de homogeneidade. Isso vai depender do pesquisador. No exemplo da educadora, observemos que para ela e muito mais f acil xar o n umero de alunos segundo seu desempenho, do que xar pela participa c ao dos pais, que, apriori ser a quase imposs vel. Teste de Independ encia Apresentaremos a l ogica do teste com um exemplo bastante simples. Exemplo 5.1. Suponha que 125 crian cas foram expostas a tr es tipos de comerciais de TV, sobre cereais para caf e da manh a. Ap os a exposi c ao foi solicitado a cada crian ca para indicar qual dos comerciais ela gostou mais. O que se deseja saber e se a escolha do comercial est a relacionado ao g enero da crian ca: pois suspeita-se de que o g enero pode estar inuenciando na escolha do comercial. Os dados podem ser apreciados na Tabela 5.3. Tabela 5.3: N umero de crian cas segundo tipo de comercial escolhido e g enero. Tipo de comercial G enero A B C Total Meninos 30 29 16 75 Meninas 12 33 5 50 Total 42 62 21 125 Analisando atentamente a Tabela 5.3, composta por valores absolutos, percebemos:

5.2

Teste de Independ encia e de Homogeneidade a amostra est a composta por mais meninos do que meninas, nos comerciais A e C o n umero de meninos e maior do que meninas, e no comercial B essa rela c ao se inverte.

ROSSI, Robson M. 53

Contudo, essa an alise ca prejudicada pela composi c ao da amostra, que tem mais meninos do que meninas. Portanto, a primeira coisa a fazer e analisar as estruturas percentuais, mostradas na Tabela 4.3, ou seja retirar a inu encia da amostragem. Tabela 5.4: Porcentagem para os valores absolutos de crian cas por tipo de comercial escolhido e g enero apresentados na tabela anterior. Tipo de comercial G enero A B C Total Meninos 71% 47% 76% 60% Meninas 29% 53% 24% 40% Total 100% 100% 100% Observe cuidadosamente a Tabela 5.4, onde 60% da amostra e composta por meninos. Se a prefer encia das crian cas pelos comerciais independe do g enero, esperar amos que a estrutura percentual para cada comercial casse em torno de 60% para os meninos e 40% para as meninas, desvios grandes destes percentuais estariam mostrando evid encias de que existe alguma rela c ao entre essas vari aveis. Essa inspe c ao intuitiva, tamb em, pode ser feita analisando a estrutura dentro de cada g enero como mostra a Tabela 5.5. Tabela 5.5: Porcentagem de crian cas por g enero e tipo de comercial escolhido. Tipo de comercial G enero A B C Total Meninos 40% 39% 21% 100% Meninas 24% 66% 10% 100% Total 33% 50% 17% Analisando a Tabela 5.5 observamos que as meninas tem uma forte prefer encia pelo comercial B, enquanto que os meninos se dividem entre o comercial A e B. Assim, intuitivamente percebemos que existe interfer encia do g enero na prefer encia, agora precisamos saber at e que ponto essas diferen cas se devem ao acaso, ou a exist encia de associa c ao entre as duas vari aveis: X: prefer encia pelo comercial ( A, B e C) qualitativa; Y: g enero (meninos, meninas) qualitativa. Hip otese nula (H0 ): A prefer encia pelo comercial independe do g enero da crian ca; Hip otese alternativa (Ha ): A prefer encia pelo comercial depende do g enero da crian ca (ou, o g enero interfere na prefer encia pelo comercial); Analogamente, temos: Ho H1 : independ encia de vari aveis : depend encia de vari aveis

Como deveriam ser os valores a serem observados se as vari aveis fossem independentes?, ou dito de outra forma, sob a hip otese de nulidade, de independ encia de vari aveis, como deveriam ser os valores a serem observados? A l ogica nos diz que esses valores devem estar muito pr oximos da estrutura percentual global. Esses valores s ao chamados de valores esperados. Cada valor esperado ser a calculado supondo que a estrutura percentual global se mantenha em cada coluna: Calculando os valores esperados, sobre a suposi c ao de independ encia:

5.2

Teste de Independ encia e de Homogeneidade

ROSSI, Robson M. 54

Valores percentuais Tipo de comercial G enero A B C Meninos 60% 60% 60% Meninas 40% 40% 40% Total 42 62 21

Valores absolutos Valores esperados Total G enero A B C e 60% Meninos 25 37 13 40% Meninas 17 25 8 125 Total 42 62 21

Tabela 5.6:

Total 75 50 125

Valor esperado menino, comercial A: 60% de 42 = 25,2 Valor esperado menino, comercial B: 60% de 62 = 37,2 ... O mesmo teria acontecido se xarmos primeiro o comercial: Valor esperado comercial A, menino: 33,7% de 75 = 25,2 Valor esperado comercial A, menina: 33,7% de 50 = 16,8 ... Tanto faz xar a linha ou a coluna pois: Ei = Tl Tc Tc Tl = Tl = Tc T T T

Por exemplo, calculemos o valor esperado da primeira linha e primeira coluna: Ei = 75 42 42 75 = 75 = 42 = 25, 2 125 125 125

Assim calculando os valores esperados para todas as c elulas temos: Tabela 5.7: Tipo de comercial A B Oi = 30 Ei = 25,2 29 37,2 di = +4,8 -8,2 12 16,8 33 24,8 -4,8 +8,2 42 62

G enero Meninos Meninas Total

C 16 12,6 +3,4 5 8,4 -3,4 21

Total 75 50 125

Dentro de cada c elula, no canto superior esquerdo colocamos o valor observado, no canto superior direito o valor esperado (sob a hip otese de independ encia) e, na parte inferior, a dist ancia entre o observado e o esperado. Logo, se as vari aveis fossem independentes, as dist ancias entre os valores observados e esperados deveriam ser muito pequenas, caso contr ario haver a ind cios de depend encia. A pergunta agora e: quando a dist ancia e pequena ou grande? Para isto devemos calcular o valor (2 ) qui-quadrado da amostra: 2 amostra =
k (O E )2 (observado esperado)2 i i = esperado E i i=1 i=1 k

que ter a uma distribui c ao chi-quadrado com graus de liberdade igual ao produto do n umero de linhas menos um vezes o n umero de colunas menos um, isto e:
2 2 amostra

: graus de liberdade : (no colunas - 1)(no linhas - 1)

Para testar as hip oteses, temos a estat stica teste qui-quadrado com corre c ao de continuidade de Yates: 2 cY =
k i=1

|Oi Ei | Ei

1 2 2

2 [L1C 1;(1)%] (Tabelas L C)

5.2

Teste de Independ encia e de Homogeneidade No nosso exemplo sem a corre c ao de Yates, temos: 2 amostra = = =

ROSSI, Robson M. 55

(+4, 8)2 (8, 2)2 (+3, 4)2 (4, 8)2 (+8, 2)2 (3, 4)2 + + + + + 25, 2 37, 2 12, 6 16, 8 24, 8 8, 4 0, 914 + 1, 808 + 0, 917 + 1, 371 + 2, 711 + 1, 376 9, 09818 (p-valor : 0,0106) onde v = (2 1) (3 1) = 1 2 = 2

Para aceitar ou rejeitar a hip otese devemos conhecero valor de 2 calculado na tabela qui-quadrado, com dois graus de liberdade. Para = 5%, o valor cr tico e 5, 991, como o valor da amostra e maior que o valor cr tico, logo rejeitamos a hip otese nula, concluindo que o g enero interfere na prefer encia pelos comerciais. No caso de dispormos de um pacote estat stico, este, via de regra, calcula o p-valor, nesse caso e s o comparar esse valor com o n vel de signic ancia desejado. No nosso caso o p valor = 0, 01058, ou seja, rejeitamos ao n vel de 5% mas n ao ao n vel de 1%. Obs.: Quando as vari aveis s ao independentes (H0 ), as freq u encias observadas tendem a car perto das esperadas. Neste caso, o valor de 2 deve ser pequeno. Limita c oes do teste 2 : 1. Infelizmente, o teste qui-quadrado n ao permite concluir como se d a a rela c ao, uma v ez que ele testa apenas a hip otese geral de que as duas vari aveis s ao independentes. Examinando a dist ancia entre valor observado e esperado, por exemplo, observamos que as meninas tem uma maior prefer encia pelo comercial B, por em n ao podemos concluir nada. 2. Uma outra limita c ao do teste qui-quadrado e que o valor esperado das c elulas n ao deve ser menor ou igual a 5 e devido a isso torna vulner avel a estat stica. Nesse caso usamos outra estrat egia: o teste exato de Fisher. Teste de Homogeneidade Quando testamos independ encia de vari aveis, o pesquisador s o controla o tamanho total da amostra, mas os totais para cada coluna e linha s ao aleat orios. Exemplo 5.2. No caso do exemplo anterior, os pesquisadores selecionaram aleatoriamente 125 crian cas, das quais 75 eram meninos e 50 meninas. Ele n ao xou o numero de meninos e o n umero de meninas. Vejamos um exemplo de teste de homogeneidade. Retomemos o exemplo inicial e suponhamos que a professora xou o tamanho dentro de cada grupo de alunos e os resultados foram os seguintes: Tabela 5.8: N umero de alunos segundo seu desempenho em Matem atica e participa c ao dos pais nas atividades extra-escolares. Desempenho em Matem. Participa c ao Baixo M edio Alto Total dos pais Ativa 5 25 70 100 Fraca 95 75 30 200 Total 100 100 100 300

H0 H1

: p11 = p12 = p13 igualdade de propor c oes : p1i = p1j ; para algum i = j existe pelo menos uma propor c ao diferente

A hip otese nula esta testando que a propor c ao de alunos com baixo desempenho e igual a propor c ao de alunos m edio e igual a propor c ao de alunos com desempenho alto quando seus pais participam ativamente das atividades extra-escolares, contra a hip otese alternativa que indica que existe pelo menos uma propor c ao diferente. O teste e id entico ao teste de independ encia.

5.2

Teste de Independ encia e de Homogeneidade

ROSSI, Robson M. 56

O Coeciente de Conting encia. O coeciente de conting encia e uma medida do alcance da associa c ao ou rela c ao entre dois conjuntos de atributos. Ele e calculado em fun c ao do valor calculado na tabela de conting encia e independe de ordena c ao das categorias das vari aveis: C= 2 , onde n e o tamanho da amostra. 2 + n

Exemplo 5.3. No exemplo dos comerciais de TV, o coeciente de conting encia ser a: C= 9, 09818 = 0, 26047. 9, 09818 + 125

Para testar a signic ancia deste coeciente ter amos que recorrer a tabela pr opria. H0 H1 : : C=0 C=0

Se o p-valor associado for menor que alfa rejeitamos H0 e conclu mos de que existe associa c ao entre as vari aveis, caso contr ario n ao. Para facilitar a interpreta c ao, usaremos uma modica c ao deste coeciente. Chamaremos de k o menor entre l (no de linhas da tabela) e c (no de colunas da tabela), isto e: k = min{l; c}. O chamado coeciente de conting encia modicado (C ) e dado por: C = k.2 . (k 1)(2 + n)

O valor C sempre estar a no intervalo de 0 a 1. Ser a 0, somente quando houver completa independ encia e ser a 1 quando houver associa c ao perfeita. Valores de C pr oximos de 1 descrevem associa c ao forte, enquanto que valores de C pr oximos de 0 indicam associa c ao fraca. Os valores de C em torno de 50% podem ser interpretados como associa c ao moderada. Exemplo 5.4. C alculo do coeciente de conting encia para os dados do exemplo anterior. k C = = = = min{2; 3} = 2 k.2 (k 1)(2 + n) 2.(9, 09818) (2 1)(9, 09818 + 125) 0, 3684 ou 36, 84%.

Este resultado indica uma fraca associa c ao entre X: prefer encia pelo comercial e Y: g enero. Exerc cio 5.1. A freq u encia da invers ao F do cromossomo IIL foi estudada em popula c oes urbanas de Drosophila willistoni. Os exemplares foram coletados em zonas considerada de alta, m edia e baixa urbaniza c ao, na cidade de Porto Alegre ( Valente et al, 1993). Os dados foram comparados entre si e com um vel de 1% de signic ancia se existem evid encias de associa c ao grupo-controle n ao-urbano. Verique ao n entre a invers ao F e a Urbaniza c ao. Exerc cio 5.2. Crian cas hospitalizadas e alimentadas por nutri c ao endovenosa ` as vezes apresentam colestase,um bloqueio do uxo da bile que pode produzir c alculos biliares e outros problemas. Suponha que foi realizado um c ao grave sobre o risco de colestase estudo do tipo caso-controle para avaliar o efeito ( = 5%) de uma infec em crian cas com nutri c ao parenteral. A Tabela abaixo mostra o resultado de um estudo feito em 113 crian cas hospitalizadas. Como o desfecho, isto e, a colestase, e uma caracter stica rara na popula c ao, o risco relativo foi estimado atrav es do Odds Ratio (Fonte: Carvalho, 1993).

5.2

Teste de Independ encia e de Homogeneidade

ROSSI, Robson M. 57

Tabela 5.9: Associa c ao entre Invers ao F e Urbaniza c ao quando comparadas a um controle. Urbaniza c ao Invers ao F Alta Intermedi aria Baixa Controles Total Sim 63 421 641 223 1349 N ao 475 1201 1542 658 3875 Total 538 1622 2183 881 5224 % Invers ao F 12% 26% 29% 25% 26% Tabela 5.10: Presen ca de colestase em crian cas com nutri c ao endovenosa, som e sem infec c ao grave. Colestase Infec c ao grave Sim N ao Sim 19 61 N ao 1 32 Exerc cio 5.3. Com o objetivo de avaliar fatores de risco para o c ancer intra-epitelial da c ervice uterina, Soares (1998) estudou 43 casos com essa doen ca e 63 mulheres controles da popula c ao de Porto Alegre. A Tabela 2 apresenta dados relativos ` a presen ca do alelo DQB1*03, do sistema HLA. Teste a associa c ao entre a doen ca e o fator ao n vel de 5%. Em caso armativo determine o risco de desenvolver a neoplasia e seu respectivo IC. Tabela 5.11: Associa c ao entre c ancer intra-epitelialda c ervice uterina e presen ca do alelo DQB1*03. Presen ca do alelo C ancer DQB1*03 Outro Casos 33 10 Controles 24 39

5.2

Teste de Independ encia e de Homogeneidade

ROSSI, Robson M. 58

Exerc cio 5.4. Vericar se a freq u encia dos dois tipos de cromossomos Y est a relacionado com o grau de mistura racial aparente e com a idade do touro ao n vel de 5%. Tabela 5.12: Associa c ao entre tipo de cromossomo e contamina c ao de ra ca aparente. Tipo do cromossomo Contamina c ao racial aparente Acroc entrico Submetac entrico Sim 38 16 N ao 13 8

Tabela 5.13: Associa ca o entre tipo de cromossomo e idade do touro. Tipo do cromossomo Idade do touro Acroc entrico Submetac entrico 1 a 2 anos 21 17 3 anos ou + 30 7 Exerc cio 5.5. Em um estudo gen etico realizado em macacos amaz onicos da subesp ecie Saimiri sciureus ustus, Silva et al. (1993) encontraram varia c ao nas freq u encias de dois tipos de enzimas glioxalase (GLO) em animais que vivem nas margens do rio Jamari, em Rond onia. Na Tabela 4, est ao os n umeros observados de animais com diferentes tipos de enzim aticos, coletados nas margens esquerda e direita desse rio. Verique se existem evid encias de associa c ao entre as vari aveis ao n vel de 1%.

Tabela 5.14: Associa c ao entre tipos enzim aticos e margem do rio Jamari-Rond onia. Margem do rio Enzima Esquerda Direita GLO 2 72 74 GLO 2-3 22 3

5.2

Teste de Independ encia e de Homogeneidade

ROSSI, Robson M. 59

Exerc cio 5.6. Vieira e Prolla (1979) estudaram uma amostra de 384 pacientes com problemas pulmonares, classicando-os segundo a presen ca ou n ao de eosin olos no escarro e o tipo de pneumopatia diagnosticada. Existem evid encias de associa c ao entre as vari aveis ao n vel de 5%? e a 1%? G1: asmas; G2: broncoespasmo; G3: ensema; G4: outras doen cas.

Tabela 5.15: Presen ca de eosin olos no escarro e tipo de doen ca pulmonar em 384 pacientes porto-alegrenses. Grupo quanto a pneumopatia Eosin olos no escarro G1 G2 G3 G4 Sim 142 26 32 28 N ao 55 19 41 41 Exerc cio 5.7. O cole optero chauliognathus avipes pode apresentar 10 diferentes padr oes para as manchas pretas que ocorrem sobre os elitros (asas), que s ao amarelos. Machado e Ara ujo (1994) coletaram insetos dessa esp ecie em v arias localidades do Rio Grande do Sul, nos anos de 1989 e 1990, como mostra a Tabela 6. Teste a hip otese de igualdade de propor c oes entre as localidades ao n vel de 5% e a 1%.

Tabela 5.16: N umero de indiv duos da esp ecie Chauliognathus com diferentes padr oes de manchas nos elitros, coletados em tr es localidades do Rio Grande do Sul. Padr ao do elitros Localidade Claro Intermedi ario Escuro Porto Alegre 67 20 4 S ao Leopoldo 68 29 19 Caxias do Sul 26 3 6 Exerc cio 5.8. Verique se as localidades a seguir diferem quanto a freq u encia dos diferentes grupos sang u neos do sistema ABO, ao n vel de 5%.

Tabela 5.17: N umero de indiv duos da esp ecie Chauliognathus com diferentes padr oes de manchas nos elitros, coletados em tr es localidades do Rio Grande do Sul. Tipo sang u neo Localidade A B AB O Cidade I 43 9 1 47 Cidade II 29 17 9 45

5.2

Teste de Independ encia e de Homogeneidade

ROSSI, Robson M. 60

Exerc cio 5.9. Um estudo foi conduzido para investigar se existe uma associa c ao entre doen ca card aca e apn eia (ronco). Teste esta hip otese ao n vel de 5%.

Tabela 5.18: Associa c ao entre doen ca card aca e apn eia. Apn eia Doen ca card aca n ao ocasionalmente quase toda noite todas as noites Sim 24 35 21 30 N ao 1355 603 192 224 Exerc cio 5.10. Reestruture os dados para uma tabela 2x2 considerando apenas sim ou n ao para a apn eia, em seguida teste a mesma hip otese ao n vel de 5%, determine o OR e seu respectivo IC.

Cap tulo 6

Compara c oes Entre Grupos


6.1 Introdu c ao

` vezes, As e preciso comparar duas popula c oes. Por exemplo, imagine que um pesquisador obteve, para um grande n umero de crian cas, a idade em que cada uma delas come cou a falar. Para vericar se meninos e meninas aprendem a falar na mesma idade, o pesquisador ter a que comparar os dados dos dois sexos. Outras vezes, e preciso comparar condi c oes experimentais. Por exemplo, para saber se um tratamento tem efeito positivo, organizam-se dois grupos de unidades: um grupo recebe o tratamento em teste ( e o grupo tratado ), enquanto o outro n ao recebe o tratamento ( e o grupo controle ). O efeito do tratamento e dado pela compara c ao dos dois grupos. Freq uentemente, para compara c ao de dois tratamentos observam-se caracter sticas ou mede-se o valor da vari avel resposta de interesse que as caracter sticas importantes dos indiv duos que integram o mesmo par sejam t ao semelhantes quanto poss vel. O tratamento e administrado a um dos elementos do par e o outro e mantido como controle. A vantagem do procedimento e clara. Os indiv duos no par s ao semelhantes, exceto no que se refere ao tratamento recebido. Em algumas situa c oes o par e constitu do do mesmo indiv duo em duas ocasi oes diferentes (amostras dependentes).

6.2

Resposta Dicot omica: Amostras Independentes

Comparar dois grupos atrav es do resultado observado em uma vari avel dicot omica e um problema comum na pesquisa m edica, aparecendo com freq u encia em todos os tipos de estudos cl nicos. A vari avel de interesse e a ocorr encia de um evento, como o desenvolvimento de uma doen ca de certo atributo, por exemplo, albinismo. O problema de compara c oes das probabilidades de ocorr encia do evento ou do atributo nos dois grupos (p1 e p2 ) e formulado atrav es das hip oteses: H0 : p1 = p2 Ha : p1 = p2 n ao h a diferen ca signicativa entre os grupos h a diferen ca signicativa entre os grupos

6.2.1

Teste Qui-Quadrado

A Tabela 6.1 apresenta dados gen ericos de uma situa c ao envolvendo a compara c ao de dois grupos e que a resposta de interesse e dicot ominca: a ocorr encia ou n ao de um evento. Tabela 6.1: Distribui c ao quanto ` a ocorr encia de um evento. Grupo Ocorr encia do Evento Total Sim N ao I a b n1 = a + b n2 = c + d II c d Total m1 = a + c m2 = b + d n = n1 + n2

61

6.2

Resposta Dicot omica: Amostras Independentes A estat stica teste ser a: 2 c =

ROSSI, Robson M. 62

(Oi Ei )2 2 1;(1)% E i i=1


2

ou, para Tabelas 22: 2 c =

n (ad bc) 2 1;(1)% (Tabelas 2 2) n1 n2 m1 m2

H a restri c oes para aplica c ao do 2 em tabelas conting encia, logo a corre c ao de Yates (1934) e necess aria. Esta corre c ao deve ser feita quando: n < 40; 20 < n < 40 e Ei 5 para algum i; n > 40 e Ei 5 para algum i; Para testar as hip oteses acima citadas temos a estat stica teste qui-quadrado com corre c ao de continuidade de Yates, temos 2 n |ad bc| n 2 2 = 2 cY 1;(1)% (Tabelas 2 2) n1 n2 m 1 m 2 Exemplo 6.1. Estudo sobre a associa c ao entre o uso corrente de contraceptivos e o infarto de mioc ardio. Shapiro et al. (1979) observaram os resultados entre pacientes com idade entre 30 e 34 anos e estes s ao mostrados na Tabela 6.2. Tabela 6.2: Distribui c ao de uso de contraceptivo oral segundo grupo que sofreu ou n ao infarto do mioc ardio. Grupo Uso recente Total Sim N ao Casos 9 12 21 Controles 33 390 423 Total 42 402 444 Entre os casos, ou seja, entre as pacientes que tiveram um infarto do mioc ardio, a propor c ao de uso recente 9 33 de contraceptivos e = 0, 43 e entre os controles, = 0, 08. A diferen ca entre estas duas propor c oes 21 423 (0,35) parece indicar que o uso de contraceptivos orais e mais freq uente entre os casos (infartos). Mas ser a que este resultado n ao ocorreu por mero acaso? 2 A express ao 2 ca (95%) armar que existe c = 24, 76 > 3, 84 = 1;95% , nos indica, com alto grau de conan associa c ao entre o uso de contraceptivos orais e infarto do mioc ardio para pacientes entre 30 e 34 anos.

6.2

Resposta Dicot omica: Amostras Independentes

ROSSI, Robson M. 63

6.2.2

Teste Exato de Fisher

Nos casos em que formamos uma tabela de conting encia com formato 2 2, com pequeno n umero de oximo) e, conseq uentemente, com freq u encias observadas em cada casela muito observa co es (n < 20 ou pr baixas, a literatura apresenta a utiliza c ao do teste exato de Fisher, no qual estimamos, a partir da menor freq u encia contida na tabela, a probabilidade de ocorr encia deste valor e de uma freq u encia menor ainda, fazendo-se p =
n

Numa tabela de conting encia 2 2, com os totais marginais xos, apresentada como a Tabela 5.1, as freq u encias observadas t em distribui c ao hipergeom etrica e a probabilidade de ocorr encia i ser a dada por: pi = n1 !n2 !m1 !m2 ! a!b!c!d!n!

i=0

pi , em que n e a menor freq u encia vericada na tabela.

Exemplo 6.2. Um estudo foi realizado para vericar a exist encia de associa c ao entre o tipo de tratamento e mortalidade por AIDS. A Tabela 6.3 apresenta os dados.

Tabela 6.3: Associa ca o entre o tipo de tratamento e mortalidade por AIDS. Tratamento Mortalidade Total Sim N ao A 7 5 12 B 1 9 10 Total 8 14 22 Sendo p =
1 i=0

pi , temos p1 = 12!10!8!14! = 0, 024. 7!5!1!9!22!

e Tabela 6.4: Associa ca o entre o tipo de tratamento e mortalidade por AIDS. Tratamento Mortalidade Total Sim N ao A 8 4 12 B 0 10 10 Total 8 14 22 assim

12!10!8!14! = 0, 0015. 8!4!0!10!22! O valor de p ser a 0, 024 + 0, 0015 = 0, 0255 (p-valor : 0,0263). Como este p e menor que o n vel de signic ancia, para = 0, 05 a decis ao correta ser a rejeitar H0 , isto e, pode-se concluir que h a diferen ca quanto ` a mortalidade em rela c ao ao tipo de tratamento, sendo B mais ec az. p0 = Exemplo 6.3. Suponha um grupo de dezesseis ratos, divididos em dois grupos, experimental e normal. O grupo experimental e formado por 9 animais geneticamente modicados, por apresentarem uma disfun c ao pancre atica com diminui c ao da capacidade de produ c ao de insulina. Imagine que, ap os um ano e meio em ambiente controlado, o n umero de ratos vivos do grupo experimental e do normal seja o seguinte (Tabela 6.5): Pode-se notar que aproximadamente 71% dos ratos normais ainda permaneciam vivos, enquanto a sobrevida para o grupo experimental e de apenas 11%. O teste exato de Fisher consiste em elaborar, com base nos totais marginais do fator discriminante da tabela original, duas outras tabelas, que ser ao denominadas tabelas ou matrizes extremas, X1 e X2 . A matriz

6.2

Resposta Dicot omica: Amostras Independentes

ROSSI, Robson M. 64

Tabela 6.5: Estudo em ratos sobre disfun c ao pancre atica. Grupo Sobrevida + 1,5 ano Total Vivos Mortos Normal 5 2 7 Experimental 1 8 9 Total 6 10 16 extrema 1 e a matriz em que todos os animais mortos pertencem ao grupo normal (s ao 10 mortos, mas o grupo normal tem 7 ratos, logo, os outros 3 que morreram pertencem ao grupo experimental) e todos que sobraram do grupo experimental est ao vivos (todos os vivos, pois sobraram 9-3 = 6 ratos). Desta forma, resulta na Matriz X1 (Tabela 6.6): Tabela 6.6: Matriz X 1 . Grupo Sobrevida + 1,5 ano Vivos Mortos Normal 0 7 Experimental 6 3 Total 6 10

Total 7 9 16

A matriz extrema 2, X2 , corresponde a uma tabela com os mesmos totais marginais, mas com todos os animais vivos no grupo normal. Ent ao, pela matriz X2 (Tabela 6.7): Tabela 6.7: Matriz X 2 . Sobrevida + 1,5 ano Vivos Mortos Normal 6 1 Experimental 0 9 Total 6 10 Grupo

Total 7 9 16

Observe que existe um obito no grupo normal, pois o n umero de ratos do grupo normal e maior que o de ratos que sobreviveram. Obviamente, os 9 mortos que restaram pertencem ao grupo experimental. Nenhum rato do grupo experimental sobreviveu. Finalmente, o valor de signic ancia para o teste e calculado segundo a f ormula apresentada anteriormente: Para a matriz original: 7!.9!.10!.6! F0 : = 0, 02360 2!.5!.8!.1!.16! Para a matriz X 1 : 7!.9!.10!.6! FX1 : = 0, 0105 0!.7!.6!.3!.16! Para a matriz X 2 : 7!.9!.10!.6! FX2 : = 0, 0009 6!.1!.0!.9!.16! Finalmente, p = F0 + FX1 + FX2 = 0, 0236 + 0, 01505 + 0, 0009 = 0, 035 ou 3, 5%. Ou seja, a arma c ao de que a sobrevida dos ratos geneticamente alterados e menor que a dos ratos normais envolve uma probabilidade de erro de 3,5%. Portanto, ao n vel de 5% de signic ancia, rejeita-se a hip otese de nulidade (ou seja, de que as vidas dos ratos normais e dos transg enicos s ao iguais).

6.3

Resposta Dicot omica: Amostras Pareadas

ROSSI, Robson M. 65

6.2.3

Teste z para Compara c ao de Propor c oes

Denotamos os dois resultados poss veis da vari avel dicot omica por sucesso e fracasso. Sejam p1 e p2 as 1 e p 2 , as propor c oes de sucesso referentes aos tratamentos a serem comparados, que s ao estimadas por p propor c oes amostrais baseadas em amostras de tamanhos n1 e n2 , respectivamente. Queremos testar as hip oteses: H0 Ha : p1 = p2 : p1 = p2

isto e, estamos investigando a equival encia entre os dois tratamentos. Apresentaremos uma alternativa para o teste qui-quadrado para a compara c ao de propor c oes. Trata-se de um teste aproximado que requer amostras grandes para sua aplica c ao. Um crit erio e exigir que n1 p 1 e n2 p 2 excedam o valor 5. O teste e baseado em p 1 p 2 N (0, 1). Zc = 2 (1p 2 ) p 1 (1p 1 ) +p n1 n2 Exemplo 6.4. Compara c ao de drogas contra n ausea. Com o objetivo de comparar a ec acia de dois preventivos contra n ausea, dividiu-se aleatoriamente uma amostra de 400 marinheiros em dois grupos de 200. Um grupo recebeu a p lula A e o outro a p lula B, sendo que no primeiro grupo 152 n ao enjoaram durante uma tempestade e no outro grupo apenas 132. H a indica c oes de que a ec acia da p lula A e B e a mesma? Sol.: Sejam pA e pB as propor c oes de marinheiros que n ao enjoam, respectivamente para as p lulas A e 152 132 A = 200 = 0, 76, p B = 200 = 0, 66, logo tem-se: B. Temos que nA = 200, nB = 200, p Z= 0, 76 0, 66
0,76(10,76) 200 0,66(10,66) 200

= 2, 22 (p-valor : 0,0281).

Fixando-se o n vel de signic ancia em 5%, rejeita-se H0 . Portanto, pode-se concluir que as duas p lulas n ao s ao igualmente efetivas. H a indica c ao de que a p lula A oferece maior prote c ao contra n ausea comparada a p ` lula B.

6.3

Resposta Dicot omica: Amostras Pareadas

Podemos disting uir tr es tipos de pareamento: auto-pareamento, pareamento natural e pareamento articial. O auto-pareamento ocorre quando o indiv duo serve como seu pr oprio controle, como na situa c ao em que um indiv duo recebe duas drogas administradas em ocasi oes diferentes. Outra situa c ao e a que um tratamento e administrado e as vari aveis de interesse s ao observadas antes e depois do programa. Finalmente, a compara ca o de dois org aos no mesmo indiv duo, como bra cos, pernas, olhos, narinas, segundo alguma caracter stica estudada tamb em constitui um auto-pareamento. O pareamento natural consiste em formar pares t ao homog eneos quanto poss vel, controlando os fatores que possam interferir na resposta, sendo que o pareamento aparece de forma natural. Por exemplo, em experimentos de laborat orio pode-se formar pares de cobaias selecionadas da mesma ninhada; em investiga c oes cl nicas, g emeos univitelinos s ao muitos usados. No pareamento articial escolhe-se indiv duos com caracter sticas semelhantes, tais como, idade, sexo, n vel s ocio-econ omico, estado de sa ude ou, em geral, fatores que podem inuenciar de maneira relevante a vari avel resposta.

6.3

Resposta Dicot omica: Amostras Pareadas

ROSSI, Robson M. 66

6.3.1

Teste de McNemar

O exemplo a seguir ilustra a necessidade de desenvolvimento de um teste espec co para a situa c ao de dados pareados em que a resposta e dicot omica. Exemplo 6.5. Suponhamos que dois patologistas examinaram, separadamente, o material de 100 tumores e os classicaram como benignos ou malignos. A quest ao de interesse e saber se os patologistas diferem nos seus crit erios de decis ao. Neste caso, a forma adequada de apresenta c ao dos dados e mostrada na Tabela 6.8. Tabela 6.8: Classica c ao de dois patologistas (A e B) quanto ` a malignidade de tumores. Diagn ostico de B Diagn ostico de A Total Malignos Benignos Malignos 9 1 10 Benignos 9 81 90 Total 18 82 100 importante observar que a unidade de an E alise aqui e o tumor, avaliado por dois patologistas. Embora tenham sido feitas 200 an alises, o total de tumores e, na realidade, apenas 100. Al em disto, alguns tumores ser ao claramente mais malignos do que outros e, portanto, a hip otese fundamental na constru c ao do teste de probabilidade constante de malignidade n ao e razo avel aqui. Isto explica a necessidade de desenvolvimento de teste espec co, isto e, para dados pareados. Os dados a serem analisados no processo de compara c ao podem ser resumidos no formato da Tabela 6.9.

Tabela 6.9: Apresenta c ao de dados obtidos em uma classica c ao de dados pareados. Controle Tratamento Total Sucesso Fracasso Sucesso a b n1 Fracasso c d n2 Total m1 m2 n

Se p1 e p2 s ao as probabilidades de sucesso nos grupos controle e tratamento, respectivamente, a hip otese de interesse e: H0 Ha A Estat stica Teste: (B/C) 2 M cN = (|b c| 1)2 2 1. b+c : p1 = p2 : p1 = p2

2 A hip otese nula dever a ser rejeitada quando 2 M cN > 1 .

6.4

Resposta Cont nua - Teste de M edias para Amostras Independentes ROSSI, Robson M. 67

Exemplo 6.6. Amigdalectomia e doen ca de Hodgkin. Johnson & Johnson (1972), ao analisarem retrospectivamente a hist oria cl nica de pacientes de doen ca de Hodgkin, um tipo de c ancer no tecido linf oide, n ao encontraram evid encias que sustentassem a hip otese de que a amigdalectomia aumenta a suscetibilidade ` a doen ca, pela remo c ao da barreira linf atica representada pela am gdala. Neste estudo, usaram um planejamento do tipo caso-controle pareado. A conclus ao relatada no artigo foi feita, entretanto, com uma an alise apropriada para dados provenientes de grupos independentes. Logo ap os a publica c ao, v arios autores observaram a impropriedade da an alise e, utilizando as informa c oes do artigo, zeram a an alise correta, que e baseada nos dados da Tabela 6.10. Tabela 6.10: Distribui c ao de pacientes com e sem doen ca de Hodgkin em um estudo caso-controle pareado segundo ` a amigdalectomia. Doen ca de Controle Total Hodgkin Operados N ao operados Operados 26 15 41 N ao operados 7 37 44 Total 33 52 85 O valor da estat stica do teste de McNemar e: 2 M cN = (|15 7| 1)2 = 2, 23 (p-valor : 0,1356). 15 + 7

Este valor dever ser comparado com 3,84 para um n vel de signic ancia de 5%. Ou seja, com uma conan ca de 95% acreditamos que n ao h a associa c ao entre a doen ca de Hodgkin e a amigdalectomia. Esta conclus ao n ao est a de acordo com trabalhos anteriores, como o de Vianna et al. (1971).

6.4

Resposta Cont nua - Teste de M edias para Amostras Independentes

` vezes, As e preciso comparar duas popula c oes. Por exemplo, imagine que um pesquisador obteve, para um grande n umero de crian cas, a idade em que cada uma delas come cou a falar. Para vericar se meninos e meninas aprendem a falar na mesma idade, o pesquisador ter a que comparar os dados dos dois sexos. Nesta se c ao apresentamos a metodologia para comparar dois grupos de pacientes (por exemplo, doentes versus n ao doentes) em rela c ao a uma resposta cont nua, por exemplo, press ao sist olica. Testa-se, neste caso, a igualdade das m edias das respostas de dois tratamentos. Sejam 1 e 2 as m edias da vari avel estudada para os dois grupos, respectivamente. As hip oteses a serem testadas s ao: H0 Ha : 1 = 2 : 1 = 2

6.4.1

Teste t

Se a vari avel em an alise tem distribui c ao normal ou aproximadamente normal, aplica-se o teste t para comparar duas m edias. Mas primeiro e preciso estabelecer o n vel de signic ancia, . Depois, dados os dois grupos, 1 e 2, calculam-se: a) as m edias de cada grupo: x 1 x 2 : m edia do grupo 1 : m edia do grupo 2

b) as vari ancias ou os desvios-padr oes de cada grupo: s1 s2 : : desvio-padr ao do grupo 1 desvio-padr ao do grupo 2

6.4

Resposta Cont nua - Teste de M edias para Amostras Independentes ROSSI, Robson M. 68 c) a vari ancia ponderada: s2 p =
2 (n1 1)s2 1 + (n2 1)s2 n1 + n2 2

d) o valor da estat stica teste, tc , denida por: tc = s2 p x 1 x 2 1 1 + n1 n2 tn1 +n2 2;%

O intervalo de conan ca para (1 2 ) ser a: ( x1 x 2 ) tn1 +n2 2;% .s2 p. Exemplo 6.7. Compara c ao entre tratamentos para dieta. Para vericar se duas dietas para emagrecer s ao igualmente ecientes, um m edico separou, ao acaso, um conjunto de pacientes em dois grupos. Cada paciente seguiu a dieta designada para seu grupo. Decorrido certo tempo, o m edico obteve a perda (ou ganho) de peso, em quilogramas, de cada paciente de cada grupo. Os dados est ao apresentados na Tabela 6.11: Tabela 6.11: Perdas de peso, em quilogramas, segundo a dieta. 1 15 19 15 12 13 16 15 2 12 8 15 13 10 12 14 11 12 13
2 2 Ap os alguns c alculos preliminares, temos: x 1 = 12; x 2 = 15; s2 1 = 4; s2 = 5; sp = 4, 4, desta forma, para = 5%, temos t15;5% = 2, 13, assim:

1 1 + n1 n2

tc

12 15 4, 4 1 1 + 10 7

= 2, 902 Regi ao de rejei c ao de H0 , logo podemos

p valor

0, 010947

concluir que, em m edia, as perdas de peso de pacientes submetidos aos dois tipos de dieta s ao diferentes. Em termos pr aticos, a perda de peso e maior quando os pacientes s ao submetidos ` a dieta 2.

6.4.2

Teste z

Um pressuposto importante para aplicar o teste t visto anteriormente e que os dois grupos comparados tenham a mesma variabilidade, o que nem sempre acontece na pr atica. No caso de amostras grandes (n1 e 2 n2 30) dispomos de um teste em que n ao e necess ario qualquer suposi c ao adicional sobre 2 1 e 2 , ou seja, as var ancias podem ser iguais ou diferentes. A estat stica teste usada ser a: x 1 x 2 Zc = N (0, 1). s2 s2 1 2 + n1 n2 Exemplo 6.8. Efeito do halotano em cirurgias card acas. O halotano e uma droga bastante utilizada para induzir a anestesia geral. Trata-se de um poderoso anest esico de inala c ao, n ao inam avel e n ao explosivo, com um odor relativamente agrad avel. Pode ser administrado ao paciente com o mesmo equipamento usado para sua oxigena c ao. Ap os a inala c ao, a subst ancia chega aos pulm oes tornando poss vel a passagem para o estado anest esico mais rapidamente do que seria poss vel com drogas administradas de forma intravenosa.

6.5

Resposta Cont nua - Teste de M edias para Amostras Pareadas

ROSSI, Robson M. 69

Entretanto, os efeitos colaterais incluem a depress ao do sistema respirat orio e cardiovascular, sensibiliza c ao a arritmias produzidas por adrenalina e eventualmente o desenvolvimento de les ao hep atica. Alguns anestesistas acreditam que esses efeitos podem causar complica c oes em pacientes com problemas card acos e sugerem o uso da morna como um agente anest esico nesses pacientes devido ao seu pequeno efeito na atividade card aca. Conahan et al. (1973) compararam esses dois agentes anest esicos em um grande n umero de pacientes submetidos a uma cirurgia de rotina para reparo ou substitui c ao da v alvula card aca. Para obter duas amostras compar aveis, os pacientes foram alocados aleatoriamente a cada tipo de anestesia. Com o objetivo de estudar o efeito desses dois tipos de anestesia, foram registradas vari aveis hemodin amicas, como press ao sang u nea antes da indu c ao anest esica, ap os a anestesia mas antes da incis ao, e em outros per odos importantes durante a opera c ao. A quest ao que surge e se o efeito do halotano e da morna na press ao sang u nea e o mesmo. Para comparar os dois grupos, necessitamos dos resultados apresentados na Tabela 6.12 a seguir:

Tabela 6.12: M edia e desvio-padr ao da press ao sang u nea (mmHg) segundo o tipo de anestesia. Informa c oes Anestesia sobre a amostra Halotano Morna M edia 66,9 73,2 Desvio-Padr ao 12,2 14,4 n 61 61

Nas condi c oes do problema, as hip oteses s ao: H0 : 1 = 2 ; Ha : 1 = 2 isto e, devemos testar a diferen ca entre as press oes sang u neas m edias de indiv duos anestesiados com halotano ou morna. Como as amostras s ao grandes, podemos usar o teste Z , cujo valor da estat stica do teste e: Zc = 6, 30 = = 2, 61 (p-valor : 0,0103). 5, 84 12, 2 14, 4 + 61 61 66, 9 73, 2
2 2

Adotando um n vel de siginic ancia de 5%, o resultado e estatisticamente signicativo, j a que | 2, 61| > 1, 96, indicando que os dois anest esicos n ao s ao equivalentes.

6.5
6.5.1

Resposta Cont nua - Teste de M edias para Amostras Pareadas


Teste t

Para estudar o efeito de um tratamento, muitas vezes comparam-se pares de indiv duos. Por exemplo, em alguns estudos de psicologia comparam-se pares de g emeos: um dos g emeos recebe o tratamento, enquanto o outro permanece sem o tratamento (controle). Outras vezes, comparam-se os dois lados dos mesmos indiv duos. Por exemplo, par estudar o efeito de um tratamento para preven c ao de c aries, o dentista pode aplicar o tratamento em um lado da arcada dent aria de cada paciente, e deixar o outro lado sem tratamento (controle). Tamb em s ao feitos experimentos em que se observam os mesmos indiv duos duas vezes, isto e, uma vez antes, outra vez, depois de administrar o tratamento. Por exemplo, para vericar o efeito de um tratamento sobre press ao arterial, o m edico pode obter a press ao arterial de seus pacientes, antes e depois de administrar o tratamento. Todos esses exemplos s ao de observa c oes pareadas (pares de g emeos, dois lados de um indiv duo, observa c oes no mesmo indiv duo). Para testar o efeito de um tratamento, quando as observa c oes s ao pareadas, aplica-se o teste t.

6.5

Resposta Cont nua - Teste de M edias para Amostras Pareadas Estat stica teste: tc =

ROSSI, Robson M. 70

d s2 n

tn1;%

onde: : m d edia das diferen cas, di = x2 x1 : a diferen ca entre as unidades de cada um dos n pares
n

= d

i=1

di

s2 : vari ancia das diferen cas, di . Toda vez que o valor absoluto de tc for igual ou maior do que o valor tabelado tn1;% , conclui-se que o tratamento tem efeito ao n vel % estabelecido. O intervalo de conan ca para d, ser a dado por: S tn1;% . d n Exemplo 6.9. S ao dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento. Tabela 6.13: Pesos em Kg de 9 pessoas antes e depois da dieta para emagrecimento. Dieta Antes Depois di 77 80 3 62 58 -4 61 0 61 80 76 -4 90 79 11 72 69 -3 86 90 4 59 51 -8 88 81 -7 Total -30 Para fazer o teste, e preciso primeiro estabelecer o n vel de signic ancia. Seja = 1%, = d s2 logo tc = = 30 = 3, 33 9 25

3, 33 = 2, 0 (p-valor : 0,080516). 25 9

Ao n vel de siginic ancia de 1% com g.l. = 8, o valor de t tabelado para t8;1% . e de 3,36. Como o valor absoluto de tc (2,0) e menor do que o valor da tabela, concui-se que o tratamento n ao tem efeito signicativo. Em termos pr aticos, o experimento n ao provou que a dieta emagrece.

6.6

Testes N ao-Param etricos

ROSSI, Robson M. 71

Exerc cio 6.1. Avalia c ao morfoquantitativa dos neur onios mioent ericos nadh-diaforase reativos do est omago de ratos com diabetes induzido por estreptozootocina e suplementados com acido asc orbico (Mestrado em Morfologia-UEM). Este trabalho teve entre v arios objetivos, vericar se existe diferen ca de tamanho entre as regi oes glandular e aglandular, entre as sub-regi oes aglandular (A e B) e glandular (A e B) e entre o est omago como um todo; e vericar se o diabetes afeta mais a regi ao glandular do que a regi ao aglandular, ou vice e versa. Parte dos dados est ao dispon veis na Tabela (6.14) a seguir. Tabela 6.14: Avalia ca o morfoquantitativa dos neur onios mioent ericos nadh-diaforase reativos do est omago de ratos com diabetes induzido por estreptozootocina e suplementados com acido asc orbico. aglanB aglanA aglanTotal glanB glanA glanTotal Grupos 101,1 92,37 193,47 123,6 123,2 246,8 c 97,24 121,9 219,14 92,83 100,6 193,43 c 146,9 197,2 344,1 138,6 133,5 272,1 c 94,44 96,5 190,94 149,5 114,3 263,8 c 139,5 110,4 249,9 184,4 143,6 328 c 203,3 191,1 394,4 438,1 367,2 805,3 d 232,4 216,1 448,5 290,7 311 520,7 d 237,3 240,3 477,6 271,4 193,4 464,8 d 139,5 158,2 297,7 269,5 159,6 429,1 d 222,9 262,4 485,3 334,6 246,8 581,4 d 234,1 191,9 426 253 231,5 484,5 ds 201,9 207,3 409,2 237,7 186,6 424,3 ds 164,1 213,3 377,4 269,3 214,7 484 ds 251,1 217,1 468,2 ds

6.6

Testes N ao-Param etricos

Os testes n ao-param etricos s ao boas op c oes para situa c oes em que ocorrem viola c oes dos pressupostos b asicos necess arios para a aplica c ao de um teste param etrico. Por exemplo, para testar a diferen ca de dois ou mais grupos quando a distribui c ao subjacente e assim etrica ou dos dados foram coletados em uma escala ordinal.

6.6.1

Teste U de Mann-Whitney

Este teste corresponde a mais uma alternativa para a compara c ao de duas amostras independentes, utilizando, como os demais testes n ao-param etricos, os n umeros naturais para classica c ao conjunta dos valores observados. Portanto, o posto de um valor de um conjunto de n valores corres-ponde a um n umero natural que indicar a a sua posi c ao no conjunto anteriormente ordenado (posto, score ou rank ), isto e, todas as N observa c oes recebem uma pontua c ao atrav es dos n umeros naturais 1, 2, 3, 4, ..., n. Assim, ao menor valor se dar a o n umero 1, e assim sucessivamente at e o valor maior, que receber a a maior pontua c ao. Quando ocorre a presen ca de valores iguais no conjunto, considera-se um ponto m edio, n ao afetando o posto seguinte. Portanto, num conjunto de seis valores j a ordenados {7-12-18-18-19-23} os postos ser ao {1-2-3,5-3,5-5-6}, respectivamente. Quanto ao procedimento mais adequado para a aplica c ao do teste, baseamo-nos no c alculo de U1 e U2 , sendo: n1 (n1 + 1) T1 U1 = n1 n2 + 2 e n1 (n1 + 1) T2 U2 = n1 n2 + 2 onde n1 e n2 s ao os tamanhos das duas amostras de T1 e T2 , que correspondem as somas dos pontos (postos) atribu dos aos valores das duas amostras.

6.6

Testes N ao-Param etricos

ROSSI, Robson M. 72

Para amostras pequenas (n 20) Uc = m n{U1 ; U2 } Obtemos uma estat stica tabelada : UT = U,n1 ,n2 e conclu mos para a rejei c ao de Ho se Uc UT . Para amostras grandes (n > 20) Neste caso o teste pode ser aplicado por aproxima c ao normal, sendo (u) = n1 n2 e (u) = 2 n1 n2 (n1 + n2 + 1) . 12

Neste caso, a express ao do teste ser a: Z= u1 (u) N (0, 1). (u)

Exemplo 6.10. Vericar se os dados das duas amostras apresentam diferen ca signicativa.

Tabela 6.15: Dados hipot eticos. Amostra A Amostra B 2,6 (9,5) 2,3 (5) 2,9 (13) 2,8 (12) 2,5 (8) 2,0 (2) 2,7 (11) 1,8 (1) 3,2 (14) 2,4 (7) 2,6 (9,5) 2,3 (5) 2,3 (5) 2,2 (3) 3,3 (15) T1 = 85, 0 T2 = 35, 0 Procede-se ` a ordena c ao dos valores para obten c ao dos seus postos e posteriormente seu somat orio. Temos ent ao n1 = 8, n2 = 7, T1 = 85 e T2 = 35. O valor de U1 e de U2 , respectivamente ser ao: U 1 = 8 .7 + U2 = 8.7 + Assim Uc = m n{7;49} = 7 O valor da estat stica tabelada ser a de: UT = U,n1 ,n2 = U5%,8,7 12 8(8 + 1) 85 = 7 2

7(7 + 1) 35 = 49. 2

Como Uc UT rejeitamos Ho . Portanto as amostras diferem entre si ao n vel de 5% de signic ancia. Suponho n 20 O teste pode ser aplicado tanto para U1 ou U2 , pois ambos s ao sim etricos em rela c ao ` a m edia 28. 8.7 n1 n2 8.7(8 + 7 + 1) = = 28 e (u) = = 8, 63. (u) = 2 2 12 Sendo assim: 7 28 = 2, 43 (p-valor : 0,013986). Z= 8, 63 Como o valor de |Z | e maior do que Z , quando = 5%, ou seja, o valor 1,96, rejeitamos H0 . Considera-se ancia. que as amostras diferem entre si ao n vel de 5% de signic

6.6

Testes N ao-Param etricos

ROSSI, Robson M. 73

Exerc cio 6.2. Diagn ostico e tratamento da Osteoporose. Osteoporose e uma doen ca esquel etica sist emica caracterizada por baixa massa ossea e altera c ao da micro-arquitetura, levando a um aumento da fragilidade ossea e, conseq uentemente, do risco de fratura. A massa ossea aumenta durante a inf ancia e principalmente adolesc encia, atingindo seu pico em torno dos 25 anos na mulher e 30 a 35 anos no homem. Ap os a parada do crescimento osseo, a forma c ao e a reabsor c ao ocorrem na mesma propor c ao, em um processo denominado de remodela c ao ossea. Com o avan co da idade cronol ogica, a forma c ao ossea torna-se menor que a reabsor c ao, levando a uma perda de massa ossea em torno de 1% ao ano. A quantidade de osso presente no adulto e proporcional ao pico de massa ossea atingido. Na osteoporose p os-menopausa (desencadeada pelo hipoestrogenismo), a reabsor c ao ossea se manifesta mais precocemente nas regi oes ricas em osso trabecular, levando ` a fratura na regi ao distal do radio e colapso central das v ertebras dorsais e lombares. A osteoporose e uma doen ca assintom atica at e o paciente apresentar alguma fratura. Os locais mais comuns s ao v ertebras, regi ao distal do r adio e colo do f emur. As principais complica c oes das fraturas s ao dor cr onica e deformidade ossea. Assim, com objetivo de detectar pacientes com osteoporose coletou-se uma amostra de 30 pacientes aleatoriamente em um Hospital Universit ario. De cada paciente realizou-se um cadastro onde tinha as seguintes vari aveis: idade, peso, altura, atividade f sica, hist oria de fratura materna, ingest ao adequada de c alcio, ra ca e outras como, tabagismo, algumas doen cas (hipogonadismo, s ndromes disabsortivas) e drogas (cortic oide) s ao fatores de risco que aceleram a perda ossea. Exerc cio 6.3. Utilize o banco de dados em anexo de nome: osteporose ex.stw e verique se existe diferen ca entre os grupos: Tabagismo e Ingest ao, com rela c ao entre as vari aveis: Altura, Peso e IMC, onde IM C = * Considere = 5%. P eso ; Altura2

6.6

Testes N ao-Param etricos

ROSSI, Robson M. 74

6.6.2

Teste H de Kruskal-Wallis para k amostras

O teste de Kruska-Wallis foi criado como um substituto ao teste F na an alise param etrica. Ele e utilizado para que se verique o contraste entre k amostras independentes. Requisitos: Compara c ao entre 3 ou mais grupos independentes; Dados ordinais (que possam ser ordenados); ni 6. Os valores obtidos nas diversas amostras diferem entre si e portanto, ser a uma maneira de vericar se estas diferen cas s ao devidas ao acaso ou se as amostras prov em de popula c oes diferentes. Da mesma forma que nos outros testes, ser ao consideradas as hip oteses nula (H0 ) e alternativa (Ha ), isto e: H0 Ha : n ao h a diferen ca signicativa entre os tratamentos. : h a diferen ca signicativa entre os tratamentos.

Quanto ` a metodologia usada no teste de Kruskal-Wallis, a express ao e denida por: HK W =


k T2 12 i . 3(N + 1) tal que H 2 (k1) N (N + 1) i=1 ni

em que: Ti : e a soma das ordens atribu das ao tratamento i; k : corresponde ao n umero de tratamentos ou amostras a comparar; ni : o n umero de observa co es em cada tratamento k e, N : o total de observa c oes em todos os tratamentos k. nica de abd omen Exemplo 6.11. Analisar o tempo de sobrevida, em meses, de pacientes atendidos na cl do hospital X, na cidade de Cabrob o.

Tabela 6.16: Tempo de sobrevida. Radioterapia (n1 = 7) Quimioterapia (n2 = 8) Cirurgia (n3 = 8) 17 (11) 20 (12) 32 (17) 14 (9) 5 (3) 35 (20) 4 (2) 9 (6) 26 (15) 8 (5) 13 (8) 34 (18,5) 29 (16) 34 (18,5) 21 (13) 6 (4) 2 (1) 45 (21) 15 (10) 11 (7) 50 (23) 22 (14) 47 (22) T1 = 57, 0 T2 = 69, 5 T3 = 149, 5 Quest oes: H a diferen ca sifnicativa entre os tempos de sobreviv encia? Qual o tratamento recomendado baseado no tempo de sobrevida? Independentemente do n umero de observa c oes em cada grupo e utilizando os n umeros naturais, procedemos ` a ordena c ao dos valores. Assim os valores acima receberiam a seguinte numera c ao, conforme os valores j a entre par enteses.

6.6

Testes N ao-Param etricos Ent ao: HK W = = = = =


k T2 12 i . 3(N + 1) N (N + 1) i=1 ni 3 T2 12 i . 3(23 + 1) 23(23 + 1) i=1 ni

ROSSI, Robson M. 75

1 572 69, 52 149, 52 . + + 72 46 7 8 8 1 . (3861, 7) 72 46 11, 95 (p-valor : 0,0025).

2 2 Como HK W 2 ao H 2 (k1) , ent (31) 2;5% = 5, 99 e 2;1% = 9, 21, portanto, considerando que o valor encontrado de HK W = 11, 95 e maior do que os valores da tabela, tanto para = 5% como para = 1%, conclu mos pela rejei c ao de H0 e conseq uentemente, pela indica c ao de que o tratamento cir urgico se destaca dos demais, pois apresenta maiores valores aos tempos de sobrevida.

Exerc cio 6.4. Utilize o banco de dados citado no exerc cio anterior: osteoporose ex.stw para vericar se existe diferen ca entre as Ra cas, considerando as vari aveis: Altura, Peso e IMC, ao n vel de 5%.

6.6.3

Teste de Wilcoxon (Amostras Pareadas ou dependentes)

Trata-se de um teste n ao-param etrico para comparar dois tratamentos quando os dados s ao obtidos atrav es do esquema de pareamento. A prova de Wilcoxon avalia a grandeza das diferen cas quando comparados postos de observa c oes. Dada a grandeza das diferen cas observadas, atribui-se maior valor para a maior diferen ca encontrada, diminuindo este valor de acordo com as menores diferen cas existentes. Procedimento 1. Calcular di : diferen ca entre as obseva c oes di = xi 2. Ignorar os sinais e atribuir postos 3. Calcular a soma dos postos (T+ e T ). 4. Obter o valor da estat stica calculada Tc = m n{|T |; |T+ |} 5. Obter o valor da estat stica Tabelada (Anexo) T;n 6. Concluir pela rejei c ao de H0 se Tc T;n . Pequenas Amostras (n 25) No confronto de dois grupos quando desejamos identicar se existe diferen ca signicativa entre os mesmos quanto ` as medidas encontradas, empregamos o teste de Wilcoxon quando a varia c ao dos valores apresenta-se de forma acentuada. A aplica c ao deste teste pressup oe que as duas amostras sejam casualizadas e independentes, e que as vari aveis em confronto sejam cont nuas. A metodologia do teste consiste em se proceder ` a ordena c ao dos valores das amostras e, posteriormente, atribuir aos mesmos seus ranks. Em seguinda, obt em-se os totais do ranks da amostra de menor tamanho, consultando-se a tabela (anexo) do referido teste.
(2)

xi

(1)

6.6

Testes N ao-Param etricos

ROSSI, Robson M. 76

Exemplo 6.12. Foi realizado um ensaio cl nico em que foram utilizadas duas drogas A e B. Com a droga A foram tratados oito pacientes e com a droga B, cinco pacientes. Os n veis de anticorpos corresponderam a:

Tabela 6.17: N veis de anticorpos. Tratamento A B 7,4 (6) 9,1 (7) 0,7 (1) 12,3 (9) 11,8 (8) 19,2 (12) 16,4 (10) 2,4 (3) 1,9 (2) 17,5 (11) 3,0 (4) 6,8 (5) 20,4 (13) T1 = 57 T2 = 34 Logo, para Tc = m n{57; 34} = 34 consultando-se a Tabela de Wilcoxon, verica-se que T;n = T5%;5 = 0 > 34 (no Statistica o p-valor : 0,8927). Assim, podemos armar que n ao rejeitamos H0 , ou seja, que os valores comparados, referentes ` as drogas A e B, n ao apresentam-se com diferen ca siginicativa. Conclui-se, ent ao, que os valores de n veis de anticorpos em rela c ao aos dois tipos de drogas se comportam de forma semelhante. Grandes Amostras (n > 25) Nos casos de grandes amostras, estas apresentam valores com distribui c ao normal e, portanto, a compara c ao das medidas ser a realizada atrav es de determina c ao de um valor W . S ao enunciadas naturalmente as hip oteses. H0 ser a rejeitada se o valor de W for maior ou igual a Z para um n vel de signic ancia, , pr e-determinado. Assim, para a compara ca o de conjuntos de medidas, provenientes de duas amostras, ser a necess ario utilizar a express ao de W : n(n + 1) Tc 4 W = N (0, 1) n(n + 1)(2n + 1) 24 em que: n : n umero de elementos da menor amostra;

6.6

Testes N ao-Param etricos

ROSSI, Robson M. 77

Exemplo 6.13. Evolu c ao do tratamento com tianeptina: Escores dos pacientes do grupo tianeptina no primeiro e no u ltimo dia: Tabela 6.18: Tratamento com tianeptina. Tianeptina Primeiro dia (m = 8) Ultimo dia (n = 8) d 24 6 -18 46 33 -13 26 21 -5 44 26 -18 27 10 -17 34 29 -5 33 33 0 25 29 +4 35 37 +2 30 15 -15 38 2 -36 38 21 -17 31 7 -24 27 * * 34 * * 32 26 -6 Sendo assim temos: |T | = 99 e |T+ | = 6, ent ao Tc = m n{99; 6} = 6 De acordo com a Tabela de Wilcoxon, T;n = T5%;14 = 21 Como 6 < 21, rejeitamos H0 . Supondo n grande teremos: 14(14 + 1) 4 = 2, 92 (p-valor : 0,003). 14(14 + 1)(2.14 + 1) 24 6

Postos (-) 11,5 (-) 7 (-) 4,5 (-) 11,5 (-) 9,5 (-) 4,5 (+) 1 (+) 3 (+) 2 (-) 8 (-) 14 (-) 9,5 (-) 13 * * (-) 6

W =

Considerando que o valor de W = 2, 92 est a na area de rejei c ao de H0 , para o valor de Z5% = 1, 96, rejeitamos H0 , ou seja, os valores dos dois conjuntos apresentam diferen cas signicativas.

6.6

Testes N ao-Param etricos

ROSSI, Robson M. 78

6.6.4

Teste de Friedman para k tratamentos

O teste de Friedman e recomendado como um substituto do teste F, quando procede-se ` a compara c ao de k amostras relacionadas ou dependentes cujas observa c oes apresentam valores com acentuadas varia c oes e em cada tratamento s ao constitu dos blocos. Na verdade, procura-se fazer a compara c ao de tratamentos em que s ao formados blocos com a inten c ao de que isto resulte em um pareamento consider avel entre os diversos tratamentos. A forma de realiza c ao do teste e an alogo aos demais. Dentro de cada um do n blocos formados procede-se a classica ` c ao das i- esimas observa c oes em k tratamentos, utilizando-se n umeros naturais. Assim, tem-se a estat stica teste: HF r =
k 12 . Ti2 3n(k + 1) tal que HF r 2 (k1) nk (k + 1) i=1

Exemplo 6.14. S ao prescritos quatro procedimentos t ecnicos para determina c ao de certa vari avel. Foram formados cinco blocos e obtidos os seguintes valores: Tabela 6.19: Dados de quatro procedimentos t ecnicos. Tratamentos A B C D 12 (2) 13 (3) 16 (4) 7 (1) 9 (3) 12 (4) 5 (1) 8 (2) 14 (2) 20 (3) 22 (4) 6 (1) 17 (3) 16 (2) 21 (4) 11 (1) 12 (2) 15 (3) 16 (4) 10 (1) T1 = 11 T2 = 14 T3 = 20 T4 = 5 Substituindo-se os valores na express ao no teste, tem-se: HF r = = =
4 12 . Ti2 3.5(4 + 1) 5.4(4 + 1) i=1 12 . [121 + 196 + 400] 75 100 14, 04 (p-valor : 0,00285).

2 2 Como HF r 2 ao HF r 2 (k1) , ent (41) 3;5% = 7, 82 e 3;1% = 11, 34, portanto, considerando que e maior do que os valores da tabela, tanto para = 5% como para o valor encontrado de HF r = 14, 04 = 1%, conclu mos pela rejei c ao de H0 , logo verica-se que h a diferen ca signicativa entre as medidas dos tratamentos. O tratamento C apresentou melhores resultados em rela c ao aos demais grupos.

6.7

Outros Testes N ao-Param etricos

ROSSI, Robson M. 79

6.7
6.7.1

Outros Testes N ao-Param etricos


Teste de Concord ancia ou de Replicabilidade (Coeciente de Kappa)

O coeciente de Kappa e utilizado para vericar a concord ancia entre os diagn osticos de dois especialistas. Observe a Tabela (6.20) abaixo: Tabela 6.20: Concord ancia entre o diagn ostico de dois especialistas. Diagn ostico Diagn ostico Especialista 1 Total Especialista 2 Presente (+) Ausente (-) Presente (+) a (++) b (+-) n1 = a + b Ausente (-) c (-+) d () n2 = c + d Total m1 = a + c m2 = b + d n C alculos auxiliares: Propor c ao de concord ancia observada: po = c ao de concord ancia casual: Propor pc = Coeciente: Kappa = Classica c ao: Kappa k=0 k < 0, 4 0, 4 k < 0, 8 0, 8 k < 1 k=1 Concord ancia nenhuma leve moderada forte perfeita a+d n

n1 .m1 + n2 .m2 n2 po pc . 1 pc

Exemplo 6.15. Em uma determinada experi encia, foi avaliado o grau de les ao do tecido hep atico, em 20 cobaias ` as quais foi administrada uma certa subst ancia t oxica. Os resultados dos exames efetuados por dois patologistas foram o seguinte:

Tabela 6.21: Teste Kappa Cobaia 1 2 Patologista 1 + + Patologista 2 + +

para a concord ancia entre patologistas quanto 3 4 5 6 7 8 9 10 11 12 + + + + - + + + + + - + + + - + + + + : presen ca de les ao hep atica - : aus encia de les ao hep atica.

ao grau de les ao do 13 14 15 16 + + + -

tecido hep atico. 17 18 19 20 + + + -

Com base nesses resultados, e poss vel construir a tabela abaixo:

6.7

Outros Testes N ao-Param etricos

ROSSI, Robson M. 80

Tabela 6.22: Concord ancia entre o diagn ostico de dois especialistas. Diagn ostico Diagn ostico Patologista 1 Total Patologista 2 Presente (+) Ausente (-) Presente (+) 10 5 15 Ausente (-) 0 5 5 Total 10 10 20 Ent ao temos:

a+d 10 + 5 = = 0, 75 n 20 n1 .m1 + n2 .m2 15.10 + 5.10 200 pc = = = = 0, 5 2 2 n 20 400 po pc 0, 75 0, 5 Kappa = = = 0 , 5. 1 pc 1 0, 5 po =

Conclui-se que existe uma concord ancia apenas moderada entre os diagn osticos dos patologistas.

6.7.2

Teste de Cochran

O teste de Cochran e utilizado quando as respostas do tratamento s ao do tipo Sucesso ou Insucesso, Alterado ou N ao alterado e, al em disso, cada unidade experimental e avaliada em rela c ao a mais de dois tratamentos distintos, o que caracteriza a depend encia ou o pareamento das unidades amostrais. uma extens E ao da prova de McNemar para a signic ancia de mudan cas. Particularmente e aplic avel aos planejamentos do tipo antes e depois, em que cada indiv duo e utilizado como seu pr oprio controle e a mensura ca o se faz ao n vel de uma escala nominal ou ordinal. A prova de Cochran para k amostras relacionadas proporciona um m etodo para comprovar se tr es ou mais conjuntos correspondentes de freq u encias ou propor c oes diferem entre si signicativamente: Os mesmos indiv duos s ao observados sob condi c oes diferentes; Para escores ordinais dicotomizados, atribui o escore 1 a cada sucesso e o escore 0 a cada falha; Posiciona os dados numa tabela CxI com C colunas, que correspondem ao n umero k de tratamentos I linhas, que coincidem com o n umero de casos em cada um dos k tratamentos; Utiliza o somat orio dos resultados correspondentes a cada grupo e os somat orios dos escores de cada bloco; Grupo
k j =1

Bloco
n i=1 n i=1

Gj = G1 + G2 + ... + Gk

Lj = L1 + L2 + ... + Ln

2 2 2 L2 j = L1 + L2 + ... + Ln

Estat stica teste:

(k 1)k Q= k
k j =1 n

G2 j
n

2 k1 ;

j =1

Gj

i=1

Lj

i=1

L2 j

Quando Q > 2 ao a ser tomada e de rejei c ao de H0. k1 a decis N ao se conhece exatamente o poder da prova de Cochran. A no c ao de poder-eci encia n ao tem sentido quando se aplica a prova de Cochran a dados nominais ou naturalmente dicot omicos, pois as provas param etricas n ao se aplicam a tais dados. Quando se utiliza a prova de Cochran em dados que n ao sejam nominais ou naturalmente dicot omicos, h a perda de informa c oes.

6.7

Outros Testes N ao-Param etricos

ROSSI, Robson M. 81

Exemplo 6.16. Suponha que estejamos interessados em estudar a inu encia da atitude de um entrevistador sobre as respostas das donas de casa a determinada pesquisa de opini ao. Poderemos treinar um entrevistador para efetuar suas entrevistas de tr es maneiras diferentes: entrevista tipo 1 demonstrando interesse, cordialidade, entusiasmo; entrevista tipo 2 demonstrando formalismo, reserva e cortesia; entrevista tipo 3 demonstrando desinteresse, modo abrupto, formalismo aspero. Tabela 6.23: Inu encia do pesquisador em pesquisas de opini ao. Resposta Resposta Resposta Conjunto Li a entrevista 1 ` a entrevista 2 ` ` a entrevista 3 1 0 0 0 0 2 1 1 0 2 3 0 1 0 1 4 0 0 0 0 5 1 0 0 1 6 1 1 0 2 7 1 1 0 2 8 0 1 0 1 9 1 0 0 1 10 0 0 0 0 11 1 1 1 3 12 1 1 1 3 13 1 1 0 2 14 1 1 0 2 15 1 1 0 2 16 1 1 1 3 17 1 1 0 2 18 1 1 0 2

L2 i 0 4 1 0 1 4 4 1 1 0 9 9 4 4 4 9 4 4

O entrevistador visitaria tr es grupos de 18 casas, aplicando aleatoriamente o tipo 1 de entrevista a um grupo, o tipo 2 a outro grupo, o tipo 3 ao terceiro grupo. Ter amos ent ao 3 amostras relacionadas (correspondentes) com 18 elementos cada uma (n = 18). Desejamos comprovar se as diferen cas fundamentais nos tipos de entrevista inuenciariam o n umero de respostas armativas (sim) dadas a determinada pergunta. Etapa 1: H0 : A probabilidade de um sim e a mesma para os tr es tipos de entrevista. H1 : As probabilidades de um sim diferem conforme o tipo de entrevista. Etapa 2: Estabelecendo o n vel de signic ancia: = 0, 01. Etapa 3: Estabelecendo a estat stica de teste: Q de Cochran porque os dados se referem a mais de dois grupos relacionados (k = 3) e se apresentam dicotomizados sob forma sim ou n ao. Etapa 4: Estabelecendo os valores cr ticos para gl = k 1 = 3 1 = 2 e n vel de signic ancia = 0, 01 um valor de 9, 21. Etapa 5: C alculo da Estat stica teste: Calculando os somat orios dos resultados correspondentes a cada grupo e o somat orio dos escores de cada bloco (Li ) temos: G1 = 13 - no total de respostas sim para entrevista 1 G2 = 13 - no total de respostas sim para entrevista 2 G3 = 3 - no total de respostas sim para entrevista 3 ap os c alculos Q = 16, 7. Etapa 6: Como Q > 2 cr tico (16, 7 > 9, 21), ent ao rejeita-se H0 , ou seja, o n umero de respostas sim difere signicativamente em rela c ao aos tipos 1, 2 e 3 de entrevista.

6.7

Outros Testes N ao-Param etricos

ROSSI, Robson M. 82

Figura 6.1: Gr aco para o teste de Cochran. Exerc cio 6.5. Comparar quatro t ecnicas de treinamento aplicadas a seis blocos de funcion arios do setor de marca c ao de luz de uma empresa cinematogr aca. Cada bloco foi formado de modo que os quatro funcion arios que o constitu am eram equivalentes em seu desempenho atual no cargo. Os resultados obtidos na escala de avalia c ao de desempenho, aplicada ap os o treinamento, foram os que constam no quadro abaixo. Tabela 6.24: Teste em funcion arios do setor de marca ca o de luz de uma empresa cinematogr aca. Tratamentos Blocos X1 Escore X2 Escore X3 Escore X4 Escore A 7 1 9 1 10 1 6 0 B 8 1 12 1 11 1 5 0 C 6 0 7 1 8 1 4 0 D 3 0 5 0 6 0 6 0 E 9 1 10 1 8 1 2 0 F 4 0 7 1 5 0 9 1 Total 3 5 4 1 Exerc cio 6.6. Rea c ao em cadeia da polimerase (PCR) em sangue de camundongos infectados com clones de trypanosoma cruzi pertencentes a diferentes gen otipos. (Banco de dados: Analises Clinicas ex.stw ) O objetivo principal do trabalho foi o de investigar se existe diferen ca entre os tratamentos: PCR, ELISA, HEMO e ESF de modo global (para toda a amostra), por Gen otipo: 39, 32, 20 e 19 e por Fase: Aguda ou Cr onica. Exerc cio 6.7. Utilize o bancos de dados: Pediat ex.stw e Psi1 ex.stw, leia as informa c oes e fa ca o que se pede.

Cap tulo 7

An alise de Vari ancia


` vezes As e preciso comparar m edias de mais de duas popula c oes. Por exemplo, para vericar se pessoas com diferentes n veis de renda, isto e, alto, m edio e baixo t em, em m edia, o mesmo peso corporal, e preciso comparar m edias de tr es popula c oes. Outras vezes, e preciso comparar v arias situa c oes experimentais. Por exemplo, se um pesquisador separa, ao acaso, um conjunto de pacientes em 4 grupos e administra uma droga diferente a cada grupo, ter a que comparar m edias de quatro popula c oes. Para comparar m edias de mais de duas popula c oes normais ou aproximadamente normais, aplica-se o teste F. Neste caso conv em vericar antecipadamente a normalidade dos dados. Por exemplo, imagine que 4 amostras casuais simples, todas com cinco elementos mas cada uma proveniente de uma popula c ao, conduziram aos dados apresentados na Tabela 7.1. Tabela 7.1: Dados de 4 amostras e respectivas m edias. Amostras A B C D 11 8 5 4 8 5 7 4 5 2 3 2 8 5 3 0 8 5 7 0 x 1 = 8 x 2 = 5 x 3 = 5 x 4 = 2 Ser a que as diferen cas das m edias das amostras s ao sucientemente grandes para que se possa armar que as m edias das popula c oes s ao diferentes? Para responder a esta pergunta, e preciso um teste estat stico.

7.1

An alise de Vari ancia para Experimentos ao Acaso

Primeiro, e preciso estudar as causas de varia ca o. Por que os dados variam? Uma explica c ao e o fato de as amostras provirem de popula c oes diferentes. Outra explica c ao e o caso, porque mesmo dados provenientes da mesma popula c ao variam. O teste F e feito atrav es de uma an alise de vari ancia, que separa a variabilidade devido aos tratamentos (no exemplo, devido ` as amostras terem provindo de popula c oes diferentes) da variabilidade residual, isto e, devido ao acaso. Para aplicar o teste F e preciso fazer uma s erie de c alculos, que exigem conhecimento de nota c ao. A Tabela 7.2, apresenta os dados de k tratamentos, cada um com r repeti c oes (no exemplo, denominam-se repeti c oes os elementos da mesma amostra). A soma das r repeti c oes de um mesmo tratamento constitui o total desse tratamento. O total geral e dado pela soma dos k totais de tratamentos.

83

7.1

An alise de Vari ancia para Experimentos ao Acaso

ROSSI, Robson M. 84

Tabela 7.2: Nota c ao para a an alise Tratamentos 1 2 3 ... x11 x21 x31 ... x12 x22 x32 ... . . . x1r x2r x3r Total T1 T2 T3 ... No de repeti c oes r r r ... M edia x 1 x 2 x 3

de vari ancia. k xk 1 xk 2 . . . xkr Tk r x k Total

T = x n = kr

Para fazer a an alise de vari ancia e preciso calcular as seguintes quantidades: 1. os graus de liberdade: (a) de tratamento: k 1 (b) de total: n 1 (c) de res duo: (n 1) (k 1) = n k umero de dados. O valor C e 2. o valor C, dado pelo total geral elevado ao quadrado e dividido pelo n chamado corre ca o. ( x)2 C= n 3. a soma de quadrados total: SQT = 3. a soma de quadrados de tratamentos: SQT r = 4. a soma de quadrados de res duos: SQR = SQT SQT r 5. o quadrado m edio de tratamentos: QM T r = 6. o quadrado m edio de res duo: QM R = 7. o valor de F F = SQT r k1 SQR nk T2 C r x2 C

QM T r QM R

Em seguida, e preciso comparar o valor calculado de F com o valor tado em tabela, ao n vel de signic ancia estabelecido e com (k 1) graus de liverdade no numerador e (n k ) graus de liberdade no denominador. Toda vez que o valor calculado de F for maior ou igual do que o da tabela conclui-se, ao n vel de signic ancia estabelecido, que as m edias de tratamentos s ao iguais.

7.1

An alise de Vari ancia para Experimentos ao Acaso

ROSSI, Robson M. 85

Exemplo 7.1. Para os dados apresentados na Tabela 7.1, proceder uma an alise de vari ancia para vericar se existe diferen ca signicativa entre os tratamentos. 1. os graus de liberdade: (a) de tratamento: k 1 = 4 1 = 3 (b) de total: n 1 = 20 1 = 19 (c) de res duo: (n 1) (k 1) = n k = 20 4 = 16 2. o valor C: C= 3. a soma de quadrados total: SQT = x2 C = 112 + 82 + ... + 02 500 = 658 500 = 158 ( (11 + 8 + ... + 0)2 x)2 = = 500 n 20

3. a soma de quadrados de tratamentos: SQT r = T2 402 + 252 + 252 + 102 C = 500 = 590 500 = 90 r 5

4. a soma de quadrados de res duos: SQR = SQT SQT r = 158 90 = 68 5. o quadrado m edio de tratamentos: QM T r = 6. o quadrado m edio de res duo: QM R = 7. o valor de F F = SQT r 90 = = 30 k1 3

SQR 68 = = 4, 25 nk 16 QM T r = 7, 06 QM R

As quantidades calculadas s ao apresentadas numa tabela de an alise de vari ancia. Veja a Tabela 7.3: Tabela 7.3: An alise de vari ancia dos dados da Tabela 6.1. Causas da varia c ao GL SQ QM F p Tratamentos 3 90 30 7,06 0,003086 Res duo 16 68 4,25 Total 19 158 Ao n vel de signic ancia de 5%, o valor de F tabelado, com 3 e 16 graus de liberdade (numerador e denominador, respectivamente), e de 3,24. Como o valor obtido e maior do que 3,24, conclui-se que as m edias n ao s ao iguais, ao n vel de signic ancia de 5%.

7.2

Teste Param etrico para Compara c oes M ultiplas

ROSSI, Robson M. 86

7.2
7.2.1

Teste Param etrico para Compara co es M ultiplas


Teste Tukey

Uma an alise de vari ancia permite estabelecer se as m edias das popula c oes em estudo s ao, ou n ao s ao, estatisticamente iguais. No entanto, esse tipo de an alise n ao permite detectar quais s ao as m edias estat sticamente diferentes das demais. Por exemplo, a an alise de vari ancia apresentada na Tabela 6.3 mostrou que as m edias das popula c oes n ao s ao iguais, mas n ao permite concluir que e, ou quais s ao, as m edias diferentes das demais. O teste de Tukey permite estabelecer a diferen ca m nima signicante (d.m.s), ou seja, a menor diferen ca de m edias de amostras que deve ser tomada como estatisticamente signicante, em determinado n vel. Essa diferen ca (d.m.s) e dada por: QM R d.m.s = q. r onde q e um valor dado em tabela, QMR e o quadrado m edio do res duo da an alise de vari ancia e r e o n umero de repeti c oes de cada tratamento. Considere agora os dados da Tabela 7.1. A an alise de vari ancia apresentada na Tabela 7.3 mostra um valor F signicante ao n vel de 5%. Ent ao as m edias de A, B, C e D n ao s ao estat sticamente iguais. Mas qual e, ou quais s ao, as m edias diferentes entre si? A pergunta pode ser respondida com a aplica c ao do teste de Tukey. Ao n vel de signic ancia de 5%, o valor de q para comparar 4 tratamentos (A,B, C e D), com 16 graus de liberdade no res duo, e de 4,05. Como QMR = 4,25 e r = 5, segue-se que: d.m.s = 4, 05. 4, 25 = 3, 73. 5

De acordo com o teste de Tukey, duas m edias s ao estatisticamente diferentes toda vez que o valor absoluto da diferen ca entre elas for igual ou superior ao valor da d.m.s. No caso do Exemplo, o valor da d.m.s. e 3.73 f e os valores absolutos das diferen cas entre as m edias est ao apresentados a seguir. E acil ver que a diferen ca entre as m edias A e D e maior do que a d.m.s. Ent ao, ao n vel de 5%, a m edia de A e signicativamente mair do que a m edia de D. Tabela 7.4: Compara c oes entre as m edias via Tukey. Pares de m edias Valor absoluto da diferen ca AeB |8 5| = 3 AeC |8 5| = 3 AeD |8 2| = 6 BeC |5 5| = 0 BeD |5 2| = 3 CeE |5 2| = 3

7.2

Teste Param etrico para Compara c oes M ultiplas

ROSSI, Robson M. 87

Exemplo 7.2. Com base nos dados apresentados na Tabela 7.5 abaixo, verique se existe diferen ca estat stica entre os grupos. Note que s ao tr es grupos em compara c ao. No grupo operado foi feita a remo c ao das gl andulas salivares maiores, e no grupo pseudo-operado foram executados todos os tempos cir urgicos, mas nenhuma gl andula foi removida (Banco de dados: Tukey1 ex.stw). Tabela 7.5: Taxa de glicose, em miligramas por 100 ml de sangue, em ratos Wistar machos de 60 dias, segundo o grupo. Grupo Operado Pseudo-operado Normal 96 90 86 95 93 85 100 89 105 108 88 105 120 87 90 110,5 92,5 100 97 87,5 95 92,5 85 95 Sol.: A tabela de an alise de vari ancia resume os c alculos: Tabela 7.6: ANOVA para a taxa de glicose. Causas da varia c ao GL SQ QM F p Grupos 2 717,25 358,625 6,73 0,005509 Res duo 21 1118,75 53,274 Total 23 1836,00 Para aplicar o teste de Tukey ao n vel de signic ancia de 5%, tem-se: q3;21 e d.m.s. = 3, 57 53, 247 = 9, 21. 8 3, 57

Os valores absolutos das diferen cas de m edias est ao apresentados na Tabela (7.7). Tabela 7.7: Compara co es para as taxas m edias de Pares de m edias Valor absoluto da diferen ca Operado vs pseudo |102, 375 89, 0| = 13, 375 Operado vs normal |102, 375 95, 125| = 7, 25 Pseudo vs normal |89, 000 92, 125| = 6, 125 glicose. p 0,0004 0,1403 0,2368

A taxa de glicose e, em m edia, maior nos operados do que nos pseudo-operados, ao n vel de signic ancia de 5.

7.2

Teste Param etrico para Compara c oes M ultiplas

ROSSI, Robson M. 88

7.2.2

Teste Dunnett

Em muitos experimentos, e comum a necessidade de se realizar m ultiplas compara c oes, todas em rela c ao a um u nico grupo denominado Controle. Neste caso, o test Dunnett (1964) e apropriado. Teremos (k 1) compara c oes a serem realizadas em rela c ao ao controle e queremos testas as seguintes hip oteses: H0 Ha : i = c i = 1, 2, ..., k 1 : i = c c: controle

O procedimento de Dunnett e an alogo ao teste t, mas modicado. d.m.s = d. 2.QM R r

onde r e o n umero de repeti c oes. Considerando um n vel de conan ca , rejeitamos H0 se: |x i x c | > d,(k1),f . QM R. 1 1 + ni nc

onde: a tabelado (Tabela Dunnett) para k 1 comara c oes e f : no de observa d,(k1),f est c oes dos tratamentos (exceto o controle); QM R : proveniente da ANOVA (Quadrado M edio dos Res duos); ni : no de observa c oes do tratamento i; nc : no de observa c oes do controle; x i e x c : m edias, do tratamento e controle, respectivamente. Exemplo 7.3. Deseja-se comparar o efeito de cinco drogas na diminui ca o da press ao arterial. Para isto utilizou-se cinco grupos distintos e foram comparadas suas m edias em rela c ao a m edia de um grupo controle, que recebeu placebo. Ao todo, 30 indiv duos participaram no experimento. A Tabela abaixo apresenta os valores referentes a diferen ca entre a press ao arterial no in cio e no m do experimento (mmHg). Tabela 7.8: Diminui ca o da press ao arterial, em mil metros de merc urio, segundo o tratamento. Tratamento A B C D E Controle 25 10 18 23 11 8 17 -2 8 29 23 -6 27 12 4 25 5 6 21 4 14 35 17 0 15 16 6 33 9 2 Ap os a an alise de vari ancia, tem-se: Tabela 7.9: ANOVA para os dados de press ao arterial, em mil metros de merc urio, segundo o tratamento. Causas da varia c ao GL SQ QM F p Grupos 5 2354,17 470,83 13,08 0,000003 Res duo 24 864 36 Total 29 3218,17 Como o valor de F apresentado e de 13,08 (p-valor = 0,000003) e signicante ao n vel de 5%, e razo avel procurar um teste para comparar as m edias dos tratamentos. A d.m.s. estabelecida pelo teste Dunnett (espec co para este caso) ser a: d.m.s = d. 2.QM R = 2, 70 r 2.36 = 10, 25 5

7.3

Teste N ao-Param etrico para Compara c oes M ultiplas

ROSSI, Robson M. 89

Obs. O valor d = 2, 70 e proveniente da Tabela Dunnett com 24 graus de liberdade. Desta forma teremos: Tabela 7.10: Compara c oes entre as m edias dos dados de Pares de m edias Valor absoluto da diferen ca A vs Controle |21 2| = 19 > 10, 25 B vs Controle |8 2| = 6 < 10, 25 C vs Controle |10 2| = 8 < 10, 25 D vs Controle |29 2| = 27 > 10, 25 E vs Controle |13 2| = 11 > 10, 25 Press ao arterial. p 0,000182 0,392329 0,162730 0,000007 0,032024

facil observar que os tratamentos A, D e E apresentam, em m E edia, resultados melhores que os do controle, ao n vel de 5%.

7.3
7.3.1

Teste N ao-Param etrico para Compara c oes M ultiplas


Teste Dunn-Bonferroni

Analogamente ao processo do Teste de Tukey para comparar tratamentos atrav es de par ametros populacionais como a m edia, por exemplo, o M etodo de Dunn-Bonferroni pode ser utilizado para o caso N aoParam etrico. Hip oteses a serem testadas: H0 Ha : Mi = Mj (m edias) : Mi = Mj , para algum i = j.

A diferen ca m nima signicativa (d.m.s.) para os contrastes (em pares): d.m.s. = Z1 2 Q onde N (N + 1) 12 1 1 + ni nj

k (k 1) . 2 Intervalo de Conan ca via Dunn-Bonferroni para os contrastes: Q= IC (1 )% = (Mi Mj ) d.m.s. umero 0 n ao pertencer ao IC, Rejeitamos H0 . Decis ao: Se o n

Exemplo 7.4. Deseja-se comparar 3 Grupos, de 15 ratos (5 cada) em tr es tipos de incentivos distintos: comida, agua e sexo. Os resultados mostrados na Tabela 7.11, representam tempos em segundos que cada rato precisou para sair de um labirinto de pesquisa.

Tabela 7.11: Tempo de percurso de Grupo I (comida) 30, Grupo II ( agua) 28, Grupo III (sexo) 23,

um rato at e sair 33, 29, 35, 25, 31 27, 21, 18, 15,

do labirinto. 34 26 20

Desejamos saber se existe evid encia suciente para armar, a um n vel de signic ancia de 1%, que existe diferen ca entre os grupos, e se houver, desejamos saber entre quais.

7.3

Teste N ao-Param etrico para Compara c oes M ultiplas Hip oteses: H0 Ha : n ao h a diferen ca signicativa entre os tratamentos. : h a diferen ca signicativa entre os tratamentos.

ROSSI, Robson M. 90

Sol.: Utilizando o teste de Kruskal-Wallis para k provas, temos a Tabela 7.12 com os postos das observa c oes. Tabela 7.12: Postos do tempo de percurso de Tratamento xi Grupo I (comida) 12 13 11 15 Grupo II ( agua) 9 6 10 8 Grupo III (sexo) 5 4 2 1 A estat stica teste: HK W = = = =
k T2 12 i . 3(N + 1) N (N + 1) i=1 ni 3 T2 12 i . 3(15 + 1) 15(15 + 1) i=1 5

um rato at e sair do labirinto. Ti = xi ni x i 14 65 5 13 7 40 5 8 3 15 5 3

(0, 05). 12, 5

652 + 402 + 152 5

48

2 como H 2 (k1) (1%;2) = 7, 98, e sendo HK W = 12, 5 > 7, 98, Rejeita-se H0 . O passo seguinte, ser a o de determinar qual(is) pares de tratamentos (contrastes) ocasionaram esta rejei c ao. C alculo do d.m.s.: k (k 1) 3(3 1) Q= = =3 2 2 assim,

d.m.s.

= Z1 0,01
2.3

15(15 + 1) 12

1 1 + 5 5

= 2, 95.(2, 83) = 8, 35 Contrastes: Tabela 7.13: Contrastes para os dados de tempo de percurso de um rato at e sair do labirinto. Contraste IC (1 )% 1 = x L 1 x 2 = 5 5 8, 35 : (3, 38; 13, 35) 2 = x L 1 x 3 = 10 10 8, 35 : (1, 66; 18, 35) 3 = x L 2 x 3 = 5 5 8, 35 : (3, 38; 13, 35) Decis ao: Se o n umero 0 n ao pertencer ao IC, Rejeitamos H0 . 1 e L 3 , podemos concluir que os tratamentos Observando que o 0 (zero) pertence somente aos IC de L que diferem signicativamente s ao dados pelo contraste L2 : motiva c ao pela comida e motiva c ao sexual. Isto e, as ratas tendem a correr mais para sair do labirinto, quando estimuladas ` a comida e ao sexo.

7.4

An alise de Vari ancia com N umero Diferente de Repeti c oes

ROSSI, Robson M. 91

7.4

An alise de Vari ancia com N umero Diferente de Repeti c oes

Muitas vezes o pesquisador disp oe de diversas amostras, cada uma proveniente de uma popula c ao, mas essas amostras n ao t em todas o mesmo tamanho. Mesmo assim, e poss vel conduzir a an alise de vari ancia. Ali as, todos os c alculos, com exce c ao da soma de quadrados de tratamentos, s ao feitos na forma j a apresentada anteriormente. Para entender como se calcula a soma de quadrados de tratamentos quando os tratamentos n ao t em o mesmo n umero de repeti c oes, primeiro observe a Tabela 7.14. Tabela 7.14: Nota c ao para a an alise de vari ancia com diferentes repeti c oes. Tratamentos 1 2 3 ... k Total x11 x21 x31 ... xk1 x12 x22 x32 ... xk2 . . . . . . x1r x2r x3r xkr Total T1 T2 T3 ... Tk T = x No de repeti n = kr c oes r1 r2 r3 ... rk M edia x 1 x 2 x 3 x k A soma de quadrados de tratamentos e dada pela f ormula: SQT r =
2 T1 T2 T2 + 2 + ... + k C r1 r2 rk

onde C e a corre c ao j a denida anteriormente. mais f E acil entender a aplica c ao de f ormulas atrav es de um exemplo.

7.4

An alise de Vari ancia com N umero Diferente de Repeti c oes

ROSSI, Robson M. 92

Exemplo 7.5. An alise de vari ancia para os dados da Tabela 7.15. Tabela 7.15: Dados de 3 amostras e respectivas m edias. Amostras A B C 15 23 19 10 16 15 13 19 21 18 18 14 15 16 13 x 1 = 84 x 2 = 76 x 3 = 86 1. os graus de liberdade: (a) de tratamento: k 1 = 3 1 = 2 (b) de total: n 1 = 15 1 = 14 (c) de res duo: (n 1) (k 1) = n k = 15 3 = 12 2. o valor C: C= 3. a soma de quadrados total: SQT = x2 c = 152 + 102 + ... + 162 4001, 67 = 159, 33 ( x)2 (15 + 10 + ... + 16)2 = = 4001, 67 n 15

3. a soma de quadrados de tratamentos: SQT r = 842 762 852 T2 C = + + 4001, 67 = 63, 33 r 6 4 5

4. a soma de quadrados de res duos: SQR = SQT SQT r = 159, 33 63, 33 = 96, 00 5. o quadrado m edio de tratamentos: QM T r = 6. o quadrado m edio de res duo: QM R = 7. o valor de F F = SQT r 63, 33 = = 31, 67 k1 2 96 SQR = = 8, 00 nk 12

QM T r 31, 67 = = 3, 96 QM R 8, 00

Os valores calculados est ao apresentados na Tabela 7.16. Ao n vel de signic ancia de 5%, com 2 e 12 g.l., o valor de F tabelado e de 3,89, menor do que 3,96, conclui-se que as m edias diferem entre si. Os m etodos de compara c ao de m edias apresentados anteriormente tamb em podem ser usados quando o ao o n umero de repeti c oes dos tratamentos n umero de repeti c oes por tratamento n ao e constante. Se ri e rj s em compara c ao, as f ormulas para a diferen ca m nima signicante cam como segue:

7.4

An alise de Vari ancia com N umero Diferente de Repeti c oes

ROSSI, Robson M. 93

Tabela 7.16: An alise de vari ancia. Causas da varia c ao GL SQ QM F Tratamentos 2 63,33 31,67 3,96 Res duo 12 96 8 Total 14 159,33

p 0,04784

7.4.1

Teste Tukey

Para comparar as m edias de tratamentos duas a duas, pode-se aplicar o teste de Tukey que, neste caso, e aproximado, porque os tratamentos t em n umeros diferentes de repeti c oes. A diferen ca m nima signicativa (d.m.s.) e dada pela f ormula: d.m.s. = q 1 1 + ri rj QM R 2

onde ri e o n umero de repeti c oes do i- esimo tratamento e rj e o n umero de repeti c oes do j - esimo tratamento. No caso do Exemplo anterior com dados na Tabela 7.15, para comparar a m edia de A com a m edia de B, tem-se: d.m.s. = 3, 77 Para comparar A com C, tem-se: d.m.s. = 3, 77 Para comparar B com C, tem-se: d.m.s. = 3, 77 1 1 + 4 5 8 = 5, 06. 2 1 1 + 6 5 8 = 4, 57. 2 1 1 + 6 4 8 = 4, 87. 2

Os valores absolutos das diferen cas entre as m edias est ao s ao apresentados a seguir. Como o valor absoluto da diferen ca entre A e B e maior do que a respectiva d.m.s., conclui-se que, em m edia, A difere de B, ao n vel de signic ancia de 5%. Tabela 7.17: Comapara c oes entre m edias. Pares de m edias Valor absoluto da diferen ca p AeB |14 19| = 5 0,0443* AeC |14 17| = 3 0,2272 BeC |19 17| = 2 0,5589

7.4

An alise de Vari ancia com N umero Diferente de Repeti c oes

ROSSI, Robson M. 94

7.4.2

Teste t

A diferen ca m nima signicativa (d.m.s.) e dada pela f ormula: d.m.s. = t 1 1 + ri rj QM R

7.4.3

Teste Dunnett

A diferen ca m nima signicativa (d.m.s.) e dada pela f ormula: d.m.s. = d 1 1 + ri rj QM R

Considera c oes A escolha apropriada de um teste e muito ex vel. Se o pesquisador quer ter alta chance de rejeitar H0 : de que as m edias s ao iguais, pode optar pelo teste t ou pelo teste Duncan (N ao apresentado neste material-Ver Vieira, 1999). Estes dois testes t em caracter sticas similares, mas o teste t e mais antigo e, talvez por isso, mais conhecido. Tamb em e de aplica c ao mais f acil. Entretanto, o pesquisador tamb em pode optar por aplicar o teste de Tukey ou de Dunnett, com n vel de signic ancia mais elevado. Estes testes teriam, ent ao, maior poder. Por exemplo, o teste de Tukey a 10% tem maior poder do que o teste de Tukey a 5%. Um pesquisador que pretende somente rejeitar a hip otese de que as m edias s ao iguais com muita conan ca, deve optar pelo teste de Tukey ou de Dunnett, com baixo n vel de signic ancia. Esta situa c ao pode ocorrer quando se comparam novas drogas terap euticas com uma droga conhecida. Toda droga tem efeitos colaterais. Ent ao, muitas vezes s o e razo avel indicar uma nova droga - de efeitos colaterais desconhecidos - quando existem indica c oes seguras de que essa nova droga e melhor do que a convencional. De qualquer forma, ca aqui um alerta: todos os procedimentos para a compara c oes de m edias t em vantagens e desvantagens. Ainda n ao existe um teste denitivamente melhor que todos os outros.

Cap tulo 8

Testes Cl nicos
8.1 Introdu c ao

Uma das experi encias mais rotineiras da pr atica m edica e a solicita c ao de um teste diagn ostico. Os objetivos s ao v arios, incluindo a triagem de paciente, o diagn ostico de doen cas e o acompanhamento ou progn ostico da evolu c ao de um paciente. Para chegar ao diagn ostico, o m edico considera v arias possibilidades, com n veis de certeza que variam de acordo com as informa c oes dispon veis. Um dos objetivo deste cap tulo e mostrar como se mede o n vel de certeza da ocorr encia de um evento, por exemplo: a presen ca de uma doen ca ap os a observa c ao de um teste positivo. Consideraremos o teste positivo quando indicar a presen ca da doen ca e negativo quando indicar a aus encia. N ao existe teste perfeito, aquele que com certeza absoluta determina a presen ca ou aus encia da doen ca. Estudaremos os ndices nos quais o conceito de qualidade de um teste diagn ostico e usualmente desmenbrado. Freq u entemente, um u nico teste n ao e suciente, e portanto deve-se combinar dois ou mais testes. O ideal seria que, para cada patologia, fossem determinados os testes a serem inclu dos no processo diagn ostico e a melhor forma de combin a-los. Apresentaremos as formas mais comuns de combina c oes de testes e como medir a qualidade do teste conjunto.

8.2

Testes Diagn osticos

O bom uso de um teste diagn ostico requer, al em de considera c oes cl nicas, o conhecimento de medidas que caracterizam a sua qualidade intr nsica: a sensibilidade, a especicidade e os par ametros que reetem a sua capacidade de produzir decis oes cl nicas corretas: Valor da Predi c ao Positiva e o Valor da Predi c ao Negativa. Na an alise da qualidade de testes diagn osticos, interessa conhecer duas probabilidades condicionais, que por suas import ancias, recebem nomes especiais:

95

8.2

Testes Diagn osticos

ROSSI, Robson M. 96

8.2.1

Sensibilidade e Especicidade

A sensibilidade, denotada por s, e denida como a probabilidade de o teste ser positivo dado que o paciente examinado e doente: s = Pr(T+ |D+ ) A especicidade, denotada por e, e denida como a probabilidade de o teste ser negativo dado que o paciente examinado n ao e doente: e = Pr(T |D ) Os nomes s ao descritivos: sensibilidade mede a capacidade de rea c ao do teste em um paciente doente enquanto que especicidade, a rea c ao do teste em pacientes n ao portadores da doen ca, isto e, o teste e espec co para a doen ca em quest ao. A an alise da deni c ao desses dois ndices (s e e ) mostra que, subjacentemente a estes conceitos, estamos assumindo a exist encia de um padr ao ouro (gold-standart), ou seja, um teste diagn ostico que sempre produz resultados corretos. Al em, disso assumimos que os pacientes s ao classicados apenas como doentes e n aodoentes n ao se admitindo est agios intermedi arios. De acordo com a Tabela 8.1, Tabela 8.1: Distribui c ao quanto ` a ocorr encia de um evento. Fator Total Doen ca Presente Ausente Presente a b n1 = a + b Ausente c d n2 = c + d Total m1 = a + c m2 = b + d n = n1 + n2 os ndices s e e s ao estimados por: s= e e= a a = a+b n1 d d = . c+d n2

ostico de doen ca coronariana. Exemplo 8.1. Diagn Wiener et al. compararam os resultados do teste ergom etrico de toler ancia a exerc cios entre indiv duos com e sem doen ca coronariana. O teste foi considerado positivo quando se observou mais de 1 mm de depress ao ou eleva c ao do segmento ST, por no m nimo 0,08 s, em compara c ao com os resultados obtidos com o paciente em repouso. O diagn ostico denitivo foi feito atrav es de angiograa (gold). A Tabela 8.2, sintetiza os resultados encontrados. Tabela 8.2: Resultados da avalia c ao da aplica c ao do teste ergom etrico de pacientes. Doen ca Teste ergom etrico Coronariana Positivo (T+ ) Negativo (T ) Presente (D+ ) 815 208 Ausente (D ) 115 327 Total 930 535 A sensibilidade e a especicidade s ao estimadas por: s= e 815 = 0, 797 1023 toler ancia a exerc cios em 1465 Total 1023 442 1465

327 = 0, 740. 442 O teste ergom etrico tem uma sensibilidade de 79,7%, ligeiramente superior que sua especicidade (74%). e=

8.2

Testes Diagn osticos

ROSSI, Robson M. 97

8.2.2

Valor das Predi c oes: VPP e VPN

A sensibilidade e a especicidade, embora sendo ndices ilustrativos e bons sintetizadores das qualidades gerais de um teste, tem uma limita c ao s eria: n ao ajudam a decis ao da equipe m edica que, recebendo um paciente com resultado positivo do teste, precisa avaliar se o paciente est a ou n ao doente. N ao se pode depender apenas da sensibilidade e da especicidade, pois estes ndices s ao provenientes de uma situa c ao em que h a certeza total sobre o diagn ostico, o que n ao acontece no consult orio m edico. Da a necessidade destes dois outros ndices que reetem melhor a realidade pr atica. Neste momento, interessa mais conhecer os seguintes ndices denominados valor da predi c ao positiva (VPP) e valor da predi c ao negativa (VPN), denidos respectivamente por: V P P = Pr [D+ |T+ ] e V P N = Pr [D |T ] . Em palavras, VPP e a probabilidade do paciente estar realmente doente quando o resultado do teste e positivo e VPN, a probabilidade do paciente n ao estar doente quando o resultado do teste e negativo. Estes valores s ao probabilidades condicionais, tal que o evento condicionante e o resultado do teste, aquele que na pr atica acontece primeiro. A maneira mais f acil de se calcular o VPP e o VPN e atrav es das f ormulas sugeridas por Vecchio (1966).

Tabela 8.3: Probabilidade necess arias para o c alculo dos ndices VPP e VPN. Popula c ao Propor c ao Propor c ao com resultado Positivo Negativo Doente p ps p(1 s) Sadia 1p (1 p)(1 e) (1 p)e Total p + (1 p) ps + (1 p)(1 e) p(1 s) + (1 p)e Seja p = Pr(D+ ) a preval encia da doen ca na popula c ao de interesse, isto e, a propor c ao de pessoas doentes, ou a probabilidade de doen ca pr e-teste. O valor de predi c ao positiva e obtido dividindo-se a freq u encia dos verdadeiros-positivos (oriundos de pacientes doentes), pelo total de positivos V PP = ps . ps + (1 p)(1 e)

De forma an aloga, considerando-se os verdadeiros-negativos obtemos o valor da predi c ao negativa V PN = (1 p)e . p(1 s) + (1 p)e

Ambas as express oes dependem do conhecimento de p, uma estimativa da preval encia da doen ca na popula c ao de interesse. Estas s ao probabilidades de resultados corretos de diagn ostico. Exemplo 8.2. Diagn ostico de doen ca coronariana (Continua c ao). Para uma popula c ao cuja preval encia de doen ca coronariana e de 2%, os valores de predi c ao do teste ergom etrico s ao: 0, 02 0, 797 = 5, 89%. V PP = 0, 02 0, 797 + (1 0, 02)(1 0, 74) e (1 0, 02) 0, 797 V PN = = 99, 34%. 0, 02 (1 0, 74) + (1 0, 02) 0, 797 Portanto, o valor de predi c ao positiva e baixo enquanto que o valor de predi c ao negativa e bastante alto. Se o resultado da ergometria for negativo, a chance de n ao haver uma doen ca coron aria e de 99,43%. Se, antes de qualquer informa c ao, o paciente tinha uma chance de 2% de apresentar a doen ca, ap os o resultado do teste negativo esta chance e de apenas 0,66% (1-0,9934).

8.2

Testes Diagn osticos

ROSSI, Robson M. 98

8.2.3

Decis oes Incorretas: PFP e PFN


P F P = Pr [D |T+ ] = 1 Pr [D+ |T+ ] = 1 V P P

As probabilidades e P F N = Pr [D+ |T ] = 1 Pr [D |T ] = 1 V P N referem-se, respectivamente, ao falso-positivo e ao falso-negativo, isto e, decis oes incorretas baseadas no teste diagn ostico. Uma diculdade com rela c ao ` a estes ndices e que muitos autores admitem, implicitamente, que a preval encia que ocorre na tabela e a mesma na popula c ao de interesse e assim usam tabelas 2 2 para calcular os valores de predi c ao. Nada justica esta hip otese. Este procedimento se usado sistematicamente, leva a erros s erios. Exemplo 8.3. Teste ELISA para detec c ao do HIV. Entre as v arias tecnologias para detectar a presen ca do HIV, a primeira a se difundir no Brasil foi o ELISA (Enzymelinked immunosorbent assay ). Em 1985 esta foi simultaneamente comercializada por v arios laborat orios americanos. Alguns deles reportaram, em seus testes preliminares, sensibilidade de 95% e especicidade de 99,8%. Os valores para os outros laborat orios s ao parecidos, segundo Marwick (1985). A Tabela 8.4 apresenta os valores dos ndices VPP e VPN para a implementa c ao do teste ELISA e v arios supostos valores da preval encia. Tabela 8.4: Valores da VPP, VPN, PFP e PFN para o teste ELISA para a detec c ao do HIV. Preval encia VPP(%) VPN(%) PFP(%) PFN(%) 1/100.000 0,47 100,00 99,53 0,00 1/10.000 4,54 100,00 95,46 0,00 1/1.000 32,21 99,99 67,79 0,01 1/500 48,77 99,99 51,23 0,01 1/200 70,47 99,99 29,53 0,01 1/100 82,75 99,99 1725 0,01 1/50 90,65 99,89 9,35 0,11 Considerando-se a popula c ao total de um pa s, a AIDS e uma doen ca de preval encia pequena. Os resultados da Tabela 8.4 mostram que em um programa de uso do teste em larga escala, grande parte dos pacientes com resultado positivo consiste na realidade de falsos-positivos; em outra palavras, o valor da predi c ao positiva e muito pequeno. Por outro lado, pouqu ssimos n ao doentes deixar ao de ser detectados e, portanto, o valor de predi c ao negativa e alto. Isto sugere um cuidado b asico: um resultado positivo dever ser reconrmado atrav es de teste baseado em tecnologia diferente do ELISA.

8.2.4

Combina c ao de Testes Diagn osticos

Muitas vezes, para o diagn ostico de certa doen ca dispomos apenas de testes com VPP ou VPN baixo ou, se existe um bom teste, este e muito caro ou oferece grande risco e/ou desconforto ao paciente. Nestas circunst ancias, uma op c ao freq uentemente usada e o uso de uma combina c ao de testes mais simples. A associa c ao de testes eleva a qualidade do diagn ostico, diminuindo o n umero de resultados incorretos. Quando dois ou mais testes s ao usados para se chegar a um diagn ostico e preciso saber como s ao obtidos os ndices de qualidade do teste m ultiplo, aquele composto pela agrega c ao de dois ou mais testes individuais. Restringiremos ao caso de apenas dois testes e as id eias apresentadas a seguir podem ser estendidas para o caso de mais de dois testes. Alguns detalhes podem ser encontrados em Hirsh & Rielgelman (1996). Formas de Combina c ao de Testes As maneiras mais simples de se formar um teste m ultiplo a partir dos resultados de dois testes s ao os esquemas em paralelo e em s erie. No caso do teste em paralelo, se um dos dois testes e positivo o teste conjunto tamb em o e. No teste em s erie, este e considerado positivo se os dois testes individuais s ao positivos.

8.2

Testes Diagn osticos

ROSSI, Robson M. 99

A associa c ao de testes em s erie e bastante empregada, tanto em triagens como no diagn ostico individual, sendo de grande utilidade quando a quest ao do custo e relevante. Chamando os testes originais de A e B, o teste em paralelo de Tp e o em s erie de Ts , e usando a linguagem de eventos temos: Tp+ = A+ B+ e Ts+ = A+ B+ . As sensibilidade e especicidade de Tp e Ts s ao calculadas com o aux lio das regras de c alculo de probabilidades de eventos. Combina c ao em Paralelo Nesse caso, o resultado do teste ser a considerado positivo, se pelo menos um dos testes apresentar de maior utilidade em casos de urg resultado positivo. E encia, quando se necessita de uma abordagem r apida, ou por outro tipo de conveni encia, como para pacientes provenientes de lugares distantes. A Tabela 8.5 apresenta de forma expl cita o procedimento proposto. Tabela 8.5: Resultado do teste em paralelo dependendo da classica c ao dos testes individuais A e B. Teste A Teste B Teste em paralelo + + + + + + + Em analogia ` a express ao para obter a sensibilidade temos: Pr[Tp+ |D+ ] = Pr[A+ B+ |D+ ] = Pr[A+ |D+ ] + Pr[B+ |D+ ] Pr[A+ B+ |D+ ] ou seja, a sensibilidade do teste em paralelo (sp ) e dada por sp = sA + sB sA sB . Admitindo-se que os resultados dos dois testes s ao independentes, pode-se calcular a especicidade de um teste em paralelo da seguinte forma: Pr[Tp |D ] = Pr[A B |D ] = Pr[A |D ] Pr[B |D ] ou seja, a especicidade do teste em paralelo (ep ) e dada por ep = eA eB . Portanto, facilmente calculamos a sensibilidade e a especicidade de um teste em paralelo a partir das sensibilidades e especicidades dos testes A e B. Al em disso, os par ametros VPP e VPN s ao calculados da mesma forma j a vista para testes isolados, utilizando-se agora a sensibilidade e especicidade da combina c ao em paralelo, e a preval encia da popula c ao de interesse. Combina c ao em S erie Nesse caso, os testes s ao aplicados consecutivamente, sendo o segundo teste aplicado apenas se o primeiro apresentar resultados positivo. O teste s o ser a considerado positivo, se o resultado dos dois testes for positivo. Esse procedimento e indicado em situa c oes em que n ao h a necessidade de r apido atendimento e quando o paciente pode ser acompanhado ao longo do tempo, e se a considera c ao de custo e importante, seja pela quest ao naceira, pelo risco ou desconforto induzidos pelo exame. A Tabela 8.6 apresenta de forma expl cita o procedimento proposto.

8.2

Testes Diagn osticos

ROSSI, Robson M. 100

Tabela 8.6: Resultado do teste em s erie dependendo da classica c ao dos testes individuais A e B. Teste A Teste B Teste em s erie desnecess ario + + + + Como s o ser ao aplicados dos testes se o primeiro for positivo, o custo desse tipo de combina c ao e menor. Uma discuss ao sobre a ordem mais indicada para a aplica c ao dos testes a serem combinados em s erie pode ser encontrada em Soares & Parenti (1995). Se os dois testes A e B s ao independentes, a sensibilidade (ss ) e a especicidade (es ) par o teste combinado em s erie s ao obtidos sa seguinte forma: Pr[Ts+ |D+ ] = Pr[A+ B+ |D+ ] = Pr[A+ |D+ ] Pr[B+ |D+ ]. ss = sA sB e es = eA + eB eA eB . Para os c alculos da sensibilidade e especicidade da associa c ao em s erie e em paralelo, a independ encia dos dois testes e crucial. Entretanto, n ao se pode garantir que isto ocorra sempre. Quando os testes n ao forem independentes, n ao h a uma forma anal tica simples para se obter tais ndices para um teste composto. Exemplo 8.4. Diagn ostico de c ancer pancre atico. Imagine um paciente idoso com dores persistentes nas costas e no abdomem e perda de peso. Na aus encia de uma explica c ao para estes sintomas, a possibilidade de c ancer do p ancreas e freq uentemente levantada. comum para se vericar esta possibilidade diagn E ostica, que ambos os testes de ultrasom (A) e tomograa computadorizada (B) do p ancreas sejam solicitados. A Tabela 8.7 apresenta dados hipot eticos sobre os ndices s e e dos testes, quando utilizados separadamente e em conjuto (Griner et al., 1981). Tabela 8.7: Sensibilidade e especicidade dos testes de ultra-som e tomograa computadorizada no diagn ostico do c ancer de p ancreas individualmente e em conjunto. Teste Sensibilidade (%) Especicidade (%) A: Ultra-Som 80 60 B: Tomograa 90 90 C: A ou B positivo 98 54 D: A e B positivo 72 96 Note que os esquemas C e D correspondem respectivamente a testes em paralelo e em s erie. Admitindo que os resultados dos dois testes sejam independentes e usando as express oes vistas anteriormente, temos as seguintes sensibilidades e especicidades combinadas: Em paralelo: sC = 0, 8 + 0, 9 0, 8 0, 9 = 0, 98 e eC = 0, 6 0, 9 = 0, 54; Em s erie: sD = 0, 8 0, 9 = 0, 72 eD = 0, 6 + 0, 9 0, 6 0, 9 = 0, 96. Quando um ou outro teste e positivo, a sensibilidade combinada e maior que o mais sens vel dos testes, mas a especicidade e menor.

Portanto,

8.2

Testes Diagn osticos

ROSSI, Robson M. 101

Ao contr ario, quando o crit erio para a positividade do teste e que tanto o ultra-som como a tomograa sejam positivos, a especicidade combinada e maior que o mais espec co dos dois, mas a sensibilidade e menor. Portanto, a sugest ao seria o teste em s erie. Exemplo 8.5. Sensibilidade e especicidade de testes em paralelo e em s erie. Consideremos dois testes A e B com sensibilidade e especicidade apresentados na Tabela 8.7, supondo uma preval encia de 1%, ent ao teremos os seguintes valores: s, e, VPP e VPN. Tabela 8.8: Sensibilidade, especicidade s erie e em paralelo considerando-se uma Teste A B Paralelo S erie e valores de predi c ao de testes individuais A e B e dos testes em preval encia de 1%. s e VPP VPN 0,9500 0,9000 0,0876 0,9994 0,8000 0,9500 0,1391 0,9979 0,9900 0,8550 0,0645 0,9999 0,7600 0,9950 0,6056 0,9976

A combina c ao em paralelo apresenta alta sensibilidade (0,99) mas sua especicidade e menor que a dos testes isolados. J a a combina c ao em s erie apresenta alta especicidade (0,995) enquanto que a sensibilidade e relativamente baixa comparada com testes isolados. Como esperado, os valores de predi c ao negativa s ao altos, tanto para os testes isolados como para as duas formas combinadas dos testes. Entretanto, os valores de predi c ao positiva n ao s ao altos, sendo que a combina c ao em s erie proporcionou o melhor resultado (V P P = 0, 6056). importante lembrar que, na maioria das vezes, os testes usados na combina E c ao s ao dependentes entre si. Portanto, os valores acima tendem a superestimar o verdadeiro valor dos ndices dos testes combinados. Nesse caso, n ao e poss vel determinar os valores dos par ametros de qualidade conhecendo-se apenas os valores de cada teste em separado. Torna-se necess ario um trabalho de pesquisa realizado em um grupo de pacientes nos quais s ao utilizados o teste padr ao (gold test ) e teste combinado (Di Magno et al., 1977).

8.2.5

Escolha entre Testes Diagn osticos

Idealmente, os testes utilizados devem ter alta sensibilidade e especicidade. Entretanto, na pr atica nem relativamente comum a situa sempre existem testes dispon veis com caracter sticas otimas. E c ao em que h a mais de um teste e ent ao surge a necessidade da compara c ao entre eles para uma escolha mais adequada. Em processos de escolha do ponto de corte (ponto limite para decidir se um paciente e doente ou sadio), por exemplo, Galen & Gambino (1975) sugeriram uma medida de eci encia denida pela soma da sensibilidade e especicidade, isto e, o valor de refer encia (k :Ponto de corte) foi obtido atrav es dos valores de s e e que tinham a maior soma. Suponha que dois testes diagn osticos est ao dispon veis: um com alta sensibilidade mas relativamente baixa especicidade e o outro com alta especicidade e relativamente baixa sensibilidade. Qual seria a melhor escolha? Embora a avalia c ao de um teste n ao seja trivial, j a que v arios fatores devem ser considerados, apresentaremos alguns argumentos baseados nas medidas de qualidades, que podem ajudar na escolha de um teste diagn ostico. O primeiro fato importante e que os valores de predi c ao (VPP e VPN) dependem conjuntamente de s, e e p. Soares & Parenti (1995) apresentam um estudo detalhado atrav es de gr acos que ilustram claramente o efeito da preval encia nos valores de predi c ao. O exemplo a seguir ilustra numericamente este fato. ostico da gonorr eia. Exemplo 8.6. Diagn O teste Gonosticon Dri-Drot, desenvolvido para o diagn ostico de gonorr eia, tem sensibilidade de 0,80 e especicidade de 0,95. Os valores da predi c ao positiva e negativa s ao apresentados na Tabela 8.9 para quatro popula c oes com diferentes preval encias. Embora o teste tenha par ametros de qualidades razo aveis, o VPP e baix ssimo para popula c oes de baixa preval encia, tornando o exame sem utilidade nessas condi c oes. Para simplicar o racioc nio sobre a escolha de testes diagn osticos, vamos inicialmente considerar duas situa c oes extremas, obviamente sem interesse pr atico, e depois vamos estender para situa c oes masi gerais.

8.2

Testes Diagn osticos

ROSSI, Robson M. 102

Tabela 8.9: Valores de predi c ao (VPP e VPN) do teste Popula c ao p A 0,500 B 0,100 C 0,020 D 0,001

Gonosticon Dri-Drot para quatro preval encias (p). VPP VPN 0,940 0,830 0,640 0,980 0,250 0,990 0,020 1,00

Suponhamos que p = 0, isto e, ningu em tem a doen ca, ou que p = 1, isto e, toda a popula c ao tem a doen ca em quest ao. Facilmente chagamos nos valores apresentados na Tabela 8.10, para quaisquer valores de s e e. Tabela 8.10: Valores de predi c ao (VPP e VPN) extremos de preval encias. p VPP 0 0 1 1 e propor c ao de resultados falsos (PFP e PFN) para casos PFP 1 0 VPN 1 0 PFN 0 1

A extens ao para o caso mais geral de p pequeno (doen ca rara) e p grande (doen ca comum) pode ser feita pela an alise das express oes j a estudadas variando-se as quantidades envolvidas (s, e e p), mas nos restringimos a apresentarmos uma an alise num erica. A Tabela 8.11 mostra os valores de predi c ao para preval encias de 1% e 90%. Tabela 8.11: Valores de predi c ao (VPP e VPN) para alguns preval encias de 1% e 90%. Preval encia de 1% s e VPP VPN 0,99 0,99 0,5000 0,9999 0,99 0,90 0,0909 0,9999 0,99 0,80 0,0476 0,9999 0,90 0,99 0,4762 0,9990 0,90 0,90 0,0833 0,9989 0,90 0,80 0,0435 0,9987 0,80 0,99 0,4469 0,9980 0,80 0,90 0,0748 0,9978 0,80 0,80 0,0388 0,9975 valores de sensibilidade e especicidade para Preval encia de 90% VPP VPN 0,9989 0,9167 0,9889 0,9091 0,9780 0,8989 0,9988 0,5238 0,9878 0,5000 0,9759 0,4706 0,9986 0,3548 0,9863 0,3333 0,9730 0,3077

Quando a preval encia e baixa, o valor de predi c ao positiva (VPP) e mais inuenciado pela especicidade. O valor de predi c ao negativa (VPN) e pouco inuenciado tanto pela sensibilidade quanto pela especicidade e e alto, como era de se esperar. Para a preval encia alta, o VPP e pr oximo de 1, independente dos valores da sensibilidade e da especicidade. Al em disso, o VPN e inuenciado mais pela sensibilidade do que pela especicidade. Embora este n ao seja um estudo exaustivo, existem evid encias para as seguintes conclus oes: 1. Um teste com alta especicidade deve ser usado quando a preval encia da doen ca e relativamente baixa (doen ca rara ), mesmo que o teste tenha relativamente baixa sensibilidade. 2. Um teste com alta sensibilidade deve ser usado quando a preval encia da doen ca e alta (doen ca comum ), mesmo que o teste tenha relativamente baixa especicidade. comum a id E eia de que se a doen ca e rara, um teste com alta sensibilidade dever ser usado para achar os casos e para uma doen ca de alta preval encia, um teste com alta especicidade deve ser escolhido. Esse racioc nio n ao coincide com os argumentos apresentados. Outro tipo de simula c ao e apresentado nas Figuras 8.1 e 8.2 para algumas situa c oes espec cas:

8.2

Testes Diagn osticos

ROSSI, Robson M. 103

Prevalncia

0% 100%

10%

20%

30%

40%

50%

VPP

50%

s = 99%; e = 70% s = 95%; e = 95% s = 70%; e = 99%


0%

s = 99%; e = 99%

Figura 8.1: Valor Preditivo Positivo em Fun c ao da Preval encia


Prevalncia
0% 100% 20% 40% 60% 80% 100%

VPN

50%
s = 70%; e = 99% s = 95%; e = 95% s = 99%; e = 70% s = 99%; e = 99%

0%

Figura 8.2: Valor Preditivo Negativo em Fun c ao da Preval encia Inicialmente percebe-se na Figura 8.1 que, para qualquer situa c ao, quanto maior a preval encia da doen ca, maior o valor preditivo positivo. Para um teste com sensibilidade e especicidade elevadas (s = 99% e e = 99%) o seu valor preditivo positivo ser a muito alto mesmo em situa c oes de preval encia n ao muito elevada. Entretanto, esta situa c ao sofre um impacto importante ao se diminuir apenas um pouco a sensibilidade e especicidade do teste (s = 95% e e = 95%). Uma outra situa c ao ocorrer a ao se modicar apenas uma das caracter sticas do teste. Por exemplo, ao se diminuir a sensibilidade mantendo-se a especicidade elevada (s = 70% e e = 90%), percebe-se que praticamente n ao houve impacto nos valores preditivos positivos em fun c ao da preval encia. Entretanto, quando essa mesma diminui c ao ocorre na especicidade, o impacto e bastante grande, diminuindo-se muito o valor preditivo positivo do resultado mesmo para preval encias mais elevadas. Dessa forma, pode-se armar que o valor preditivo positivo de um teste e fun c ao da preval encia da doen ca, da sensibilidade e fundamentalmente da especicidade, conforme j a fora observado na f ormula anterior. Note na Figura 8.2 que, ao reduzir apenas a sensibilidade (s = 70% e e = 99%), ocorre uma dr astica redu c ao no VPN, mostrando o grande impacto que essa medida exerce no VPN. Ao se reduzir apenas a especicidade (s = 99% e e = 70%), o impacto no VPN e muito pequeno, menor do que quando se reduz apenas um pouco a sensibilidade e a especicidade conjuntamente (s = 95 e e = 95%). Note tamb em que, para um mesmo teste diagn ostico (exce c ao apenas para s = 70% e e = 99%), o impacto do aumento da preval encia na redu c ao do VPN e muito pequeno. Esse impacto se acentua nas preval encias muitos elevadas. Como na pr atica cl nica, as doen cas estudadas comumente possuem preval encias relativamente baixas, o VPN ir a sofrer apenas pequena varia c ao ao se modicar a especicidade de um teste diagn ostico e mesmo ao se modicar pouco a sensibilidade.

8.2

Testes Diagn osticos

ROSSI, Robson M. 104

8.2.6

Rela c ao entre Sensibilidade e Especicidade

O teste diagn ostico ideal seria aquele na qual a sensibilidade e a especicidade fossem 100%, ou seja, n ao existiria erro em seu resultado. Entretando, na pr atica, isso n ao e poss vel. Ao contr ario, freq uentemente, existe uma contra-balan co (trade-o ) entre essas duas propriedades de tal modo que, quando um delas aumenta a outra diminui e vice-versa. Assim, para um teste expresso em uma escala cont nua (glicemia, por exemplo) e necess ario determinar um ponto de corte (cut o ) entre os valores considerados normais e os anormais. Neste caso, uma determinada propriedade do teste (por exemplo, a sensibilidade) somente pode ser aumentada ` as custas da diminui c ao da especicidade e vice-versa. Freq uentemente, na pr atica cl nica, escolhe-se um ponto de corte onde exista o menor erro poss vel, tanto de falsos positivos quanto de falsos negativos (Figura 8.3).

Figura 8.3: Ponto de corte com o m nimo erro poss vel

8.2.7

Curva ROC

Uma forma de expressar gracamente a rela c ao entre a sensibilidade e a especicidade e atrav es da constru c ao da curva ROC (receiver operating characteristic curve ). Esta curva foi primariamente desenvolvida na d ecada de 1950 para avaliar a detec c ao de sinais de radar (da a sua denomina c ao), embora somente recentemente tenha se tornado comum o seu uso na area m edica. Sua constru c ao e feita colocando-se os valores da sensibilidade (propor c ao de verdadeiros positivos) no eixo Y (ordenadas) e o complemento da especicidade (1 - e), ou seja, a propor c ao de falsos positivos no eixo X (abscissas) para diferentes pontos de corte. A partir dos dados apresentados na Tabela 8.12 foi constru da a curva ROC (8.4). Note que quanto mais pr oxima a curva estiver do canto superior esquerdo do gr aco, melhor ser a o poder discriminat orio do teste diagn ostico e quanto mais distante, at e o limite da diagonal do gr aco, pior ser ao seu poder de discriminar doentes e n ao doentes. A curva ROC pode servir como orienta c ao para a escolha do melhor ponto de corte de um teste diagn ostico que, em geral, se localiza no extremo da curva pr oximo ao canto superior esquerdo do gr aco. As curvas ROC, al em de auxiliarem na identica c ao do melhor ponto de corte, s ao muito utilizadas para comparar dois (ou mais) testes diagn osticos para a mesma doen ca. Nesse caso, o poder discriminat orio do teste, ou seja, a acur acia global, pode se mensurado atrav es do c alculo da area sob a curva ROC; quanto maior for a area tanto melhor ser a o teste diagn ostico. Um teste diagn ostico ideal, com 100% de sensibilidade e 100% de especicidade, a area total seria igual a 1 (um), ou seja, a curva seria coincidente com o lado esquerdo e o topo do gr aco. Neste caso, o teste n ao possuiria erro, identicando perfeitamente todos os indiv duos sadios e doentes (gold test ). Para um teste sem nenhuma utilidade, a curva seria uma linha reta em diagonal, partindo do canto inferior esquerdo at e o canto superior direito. Neste caso, o teste diagn ostico n ao possuiria nenhum poder para discriminar doentes de n ao-doentes.

8.2

Testes Diagn osticos

ROSSI, Robson M. 105

Tabela 8.12: Trade-o entre Sensibilidade e Especicidade no tratamento de Diabetes (Glicemia p os-prandial 2(h) mg/100 ml). Glicemia p os-prandial Sensibilidade (%) Especicidade (%) 1 - Especicidade (%) (2h) mg/100 ml 70 98,6 8,8 91,2 80 97,1 25,5 74,5 90 94,3 47,6 52,4 100 88,6 69,8 30,2 110 85,7 84,1 15,9 120 71,4 92,5 7,5 130 64,3 96,9 3,1 140 57,1 99,4 0,6 150 50,0 99,6 0,4 160 47,1 99,8 0,2 170 42,9 100,0 0 180 38,6 100,0 0 190 34,3 100,0 0 200 27,1 100,0 0
1 - Especificidade 0% 100% 20% 40% 60% 80% 100%

Sensibilidade

50%

0%

Figura 8.4: Curva ROC da Glicemia p os-prandial (2h) mg/100 ml Exemplo 8.7. Os dados da Tabela 8.13 foram obtidos na UEM/HU - Hospital Universit ario da Universidade Estadual de Maring a, em um estudo para avalia c ao de equipamentos para dosagem glic emica capilar O objetivo do trabalho foi o de escolher o melhor equipamento entre tr es analisados: Glucotrend, Precision e Advantage. Os testes foram realizados em 21 indiv duos. O teste Colorim etrico foi ser utilizado como Gold Standard (Teste Ouro), que classica sem erro doentes e n ao-doentes.

Obs.: Valores de refer encia: 60 a 120 mg/dl (Consideram-se anormais os valores abaixo de 60 (hipoglicemia) e acima de 120 (hiperglicemia)). Obs.: 1. *1 foram utilizadas duas tas por falha na leitura do equipamento; 2. *2 foram utilizadas quatro tas por falha na leitura do equipamento; 3. *3 equipamento apresentou erro.

8.2

Testes Diagn osticos

ROSSI, Robson M. 106

Tabela 8.13: Resultados da avalia c ao de equipamentos para dosagem glic emica capilar. Indiv duo Gold-Calorim etrico G-Glucotrend P-Precision A-Advantage 1 282 310 336 283 2 121 115 143 137 3 71 71 76 66 4 101 *3 85 99 5 161 *3 215 177 6 192 215 134 *2 211 7 99 97 123 134 8 105 152 156 *1 136 9 190 200 208 205 10 64 69 76 69 11 108 125 105 115 12 99 97 95 116 *1 13 107 107 109 108 14 68 75 81 64 15 81 86 94 91 16 82 84 49 *1 89 17 88 90 93 93 18 71 76 88 77 19 76 90 91 96 20 98 107 89 *1 105 21 87 86 90 96 Exerc cio 8.1. Utilize o banco de dados referentes a Tabela 8.13 e: 1. Determine as Tabelas Cruzadas: Gold X G; Gold X P e Gold X A. 2. Determine a sensibilidade e especicidade de cada testes acima . Baseado nestes resultados qual (quais) o(s) melhor(es) teste(s) ? c ao positiva (VPP) e negativa (VPN) assim como o PFP e o PFN para 3. Determine os valores de predi cada um dos testes, usando a preval encia da doen ca obtida atrav es da Tabela Cruzada. Interprete-os. 4. Considerando que a preval encia para a doen ca em quest ao e de 1%, recalcule os itens anteriores. 5. Combine os testes: G x P, G x A e P x A de forma paralela e em s erie, considerando uma preval encia de 1%. Qual a melhor combina c ao ? porqu e?

Refer encias Bibliogr acas


[1] ARANGO, H.G.. Bioestat stica: Te orica e computacional. Guanabara Koogan S.A. RJ, 2001. [2] CALLEGARI-JACQUES, S. M.. Bioestat stica: Princ pios e Aplica co es. Ed. Artmed. RS, 2003. [3] CAMPOS, H.. Estat stica Experimetal N ao-Param etrica. 4a Ed. USP/ESALQ, 1983. [4] CARVAJAR, S. S. R.. Elementos de Estat stica (com aplica c oes ` as ci encias m edicas e biol ogicas). Rio de Janeiro: UFRJ, 1970. [5] CASTELLANOS, R. S e MERINO, A. P.. Psicoestadistica-Contrastes Param etricos y no Param etricos. Ediciones Piramide S.A., Madrid, 1989. [6] CENTENO, A. J. Curso de Estat stica aplicada ` a Biologia. Goi ania: Ed. Universidade Federal de Goi as, 1981. stica (com aplica c oes ` as ci encias m edicas e biol ogicas). Rio [7] CARVAJAR, S. S. R. Elementos de Estat de Janeiro: UFRJ, 1970. [8] COLLET, D..Modelling survival data in medical research. Tests in statistical science. 4a Ed. Chapman & Hall. London, 1994. [9] DANIEL, W. W. Bioestatistics: a foundation for analysis in the health sciences. 2 Ed. New York: John Wiley, 1999. [10] DOWNING, D e CLARK, J.. Estat stica aplicada. 2a Ed. Saraiva. SP, 2002. [11] FORANTTINI, O. P.. Epidemiologia Geral. 1a Ed. Artes M edicas, Ltda., 1980. stica. 2a Ed. Thonson, 2004. [12] GAUVREAU, K. e PAGANO.. Principios de Bioestat [13] GUEDES, M. L. S. e GUEDES, J. S.. Bioestat stica - Para prossionais de sa ude. 1a Ed. Ao livro t ecnico S.A. RJ, 1988. [14] MEDRONHO, R. A.. Epidemiologia. Ed. Atheneu. SP, 2003. [15] PEREIRA, M. G.. Epidemiologia: Teoria e Pr atica. Ed. Guanabara & Koogan, 1995. [16] RODRIGUES, P. C.. Bioestat stica. EdUFF, RJ, 2002. [17] SIEGEL, S.. Estat stica n ao-param etrica. 1a Ed. RJ, Editora McGraw Hill do Brasil Ltda, 1981. [18] SOARES, J. F e BARTMAN, F. C.. M etodos estat sticos em medicina e biologia. 14o Col oquio Brasileiro de Matem atica. IMPA/CNPq. RJ, 1983. [19] SOARES, J. F. e SIQUEIRA, A.L.. Introdu c ao ` a estat stica m edica. Ed. UFMG. 1999. [20] SOKAL, R.R. Biometry: The Principles and Practice of Statistics in Biological Research. New York: W.F. Freeman, 1995. [21] SOUNIS, E. Bioestat stica. Princ pios fundamentais, metodologia, estat stica, aplica c ao ` a ci encias biol ogicas. 2a Ed. Revisada, McGraw-Hill, 1975. 107

8.2

Testes Diagn osticos

ROSSI, Robson M. 108

[22] STEEL, R.G.D. Principles and Procedures of Statistics a Biometrical Approach. 2. Ed. New York: Mc Graw-Hill, 1980. [23] WAYNE, W. D.. Biostatistics. A foundation for analysis in the health sciences. 7a Ed. J&S. NY, 1999. [24] VIEIRA, S.. Introdu c ao ` a Bioestat stica. 5a Edi c ao Revista e Ampliada. Editora Campus,1980. [25] VIEIRA, S.. Estat stica Experimental. 2a Edi c ao. Ed Atlas S.A. SP,1999.

Вам также может понравиться