Manual BioEstat

APLICAES ESTATSTICAS
NAS REAS DAS CINCIAS BIO-MDICAS

Desenvolvimento estatstico:
Manuel Ayres
Professor Emrito da Universidade Federal do Par

Manuel Ayres Jr. Ph.D.,
Universidade de Maryland

Desenvolvimento do software
Daniel Lima Ayres
Engenheiro de Computao
Universidade de Illinois

Alex de Assis Santos dos Santos
Tecnlogo em Processamento de Dados
Instituto Bioestatstico de Cincia e Tecnologia

BELM PAR BRASIL

ANO 2007

Manuel Ayres, Manuel Ayres Jnior, Daniel Lima Ayres, Alex de
Assis Santos dos Santos e Lucas Lima Ayres dedicam esta verso 5.0
do BioEstat a IZA DO AMARAL CORRA AYRES, com um abrao
carinhoso, repassado com admirao e apreo.

Ao longo de mais de dez (10) anos ininterruptos, voc IZA tem nos
proporcionado apoio incondicional na elaborao de nosso trabalho
cientfico, participando direta e indiretamente com sugestes, na escolha
de textos e imagens que enriquecem nosso livro, e no apoio material e
espiritual desmedido para o aperfeioamento de uma ferramenta
imprescindvel para todos aqueles que desenvolvem pesquisa em nosso
Pas. Sua bondade e humanidade nos tem sido preciosos e voc tem sido a
grande responsvel por nossa alegria e energia nesse labor, no havendo
qualquer exagero nessa afirmao. A unanimidade dentre aqueles que tem
sorte de conhec-la de perto no deixa margem a equvocos quanto ao
estofo de que feita a sua personalidade, sendo uma criatura singular
difcil de encontrar nesse mundo conturbado em que vivemos. Voc a
Me admirvel, a Mulher incomparvel e a amiga mais carinhosa que
poderamos desejar.

Um muito obrigado de todos os seus fiis admiradores:

Manuel Ayres
Manuel Ayres Jnior
Daniel Lima Ayres
Alex Santos dos Santos
Lucas Lima Ayres

Prefcio da 5
a
Edio

O universo encontra-se em constante evoluo. A idia de que o mundo seria
imutvel, com toda a sua monotonia, foi alterada por outra, de uma dinmica
incessante. Da mesma maneira, a famlia Ayres e seu fiel companheiro Alex Santos
dos Santos tambm no param. Estamos agora diante da quinta verso de um manual
que j provou sua imensa utilidade junto comunidade cientfica brasileira. Tendo
como origem texto publicado h 20 anos atrs, as diferentes verses do BioEstat esto
sempre procurando manter-se alertas s necessidades desta comunidade, em uma rea
que tradicionalmente considerada difcil por alunos e profissionais da biologia e
biomedicina.
Esta natural (ser mesmo natural?) averso de bilogos e biomdicos
matemtica e estatstica est sendo vencida, e boa parte do progresso alcanado
vincula-se revoluo causada pela eletrnica. Com a internet houve uma
considervel democratizao do saber. Informaes que antes levavam meses para
transitar entre o Primeiro e o Terceiro Mundos atualmente podem ser obtidas de
maneira quase instantnea. Da mesma forma, os pacotes estatsticos tornaram
imensamente mais fcil a tarefa dos nefitos, como pode ser perfeitamente
testemunhado por todos os usurios das verses anteriores do BioEstat.
O que pode ser encontrado nas mesmas, bem como na verso atual? Bem, ali
(e aqui) esto matrias presentes tambm em qualquer tratado de bioestatstica, como
probabilidades; amostragem; construo de grficos e tabelas; frmulas mais
empregadas; estimao de parmetros clssicos; correlao e regresso; e anlise de
varincia. Mas tambm h tpicos mais especializados e de grande valor, como
anlise de sobrevivncia; bootstrap; ou meta-anlises diversas.
O que h de novo? O teste de Mantel; acrscimo aos testes de risco relativo;
ndices de diversidade; e diversos outros aplicativos que complementam de maneira
importante aspectos de processos considerados anteriormente.
Qual seria a mensagem final desta breve introduo? A de que devemos
agradecer que crebros como os dos autores deste livro estejam se dedicando difcil
tarefa de colocar disposio de seus colegas ou de qualquer outro interessado as
ferramentas bsicas necessrias utilizao de conceitos e interpretao de processos
cientficos. Em uma poca em que lado a lado com os fantsticos progressos da
cincia pululam por todo o mundo movimentos anticincia salutar encontrar obras
como esta: uma aragem revigorante que parte do ambiente quase sempre escaldante
da nossa Amaznia!

Francisco M. Salzano
Professor Emrito
Universidade Federal do Rio Grande do Sul

Prefcio da 1
a
e 2
a
Edies

O alvioda pobreza na Amaznia spodeser feitose
diminuirmos a migraoda zona rural para as grandes
cidades. Para mantermos a populaohumana na zona
rural, almdedarmos infra-estrutura escolar, sanitria
emdica, precisamos manejar os recursos naturais de
forma sustentvel combase cientfica slida e assim
manter a estrutura dos ecossistemas atravs da
conservaodos processos ecolgicos eevolutivos.
Jos Mrcio Ayres

APRESENTAO
O pacote estatstico BioEstat, aqui apresentado, tem como objetivo propiciar
aos acadmicos de diversas reas do conhecimento um instrumento de grande
praticidade e de fcil manuseio na avaliao de informaes originadas
atravs de pesquisa, sendo composto por este manual e de um aplicativo. Este
estudo representa na verdade uma evoluo bastante significativa dos mesmos
autores de Aplicaes Estatsticas em Basic, publicado em 1987 pela editora
McGraw-Hill e, atravs de observaes ao longo dos anos, oriundas do curso
de Bioestatstica fornecido pelo autor principal na Universidade Federal do
Par.

Este trabalho foi realizado por trs geraes dos Ayres: a primeira est
representada por Manuel Ayres, professor de Estatstica da Universidade
Federal do Par; a segunda, por Manuel Ayres Jr., PhD em engenharia civil
pela Universidade de Maryland (EUA); e a terceira, pelo estudante do
segundo grau, Daniel Lima Ayres, com 15 anos de idade, que desenvolveu o
aplicativo, juntamente com Alex de Assis Santos dos Santos, em Visual Basic,
e a diagramao deste manual.

BioEstat dirigido especialmente aos estudantes de graduao e ps-
graduao das reas mdica e biolgica que possuam noes bsicas de
estatstica. O pacote bastante facilitado pelo emprego do aplicativo e deste
manual, onde a escolha do teste adequado poder ser feita de maneira prtica
de acordo com a natureza dos dados, nmero de amostras e tipo de
experimento. Ainda, para facilitar seu uso, cada teste tem seu respectivo
exemplo que auxilia o emprego deste pacote estatstico. Os exemplos aqui

fornecidos podem ter sido originados de situaes prticas reais ou puramente
hipotticas.

Embora os testes estatsticos aqui apresentados sejam empregados nas mais
diversas reas da cincia, a escolha foi baseada na demanda levantada ao
longo dos ltimos anos por estudantes das reas mdicas e de diversos
segmentos da rea biolgica. Podero ser observadas pequenas divergncias
de resultados quando comparados a outros pacotes desse gnero. Essas
diferenas, porventura detectadas, podem estar relacionadas ao emprego de
distintos algoritmos.

Sugestes para melhoria do pacote e possveis erros encontrados durante o seu
uso sero bem recebidos pelos autores. Essas modificaes tambm podero
ser inseridas em futuras verses.

J. Mrcio C. Ayres
MPEG/CNPq
Wildlife Conservation Society
NY
Belm, Par, Maio de 1998.

In memorian: o Autor desta Apresentao faleceu em 7 de maro de 2003 e, se vive fosse,
o segundo pargrafo desta Apresentao teria certamente o seguinte teor:

Este trabalho foi realizado por trs geraes dos Ayres: a primeira est
representada por Manuel Ayres, ex-professor de Estatstica da Universidade
Federal do Par; a segunda, por Manuel Ayres Jr., PhD em engenharia civil pela
Universidade de Maryland (EUA); e a terceira, por Daniel Lima Ayres,
engenheiro de computao pela Universidade de Illinois (EUA), que
desenvolveu o aplicativo, juntamente com Alex de Assis Santos dos Santos, e a
diagramao deste manual, e, mais recentemente, Lucas Lima Ayres, estudante
de medicina veterinria da Universidade Federal de Minas Gerais, o qual
contribuiu no desenvolvimento do Captulo 18 sobre Estatsticas Circulares.

Prefcio da 3
a
Edio

A conservao da biodiversidade componente essencial para qualquer poltica de
desenvolvimento sustentvel. A falta de uma poltica consistente para este fim poder levar a
contnua eliminao de diferentes formas de vida, perda de recursos genticos e a modificao
de processos ecolgicos e evolutivos que so essenciais para a prpria sobrevivncia da nossa
prpria espcie. Como demonstrado por inmeros estudos, a perda da diversidade biolgica
ter custos enormes para toda a humanidade, tanto se utilizarmos os indicadores econmicos
tradicionais, como se considerarmos tambm os valores sociais, estticos e espirituais que
fazem parte da nossa cultura.
A Conservation International acredita que conservao da biodiversidade deve ser baseada em
cincia de boa qualidade. Por isso, estamos estabelecendo, atravs dos nossos Centros de
Conservao da Biodiversidade, parcerias diversas para o desenvolvimento de pesquisas e
capacitao em todas as reas do conhecimento relevantes para a ao de conservao.
Independente da rea, o conhecimento da estatstica fundamental.

Uma necessidade comum no Brasil, tanto para os cientistas mais novos como para os que j
possuem anos de experincia, a existncia de programas de computador que sejam efetivos
para as anlises estatsticas. nesse contexto, que temos a honra de apoiar a publicao da
terceira edio do livro BIOESTAT, escrito com toda a competncia por Manuel Ayres,
Manuel Ayres Jnior, Daniel Lima Ayres e Alex Santos dos Santos. H poucos cientistas no
Brasil que no conhecem as verses anteriores e certamente so milhares os estudantes de
graduao e ps-graduao no pas que iniciaram ou aprofundaram seus estudos de estatstica
utilizando este livro. O sucesso das duas verses anteriores foi to grande, que os autores
tiveram que trabalhar bastante para atender a uma demanda enorme para a atualizao e
publicao peridica de um livro to importante para todos.

Em nome de todos os que se dedicam ao estudo e a conservao da biodiversidade brasileira e
mundial, desejamos agradecer o extraordinrio esforo dos autores para produzir uma obra to
importante para todos, assim como reconhecer a importncia do trabalho realizado por nosso
grande amigo Jos Mrcio Ayres, cujo trabalho fenomenal para demonstrar de forma
inequvoca a indissociabilidade entre cincia e conservao.

Russel A. Mittermeier Gustavo A. B. da Fonseca
Presidente Vice-Presidente Executivo
Conservation International Conservation International

Prefcio da 4
a
Edio
A Estatstica tem tido grande importncia ao longo de sua histria, que comea Antes
de Cristo, com os registros egpcios de presos de guerra, a partir da organizao de bancos
de dados que possibilitaram o estabelecimento de uma relao-verdade entre o passado, o
presente e o futuro.
O BioEstat trilha a gide que fortalece o conhecimento da Estatstica como cincia,
desvendando modelos matemticos e procedimentos de anlises e, assim, possibilitando maior
facilidade na interpretao dos fenmenos que se manifestam espontaneamente ou so
induzidos natureza dos seres vivos, sobretudo pelo prprio Homem.
A evoluo deste trabalho didtico deve-se, entre outros fatores, s fases evolutivas
dos conhecimentos estatsticos. A princpio houve a preocupao de introduzir aqueles
aplicativos de uso mais geral, e assim o BioEstat 1.0 se apresentou como ferramenta destinada
a oferecer aspectos voltados sobretudo para estudantes de graduao e ps-graduao das
reas mdicas e biolgicas. Na segunda etapa, o BioEstat 2.0 no perde seu foco inicial, mas
evolui com a incluso de novos modelos de anlises e ultrapassa as fronteiras brasileiras e
alcana o pblico tcnico-cientfico da lngua espanhola.
Na fase seguinte, com a adio de novos aplicativos, a sugesto da escolha dos testes
estatsticos e o clculo do tamanho das amostras, o BioEstat 3.0 solidifica-se como ferramenta
didtica quase obrigatria devida, sobretudo, facilidade de sua aplicao e interpretao dos
fenmenos biolgicos, sejam de ordem observacional, quer de natureza experimental. Tem
assim incio, e de forma definitiva, a empatia entre usurios e autores, cada um interpretando
as necessidades de desenvolvimento do outro.
Por fim, ocorre a interdependncia de diversas reas do conhecimento das cincias
biomdicas com a Biometria o BioEstat 4.0 chega com nova roupagem, com mais 15
aplicativos, sem se despir de sua trajetria histrica, mas atendendo as exigncias dos
usurios, vidos por ampliar seus conhecimentos e se coloca, com seus 184 testes, como
alternativa didtica para outras reas das cincias, com sugestes dos prprios usurios.
Esta edio do BioEstat 4.0 consolida a relao de dependncia com o seu pblico
fiel, onde as trocas se igualam vontade de evoluir, com ganhos de conhecimentos e
confiabilidade, diante da necessidade de aprender a ensinar ensinando. Desperta interesse
maior e permite a sua insero, como instrumento de consultas, por estudiosos de outras reas
de conhecimento tcnico-cientfico, que se auxiliam do BioEstat nas avaliaes de seus
estudos experimentais e observacionais.
Do mesmo modo como a Estatstica surgiu e ganhou reconhecimento, o projeto
BioEstat vem evoluindo a cada lanamento. Esta evoluo s se tornou possvel pelo forte
empenho e competncia de seus autores, os quais tem se dedicado ao longo de 20 anos no
aperfeioamento e na produo desta obra.

Ana Rita Pereira Alves
Diretora

AGRADECIMENTOS

Os autores penhoradamente agradecem o desvelo da Professora JUSSARA
MORETTO MARTINELLI, da Universidade Federal do Par, na reviso
minuciosa e com primor do manuscrito do BioEstat 5.0. O interesse inexcedvel
da ilustre Professora na execuo dessa rdua tarefa, trouxe grande satisfao,
incentivo e alegria aos participantes do trabalho ora publicado.

Ao LUCAS LIMA AYRES, aluno de Medicina Veterinria da Universidade
Federal de Minas Gerais, outro componente da famlia Ayres engajado nesta
tarefa, agradecemos seu incentivo na introduo dos ndices de Shannon-Wiener e
de Simpson no BioEstat 5.0 e, sobretudo, no desenvolvimento das Estatsticas
Circulares, ainda de menor utilizao em nosso meio acadmico.

NOTA: Manuel Ayres, Manuel Ayres Jnior, Daniel Lima Ayres e Alex Assis
Santos dos Santos tm a satisfao em lanar a mais nova edio do BioEstat (5.0),
com 210 aplicativos voltados sobretudo para as reas de cincias biolgicas e
mdicas, resultantes do aperfeioamento das verses anteriores e de sugestes
recebidas dos Usurios deste software, esclarecendo, todavia, que possveis
incorrees no programa e no texto so de inteira responsabilidade dos seus
autores.

Agradecemos, tambm, a todas as pessoas que colaboraram direta ou
indiretamente na construo do BioEstat, tornando pblico o nosso
reconhecimento quelas indicadas em seguimento e, ainda, aos docentes e
discentes das Universidades brasileiras que muito contriburam com suas
sugestes no aperfeioamento deste trabalho:

Ademar Ayres do Amaral J. C. Voltolini
Alberto Cargnelutti Filho Jeffrey Shaw
Alex Fiza de Melo Jos Mrcio Corra Ayres *
Altino Pinheiro Jos Maria Cardoso da Silva
Ana Rita Pereira Alves Jos Maria de Azevedo Barbosa *
Anis Rassi Jnior Jos Maria de Sousa
Antonio Carlos Simes Pio Jos Slvio Govone
Arno Holf Hamel Jussara Moretto Martinelli
Bernardo Beiguelman Lucimar Macedo Rodrigues
Ceclia Banhara Marigo Lcio Flvio Pinto
Cristovam Diniz Luiz Claudio Marigo
Deborah Magalhes Lima Marcos Porpino de Oliveira
Delma Maria dos Santos Maria Aparecida Pion Abuabara
Edson Elias Andrade Berbary Miguel Petrere Jr.
Elon Lages Lima Oswaldo Frota-Pessoa
Fbio Pereira Alves Paulo A. Otto
Fernanda Sagica Peter Toledo
Francisco Mauro Salzano Renata Gomes G. Oliveira
Giorgini Augusto Venturieri Roberto B. Cavalcanti
Gustavo A. B. da Fonseca Russel A. Mittermeier
Helder Lima de Queiroz Srgio de Mello Alves
Horcio Schneider Sdia M. Callegari Jacques
Ima Vieira Suely Fraiha
Israel Roisenberg Victoria J. Isaac
Iza do Amaral Corra Ayres William D. Hamilton *
* : In memorian

Os autores estendem seus agradecimentos s seguintes Instituies:
Conselho Nacional de Pesquisas - CNPq
Conservation International - CI
Instituto de Desenvolvimento Sustentvel Mamirau - IDSM
Imprensa Oficial do Estado do Par - IOEPA
Museu Paraense Emlio Goeldi - MPEG
Ministrio da Cincia e Tecnologia MCT
Universidade Federal do Par - UFPA
Wildlife Conservation Society - WCS

- xi -
SUMRIO
CAPTULO 1 Usando o BioEstat1 1
1.1 Requerimentos de sistema, 1 1.7 Imprimindo, 6
1.2 Instalando o BioEstat, 1 1.8 Escolhendo o teste, 6
1.3 Expresso de casas decimais, 1 1.9 Executando o teste, 6
1.4 Entrando com os dados, 3 1.10 Configurando o BioEstat, 7
1.5 Salvando os dados, 4 1.10 Obtendo ajuda, 7
1.6 Abrindo arquivos, 5 1.12 Capacidade do geral do sistema, 7

CAPTULO 2 Amostragem 9
2.1 Introduo, 9 2.5 Amostra por Conglomerados, 11
2.2 Amostra Aleatria Simples, 10 2.6 Amostragem dos Escores do Grid, 13
2.3 Amostra Sistemtica, 10 2.7 Aumento da amostra, 14
2.4 Amostra Estratificada, 11

CAPTULO 3 Anlise Multivariada. 17
3.1 Introduo, 17 3.6 Distncia Euclidiana, 30
3.2 Anlise de Conglomerados, 17 3.7 Distncia Penrose-Mahalanobis, 31
3.3 Anlise Discriminante, 20
3.8 Teste de Bartlett, 33
3.4 Componentes Principais, 23
3.9 Teste de Hotelling, 33
3.5 Correlao Cannica, 25
3.10 Teste de Mantel, 34

CAPTULO 4 Anlise de Sobrevivncia . 39
4.1 Introduo, 39 4.6 Log-Rank Test, 47
4.2 Atuarial, 40 4.7 Gehan (Wilcoxon Gerneralizado), 51
4.3 Modelo de Cox-Mantel, 41 4.8 Mantel-Haenszel, 52
4.4 Cox: Modelo de Risco Proporcional, 42 4.9 Pirmide Populacional, 53
4.5 Kaplan-Meyer, 46

- viii -
SUMRIO
CAPTULO 6 Anlise de Varincia . 39
6.1 Introduo, 39 6.5 ANOVA: Fatorial a x b x c , 47
6.2 ANOVA: um critrio, 39 6.6 Teste de Friedman, 48
6.3 ANOVA: dois critrios, 44 6.7 Teste de Kruskal-Wallis, 50
6.4 ANOVA: Fatorial a x b , 45 6.8 Teste Q de Cochran, 52

CAPTULO 7 Bootstrap Tira de Bota . 55
7.1 Introduo, 55 7.5 Intervalo de Confiana: Proporo , 59
7.2 Dados Dicotmicos, 55 7.6 Teste de Hiptese: t Teste, 60
7.3 Intervalo de Confiana: Correlao, 56 7.7 Teste de Hiptese: ANOVA, 61
7.4 Intervalo de Confiana: Mdia , 57 7.8 Teste de Hiptese: Correlao, 62

CAPTULO 8 Correlao . 65
8.1 Introduo, 65 8.8 Coeficiente de Correlao de
8.2 Correlao Linear de Pearson, 65 Kendall: , 72
8.3 Matriz de Correlao, 66 8.9 Coeficiente Phi: r
, 73
8.4 Correlao Parcial, 68 8.10 Coeficiente de Correlao de
8.5 Correlao Linear: < 0 ou > 0, 69
8.6 Coeficiente de Contingncia C, 70
Spearman: r
s
, 74

8.7 Coeficiente de Concordncia de
Kendall: W, 71

CAPTULO 9 Distribuio de Probabilidades . 75
9.1 Introduo, 75 9.8 Curva ROC, 83
9.2 Distribuio Binomial, 75 9.9 Regra de Bayes, 85
9.3 Distribuio Hipergeomtrica, 76 9.10 Sensibilidade/Especificidade, 85
9.4 Distribuio de Poisson, 77 9.11 Distribuio F, 86
9.5 Distribuio Exponencial, 78 9.12 Distribuio do Qui-Quadrado, 87
9.6 Distribuio Normal, 79 9.13 Distribuio t de Student, 87
9.7 Crivo (Screening Test), 82 9.14 Distribuio Z, 88

- ix -
SUMRIO
CAPTULO 10 Uma Amostra . 89
10.1 Introduo, 89 10.6 Teste de Kolmogorov-Smirnov, 94
10.2 Teste t de Student, 89 10.7 Teste de Lilliefors, 95
10.3 Teste Z, 91 10.8 Teste do Qui-Quadrado, 96
10.4 Teste Binomial, 92 10.9 Teste do Qui-Quadrado, 97
10.5 Teste G, 93 10.10 Teste de Poisson, 98

CAPTULO 11 Duas Amostras Independentes . 99
11.1 Introduo, 99 11.9 Teste da Mediana, 108
11.2 Teste t de Student, 100 11.10 Teste do Qui-Quadrado, 109
11.3 Teste Z, 102 11.11 Odds Ratio (OR), 110
11.4 Teste Binomial, 104 11.12 Risco Relativo (RR), 112
11.5 Teste Exato de Fisher, 104 11.13 Taxa de Incidncia, 113
11.6 Teste G, 105 11.14 Coeficiente de Variao, 114
11.7 Teste de Kolmogorov-Smirnov, 106 11.15 Teste de Poisson, 115
11.8 Teste de Mann-Whitney, 107

CAPTULO 12 Duas Amostras Relacionadas . 117
12.1 Introduo,117 12.5 Teste dos Sinais, 122
12.2 Teste t de Student, 117 12.6 Teste Kappa, 123
12.3 ANOVA, 119 12.7 Teste de Wilcoxon, 124
12.4 Teste de McNemar, 120

CAPTULO 13 Estatstica Descritiva . 125
13.1 Introduo, 125

CAPTULO 14 Estimao de Parmetros . 129
14.1 Introduo, 129 14.8 Fourier (densidade), 136
14.2 Estimao da Mdia, 129
14.3 Estimao da Proporo, 130
14.9 Lei de Hardy-Weinberg, 137
14.10 Tamanho da Populao (amostragem
14.4 Estimao da Diferena entre Duas simples, mtodo direto), 138
Mdias, 131 14.11 Tamanho da Populao (amostragem

- x -
SUMRIO
14.5 Estimao da Diferena entre Duas simples, mtodo inverso), 139
Propores, 133
14.6 Densidade e Tamanho da
Populao, 134
mltipla, populao fechada), 139
14.7 Fentipos e Gentipos, 135 mltipla, populao aberta), 141

CAPTULO 15 Meta-Anlise . 143
15.1 Introduo, 143 15.8 Regresso (Bw), k amostras, 153
15.2 Teste de DerSimonian-Laird, 144
15.3 Dados Contnuos, 146
15.9 Risco relativo (w),
para k tabelas 2 x 2, 154
15.4 Teste de Mantel-Haenszel, 148 15.10 Teste G, Aderncia,
15.5 p-valor (pw combinado), 149
15.6 Qui-Quadrado, aderncia
para k amostras, 155
15.11 Vrias Correlaes
para k amostras, 150
15.7 Qui-Quadrado independncia
para k tabelas 2 x 2, 151
(rw combinado), 157
15.12 Vrias Propores
(pw combinado), 158

CAPTULO 16 Normalidade. 165
16.1 Introduo, 165 16.5 Teste de Lilliefors, 167
16.2 Teste DAgostino, 165

16.6 Teste de Shapiro-Wilk, 168
16.3 Teste DAgostino-Pearson, 166
16.7 Valores Extremos (desvios), 169
16.4 Teste de Kolmogorov-Smirnov, 167 16.8 Valores Extremos (quartis), 171

CAPTULO 17 Qui-Quadrado 173
17.1 Introduo, 173 17.4 Partio L x C, 173
17.2 Uma Amostra (aderncia), 173 17.5 Teste de Tendncia, 174
17.3 Duas Amostras Independentes, 173

CAPTULO 18 Regresso. 177
18.1 Introduo, 177 18.5 Anlise de Resduos, 182
18.2 Regresso Linear Simples, 177 18.6 Regresso Logstica Simples, 185
18.3 Regresso Linear Mltipla, 179 18.7 Regresso Logstica Mltipla, 187
18.4 Ajustamento de Curvas, 180 18.8 Regresso Polinomial, 188

- xi -
SUMRIO
CAPTULO 19 Tamanho das Amostras . 191
19.1 Introduo, 191 19.6 Proporo: duas amostras, 195
19.2 Anlise de Varincia, 192 19.7 Qui-Quadrado, 196
19.3 Correlao Linear, 192 19.8 Teste t: uma amostra, 196
19.4 Teste de McNemar, 193
19.5 Proporo: uma amostra, 194
19.9 Teste t: duas independentes, 197
19.10 Teste t: amostras pareadas, 198
CAPTULO 20 Transformao . 201
20.1 Introduo, 201

CAPTULO 21 Grficos e Tabela . 205
21.1 Introduo, 205 21.8 Histograma, 214
21.2 Grfico de rea, 206 21.9 Grfico de Linha (Curva), 217
21.3 Box-Plot (Mediana e quartis), 207 21.10 Grfico de Mximo e Mnimo, 218
21.4 Box-Plot (Mdia e desvios), 208 21.11 Grfico Polar, 219
21.5 Caule e Folha (Stem and Leaf), 209 21.12 Grfico de Setor, 220
21.6 Grfico de Colunas, 211 21.13 Manipulao de Grficos, 221
21.7 Diagrama de Disperso, 213 21.14 Tabelas de Freqncia, 223

CAPTULO 22 Frmulas Estatsticas . 227
22.2 Anlise Multivariada, 227 22.10 Estatstica Descritiva, 242
22.3 Anlise de Sobrevivncia, 228 22.11 Estimao de Parmetros, 245
22.4 Anlise de Varincia, 229 22.12 Meta-Anlise, 250
22.5 Correlao, 231 22.13 Normalidade, 253
22.6 Distribuio de Probabilidades, 233 22.14 Qui-Quadrado, 254
22.7 Uma Amostra, 235 22.15 Regresso, 256
22.8 Duas Amostras Independentes, 237 22.16 Tamanho das Amostras, 260
22.9 Duas Amostras Relacionadas, 240 22.17 Novos Aplicativos, 262

CAPTULO 23 Escolha do Teste Estatstico Sugestes . 265
23.1 Introduo, 265 23.9 Duas Amostras Relacionadas, 269
23.2 Nmero de Amostras, 266
23.3 Uma Amostra: uma varivel, 266
23.4 Uma Amostra: duas variveis, 267
23.10 k Amostras Independentes,
uma varivel, 270
23.11 k Amostras Independentes,

- xii -
SUMRIO
23.5 Uma Amostra: k variveis, 267
23.6 Duas Amostras Independentes: uma
k variveis, 270
23.12 k Amostras Relacionadas, 271
varivel (Dados Categricos), 268 23.13 Distribuio de Probabilidades, 271
23.7 Duas Amostras Independentes: uma 23.14 Estimao de Parmetros, 272
varivel (Dados Ordenativos), 268
23.8 Duas Amostras Independentes,
k variveis (dados numricos), 269

CAPTULO 24 Aplicativos Introduzidos no BioEstat 4.0 . 273
24.2 Anlise de Conglomerados, 273 24.10 Teste t, Duas Amostras
24.3 Anlise Discriminante, 276 Independentes, Resumo, 290
24.4 Correlao Cannica, 279 24.11 Teste Z, Duas Amostras
24.5 Cox: Risco Proporcional, 282 Independentes, Resumo, 291
24.6 Ponto de Corte, 285 24.12 Teste t, Duas Amostras
24.7 Reamostragem: Bootstrap, 287 Relacionadas, Resumo, 292
24.8 Teste t, uma Amostra 24.13 Correlao Intraclasse, 293
Resumo Amostral, 288 24.14 Diagrama IC (95% e 99%), 294
24.9 Teste Z, Uma Amostra 24.15 Diagrama Pontual, 297
Resumo Amostral, 289 24.16 Pirmide Populacional, 298
24.17 Aumento do Tamanho Amostral, 302
Glossrio . 303

Referncias Bibliogrficas . 313

ndice . 319

- 1 -
CAPTULO 1
USANDO O BIOESTAT

1.1 REQUERIMENTOS DE SISTEMA
O BioEstat 5.0 requer o sistema operacional Microsoft Windows XP ou posterior e
um processador compatvel com o padro Intel Pentium com no mnimo 128MB de
memria RAM.

1.2 INSTALANDO O BIOESTAT
a) Coloque o CD-ROM do BioEstat no drive apropriado;
b) O programa de instalao deve inicializar aps alguns instantes. Caso isso no
ocorra, clique no boto Iniciar, em seguida escolha Executar e digite:
D:\SETUP.EXE, onde D a letra do drive apropriado;
c) Aps o programa de instalao inicializar, siga as instrues contidas na tela;
d) Quando a instalao estiver terminada, voc pode rodar o BioEstat clicando em
Iniciar, Programas, BioEstat 5.0 e, por fim, ao lado, em BioEstat 5.0.

1.3 EXPRESSO DE CASAS DECIMAIS
No BioEstat, para que seja mantida a compatibilidade com outros softwares e
acompanhando a norma aceita internacionalmente nas calculadoras eletrnicas, todos
os valores que possuam casas decimais devem ser grafados usando o ponto decimal.
A vrgula, portanto, no usada no BioEstat como indicador da separao entre a
parte inteira e a decimal, conforme os exemplos abaixo:

VALOR DESEJADO
GRAFIA
CORRETA
GRAFIA
INCORRETA

Um e meio. 1.5

1,5

Dois inteiros e 75 centsimos. 2.75

2,75

Cinco mil e um centsimo. 5000.01

5000,01

- 2 -
CAPTULO 1 - INTRODUO
Podero ser observadas pequenas divergncias de resultados quando comparados a
outros pacotes desse gnero. Essas diferenas, porventura detectadas, podem estar
relacionadas ao emprego de distintos algoritmos.

Sugestes para melhoria do pacote e possveis erros encontrados durante o seu uso
sero bem recebidos pelos autores. Essas modificaes tambm podero ser inseridas
em futuras verses.

J. Mrcio C. Ayres
MPEG/CNPq
Wildlife Conservation Society NY
Belm, Par, Maio de 1998.

AGRADECIMENTO (Verso 1.0)

Os autores agradecem a colaborao dos alunos do curso de mestrado em Doenas
Tropicais da Universidade Federal do Par (UFPA) e s seguintes pessoas: Giorgini
Augusto Venturieri (UFPA), Horcio Schneider (UFPA), Jos Mrcio C. Ayres
(MPEG/CNPq, Wildlife Conservation Society), Jos Maria de Azevedo Barbosa
(Academia Paraense de Letras), Deborah Magalhes Lima (UFPA), Paulo A. Otto
(Universidade de So Paulo), Victoria J. Isaac (UFPA), William D. Hamilton (Oxford
e Royal Society-UK).
Ao Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico CNPq/MCT
Sociedade Civil Mamirau, pela publicao desta verso.
Em especial gostaramos de reconhecer a ajuda no perodo da elaborao do BioEstat,
proporcionada por Iza do Amaral Corra Ayres.

- 3 -
CAPTULO 1 INTRODUO
1.2 REQUERIMENTOS DE SISTEMA
O BioEstat requer o sistema operacional Microsoft Windows 95 ou posterior e um PC
486 ou superior com no mnimo 8 MB de RAM.

1.3 INSTALANDO O BIOESTAT
a) Coloque o CD-ROM do BioEstat no drive apropriado;
b) O programa de instalao deve inicializar aps alguns instantes. Caso isso no
ocorra, clique no boto Iniciar, em seguida escolha Executar e digite:
D:\SETUP.EXE, onde D a letra do drive apropriado;
c) Aps o programa de instalao inicializar, siga as instrues contidas na tela;
d) Quando a instalao estiver terminada, voc pode rodar o BioEstat clicando em
Iniciar, Programas, BioEstat 4.0 e, por fim, ao lado, em BioEstat 4.0.

1.4 EXPRESSO DE CASAS DECIMAIS
No BioEstat, para que seja mantida a compatibilidade com outros softwares e
acompanhando a norma aceita internacionalmente nas calculadoras eletrnicas, todos
os valores que possuam casas decimais devem ser grafados usando o ponto decimal.
A vrgula, portanto, no usada no BioEstat como indicador da separao entre a
parte inteira e a decimal, conforme os exemplos abaixo:

VALOR DESEJADO
GRAFIA
CORRETA
GRAFIA
INCORRETA

Um e meio. 1.5

1,5

Dois inteiros e 75 centsimos. 2.75

2,75

Cinco mil e um centsimo. 5000.01

5000,01

1.5 BIOESTAT VERSO 2.0: BELM, PAR, MAIO DE 2000
A verso 2.0 do BioEstat mantm e aprimora os recursos da verso anterior. Foram
acrescentados novos testes, vrios grficos e tabelas de freqncia. Resumidamente,
h:

a) Captulo 3 - Amostragem: foi adicionada a amostragem aleatria de escores
introduzidos no grid geral do BioEstat;

b) Captulo 4 - Anlise Multivariada: foram acrescentados dois testes de
regresso: Linear mltipla e Logstica mltipla;

c) Captulo 5 - Anlise de Sobrevivncia: foram introduzidos os testes de Cox-
Mantel, Gehan (Wilcoxon generalizado) e Mantel-Haenszel;

d) Captulo 6 - Anlise de Varincia: no teste de Kruskal-Wallis acrescentaram-
se os valores de R
i
(i = 1, 2, 3, ... , t);

e) Captulo 8 - Distribuio de Probabilidades: foram includos o teste de
probabilidade condicional Sensibilidade/Especificidade e as distribuies F, do
Qui-Quadrado, t de Student e Z, com as respectivas curvas;

- 4 -
f) Captulo 9 - Uma Amostra: foi adicionado o teste de Poisson. O teste de
Kolmogorov-Smirnov foi desdobrado em dois modelos: o modelo K S, que
necessita do conhecimento da mdia e do desvio padro do universo, e o modelo
Lilliefors, o qual dispensa esses parmetros;

g) Captulo 10 - Duas Amostras Independentes: foram adicionados os testes:
Coeficientes de Variao, Taxas de Incidncia e Teste de Poisson. O Teste Z foi
revisto;

h) Captulo 12 - Estatstica Descritiva: foram introduzidos o primeiro e o terceiro
quartis;

i) Captulo 14 - Normalidade: foi acrescido este captulo, que dispe de vrios
testes;

j) Captulo 15 - Qui-Quadrado e Teste G : como se percebe pelo enunciado do
captulo, deu-se, tambm, destaque ao Teste G, inclusive com a introduo do
Teste G de Homogeneidade (aderncia);

k) Captulo 16 - Regresso: foram acrescidos os testes: Regresso Logstica
(simples e mltipla), Polinomial (quadrtica, cbica e qurtica) e Anlise de
Resduos;

l) Captulo 18 - Transformao: a Transformao Ordinal agora pode ser
alfabtica ou numrica, crescente ou decrescente, podendo-se efetuar a ordenao
de vrias colunas, tomando por base a primeira selecionada. Pode-se, ainda,
calcular os percentuais de escores brutos;

m) Captulo 19 - Grficos: este captulo apresenta vrios grficos e o diagrama
Caule-e-folha; incluiu-se, ainda, a gerao de Tabelas de Freqncia.

Sobre o total de 100 testes contidos na verso 1.0 foram acrescentados mais 39,
perfazendo agora 139 programas.

AGRADECIMENTO (Verso 2.0)

Os autores reiteram os agradecimentos quelas pessoas j referidas na Verso 1.0 do
BioEstat, estendendo-os a Ana Rita Pereira Alves, Bernardo Beiguelman, Ceclia
Banhara Marigo, Elon Lages Lima, J. C. Voltolini, Jeffrey Shaw, Lucimar Macedo
Rodrigues, Luiz Claudio Marigo, Maria Aparecida Pion Abuabara, Miguel Petrere Jr.,
Oswaldo Frota-Pessoa, Renata Gomes G. Oliveira, Srgio Cacela Alves e Sdia
Callegari Jacques, pelas sugestes e colaboraes oportunas oferecidas, e, tambm, a
Suely Fraiha, uma das primeiras pessoas a incentivar a elaborao do CD-ROM que
acompanha este manual.

- 5 -
CAPTULO 1 INTRODUO
1.6 BIOESTAT VERSO 3.0: BELM, PAR, MAIO DE 2003
A verso 3.0 do BioEstat mantm e aprimora os recursos da verso anterior. Foram
acrescentados novos testes e alterados alguns captulos como sero vistos a seguir:

a) Captulo 4 - Anlise Multivariada. Este captulo foi complementado com a
exibio de grficos em alguns testes. Os aplicativos sobre Regresso Linear
Mltipla e Logstica Mltipla foram transferidos para o Captulo 18;

b) Captulo 5 - Anlise de Sobrevivncia. Foi implementada a exibio de
grficos para alguns testes, como Atuarial e Kaplan-Meyer;

c) Captulo 6 - Anlise de Varincia. Acrescentou-se o teste de Tukey e o de
Dunnet (ANOVA, um critrio) e as comparaes pelo mtodo de Dunn foram
especificadas para Anlise de Kruskal- Wallis;

d) Captulo 7 - Bootstrap. Este tema foi introduzido com 7 aplicativos;

e) Captulo 8 - Correlao. Foi introduzido aplicativo sobre Matriz de
Correlao. Alguns grficos foram includos. O aplicativo sobre Vrias
Correlaes foi transferido para o Captulo 15 sobre Meta-Anlise;

f) Captulo 9 - Distribuio de Probabilidades. Adicionou-se o aplicativo sobre
Curva ROC (Receiver Operating Characteristic Curve).

g) Captulo 10 - Uma Amostra. O teste de Kolmogorov-Smirnov, modelo
Lilliefors, tambm j pode ser efetuado para vrias amostras, de modo
simultneo, com resultados independentes para cada uma;

h) Captulo 11 - Duas Amostras Independentes. O teste t de Student foi
desdobrado em dois aplicativos: para dados amostrais e resumo amostral;

i) Captulo 14 - Estimao de parmetros. Foi introduzida a sada grfica para o
teste de Schumacher-Eschmeyer;

j) Captulo 15 Meta-Anlise. Este tema foi introduzido com 11 aplicativos e
grficos tipo Forest Plot;

k) Captulo 16 - Normalidade. Os testes DAgostino, DAgostino-Pearson,
Kolmogorov-Smirnov (modelo Lilliefors) e Shapiro-Wilk tambm podem ser
efetuados para vrias amostras, de modo simultneo, com resultados
independentes para cada uma. Foi incorporada a sada grfica ao teste de Valores
Extremos;

l) Captulo 17 - Qui-Quadrado . Os testes que implicavam em vrias amostras
sobre o mesmo assunto foram transferidos para o captulo sobre Meta-Anlise;

- 6 -
m) Captulo 18 - Regresso. O teste de Homogeneidade agora faz parte integrante
do captulo Meta-Anlise, com a denominao de Regresso (Bw) para k
amostras. Foi incorporada a sada grfica para Anlise de Resduos e Ajustamento
de Curvas;

n) Captulo 19 - Tamanho das Amostras. O teste do Qui-Quadrado agora estima o
tamanho das amostras, tanto para testes de aderncia quanto para os de
independncia;

o) Captulo 21 - Grficos e Tabela. Foi introduzido o grfico Polar. A Tabela de
Freqncia e o Histograma foram aprimorados para permitir maior flexibilidade
na configurao das classes e respectivos limites.

O total de aplicativos no BioEstat 3.0 atinge, agora, 169 programas.

1.7 BIOESTAT VERSO 4.0: BELM, PAR, DEZEMBRO DE 2005

A verso 4.0 do BioEstat caracteriza-se pela incluso do Captulo 24 o qual contm
16 novos aplicativos, acrescidos de outros distribudos em diferentes Captulos,
totalizando cerca de 189 mtodos computacionais aplicados s cincias biomdicas,
como so exemplos: Anlise de Conglomerados, Anlise Discriminante, Correlao
Cannica, Cox (Risco Proporcional), Ponto de Corte, Reamostragem (bootstrap),
Aumento do Tamanho da Amostra, Testes de Hiptese para Resumos Amostrais,
Correlao Intraclasse e Diagramas IC (95% e 99%), Pontual e Pirmide
Populacional.

AGRADECIMENTO (Verses 3.0 e 4.0)

Os autores agradecem a colaborao de Alberto Cargnelutti Filho, Ana Rita Pereira
Alves, Antonio Carlos Simes Pio, Edson Elias Andrade Berbary, Fbio Pereira
Alves, Fernanda Sagica, Giorgini Augusto Venturieri, Gustavo A. B. da Fonseca,
Helder Lima de Queiroz, Israel Roisenberg, Jos Maria Cardoso, Jos Slvio Govone,
Jlio Cesar Voltolini, Luiz Claudio Marigo, Marcos Porpino de Oliveira, Maria
Aparecida Pion Abuabara, Miguel Petrere Jr., Roberto B. Cavalcanti, Russel A.
Mittermeier, Sdia M. Callegari Jacques e a todos aqueles que, direta ou
indiretamente, contriburam para o aperfeioamento desta edio do BioEstat.
Sociedade Civil Mamirau e Conservation Internacional (C.I.), pela publicao
do BioEstat, verso 3.0.
Professora Jussara Moretto Martinelli, pelo seu labor na reviso do BioEstat, verso
4.0, e pela sua colaborao no aplicativo Correlao Cannica.
Renata Galcio Oliveira, pela sua eficincia na distribuio do BioEstat, em todos
os recantos do nosso pas.
Ao jornalista Antonio Srgio Pimenta Quinder, pela reviso deste texto.
.

- 7 -
CAPTULO 2
USANDO O BIOESTAT

2.1 INTRODUO
Para usar o BioEstat preciso entender alguns termos bsicos do programa e do
padro Microsoft Windows 98/2000/NT/XP:

Menu superior
Barra de
ferramentas
Grid geral
de entrada
de dados
Barra de
status
Tela de
resultados
Figura 2.1
Janela do
BioEstat.
Figura 2.2
Barra de ferramentas
Novo grid
Abrir
Salvar
Imprimir
Recortar
Copiar
Colar
Aumentar
casas
decimais
Diminuir
casas
decimais
Aumentar
largura da
coluna
Diminuir
largura da
coluna
Limpar tudo
Localizar
Lista dos
testes
estatsticos
mais
comuns
Ajuda

- 8 -
CAPTULO 2 USANDO O BIOESTAT

2.2 ENTRANDO COM OS DADOS
Para entrar com os dados no grid geral, clique com o mouse na clula desejada e entre
com o valor ou texto, se for o caso, passando para outra clula com as setas
direcionais e inserindo o prximo dado, e assim por diante.

A denominao de uma coluna pode ser efetuada de uma das seguintes maneiras:
a) Pressione a tecla F2, preencha o nome desejado na caixa de texto e pressione a
tecla Enter;
b) Clique em Configurar no menu superior e, a seguir, na opo Nome da coluna,
preencha a caixa de texto com o nome desejado e pressione a tecla Enter.

Se h interesse em copiar os dados do grid, adote as seguintes condutas:
a) Clique em uma das clulas j preenchidas e, com o boto pressionado, arraste o
mouse sobre os dados que deseje copiar;
b) Clique no boto Copiar da barra de ferramentas ou pressione Editar do menu
superior, clicando em Copiar ou utilizando as teclas Ctrl + C.

Para recortar os dados do grid adote os seguintes procedimentos:
a) Clique em uma das clulas j preenchidas e, com o boto pressionado, arraste o
mouse sobre os dados que deseje recortar;
b) Clique no boto Recortar da barra de ferramentas ou pressione Editar do menu
superior, clicando em Recortar ou pressione as teclas Ctrl + X.

Quando for necessrio colar os dados, adote as seguintes condutas:
a) Copie ou recorte os dados que deseje colar;
b) Clique na clula desejada e pressione o boto Colar na barra de ferramentas, ou
em Colar do menu Editar ou, ainda, apertar Ctrl + V.

Para localizar um valor ou um texto do grid geral, adote os seguintes procedimentos:
a) Clique no boto Localizar na barra de ferramentas ou a opo Localizar no menu
Editar ou, ainda, pressione as teclas Ctrl + L, quando surgir a seguinte tela:

b) Preencha a caixa de texto com a palavra ou o valor a ser localizado, pressione em
Localizar prxima;
c) Aps fechar-se a janela Localizar, pode-se repetir a ltima busca utilizando a
tecla F3 ou a opo Localizar prxima do menu Editar.

Caso queira, pode-se apagar todos os dados presentes no grid clicando no boto
Limpar tudo da barra de ferramentas ou na opo Limpar tudo do menu Editar.
Figura 2.3
Localizar

- 9 -
2.3 SALVANDO OS DADOS
A salva dos dados no BioEstat pode ser efetuada no grid geral a maioria e, em
alguns casos, em grids especficos.

2.3.1 DO GRID GERAL (Matriz de entrada de dados)
Quando for necessrio salvar os dados, siga as seguintes instrues:
a) Clique na opo Salvar (tecla Ctrl + B) no menu Arquivo ou pressione o boto
Salvar na barra de ferramentas;
b) Caso seja a primeira vez que esteja salvando os dados, entre com o nome do
arquivo desejado na caixa de texto e, em seguida, pressione o boto Salvar.

Caso deseje salvar um arquivo com outro nome, siga o seguinte procedimento:
a) Clique na opo Salvar Como no menu Arquivo;
b) Preencha a caixa de texto com o nome do arquivo desejado e, em seguida,
pressione o boto Salvar.

possvel tambm exportar os dados para o formato CSV (delimitado por vrgula)
que pode ser lido por diversos outros aplicativos, tal como o Microsoft Excel. Para
exportar, siga as seguintes condutas:
a) Clique na opo Exportar do menu Arquivo;
b) Preencha a caixa de texto com o nome do arquivo desejado e, em seguida,
pressione o boto Salvar.

2.3.2 DE GRIDS ESPECFICOS
Em alguns testes o BioEstat apresenta grids prprios, a saber:
a) Teste de Cox-Mantel;
b) Teste de Gehan (Wilcoxon generalizado);
c) ANOVA Fatorial: a x b;
d) ANOVA Fatorial: a x b x c;
e) Correlao: Teste de homogeneidade para vrios valores de r;
f) Qui-Quadrado: Homogeneidade (aderncia);
g) Teste G de Homogeneidade (aderncia).

Clique no menu Estatstica e escolha, conforme o caso, um dos testes acima
indicados. Aps introduzir os escores nas caixas de texto, como especificado na
Figura 2.4, digite em Nome do arquivo a designao que servir para identificar seus
dados.

Depois desses procedimentos, o nome do arquivo aparecer na lista dos itens salvos
na parte superior esquerda do respectivo grid com a denominao do teste em
questo. A Figura 2.4 mostra um exemplo do salvamento de um teste de Anlise de
Sobrevivncia teste de Gehan. Na lista daqueles que foram salvos aparecem dois
exemplos: Exemplo_5_6_1.Gehan e Exemplo_5_6_2.Gehan.

Para recuperar os dados, basta clicar no nome do item contido na lista, pressionando
o mouse, a seguir, em Executar para obter os resultados.

- 10 -

Na parte superior do grid consta o seguinte: Novo, Deletar, Salvar e Imprimir, que podem
ser utilizados pelo usurio, conforme o caso.

2.4 ABRINDO ARQUIVOS
Quando for necessrio abrir um arquivo, siga as seguintes instrues:
a) Clique na opo Abrir (tecla Ctrl + A) no menu Arquivo ou pressione o boto
Abrir na barra de ferramentas;
b) Selecione o arquivo desejado e pressione o boto Abrir.

Para abrir um arquivo que foi recentemente utilizado, clique no menu Arquivo e
selecione aquele desejado na parte inferior do menu.

O BioEstat contm os dados dos vrios exemplos encontrados neste manual; para
acess-los, siga os seguintes passos:
a) Clique na opo Abrir (tecla Ctrl + A) no menu Arquivo ou pressione o boto
Abrir na barra de ferramentas;
b) D um duplo clique na pasta Exemplos, que se encontra na lista de arquivos;
c) Selecione um dos vrios exemplos disponveis e pressione o boto Abrir.

O programa tambm permite importar dados do formato CSV (delimitado por vrgula)
e, para isso, siga as seguintes condutas:
a) Clique na opo Importar do menu Arquivo;
b) Selecione o arquivo desejado e pressione o boto Abrir.

Figura 2.4
Salvando os
dados de um
grid espec-
fico.

- 11 -
2.5 IMPRIMINDO
Para imprimir dados, siga os seguintes passos:
a) Clique na opo Imprimir (Ctrl + P) do menu Arquivo ou no boto Imprimir da
barra de ferramentas;
b) Escolha se deseja imprimir o ttulo ou no, o nmero de cpias e a orientao da
pgina, sendo que a opo Automtica utiliza a orientao mais adequada;
c) Caso seja necessrio, configure a impresso apertando no boto Configuraes
ou atravs da opo Configurar impresso do menu Arquivo.
d) Quando esses procedimentos estiverem definidos, pressione o boto Imprimir.

2.6 ESCOLHENDO O TESTE
Quando o usurio desejar escolher um teste estatstico que seja adequado para os seus
dados, siga, a ttulo de sugesto, os seguintes procedimentos:
a) Pressione Sugestes no menu superior;
b) Clique na clula correspondente ao nmero de amostras do seu trabalho: uma
amostra, duas amostras independentes, duas amostras pareadas, k amostras
independentes ou k amostras relacionadas;
c) Clique na clula relacionada com o nmero de variveis da(s) amostra(s): uma,
duas ou k variveis;
d) Clique na clula relativa ao tipo de dados amostrais: categricos, ordenativos ou
numricos, surgindo, nesse momento, na parte inferior da tela, exemplos desses
modelos de dados e, na coluna seguinte, os testes sugeridos pelo programa;
e) Ao passar o cursor sobre as sugestes do BioEstat, surgiro, na parte inferior da
tela, um resumo e a frmula estatstica do teste correspondente. Se julgar
adequado, pressione o teste desejado.

A qualquer momento possvel retornar coluna anterior pressionando o boto
correspondente: Dados, Variveis ou Amostras, conforme o caso ou, ainda, em Sair
para retornar ao grid geral.

2.7 EXECUTANDO O TESTE
O BioEstat dispe de 169 testes estatsticos; para execut-los, adote as seguintes
condutas:
a) Abra um dos arquivos de Exemplos do BioEstat ou digite seus prprios dados no
grid principal;
b) Clique no menu Estatsticas e escolha um teste dentre as diversas opes;
c) Na janela Seleo de Amostras:
i - Selecione as colunas a serem utilizadas no teste, clicando-as. Para selecionar
todas as colunas disponveis para o teste, aperte o boto >>;
ii - Caso queira remover alguma coluna que havia sido selecionada, d um duplo
clique nela mesma e, para remover todas as colunas selecionadas, pressione o
boto <<;
d) Quando as colunas desejadas estiverem selecionadas, clique no boto Executar
Estatstica.
Para tornar a executar o ltimo teste, clique na primeira opo do menu Estatsticas
ou pressione as teclas Ctrl + U.

- 12 -
Voc tambm pode acessar mais facilmente os testes estatsticos mais comuns
utilizando a lista dos mesmos na barra de ferramentas.

2.8 CONFIGURANDO O BIOESTAT
O menu Configurar apresenta uma srie de opes de configurao:
a) Aumentar Casas Decimais: aumenta o nmero de casas decimais visveis da
coluna atual, podendo tambm ser acessada atravs de seu boto na barra de
ferramentas;
b) Diminuir Casas Decimais: diminui o nmero de casas decimais visveis da
coluna atual. Esta opo pode tambm ser acessada atravs de seu boto na barra
de ferramentas;
c) Aumentar Largura: aumenta a largura da coluna atual. Tambm pode ser
acessada atravs do boto do mesmo nome na barra de ferramentas;
d) Diminuir Largura: diminui a largura da coluna atual. Ainda pode ser acessada
atravs do boto similar da barra de ferramentas;
e) Nome da coluna (F2): denomina uma coluna;
f) Barra de Ferramentas: habilita ou desabilita a barra de ferramentas;
g) Barra de Status: esconde ou torna visvel a barra de status.

2.9 OBTENDO AJUDA
Para obter ajuda enquanto estiver no BioEstat, aperte o boto Ajuda na barra de
ferramentas ou clique na opo Ajuda do BioEstat (tecla F1) no menu Ajuda.

- 9 -
Figura 2.1
Menu de
Amostragem.
CAPTULO 2
AMOSTRAGEM

2.1 INTRODUO
Amostragens ou sondagens so procedimentos de seleo de subconjuntos de
populaes as amostras , destinados ao conhecimento de uma ou vrias
caractersticas dos universos investigados. Quando se estuda uma populao por
sondagens, necessrio selecionar suas amostras representativas, a fim de que os
resultados obtidos possam ser inferidos para o conjunto objeto da investigao.
As amostragens dividem-se em dois grupos:
a) Amostragens probabilsticas:
i amostras aleatrias simples;
ii amostras sistemticas;
iii amostras estratificadas;
iv amostras por conglomerados;
v amostras aleatrias: dados do grid;
vi aumento do tamanho da amostra;
vii reamostragem Bootstrap.
b) Amostras no-probabilsticas:
i intencional;
ii por convenincia;
iii por cotas.

No BioEstat sero abordadas as amostragens probabilsticas, nas quais cada indivduo
tem uma chance conhecida, diferente de zero, de ser includo na amostra e o mtodo de
seleo deve ser compatvel com a probabilidade de cada unidade.
Algumas etapas devem ser observadas na seleo amostral:
a) Definio da populao-alvo;
b) Alistamento de todos os indivduos desse universo: 1, 2, 3, , n;
c) Determinao do tamanho da amostra;
d) Escolha do modelo de amostragem;
e) Seleo das unidades da populao.

2.1.1 INSTRUES
a) Dirigir o mouse para o menu superior e clicar em Estatstica;
b) Apontar o mouse em Amostragem, quando surgir a figura abaixo, comum para
todos os modelos de seleo amostral do BioEstat:

- 14 -
CAPTULO 3 AMOSTRAGEM
3.2 AMOSTRAS ALEATRIAS SIMPLES
So aquelas cujos indivduos foram obtidos ao acaso da populao, tendo cada
amostra a mesma chance de ser escolhida dentre todas aquelas possveis do mesmo
tamanho. Os termos aleatrio, randmico, casual e ao acaso so sinnimos. As
amostras aleatrias simples podem ser obtidas por sorteio, em tabelas de nmeros
aleatrios e por computao.

3.2.1 EXEMPLO
Para determinar a estatura mdia de uma populao de 400 alunos da segunda srie do
primeiro grau, tomou-se amostra aleatria de 50 estudantes, precedida da listagem
numrica de todos os discentes desse universo.

3.2.2 INSTRUES
a) Apontar o mouse em Aleatria, para escolha de um dos modelos: Com ou Sem
reposio.
b) Clicar o mouse em Sem reposio, modelo escolhido neste exemplo; preencher as
caixas de texto com os tamanhos da populao e da respectiva amostra,
pressionando, a seguir, o boto Executar.

3.3 AMOSTRAS SISTEMTICAS
Nestas amostras o primeiro elemento escolhido ao acaso e os demais, a partir dessa
unidade, so selecionados a intervalos sistemticos (k) previamente definidos at ser
atingido o nmero total de indivduos. Os intervalos so calculados pela razo:
k = tamanho da populao (N) / tamanho da amostra (n).
A primeira unidade amostral pode variar de 1 at o limite mximo do intervalo
sistemtico (k).

3.3.1 EXEMPLO
Do mesmo alunado do exemplo anterior, retirar amostra sistemtica de tamanho 40.

3.3.2 INSTRUES
a) Clicar o mouse em Sistemtica;
b) Preencher as caixas de texto com os tamanhos da populao e da respectiva
amostra, pressionando, a seguir, o boto Executar.
Figura 3.2
Amostragem
Aleatria
(sem
reposio).

- 15 -

3.4 AMOSTRAS ESTRATIFICADAS
Trata-se de amostras obtidas de subconjuntos de uma populao designados por
estratos ou grupos, sem superposio de unidades entre eles, retirando-se amostra
randmica de cada um. H maior homogeneidade dos elementos dentro de cada grupo
e maior diversidade entre os estratos, possibilitando maximizar as informaes sobre
todo o universo investigado. Deve-se definir cuidadosamente a quantidade de estratos,
os limites de cada um e o nmero de variveis a investigar.

3.4.1 EXEMPLO
A populao de uma cidade de 600 habitantes foi dividida em dois estratos: urbano e
rural, com a finalidade de se estudar a incidncia de malria em cada grupo de seus
residentes. O estrato urbano possui 400 habitantes e o rural, 200. O tamanho total da
amostra deve compreender 60 pessoas. Deve-se notar que o tamanho da amostra
retirada de cada subconjunto proporcional ao tamanho de cada estrato em relao ao
tamanho da populao.

3.4.2 INSTRUES
a) Clicar o mouse em Estratificada;
b) Preencher as caixas de texto com o nmero de estratos e o tamanho total da
amostra e o grid especfico com o nmero de indivduos em cada estrato,
pressionando, a seguir, o boto Executar (ver Figura 3.4).

3.5 AMOSTRAS POR CONGLOMERADOS
Caracterizam-se pelo fato de que os elementos simples destas amostras so obtidos de
unidades coletivas denominadas conglomerados ou clusters. Os conglomerados
apresentam acentuada similitude no que diz respeito variao de seus indivduos,
como so exemplos as colmeias, os blocos residenciais, as aldeias de um mesmo
grupo indgena etc. Por esse procedimento possvel a listagem de todos os clusters,
a escolha randmica de alguns, a relao completa das unidades simples daqueles j
sorteados e, finalmente, a obteno casual dos indivduos dos conglomerados
selecionados. A retirada da amostra pode ser efetuada em dois ou mais estgios:
duplo, triplo, mltiplo, conforme o caso.
Figura 3.3
Amostragem
sistemtica.

- 16 -

3.5.1 EXEMPLO
Calcular o peso mdio de estudantes da quinta srie do ensino fundamental das
escolas pblicas de um municpio. O total de estabelecimentos de ensino de 50
escolas (conglomerados do 1
o
estgio), cada uma com 10 turmas da quinta srie
(conglomerados do 2
o
estgio), e cada turma apresentando 40 alunos matriculados
(unidades simples, 3
o
estgio). Foram selecionadas 5, 4 e 8 unidades dos estgios 1
o
,
2
o
e 3
o
, respectivamente, constituindo, ao final, amostra de 160 discentes (5 x 4 x 8).

3.5.2 INSTRUES
a) Clicar o mouse em Conglomerados;
b) Preencher a caixa de texto com o nmero de estgios e o grid especfico com a
denominao de cada um, o nmero de unidades contidas nos respectivos clusters
e, por fim, a quantidade de unidades determinadas para sorteio em cada
conglomerado. Pressionar, em seguida, o boto Executar.
Figura 3.4
Amostragem
Estratificada.
Figura 3.5
Amostragem
por Conglo-
merados.
(parte dos re-
sultados)

- 17 -
3.6 AMOSTRA ALEATRIA DOS ESCORES DO GRID
Pode-se retirar amostras aleatrias de escores inseridos no grid geral do BioEstat.

3.6.1 EXEMPLO
Esto inseridos no grid 140 escores (Figura 3.6), referentes estatura de estudantes do
sexo masculino de idades compreendidas entre 16 e 18 anos, de uma escola de ensino
fundamental. Tendo em vista que os dados compreendem todos os alunos
matriculados nessa instituio, com as caractersticas referidas, esses escores
constituem, portanto, uma populao, com estatura mdia igual a 169.45 cm. Retirou-
se amostra aleatria desse conjunto para calcular a mdia amostral da varivel peso
no sentido de verificar se ela representativa do universo em questo.

3.6.2 INSTRUES
a) Introduzir os dados no grid padro do BioEstat, conforme a Figura 3.6;
b) Pressionar o mouse em Aleatria dos escores do grid;
c) Selecionar a coluna respectiva, a qual, neste exemplo, a de nmero 1;
d) Pressionar em Executar;
e) Informar na caixa de texto o tamanho da amostra desejada e que, no caso, foi
igual a 10, conforme demonstra a Figura 3.7;

Figura 3.6
Dados
parciais do
Exemplo
3.6.1.
Figura 3.7
Tamanho da
Amostra

- 18 -
f) Pressionar em OK, para resultados (Figura 3.8). Aparece, ainda, uma tela
indicando a coluna do grid onde ser inserida a amostra obtida.

Efetuando-se a estatstica descritiva dos escores amostrais, com o clculo da mdia e
do erro padro, e comparando-os com a mdia paramtrica, obtm-se:
Dados da amostra: X = 168.3;
x
s = 1.399;
Dado da populao: = 169.45;
Vis = ( - X ) = 169.45 168.3 = 1.15
Pode-se concluir que a mdia amostral ( X = 168.3) um estimador no enviesado
do parmetro ( =169.45), eis que o vis (1.15) inferior a um erro padro,
representado por (
x
s = 1.399).
A mdia amostral , assim, representativa do universo em questo.
Figura 3.8
A Coluna
Amostra
indica os
escores
selecionados
de maneira
aleatria

- 17 -
CAPTULO 3
ANLISE MULTIVARIADA

3.1 INTRODUO
A maioria dos testes estatsticos concernente ao exame de uma nica varivel, a qual
considerada importante na descrio ou no estudo analtico dos dados amostrais. Em
algumas situaes, porm, torna-se importante considerar a anlise de diversas
variveis aleatrias de modo simultneo, para atingir outros aspectos no abrangidos
por um exame mais simplificado. Embora se deva a Francis Galton (1886) as
primeiras anlises multivariadas, somente com o desenvolvimento dos computadores
foi possvel construir pacotes estatsticos com diferentes modelos de anlises
multivariadas, possibilitando seu uso em escala muito mais ampla. Do ponto de vista
matemtico, alm dos conhecimentos bsicos de lgebra, h necessidade de alguma
noo sobre matrizes algbricas, para a efetivao da anlise multivariada.

A atual verso do BioEstat (5.0) dispe dos seguintes testes:
a) Anlise de Conglomerados;
b) Anlise Discriminante;
c) Componentes Principais;
d) Correlao Cannica;
e) Distncia Multivariada (Euclidiana);
f) Distncia Multivariada (Penrose e Mahalanobis);
g) Teste de Bartlett (duas amostras);
h) Teste de Hotelling (uma amostra);
i) Teste de Mantel.

3.1.1 INSTRUES
a) Introduzir os dados no grid padro ou especfico, conforme o teste;
b) Dirigir o mouse para o menu superior e clicar em Estatstica;
c) Apontar o mouse em Anlise Multivariada, conforme demonstra a Figura 3.1:

3.2 ANLISE DE CONGLOMERADOS
O objetivo desta anlise agrupar os indivduos em conglomerados ou clusters. Os
conglomerados so identificados como grupos que compem a populao ou a
amostra que est sendo analisada. As unidades de um grupo apresentam muitas
Figura 3.1
Menu de
anlise
multivariada.

- 20 -
CAPTULO 4 ANLISE MULTIVARIADA
Trata-se, portanto, de um teste interpretativo, o qual consiste em examinar um grupo
de k variveis correlacionadas, transformando-as em outro conjunto de variveis no
correlacionadas e independentes, dispostas em combinaes lineares e em ordem
decrescente de importncia atravs de ndices designados de Z
p
, de tal maneira que a
varincia var(Z
1
)

varincia var(Z
2
)

varincia var(Z
3
)
., ,
varincia

var(Z
p
). Os
primeiros ndices so chamados de Componentes Principais, devendo-se dar maior
nfase queles que descrevem cerca de 80% ou mais da variao, os quais, em alguns
casos, esto representados pelo primeiro e segundo componentes. Os tamanhos das
amostras podem ser iguais ou desiguais.

4.2.1 EXEMPLO
Foram examinadas 40 andorinhas, mensurando-se 5 variveis: X
1
, X
2
, X
3
, X
4
e X
5
,
representando o comprimento total, comprimento das asas, comprimento do bico,
permetro ceflico e comprimento do esterno, respectivamente. Determinar os
componentes principais dentre essas variveis, cujos valores foram inseridos no grid
geral como demonstrado a seguir:

4.2.2 INSTRUES
a) Pressionar o mouse em Componente Principal;
b) Selecionar as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, para obter os resultados (ver Figura 4.3).

Figura 4.2
Dados
parciais do
Exemplo
4.2.1
Figura 4.3
Resultados do
Exemplo 4.2.1
Os resultados
demonstram
que os ndi-
ces 1 e 2
representam
83% da
variao total
(73% + 10%)
dos indivduos
testados,
constituindo
os Compo-
nentes Princi-
pais nesse
Exemplo.

- 21 -
d) Pressionar em Grfico, na barra da Figura 4.3, para visualizar a seguinte imagem:

4.3 DISTNCIA MULTIVARIADA (Euclidiana)
A distncia Euclidiana abrange amostra com n indivduos de espcies ou sub-
espcies diferentes, cada um apresentando p variveis X
1
, X
2
, , X
p
mensuradas
a nvel intervalar ou de razes, procurando-se determinar a distncia, sob o aspecto
evolutivo, entre os indivduos estudados. Os tamanhos das amostras podem ser iguais
ou desiguais.

4.3.1 EXEMPLO (hipottico)
Procurou-se verificar a distncia Euclidiana de 5 espcies de felinos, medindo-se: X
1

= distncia entre o primeiro molar e o ltimo molar; X
2
= comprimento do canino; X
3

= extenso da mandbula; X
4
= distncia entre o primeiro pr-molar e o ltimo molar;
X
5
= altura mandibular. Os dados foram inseridos no grid geral, de tal modo que as
variveis mensuradas correspondem s colunas X
1
,

X
2
,

X
3
,

X
4
e

X
5
,

e as espcies
de felinos so correlativas s linhas: 1 = espcie A; 2 = espcie B; 3 = espcie C;
4 = espcie D; e 5 = espcie E.

Figura 4.5
Dados do
Exemplo
4.3.1.
Figura 4.4
Grfico do
Exemplo
4.2.1.

- 22 -
4.3.2 INSTRUES
a) Pressionar o mouse em Distncia Multivariada (Euclidiana);
c) Clicar em Executar o Teste para obter os resultados (ver Figura 4.5).

d) Pressionar em Grfico barra da Fig. 4.6 para visualizar a seguinte imagem:

4.4 DISTNCIA MULTIVARIADA (Penrose e Mahalanobis)
O mtodo de Penrose testa as distncias multivariadas de duas ou mais populaes,
levando em considerao, para o clculo, os dados sobre mdias, varincias e
covarincias. O teste de Mahalanobis considera ainda as correlaes entre as
variveis, alm dos valores numricos utilizados no procedimento de Penrose. Os
tamanhos das amostras podem ser iguais ou desiguais.

Figura 4.6
Resultados
do Exemplo
4.3.1.
A menor
distncia foi
observada
entre as
espcies A e
E e a maior,
entre as
espcies
B e C.
Figura 4.7
Grfico do
Exemplo
4.3.1.

- 23 -
4.4.1 EXEMPLO
O exemplo diz respeito a um trabalho (hipottico) realizado por um antroplogo sobre
as medidas de 4 variveis cranianas do homem em diferentes grupos indgenas: Grupo
A = variveis A
1
, A
2
, A
3
, A
4
; Grupo B = variveis B
1
, B
2
, B
3
, B
4
; Grupo C = variveis
C
1
, C
2
, C
3
, C
4
; Grupo D = variveis D
1
, D
2
, D
3
, D
4
; Grupo E = variveis E
1
, E
2
, E
3
, E
4
,
E
5
. Os dados so introduzidos no grid geral abrangendo 20 colunas e 30 linhas, estas
representando o nmero de indivduos mensurados, conforme demonstrado na Figura
4.7.

4.4.2 INSTRUES
a) Pressionar o mouse em Distncia Multivariada (Penrose/Mahalanobis);
c) Clicar em Executar o Teste, informando, a seguir, o nmero de amostras
introduzidas:
d) Clicar em OK, para os resultados:

Figura 4.8
Dados
parciais do
Exemplo
4.4.1.
Figura 4.9
Nmero de
amostras
(Exemplo
4.4.1).

- 24 -
Figura 4.10
Resultado do
Exemplo 4.4.1.
Observa-se,
apesar das
diferenas dos
valores em cada
um dos testes,
que houve
concordncia
nos resultados:
a maior distn-
cia foi obser-
vada entre as
amostras A e E,
e a menor,
entre as
amostras A e B.
Figura 4.11
Grfico do
Exemplo
4.4.1.

d) Pressionar em Grfico barra da Fig. 4.10 para visualizar a seguinte imagem

4.5 TESTE DE HOTELLING
Destina-se a comparar duas amostras multivariadas, cada uma com o mesmo nmero
de variveis duas ou mais , baseando-se na generalizao do Teste t de Student,
mais precisamente no quadrado dessa estatstica, sendo representado simbolicamente
por T
2
. A probabilidade do teste p-valor calculada pela estatstica F resultante
da transformao de T
2
, conforme demonstrado no captulo sobre Frmulas
Estatsticas. Os dados devem ser mensurados a nvel intervalar ou de razes.

- 25 -
4.5.1 EXEMPLO
Duas amostras foram selecionadas, estudando-se 5 variveis de cada uma, cujos dados
foram introduzidos no grid geral, correspondendo s variveis X
i
primeira amostra,
enquanto as variveis Y
i
representam a segunda, num total de 10 colunas (variveis) e
28 linhas, estas representando o nmero de indivduos sorteados para o teste.

4.5.2 INSTRUES
a) Pressionar o mouse em Teste de Hotelling;
c) Clicar em Executar o Teste, para resultados:

4.6 TESTE DE BARTLETT
O teste de Bartlett compara trs ou mais amostras m multivariadas, obtendo-se um
coeficiente de mxima-verossimilhana simbolizado por (phi), cuja significncia
estatstica calculada pelo Qui-Quadrado com p (m 1) graus de liberdade.
Os tamanhos das amostras podem ser iguais ou desiguais.

4.6.1 EXEMPLO
Os mesmos dados de exemplo da Distncia Multivariada (Penrose e Mahalanobis)
constituem o exemplo para este teste, compreendendo, pois, 5 amostras, cada uma
com 4 variveis (ver Figura 4.6).

4.6.2 INSTRUES
a) Pressionar o mouse em Teste de Bartlett;
Figura 4.12
Viso
parcial dos
dados do
Exemplo
4.5.1.
Figura 4.13
Resultados
do Exemplo
4.5.1.
No h
diferena
estatistica-
mente signifi-
cante entre
as duas
amostras,
p = 0.5210.

- 26 -
c) Clicar em Executar o Teste, informando, a seguir, o nmero de amostras
introduzidas:

d) Clicar em OK, para resultados:

Figura 4.14
Nmero de
amostras
(Exemplo
4.6.1).
Figura 4.15
Resultados do
Exemplo
4.6.1.
Os resultados
apresentam
um valor de
Phi elevado
(61.3095),
sendo
estatistica-
mente muito
significativo,
eis que o
valor de p
menor que
0.0001.

- 39 -
CAPTULO 4

ANLISE DE SOBREVIVNCIA

4.1 INTRODUO
A anlise de sobrevivncia vem sendo enfatizada nos estudos biomtricos e destina-se
a calcular a probabilidade de ocorrncia de eventos ao longo de certo perodo, o qual
dividido em vrios intervalos de tempo. Os eventos podem ser de diversas naturezas,
tais como: perodos de remisso de uma doena, tempo de sobrevivncia de indivduos
acometidos por neoplasia, estudos epidemiolgicos, durao de matrimnios, efeitos de
drogas e outros.

Um fato a destacar nas anlises de sobrevivncia o de que nem todos os elementos
selecionados para o estudo atendem ao seguimento ao longo do perodo previamente
estabelecido, podendo, a qualquer momento, abandon-lo por motivos diversos. Esses
indivduos recebem a designao geral de censurados, os quais, de acordo com o teste
escolhido, devem ou no ser registrados em cada tempo t no qual o perodo total foi
dividido.

O BioEstat oferece os seguintes modelos de Anlise de Sobrevivncia:
a) Atuarial;
b) Cox-Mantel;
c) Cox: Modelo de Risco Proporcional;
d) Kaplan-Meier;
e) Log-Rank Test;
f) Gehan (Wilcoxon generalizado);
g) Mantel-Haenszel;
h) Pirmide Populacional.

4.1.1 INSTRUES
a) Introduzir os dados no grid padro do BioEstat;
c) Apontar o mouse em Anlise de Sobrevivncia, conforme demonstra a Figura 4.1
Figura 4.1
Menu
Anlise de
Sobrevivncia.

- 28 -
CAPTULO 5 ANLISE DE SOBREVIVNCIA
meses ou anos, registrando-se na 1
a
coluna o nmero de indivduos vivos, na 2
a
,

o de
ocorrncias remisses, recidivas, mortes etc. e na 3
a
, o de censurados 0, 1, 2,
, n. Este modelo de largo uso em instituies securitrias.

5.2.1 EXEMPLO
Um estudo foi efetuado em 87 pessoas operadas de neoplasia do estmago, as quais
foram observadas ao longo de cinco anos, com intervalos t anuais. Os dados foram
introduzidos no grid geral, registrando-se nas colunas 1, 2 e 3 os vivos, as ocorrncias
e os censurados, respectivamente. As linhas correspondem aos intervalos anuais: 1, 2,
3, 4 e 5 anos.

5.2.2 INSTRUES
a) Pressionar o mouse em Atuarial;
c) Clicar em Executar o Teste, informando caixa de texto ao lado da Fig. 5.2 a
unidade de tempo representada pelos nmeros 1 a 5 (ano, neste exemplo);
d) Pressionar OK, para resultados.

Ao final de 5 anos, a chance de sobrevivncia bem exgua (0.0174), aumentando a
proporo de risco a cada intervalo t. A expectativa de vida anual de 2.82.

Pressionando-se em Grfico, na barra superior desta figura, escolhe-se uma das
opes: Freqncia, Proporo ou Chance acumulada de sobrevivncia com IC (95).
Neste exemplo escolheu-se a terceira opo, surgindo o grfico da Figura 5.4.

Figura 5.2
Dados do
Exemplo
5.2.1.
Figura 5.3
Resultados
do Exemplo
5 2 1

- 29 -

5.3 KAPLAN-MEIER
Este procedimento semelhante ao atuarial, porm o tempo aprazado menor, de dias
ou meses, e os intervalos no so, de modo obrigatrio, igualmente espaados,
obtendo-se, ainda, em cada tempo t, o intervalo de confiana (IC 95%) respectivo.

5.3.1 EXEMPLO
180 indivduos com patologia de alto risco de mortalidade foram submetidos a
tratamento com a droga A em altas doses. O perodo de observao foi de 6 meses,
com intervalos mensais de registro das observaes. Os dados foram introduzidos no
grid geral: as colunas 1 e 3 correspondem ao tempo t, aos indivduos vivos e aos
bitos, respectivamente, observando-se que os intervalos mensais no so constantes
como ocorre na anlise Atuarial (ver Figura 5.5).

Figura 5.5
Dados do
Exemplo
5.3.1.
Figura 5.4
Grfico do
Exemplo
5.2.1.

- 30 -
5.3.2 INSTRUES
a) Pressionar o mouse em Kaplan-Meier;
b) Selecionar as duas colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste para obter os resultados.

Probabilidade de sobrevivncia em cada perodo e a chance acumulada at o referido
tempo, com IC 95%.
Pressionando-se em Grfico, na barra superior da Figura 5.6, escolhe-se uma das
opes: Freqncia, Proporo ou Chance acumulada de sobrevivncia com IC (95).
Neste exemplo escolheu-se a primeira opo, surgindo o diagrama da Figura 5.7..

Figura 5.6
Resultados
do Exemplo
5.3.1:
Figura 5.7
Grfico do
Exemplo
5.3.1.

- 31 -
5.4 LOG-RANK TEST
Este teste de anlise de sobrevivncia permite comparar duas amostras, cujas
observaes foram efetuadas em perodos e intervalos idnticos.

5.4.1 EXEMPLO 1 (sem censurados, mtodo 1)
O tempo de recidiva ao alcoolismo foi observado em dois grupos:
a) Grupo A, indivduos com at 45 anos (n = 376);
b) Grupo B, com idade superior a 45 anos (n = 450).
O objetivo era verificar se a varivel idade influenciava a ocorrncia objeto da
investigao. O tempo de observao foi de 365 dias, dividido em intervalos
trimestrais, e contadas as ocorrncias. Os dados foram introduzidos no grid geral.

H
0
: o tempo de recidiva ao alcoolismo o mesmo nos dois grupos de pessoas: p
1
= p
2
;
H
1
: o tempo de recidiva ao alcoolismo dependente do grupo etrio dos indivduos:
p
1
p
2
;
Nvel de deciso: alfa = 0.05.

5.4.2 EXEMPLO 2 (sem censurados, mtodo 2)
Dados hipotticos foram coletados relativos aos tratamentos A e B. No grupo A foram
acompanhados 14 indivduos enquanto no grupo B, 33. Os dados esto dispostos na
Figura 5.9.

H
0
: no h diferena no tempo de sobrevivncia dos indivduos submetidos aos
tratamentos A e B: p
1
= p
2
;
H
1
: h diferena no tempo de sobrevivncia dos indivduos submetidos aos
1
p
2
;
Figura 5.8
Dados do
Exemplo
5.4.1 (sem
censurados).
Figura 5.9
Viso parcial
dos dados
do Exemplo
5.4.2

- 32 -
5.4.3 EXEMPLO 3 (com censurados)
Dados hipotticos de duas amostras sobre tempo de sobrevivncia de dois conjuntos
de indivduos submetidos a tratamentos diferentes: A, para um grupo e B, para o
outro, com seguimento ao longo de seis anos, correspondendo cada valor do grid ao
respectivo nmero de indivduos. Os indivduos dos Eventos A e B totalizaram 99 e
77, respectivamente.

H
0
: no h diferena no tempo de sobrevivncia dos indivduos submetidos aos
1
= p
2
;
H
1
: h diferena no tempo de sobrevivncia dos indivduos submetidos aos
1
p
2
;

5.4.4 INSTRUES
a) Pressionar o mouse em Log-Rank test, e escolha uma das duas opes: Sem
Censurados (Figuras 5.8 e 5.9) ou Com Censurados (Figura 5.10);
b) Selecionar, no grid geral, as colunas referentes s variveis conforme o caso;
c) Clicar em Executar o Teste, para obter os resultados.

A diferena no tempo de recidiva ao alcoolismo no foi significativa (p = 0.1564).

A diferena foi significativa (p=0.0102).
Figura 5.10
Dados do
Exemplo
5.4.3 (com
censurados).
Figura 5.12
Resultados
do Exemplo
5.4.2
Figura 5.11
Resultados
do Exemplo
5.4.1.

- 33 -

A diferena no foi significativa. (p=0.1845)

5.4.5 GRFICO DO EXEMPLO 5.4.1
a) Pressionar em Grfico na barra da Fig. 5.10, para visualizar a seguinte imagem:

O grfico desta anlise de sobrevivncia compatvel com o resultado do teste, o qual
no mostrou diferena significativa entre os dois tratamentos. As curvas so muito
semelhantes.

Figura 5.13
Resultados
do Exemplo
5.4.3.
Figura 5.14
Grfico do
Exemplo
5.4.1.

- 34 -


Figura 5.16
Grfico do
Exemplo
5.4.2.
Figura 5.15
Grfico do
Exemplo
5.4.2.

- 35 -
5.5 COX-MANTEL
Teste estatstico para duas amostras independentes com observaes censuradas.

Dois grupos de 6 mulheres com cncer mamrio foram tratados do seguinte modo: o
primeiro grupo recebeu quimioterapia e radioterapia, enquanto o outro nada recebeu
aps mastectomia total. Ao final de 3 anos, o tempo de remisso foi assinalado em
meses. As observaes censuradas esto assinaladas no grid especfico com o
sinal +.

H
0
: S
1
(t) = S
2
(t);
H
1
: S
1
(t) > S
2
(t);
Nvel de deciso: alfa = 0.05 (unilateral)

5.5.2 INSTRUES
a) Pressionar o mouse em Cox-Mantel;
b) Inserir os valores de cada grupo (A e B) no grid especfico, assinalando com o
caractere + precedendo os escores censurados;
c) Clicar em OK para obter os resultados, conforme disposto na Figura 5.17.

A diferena entre os tratamentos muito significativa (p = 0.0079), rejeitando-se a
hiptese de nulidade, constatando-se que o tempo de sobrevivncia foi maior no grupo
tratado com quimioterapia e radioterapia.

Figura 5.17
Grfico do
Exemplo
5.5.1.

- 36 -
5.6 GEHAN (WILCOXON GENERALIZADO)
Teste estatstico semelhante ao anterior para duas amostras independentes com
observaes censuradas.

Dois grupos de 6 mulheres com cncer mamrio foram tratados do seguinte modo: o
primeiro grupo recebeu quimioterapia e radioterapia, o outro nada recebeu aps
mastectomia total. Ao final de 3 anos, o tempo de remisso foi assinalado em meses.
As observaes censuradas esto assinaladas no grid especfico com o sinal +.

H
0
: S
1
(t) = S
2
(t);
H
1
: S
1
(t) > S
2
(t);
Nvel de deciso: alfa = 0.05 (unilateral)

5.6.2 INSTRUES
a) Pressionar o mouse em Gehan (Wilcoxon generalizado);
b) Inserir os valores de cada grupo, assinalando com + os escores censurados;
c) Clicar em OK para obter os resultados, conforme disposto na Figura 5.18.

A diferena entre os tratamentos muito significativa (p = 0.0085), rejeitando-se a
hiptese de nulidade, constatando-se que o tempo de sobrevivncia foi maior no
grupo tratado com quimioterapia e radioterapia.

5.7 MANTEL-HAENSZEL
O teste de Mantel-Haenszel se aplica para duas ou mais amostras cujos dados so
dispostos em n tabelas de contingncia 2 x 2.

Figura 5.18
Resultados
do Exemplo
5.6.1.

- 37 -
5.7.1 EXEMPLO
Efetuou-se levantamento de duas investigaes (Amostras A e B) em 865 mulheres
com idades compreendidas entre 40 e 50 anos, relativo associao entre neoplasia
cervical e positividade para HPV.

Amostra A: 490 mulheres
Neoplasia cervical Sem neoplasia

HPV+ 152 120

HPV -
108 110

Amostra B: 375 mulheres
Neoplasia cervical Sem neoplasia

HPV+ 143 111

HPV -
45 76

Essas tabelas foram introduzidas nas caixas de texto do teste de Mantel-Haenszel,
como sero vistas a seguir.

H
0
: no h associao entre neoplasia cervical e HPV positivo:
0
=
1
H
1
h associao entre neoplasia cervical e HPV positivo:
0

1

5.7.2 INSTRUES
a) Pressionar o mouse em Mantel-Haenszel;
b) Preencher as caixas de texto com os dados do Amostra A;
c) Clicar em Prxima Tabela e introduzir os dados do Amostra B;
d) Clicar em Executar, para obter os resultados.

Figura 5.19
Resultados
do Exemplo
5.7.1.

- 38 -
O teste foi muito significativo (p = 0.0013), demonstrando que a neoplasia cervical est
associada presena de HPV, rejeitando-se, portanto, a hiptese de nulidade. O Odds
Ratio calculado conjuntamente com o teste de Mantel-Haenszel, concluindo-se que as
mulheres com teste positivo para HPV tm mais de uma vez e meia a probabilidade de ter
cncer do colo uterino do que aquelas com teste negativo.

- 59 -
CAPTULO 5
ANLISE DE VARINCIA

5.1 INTRODUO
A Anlise de Varincia, introduzida por R. A. Fisher, compara a magnitude das
variaes de mais de duas amostras, decompondo a varincia total em duas partes:
a) entre as amostras, constituindo o chamado quadrado mdio dos tratamentos;
b) dentre cada tratamento, compondo o denominado quadrado mdio do erro
experimental.
c) O teste da anlise da varincia a razo entre esses quadrados mdios. Esta
anlise compreende dois grupos:

a) Testes paramtricos:
i ANOVA: um critrio;
ii ANOVA: dois critrios;
iii ANOVA: Fatorial (a x b) com replicao;
iv ANOVA: Fatorial (a x b x c) sem replicao.
b) Testes no-paramtricos:
i Teste de Friedman;
ii Teste de Kruskal-Wallis;
iii Teste Q de Cochran.

5.1.1 INSTRUES
a) Introduzir os dados no grid geral do BioEstat;
c) Apontar o mouse em Anlise de Varincia, conforme demonstra a Figura 5.1:

5.2 ANOVA: um critrio
A designao ANOVA deriva da expresso inglesa ANalysis Of VAriance,
chamando-se F-teste em homenagem a Fisher. Destina-se a comparar mais de duas
amostras cujos dados devem ser mensurados em escala intervalar ou de razes. A
designao um critrio pelo fato de se comparar somente as variaes entre os
Figura 5.1
Menu de
Anlise de
Varincia.

- 40 -
CAPTULO 6 ANLISE DE VARINCIA
tratamentos, cujo resultado traduzido no valor do F-teste, complementando-se com
o exame, a priori (Bonferroni) ou a posteriori (Tukey ou teste t de Student), das
diferenas entre as mdias amostrais. As amostras podem ser do mesmo tamanho ou
desiguais.
Quando o valor de F for significativo e a escolha do teste das diferenas entre as
mdias for o Bonferroni, deve-se escolher previamente o nvel alfa e, neste caso, o
aplicativo permite selecionar: 0.1, 0.05, 0.025, 0.01, 0.005, 0.001 ou 0.0005, j
indicados como testes bilaterais (/2). Assim, se a escolha for igual a 0.025,
significa 2 x 0.025.

6.2.1 EXEMPLO 1 (TUKEY)
Foi efetuada uma investigao em trs grupos de estudantes: o grupo A estava
constitudo por 6 alunos no-fumantes (NF); o segundo, por 6 discentes que
fumavam moderadamente em torno de 10 a 15 cigarros por dia (FM); e o terceiro,
por 5 estudantes que fumavam mais de 40 cigarros por dia (FI). Mediu-se a funo
pulmonar atravs do fluxo mdio expiratrio. Os dados obtidos esto no grid geral.

H
0
: o fumo no influencia a funo pulmonar medida pelo fluxo mdio expiratrio:

1
=
2
=
3
;
H
1
: o fumo influencia a funo pulmonar medida pelo fluxo mdio expiratrio,
havendo diferena, pelo menos, entre duas mdias:
1

2
etc.;

6.2.2 EXEMPLO 2 (DUNNETT)
Trs extratos de origem vegetal foram introduzidos em ces por via oral com a
finalidade de testar o possvel efeito sobre a presso arterial sistlica desses animais.
Os ces foram divididos em grupos de cinco animais, recebendo cada grupo um tipo
de extrato B, C ou D , alm de um grupo controle A injetado com placebo. Os
dados esto contidos no grid geral.

H
0
: a presso arterial sistlica no alterada pela introduo oral dos extratos
vegetais referidos no experimento:
1
=
2
=
3
=
4
;
H
1
: a administrao desses extratos produz alteraes na presso arterial sistlica
dos animais, havendo diferena entre a mdia do grupo controle com um dos
demais grupos submetidos ao experimento:
1

i
;
Figura 6.2
Dados do
Exemplo
6.2.1

- 41 -

6.2.3 INSTRUES
a) Pressionar o mouse em ANOVA: um critrio;
b) Selecionar as colunas referentes aos tratamentos do grid geral;
c) Clicar em Executar o Teste, surgindo a Figura 6.4 naqueles casos em que h
diferena estatisticamente significativa do F calculado (ver valor de p),
selecionando-se um dos testes sugeridos para a comparao das mdias
amostrais, os quais foram o de Tukey e o de Dunnett. Exemplos 6.2.1 e 6.2.2,
respectivamente.

d) Clicar em Executar para obter os resultados.

Figura 6.4
Tela de
seleo do
teste para
ANOVA: um
critrio,
Exemplo
6.2.1
Figura 6.5
Resultados
do Exemplo
6.2.1
(Tukey).
Figura 6.3
Dados do
Exemplo
6.2.2

- 42 -
Os valores obtidos rejeitam a hiptese de nulidade, aceitando-se, nesse exemplo, a
hiptese alternativa. O valor alfa escolhido a priori informa que a probabilidade
obtida na comparao entre as mdias pelo teste de Tukey deve ser igual ou inferior
a 0.01, para que a diferena seja estatisticamente significativa. O fluxo mdio
expiratrio menor entre fumantes (FM e FI), quando comparados com os no
fumantes (NF), no ocorrendo, contudo, diferena significativa entre os fumantes.

O F obtido altamente significativo (p < 0.0001). Pelo teste de Dunnett verifica-se
que os extratos B (2) e C (3) quando comparados com o Controle (Coluna 1)
aumentaram de maneira significativa a presso arterial sistlica dos animais
submetidos ao experimento (p < 0.01), enquanto o extrato D (4) no produziu
alteraes significativas na presso dos animais investigados (ns).

Para se obter os grficos desses resultados, seguir as instrues abaixo:

a) Pressionar, com o mouse, em Grfico (barra da Figura 6.5) surgindo a seguinte
imagem:

Figura 6.7
Resultados
do Exemplo
6.2.2
(Dunnett).
Figura 6.6
Tela de
seleo do
teste para
ANOVA: um
critrio,
Exemplo
6.2.2.

- 43 -

b) Pressionar, com o mouse, em Grfico (barra da Figura 6.7) surgindo a seguinte
imagem:

Figura 6.8
Grfico do
Exemplo
6.2.1.
Figura 6.9
Grfico do
Exemplo
6.2.2.

- 44 -
6.3 ANOVA: dois critrios
Este teste compara, alm da variao entre os tratamentos, a variabilidade entre os
blocos, os quais correspondem s linhas do grid geral. As amostras devem ter o
mesmo tamanho e os escores mensurados a nvel intervalar ou de razes. H, neste
modelo, dois valores de F: dos tratamentos e dos blocos.

6.3.1 EXEMPLO
Em uma escola do ensino mdio efetuou-se levantamento sobre o nmero de alunos
reprovados nas disciplinas Cincias, Matemtica e Portugus (tratamentos), ao
mesmo tempo em que se procurou verificar a proporo dos inabilitados nessas
matrias nos turnos da Manh (linha 1), da Tarde (linha 2) e da Noite (linha 3). Em
cada turno estavam matriculados 800 discentes, de onde foram retiradas as amostras.
Os dados coletados esto inseridos no grid geral de entrada de dados.

H
0
: o tipo de disciplina cursada no afeta os ndices de reprovao;
H
1
: pelo menos duas mdias so diferentes;
H
0
: o turno cursado pelo estudante no afeta os ndices de reprovao;
H
1

6.3.2 INSTRUES
a) Pressionar o mouse em ANOVA: dois critrios;
b) Selecionar as colunas referentes aos tratamentos (Cincias, Matemtica,
Portugus) do grid geral;
c) Clicar em Executar o Teste, surgindo a Figura 6.9 naqueles casos em que h
diferena estatisticamente significativa entre mdias dos tratamentos e/ou
blocos valor de p , selecionando-se um dos testes sugeridos para a
comparao dos valores mdios amostrais, o qual, neste exemplo, foi escolhido
o t de Student (Blocos).
d) Pressionar Executar, para resultados.
Figura 6.10
Dados do
Exemplo
6.3.1.
Figura 6.11
Tela de
seleo do
teste para
ANOVA: dois
critrios.

- 45 -

O F-teste significativo entre blocos (F = 8.0453, p = 0.0411), o que no ocorreu
com os tratamentos (F = 4.2754, p = 0.1023). A comparao entre as mdias dos
blocos exibe diferenas significativas entre os Blocos 1 vs. 2 e 1 vs. 3, o que no foi
observado entre os Blocos 2 vs. 3. Pode-se concluir, assim, que as turmas da manh
referentes s trs disciplinas apresentaram propores menores de alunos
reprovados, rejeitando-se, conseqentemente, a hiptese de nulidade entre os blocos
(turnos), mas aceitando-se no que diz respeito aos tratamentos (disciplinas).

6.4 ANOVA: Fatorial a x b (com replicao)
Algumas vezes o estudo procura esclarecer se h interaes entre os tratamentos e os
blocos, devendo-se, nessa circunstncia, efetuar repeties para visualizar esse
detalhe da pesquisa. Os resultados desta anlise de varincia so apresentados sob a
forma de 3 F-testes: a) dos tratamentos; b) dos blocos; c) da interao entre
tratamentos e blocos, todos com os respectivos valores de p.

6.4.1 EXEMPLO
Estudo experimental procurou verificar a influncia das drogas A, B e C no peso de
frangos e frangas, ou seja, procurou-se determinar se, alm da ao ponderal,
haveria influncia relacionada com o sexo e, ainda, a possibilidade de interao
entre peso e sexo dos animais determinada pelas drogas, com as seguintes hipteses:

H
0
: as drogas no afetam o peso mdio das aves em crescimento:
1
=
2
=
3
;
H
1
H
0
: a condio sexual no afeta o peso mdio das aves em crescimento:
m
=
f
;
H
1
: a condio sexual afeta o peso mdio das aves em crescimento:
m

f
;
H
o
: no h interao significativa entre as variveis independentes: droga e sexo;
H
1
: h interao significativa entre as variveis independentes;

Figura 6.12
Resultados
do Exemplo
6.3.1.

- 46 -
6.4.2 INSTRUES
a) Pressionar o mouse em ANOVA: Fatorial a x b;
b) Preencher as caixas de textos com o nmero de tratamentos, de blocos e de
repeties, e clicar em Ativar o Grid.
c) Preencher o grid especfico (Figura 6.13) de acordo com os escores obtidos no
experimento, correspondendo cada valor ao peso em gramas de cada animal;
d) Clicar em Executar o teste, para resultados.

O F-teste dos tratamentos foi elevado, com valor de p < 0.0001, indicando que o
efeito das drogas sobre o peso muito significativo, rejeitando-se sob esse aspecto a
hiptese de nulidade e aceitando-se a hiptese alternativa. No que diz respeito
varivel sexo e interao entre drogas e sexo conclui-se, pelos resultados dos
respectivos valores de F, que as diferenas no so estatisticamente significativas,
aceitando-se, assim, a hiptese de nulidade (ver Figura 6.14).
Figura 6.13
Dados do
Exemplo
6.4.1.
Figura 6.14
Resultados
do Exemplo
6.4.1.

- 47 -
6.5 ANOVA: Fatorial a x b x c (sem replicao)
Os experimentos fatoriais, como j foi visto no exemplo anterior, incluem a
combinao de vrios fatores ou conjuntos de tratamentos com as respectivas
interaes. Neste caso, trata-se dos fatores a, b e c, testados de modo isolado e
combinados, como segue:
i Fator a; v Fator a Fator c;
ii Fator b; vi Fator b Fator c;
iii Fator c; vii Fator a Fator b Fator c.
iv Fator a Fator b;

Procurou-se determinar a acidez de laranjas de 3 variedades, em 3 temperaturas
diferentes e em 3 perodos anuais. Os dados esto includos no grid especial do
BioEstat, como pode ser visualizado na Figura 6.15, sendo A as variedades da
espcie, B as temperaturas e C os perodos anuais.

H
0
: o teor de acidez o mesmo nas 3 variedades estudadas;
H
1
: o teor de acidez diferente nas variedades investigadas;
H
0
: a temperatura no altera o teor de acidez das variedades estudadas;
H
1
: a temperatura altera o teor de acidez das variedades estudadas;
H
0
: o perodo anual no altera o teor de acidez das variedades investigadas;
H
1
: o perodo anual altera o teor de acidez das variedades estudadas;
H
o
: no h interao significativa entre as variveis independentes;
H
1
: h interao significativa entre as variveis independentes.

Figura 6.15
Dados do
Exemplo
6.5.1.

- 48 -
6.5.2 INSTRUES
a) Pressionar o mouse em ANOVA: Fatorial a x b x c;
b) Preencher as caixas de textos com o nmero de cada fator: variedades, meses do
ano e nmero de anos, e clicar em Ativar o Grid.
c) Preencher o grid especfico (Figura 6.15) de acordo com os escores obtidos no
experimento;
d) Clicar em Executar teste, para resultados.

Observa-se pelos resultados contidos na Figura 6.16 que a interao dos Fatores a e
b, variedades vs. temperaturas, respectivamente, significativa, com p-valor da
ordem de 0.0146.

6.6 TESTE DE FRIEDMAN
A Anlise de Varincia de Friedman um teste no-paramtrico para dados
mensurados a nvel ordinal, abrangendo trs ou mais amostras e equivalendo
ANOVA com dois critrios. Este procedimento recebe, tambm, a designao de
Dupla Anlise de Varincia por Postos. Os dados devem ter dupla disposio: as
linhas representam os indivduos e as colunas, as condies experimentais ou
tratamentos. As amostras (tratamentos) devem ter o mesmo tamanho, a fim de
permitir a comparao entre todos os indivduos submetidos ao teste.

6.6.1 EXEMPLO
Em um experimento, cinco coelhos foram submetidos a quatro estmulos de
intensidade crescente: A < B < C < D. As respostas de cada animal variaram em uma
escala ordinal de 0 a 100 e os escores foram introduzidos no grid geral do programa.

H
0
: a intensidade dos estmulos no influencia a magnitude de resposta dos animais
submetidos ao experimento:
1
=
1
=
2
=
3
;
H
1
: a intensidade dos estmulos influencia a magnitude de resposta dos animais
submetidos ao experimento:
1

1

2

3
;
Figura 6.16
Resultados
do Exemplo
6.5.1.
Figura 6.17
Dados do
Exemplo
6.6.1.

- 49 -
6.6.2 INSTRUES
a) Pressionar o mouse em Friedman;

d) Pressionar, com o mouse, em Grfico (barra da Figura 6.7):

Figura 6.18
Resultados
do Exemplo
6.6.1.
Figura 6.19
Grfico do
Exemplo
6.6.1.

- 50 -
O teste de Friedman (Xr
2
= 13.0200) muito significativo (p = 0.0046), devendo-se,
portanto, rejeitar a hiptese de nulidade e aceitar a hiptese alternativa. Com base
nesse resultado e na anlise dos dados, pode-se concluir que a intensidade da
resposta dos animais diretamente proporcional intensidade do estmulo
provocado. A comparao entre os tratamentos exibe diferena significativa entre os
Estmulos A vs. D e B vs. D.

6.7 TESTE DE KRUSKAL-WALLIS
Teste no-paramtrico, conhecido como Teste H, destina-se a comparar trs ou mais
amostras independentes do mesmo tamanho ou desiguais, cujos escores devem ser
mensurados, pelo menos, a nvel ordinal. O teste de Kruskal-Wallis comparvel
ANOVA (um critrio).

6.7.1 EXEMPLO
Conscincia Ecolgica entre universitrios escolhidos ao acaso e pertencentes aos
cursos de Biologia, Enfermagem, Odontologia e Administrao. A apurao de
questionrio distribudo entre os estudantes indicaria que, quanto maior o escore,
maior o grau de conscincia ecolgica revelado, cujos valores variavam numa escala
de 0 a 100 pontos.

H
0
: os escores obtidos dos estudantes independem dos cursos nos quais esto
matriculados;
H
1
: a magnitude da conscincia ecolgica dependente do curso no qual o aluno
est matriculado;

6.7.2 INSTRUES
a) Pressionar o mouse em Kruskal-Wallis;

Figura 6.20
Dados do
Exemplo
6.7.1.

- 51 -

e) Pressionar, com o mouse, em Grfico (barra da Figura 6.21):

O valor de H = 15.0230 altamente significativo (p = 0.0018). Rejeita-se a hiptese
de nulidade e aceita-se a hiptese alternativa. Verifica-se, de outro lado, que as
diferenas entre os escores mdios dos alunos de Biologia vs. Odontologia e
Figura 6.21
Resultados
do Exemplo
6.7.1.
Figura 6.22
Grfico do
Exemplo
6.6.1.

- 52 -
Odontologia vs. Administrao apresentam valores de p inferiores ao nvel alfa de
0.05, sendo considerados significativos ou muito significativos, concluindo-se que
os estudantes de Biologia e de Administrao apresentaram maior conscincia
ecolgica do que os discentes dos demais cursos investigados.

6.8 TESTE Q DE COCHRAN
Destinado a testar vrias amostras relacionadas, nas quais os mesmos indivduos so
observados em trs ou mais etapas. Os escores so mensurados a nvel nominal ou
ordinal, e os resultados apresentam-se dicotomizados: 1 (sucesso) ou 0 (insucesso),
por exemplo. Este teste no-paramtrico considerado uma extenso do teste de
McNemar referente a duas amostras, enquanto o de Cochran se aplica para trs ou
mais conjuntos do mesmo tamanho.

6.8.1 EXEMPLO
Um entrevistador enviou formulrio para 12 indivduos sobre a preferncia de cada
um referente a um produto comercial recentemente lanado venda, repetindo o
procedimento em trs oportunidades, com intervalo de 2 meses entre cada
questionamento. As respostas foram consideradas satisfatrias (1) ou no (0), de
acordo com a avaliao do pesquisador.

H
0
: a probabilidade da resposta favorvel (1) a mesma em todas as trs etapas da
investigao;
H
1
: a probabilidade da resposta favorvel (1) difere em cada etapa do
questionamento;

6.8.2 INSTRUES
a) Pressionar o mouse em Q de Cochran;
Figura 6.23
Dados do
Exemplo
6.8.1.

- 53 -
c) Clicar em Executar o Teste, para resultados.

O teste Q de Cochran exibe um valor estatisticamente significativo (p = 0.0439),
devendo-se rejeitar a hiptese de nulidade e aceitar a hiptese alternativa. As
respostas favorveis diferem em cada etapa de resposta ao questionrio, no
havendo, portanto, uniformidade sobre o assunto objeto da pesquisa.
Figura 6.24
Resultados
do Exemplo
6.8.1.

- 54 -

- 75 -
CAPTULO 6
BOOTSTRAP
6.1 INTRODUO
A tcnica empregada para este procedimento consiste em retirar de uma pequena
amostra numerosas outras com reposio, por exemplo 500, 1000, 10000 ou mais.
Cada uma delas tem a probabilidade de 1/n de ser obtida. Chama-se, tambm, de
tcnica de simulao ou de reamostragem, cuja denominao na lngua inglesa
bootstrap, e a traduo tem sido Tira de Bota. Esta designao foi atribuda a Bradle
Efron, como tambm a afirmao de que a distribuio relativa de repetidas amostras
estatsticas uma estimao da distribuio de amostragem, conforme publicao de
seu artigo no The Annals of Statistics, em 1979.
Para alguns autores, requerido, para este procedimento, que as reamostragens nunca
sejam inferiores a 500, constituindo o bootstrap um mtodo computacional intensivo,
de anlise estatstica por simulao para estimativas de intervalos de confiana, erro
padro e testes de significncia, aplicveis a modelos paramtricos e no
paramtricos.

Os aplicativos tipo Bootstrap Tira de Bota - apresentados no BioEstat so:
a) Dados Qualitativos: Dicotmicos;
b) Dados Quantitativos: Contnuos;
c) Intervalo de Confiana da Correlao Linear;
d) Intervalo de Confiana da Mdia;
e) Intervalo de Confiana da Proporo;
f) Teste de hiptese: Teste t Duas Amostras Independentes;
g) Teste de hiptese: ANOVA (um critrio);
h) Teste de hiptese: Correlao Linear.

6.1.1 INSTRUES
b) Apontar o mouse em Bootstrap, quando surgir a figura abaixo:

6.2 DADOS QUALITATIVOS: DICOTMICOS
Os dados dicotmicos ou binrios so representados pelos dgitos Um (1) e Zero (0),
correspondentes a SIM e NO, respectivamente.
Figura 6.1
Menu de
Bootstrap.

- 56 -
CAPTULO 7 BOOTSTRAP
qualquer um dos valores, 5 por exemplo, que corresponder a SIM e os demais (1, 2,
3, 4 e 6), a NO.

7.2.1 EXEMPLO
O lanamento de moeda 11 vezes resultou em 6 caras, representadas por 1, e 5
coroas, equivalentes a 0. Os dados esto contidos no grid geral (Figura 7.4).

7.2.2 INSTRUES
a) Pressionar o mouse em Dados Dicotmicos;
b) Selecionar a coluna Moeda, do Exemplo 7.2.1;
c) Clicar em Executar o Teste, preencha as caixas de texto, com os seguintes dados:
i tamanho da amostra inicial;
ii tamanho de cada reamostra;
iii valor do evento de interesse, 0 (coroa) no presente caso;
iv nmero de simulaes, 10000 no presente exemplo;
d) Pressionar o mouse em Executar, para resultados.

Os dados da reamostragem esto bem prximos do valor da proporo inicial da
amostra de coroas da amostra (valor 0 do evento), 45.46% e 45.45%, respectivamente.

7.3 INTERVALO DE CONFIANA DA CORRELAO LINEAR
um dos testes estatsticos de largo uso, cujos dados amostrais das variveis X e Y
podem ser submetidos reamostragem, para determinao do intervalo de confiana
do coeficiente r (Pearson), como demonstrado em seguida.

7.3.1 EXEMPLO
Efetuou-se levantamento de 30 recm-nascidos de ambos os sexos, no sentido de
verificar a associao entre peso (X) e comprimento (Y) dessas crianas. A amostra
foi randmica, cujos dados esto contidos no grid geral (Figura 7.4).

Figura 7.2
Dados do
Exemplo
7.2.1.
Figura 7.3
Resultados
do Exemplo
7.2.1.
Neste exemplo, a simulao (reamostragem) ser aplicada
para estimar a proporo de coroas na populao.

- 57 -
CAPTULO 7 BOOTSTRAP

7.3.2 INSTRUES
a) Pressionar o mouse em Intervalo de Confiana da Correlao Linear;
b) Selecionar as colunas Peso (Y) e Comprimento (X);
c) Clicar em Executar o Teste. Sero exibidas caixas de texto, as quais devem ser
preenchidas com o nmero de simulaes - 1000, no caso - e o Intervalo de
Confiana desejado (95%, neste exemplo). Pressione, a seguir, em Executar, para
resultados.

O IC (95%), aps 1000 simulaes, est compreendido entre 0.14 a 0.72, tambm
mostrado graficamente na figura inferior em linha de cor cinza, assinalando-se, ainda,
o trao vertical escuro correspondente ao valor de r da simulao, igual a 0.58,
includo, como seria de esperar, no respectivo intervalo, prximo do valor de r da
amostra inicialmente coletada (0.45).

7.4 INTERVALO DE CONFIANA DA MDIA
De dados amostrais randmicos podem-se obter a mdia das reamostragens e seu
respectivo intervalo de confiana baseado em percentis.

Figura 7.4
Dados
parciais do
Exemplo
7.3.1.
Figura 7.5
Resultados
do Exemplo
7.3.1

- 58 -
CAPTULO 7 BOOTSTRAP
7.4.1 EXEMPLO
De amostra formada por 10 insetos, mediu-se o peso de cada indivduo em gramas.
Os resultados foram estes:

7.4.2 INSTRUES
a) Pressionar o mouse em Intervalo de Confiana da Mdia;
b) Selecionar a coluna do grid geral (Exemplo 7.4.1) correspondente aos valores
amostrais e clicar em Executar o Teste;
c) Preencher as caixas de texto com as informaes sobre o nmero de simulaes e
o Intervalo de Confiana desejados;
d) Pressionar em Executar, para resultados.

Foram efetuadas 10000 simulaes, ou seja, a retirada de dez mil amostras da amostra
inicial, com reposio, obtendo-se a Mdia e o Intervalo de Confiana de 95%
seguintes:
Mdia = 3.050:
IC (95%): 2.640 a 3.407 (em termos de percentis)
Para efeito de comparao, quando se efetua a estimao de parmetros somente com
base na mdia e no desvio padro da amostra original, obtm-se:
Mdia = 3.05
IC (95%): 2.622 a 3.478 (em termos de desvio padro)
Figura 7.7
Resultados
do Exemplo
7.4.1.
Figura 7.6
Dados do
Exemplo
7.4.1

- 59 -
CAPTULO 7 BOOTSTRAP
Obs.: pode-se repetir n vezes o mesmo procedimento, com ou sem alteraes do
nmero de Simulaes e do Intervalo de Confiana, clicando-se em Executar, para
resultados.

7.5 INTERVALO DE CONFIANA DA PROPORO
O procedimento semelhante ao utilizado para mdia, como ser visto em seguida,
cujos Intervalos de Confiana esto baseados nos percentis.

7.5.1 EXEMPLO
Em sondagem eleitoral, efetuada com dois meses de antecedncia do pleito, obteve-se
amostra de tamanho 200 e a seguinte proporo para o candidato AZ: 0.36 (36%),
correspondendo a 72 eventos favorveis em 200 eleitores. Efetuar 15000 simulaes,
para calcular a proporo com o respectivo Intervalo de Confiana de 99%.

7.5.2 INSTRUES
a) Pressionar o mouse em Intervalo de Confiana da Proporo;
b) Preencher as caixas de texto com as informaes sobre o nmero de simulaes,
o Intervalo de Confiana desejado e os valores originais do tamanho da amostra e
da respectiva proporo;
c) Pressionar em Executar, para resultados.

Foram efetuadas 15000 simulaes, ou seja, a retirada de quinze mil amostras com
reposio da amostra original, obtendo-se os seguintes valores:
Proporo = 0.363
IC (99%): 0.275 a 0.445 (em termos de percentis)

Figura 7.8
Resultados
do Exemplo
7.5.1.

- 60 -
CAPTULO 7 BOOTSTRAP
Para efeito de comparao, quando se efetua a estimao de parmetros somente com
base na amostra inicial e no nmero de eventos favorveis, obtm-se:
Proporo amostral = 0.36
IC (99%): 0.272 a 0.448 (em termos de desvio padro)

Obs.: pode-se repetir n vezes o mesmo procedimento, com ou sem alteraes do Nmero
de Simulaes e do Intervalo de Confiana, clicando-se em Executar, para resultados.

7.6 TESTE DE HIPTESE: Teste t Duas Amostras Independentes
Realiza-se a reamostragem de duas amostras independentes teste t , as quais podem
ser do mesmo tamanho ou desiguais.

7.6.1 EXEMPLO
Um investigador admite que a estatura dos homens de duas populaes de pases da
Europa ocidental so diferentes. Foram mensurados 36 indivduos do pas A e 33 do B.
Os dados esto inseridos no grid geral (Figura 7.9).

H
0
: no h diferena entre a estatura mdia dos homens nos pases A e B:
1
=
2
;
H
1
: h diferena entre a estatura mdia dos homens nos pases A e B:
1

2
;

7.6.2 INSTRUES
a) Pressionar o mouse em Teste de hiptese: teste t - duas amostras independentes;
b) Selecionar as colunas referentes aos pases A e B, do Exemplo 7.6.1;
c) Clicar em Executar o Teste, surgindo caixas de texto informando o tamanho de
cada amostra, 36 e 33, neste exemplo. Preencher, em seguida, o nmero de
simulaes desejadas, 10000 neste caso, e pressione em Executar, para
resultados.
Figura 7.9
Dados
parciais do
Exemplo
7.6.1

- 61 -
CAPTULO 7 BOOTSTRAP

A Mdia geral prior e o Desvio prior so estatsticas obtidas das amostras, sem
simulao. O p-valor da simulao mostrou resultado altamente significativo
(0.0030), rejeitando-se, portanto, a hiptese de nulidade, podendo-se admitir que a
estatura mdia dos homens desses pases diferente.

7.7 TESTE DE HIPTESE: ANOVA (um critrio)
Para obter a reamostragem de dados para fins de anlise de varincia, realiza-se o
seguinte procedimento: retirar trs ou mais amostras, dos mesmos tamanhos ou
desiguais, cujos critrios de comparao so os tratamentos. Procede-se, ento, a
simulao conforme indicado a seguir.

7.7.1 EXEMPLO
Foram coletadas sementes das espcies A, B, C e D, cujo peso em gramas de cada
unidade e respectivas espcies so mostrados na tabela seguinte.

Figura 7.11
Dados do
Exemplo
7.7.1.
Figura 7.10
Resultado
do Exemplo
7.6.1

- 62 -
CAPTULO 7 BOOTSTRAP
H
0
: os pesos das sementes obtidas das espcies em questo no apresentam diferenas
significativas:
1
=
2
=
3
=
4
;
H
1
: pelo menos, os pesos das sementes de duas das espcies obtidas apresentam
diferenas significativas:
i

j
;

7.7.2 INSTRUES
a) Pressionar o mouse em Teste de hiptese: ANOVA (um critrio);
b) Selecionar as colunas referentes aos tratamentos (Espcies A, B, C e D) do
Exemplo 7.7.1;
c) Clicar em Executar o Teste e informar o Nmero de Tratamentos includos no
teste (4 tratamentos). Preencha, em seguida, o Nmero de Simulaes desejadas,
10000 neste exemplo, e pressione em Executar, para resultados.

O p-valor da simulao mostrou resultado altamente significativo (0.0001), rejeitando-
se, portanto, a hiptese de nulidade, podendo-se admitir que, pelo menos, o peso
mdio das sementes de duas espcies das amostras coletadas so diferentes.

7.8 TESTE DE HIPTESE: CORRELAO LINEAR
Pelo procedimento de reamostragem, podemos obter os valores de r (Pearson) e o
respectivo p-valor da Correlao Linear.

7.8.1 EXEMPLO
Os dados contidos na Figura 7.13 foram submetidos ao teste de reamostragem para
obteno do p-valor e de r simulados.

H
0
: no h correlao entre as variveis X e Y: r = 0;
H
1
: h correlao entre as variveis X e Y: r 0;
Nvel de deciso: alfa = 0.01
Figura 7.12
Resultados
do Exemplo
7.7.1.

- 63 -
CAPTULO 7 BOOTSTRAP

7.8.2 INSTRUES
a) Pressionar o mouse em Teste de hiptese: Correlao Linear;
b) Selecionar as colunas do grid geral correspondentes aos valores amostrais X e Y
(Exemplo 7.8.1) e clicar em Executar o Teste;
c) Preencher as caixas de texto com o nmero de simulaes desejado, 1000 no
presente exemplo;
d) Clicar em Executar, para resultados.

O p-valor obtido igual a 0.0040, sendo estatisticamente muito significativo. Os
valores de r, prior e simulado, foram 0.8728 e 0.5036, respectivamente.
Figura 7.13
Dados do
Exemplo
7.8.1.
Figura 7.14
Resultados
do Exemplo
7.8.1.

- 64 -
CAPTULO 7 BOOTSTRAP

- 85 -
CAPTULO 7
CORRELAO

7.1 INTRODUO
A Anlise de Correlao proporciona um meio de se verificar o grau de associao
entre duas ou mais variveis. Os testes mais utilizados para essa anlise so:

i Correlao linear de Pearson;
ii Matriz de Correlao;
iii Correlao parcial;
iv Correlao linear quando o parmetro diferente de zero (r < 0 ou r > 0);

i Contingncia C;
ii Concordncia de Kendall;
iii Correlao de Kendall;
iv Coeficiente Phi;
v Correlao de Spearman.

7.1.1 INSTRUES
c) Apontar o mouse em Correlao, conforme demonstra a Figura 7.1:

7.2 CORRELAO LINEAR DE PEARSON
um teste de largo emprego em bioestatstica, onde os valores das variveis X e Y so
mensurados a nvel intervalar ou de razes. O coeficiente de Pearson r pode
variar de 1 a +1, e quanto mais prximos desses valores, mais forte a associao das
variveis em exame. O escore zero desse coeficiente indica ausncia de correlao.

7.2.1 EXEMPLO
Efetuou-se levantamento em adolescentes no sentido de verificar a associao de peso
e estatura desses indivduos. A amostra foi randmica e os dados esto no grid geral
(ver Figura 7.2).
Figura 7.1
Menu de
Correlao.

- 66 -
CAPTULO 8 CORRELAO
H
0
: no h associao entre peso e estatura de adolescentes: r = 0;
H
1
: h correlao entre as duas variveis: r 0;

8.2.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao de Pearson;
c) Clicar em Executar o Teste para obter resultados.

Os resultados mostram forte correlao positiva entre Peso e Estatura de adolescentes
(r = 0.9624 e p = 0.0021), rejeitando-se, assim, a hiptese de nulidade e aceitando-se
a alternativa. Em outras palavras, medida que aumenta uma das variveis, a outra
cresce de valor, no havendo, entretanto, relao de dependncia de X em relao a Y
ou de Y sobre X.

8.3 MATRIZ DE CORRELAO
Pode-se calcular diversos valores de r com as respectivas probabilidades e, ao mesmo
tempo, obter a matriz dos valores da correlao.

8.3.1 EXEMPLO
Os dados contidos no grid geral, apresentados na Figura 8.4, correspondem a valores
de 4 amostras, as quais devem apresentar o mesmo tamanho. A Figura 8.5 indica os
resultados obtidos e a matriz de correlao.

8.3.2 INSTRUES
a) Pressionar o mouse em Matriz. de Correlao;
Figura 8.2
Dados do
Exemplo
8.2.1.
Figura 8.3
Resultados
do Exemplo
8.2.1.

- 67 -
CAPTULO 8 CORRELAO
c) Clicar em Executar o Teste para obter resultados

As variveis das colunas 1 e 4 apresentam Coeficiente de Pearson igual a 0.9609,
com p = 0.0092. As demais correlaes no so estatisticamente significativas. A
matriz est representada na parte inferior da Figura 8.5.

Pressionar em Grfico na linha superior da Figura 8.5:

Figura 8.4
Dados do
Exemplo
8.3.1
Figura 8.6
Grfico do
Exemplo
8.3.1,
Colunas
1 e 4
Figura 8.5
Resultados
do Exemplo
8.3.1.
Na parte
inferior est
represen-
tada a
matriz de
correlao.

- 68 -
CAPTULO 8 CORRELAO
8.4 CORRELAO PARCIAL
No estudo da correlao linear possvel estender o conceito medindo-se a associao
entre duas variveis e, ao mesmo tempo, controlando o efeito de uma terceira, a
varivel Z. Neste caso, chama-se o procedimento de Correlao Parcial.

8.4.1 EXEMPLO
O exemplo que vai ser mostrado o da influncia da renda familiar varivel Z na
correlao entre tempo de estudo dos pais varivel X e tempo de estudo dos filhos
varivel Y. O programa permite que se escolha a varivel Z, a qual pode ser
qualquer uma das trs colunas preenchidas com os escores. No exemplo, a varivel a
ser fixada est na coluna 3 do grid. Alm disso, os resultados da Correlao Linear de
Pearson das variveis X e Y so apresentados a ttulo comparativo.

H
0
: a renda familiar (varivel Z) no influencia a correlao tempo de estudo dos pais
(varivel X) e o tempo de escolaridade dos filhos (varivel Y);
H
1
: a renda familiar (varivel Z) influencia a correlao tempo de estudo dos pais
(varivel X) e o tempo de escolaridade dos filhos (varivel Y);

8.4.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao Parcial;
c) Clicar em Executar o Teste, surgindo uma tela para a escolha da varivel Z;

Figura 8.8
Resultados
do Exemplo
8.4.1.
Figura 8.7
Dados do
Exemplo
8.4.1.

- 69 -
CAPTULO 8 CORRELAO
H uma associao entre a escolaridade dos pais e dos filhos (r XY= 0.8295, p =
0.021), a qual deixa de ser significativa ao se introduzir a varivel Z (r XY.Z =
0.2719, p = 0.6022)

8.5 CORRELAO LINEAR: < 0 ou > 0
Algumas vezes h interesse do pesquisador no estudo da associao entre duas
variveis, mas o parmetro de comparao passa a ser diferente de zero, como se
exemplifica a seguir.

8.5.1 EXEMPLO
Em estudo gentico (hipottico) verificou-se que o parmetro ( ) de associao entre
as variveis X e Y igual a 0.50. Tomou-se amostra aleatria de 6 indivduos, cujas
variveis em questo foram mensuradas, a fim de verificar se estariam de acordo com
a distribuio terica formulada.

H
0
: = 0.50;
H
1
: 0.50;

8.5.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao: < 0 ou > 0;
c) Clicar em Executar o Teste, surgindo a Figura 8.10, a qual deve ser preenchida
com o valor de assumido da populao, 0.5 no caso;

d) Clicar em OK, para resultados.

Figura 8.9
Dados do
Exemplo
8.5.1.
Figura 8.10
Coef. de
correlao da
populao ( ).
(Exemplo
8.5.1)

- 70 -
CAPTULO 8 CORRELAO

H diferena estatisticamente significativa entre o coeficiente observado (- 0.5456) e
o parmetro (0.50), sendo o valor de p igual a 0.044. Rejeita-se, portanto, a hiptese
de nulidade.

8.6 COEFICIENTE DE CONTINGNCIA C
Este Coeficiente indicado para determinar a magnitude de associaes de variveis
mensuradas a nvel ordinal, dispostas em tabelas de contingncia n x n (n 2).

8.6.1 EXEMPLO
Um pesquisador deseja verificar se h associao entre o grau de escolaridade (X) e o
nvel salarial (Y). Os dados coletados de cada amostra correspondem ao nmero de
indivduos e foram inseridos no grid geral da seguinte forma:

a) Colunas 1, 2 e 3 referentes aos nveis de escolaridade: fundamental, mdio e
superior, respectivamente;
b) Linhas 1, 2 e 3: relativas aos nveis salariais: um a dois, trs a cinco e mais de
cinco salrios mnimos, respectivamente;
c) Cada casela do grid registra o nmero de indivduos relativos escolaridade e
ao respectivo nvel salarial.

H
0
: no h associao entre nveis de escolaridade e salarial: Coeficiente C = 0;
H
1
: h correlao entre as duas variveis, quanto maior a escolaridade dos indivduos,
maior o salrio recebido: Coeficiente C 0;

8.6.2 INSTRUES
a) Pressionar o mouse em Coef. de Contingncia C;
c) Clicar em Executar o Teste, para resultados (Figura 8.13).
Figura 8.12
Dados do
Exemplo
8.6.1.
Figura 8.11
Resultados
do Exemplo
8.5.1.

- 71 -
CAPTULO 8 CORRELAO

H forte associao entre o grau de escolaridade e o nvel salarial: Coef. C = 0.3977 e
p < 0001, rejeitando-se a hiptese de nulidade e aceitando-se a alternativa.

8.7 COEFICIENTE DE CONCORDNCIA DE KENDALL: W
Este coeficiente W testa a associao entre vrios (k) conjuntos de postos dos
mesmos indivduos (n), cujas variveis so mensuradas a nvel ordinal.

8.7.1 EXEMPLO
Testar o grau de correlao entre o nvel de desempenho de 3 mdicos residentes e as
respectivas avaliaes efetuadas por 3 supervisores.

H
0
: no h concordncia entre a avaliao dos supervisores em relao ao
desempenho dos mdicos residentes: Coef. de Kendall W = 0;
H
1
: h concordncia entre a avaliao dos supervisores em relao ao
desempenho dos mdicos residentes: Coef. de Kendall W 0;

8.7.2 INSTRUES
a) Pressionar o mouse em Coef. de Concordncia de Kendall;
b) Selecionar as colunas (postos) referentes s variveis do grid geral;
Figura 8.15
Resultados do
Exemplo
8.7.1.
Figura 8.13
Resultados
do Exemplo
8.6.1.
Figura 8.14
Dados do
Exemplo
8.7.1.

- 72 -
CAPTULO 8 CORRELAO
Os resultados no mostram diferena estatisticamente significativa entre o
desempenho dos mdicos residentes e as respectivas avaliaes dos trs supervisores
(W = 0.7778 e p = 0.097), tendo havido, portanto, concordncia entre os avaliadores.
Aceita-se, portanto, a hiptese de nulidade.

8.8 COEFICIENTE DE CORRELAO DE KENDALL:
Mede a associao entre duas variveis mensuradas a nvel ordinal, ou seja, por
postos.

8.8.1 EXEMPLO
Dois mdicos neonatalogistas efetuaram a avaliao de seis recm-nascidos pelos
escores de Apgar. Os valores foram inseridos no grid geral.

H
0
: no h concordncia entre a avaliao dos neonatalogistas em relao aos escores
de Apgar dos recm-nascidos: Coef. de Correlao de Kendall = 0;
H
1
: h concordncia entre a avaliao dos neonatalogistas em relao aos escores
de Apgar dos recm-nascidos: Coef. de Correlao de Kendall 0;

8.8.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao de Kendall;

Figura 8.16
Dados do
Exemplo
8.8.1.
Figura 8.17
Resultados do
Exemplo
8.8.1.

- 73 -
CAPTULO 8 CORRELAO
Os resultados revelam um Coeficiente de Correlao de Kendall (0.7877)
significativo (p = 0.0132), tendo havido concordncia dos mdicos especialistas em
relao aos escores de Apgar dos recm-nascidos. Rejeita-se a hiptese de nulidade,
aceitando-se a alternativa.

8.9 COEFICIENTE PHI: r

Este teste aplicado para verificar a associao de variveis mensuradas a nvel
nominal e que se apresentam de modo dicotmico em tabela de contingncia 2 x 2.

8.9.1 EXEMPLO
Foi efetuado levantamento em uma universidade para verificar se h associao entre
os sexos dos estudantes e os cursos de medicina e biologia. Nesse exemplo ambas as
variveis apresentam-se dicotmicas e so mensuradas a nvel nominal: sexo
masculino e feminino de um lado e, de outro, os cursos de medicina e biologia, com
os seguintes escores:
a) estudantes do sexo masculino cursando biologia: 40;
b) estudantes do sexo masculino cursando medicina: 48;
c) estudantes do sexo feminino cursando biologia: 55;
d) estudantes do sexo feminino cursando medicina: 47;

H
0
: no existe associao entre os sexos dos estudantes e os cursos de medicina e de
biologia: r
= 0;
H
1
: existe associao entre os sexos dos estudantes e os cursos de medicina e de
biologia: r
0;

8.9.2 INSTRUES
a) Pressionar o mouse em Coef. Phi;
b) Preencher o grid especfico da seguinte maneira;

c) Clicar em Executar, para resultados.
Figura 8.18
Coeficiente
Phi.
(Exemplo
8.9.1)
Entrada de Dados do Coef. Phi.

A = estudantes masculinos que cursam biologia;
B = estudantes masculinos que cursam medicina;
C = estudantes femininos que cursam biologia;
D = estudantes femininos que cursam medicina.

- 74 -
CAPTULO 8 CORRELAO
Pelos resultados verifica-se que no h diferena estatisticamente significativa entre
sexos e escolha dos cursos em questo (p = 0.3085). Aceita-se, portanto, a hiptese de
nulidade (Figura 8.20).

8.10 COEFICIENTE DE CORRELAO DE SPEARMAN: r
s

uma prova no-paramtrica com a finalidade de determinar o grau de associao
entre duas variveis mensuradas, pelo menos, a nvel ordinal e dispostas em postos
ordenados em duas sries: X e Y.

8.10.1 EXEMPLO
Os mesmos dados relativos Correlao de Kendall sobre os escores de Apgar (ver
Figura 8.18).

H
0
: no h correlao entre a avaliao dos neonatalogistas em relao aos escores de
Apgar dos recm-nascidos: r
s
= 0;
H
1
: h correlao entre a avaliao dos neonatalogistas em relao aos escores de
Apgar dos recm-nascidos: r
s
0;

8.10.2 INSTRUES
a) Pressionar o mouse em Coef. de Correlao de Spearman;

Os resultados mostram correlao entre as avaliaes efetuadas pelos dois mdicos
em 6 recm-nascidos, sendo o teste estatisticamente significativo (p = 0.0188),
confirmando aqueles obtidos pelo teste de Correlao de Kendall.

Figura 8.19
Resultados do
Exemplo
8.10.1.

- 95 -
CAPTULO 8
DISTRIBUIO DE PROBABILIDADES

8.1 INTRODUO
Quando o procedimento para a coleta de dados, conseqentemente das variveis
investigadas, randmico, assumindo cada varivel um certo valor e uma
determinada probabilidade, diz-se, ento, que so variveis aleatrias. O programa
apresenta as seguintes distribuies:

a) Distribuies discretas:
i Binomial;
ii Hipergeomtrica;
iii Poisson.
b) Distribuies contnuas:
i Exponencial;
ii Normal.
c) Probabilidade condicional:
i Crivo (screening test);
ii Curva ROC;
iii Ponto de Corte;
iv Regra de Bayes;
v Sensibilidade/Especificidade.
d) Outras distribuies:
i Distribuio F;
ii Distribuio do Qui-quadrado;
iii Distribuio t de Student;
iv Distribuio Z.

8.1.1 INSTRUES
b) Apontar o mouse em Distribuio de Probabilidades.

8.2 DISTRIBUIO BINOMIAL
Esta distribuio caracteriza-se quando:
a) o experimento consiste de n provas idnticas, cada uma apresentando apenas dois
resultados: sucesso e insucesso;
b) a probabilidade do sucesso igual a p, e a do insucesso, a q, sendo q = 1 p;
Figura 8.1
Menu de
Distribuio
de Probabili-
dades.

- 76 -
CAPTULO 9 DISTRIBUIO DE PROBABILIDADES
c) as provas so independentes, procurando-se determinar a probabilidade do
nmero de sucessos k em n provas;
d) o quociente n/N deve ser inferior a 0.05.

9.2.1 EXEMPLO
No universo de leuccitos da circulao perifrica do homem a proporo de
linfcitos igual a 0.36. Contando-se 20 leuccitos, qual a probabilidade de se obter
5 linfcitos? Considerando-se que a populao (N) de leuccitos atinge a casa dos
milhes, ento o quociente n/N inferior a 0.05, indicando-se, nesse caso, a aplicao
da distribuio binomial para a varivel questionada.

9.2.2 INSTRUES
a) Clicar o mouse em Binomial;
b) Preencher as caixas de texto com os dados;
c) Clicar em Executar, para obter os resultados.

Observa-se, alm da mdia (), do
desvio padro () e dos valores de p e q,
a probabilidade de se obter exatamente
5 linfcitos em 20 clulas leucocitrias
(0.1161), a da obteno de 5 ou menos
linfcitos (k 5 = 0.2171) e, ainda, a
chance de mais de 5 clulas linfocitrias
(0.7829). A soma desses valores igual
unidade (0.2171+ 0.7829 = 1). A
frao 0.1161 est includa em 0.2171
(igual ou menor que 5 linfcitos).

9.3 DISTRIBUIO HIPERGEOMTRICA
Em determinadas ocasies as distribuies de probabilidades de variveis discretas
tm as mesmas caractersticas das distribuies binomiais, mas o tamanho da amostra
relativamente grande em relao ao tamanho do universo. Desse modo, a retirada de
uma unidade sem reposio altera acentuadamente a probabilidade dos demais
constituintes da populao e, nesses casos, a distribuio passa a ser hipergeomtrica.
O critrio adotado para considerar esse modelo o valor do quociente n/N, o qual
deve ser 0.05.

9.3.1 EXEMPLO
Uma caixa contm 15 vidros (populao) de comprimidos de vitamina B
1
e em cada
caixa observou-se que 3 vidros apresentavam dosagem da vitamina inferior indicada
pelo fabricante, compreendendo uma proporo de 3/15 = 0.2. Em amostra randmica
Figura 9.2
Distribuio
Binomial.
(Exemplo
9.2.1)

- 77 -
de 5 unidades, calcular a probabilidade de 2 vidros ou menos apresentarem dosagem
da vitamina abaixo da indicada pelo produtor. O quociente n/N = 5/15 = 0.333,
superior a 0.05, indicando-se a distribuio hipergeomtrica para esse clculo.

9.3.2 INSTRUES
a) Clicar o mouse em Hipergeomtrica;

A probabilidade de se encontrar na
amostra 2 vidros com subdosagem de
vitamina B
1
0.2198, a de 2 vidros ou
menos 0.9780 e a de mais de dois
vidros 0.0220. A soma dessas
probabilidades igual unidade:
0.9780 + 0.0220 = 1 (o valor 0.2198
est includo em 0.9780).

9.4 DISTRIBUIO DE POISSON
Trata-se de um modelo de distribuio de probabilidade discreta semelhante
binomial, com as seguintes diferenas:
a) A probabilidade do evento de interesse p se apresenta como ocorrncia rara e
relacionada no tempo e no espao.
b) O valor de q (1 - p) no considerado nos clculos.

9.4.1 EXEMPLO
A hipersensibilidade penicilina de 0.0015 em populaes humanas. Se em
determinada localidade e num perodo de um ano fossem testadas 4000 pessoas
residentes, qual seria a probabilidade de 3 indivduos apresentarem a mencionada
reao ao antibitico? Tratando-se de evento raro (0.0015) e relacionado no tempo e
no espao, indica-se a distribuio de Poisson para o clculo da probabilidade dessa
distribuio.

Figura 9.3
Distribuio
Hipergeo-
mtrica.
(Exemplo
9.3.1)

- 78 -
9.4.2 INSTRUES
a) Clicar o mouse em Poisson;

A probabilidade de ocorrncia de 3 indivduos com hipersensibilidade penicilina
0.0892; de 3 ou menos, 0.1512, e para mais de 3 pessoas, 0.8488. A soma dessas
probabilidades igual unidade: 0.1512 + 0.8488 = 1. No escore 0.1512 est includo
o valor de p (x), igual a 0.0892.

9.5 DISTRIBUIO EXPONENCIAL
A distribuio exponencial um modelo para variveis contnuas referentes a
intervalos de tempo transcorrido entre eventos raros e discretos, como ocorre na
distribuio de Poisson. O interesse, no entanto, o intervalo temporal, o qual
apresenta distribuio contnua e exponencial.

9.5.1 EXEMPLO
Em uma instituio de abrigo aos idosos, a admisso em 12 meses de 25 pessoas por
1000 habitantes, com valor lambda (p) = 25/1000 = 0.025. Calcular a probabilidade
do recebimento de 25 idosos em 8 meses.

9.5.2 INSTRUES
a) Clicar o mouse em Exponencial;
Figura 9.4
Distribuio
de Poisson.
(Exemplo
9.4.1)

- 79 -

A probabilidade do evento ocorrer (25 admisses) em 8 meses inferior a 20%
(0.1813).

9.6 DISTRIBUIO NORMAL
um dos mais importantes modelos de distribuio de probabilidades em estatstica,
sobretudo nas reas das cincias biolgicas e da sade. A curva desta distribuio
apresenta as seguintes caractersticas:
a) simtrica;
b) em forma de sino;
c) assinttica: as extremidades se aproximam mas no tocam a linha das abscissas;
d) dois pontos de inflexo situados a igual distncia da mdia, um de cada lado
desse parmetro: 1.
Os escores brutos so transformados em escores padronizados (Z), e nessa
padronizao a mdia igual a zero (0) e o desvio padro igual a um (1). Aps o
clculo do valor de Z o programa determina as probabilidades da distribuio.
A rea sob a curva normal apresenta estas propores, por exemplo:
a) 1.645 = 90% da rea, sendo 45% de cada lado da curva;
b) 1.96 = 95% da rea, sendo 47.5% de cada lado da curva;
c) 2.33 = 98% da rea, sendo 49% de cada lado da curva;
d) 2.58 = 99% da rea, sendo 49.5% de cada lado da curva.

Figura 9.5
Distribuio
Exponencial.
(Exemplo
9.5.1)

- 80 -
9.6.1 EXEMPLO
Em uma amostra aleatria, o peso de recm-nascidos tem distribuio normal, com
mdia de 3100g e desvio- padro igual a 225g. Considerando-se amostra aleatria de
300 crianas, calcular:
a) a probabilidade e a respectiva proporo de recm-nascidos pesando entre 2750g
e 3200g;
b) idem, entre 3150g e 3300g;
c) idem, entre 2659g e 3541g.

9.6.2 INSTRUES
a) Clicar o mouse em Normal;
b) Preencher as caixas de texto: Tamanho, Mdia Desvio padro, e os escores X1 e
X2, os quais compreendem o intervalo de valores cuja probabilidade se pretende
calcular;

A Figura acima expressa os valores de Z, as respectivas probabilidades (p) e os
escores inferiores a X
1
(17.97), entre X
1
e X
2
(183.51) e superiores a X
2
(98.52). A
questo argida, portanto, corresponde a 184 crianas.
As casas decimais so importantes porque a curva normal representa dados contnuos.

A probabilidade e a respectiva proporo de recm-nascidos pesando entre 3150g e
3300g, conforme argido no item b, est representada na prxima figura.
Figura 9.6
Distribuio
Normal.
(Exemplo
9.6.1 - a)

- 81 -

A Figura 9.7 apresenta os valores de Z, as respectivas probabilidades (p) e os escores
inferiores a X
1
(176.37), entre X
1
e X
2
2
(56.10). A pergunta
formulada, assim, corresponde a 68 crianas.

A Figura 9.8 exibe os valores de Z, as respectivas probabilidades (p) e os escores
inferiores a X
1
(7.50), entre X
1
e X
2
2
(7.50). A questo
formulada (item c), dessa maneira, compreende 286 crianas. Registre-se que os
escores escolhidos 2659 e 3541 correspondem a valores de Z de 1.96 e + 1.96,
cujas probabilidades de distribuio situam-se nas faixas de 0.025 para cada lado da
curva, aqum e alm dos escores X
1
e X
2
, respectivamente, totalizando 0.025 + 0.025
= 0.05 (5%). A rea compreendida entre esses valores igual a 1 - 0.05 = 0.95 (95%),
confirmando, portanto, a informao antes mencionada, ou seja: 1.96 = 95%
da rea, sendo 47.5% de cada lado da curva.
Figura 9.7
Distribuio
Normal.
(Exemplo
9.6.1 - b)
Figura 9.8
Distribuio
Normal.
(Exemplo
9.6.1 - c)

- 82 -
9.7 CRIVO (SCREENING TEST)
Emprega-se em estudos epidemiolgicos e em clnica mdica como estimadores de
determinadas doenas. O mais simples aquele em que a pessoa testada pode ser
classificada como doena provvel (teste positivo) ou doena improvvel (teste
negativo). A classificao final de cada indivduo poder depender, entretanto, do
seguimento dos casos, de exames complementares, de procedimentos cirrgicos e de
resultados de necropsia. O aperfeioamento cada vez maior dos testes laboratoriais
tem aumentado o grau de certeza nos resultados dos screening tests.

H vrios estimadores de desempenho de um teste:
a) Sensibilidade: probabilidade de, se o teste for positivo, a pessoa ter a doena;
b) Especificidade: probabilidade de, se o teste for negativo, a pessoa esteja sadia;
c) Valor preditivo de um teste positivo: probabilidade do indivduo com teste
positivo ter a doena;
d) Valor preditivo de um teste negativo: probabilidade do indivduo com teste
negativo estar sadio.

9.7.1 EXEMPLO
Efetuou-se um screening test para diabete em 630 indivduos de ambos os sexos, com
idade compreendida entre 18 e 25 anos, considerando-se o teste como positivo se a
glicemia fosse igual ou superior a 155 mg/dl, determinada uma hora aps refeio
padro. Os resultados foram os seguintes:

Teste positivo em pessoas diabticas = 61;
Teste positivo em pessoas no diabticas = 35;
Teste negativo em pessoas diabticas = 12;
Teste negativo em pessoas no diabticas = 522.

Figura 9.9
Screening
Test,
(Exemplo
9.7.1).
Definies

- 83 -
9.7.2 INSTRUES
a) Selecionar Probabilidade Condicional e clicar em Crivo (Screening Test);
A especificidade do teste maior que a sensibilidade, ou seja, o valor preditivo do
teste negativo de 97.75%. Portanto, se em uma pessoa o teste for negativo, h quase
100% de chances de no ser diabtica. De outro lado, o valor preditivo de um teste
positivo de apenas 63.54%.
Pode haver, contudo, mudana ulterior na prevalncia da doena. Neste caso,
mantidos os valores da sensibilidade e da especificidade, o valor preditivo ser
alterado de modo diretamente proporcional alterao da prevalncia. Se esta
aumentar, o valor preditivo do teste positivo crescer, e vice-versa. Suponhamos que a
prevalncia posterior subiu para 0.25: pressiona-se o mouse no boto SIM, introduz-se
na caixa de texto o atual valor desse ndice, clicando outra vez em Executar.
9.8 CURVA ROC
A Curva ROC (Receiver Operanting Characteristic Curve) um mtodo estatstico e
grfico para determinar o melhor ponto de corte (cutoff point) de um teste
diagnstico. Representa-se no eixo das ordenadas (Y) a sensibilidade e no eixo das
abscissas a proporo de falsos positivos, ou seja, 1-especificidade. O ponto mais
elevado da curva, correspondente ao ngulo superior esquerdo do grfico, representa
100% de sensibilidade e 0% de falsos positivos (d =0), sendo, nesse caso, o valor
ideal de uma prova diagnstica chamado padro ouro. Podemos testar at vrias
Curvas por este mtodo, para avaliar o ponto de corte de cada uma, medindo-se, para
isto, as respectivas reas e os valores de d.

9.8.1 EXEMPLO
Uma investigao efetuada para determinar qual o melhor teste, A ou B, para
enfermidade neoplsica, mostrou os resultados abaixo, em exames efetuados em 45
pessoas com a enfermidade e em 45 indivduos considerados normais:

Figura 9.10
(Exemplo
9.7.1 com
nova
prevalncia).
Figura 9.11
Dados do
Exemplo
9.8.1

- 84 -
9.8.2 INSTRUES
a) Introduzir os dados no grid geral do BioEstat, conforme mostrado na Figura 9.11;
b) Selecionar com o mouse em Probabilidade Condicional e pressionar em Curva
ROC;
c) Selecionar as colunas do grid geral e, em seguida, pressionar Executar;
d) Informar o nmero de indivduos doentes e o nmero de indivduos sadios de
cada amostra (Figura 9.12) e pressionar o boto Executar.

Figura 9.13
Resultados
do Exemplo
9.8.1.
Figura 9.14
A linha
diagonal
representa a
metade da
rea. Quanto
mais
prximas
estiverem as
curvas dessa
linha, menor o
desempenho
do teste.
A linha d indica o teste
de melhor desempenho,
mais prximo do padro
ouro, ou seja:
Sensibilidade = 1 e
Especificidade = 0

Figura 9.12
Nmero de
doentes e de
sadios em
cada teste.

- 85 -
9.9 REGRA DE BAYES
A probabilidade condicional para dois ou mais eventos pode ser obtida pela
generalizao da regra de Bayes. O programa admite at dez eventos.

9.9.1 EXEMPLO
Tendo em vista os dados populacionais e as informaes clnicas, obtiveram-se os
seguintes escores relativos ao sintoma dispnia (A):
a) Dados da populao: b) Dados clnicos:
B
1
= Asma brnquica: Pr (B
1
) = 0.15 Pr (A|B
1
) = 0.26
B
2
= Enfisema pulmonar: Pr (B
2
) = 0.01 Pr (A|B
2
) = 0.75
B
3
= Cncer do pulmo: Pr (B
3
) = 0.009 Pr (A|B
3
) = 0.43
Dada a ocorrncia de dispnia, calcular as respectivas probabilidades dessas afeces.

9.9.2 INSTRUES
a) Apontar o mouse em Probabilidade Condicional e clicar em Regra de Bayes;
b) Preencher as caixas de texto da Figura 9.15;

c) Clicar em Executar, preenchendo em seguida o grid especfico com os dados;
d) Dirigir o mouse para o menu superior e clicar em Executar, para resultados.

9.10 SENSIBILIDADE/ESPECIFICIDADE
A probabilidade posterior pode ser calculada conhecendo-se a probabilidade prior e
os novos valores da sensibilidade e da especificidade.

9.10.1 EXEMPLO
Um determinado evento tem uma probabilidade prior 0.45, calculada com
informaes sobre a sensibilidade e a especificidade de 0.55 e 0.45, respectivamente,
obtidas em um screening test. Com o aperfeioamento dos exames de laboratrio, os
novos valores da sensibilidade e da especificidade foram, respectivamente, iguais a
0.85 e 0.78. Calcular a probabilidade posterior com essas novas informaes.

Figura 9.15
Regra de
Bayes
(Exemplo
9.9.1.
Figura 9.16
Regra de
Bayes
generalizada
(Exemplo
9.9.1)

- 86 -
9.10.2 INSTRUES
a) Apontar o mouse em Probabilidade Condicional e clicar em
Sensibilidade/Especificidade;
b) Preencher as caixas de texto;
c) Clicar em Executar, para obter resultado.

Com os valores da sensibilidade, da especificidade e da prevalncia (prior), obtm-se
todos os indicadores quantificados na rea de resultados da Figura 9.17.

9.11 DISTRIBUIO F
A distribuio F, como as demais que se seguem, facilita o clculo do p-valor a partir
do valor de F obtido e de acordo com os graus de liberdade do numerador e do
denominador. Trata-se, assim, de um procedimento didtico, de vez que o grfico
aproximado da curva respectiva da distribuio mostrado com destaque para a rea
de rejeio, o que torna mais fcil a compreenso de um teste F pelo usurio.

9.11.1 EXEMPLO
Considerando o valor de F = 3.26, obtido em um teste de anlise de varincia baseada
em um critrio, com 4 e 15 graus de liberdade do numerador e do denominador,
respectivamente, determinar a curva e o p-valor para esses dados.

9.11.2 INSTRUES
a) Apontar o mouse em Outras distribuies;
b) Clicar o mouse em Distribuio F;
c) Preencher as caixas de texto com os dados do exemplo e clicar em Executar.

Figura 9.18
O p-valor
obtido
igual a
0.0408.
Figura 9.17
Sensibilidade/
Especificida-
de. (Exemplo
9.10.1)

- 87 -
9.12 DISTRIBUIO DO QUI-QUADRADO
A distribuio do Qui-Quadrado, com base no valor de
2
obtido e os graus de
liberdade, calcula o p-valor e mostra, aproximadamente, a respectiva curva.

9.12.1 EXEMPLO
Considerando o valor de
2
= 3.841, obtido em uma tabela de contingncia 2 x 2,
portanto, com 1 grau de liberdade, calcular o respectivo p-valor.

9.12.2 INSTRUES
b) Clicar o mouse em Distribuio do Qui-Quadrado;
c) Preencher as caixas de texto com os dados do exemplo e clicar em Executar.

9.13 DISTRIBUIO t DE STUDENT
A distribuio t de Student varia, como se sabe, de acordo com o valor obtido e os
respectivos graus de liberdade, aproximando-se da curva normal medida que
aumentam os graus de liberdade. Os valores alfa unilateral e bilateral so mostrados
juntamente com a respectiva curva, esta de modo aproximado.

9.13.1 EXEMPLO
Tendo em vista o valor obtido de t = 2.947 e considerando 15 graus de liberdade,
calcular o p-valor unilateral.

9.13.2 INSTRUES
b) Clicar o mouse em Distribuio t de Student;
c) Preencher as caixas de texto com os dados do exemplo e clicar em Unilateral.
Figura 9.19
O p-valor
igual a
0.05 e
corresponde
ao segmen-
to escuro
direita da
curva.

- 88 -

9.14 DISTRIBUIO Z
A distribuio Z, como se sabe, corresponde distribuio normal com parmetros
N(0,1). A curva e o p-valor so mostrados conforme se verifica na Figura 9.17.

9.14.1 EXEMPLO
Considerando o valor obtido de Z = 1.96, calcular o p-valor bilateral.

9.14.2 INSTRUES
b) Clicar o mouse em Distribuio Z;
c) Preencher a caixa de texto com o valor de Z e clicar em Bilateral.

Figura 9.21
p-valor
bilateral
obtido
igual a
0.025 de
cada lado
da curva,
totalizando
0.05.
Figura 9.20
Distribuio
t de
Student,
o p-valor
unilateral
obtido
igual a
0.005.
O resultado unilateral,
como era esperado,
igual a 0.005.

Se fosse desejado o valor
bilateral, bastaria
pressionar o boto
Bilateral, o qual, com
esses dados, o p-valor
corresponderia a 0.005 de
cada lado da curva,
totalizando 0.01,
(0.005 + 0.005).

- 111 -
CAPTULO 9
UMA AMOSTRA

9.1 INTRODUO
Os testes de inferncia estatstica para uma s amostra envolvem os dados amostrais e
os parmetros da populao investigada. Algumas vezes a comparao dos valores
numricos da amostra efetuada com distribuies tericas esperadas, recebendo a
denominao, nesses casos, de testes de aderncia.
Estes testes classificam-se em:
i Teste t: dados amostrais;
ii Teste t: resumo amostral;
iii Teste Z: dados amostrais;
iv Teste Z: resumo amostral.
i Teste Binomial;
ii Teste de Iteraes (Runs test);
iii Teste G;
iv Teste de Kolmogorov-Smirnov;
v Teste de Lilliefors;
vi Teste do Qui-Quadrado: propores esperadas iguais;
vii Teste do Qui-Quadrado: propores esperadas desiguais;
viii Teste de Poisson.

9.1.1 INSTRUES
c) Apontar o mouse em Uma Amostra, conforme demonstra a Figura 9.1:

9.2 TESTE t DE STUDENT: DADOS AMOSTRAIS
Prova paramtrica cuja finalidade a de comparar a mdia amostral com a mdia da
populao, sendo necessrio assumir a mdia paramtrica do universo em questo, ou
Figura 9.1
Menu dos
aplicativos
para uma
amostra.

- 90 -
CAPTULO 10 UMA AMOSTRA
10.2.1 EXEMPLO
Determinaram-se os nveis de fosfatase srica de 24 crianas com infeco malrica,
comparando-se os escores obtidos com o dado paramtrico da populao considerado
normal para a infncia: = 2.45 mg/dl.

H
0
: A fosfatase srica no alterada durante a infeco malrica:
1
=
0
;
H
1
: A fosfatase srica alterada durante a infeco malrica:
1

0
.
Nvel de deciso: alfa = 0.01, bilateral.

10.2.2 INSTRUES
a) Pressionar o mouse em Teste t;
b) Selecionar a coluna referente amostra do grid geral;
c) Clicar em Executar o Teste surgindo a Figura 10.3 e preencher ento a caixa
de texto com a mdia da populao.

d) Clicar em Executar para obter os resultados.

Pelo exame dos resultados (Figura 10.4), conclui-se que a diferena altamente
significativa, eis que o valor de p inferior ao nvel alfa previamente estabelecido.
Rejeita-se a hiptese de nulidade e aceita-se a alternativa, ou seja, o nvel de fosfatase
srica em crianas alterado pela infeco malrica.

Figura 10.2
Viso parcial
dos dados do
Exemplo
10.2.1.
Figura 10.3
Mdia da
populao.

- 91 -

10.3 TESTE Z
Prova paramtrica semelhante anterior, devendo o procedimento ser escolhido
quando a mdia e a varincia da populao so conhecidas.

10.3.1 EXEMPLO
Em um lago criatrio foram pesados 50 peixes de determinada espcie, cujos escores
esto inseridos no grid geral. Em estudos efetuados no habitat natural, o peso mdio
dos animais dessa espcie de 21600 g e o desvio padro igual a 7338 g.

H
0
: os animais do lago criatrio tm peso igual aos do habitat natural:
1
=
0
;
H
1
: os animais do lago criatrio tm peso superior aos do habitat natural:
1
>
0
;
Nvel de deciso: alfa = 0.05, unilateral.

10.3.2 INSTRUES
a) Pressionar o mouse em Teste Z;
b) Selecionar a coluna referente amostra do grid geral;
c) Clicar em Executar o Teste surgindo a Figura 10.6 e preencher ento as
caixas de texto com a mdia da populao e o desvio padro paramtrico.
Figura 10.5
Viso parcial
dos dados
do Exemplo
10.3.1.
Figura 10.4
Resultados
do Exemplo
10.2.1.

- 92 -


Os resultados revelam que a diferena significativa (p unilateral = 0.0212), inferior,
portanto, ao nvel de significncia previamente estabelecido. Rejeita-se a hiptese de
nulidade e aceita-se a alternativa, ou seja, os peixes do lago criatrio tm mdia de
peso superior queles existentes no habitat natural.

10.4 TESTE BINOMIAL (para uma proporo)
Trata-se de teste no-paramtrico utilizado quando os eventos na populao
apresentam-se dicotmicos ou binrios sucesso e insucesso. Os valores amostrais
so comparados com os dados da populao.

10.4.1 EXEMPLO
Supondo-se que, de 10000 indivduos com idade entre 50 e 60 anos e com histria
familiar de cncer gstrico, 350 apresentaram esse tipo de carcinoma. Os estudos
demonstraram que a prevalncia dessa doena na populao de 0.03. As hipteses
formuladas so estas:

H
0
: a prevalncia de cncer gstrico em indivduos com histria familiar dessa
neoplasia igual a da observada na populao: p
1
= p
0
;
H
1
: a prevalncia de cncer gstrico em indivduos com histria familiar dessa
neoplasia diferente da observada na populao: p
1
p
0
;
Figura 10.6
Mdia e
desvio padro
da populao.
Figura 10.7
Resultados
do Exemplo
10.3.1.

- 93 -

10.4.2 INSTRUES
a) Pressionar o mouse em Teste binomial;
b) Preencher as caixas de textos com o tamanho da amostra, o nmero de sucessos e
a proporo do evento na populao (em decimais).

A diferena entre as propores da amostra e a da populao altamente significativa
(p = 0.0034) no teste bilateral. Considerando-se que a proporo amostral superior a
da populao, rejeita-se a hiptese de nulidade e aceita-se a alternativa no sentido de
que os indivduos com histria familiar de neoplasia gstrica tm maior prevalncia
dessa enfermidade.

10.5 TESTE G
Prova no-paramtrica de aderncia, semelhante ao teste do Qui-Quadrado, aplicada
em amostra com dados mensurados na escala nominal e dispostos em duas ou mais
categorias mutuamente exclusivas.

10.5.1 EXEMPLO
Efetuaram-se 300 lanamentos de um dado cujos escores esto inscritos no grid geral.
Considerando-se que o dado apresenta 6 categorias (s, duque, terno, quadra, quina e
sena) e todas so equiprovveis, ento, do ponto de vista terico deve-se esperar que,
em trezentos lanamentos, cada modalidade deve apresentar 50 sucessos. Testar:

H
0
: os valores observados esto de acordo com os teoricamente esperados;
H
1
: os valores esperados diferem da proporo terica esperada em cada categoria;

Figura 10.8
Teste
Binomial
(Exemplo
10.4.1).
Figura 10.9
Dados do
Exemplo
10.5.1.

- 94 -
10.5.2 INSTRUES
a) Pressionar o mouse em Teste G;
b) Selecionar as colunas do grid geral referentes aos dados observados e queles
teoricamente esperados;

As propores observadas concordam com as esperadas, eis que o teste G ajustado
(Williams) = 2.6669 no significativo (p = 0.7512). O dado pode, assim, ser
considerado no-viciado, sem vis.

10.6 TESTE DE KOLMOGOROV-SMIRNOV
Prova no-paramtrica de aderncia destinada a comparar o grau de concordncia
entre a distribuio acumulada de um conjunto de valores de uma amostra com a
distribuio terica acumulada esperada.

10.6.1 EXEMPLO
Em uma fazenda registrou-se o grau mdio do teor alcolico de cada safra anual dos
vinhos produzidos no perodo de 1980/89, obtendo-se os seguintes valores:

Os dados obtidos em todas as reas vincolas da regio indicam que o grau mdio
alcolico dos vinhos produzidos igual a 9, com desvio padro igual a 2.

H
0
: as freqncias acumuladas observadas no diferem da distribuio esperada, com
base nos dados da populao: F
0
(X) = Sn(X);
H
1
: as freqncias acumuladas observadas diferem da distribuio esperada, com base
nos dados da populao: F
0
(X) Sn(X);

Figura 10.11
Dados do
Exemplo
10.6.1.
Figura 10.10
Resultados
do Exemplo
10.5.1.

- 95 -
10.6.2 INSTRUES
a) Pressionar o mouse em Kolmogorov-Smirnov;
b) Selecionar apenas uma coluna do grid geral referente aos dados observados, os
quais, neste caso, correspondem coluna 2;
c) Clicar em Executar e preencher as caixas de texto com as informaes referentes
aos dados paramtricos mdia e desvio padro , apertando na tecla OK, para
resultados.

Pelo resultado do teste, rejeita-se a hiptese de nulidade e se aceita a alternativa. O
grau alcolico obtido da referida adega difere do parmetro da populao vincola da
rea investigada.

10.7 TESTE DE LILLIEFORS
Prova no-paramtrica de aderncia destinada a comparar o grau de concordncia
entre a distribuio acumulada de um conjunto de valores de uma amostra com a
distribuio terica acumulada esperada.

10.7.1 EXEMPLO
O mesmo exemplo anterior Exemplo 10.6.1 sobre o grau mdio do teor alcolico
de cada safra anual dos vinhos produzidos no perodo de 1980/89, conforme relao
constante na Figura 10.11, desconhecendo-se os parmetros da populao (mdia e
desvio padro). Este teste pode ser empregado para k amostras de modo simultneo.

H
0
: as freqncias acumuladas observadas no diferem da distribuio terica
esperada: F
0
(X) = Sn(X);
H
1
: as freqncias acumuladas observadas diferem da distribuio terica esperada:
F
0
(X) Sn(X);

10.7.2 INSTRUES
a) Pressionar o mouse em Lilliefors;
b) Selecionar apenas uma coluna do grid geral referente aos dados observados, os
quais, neste caso, correspondem coluna 2;
c) Clicar em Executar para obter resultados.

Figura 10.12
Resultados
do Exemplo
10.6.1.
Figura 10.13
Resultados
do Exemplo
10 7 1

- 96 -
Pelo resultado do teste (p > 0.05), aceita-se a hiptese de nulidade e consideram-se os
dados amostrais com aderncia normalidade. Pelo modelo de Lilliefors o p-valor,
dos dados do Exemplo 10.6.1, difere do modelo Kolmogorov-Smirnov.

10.8 TESTE DO QUI-QUADRADO: propores esperadas iguais
Constitui a prova no-paramtrica de mais largo uso nas reas de cincias biolgicas e
mdicas. O teste para uma amostra um procedimento semelhante ao teste G, ou seja,
de aderncia. A comparao efetuada entre os escores observados e os esperados,
estes iguais, neste caso.

10.8.1 EXEMPLO
Em 48 filhos de casais constitudos por um cnjuge afetado por anomalia dominante
autossmica (Aa) e o outro normal (aa), verificou-se que 18 descendentes mostravam
a anomalia do genitor afetado e, conseqentemente, 30 no a apresentavam. Pela
teoria gentica, as propores esperadas so de 1:1. Os dados devem ser inseridos em
uma s coluna do grid geral, eis que quando as propores esperadas so iguais.
Testar:

H
0
: as propores fenotpicas observadas concordam com as esperadas pela teoria
gentica (1:1): p
1
= p
2
;
H
1
: as propores fenotpicas observadas no esto de acordo com as esperadas pela
teoria gentica (1:1): p
1
p
2
;

10.8.2 INSTRUES
a) Apontar o mouse em Qui-Quadrado, para Propores esperadas iguais,
conforme o Exemplos 10.7.1;
b) Selecionar a coluna do grid geral e clicar em Executar o Teste, para resultados.

O Qui-Quadrado corrigido (Yates) no significativo (p = 0.1124), evidenciando que
os valores observados concordam com os esperados pela teoria gentica. A diferena
existente , portanto, variao amostral.

Figura 10.14
Dados do
Exemplo
10.8.1.
Figura 10.15
Resultados
do Exemplo
10.8.1.

- 97 -
10.9 TESTE DO QUI-QUADRADO: propores esperadas desiguais
Constitui outra prova no-paramtrica muito utilizada nas reas de cincias biolgicas
e mdicas. O teste para uma amostra um procedimento semelhante ao teste G, ou
seja, de aderncia. A comparao efetuada entre os escores observados e os
esperados, estes desiguais, calculados do ponto de vista matemtico ou de acordo com
alguma teoria.

10.9.1 EXEMPLO
Em casais com grupos sangneos AB x AB, testou-se o fentipo de 80 descendentes
no que diz respeito a esse sistema, observando-se que 18 pertenciam ao grupo A, 36
ao AB e 26 ao B. Pela teoria gentica as propores esperadas seriam: 1:2:1 (25% :
50% : 25%) , dos grupos A, AB e B, respectivamente. Os dados devem ser inseridos
em duas colunas do grid geral, pois os valores esperados so desiguais. Testar:

H
0
: as propores fenotpicas observadas concordam com as esperadas pela teoria
gentica (1:2:1): p
1
= ; p
2
= ; p
3
= ;
H
1
: as propores fenotpicas observadas no esto de acordo com as esperadas pela
teoria gentica (1:2:1): p
1
; p
2
; p
3
;

10.9.2 INSTRUES
a) Apontar o mouse em Qui-Quadrado, para Propores esperadas desiguais,
conforme o Exemplo 10.7.1;
b) Selecionar as colunas do grid geral e clicar em Executar o Teste, para resultados.

O Qui-Quadrado calculado no significativo (p = 0.3012), evidenciando que os
valores observados concordam com os esperados pela teoria gentica. Aceitar a
hiptese de nulidade, eis que a diferena existente , portanto, variao amostral.

10.10 TESTE DE POISSON
Este teste deve ser empregado quando os dados so binrios, como no teste binomial,
e se o evento em questo considerado raro e ocorrido em determinado espao de
tempo.
Figura 10.16
Dados do
Exemplo
10.9.1.
Figura 10.17
Resultados
do Exemplo
10.9.1.

- 98 -
Uma investigao foi efetuada sobre a ocorrncia de linfomas em dez mil indivduos
que trabalhavam em uma indstria de calados e que foram seguidos durante 1 ano. O
nmero registrado de casos foi igual a 6, enquanto a taxa dessa neoplasia na
populao, por 10000 habitantes, no mesmo perodo, obtida dos rgos de sade, foi
igual a 4.7. H diferena significativa entre esses dados?

H
0
: =
0
;
H
1
:
0
;

10.10.2 INSTRUES
a) Pressionar o mouse em Teste de Poisson;
b) Preencher a caixa de texto e pressionar Executar, para resultados.

As propores observadas concordam com as esperadas, eis que o teste de Poisson
no significativo (p = 0.6631). A diferena detectada no importante do ponto de
vista epidemiolgico, sendo considerada de natureza amostral.

Figura 10.18
Resultados
do Exemplo
10.10.1.

- 125 -
CAPTULO 10
DUAS AMOSTRAS INDEPENDENTES

10.1 INTRODUO
Um dos testes mais freqentes em bioestatstica consiste na avaliao da diferena
entre duas amostras independentes, que devem representar as respectivas populaes,
em que os dados de uma no esto relacionados com os escores da outra.
i Teste t: dados amostrais;
ii Teste t: resumo amostral;
iii Teste Z: dados amostrais;
iv Teste Z: resumo amostral.
i Binomial para Duas Propores;
ii Exato de Fisher;
iii Teste G;
iv Kolmogorov-Smirnov;
v Mann-Whitney;
vi Mediana;
vii Qui-Quadrado;
vii Odds Ratio;
viii Risco Relativo;
ix Taxa de Incidncia.
x Coeficiente de Variao;
xii Poisson;

10.1.1 INSTRUES
a) Introduzir os dados no grid geral do BioEstat ou preencher caixas de texto;
c) Apontar o mouse em Duas Amostras Independentes.

Figura 10.1
Menu de
Duas
Amostras
Indepen-
dentes.

- 100 -
CAPTULO 11 DUAS AMOSTRAS INDEPENDENTES
11.2 TESTE t DE STUDENT
Teste paramtrico de largo uso, sobretudo quando o tamanho das amostras n
1
e n
2

igual ou inferior a 30 unidades e as varincias paramtricas so desconhecidas, cuja
distribuio das diferenas entre as mdias (
1
-
2
) foi descrita por W. Gosset
(Student). Os dados devem ser mensurados a nvel intervalar ou de razes e as
amostras podem ser de igual tamanho ou desiguais. As seguintes pressuposies
devem ser observadas neste teste:
a) amostras randmicas de cada populao investigada;
b) as varincias devem ser iguais;
c) as variveis das populaes de onde as amostras foram selecionadas devem
apresentar distribuio aproximadamente normal.

A questo das varincias amostrais importante no teste t de Student. Como as
amostras podem ser de tamanho desiguais, conveniente ponderar as duas varincias
s
2
1
e s
2
2
mesmo que a pressuposio tenha sido feita de que elas no so
diferentes. Essa ponderao conduz a determinado valor conhecido como pooled
variance.
Outras vezes uma das varincias mais de 4 vezes superior outra ou, ento, n
1
e n
2

so muito diferentes. Nesses casos, as varincias so consideradas desiguais desde
que o teste F, realizado tambm pelo BioEstat, seja significativo (p 0.05). O t
calculado para as duas mdias amostrais
1
X e
2
X levar em considerao esses
aspectos.

11.2.1 EXEMPLO (para dados amostrais)
Um pesquisador admite que a estatura dos homens pertencentes ao grupo indgena A
diferente dos indivduos do sexo masculino concernentes ao grupo indgena B.
Foram mensuradas 12 pessoas do primeiro agrupamento e 11 do segundo. Testar:

H
0
: no h diferena entre a estatura mdia dos indivduos dos grupos A e B:
1
=
2
;
H
1
: h diferena entre a estatura mdia dos indivduos dos grupos A e B:
1

2
;

Figura 11.2
Dados do
Exemplo
10.2.1.

- 101 -
11.2.2 INSTRUES
b) Selecionar as colunas referentes s amostras do grid geral;
c) Clicar em Executar o Teste para obter resultados.

O valor de t (5.0647) altamente significativo, com probabilidade igual a 0.0001
(bilateral). Rejeita-se, assim, a hiptese de nulidade e aceita-se a alternativa: h
diferena na estatura dos homens das populaes investigadas, sendo em mdia mais
altos aqueles pertencentes ao grupamento indgena A.

Pressionar em Grfico na barra superior da Fig. 11.3.

Figura 11.4
O grfico
sugestivo da
diferena
entre as
mdias
amostrais
do Exemplo
11.2.1
Figura 11.3
Resultados
do Exemplo
11.2.1.

- 102 -
11.2.4 EXEMPLO (resumo amostral)
Quando j se dispe do tamanho das amostras e respectivas mdias e varincias,
pode-se efetuar o teste t de Student com esses dados, preenchendo as caixas de texto
da Figura 11.5 e pressionar em Executar para resultados. Os dados para esse teste so
os seguintes:
a) Amostra 1: 11, 1.85 e 0.21;
b) Amostra 2: 10, 1.91 e 0.23.

H
0
: no h diferena entre a estatura mdia dos indivduos dos grupos A e B:
1
=
2
;
H
1
: h diferena entre a estatura mdia dos indivduos dos grupos A e B;

11.3 TESTE Z
Apresenta caractersticas semelhantes ao Teste t, mas indicado para duas amostras
independentes quando as varincias paramtricas so conhecidas e as variveis nas
populaes apresentam distribuies normais. Esta ltima pressuposio pode no ser
conhecida, mas o tamanho de cada amostra, nesse caso, deve ser superior a 30
unidades.

Figura 11.5
Dados do
Exemplo
10.2.1.
Figura 11.6
Resultados
do Exemplo
11.2.1.
No h
diferena
estatistica-
mente
significativa
(p > 0.05)
.

- 103 -
11.3.1 EXEMPLO
Dois produtos comerciais D1 e D2 , recomendados para alvio de dores
musculares, foram testados em duas amostras independentes de pacientes da mesma
idade, do sexo feminino e em condies clnicas semelhantes. Cada grupo estava
constitudo de 32 indivduos e o tempo decorrido entre a ingesto das drogas e o
alvio do sintoma foi contado em minutos. As varincias paramtricas dos produtos
D1 e D2 so, respectivamente, 1.68 e 1.62. Testar:
11.3.2 INSTRUES
a) Pressionar o mouse em Teste Z;
b) Selecionar as colunas referentes s amostras do grid geral e clicar em Executar o
Teste;
c) Preencher as caixas de texto (Figura 11.6), com as informaes sobre as varincias
paramtricas e pressionar em Continue, para obter resultados (Figura 11.7).

O valor de Z (2.9194) calculado muito significativo no teste unilateral (p = 0.0018),
rejeitando-se a hiptese de nulidade e aceitando-se a alternativa. A droga D1 alivia a dor
muscular em um perodo de tempo inferior ao da droga D2. O poder do teste
calculado, deduzindo-se, em decorrncia, o erro tipo II () = 1 - Poder. Se se desejar o
grfico desse Exemplo, pressionar em Grfico na barra superior da Figura 11.7.

Figura 11.7
Dados
parciais do
Exemplo
11.3.1.
H
0
: no h diferena entre as drogas no tempo de
alvio da dor muscular:
1
=
2
;

H
1
: a droga A alivia a dor muscular em um tempo
inferior ao da droga B:
1
<
2
;

Nvel de deciso: alfa unilateral = 0.01.

Figura 11.8
Como
informar as
varincias
param-
tricas.
Figura 11.9
Resultados
obtidos.

- 104 -
11.4 TESTE BINOMIAL
Destina-se a testar a diferena entre duas propores amostrais independentes,
procurando-se determinar se a diferena (p
1
p
2
) de tal grandeza que permita
rejeitar a hiptese de nulidade. O tamanho de cada amostra deve ser suficiente para a
devida aproximao da distribuio binomial curva normal, ou seja, quando
atendidas duas condies: 5
1 1 1
q p n e 5
2 2 2
q p n .

11.4.1 EXEMPLO
Uma pesquisa foi conduzida para estudar o efeito da aspirina no enfarte do miocrdio.
Um grupo de 10000 pessoas do sexo masculino, de 40 anos de idade, recebeu cada
uma 100 mg da droga por dia e foram observados durante 10 anos. Ocorreram
manifestaes de doena coronria em 14. Outro grupo de 9500 indivduos do mesmo
sexo e com a mesma idade foram seguidos por igual perodo, mas no receberam
aspirina, tendo ocorrido 30 casos de enfarte do miocrdio. Testar:

H
0
: a aspirina no influencia a ocorrncia da doena coronria: p
1
= p
2
;
H
1
: a aspirina diminui a incidncia da doena coronria: p
1
< p
2
;
Nvel de deciso: alfa unilateral = 0.01.

Os valores n
1
p
1
q
1
= 10000 x 0.0014 x 0.9986 = 13.98 e n
2
p
2
q
2
= 9500 x 0.0032 x
0.9968 = 30.30 atendem as condies exigidas para este teste.

11.4.2 INSTRUES
a) Pressionar o mouse em Teste Binomial: duas propores;

A diferena observada muito significativa (p unilateral = 0.0049), rejeitando-se a
hiptese de nulidade e aceitando-se a alternativa. O uso prolongado da aspirina
diminui a incidncia da doena coronria no homem.

11.5 TESTE EXATO DE FISHER
Prova no-paramtrica com a finalidade de verificar se duas amostras independentes
provieram da mesma populao. As amostras devem ser classificadas sob dois
critrios ou categorias, dispostas em tabelas de contingncias 2 x 2, cujos escores so
pequenos, quando o teste do Qui-Quadrado no pode ser aplicado. A probabilidade
exata (valor de p) apresentada sob as formas unilateral e bilateral.
Figura 11.10
Teste
Binomial
(Exemplo
11.4.1).

- 105 -
11.5.1 EXEMPLO
20 ces, divididos aleatoriamente em dois grupos de 10 animais, foram submetidos
gastrectomia experimental, tendo sido efetuada a sutura do coto duodenal em um
plano, no primeiro grupo, e em dois, no segundo. O experimento destinou-se a
constatar a ocorrncia de aderncia do epploo ao duodeno, verificado no ps-
operatrio imediato:

a) primeiro grupo:
i aderncia presente: 9 animais;
ii aderncia ausente: 1 animal.
b) segundo grupo:
i aderncia presente: 2 animais;
ii aderncia ausente: 8 animais.

H
0
: a presena de aderncia do epploo no coto duodenal independe do nmero de
planos de sutura: p
1
= p
2
;
H
1
: a presena de aderncia do epploo no coto duodenal depende do nmero de
planos de sutura: p
1
p
2
;
Nvel de deciso: alfa bilateral = 0.01.

11.5.2 INSTRUES
a) Pressionar o mouse em Teste Exato de Fisher;

O valor de p bilateral igual a 0.0055, rejeitando-se a hiptese de nulidade e
aceitando-se a alternativa. Os animais submetidos ao experimento, cuja sutura foi
efetuada em dois planos, apresentaram menor nmero de aderncias ao coto duodenal.

11.6 TESTE G
Teste no-paramtrico para duas amostras independentes, semelhante em todos os
seus aspectos ao do Qui-Quadrado, para dados categricos dispostos em tabelas de
contingncia 2 x 2, podendo, todavia, estender-se para mais de duas amostras, cada
uma com duas ou mais modalidades: l x c. Os graus de liberdade so assim
calculados: (l 1) x (c 1).

Figura 11.11
Resultados
do Teste
Exato de
Fisher
(Exemplo
11.5.1).

- 106 -
11.6.1 EXEMPLO
Relao entre sistema secretor ABH em indivduos normais e com filariose. Foram
submetidos ao teste 573 filariticos, dos quais 472 eram secretores e 101 no-
secretores; e 558 controles, sendo 490 secretores e 68 no-secretores.

H
0
: a ocorrncia de filariose independe do grupo do sistema secretor ABH ao qual
pertence o paciente;
H
1
: a ocorrncia de filariose est associada ao grupo do sistema secretor ABH ao qual
pertence o paciente;

11.6.2 INSTRUES
a) Pressionar o mouse em Teste G;
c) Clicar em Executar o Teste, para resultados
d) Clicar em Grfico na barra da Figura 11.11.

Os resultados mostram associao estatstica significativa entre sistema Secretor ABH
e filariose, rejeitando-se a hiptese de nulidade e aceitando-se a alternativa.

Prova no-paramtrica para duas amostras independentes e vrias modalidades, com
dados mensurados a nvel nominal, ordinal ou intervalar e retiradas da mesma
populao ou com a mesma distribuio cumulativa.

11.7.1 EXEMPLO
Tempo de adaptabilidade escola de crianas pertencentes s classes Maternal I e
Jardim I, com idades mdias de 3 (76 alunos) e 4 anos (63 escolares),
Figura 11.12
Dados do
Exemplo
11.6.1.
Figura 11.13
Resultados
do Exemplo
10.6.1 e
respectivo
Grfico.

- 107 -
respectivamente. A avaliao foi efetuada a nvel ordinal, por postos, correspondendo
cada linha do grid geral a um posto em termos temporais diretamente proporcionais:

H
0
: o perodo de adaptao escola independe da idade da criana;
H
1
: o tempo de adaptao escola depende da idade da criana;

11.7.2 INSTRUES
a) Pressionar o mouse em Kolmogorov-Smirnov;
b) Selecionar as colunas 2 e 3 do grid geral;
c) Informar se os dados esto ou no agrupados em classe. Neste exemplo os dados
esto agrupados, devendo-se clicar em Sim;
d) Clicar em Executar o Teste, para resultados.

O teste revela que a diferena entre as duas amostras muito significativa, rejeitando-
se a hiptese de nulidade e aceitando-se a alternativa. mais fcil a adaptabilidade
das crianas ao Jardim I que ao Maternal, indicando que a idade influencia o
comportamento desses escolares.

11.8 TESTE DE MANN-WHITNEY
O teste de Mann-Whitney, conhecido tambm como Teste U, uma prova no-
paramtrica destinada a comparar duas amostras independentes do mesmo tamanho
ou desiguais, cujos escores tenham sido mensurados pelo menos a nvel ordinal.

11.8.1 EXEMPLO
Nveis de fosfatase sangnea em 12 pacientes acometidos de malria por P. vivax e
em 10 parasitados pelo P. falciparum.

Figura 11.14
Dados do
Exemplo
11.7.1.
Figura 11.15
Resultados
do Exemplo
11.7.1.

- 108 -
H
0
: os nveis de fosfatase sangnea independem da espcie de Plasmodium que
parasita o homem;
H
1
: os nveis de fosfatase sangnea esto relacionados com a espcie de Plasmodium
encontrada nos doentes de malria;

11.8.2 INSTRUES
a) Pressionar o mouse em Mann-Whitney;

O teste U no estatisticamente significativo (p = 0.6444), aceitando-se, portanto, a
hiptese de nulidade. No h diferena nos nveis sangneos de fosfatase em
pacientes acometidos de malria pelo P. vivax ou pelo P. falciparum.

11.9 TESTE DA MEDIANA
O teste da Mediana um procedimento destinado a comprovar se duas amostras
independentes, do mesmo tamanho ou desiguais, provieram da mesma populao com
o mesmo valor mdio, mais precisamente o valor da mediana. Os escores de cada
amostra devem ser mensurados pelo menos a nvel ordinal.

11.9.1 EXEMPLO
Aps alta hospitalar, 12 indivduos de uma casa de sade (A) e 10 pessoas de outra
entidade nosocomial (B) foram avaliados quanto aos cuidados de enfermagem
Figura 11.17
Resultados
do Exemplo
11.8.1.
Figura 11.16
Dados do
Exemplo
11.8.1.

- 109 -
dispensados a cada um nas respectivas instituies. O escore de auto-avaliao de
cada paciente, numa escala ordinal de 0 a 100, est contido no grid.

H
0
: o atendimento de enfermagem no difere nos hospitais de onde os indivduos
foram selecionados;
H
1
: o atendimento de enfermagem difere nos hospitais de onde provieram as pessoas
selecionadas;

11.9.2 INSTRUES
a) Pressionar o mouse em Mediana;

O teste da Mediana foi significativo (p = 0.0323), rejeitando-se a hiptese de nulidade
e aceitando-se a alternativa. Os cuidados de enfermagem do Hospital A foram
superiores queles oferecidos pelo Hospital B.

11.10 TESTE DO QUI-QUADRADO
um dos testes no-paramtricos mais conhecidos e de larga aplicao nas cincias
biomdicas, destinando-se a comprovar se duas amostras independentes provieram da
mesma populao. Os escores devem ser mensurados a nvel nominal ou ordinal, e as
amostras podem apresentar duas ou mais categorias dispostas em tabelas de
contingncia l x c.
Figura 11.18
Dados do
Exemplo
11.9.1.
Figura 11.19
Resultados
do Exemplo
11.9.1.

- 110 -
O Qui-Quadrado sofre a correo de continuidade correo de Yates quando as
amostras apresentam apenas duas categorias (tabelas 2 x 2), devendo-se escolher
outro teste quando o valor de n (soma de todas as modalidades) inferior a 20 ou se
20 < n < 40 e qualquer freqncia esperada for menor que 5. De acordo com Cochran,
se n for igual ou maior que 40, pode-se tolerar valores esperados to pequenos quanto
a unidade (1).

11.10.1 EXEMPLO
Em rebanho bubalino, parte dos animais recebeu cuidados veterinrios, o que no
aconteceu com a outra parte. Decorrido um ano, o nmero de animais vivos e mortos
entre os referidos grupos foi o seguinte:

H
0
: a proporo dos animais vivos e mortos independe dos cuidados veterinrios
recebidos;
H
1
: a proporo dos animais vivos e mortos depende dos cuidados veterinrios
recebidos;

11.10.2 INSTRUES
a) Pressionar o mouse em Qui-Quadrado;
c) Clicar em Executar o Teste, para resultados;

O Qui-Quadrado obtido e devidamente corrigido (Yates) significativo, rejeitando-se
a hiptese de nulidade e aceitando-se a alternativa. A freqncia de animais vivos ou
mortos dependente dos cuidados veterinrios recebidos.

11.11 ODDS RATIO (OR)
O Odds Ratio (OR) um teste para propores dispostas em tabela de contingncia 2
x 2, ou seja, para duas amostras dicotomizadas, mensuradas a nvel nominal, o qual
calcula a vantagem (ou desvantagem) de um dos eventos sucesso em relao ao
outro. O programa apresenta tambm a probabilidade da ocorrncia e o intervalo de
Figura 11.20
Dados do
Exemplo
11.10.1.
Figura 11.21
Resultados
do Exemplo
11.10.1.

- 111 -
confiana de 95%. Quando o ndice igual unidade no h vantagem para quaisquer
dos eventos.

Indica-se o OR nos estudos de casos nos quais o nmero de controles previamente
fixado pelo pesquisador, no sendo aconselhvel a determinao da incidncia do
evento.

11.11.1 EXEMPLO
Efetuou-se levantamento em um grupo de pessoas do sexo masculino, cujas idades
variavam entre 50 e 60 anos, no sentido de verificar a associao de enfisema
pulmonar e o hbito do fumo. De 400 indivduos investigados, 216 eram no-
fumantes (controles), obtendo-se, ao final, os seguintes escores:
Amostra 1 (fumantes): Com enfisema = 120; Sem enfisema = 64;
Amostra 2 (no-fumantes): Com enfisema = 66; Sem enfisema = 150.

Tendo em vista que se trata de um estudo de casos cujos controles foram definidos
pelo investigador, pode-se calcular o OR.

11.11.2 INSTRUES
a) Clicar o mouse em Odds Ratio;

A probabilidade de enfisema pulmonar entre os fumantes 4 vezes superior dos
no-fumantes, com valor de p < 0.0001 (muito significativo).

Se os dados fossem introduzidos com inverso da posio das amostras, ter-se-ia:

Figura 11.22
Teste de
Odds Ratio
(Exemplo
11.11.1).

- 112 -

A leitura passaria a ser diferente: a chance dos no-fumantes de apresentar enfisema
pulmonar cerca de 4 vezes menor que a dos fumantes.

11.12 RISCO RELATIVO (RR)
O RR um teste para duas amostras dicotomizadas e dispostas em tabelas de
contingncia 2 x 2, no qual se calcula o quociente das propores p
1
e p
2
. bastante
utilizado para comparar a incidncia de eventos em pessoas expostas a determinado
fator de risco, em relao aos indivduos no expostos ao mesmo fator.

O programa determina tambm a probabilidade de RR e o intervalo de confiana de
95%. Se o risco relativo se aproxima da unidade, os eventos devem ser considerados
independentes, no havendo, por conseguinte, vantagem ou desvantagem entre eles.
De outro lado, quanto mais afastado de 1, maior a relao de dependncia entre os
eventos investigados. De acordo com Dawson-Saunders e Trapp, o RR deve ser
calculado em estudos de coorte ou de experimentos clnicos, nos quais um dos grupos
de pacientes submetido a determinado tratamento e o outro sem essa interferncia,
so seguidos durante determinado perodo de tempo (follow-up), a fim de que sejam
observadas as ocorrncias.

11.12.1 EXEMPLO
Foi realizada investigao com o PPD (reao de Mantoux) em uma coorte de
indivduos da faixa etria de 15 a 25 anos, de ambos os sexos, com seguimento
durante 3 anos. Constatou-se, ao final, que, em 9000 pessoas, cujo teste foi negativo,
3 contraram a tuberculose. Por sua vez, de 200 pessoas com teste positivo, duas
adoeceram com a referida infeo. Calcular o risco relativo de estar acometido da
doena entre os que apresentaram o teste positivo em relao queles cujos resultados
foram negativos ao PPD.
Figura 11.23
Teste de
Odds Ratio
(Exemplo
11.11.1 com
posio
invertida das
amostras).

- 113 -
11.12.2 INSTRUES
a) Clicar o mouse em Risco Relativo;

O Risco Relativo de uma pessoa com teste PPD positivo contrair a tuberculose 30
vezes maior do que se o teste for negativo. O resultado muito significativo (p <
0.0001), devendo o parmetro ser um valor dentro do espao compreendido entre 5.04
a 178.56 (IC 95%).

11.13 TAXA DE INCIDNCIA
Este teste destina-se a verificar se as taxas de incidncia (TI) de dois grupos
expostos e no expostos a determinado evento diferem ou no de modo
significativo.

11.13.1 EXEMPLO
Um levantamento foi efetuado em uma coorte de indivduos expostos e no expostos
a tuberculose no ambiente familiar. Ao final de um ano, obtiveram-se os seguintes
dados:

Nmero
de casos
Nmero de pessoas
no perodo

Expostos 40 2137

No Expostos 30 3485

H diferena nas taxas de incidncia desses grupos?

H
0
: TI
1
= TI
2
;
H
1
: TI
1
TI
2
;

11.13.2 INSTRUES
a) Clicar em Taxa de Incidncia;

Figura 11.24
Risco
Relativo
(Exemplo
11.12.1).

- 114 -

A diferena altamente significativa, havendo maior incidncia entre o grupo exposto
ao contgio domiciliar com o bacilo responsvel pela tuberculose. Os valores
esperados seriam: 27.0 no primeiro grupo e 43.0 no segundo, diferindo de modo
acentuado dos valores observados, 40 e 30, respectivamente.

11.14 COEFICIENTE DE VARIAO
Este teste permite comparar dois Coeficientes de Variao (CV) de dados mensurados
de variveis diferentes, por exemplo: peso (kg) e estatura (cm) de pr-escolares,
largura (cm) e peso (g) de folhas etc. Deve-se pressupor distribuio normal para os
dados.

11.14.1 EXEMPLO
Um estudo foi efetuado em uma maternidade, registrando-se o peso e o comprimento
de 40 recm-nascidos do sexo feminino, obtendo-se os dados inseridos no grid geral,
mostrados, em parte, na Figura 11.23.

H
0
: a variabilidade inerente ao peso a mesma variabilidade inerente ao
comprimento das crianas recm-nascidas do sexo feminino;
H
1
: a variabilidade inerente ao peso no a mesma da variabilidade inerente ao
comprimento das crianas recm-nascidas do sexo feminino;

11.14.2 INSTRUES
a) Clicar em Coeficiente de Variao;
b) Selecionar as colunas do grid geral;
Figura 11.26
Viso parcial
dos dados
do Exemplo
11.14.1.
Figura 11.25
Resultados
do Exemplo
11.13.1.

- 115 -

Os Coeficientes de Variao do peso (CV = 0.0578) e do comprimento (CV = 0.0411)
das crianas recm-nascidas do sexo feminino mostram maior variabilidade intrnseca
da primeira varivel, com um p-valor significativo. Rejeita-se, portanto, a hiptese de
nulidade.

11.15 TESTE DE POISSON
De uma populao com distribuio de Poisson, pode-se testar, atravs de dois
valores amostrais (Y1 e Y2), se eles so oriundos do mesmo universo.

Duas capivaras foram capturadas de modo randmico, sendo uma do sexo masculino
e outra do sexo feminino. Foi contado o nmero de colepteros que parasitavam cada
capivara, os quais apresentavam distribuio de Poisson. No animal do sexo
masculino observaram-se 26 parasitas, enquanto o registrado na capivara fmea foi
igual a 12. Testar a hiptese de que a quantidade de parasitas encontrados, em termos
mdios, est relacionada com o sexo dos animais capturados.

H
0
:
1
=
2

H
1
:
1

2

Nvel de deciso: alfa bilateral = 0.05.

11.15.2 INSTRUES
a) Clicar o mouse em Teste de Poisson;
b) Preencher as caixas de texto com os valores da primeira e da segunda amostra;
c) Clicar em Executar para resultados.

Figura 11.27
Coeficientes
de Variao:
Resultados
do Exemplo
11.14.1.
Figura 11.28
Teste de
Poisson
(Exemplo
11.15.1).

- 116 -
O valor de Z obtido estatisticamente significativo ao nvel alfa previamente fixado
(p = 0.0221), rejeitando-se a hiptese de nulidade. O nmero de parasitas encontrados
em cada animal diferente, podendo-se admitir que a parasitose mais intensa nas
capivaras do sexo masculino.

- 147 -
CAPTULO 11
DUAS AMOSTRAS RELACIONADAS

11.1 INTRODUO
um procedimento onde dois conjuntos so investigados, o segundo constitudo dos
mesmos elementos do primeiro, formando-se pares de unidades onde cada indivduo
contribui com dois escores, ou seja, funciona como seu prprio controle. So, pois,
amostras relacionadas, pareadas ou dependentes, tomadas para testar-se a mdia das
diferenas antes e depois da condio objeto da pesquisa.

Os testes estatsticos para duas amostras relacionadas classificam-se em:
i Teste t de Student: dados amostrais;
ii Teste t de Student: resumo amostral;
iii ANOVA.
i Correlao Intraclasse;
ii Kappa;
iii McNemar;
iv Sinais;
v Wilcoxon (Signed-Rank Test).

11.1.1 INSTRUES
a) Preencher duas colunas do grid geral com os dados: antes e depois, com exceo
do Teste de McNemar;
c) Apontar o mouse em Duas Amostras Relacionadas, para a escolha do teste:

11.2 TESTE t DE STUDENT: DADOS AMOSTRAIS
Teste paramtrico destinado a verificar se os dois grupos de escores dos mesmos
indivduos, cujas unidades foram retiradas ao acaso da populao, no apresentam
diferena em relao s mdias. Os dados devem ser mensurados em escala intervalar
ou de razes, sendo o teste empregado quando a varincia da populao das
diferenas desconhecida, com n 1 graus de liberdade, sendo n o nmero de pares.

Figura 11.1
Menu dos
aplicativos
para duas
amostras
relacionadas.

- 118 -
CAPTULO 12 DUAS AMOSTRAS RELACIONADAS

H
0
: a infeco malrica no altera o nmero de plaquetas no sangue perifrico do
homem:
D
= 0;
H
1
: a infeco malrica altera o nmero de plaquetas no sangue perifrico do homem:

D
0;

12.2.2 INSTRUES

O t calculado igual a -6.7053, com p < 0.0001, ou seja, a diferena observada
estatisticamente muito significativa, rejeitando-se a hiptese de nulidade e aceitando-
se a alternativa. Como o valor de t negativo, deduz-se que a contagem plaquetria
antes do tratamento era bem inferior quela obtida aps a teraputica contra a
infeco malrica, responsvel pela diminuio desses elementos figurados do sangue
perifrico do homem.

Figura 12.2
Dados do
Exemplo
11.2.1.
Figura 12.3
Resultados
do Exemplo
12.2.1.

- 119 -
12.3 ANOVA
Tem as mesmas caractersticas do teste t de Student para amostras pareadas, mas ao
invs de utilizar a mdia das diferenas entre os pares, emprega a anlise da varincia
entre os blocos.

12.3.1 EXEMPLO
Determinaram-se os nveis sangneos de triglicerdios em 12 pessoas em duas
ocasies: a) em jejum e b) 4 horas aps o almoo. Testar:

H
0
: no h diferena entre os nveis de triglicerdios em jejum e 4 horas aps o
almoo:
D
= 0;
H
1
: ocorre aumento dos nveis de triglicerdios aps o almoo quando comparados
com os valores obtidos em jejum:
D
> 0;
Nvel de deciso: alfa = 0.01, unilateral.

12.3.2 INSTRUES
a) Pressionar o mouse em ANOVA;

O F obtido (88.6160) altamente significativo (p < 0.001), para 1,11 graus de
liberdade, rejeitando-se a hiptese de nulidade e aceitando-se a alternativa. Os nveis
Figura 12.4
Dados do
Exemplo
12.3.1.
Figura 12.5
Resultados do
Exemplo
12.3.1.

- 120 -
de triglicerdios so maiores 4 horas aps o almoo do que os observados em jejum.
Se o teste t fosse realizado, obter-se-ia um valor calculado igual raiz quadrada de F.
Pode-se, ainda, visualizar o grfico destes dados, exibidos a seguir:

O grfico ilustra a relao entre os nveis de triglicerdios em jejum e 4 horas aps
refeio.

12.4 TESTE DE McNEMAR
Teste no-paramtrico para duas propores, no qual procura-se avaliar o grau de
discordncia de dois tratamentos a que foram submetidos os mesmos indivduos. Os
dados devem ser mensurados a nvel nominal ou ordinal e so dispostos em tabelas de
contingncia 2 x 2, conforme definido a seguir:

A (+ +) B (+ )
C ( +) D ( )

Verifica-se que nas caselas A e D h concordncia dos escores com ambos os
tratamentos: positivos e negativos. As demais caselas apresentam os pares
discordantes, de interesse no teste. O programa est disposto de maneira que pode
haver inverso na introduo dos dados, a saber:

A (+ ) B (+ +)
C ( ) D ( +)

Os pares discordantes podem, assim, estar inseridos nas caselas B e C ou nas caselas
A e D, e o programa calcula a probabilidade desses pares em ambas as situaes,
Figura 12.6
Grfico de
Colunas
Justapostas
do Exemplo
12.3.1.

- 121 -
devendo o pesquisador selecionar o resultado de acordo com o modo de inserir os
escores nas caixas de texto. O total de pares discordantes deve ser > 20.

12.4.1 EXEMPLO
Mediu-se a presso arterial sistlica em 620 indivduos utilizando-se o
esfigmomanmetro convencional na primeira medio e um modelo eletrnico na
segunda. Considerou-se normotenso a pessoa cuja presso sistlica era inferior a 150
mm. Os resultados foram estes:
a) hipertenso com ambos medidores: 240 (+ +);
b) hipertenso com modelo eletrnico e normotenso com o convencional: 100 (+ );
c) normotenso com o modelo eletrnico e hipertenso com o convencional: 60 ( +);
d) normotenso com ambos aparelhos: 220 ( ).

H
0
: no h discordncia nas propores dos resultados da presso arterial sistlica
medida pelo esfigmomanmetro convencional e pelo modelo eletrnico;
H
1
: h discordncia nas propores dos resultados da presso arterial sistlica medida
pelo esfigmomanmetro convencional e pelo modelo eletrnico;

12.4.2 INSTRUES
a) Pressionar o mouse em McNemar;
b) Preencher as caixas de textos com os escores.

Os pares discordantes foram inseridos nas caselas B e C e o resultado do teste
altamente significativo (p = 0.0020), rejeitando-se a hiptese de nulidade e aceitando-
se a alternativa. H discordncia nos resultados das medidas de presso arterial
sistlica entre os modelos utilizados na investigao, tendo ocorrido maior nmero de
pessoas consideradas hipertensas com o aparelho eletrnico.
Figura 12.7
Teste de
McNemar.

- 122 -
12.5 TESTE DOS SINAIS
Teste no-paramtrico onde se define, em cada par, a diferena dos escores antes e
depois do procedimento investigatrio, baseando-se apenas no sentido das diferenas
dos escores, registrados sob a forma de sinais: (+) e (). Os pares com resultados
iguais, considerados empatados, so eliminados do teste.

12.5.1 EXEMPLO
Em 20 voluntrios testou-se o tempo de reao a determinado estmulo antes e aps
exerccio fsico prolongado, registrado em segundos.

H
0
: no h diferena no tempo de resposta ao estmulo utilizado antes e aps
exerccio fsico prolongado: p = q = ;
H
1
: h diferena no tempo de resposta ao estmulo utilizado antes e aps exerccio
fsico prolongado: p q;

12.5.2 INSTRUES
a) Pressionar o mouse em Sinais;

O resultado muito significativo (p bilateral < 0.0001) e o poder do teste igual a
0.9970, rejeitando-se a hiptese de nulidade e aceitando-se a alternativa. O exerccio
fsico prolongado aumenta o tempo de resposta ao estmulo utilizado no experimento.

Figura 12.8
Dados do
Exemplo
12.5.1.
Figura 12.9
Resultados
do Exemplo
12.5.1.

- 123 -
12.6 TESTE KAPPA
Prova no-paramtrica destinada a comparar as propores da mesma varivel
mensurada a nvel nominal em duas ocasies diferentes. Testa-se a reprodutibilidade
dos resultados, admitindo-se que haver concordncia nas propores das respostas
nos dois perodos considerados. Os dados so inseridos em caixas de texto, sob a
forma de tabela de contingncia 2 x 2.

12.6.1 EXEMPLO
Foram enviados questionrios a 200 pessoas, solicitando informaes sobre o
atendimento do posto de sade localizado no bairro onde elas residiam:
A ) Atendimento adequado: 140 pessoas;
C ) Atendimento inadequado: 60 pessoas.

Dois meses mais tarde o procedimento foi repetido, obtendo-se:
B ) Atendimento adequado: 137 pessoas;
D ) Atendimento inadequado: 63 pessoas.

H
0
: As respostas relativas ao segundo questionrio so concordantes com as do
primeiro;
H
1
: As respostas referentes ao segundo questionrio no replicam as propores do
primeiro;

12.6.2 INSTRUES
a) Pressionar o mouse em Kappa;
b) Preencher as caixas de texto com os escores;
Figura 12.10
Teste
Kappa.

- 124 -
O valor de Kappa obtido no significativo (p = 0.3726), aceitando-se a hiptese de
nulidade. Houve replicabilidade nas respostas ao questionrio sobre as condies de
atendimento no posto de sade do bairro em questo.

12.7 TESTE DE WILCOXON
O teste de Wilcoxon teste T uma prova no-paramtrica destinada a comparar
dados pareados de uma amostra obtidos em ocasies distintas: antes e aps. Equivale
ao teste t de Student para dados relacionados, mas aplicado a dados mensurados pelo
menos a nvel ordinal, baseando-se no sentido e na magnitude das diferenas entre os
pares amostrais.

12.7.1 EXEMPLO
Culturas de linfcitos de 9 indivduos foram investigadas, determinando-se os ndices
mitticos antes e aps exposio luz fluorescente branca durante 60 minutos.

H
0
: no h diferena entre os ndices mitticos das clulas de culturas observadas
antes e aps exposio luz fluorescente branca;
H
1
: h diferena entre os ndices mitticos das clulas de culturas observadas antes e
aps exposio luz fluorescente branca;

12.7.2 INSTRUES
a) Pressionar o mouse em Wilcoxon;

O T obtido altamente significativo (p = 0.0077), rejeitando-se a hiptese de nulidade
e aceitando-se a alternativa. Os ndices mitticos so menores aps a aplicao nas
culturas de luz fluorescente branca.
Figura 12.11
Dados do
Exemplo
12.7.1.
Figura 12.12
Resultados
do Exemplo
12.7.1.

- 125 -
CAPTULO 13
ESTATSTICA DESCRITIVA

13.1 INTRODUO
A funo descritiva da estatstica consiste em sumarizar os dados coletados da
amostra ou da populao , ordenando-os e classificando-os, para torn-los de fcil
entendimento. O programa calcula o seguinte:

a) Informaes gerais:
i Nmero de escores (N);
ii Valor mnimo;
iii Valor mximo;
iv Amplitude total (At).
b) Medidas de tendncia central:
i Mediana (Md);
ii Mdia aritmtica ( ou X ).
c) Medidas de disperso:
i Primeiro e Terceiro Quartis;
ii Desvio Interquartlico
iii Varincia (
2
ou s
2
);
iv Desvio padro ( ou s);
v Erro padro (
x
ou
x
s );
vi Coeficiente de variao (CV).
d) Medidas de forma:
i Coeficiente de assimetria (g
1
);
ii Coeficiente de curtose (g
2
).

Os valores de g
1
e g
2
so iguais a zero (0) nas curvas simtricas e mesocrticas,
respectivamente.

Dependendo do tipo de dados, como, por exemplo, os referentes a crescimento
bacteriano, diluies sorolgicas e outros, o programa permite determinar a mdia, a
varincia e o desvio padro geomtricos.

13.1.1 EXEMPLO 1
Um pesquisador coletou 3 amostras, cuja varivel investigada era a presso arterial
sistlica:
a) Amostra A: 12 estudantes do sexo feminino;
b) Amostra B: 9 alunos do sexo masculino;
c) Amostra C: 10 docentes.

- 126 -
CAPTULO 13 ESTATSTICA DESCRITIVA

13.1.2 EXEMPLO 2
Em uma cultura de bactrias, o nmero aumentou de 1431, no final do 1
o
dia, para
3250, 9610, 26800 e 63300 ao trmino do 2
o
, 3
o
, 4
o
e 5
o
dias, respectivamente.
Descrever a amostra calculando a mdia geomtrica.

13.1.3 INSTRUES
c) Clicar o mouse em Estatstica Descritiva;
d) Selecionar as colunas do grid (1, 2, 3, , n);
e) Clicar em Executar o Teste, informando se a mdia geomtrica deve ser ou no
calculada.

Figura 13.1
Dados do
Exemplo
13.1.1.
Figura 13.2
Dados do
Exemplo
13.1.2.

- 127 -

A tabela contm os resultados das 3 amostras coletadas: medidas de tendncia central,
de disperso e de forma.

A mdia geomtrica a medida de tendncia central que mais se ajusta aos dados
amostrais, sendo duas vezes menor que a aritmtica e estando mais prxima da
mediana.
Figura 13.3
Resultados do
Exemplo
13.1.1.
Figura 13.4
Resultados
do Exemplo
13.1.2.

- 128 -

- 129 -
CAPTULO 14
ESTIMAO DE PARMETROS

14.1 INTRODUO
A estimao de parmetros parte da inferncia estatstica atravs da qual, a partir
dos dados amostrais, se inferem os valores numricos da populao investigada. O
BioEstat apresenta os seguintes programas de estimao paramtrica:

a) Da Mdia;
b) Da Proporo;
c) Da Diferena entre Duas Mdias;
d) Da Diferena entre Duas Propores;
e) Da Densidade e Tamanho da Populao;
f) Fentipos e Gentipos;
g) Fourier (densidade);
h) Equilbrio de Hardy-Weinberg;
i) Tamanho da Populao (amostragem simples, mtodo direto);
j) Tamanho da Populao (amostragem simples, mtodo inverso);
k) Tamanho da Populao (amostragem mltipla, populao fechada);
l) Tamanho da Populao (amostragem mltipla, populao aberta).

14.1.1 INSTRUES
b) Apontar o mouse em Estimao de Parmetros, como demonstra a Fig. 14.1:

14.2 ESTIMAO DA MDIA
A estimao da mdia populacional () efetuada de duas maneiras:
a) Estimao de Ponto;
b) Estimao de Intervalos de Confiana: 95% e 99%.
O procedimento consiste em retirar amostra aleatria da populao e computar a
mdia aritmtica cujo valor, com base no Teorema do Limite Central, constituir a
estimao de ponto da mdia do universo objeto da pesquisa. O desvio padro ser o
da populao () ou, se inexistir, o do valor amostral (s). Os intervalos de confiana,
para amostras com desvio padro paramtrico conhecido, tm por base a distribuio
de probabilidades da curva normal, ou seja, os escores padronizados z. Em caso
Figura 14.1
Menu de
Estimao de
Parmetros.

- 130 -
CAPTULO 14 ESTIMAO DE PARMETROS
contrrio, quando se utilizar o desvio padro amostral, o programa calcula os
intervalos de confiana com suporte na distribuio t de Student.

14.2.1 EXEMPLO
Determinaram-se os nveis de creatinina do sangue perifrico de 35 estudantes
universitrios, escolhidos de modo randmico e cujas idades variavam de 18 a 23
anos, obtendo-se, como mdia amostral, 1.041 mg/dl. O desvio padro da populao
conhecido, cujo valor igual a 0.2729 mg/dl. Desse modo, h:
a) Mdia amostral = 1.041 mg/dl;
b) Desvio padro paramtrico = 0.2729 mg/dl;
Efetuar as estimativas de ponto e de intervalos de confiana de 95% e 99%.

14.2.2 INSTRUES
a) Pressionar o mouse em Estimao da Mdia;
c) Clicar o boto correspondente ao desvio padro da populao ();
d) Clicar em Executar, para obter resultados.

H 95% de chance de que a mdia paramtrica seja um valor situado no espao
compreendido entre 0.9506 e 1.1314, e de 99%, entre 0.9220 e 1.1600.

14.3 ESTIMAO DA PROPORO
A estimao de uma proporo efetuada para populaes binomiais, onde a
proporo paramtrica uma frao do universo que possui determinada
modalidade ou categoria de interesse do pesquisador. A proporo da amostra
aleatria uma estatstica que estima a proporo paramtrica, representando a
Figura 14.2
Estimao de
ponto e de
intervalos da
mdia
(Exemplo
14.2.1).

- 131 -
estimativa de ponto da proporo populacional, assim definida: n k p / = , sendo k o
nmero de eventos observados da categoria de interesse e n o tamanho amostral.
Os clculos dos intervalos de confiana so efetuados com base na distribuio
normal, desde que o valor npq seja igual ou maior que 5, aspecto definido no
programa do BioEstat.

14.3.1 EXEMPLO
Um levantamento efetuado em hospital especializado em doenas neoplsicas revelou
que em uma coorte de 12000 mulheres, cujas idades variavam entre 40 e 50 anos, o
nmero de pacientes com cncer mamrio foi igual a 420. O valor npq igual a 40.53.
Efetuar as estimativas de ponto e de intervalos de confiana de 95% e 99%.

14.3.2 INSTRUES
a) Pressionar o mouse em Estimao da Proporo;

A estimativa de ponto igual a 0.035 (3.5%), devendo a proporo paramtrica ()
ser um valor situado no intervalo de 0.032 a 0.038, com probabilidade de 95%, ou
entre 0.031 e 0.039, com chance de 99%.

14.4 ESTIMAO DA DIFERENA ENTRE DUAS MDIAS
Do mesmo modo que se infere a mdia de uma populao, pode-se estimar a da
diferena entre duas mdias (
1

2
). Quando se conhecem as varincias
paramtricas, pressupe-se uma distribuio normal da amostragem dessa diferena,
independente do tamanho das amostras. Quando as varincias das populaes so
desconhecidas, as varincias amostrais so introduzidas e a distribuio da
amostragem passa a ser a t de Student. Todas as informaes concernentes
estimao da diferena entre duas mdias, inclusive, quando for o caso, sobre o
Figura 14.3
Estimao da
proporo
(Exemplo
14.3.1).

- 132 -
pressuposto da homogeneidade das varincias amostrais, so inseridas diretamente
nas caixas de texto do programa.

14.4.1 EXEMPLO
Coletaram-se duas amostras referentes ao peso (g) de recm-nascidos: uma de
populao caucaside e outra de universo amerndio, com 32 e 27 recm-natos,
respectivamente. Os dados obtidos foram os seguintes:

a) Mdia da primeira amostra = 3300g;
b) Varincia da primeira amostra = 80200;
c) Mdia da segunda amostra = 3050g;
d) Varincia da segunda amostra = 81000;
Em estudo prvio, as varincias amostrais foram consideradas homogneas. Efetuar
as estimativas de ponto e de intervalos de confiana de 95% e 99% da diferena entre
as duas mdias.

14.4.2 INSTRUES
a) Pressionar o mouse em Diferena entre Duas Mdias;
c) Clicar o boto correspondente a varincias amostrais (s
2
);
d) Pressionar em Executar e, a seguir, em Homogneas, para resultados.

Figura 14.4
Estimao da
diferena
entre duas
mdias
(Exemplo
14.4.1).

- 133 -
A estimativa de ponto da diferena entre as mdias igual a 250g, devendo o
verdadeiro valor paramtrico dessa diferena das populaes investigadas estar
situado entre os limites dos intervalos de confiana, com erro de estimao de 0.05 ou
0.01, IC (95%) e IC (99%), respectivamente.

14.5 ESTIMAO DA DIFERENA ENTRE DUAS PROPORES
Em algumas investigaes h interesse em calcular a magnitude da diferena entre
propores de duas populaes binomiais, desde que as amostras tenham valores npq
iguais ou superiores a 5 e que os escores p estejam prximos de 0.5. A distribuio de
amostragem da diferena entre duas propores binomiais (p
1
- p
2
) se aproxima da
curva normal, podendo-se, com base no Teorema do Limite Central, utilizar os
escores z para o clculo dos intervalos de confiana.

14.5.1 EXEMPLO
Um candidato a Reitor de uma universidade obteve, em consulta prvia efetuada em
dois Centros Profissionais da referida instituio de ensino, os seguintes resultados:
a) Centro Profissional A: 430 eleitores e 312 votos favorveis;
b) Centro Profissional B: 400 eleitores e 243 votos favorveis.

Efetuar as estimativas de ponto e de intervalos de confiana de 95% e 99% da
diferena entre as duas propores

14.5.2 INSTRUES
a) Pressionar o mouse em Diferena entre Duas Propores;

Figura 14.5
Estimao da
diferena
entre duas
propores
(Exemplo
14.5.1).

- 134 -
A estimativa de ponto da diferena entre as duas propores e os respectivos
intervalos de confiana de 95% e 99% esto contidos na Figura 14.5.

14.6 DENSIDADE E TAMANHO DA POPULAO
Em muitas pesquisas h interesse em determinar o tamanho do universo investigado
como, por exemplo, o nmero de indivduos acometidos de determinada doena
epidmica, o total de indivduos residentes em determinada rea geogrfica, a
quantidade de animais de uma espcie ameaada de extino etc.
O BioEstat estima o nmero de indivduos da rea geogrfica definida, ou seja, a
densidade populacional e, a seguir, procede a estimao da quantidade de indivduos
em todo o espao objeto da pesquisa.

14.6.1 EXEMPLO
Em uma regio geogrfica de 400 ares plantados com seringueiras, selecionaram-se
aleatoriamente 15 ares, examinando-se em cada um o nmero de plantas infectadas
por fungos, contando-se, ao final, 35 rvores parasitadas. Estimar a densidade por are
e o total de plantas infectadas.

14.6.2 INSTRUES
a) Pressionar o mouse em Densidade e tamanho da populao;

A densidade de seringueiras infectadas de 2.33 por are e a populao de rvores
com fungo em todos os 400 ares de terra atinge 933 unidades. Os resultados assinalam
os erros de estimao para o intervalo de confiana de 95%.

Figura 14.6
Densidade e
tamanho da
populao
(Exemplo
14.6.1).

- 135 -
14.7 FENTIPOS E GENTIPOS
A estimao das freqncias fenotpicas e genotpicas, calculadas pelo mtodo da
mxima-verossimilhana, compreende os seguintes sistemas:
a) Sistema Secretor; e) Sistema ESD;
b) Sistema ABO; f) Sistema Gm;
c) Sistema A1A2BO; g) Sistema Rh.
d) Sistema MN;
Tendo em vista que os procedimentos so similares, ser tomado um dos sistemas
para exemplificar a estimao paramtrica.

14.7.1 EXEMPLO
Em uma populao urbana brasileira retirou-se amostra aleatria de 200 pessoas de
ambos os sexos, determinando-se os grupos sangneos do sistema ABO, tendo sido
observado:

Estimar os fentipos e gentipos do sistema sangneo investigado.

14.7.2 INSTRUES
a) Apontar o mouse em Fentipos e Gentipos;
b) Clicar em Sistema ABO;
c) Preencher o grid especfico com os dados amostrais;
Figura 14.7
Fentipos e
gentipos:
Sistema ABO
(Exemplo
14.7.1).
Figura 14.8
Resultados
do Exemplo
14.7.1.

- 136 -
A diferena entre os fentipos observados e os esperados no significativa (p =
0.2638). A estimao final dos alelos est bem prxima da calculada inicialmente,
sendo a diferena entre o clculo inicial e o final dos alelos A e B inferior a um
desvio padro, enquanto do alelo O de apenas 1.19 desvio padro.

14.8 FOURIER (densidade)
O programa Fourier do BioEstat destinado a estimativas da densidade de
populaes animais. A largura do transecto determinada pela curva mais apropriada
de uma srie de probabilidades baseada na distribuio das distncias de observaes.

14.8.1 EXEMPLO
Em levantamento efetuado em certa reserva, no sentido de determinar a densidade de
uma espcie de macacos, a distncia perpendicular mxima foi igual a 50 metros e a
inventariada atingiu 2000 metros, tendo sido observados 12 grupos de indivduos
nesse espao. Estimar a densidade pelo mtodo de Fourier.

14.8.2 INSTRUES
a) Pressionar o mouse em Fourier;
b) Preencher as caixas de texto e o grid especfico;

Figura 14.9
Anlise da
srie de
Fourier
(Exemplo
14.8.1).
Figura 14.10
Resultados
do Exemplo
14.8.1.

- 137 -
A estimativa de 88.0 grupos de indivduos por km
2
. Os intervalos de confiana e as
medidas de variao esto contidos nos resultados.

14.9 LEI DE HARDY-WEINBERG
A estimao das freqncias genotpicas e das fenotpicas esperadas podem ser
calculadas, determinando-se se h aderncia entre os valores observados e aqueles
esperados, estes com base na determinao da freqncia gnica.
O teste do Qui-Quadrado efetuado com base nos dados fenotpicos mostra, em termos
probabilsticos, se a populao est ou no em Equilbrio de Hardy-Weinberg, sendo
o grau de liberdade igual ao nmero de alelos dominantes menos 1. O procedimento
bastante semelhante aos utilizados no item 14.11 deste Captulo sobre Fentipos e
Gentipos.
O BioEstat apresenta os seguintes exemplos:
a) Sistema ABO;
b) Sistema Haptoglobinas;
c) Sistema MN
Vamos apresentar um exemplo Sistema MN -, pois os procedimentos para os
demais sistemas so similares.

14.9.1 EXEMPLO
Coletou-se amostra de 500 indivduos de origem chinesa e seus descendentes,
determinando-se os respectivos grupos sanguneos do Sistema MN, com os
resultados contidos na Figura 14.12. Determinar se a populao de onde a amostra foi
retirada est em equilbrio de Hardy-Weinberg.

14.9.2 INSTRUES
d) Apontar o mouse em Lei de Hardy-Weinberg;
e) Preencher as caixas de texto (Fig. 14.11) como os dados dos grupos M, MN e N;
f) Pressionar em Executar, para resultados.

O Qui-Quadrdo igual a 15.9106, sendo o p-valor = 0.0001, para 1 grau de liberdade.
A populao no est em Equilbrio de Hardy-Weinberg.

Figura 14.11
Dados do
Exemplo
14.8.2.
Figura 14.12
Resultados
do Exemplo
14.8.2.

- 138 -
14.10 TAMANHO DA POPULAO (amostragem simples, mtodo direto)
A estimativa do tamanho de uma populao N aplicada na rea animal pelo
mtodo direto a partir dos dados amostrais e referentes a uma determinada rea
geogrfica. Este mtodo compreende duas etapas: na primeira capturam-se t animais,
os quais so marcados e devolvidos ao meio ambiente, e na segunda, alguns dias mais
tarde, capturam-se n indivduos, contando-se os marcados e os no-marcados. Com
esses dados pode-se estimar o tamanho da populao (N), processo que poder
repetir-se, periodicamente, avaliando-se o aumento ou a diminuio do universo
pesquisado.

14.10.1 EXEMPLO
Em uma reserva florestal de tamanho bem definido capturaram-se 250 capivaras, as
quais foram marcadas. Transcorridos 20 dias, repetiu-se a operao de recaptura
obtendo-se, ao final, 180 animais, dos quais 59 estavam marcados. Estimar o tamanho
da populao da espcie estudada.

14.10.2 INSTRUES
a) Pressionar o mouse em Tamanho da populao (amostragem simples, mtodo
direto);

O tamanho estimado da populao de 763 capivaras, podendo o parmetro ser um
valor situado entre 600 e 926 animais, conforme o clculo do intervalo de confiana
de 95%.

Figura 14.13
Tamanho da
populao:
mtodo direto
(Exemplo
14.10.1).

- 139 -
14.11 TAMANHO DA POPULAO (amostragem simples, mtodo inverso)
A metodologia semelhante do procedimento direto para o clculo do tamanho da
populao (N), com a seguinte diferena: na primeira etapa capturam-se t animais, os
quais so marcados e devolvidos ao meio ambiente, e, na segunda, algum tempo mais
tarde, recapturam-se tantos espcimes at que nesta amostra tenham sido apreendidos
n animais marcados e previamente determinados.

14.11.1 EXEMPLO
Foram capturados e marcados 250 mergulhes e devolvidos, a seguir, ao respectivo
habitat. Decorridas duas semanas, programou-se a recaptura de 33 aves marcadas,
sendo que o total da amostra para atingir esse objetivo foi de 120 indivduos. Estimar
o tamanho da populao objeto da pesquisa.

14.11.2 INSTRUES
a) Pressionar o mouse em Tamanho da populao (amostragem simples, mtodo
inverso);

O tamanho da populao de mergulhes foi estimada em 909 indivduos, podendo o
verdadeiro parmetro N ser um valor situado entre 643 e 1175 aves, definido pelo
intervalo de confiana de 95%.

14.12 TAMANHO DA POPULAO (amostragem mltipla, populao fechada)
O modelo para este teste o de Schumacher e Eschmeyer, considerando-se
populao fechada aquele universo que mantm constante seu tamanho durante o
perodo de investigao. O procedimento desses autores se baseia na regresso linear,
com ajustes pelo mtodo dos mnimos quadrados.
Os dados devem ser introduzidos no grid geral do BioEstat, obedecendo aos seguintes
critrios:
Figura 14.14
Tamanho da
populao:
mtodo
inverso
(Exemplo
14.11.1).

- 140 -
n
i
= tamanho de cada amostra;
m
i
= nmero de indivduos marcados em cada amostra;
M
i
= nmero de indivduos marcados na populao exatamente antes da i-sima
amostra ser coletada.

Uma populao de uma espcie de anuros foi investigada durante 6 dias consecutivos
para calcular o tamanho desse universo. Os dados abaixo indicam a maneira de
introduzir os dados no grid geral. Estimar o tamanho da populao e os intervalos de
confiana de 95% e 99%. Sendo a amostragem mltipla (6 amostras) e a populao
considerada fechada, o mtodo escolhido foi o de Schumacher e Eschmeyer.

14.12.2 INSTRUES
a) Cada linha deve ter a seguinte disposio:
Na linha 1: n
i
,nmero de animais capturados em cada amostra (marcados e
no marcados);
Na linha 2: m
i
, nmero de animais que j estavam marcados entre os
capturados na amostra;
Todos os animais capturados em cada amostra (n
i
) so marcados, exceto os
que j apresentavam a marca, portanto, quantificados na linha (m
i
);
b) Introduzir os dados no grid como mostra a Figura 14.15;
c) Pressionar o mouse em Tamanho da populao (amostragem mltipla, mtodo de
Schumaker e Eschmeyer);
d) Selecionar as colunas do grid a partir da coluna 2, sendo neste exemplo de 2 a 7,
totalizando as 6 amostras e clicar em Executar, para resultados.

Para obter o grfico desse Exemplo pressionar o mouse em Grfico da barra superior
da Figura 14.16.
Figura 14.16
Resultados
do Exemplo
14.12.1.
Figura 14.15
Resultados
do Exemplo
14.12.1.

- 141 -

14.13 TAMANHO DA POPULAO (amostragem mltipla, populao aberta)
O modelo para este teste o de Parker, considerando-se populao aberta aquele
universo que altera seu tamanho por migraes, nascimentos e bitos , durante o
perodo de investigao. O procedimento desse autor se baseia na regresso linear,
com ajustes pelo mtodo dos mnimos quadrados. De acordo com o autor, o
intercepto constitui uma estimativa do quociente entre o nmero de indivduos
marcados na populao e o tamanho do universo.
Os dados devem ser introduzidos no grid geral do BioEstat, obedecendo aos seguintes
critrios:
NACMD = nmero de animais inicialmente capturados, marcados e devolvidos
ao respectivo meio ambiente;
perodos
i
= nmero de perodos de recaptura (i = 1, 2, 3, ... , p);
n
i
= nmero de indivduos capturados em cada amostra;
m
i
= nmero de indivduos marcados e recapturados em cada amostra;

Na regio de Mamirau, Estado do Amazonas, amostra de 3250 peixes de
determinada espcie foram capturados, marcados e devolvidos ao meio ambiente.
Posteriormente, efetuaram-se em 5 perodos distintos e consecutivos novas capturas,
contando-se, em cada apreenso, o nmero de animais capturados (marcados e no
marcados). Os dados da Figura 14.18 indicam o procedimento da introduo dos
dados no grid geral. Estimar o tamanho da populao e os intervalos de confiana de
95% e 99%. Tratando-se de amostragem mltipla e a populao sendo considerada
aberta, o mtodo escolhido foi o de Parker.
Obs.: Somente foram marcados os 3250 indivduos iniciais, nenhum outro animal foi
marcado durante as capturas posteriores.
Figura 14.17
Grfico
do Exemplo
14.12.1.

- 142 -
14.13.2 INSTRUES
a) Introduzir os dados no grid como mostra a Figura 14.18;
b) Pressionar o mouse em Tamanho da Populao (amostragem mltipla, mtodo
de Parker);
c) Selecionar as colunas do grid: 1, 2 e 3, neste exemplo;
d) Clicar em Executar e preencher a caixa de texto com o nmero de espcimes
capturadas (NACMD), marcadas e devolvidas ao meio ambiente, o qual somou
3250 unidades;
e) Pressionar em OK, para resultados.

O nmero de animais da espcie em questo estimados e os respectivos intervalos de
confiana esto contidos nos resultados.
Figura 14.18
Dados do
Exemplo
14.13.1.
Figura 14.19
Resultados
do
Exemplo
14.13.1.

- 143 -
CAPTULO 15
META-ANLISE

15.1 INTRODUO
Define-se Meta-Anlise como um procedimento destinado a examinar, de modo
simultneo, vrias investigaes, diversas pesquisas sobre um mesmo tpico. Esse
tipo de estudo vem sendo largamente utilizado na esfera mdica, para, atravs de
numerosos dados de vrios trabalhos sobre determinado assunto, aumentar o nvel de
confiana nas inferncias estatsticas, com objetivos teraputicos e outros. Alguns
estudos, como se sabe, sobre determinada matria, so concordantes, mas podem
tambm ser contraditrios, o que aumenta a necessidade de anlises conjuntas para
que se possa concluir com maior segurana.

Embora o conceito de Meta-Anlise seja oriundo de uma escola de metodologia
desenvolvida por Glass em 1976, estudos genticos sobre gentipos e fentipos j
abrangiam esse conceito, conforme descrito por Sokal e Rohlf (Biometry, 1969), sob
o ttulo "Replicated tests of goodness of fit" (pgina 575), ou seja, a combinao de
vrias amostras com informaes sobre o mesmo assunto, para obter estimativas mais
precisas das propores paramtricas.

importante distinguir os efeitos observados entre os diversos estudos examinados
em conjunto:
1 - quando diferem somente em decorrncia do erro amostral, ou seja, o
verdadeiro efeito o mesmo em cada um dos estudos, na mesma direo e no devido
a diferenas sistemticas em cada trabalho, diz-se que as amostras so homogneas e
as diferenas so consideradas efeitos randmicos ou aleatrios;
2 - outras vezes os efeitos observados ultrapassam o esperado pelo erro amostral,
existindo diferenas reais entre os estudos examinados. Quando isso ocorre,
denominando-se o efeito, neste caso, de efeito fixo, o qual pode acontecer na mesma
direo dos tratamentos efetuados - favorvel ou no - ou em diferentes direes -
benfico e adverso, sendo as amostras consideradas heterogneas..

Alguns autores aplicam em tabelas 22 o teste do Qui-Quadrado de heterogeneidade.
Quando o teste significativo, escolhem testes de efeitos aleatrios, como o de
DerSimonian-Laird; caso contrrio, os de efeitos fixos, sendo o mais conhecido o de
Mantel-Haenszel.

Existem vrias discusses, contudo, sobre a escolha do teste, mas preciso lembrar
ser fundamental preencher, pelo menos, estas recomendaes:
a) as amostras devem ser aleatrias, representativas da populao em estudo;
b) os experimentos devem ser controlados, escolhendo-se os indivduos de modo
randmico para cada grupo. Estes procedimentos so designados na literatura
inglesa como RCT (Randomized Controlled Trials);

- 144 -
CAPTULO 15 META-ANLISE
c) os critrios de tratamento devem ser semelhantes entre os estudos submetidos
meta-anlise;
d) rigorosa escolha dos trabalhos publicados, podendo-se incluir pesquisas ainda no
editadas, desde que atendam os requisitos antes referidos.

O BioEstat apresenta os seguintes aplicativos para Meta-Anlise:
a) Efeito Aleatrio: DerSimonian-Laird: para k tabelas 2 x 2;
b) Efeito Fixo: Dados Contnuos
c) Efeito Fixo: Mantel-Haenszel e Odds Ratio: para k tabelas 2 x 2;
d) p-valor (pw, combinado);
e) Qui-Quadrado (aderncia): para k amostras;
f) Qui-Quadrado (independncia): para k tabelas 2 x 2;
g) Regresso (w): para n amostras;
h) Risco relativo (w), para k tabelas 2 x 2;
i) Teste G (aderncia): para k amostras;
j) Vrias Correlaes (rw combinado);
k) Vrias Propores (pw combinado).

15.1.1 INSTRUES
b) Apontar o mouse em Meta-Anlise, conforme mostra a Figura 15.1;
c) Introduzir os dados no grid geral ou nas caixas de texto, conforme o teste.

15.2 EFEITO ALEATRIO: TESTE DE DerSimonian-Laird
Este teste recomendado quando o Qui-Quadrado da heterogeneidade significativo,
aplicvel em k tabelas de contingncia 2 x 2.

15.2.1 EXEMPLO (dados hipotticos)
Foram efetuados estudos sobre doena grave ocorrida em pessoas adultas, sendo, em
todos esses estudos, um grupo submetido ao tratamento (A) e o outro ao tratamento
tradicional (B). As amostras foram aleatrias e os indivduos de cada grupo
escolhidos pelo processo de randomizao. Os resultados obtidos, aps o perodo de
tratamento previamente estabelecido, foram os seguintes:

Figura 15.1
Menu de
Meta-Anlise

- 145 -
Grupo A Grupo B
Tabelas (Estudos) Sucessos (a) Insucessos (b) Sucessos (c) Insucessos (d) Total
1 181 29 157 52 413
2 214 69 108 37 428
3 118 36 78 39 271
4 100 3 40 4 147
5 1 31 32 4 68
6 217 60 192 81 550
7 163 40 151 53 407
8 109 21 107 25 262
9 906 110 901 112 2029
10 345 80 113 26 564
11 212 30 201 50 493
12 33 17 38 12 100
13 24 16 28 20 88
14 30 1 47 10 88
15 100 1 29 3 133
16 250 173 244 177 844
17 180 29 165 32 406
18 307 41 318 47 713
19 100 6 97 7 210
20 1113 37 1080 48 2234
21 190 40 200 27 457
22 92 16 50 2 160
23 132 10 130 14 286
24 4270 268 4267 247 9052
25 369 48 355 61 833
26 123 1 97 2 223
27 293 18 300 11 622
28 1840 67 1830 72 3809
29 2000 43 1990 42 4075
30 6540 33 1661 3 8237

H
0
: a proporo de casos favorveis igual em ambos tratamentos;
H
1
: a proporo de casos favorveis maior com o tratamento A;

15.2.2 INSTRUES
a) Apontar e pressionar o mouse em Efeito Aleatrio: DerSimonian-Laird;
b) Preencher as caixas de texto com os dados do Exemplo 15.2.1, Estudo 1;
c) Clicar em Prxima Tabela e introduzir os dados do Estudo 2, e assim,
sucessivamente, at o Estudo 30;
d) Aps introduzir os ltimos dados, clicar em Executar, para resultados.

- 146 -

O Odds Ratio (1.1486) significativo (p-valor = 0.0285) e contido no Intervalo de
Confiana 95% (1.0149 a 1.2999), cujo limite inferior est acima da unidade (valor
1), rejeitando-se, portanto, a hiptese de nulidade. O teste de heterogeneidade foi
significativo (p-valor = 0.0181), o que sugere o teste escolhido - DerSimonian-Laird.
O tratamento A, em concluso, superior ao B. O nmero total de indivduos
cuidados com os tratamentos referidos de 38202, conferindo maior relevncia ao
resultado.

15.3 EFEITO FIXO: DADOS CONTNUOS
Em determinadas situaes dispomos de vrios estudos sob a forma de dados
contnuos, medidos em escala intervalar ou de razes, onde cada estudo compara duas
amostras independentes. Essas pesquisas podem ser reunidas, desde que se tratem do
mesmo tpico.

Duas drogas foram utilizadas no tratamento de indivduos com taxas elevadas de
colesterolemia, cujas idades variavam entre 40 a 60 anos. A finalidade da pesquisa
era testar o "risco de aterosclerose" em 10 estudos independentes, do ponto de vista
do Coeficiente Total/HDL. Dos dados coletados, registrou-se o tamanho das amostras,
os valores mdios dos coeficientes obtidos e os respectivos desvios padres, dispostos
no grid geral (Fig. 15.3), como segue:

Figura 15.2
Resultados
do Exemplo
15.2.1.

- 147 -
a) N (A): tamanho das amostras com a droga A;
b) Mdia (A): mdia dos Coeficientes das amostras (tratamento A);
c) DP (A): desvio padro das amostras (tratamento A);
d) N (B): tamanho das amostras com a droga B;
e) Mdia (B): mdia dos Coeficientes das amostras (tratamento B);
f) DP (B): desvio padro das amostras (tratamento B);

H
0
: no h diferena entre as mdias dos Coeficientes Total/HDL entre os
tratamentos A e B:
1
=
0
;
H
1
: h diferena entre as mdias dos Coeficientes Total/HDL entre os tratamentos
A e B:
1

0
;

15.3.2 INSTRUES
a) Inserir os dados no grid geral, conforme mostra a Figura 15.3, obedecendo
rigorosamente ordem e disposio dos dados nas colunas desse grid;
b) Apontar e pressionar o mouse em Efeito Fixo: Dados Contnuos;
c) Selecionar as 6 colunas do grid geral e Executar, para resultados.

Os resultados apresentam diferena muito significativa (p-valor = 0.0016) entre os
dois tratamentos, podendo-se dizer que a mdia dos Coeficientes Total/HDL com a
droga A inferior aos obtidos com a droga B (Mdia das diferenas = 0.2725).
Foram testados 3792 indivduos no grupo A e 3701, no B, totalizando 7493 pessoas.
Figura 15.3
Dados
do Exemplo
15.3.1.
Figura 15.4
Resultados
do Exemplo
15.3.1.

- 148 -
15.4 EFEITO FIXO: TESTE DE MANTEL-HAENSZEL
Este teste tambm utilizado em anlise de sobrevivncia, mas indicado para
avaliao dos chamados efeitos fixos, utilizando-se k tabelas 2 x 2. Calcula-se,
simultaneamente, o valor do Odds Ratio e o respectivo intervalo de confiana.

15.4.1 EXEMPLO
Estudos realizados (dados hipotticos) em diferentes centros populacionais, sobre a
ocorrncia de cncer pulmonar em fumantes e no fumantes, revelaram o seguinte:

BELFAST Com cncer Sem cncer
Fumantes 12 598
No Fumantes 2 613

LISBOA Com cncer Sem cncer
Fumantes 14 734
No Fumantes 3 758

LONDRES Com cncer Sem cncer
Fumantes 14 709
No Fumantes 5 742

MADRID Com cncer Sem cncer
Fumantes 17 684
No Fumantes 4 650

BERLIM Com cncer Sem cncer
Fumantes 22 918
No Fumantes 3 832

H
0
: a prevalncia de cncer pulmonar em indivduos fumantes igual a da observada
em pessoas no fumantes:
1
=
0
;
H
1
: a prevalncia de cncer pulmonar em indivduos fumantes diferente da
observada em pessoas no fumantes:
1

0
;

15.4.2 INSTRUES
a) Apontar e pressionar o mouse em EfeitoFixo: Mantel-Haenszel;
b) Preencher as caixas de texto com os dados da primeira tabela 2 x 2;
c) Clicar em Nova Tabela e introduzir os dados da segunda tabela e assim,
sucessivamente, at a ltima tabela;

- 149 -

A meta-anlise, efetuada em amostras coletadas por vrios investigadores, em 5
cidades do continente europeu, revelou o seguinte: a diferena, expressa em termos de
Qui-quadrado, estatisticamente muito significativa (p < 0.0001), ou seja, a
proporo de indivduos fumantes com cncer pulmonar maior que a de no
fumantes com essa neoplasia. O Odds Ratio indica que essa proporo 4 vezes e
meia maior entre fumantes, com intervalo de confiana (95%) de 2.71 a 7.76. O total
de indivduos testados nessas 5 amostras foi igual a 7334, o que confere maior
segurana nos resultados obtidos.

15.5 P-VALOR (pw combinado)
Em alguns estudos, sobre o mesmo tpico, dispe-se das probabilidades de erro na
concluso de cada pesquisa de acordo com a hiptese formulada. H, assim, o p-valor
de cada trabalho, sendo possvel, nesses casos, reuni-los para meta-anlise obtendo-
se, ao final, um p-valor que representa o conjunto de dados submetidos ao teste. O p-
valor de cada estudo transformado em logaritmo neperiano, aplicando-se, ao final, o
teste do Qui-quadrado para obteno do valor combinado (w = pooled).

15.5.1 EXEMPLO
Coletaram-se 15 estudos e as respectivas probabilidades (p-valor) de testes efetuados
em amostras aleatrias, com o pressuposto de distribuio normal das populaes de
onde eram oriundas e o conhecimento das varincias paramtricas.
Foi aplicado o teste Z em cada um dos estudos efetuados. Os dados referidos esto
dispostos na Fig. 15.6.

H
0
: as probabilidades dos testes submetidos meta-anlise no apresentam p-valor
combinado (w) significativo;
Figura 15.5
Resultados
do Exemplo
15.3.4.

- 150 -
H
1
: as probabilidades dos testes submetidos meta-anlise apresentam p-valor
combinado (w) significativo;

15.5.2 INSTRUES
a) Inserir os dados no grid geral conforme mostra a Figura 15.6
b) Apontar e pressionar o mouse em p-valor;
c) Selecionar a coluna 2 e clicar em Executar, para resultados.

O Qui-quadrado com 30 graus de liberdade foi igual a 86.6554, cujo p-valor (w)
altamente significativo (p < 0.0001).

15.6 QUI-QUADRADO (aderncia): PARA k AMOSTRAS
Indicado para comparar vrias amostras em testes de aderncia..

15.6.1 EXEMPLO
Coletaram-se 4 amostras sobre sazonalidade de nascimentos de crianas cujos pais
residiam em localidades rurais ou urbanas do Mdio Solimes:

H
0
: O desvio entre Observado e o Esperado nas categorias de cada amostra ocorrem
na mesma direo, sendo as mesmas homogneas;
H
1
: O desvio entre Observado e o Esperado nas categorias de cada amostra ocorrem
em diversas direes, sendo as mesmas heterogneas;

Categoria A Categoria B
Nascimentos de maio a
outubro (tempo menos
chuvoso e de vazante do rio)
Nascimentos de novembro
a abril (perodo chuvoso e
de enchente do rio)
Figura 15.6
Dados
parciais
do Exemplo
15.5.1.
Figura 15.7
Resultados
do Exemplo
15.5.1.

- 151 -
15.6.2 INSTRUES
a) Apontar o mouse em Qui-quadrado Aderncia: Homogeneidade;
b) Preencher as caixas de texto com o nmero de amostras e de categorias, em
seguida preencher o grid especfico com os dados;

O total de nascidos no perodo A atingiu 1540, enquanto no perodo B somou 1670.

As amostras so homogneas (p = 0.0218), ou seja, ocorreu, em todas as amostras,
maior nmero de nascimentos no perodo chuvoso e de enchente do rio (Categoria B).
No h evidncia de heterogeneidade das amostras (p = 0.5245).

15.7 QUI-QUADRADO (independncia): PARA k TABELAS 2 x 2
Da mesma forma, neste teste procura-se verificar se as amostras foram retiradas da
mesma populao, isto , se elas so homogneas ou no.

15.7.1 EXEMPLO
Em oito localidades endmicas de malria efetuou-se pesquisa de controle de casos
(hospitalares), registrando-se os indivduos que eram admitidos com manifestaes
sugestivas da doena, oriundos da zona urbana ou da rea rural, confirmando-se ou
no o diagnstico a posteriori. As propores de casos positivos e negativos de cada
municpio foram estas:

ZONA Municpio A Municpio B Municpio C Municpio D

URBANA
RURAL
POSITIVO NEGATIVO
35 50
70 55
POSITIVO NEGATIVO
48 56
74 60
POSITIVO NEGATIVO
17 18
29 20
POSITIVO NEGATIVO
30 52
73 39

Figura 15.8
Dados do
Exemplo
15.6.1.
Figura 15.9
Resultados
do Exemplo
15.6.1.

- 152 -
ZONA Municpio E Municpio F Municpio G Municpio H

URBANA
RURAL
POSITIVO NEGATIVO
33 52
75 50
POSITIVO NEGATIVO
43 66
78 47
POSITIVO NEGATIVO
31 55
78 40
POSITIVO NEGATIVO
31 59
74 38

Os totais gerais foram estes:
a) Zona Urbana: testes positivos 268 casos;
b) Zona Urbana: testes negativos 408 casos;
c) Zona Rural: testes positivos 551 casos;
d) Zona Rural: testes negativos 349 casos;
e) Total geral = 268 + 408 + 551 + 349 = 1576 casos

H
0
: a incidncia da malria no est relacionada com a rea de residncia dos
pacientes;
H
1
: a incidncia da malria ocorre com mais freqncia em pessoas residentes na
zona rural, havendo, portanto, associao;

15.7.2 INSTRUES
a) Apontar o mouse em Qui-quadrado: independncia;
b) Preencher as caixas de texto com os dados da primeira tabela (municpio A);
c) Clicar em Nova Tabela e introduzir os dados da segunda tabela (municpio B), e
assim sucessivamente, de acordo com o nmero de tabelas dos municpios
submetidos ao teste;
d) Aps introduzir a ltima tabela (municpio H, nesse exemplo), clicar em
Executar.

O Qui-Quadrado de associao muito significativo (p < 0.0001), rejeitando-se a
hiptese de nulidade e aceitando-se a alternativa. A incidncia de malria maior nas
zonas rurais do que nas urbanas nos oito municpios investigados, compreendendo
1576 pessoas. As amostras no so heterogneas.
Figura 15.10
Resultados
do Exemplo
15.7.1.

- 153 -
15.8 REGRESSO LINEAR (w): PARA k AMOSTRAS
Trata-se de verificar se vrias amostras, no que diz respeito aos coeficientes de
regresso e aos interceptos, provieram do mesmo universo. Trata-se de uma
combinao das anlises de varincia e de regresso, conhecida como Anlise de
Covarincia ou ANCOVA. O programa determina, ainda, o coeficiente de regresso
(b) e o intercepto (a) de cada amostra, bem como o coeficiente de regresso conjunto,
tambm denominado pooled regression, simbolizado por Bw. A homogeneidade dos
coeficientes de regresso e dos interceptos determinada pela anlise de varincia,
constatando-se ou no se eles so oriundos da mesma populao, ou seja, se so
homogneos ou heterogneos. As amostras podem ser de diferentes tamanhos.

15.8.1 EXEMPLO
Registrou-se a presso arterial diastlica (P.A.D.) de pessoas do sexo feminino, cujas
idades variavam de 39 a 73 anos, selecionando-se, ao acaso, trs amostras obtidas em
diferentes cidades, cada uma constituda de 8 indivduos. O objetivo do estudo
verificar se a relao entre a idade e a P.A.D. homognea, para as trs amostras
levantadas. As hipteses formuladas foram as seguintes:

H
0
: Os coeficientes de regresso so iguais, pois as amostras foram retiradas da
mesma populao: b
1
= b
2
= b
3
;
H
1
: Os coeficientes de regresso so desiguais, pois as amostras foram retiradas de
populaes diferentes: pelo menos um b
i
b
j
;
H
0
: Os interceptos so iguais, pois as amostras foram retiradas da mesma populao:
a
1
= a
2
= a
3
;
H
1
: Os interceptos so desiguais, pois as amostras foram retiradas de populaes
diferentes: pelo menos um a
i
a
j
;

15.8.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, introduzindo na primeira coluna
os valores da varivel idade (X
1
) e na seguinte, os valores da varivel P.A.D.
(Y
1
) e, de modo sucessivo, para as demais amostras;
b) Clicar em Homogeneidade e selecionar as colunas do grid geral;
Figura 15.11
Dados do
Exemplo
15.8.1.

- 154 -

A anlise comparativa dos coeficientes de regresso exibe um valor de F (Regresso)
no-significativo, pois p = 0.3716, para 2,18 graus de liberdade, aceitando-se por isso
a hiptese de nulidade. O mesmo pode-se afirmar da anlise comparativa dos
interceptos, cujo valor de F (Interceptos) no significativo, sendo p = 0.8889, com
2,20 graus de liberdade. Assim, os coeficientes de regresso das amostras - b
1
, b
2
e b
3

so homogneos, o mesmo acontecendo com os interceptos - a
1
, a
2
e a
3
. Conclui-se
que as diferenas observadas so atribudas variao amostral e que os subconjuntos
foram retirados do mesmo universo: as amostras so homogneas. O coeficiente de
regresso conjunto - pooled regression - igual a 0.7065 (Bw), cujo valor de p
menor que 0.0001. A Figura 15.12 exibe, ainda, os valores do intercepto (a) e do
coeficiente de regresso (b) de cada amostra.

15.9 RISCO RELATIVO (w): PARA k TABELAS 2 x 2
Da mesma forma que se calcula o "Odds Ratio" (Teste de Mantel-Haenszel) em
tabelas 2 x 2, pode-se verificar o Risco Relativo (RR), como se demonstra a seguir.

15.9.1 EXEMPLO
O mesmo exemplo 15.4.1 e as respectivas tabelas 2 x 2, formulando-se as seguintes
hipteses:

H
0
: o risco relativo de cncer pulmonar em indivduos fumantes igual o do
observado em pessoas no fumantes;
H
1
: o risco relativo de cncer pulmonar em indivduos fumantes maior que o
observado em pessoas no fumantes;
Figura 15.12
Resultados
do Exemplo
15.8.1.

- 155 -
15.9.2 INSTRUES
a) Apontar e pressionar o mouse em Risco Relativo;
b) Preencher as caixas de texto com os dados da primeira tabela 2 x 2;
c) Clicar em Nova Tabela e introduzir os dados da segunda tabela e assim,
sucessivamente, de acordo com o nmero de tabelas;
d) Aps introduzir a ltima tabela, clicar em Executar, para resultados.

O Risco Relativo de cncer pulmonar cerca de 4 vezes maior em fumantes do que
em no fumantes, sendo a diferena muito significativa (p < 0.0001). As amostras so
homogneas, ou seja, na mesma direo, como pode ser visto no resultado do teste do
Qui-quadrado de homogeneidade = 35.26 e p < 0.0001.

15.10 TESTE G (aderncia): PARA k AMOSTRAS
O teste G de aderncia semelhante ao teste do Qui-Quadrado de aderncia para
vrias amostras, sendo os valores esperados em cada categoria dispostos em uma
nica coluna, em nmeros decimais.

15.10.1 EXEMPLO
Vale a pena repetir o mesmo exemplo do Qui-Quadrado (Exemplo 15.6.1), para o
teste de Homogeneidade (aderncia) com 4 amostras, sobre sazonalidade de
nascimentos de crianas cujos pais residiam em localidades rurais ou urbanas do
Mdio Amazonas, estando os dados assim dispostos:

Categoria A: nascimentos de maio a outubro;
Categoria B: nascimentos de novembro a abril.

Figura 15.13
Resultados
do Exemplo
15.9.1.

- 156 -
H
0
: os desvios entre os valores observados e os esperados em cada categoria ocorrem
na mesma direo: as amostras so homogneas;
H
1
: os desvios entre os valores observados e os esperados em cada categoria ocorrem
em diversas direes: as amostras so heterogneas;

15.10.2 INSTRUES
a) Apontar o mouse em Teste G aderncia: Homogeneidade, surgindo a Figura
15.14.
b) Preencher as caixas de texto com o nmero de amostras e o de categorias, 4 e 2,
respectivamente, no presente caso;
c) Clique em Executar;

d) Preencher, a seguir, com os dados amostrais, as caixas de texto conforme
demonstrado na Figura 15.15, clicando em Executar, para resultados.

Os resultados mostram que as amostras so homogneas, com valores observados e
esperados na mesma direo, sendo o teste significativo com p-valor igual a 0.0217.
Aceita-se, assim, a hiptese de nulidade, rejeitando-se a hiptese alternativa. Os
resultados so semelhantes aos obtidos no teste de Homogeneidade (aderncia) pelo
Qui-Quadrado, sendo tambm o G Heterogeneidade no significativo (p = 0.5234).
Figura 15.14
Quantidade
de amostras
e de
categorias.
Figura 15.15
Entrada de
dados do
Teste G.
Figura 15.16
Resultados
do exemplo
15.7.1.

- 157 -
15.11 VRIAS CORRELAES (rw combinado)
Destinado a testar vrios coeficientes de correlao linear (r), no sentido de verificar
se foram retirados da mesma populao, ou seja, se as amostras de onde provieram
apresentam homogeneidade.

15.11.1 EXEMPLO
Pesquisa realizada sobre a associao linear entre peso e estatura de recm-nascidos
foi efetuada em 3 maternidades, com a finalidade de verificar se as amostras eram
homogneas. Cada amostra, independentemente do tamanho, tem um valor de r
correspondente ao grau de associao entre as duas variveis analisadas.
H
0
: r
1
= r
2
= r
3
;
H
1
: pelo menos r
i
r
k
;

15.11.2 INSTRUES
a) Pressionar o mouse em Vrias correlaes: homogeneidade;
b) Preencher a tela seguinte (15.17) com o nmero de amostras a testar, sendo 3
neste exemplo, pressionando-se, ento, em Montar Grid;

c) Preencher ento o grid especfico com o Tamanho de cada amostra e o respectivo
valor de r e clicar em Executar, para resultados.

O p-valor (0.0040) do teste com todas as amostras muito significativo, embora elas
no sejam oriundas da mesma populao, ou seja, elas so heterogneas. Quando os
valores de r so comparados entre si, constata-se que h diferena significativa entre
os coeficientes das amostras 2 e 3 e muito significativa entre aqueles representados
pelas amostras 1 e 3. Observa-se, ainda, que no h diferena significativa entre os
coeficientes das amostras 1 e 2.
Figura 15. 17
Nmero de
amostras.
(Exemplo
15.11.1)
Figura 15.18
Dados do
Exemplo
15.11.1.
Figura 15.19
Resultados
do Exemplo
15.11.1

- 158 -
15.12 VRIAS PROPORES (pw combinado)
Em determinados estudos h interesse em comparar vrias propores no sentido de
determinar se elas provieram ou no do mesmo universo, podendo ser efetuada a
pesquisa por este modelo de procedimento.

15.12.1 EXEMPLO
Procurou-se avaliar se os resultados da contagem de linfcitos na frmula leucocitria
do sangue perifrico eram influenciados pelos tipos de aparelhos eletrnicos
atualmente utilizados pelos laboratrios clnicos. Retirou-se amostra sangnea de um
indivduo considerado clinicamente normal e efetuou-se o procedimento laboratorial
em 4 aparelhos de marcas diferentes: A, B, C e D. Os resultados foram estes:

H
0
: No h diferena nas propores de linfcitos obtidas atravs de 4 aparelhos
diferentes: p
1
= p
2
= p
3
= p
4
;
H
1
: H diferena nas propores de linfcitos obtidas nos aparelhos testados: pelo
menos duas propores so desiguais; p
i
p
j
;

15.12.2 INSTRUES
a) Clicar o mouse em Vrias Propores;
b) Selecionar as colunas do grid geral referentes aos dados das colunas 2 e 3;

O Qui-Quadrado obtido igual a 8.9866 (gl = 3) e o p-valor = 0.0295, rejeitando-se a
hiptese de nulidade. Observa-se que as propores 1 e 2 apresentam diferena
estatisticamente significativa (p-valor < 0.05).
A proporo de linfcitos nos aparelhos A e B so, portanto, diferentes, sendo que as
demais comparaes apresentam resultados semelhantes.
Figura 15.21
Resultados
(Exemplo
15.12.1).
Figura 15.20
Dados do
Exemplo
15.12.1

- 159 -
15.13 GRFICOS FOREST PLOT E ANLISE DOS DADOS
Pode-se obter Grficos de alguns exemplos dos testes de Meta-Anlise, sob a forma
de Forest Plot. Alguns so exibidos em escala logartmica, utilizada nos testes que
envolvem Odds Ratio e Risco Relativo, enquanto que a escala decimal usada em
testes de Dados Contnuos. A barra horizontal representa o intervalo de confiana de
cada estudo. O ponto central um retngulo - o odds ou a mdia das diferenas,
cujo tamanho proporcional ao inverso da varincia, designado peso, como se
observa na Anlise dos Dados. .

15.13.1 EXEMPLO 15.2.1 DerSimonnian-Laird
a) Pressionar o mouse em Grfico na barra da Figura 15.2, para resultado.

O Odds Ratio (w) combinado est representado na parte inferior do grfico, sob a
forma de um pequeno losango, cujo limite inferior maior que a unidade (1.015).
Se se desejar os dados de cada amostra (Odds Ratio) e respectivos Intervalos de
Confiana (95%), pressionar com o mouse em Anlise na barra da Figura 15.2.
Figura 15.22
Grfico do
Exemplo
15.2.1
Figura 15.23
Viso parcial
da Anlise e a
Meta-Anlise
do Exemplo
15.2.1

- 160 -
15.13.2 EXEMPLO 15.3.1 DADOS CONTNUOS
a) Pressionar o mouse em Grfico na barra da Figura 15.4, para resultado.

A Mdia Geral das Diferenas (MD w) e os respectivos Intervalos de Confiana esto
representados na parte inferior do grfico, sob a forma de um pequeno losango cujo
limite superior menor que a unidade (-0.096). Se se desejar os dados
de cada amostra (Mdia das Diferenas e respectivos Intervalos de Confiana de
95%), pressionar com o mouse em Anlise (Figura 15.4)

Figura 15.24
Grfico do
Exemplo
15.3.1
Figura 15.25
Anlise e
Meta-Anlise
do Exemplo
15.3.1

- 161 -
15.13.3 EXEMPLO 15.4.1 TESTE DE MANTEL-HAENSZEL
Pressionar o mouse em Grfico na barra da Figura 15.5, para obter o resultado.

.

O teste de Mantel-Haenszel altamente significativo e o Odds Ratio combinado, com
o respectivo Intervalo de Confiana (95%), est representado pelo losango na parte
inferior do grfico.
O procedimento para se obter a Anlise dos Dados o mesmo dos exemplos
anteriores, como veremos a seguir.

Figura 15.27
Anlise e
Meta-Anlise
do Exemplo
15.4.1
Figura 15.26
Grfico do
Exemplo
15.4.1

- 162 -

15.13.4 EXEMPLO 15.9.1 RISCO RELATIVO (w)
a) Pressionar o mouse em Grfico na barra da Figura 15.12, para resultado;

O Risco Relativo combinado altamente significativo e est representado pelo losango
na parte inferior do grfico, com os respectivos intervalos de confiana (95%), e cujo
limite inferior ultrapassa a unidade (2.829).

O procedimento para se obter a Anlise dos Dados o mesmo dos exemplos
anteriores, como se ver em seguimento:

Figura 15.28
Grfico do
Exemplo
15.9.1
Figura 15.29
Anlise e
Meta-Anlise
do Exemplo
15.9.1

- 163 -
15.14 OUTROS GRFICOS
Alm do Florest Plot, outros grficos podem ser obtidos nos testes de meta-anlise.
Foi escolhido um grfico de barra para representar as vrias propores.

15.14.1 EXEMPLO 15.4.1 VRIAS PROPORES (pw)
Pressionar o mouse em Grfico na barra da Figura 15.20

Pelo teste efetuado, no qual o valor de pw estatisticamente significativo, fica
evidente que as amostras 1 (A) e 2 (B) apresentam diferenas do ponto de vista
estatstico com erro de concluso inferior a 5% (p < 0.05).

Figura 15.30
Grfico do
Exemplo
15.4.1

- 164 -

- 165 -
CAPTULO 16
NORMALIDADE

16.1 INTRODUO
Uma das pressuposies dos testes estatsticos paramtricos diz respeito distribuio
normal das variveis nas populaes. Quando se retira, portanto, uma amostra para
esses modelos de testes, deve-se supor que as unidades do universo em questo
apresentem distribuio normal.
Vrios testes tm sido descritos para a identificao da normalidade das variveis. O
BioEstat apresenta os seguintes:
a) Teste DAgostino, para n 10 e k amostras;
b) Teste DAgostino-Pearson, para n 20 e k amostras;
c) Teste de Kolmogorov-Smirnov, para uma amostra;
d) Teste de Lilliefors, para k amostras;
e) Teste de Shapiro-Wilk, para n >2 e < 51 e k amostras;
f) Teste para Valores Extremos (Outliers).

16.1.1 INSTRUES
a) Introduzir os dados no grid padro do BioEstat;
c) Apontar o mouse em Normalidade, conforme mostra a Figura 14.1

16.2 TESTE DAGOSTINO
Trata-se de um teste para pequenas amostras, mas cujo valor de n deve ser igual ou
superior a 10 unidades. Os resultados so comparados com os valores crticos
previamente estabelecidos. A hiptese de nulidade, portanto de normalidade, deve ser
rejeitada quando o valor calculado menor ou igual que o valor crtico mnimo ou
igual ou maior que o valor crtico mximo. recomendvel, ainda, que os resultados
sejam fornecidos em 5 decimais, uma vez que o valor estatstico do desvio (D) pode
ser muito pequeno.. Pode ser efetuado para vrias (k) amostras simultaneamente.

16.2.1 EXEMPLO
Foram determinados os nveis de glicemia (mg/dl) de 15 crianas escolares, obtendo-
se os valores constantes no grid padro, Figura 16.2.
H
0
: a distribuio da varivel apresenta normalidade;
H
1
: a distribuio da varivel no atende o pressuposto de normalidade;
Figura 16.1
Menu
Normalidade.

- 166 -
CAPTULO 16 NORMALIDADE

16.2.2 INSTRUES
a) Pressionar o mouse em DAgostino;
b) Selecionar a coluna correspondente amostra do grid geral;

O D obtido igual a 0.28118, o qual est contido nos limites dos valores crticos
tabelados ao nvel alfa de 5%, traduzindo um p-valor > 0.05. Aceita-se, portanto, a
hiptese de nulidade.

16.3 TESTE DAGOSTINO-PEARSON
Este teste baseia-se nas medidas de simetria (g
1
) e curtose (g
2
) e o p-valor calculado
pelo Qui-Quadrado com 2 graus de liberdade. Este teste deve ser utilizado para
amostras iguais ou maiores que 20 unidades, com uma ou k amostras.

16.3.1 EXEMPLO
O peso (g) de sementes de uma espcie de leguminosa foi calculado de amostra
aleatria de 30 unidades, cujos valores esto inseridos no grid geral.
H
0
: a varivel peso das sementes da leguminosa normalmente distribuda;
H
1
: a varivel peso das sementes da leguminosa no normalmente distribuda;

16.3.2 INSTRUES
a) Pressionar o mouse em DAgostino-Pearson;
b) Selecionar a coluna do grid geral correspondente amostra;
a) Clicar em Executar, para resultados.

Figura 16.2
Dados do
Exemplo
16.2.1.
Figura 16.3
Resultados
do teste
DAgostino.

- 167 -

O p-valor igual a 0.21949, aceitando-se a hiptese de nulidade. A varivel estudada
apresenta distribuio normal.

Este teste j foi descrito em detalhes no Captulo 10, referente a testes para uma
amostra. Assim sendo, o exemplo e os resultados podem ser vistos nesse captulo e o
teste compreende:
a) Introduo dos dados amostrais no grid geral;
b) Pressionar o mouse em Kolmogorov-Smirnov;
c) Selecionar a coluna do grid referente aos dados amostrais;
d) Clicar em Executar;
e) Preencher as caixas de texto com os parmetros do universo em estudo (mdia
e desvio padro);
f) Clicar em OK, para resultados.

16.5 TESTE DE LILLIEFORS
O teste de Lilliefors j est descrito no Captulo 10, para uma amostra.
Efetuar o mesmo teste, mas com 5 amostras de modo simultneo.

16.5.1 EXEMPLO
Foram coletadas cinco (5) amostras, cada uma representando diferentes populaes.
Testar a normalidade delas pelo Teste de Lilliefors.

H
0
: as amostras apresentam normalidade em suas distribuies;
H
1
: as amostras no apresentam normalidade em suas distribuies;

16.5.2 INSTRUES
a) Introduzir os dados de cada amostra no grid geral;
b) Pressionar o mouse em Lilliefors;
c) Selecionar as colunas do grid referentes aos dados amostrais;
Figura 16.4
Dados do
Exemplo
16.3.1
e resultados
do teste

- 168 -

O teste de Lillierfors mostra anormalidade nas amostras 2 e 5, cujos valores de p
correspondem a < 0.05 e < 0.01, respectivamente. As demais amostras no
apresentam diferenas significativas (p > 0.05), podendo-se consider-las como
representantes de populaes com normalidade de distribuio.

16.6 TESTE DE SHAPIRO WILK
O teste de Shapiro-Wilk teste W obtido dividindo-se o quadrado da combinao
linear apropriada dos valores ordenados da amostra pela varincia simtrica estimada.
O BioEstat calcula este teste para amostras > 2 e < 51. O teste pode ser efetuado para
k amostras de modo simultneo.

Foram escolhidas de modo aleatrio 42 laranjas, cujos pesos esto inseridos no grid
geral, Figura 16.7. As hipteses formuladas foram as seguintes:

H
0
: a varivel peso das laranjas normalmente distribuda;
H
1
: a varivel peso das laranjas no apresenta normalidade em sua distribuio;

Figura 16.7
Viso parcial
dos dados do
Exemplo
16.6.1
Figura 16.5
Dados das
amostras do
Exemplo
16.5.1.
Figura 16.6
Resultados
das
Amostras
do Exemplo
16.5.1.

- 169 -
16.6.2 INSTRUES
a) Pressionar o mouse em Shapiro-Wilk;
b) Selecionar a coluna correspondente amostra do grid geral;

O p-valor obtido igual a 0.0137, rejeitando-se a hiptese de nulidade.

16.7 TESTE DE VALORES EXTREMOS, modelo com base nos desvios (OUTLIERS)
A determinao dos chamados valores extremos ou outliers pode ser desejada, uma
vez que podem desempenhar importante papel nas concluses das pesquisas. Um
valor extremo pode ser introduzido em um conjunto de observaes em decorrncia
de falha na coleta de dados, de erro no registro durante a coleta, na introduo
equivocada desse escore no momento da execuo dos clculos ou, ainda, do fato de
que o valor extremo obtido est correto. Torna-se, por conseguinte, importante sua
identificao, devendo-se tomar, conforme o caso, as medidas adequadas.
O BioEstat identifica os valores extremos contidos em uma s amostra, sem
considerar, contudo, sua origem. De acordo com a experincia de Rosner
(Fundamentals of Biostatistics, 5th ed.), o programa determina a quantidade de
possveis outliers com base na equao min([n/10},5), onde n o tamanho da amostra
e 5 a quantidade mxima de valores extremos que podem ser detectados em uma
distribuio normal.

16.7.1 EXEMPLO (baseado nos desvios)
Foi efetuada coleta de 50 peixes de uma determinada espcie em um lago criatrio,
cujos escores esto no grid geral. Parte da amostra est contida na Figura 16.9.

H
0
: No h valores extremos na amostra obtida;
H
1
: H valores extremos na amostra obtida;
Figura 16.8
Resultados
do Teste de
Shapiro-
Wilk.
Figura 16.9
Viso parcial
dos dados
do Exemplo
16.7.1

- 170 -
16.7.2 INSTRUES
a) Preencher o grid geral com os dados amostrais;
b) Pressionar o mouse em Valores Extremos (base nos desvios);
c) Selecionar a coluna correspondente aos dados;
d) Clicar em Executar;

O valor 65 kg considerado um valor extremo com p < 0.05. Se esse escore no for
excludo da amostra, o peso mdio dos peixes ser de 19.418 kg e, com sua excluso,
passa a ser igual a 18.4878 kg. H, portanto, diferena de 0.93 kg entre esses valores
mdios. Deve-se, assim, verificar a origem do valor extremo referido. Como neste
exemplo, , 50 = n logo n/10 igual a 5, ento o programa admitiu a possibilidade de
existirem at 5 outliers, como demonstrado na Figura 16.10.

Pressionando-se em Grfico na barra da Figura 16.10 obtm-se a seguinte imagem:

O grfico (Box-Plot desvios) confirma o Valor Extremo detectado pelo teste.

Figura 16.11
Grfico do
Exemplo
16.7.1
Valor
Extremo = 65
Figura 16.10
Resultados
do Teste de
Valores
Extremos
(Outliers).

- 171 -
16.8 TESTE DE VALORES EXTREMOS, modelo com base nos quartis (OUTLIERS)
A determinao dos valores extremos pode ser calculada com base nos quartis, onde
os outliers sero:
a) Os escores menores que o limite inferior, com base no primeiro quartil ajustado;
b) Os escores maiores que o limite superior, baseado no terceiro quartil ajustado.

O BioEstat identifica, como se ver em seguimento, os valores extremos contidos em
uma s amostra, sem considerar, contudo, sua origem.

16.8.1 EXEMPLO (baseado nos quartis)
O exemplo o mesmo descrito no item 16.7.1, Figura 16.9.

H
0
: No h valores extremos na amostra obtida;
H
1
: H valores extremos na amostra obtida;

16.8.2 INSTRUES
e) Preencher o grid geral com os dados amostrais;
f) Pressionar o mouse em Valores Extremos (base nos quartis);
g) Selecionar a coluna correspondente aos dados;
h) Clicar em Executar;

Os escores 65 e 32 so considerados valores extremos, eis que se encontram acima do
limite superior. Pelo mtodo anterior, com base nos desvios, apenas o escore 65 foi
considerado outlier.
Figura 16.12
Resultados
do Exemplo
16.8.1

- 172 -

- 173 -
CAPTULO 17
QUI-QUADRADO

17.1 INTRODUO
O teste do Qui-Quadrado um dos mais empregados em pesquisas biomdicas, sendo
aplicado para dados mensurados em escala nominal ou ordinal.

Os testes de aderncia e de independncia do Qui-Quadrado e o teste G j foram
exibidos nos captulos relativos a uma e duas amostras independentes. Por sua vez, os
testes envolvendo vrias amostras sobre o mesmo assunto, tanto de aderncia como o
de n tabelas de contingncia, esto dispostos agora no Captulo 15 sobre Meta-
Anlise.

Este Captulo, embora abrange os testes de Aderncia e de Independncia, inclui
exemplos apenas dos aplicativos de Partio e de Tendncia:

a) Uma amostra (Aderncia): Qui-Quadrado;
b) Duas amostras independentes: l x c;
c) Partio: l x c;
d) Teste de Tendncia.

17.1.1 INSTRUES
b) Apontar o mouse em Qui-Quadrado, quando surgir a figura abaixo:

17.2 PARTIO
O teste de independncia do Qui-Quadrado destinado para vrias amostras dispostas
em tabelas de contingncia l x c: 2 x 3, 3 x 3, 3 x 4 etc. Nessas tabelas, quando o
resultado significativo (p-valor 0.05), no se pode saber com preciso em qual dos
conjuntos testados ocorreu a associao estatstica. A partio dessas tabelas de
contingncia em outras de tamanho 2 x 2, cada uma com um grau de liberdade,
permite esclarecer o problema. Inicia-se a partilha pelo canto superior esquerdo da
tabela geral, combinando-se linhas e colunas at abranger o todo.

17.2.1 EXEMPLO
Efetuou-se levantamento de 250 granjas de trigo, com a finalidade de determinar a
influncia da lagarta sobre a produo do cereal. As granjas foram classificadas em 4
Figura 17.1
Menu do Qui-
Quadrado.

- 174 -
CAPTULO 17 QUI-QUADRADO E TESTE G
tipos, de acordo com a intensidade da infestao leve, moderada, alta, muito alta ,
registrando-se em cada uma o resultado da colheita satisfatria e no-satisfatria. Os
dados foram inseridos no grid geral.

H
0
: A produo de trigo independe do grau de infestao do cereal pela lagarta;
H
1
: A produo de trigo depende do grau de infestao do cereal pela lagarta;

17.2.2 INSTRUES
a) Clicar o mouse em Partio: L x C;

Pelos resultados pode-se concluir que as colheitas leve e moderada no apresentam
diferena estatstica significativa. Quando comparadas, entretanto, com as infestaes
alta e muito alta, parties 2L:3C e 2L:4C, respectivamente, verifica-se que as
discrepncias so muito significativas (p = 0.0042 e p = 0.0098).
Se fosse efetuado o teste de independncia, o Qui-Quadrado seria altamente
significativo (p = 0.0013,
2
= 15.7086), mas no informaria as propores de
interesse no caso.

17.3 TESTE DE TENDNCIA
O teste de tendncia realizado em k amostras, cada uma com duas categorias (A e
B), em tabelas 2 x k. Cada amostra reflete determinados perodos de tempo, os quais
devem ser espaados de maneira regular. O objetivo determinar o aumento ou
diminuio do evento sucesso nas amostras, ou seja, se h alguma tendncia
crescente ou decrescente ou se inexiste qualquer associao dos eventos com os
perodos investigados.

17.3.1 EXEMPLO
Em pesquisa ambulatorial, procurou-se estabelecer a tendncia da hipertrofia
prosttica em relao idade. Os dados obtidos foram os seguintes:
Figura 17.3
Resultados
do Exemplo
17.2.1.
Figura 17.2
Dados do
Exemplo
17.2.1.

- 175 -
IDADE EM ANOS

Hipertrofia
de prstata
54 59 60 64 65 69 70 74

SIM 120 135 162 190

NO 784 800 950 950

H
0
: No h tendncia de maior nmero de indivduos com hipertrofia prosttica com o
aumento da idade;
H
1
: H tendncia de maior nmero de indivduos com hipertrofia prosttica com o
aumento da idade;

17.3.2 INSTRUES
a) Clicar o mouse em Teste de Tendncia;
b) Preencher o grid especfico com os dados;


A tendncia aumentar o nmero de casos de hipertrofia prosttica medida que o
indivduo acresce a idade. O teste significativo (p = 0.0367), indicando tendncia
crescente pelo valor positivo de A (52.8443). Rejeita-se a hiptese de nulidade e
aceita-se a alternativa. A seo 22.14.3, do captulo Frmulas Estatsticas, define a
varivel A. Quando A > 0, a tendncia crescente; e se A < 0, a tendncia
decrescente.

Figura 17.5
Resultados
do Exemplo
17.3.1.
Figura 17.4
Dados do
Exemplo
17.3.1.

- 176 -

- 177 -
CAPTULO 18
REGRESSO

18.1 INTRODUO
No estudo de correlao procura-se verificar a magnitude e o sentido da associao
que possa existir entre duas variveis, sem haver qualquer grau de dependncia de
uma em relao outra. No teste de regresso, ao contrrio, a finalidade determinar
a dependncia de uma varivel em relao chamada varivel independente ou
preditora.
O BioEstat contm os seguintes programas de regresso:
a) Anlise de Resduos;
b) Ajustamento de curvas;
c) Regresso linear simples;
d) Regresso linear mltipla;
e) Regresso logstica simples;
f) Regresso logstica mltipla;
g) Polinomial.

18.1.1 INSTRUES
b) Apontar o mouse em Regresso, quando surgir a figura abaixo:

18.2 REGRESSO LINEAR SIMPLES
um dos modelos de regresso de largo emprego nas pesquisas biomdicas, no qual
procura-se predizer o valor de uma varivel dependente (Y) a partir de uma varivel
independente (X) ou preditora, pressupondo que elas assumam modelo linear.

18.2.1 EXEMPLO
Determinou-se a presso arterial diastlica (P.A.D.) de 20 indivduos do sexo
masculino, registrando-se a idade, em anos, de cada pessoa. Os dados obtidos esto
inseridos no grid geral.

H
0
: a presso arterial diastlica dos homens no sofre alteraes com a idade: = 0;
H
1
: a presso arterial diastlica dos homens alterada pela idade: 0;
Figura 18.1
Menu dos
Aplicativos de
Regresso
.

- 178 -
CAPTULO 18 REGRESSO
18.2.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, representando a primeira coluna
os valores da varivel Y (dependente) e a segunda os escores da varivel X
(independente);
b) Clicar em Linear Simples e selecionar as colunas do grid geral;

O valor de F (regresso) muito significativo (p = 0.0011), rejeitando-se a hiptese
de nulidade e aceitando-se a alternativa: a presso arterial diastlica acresce medida
que aumenta a idade do homem. Constata-se, neste exemplo, pelo coeficiente de
determinao ajustado (R
2
), que 44.49% da varivel dependente explicada pela
varivel preditiva, devendo outros fatores atuar como preditores do aumento da
P.A.D.
Figura 18.3
Resultados
do Exemplo
18.2.1.
Figura 18.2
Dados do
Exemplo
18.2.1
(viso
parcial).

- 179 -
CAPTULO 18 REGRESSO
18.3 REGRESSO LINEAR MLTIPLA
A regresso mltipla linear semelhante regresso linear simples, mas a quantidade
de variveis independentes ou preditoras de duas ou mais.

18.3.1 EXEMPLO
Foi efetuada pesquisa em 12 indivduos do sexo masculino, com idades variando de
30 a 55 anos, determinando-se: Y : creatininemia em mg/dl ; X
1
: idade em anos; X
2
:
peso em kg; X
3
: estatura em cm.

H
0
: o nvel srico da creatinina no dependente da idade e/ou do peso e/ou da
estatura:
1
= 0,
2
= 0,
3
= 0;
H
1
: o nvel srico da creatinina dependente da idade e/ou do peso e/ou da estatura:
pelo menos um
i
0;
Nvel de deciso: alfa 0.05.

18.3.2 INSTRUES
a) Clicar o mouse em Linear Mltipla;
c) Clicar em Executar o Teste, quando surgir uma caixa de texto para que seja
informado em qual das colunas est a varivel dependente Y que, neste exemplo,
foi a coluna 1;
d) Clicar em Executar, para obter os resultados.
Figura 18.4
Viso parcial
dos dados
do Exemplo
18.3.1.
Figura 18.5
Resultados
do Exemplo
18.3.1.

- 180 -
CAPTULO 18 REGRESSO
O valor de F (regresso) significativo (p = 0.0399), rejeitando-se a hiptese de
nulidade e aceitando-se a alternativa: pelo menos uma das variveis independentes
X
1
, X
2
ou X
3
influencia o nvel srico de creatinina. Entre os coeficientes parciais de
regresso somente o b
1
estatisticamente significativo (t = 2.3102, p = 0.0496),
sendo, portanto, X
1
a varivel que mais explica a variao de Y. O nvel srico de
creatinina (Y) deve aumentar 0.0223 mg/dl para cada acrscimo de uma unidade de X
1

(cada ano de idade, a partir de 39 e at 55).

Dados sobre os coeficientes de determinao (R
2
) e de correlao mltiplos (R
yy
) esto
contidos nos resultados, assinalando-se, ainda, a comparao entre os coeficientes
parciais de regresso.

Assinale-se, por fim, que o modelo linear para predio de Y, baseado nas variveis
X
1
, X
2
e X
3
, representado pela seguinte equao: Y
= 1.9457 + 0.0223X
1
+ 0.0222X
2

+ ( 0.0164X
3
).

18.4 AJUSTAMENTO DE CURVAS
Em algumas pesquisas, nas quais se procura analisar a relao de dependncia entre
duas variveis, o modelo de distribuio pode no ser linear, eis que os dados podem
se ajustar a uma distribuio exponencial, logartmica ou geomtrica. Torna-se mais
fcil efetuar a regresso das variveis em questo de maneira simultnea, verificando-
se, pelo coeficiente de determinao, qual a curva que mais se ajusta aos escores
coletados.

18.4.1 EXEMPLO
Supondo-se que, em determinado experimento, os escores amostrais foram
submetidos ao teste de regresso. Os dados sobre as variveis X e Y, independente e
dependente, respectivamente, esto inseridos no grid geral. Efetuar o ajustamento.

18.4.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, representando a primeira coluna
os valores da varivel X (independente) e a segunda, os escores da varivel Y
(dependente);
b) Clicar em Ajustamento de Curvas e selecionar as colunas do grid geral;

Figura 18.6
Dados do
Exemplo
18.4.1.

- 181 -
CAPTULO 18 REGRESSO

Considerando os valores dos coeficientes de determinao (R
2
), constata-se que as
regresses logartmica e geomtrica, 98% e 97%, respectivamente, so as curvas que
mais se ajustam aos dados obtidos no experimento. Em ordem decrescente, o
ajustamento seria o seguinte:

Logartmica > Geomtrica > Linear > Exponencial

Assim, a estimao da varivel dependente pela preditora deve obedecer o modelo
logartmico: = Y
0.42 + 0.35 x ln (X).

Pressione em Grfico na barra da Figura 18.7, para obter a seguinte imagem:

Figura 18.8
Grfico
do Exemplo
18.4.1.
Figura 18.7
Resultados
do Exemplo
18.4.1.

- 182 -
CAPTULO 18 REGRESSO
O grfico confirma que o melhor ajuste representado por uma curva logartmica,
conforme indicado pelo coeficiente de determinao (r
2
) de 98%.

18.5 ANLISE DE RESDUOS
Na anlise de regresso a predio da varivel dependente Y efetuada diretamente
atravs do escore da varivel independente X e dos coeficientes respectivos, pela
equao: bX a Y + =
. No entanto, de modo indireto, pode-se examinar a varivel

dependente pela avaliao dos resduos, ou seja, dos escores e
i
, os quais so obtidos
pela conhecida diferena: e
i
= ) (
i
y
i
y , que estimam os valores paramtricos
i
. A
mdia dos resduos sempre igual a zero, obtendo-se a varincia pela equao da
soma dos quadrados e respectivo quadrado mdio.

Essa anlise pode ser til para verificar os seguintes pressupostos:
a) homogeneidade das varincias dos valores de Y;
b) linearidade dos valores observados;
c) normalidade dos escores de Y;
d) presena de valores extremos (outliers).

O exame dos resduos efetuado, em geral, com diagramas de disperso. Desse
modo, aps a anlise residual, conveniente efetuar com os valores obtidos os
referidos grficos.

18.5.1 EXEMPLO 1 (hipottico)
Suponha-se que foi determinada a presso arterial sistlica (P.A.S.) de 12 crianas de
ambos os sexos consideradas normais, cujas idades estavam compreendidas entre 1 e
6 anos (incluindo meses de vida). Os escores esto inseridos no grid geral.

H
0
: os escores da presso arterial sistlica so homogneos, no apresentam valores
extremos;
H
1
: os escores da presso arterial sistlica no so homogneos, apresentam valores
extremos;
Nvel de significncia: alfa = 0.05.

Figura 18.9
Dados do
Exemplo
18.5.1.

- 183 -
CAPTULO 18 REGRESSO
18.5.2 INSTRUES
a) Preencher o grid geral com os escores amostrais, introduzindo na primeira coluna
os valores da varivel X (independente) e na seguinte os valores da varivel Y
(dependente);
b) Orientar o mouse para Regresso e clicar em Anlise de Resduos;
c) Selecionar as colunas correspondentes s variveis X e Y e clicar em Executar,
para resultados.

Pelo grfico de disperso entre os valores da varivel X e o dos resduos (i),
diagrama da Figura 18.11) observa-se:

1

Figura 18.10
Resultados
do Exemplo
18.5.1.
Figura 18.11
Grfico de
disperso do
Exemplo
18.5.1.
Valor extremo ?
11
= 41.1051

- 184 -
CAPTULO 18 REGRESSO
A linha contnua horizontal representa a mdia dos resduos valores de Y , a qual
igual zero (0). As linhas tracejadas correspondem a 1 em torno da mdia residual.
Nota-se que h muita diferena entre o valor observado Y
11
= 172.0000 e o esperado
Y
11
= 130.8949, cujo resduo igual a 41.1051, o qual est inserido na Figura 18.10
(ver seta indicativa). Testando-se o conjunto dos resduos, no sentido de verificar se
esse escore pode ser considerado um valor extremo, obtm-se:

Constata-se, pelos dados da Figura 18.12, que o resduo 41.1051 foi considerado um
valor extremo (p < 0.05). Esse resduo corresponde P.A.S. igual a 172 mmHg, de
uma criana de 5 anos de idade. Considerando-se essa faixa etria, deve-se rever essa
medio, uma vez que pode ter ocorrido erro do observador, equvoco no registro,
problemas com a aferio do aparelho medidor ou, ainda, hipertenso arterial
verdadeira.

18.5.3 EXEMPLO 2
Pode-se, tambm, testar os valores dos resduos para verificar a normalidade desses
escores. Para isso, escolheu-se o teste de Shapiro-Wilk com os resduos j calculados,
contidos na Figura 18.11 e reproduzidos, de modo isolado, na Figura 18.14:

H
0
: os resduos dos escores da presso arterial sistlica apresentam normalidade;
H
1
: os resduos dos escores da presso arterial sistlica no apresentam normalidade;
Nvel de significncia: alfa = 0.05.

18.5.4 INSTRUES
a) Preencher o grid geral com os escores residuais, como se verifica na Figura
18.13;
Figura 18.12
Valores
extremos.
Figura 18.13
Dados do
Exemplo
18.5.3.

- 185 -
CAPTULO 18 REGRESSO
b) Clicar em Normalidade e pressionar em Shapiro-Wilk;
c) Selecionar a coluna do grid correspondente aos valores dos resduos;
d) Pressionar em Executar, para resultados.

O teste de Shapiro-Wilk (W) significativo com p-valor igual a 0.0424, confirmando
o resultado do teste de valores extremos (outliers). Os resduos no apresentam
distribuio normal, rejeitando-se a hiptese de nulidade.

18.6 REGRESSO LOGSTICA SIMPLES
A regresso logstica simples testa uma varivel dependente Y e uma varivel
independente, sendo a varivel Y binria, ou seja, assume valores 1 (sucessos) e
valores 0 (insucessos). Por exemplo, bito e sobrevivente, curado e no-curado,
viciado em drogas e no-viciado, fumante e no-fumante, e assim por diante. A
varivel independente pode ser binria ou contnua.

Uma investigao foi efetuada no sentido de verificar a incidncia de cncer cervical
(Y) em relao com a histria clnica de cervicite crnica (X). A classificao
estabelecida foi a seguinte:

Varivel Y: neoplasia cervical presente = 1; ausente = 0;
Varivel X: antecedentes de cervicite crnica presente = 1; ausente = 0.

O nmero total de indivduos investigados foi igual a 20, conforme mostra,
parcialmente, a Figura 18.16:

H
0
:

= 0;
H
1
:

0;
Figura 18.14
Resultados
do Exemplo
18.5.3.
Figura 18.15
Dados do
Exemplo
18.6.1.

- 186 -
CAPTULO 18 REGRESSO
18.6.2 INSTRUES
a) Clicar o mouse em Regresso Logstica Simples;
b) Selecionar as colunas do grid geral, comeando pela coluna 1, a qual ser
considerada como a varivel dependente (Y);
c) Clicar em Executar o Teste.

A equao de regresso, assinalada na Figura 18.17, a seguinte:
Logit P
i
= -1.5041 + 2.7568X1.
Tendo em vista o p-valor (0.0138) do coeficiente b, rejeita-se a hiptese de nulidade.
A chance de neoplasia cervical de cerca de 16 vezes maior se a mulher tiver
antecedentes de cervicite crnica (odds ratio = 15.75).
Com base na equao acima referida, as probabilidades seriam assim calculadas:
Para X = 1 (antecedentes de cervicite crnica):
Logit P = - 1.5041 + 2.7568 1 = 1.2527
P = 1/(1+ EXP(-1.2527) = 0.78 = 78%.
Para X = 0 (sem antecedentes de cervicite crnica):
Logit P = - 1.5041 + 2.7568 0 = -1.5041
P = 1/(1 + EXP (1.5041) = 0.18 = 18%.

Pode-se obter essas probabilidades diretamente do BioEstat, pressionando-se o boto
Exibir, assinalado pela seta (Figura 18.16), preenchendo-se as caixas de texto da
Figura 18.17 com 1 (com cervicite) ou 0 (sem cervicite.). Pressionar o mouse em
Estimar Y, para resultados.

Figura 18.16
Resultados
do Exemplo
18.6.1.
Figura 18.17
Resultados
do Exemplo
18.6.1.

- 187 -
CAPTULO 18 REGRESSO
Os valores estimados de Y so os mesmos anteriores: 78% e 18%, para X
1
= 1 e X
1
= 0,
respectivamente.

18.7 REGRESSO LOGSTICA MLTIPLA
A regresso logstica mltipla testa uma varivel dependente Y e duas ou mais
variveis independentes, sendo a varivel Y binria, ou seja, assume valores 1
(sucessos) e valores 0 (insucessos). As variveis independentes so geralmente
binrias, mas uma delas pode ser contnua.

Uma investigao foi efetuada no sentido de verificar a incidncia de cncer pulmonar
(Y) em relao ao fumo (X
1
) e ao sexo dos indivduos (X
2
). O nmero total de
indivduos investigados foi igual a 20, sendo os 6 primeiros contidos na Fig. 18.18.

H
0
:
1
= 0;
2
= 0;
H
1
:
1
0;
2
0;
Nvel de deciso: alfa 0.05.

18.7.2 INSTRUES
a) Clicar o mouse em Regresso Logstica Mltipla;
b) Selecionar as colunas do grid geral, comeando com a coluna 1, a qual ser
considerada a varivel dependente (Y);
c) Clicar em Executar o Teste.
Figura 18.19
Resultados
do Exemplo
18.7.1
Figura 18.18
Dados
parciais do
Exemplo
18.7.1
DEFINIES:
Y: Cncer presente = 1; Ausente = 0;

X
1
: Sexos: Masculino = 1; Feminino =0;

X
2
: Fumante = 1; No Fumante = 0

- 188 -
CAPTULO 18 REGRESSO
A chance (odds ratio) de neoplasia pulmonar cerca de 9 vezes maior em fumantes e
de 23 vezes se o indivduo fumante e do sexo masculino. Os valores probabilsticos
exatos so estimados (P
i
) pela equao:
Logit P
i
= -2.9892 + 2.1813 X
1
+ 3.1450 X
2

Com base na equao acima referida, as probabilidades seriam assim calculadas:

a) Para X
1
= 0 (no-fumante) e X
2
= 0 (sexo feminino):
Logit P
1
= -2.9892 + 2.1813 0 + 3.1450 0 = -2.9892
P
1
= 1/(1+ EXP(-2.9892)) = 0.0479 = 4.79%;

b) Para X
1
= 1 (fumante) e X
2
= 0 (sexo feminino):
Logit P
1
= -2.9892 + 2.1813 1 + 3.1450 0 = 0.8079
P
1
= 1/(1+ EXP(0.8079)) = 0.31 = 31%;

c) Para X
1
= 0 (no-fumante) e X
2
= 1 (sexo masculino):
Logit P
1
= -2.9892 + 2.1813 0 + 3.1450 1 = 0.1558
P
1
= 1/(1+ EXP(0.1558)) = 0.54 = 54%;

d) Para X
1
= 1 (fumante) e X
2
= 1 (sexo masculino):
Logit P
1
= -2.9892 + 2.1813 1 + 3.1450 1 = 2.3371
P
1
= 1/(1+ EXP(2.3371)) = 0.91 = 91%.

Pode-se obter essas probabilidades diretamente do BioEstat, pressionando-se o boto
Exibir, assinalado pela seta (Figura 18.19), preenchendo-se as caixas de texto da
Figura 18.17 com X
1
= 1 (fumante) ou 0 (no-fumante.) e X
2
= 1(sexo masculino) ou
0 (sexo feminino). Pressione Estimar Y, para resultados.

18.8 REGRESSO POLINOMIAL
O ajustamento de regresses polinomiais pode ser efetuado atravs do emprego dos
conhecidos coeficientes dos polinmios ortogonais, os quais facilitam os clculos
quando os escores da varivel independente apresentam intervalos iguais. O uso da
computao permite calcular essas regresses sem auxlio dos referidos coeficientes,
como ser observado em seguimento. O BioEstat executa as seguintes regresses
polinomiais:
a) Quadrtica;
b) Cbica;
c) Qurtica.
Figura 18.20
Resultados
do Exemplo
18.7.1.

- 189 -
CAPTULO 18 REGRESSO
18.8.1 EXEMPLO (Regresso quadrtica)
Em um experimento de emprego de fosfato (X) e produo de milho (Y), os
resultados obtidos esto inseridos no grid geral (Figura 18.21). Efetuar a regresso
quadrtica para esses dados:

H
0
:
1
= 0;
2
=0;
H
1
:
1
0;
2
0.
Nvel alfa = 0.05

18.8.2 - INSTRUES
a) Pressionar o mouse em Polinomial;
b) Escolher uma das regresses polinomiais, que neste exemplo foi a Quadrtica;
c) Selecionar as colunas do grid, comeando com a que representa a varivel Y;
d) Clicar em Executar o Teste, para resultados.

O F calculado significativo, como tambm os coeficientes b1 e b2.
A predio da varivel dependente efetuada pela equao:
= Y
64.97 + 0.4682 X 0.0010 X

2

Para X = 75, temos:
= Y
64.97 + 0.4682 x 75 0.0010 x 75

2
= 64.97 + 35.115 5.625 = 94.46
Figura 18.21
Dados do
Exemplo
18.8.1
Figura 18.22
Resultados
do Exemplo
18.8.1

- 190 -
CAPTULO 18 REGRESSO
Pode-se obter um grfico em curva dos dados do Exemplo 18.8.1 executando as
instrues abaixo:
a) Abrir o Exemplo 18.8.1;
b) Clicar Grficos e, a seguir, em Diagrama de Disperso;
c) Selecionar as colunas 2 (X) e 1 (Y), nessa ordem;
d) Pressionar em Executar, para visualizar o grfico;
e) Selecionar o menu Configuraes;
f) Clicar em Fontes e Cores e, a seguir, na opo Elementos do Grfico;
g) Pressionar o mouse no quadrado representando a cor preta (na grade de cores);
h) Selecionar a janela Linhas Auxiliares e, a seguir, em Curva Ajustada, aparecendo
em primeiro plano a palavra Polinomial;
i) Clicar em Polinomial;
j) Clicar em Habilitar para obter a Figura 18.23;
k) Fechar a janela de Configuraes.

Obs. O BioEstat 4.0 dispe tambm de exemplos para as regresses Cbica (Ex
18.08.2) e Qurtica (Ex 18.08.3), com os respectivos grficos.

Figura 18.23
Grfico de
linha do
Exemplo
18.8.1

- 191 -
CAPTULO 19
TAMANHO DAS AMOSTRAS

19.1 INTRODUO
O tamanho amostral est relacionado com o grau de variao dos dados, a magnitude
dos efeitos a serem detectados e o poder do teste desejado. Cumpre salientar que:
a) quanto maior a varincia, maior dever ser o tamanho da amostra, e vice-versa;
b) quanto menor o nvel alfa, maior dever ser o tamanho da amostra;
c) quanto maior o poder do teste, maior dever ser o tamanho da amostra;
d) quanto maior a diferena entre as mdias a serem comparadas, menor poder ser
o tamanho da amostra.

importante obter informaes de outros trabalhos sobre o assunto objeto da
investigao, pois possvel coletar informaes sobre parmetros e/ou estatsticas
da mdia e da varincia, a fim de permitir, com mais preciso, determinar o tamanho
amostral. Pode-se, ainda, efetuar um teste-piloto, cujo tamanho da amostra ficar a
critrio do pesquisador, obtendo-se estatsticas com definies prvias do nvel alfa e
do poder do teste que iro proporcionar os dados necessrios para o clculo do
tamanho amostral.

O BioEstat calcula o tamanho da amostra para os seguintes testes:
i Anlise da varincia;
ii Correlao linear;
iii Teste de McNemar;
iv Proporo: uma amostra;
v Proporo: duas amostras;
vi Qui-Quadrado: 2 x 2;
vii Teste t: uma amostra;
viii Teste t: duas amostras independentes;
ix Teste t: duas amostras pareadas.

19.1.1 INSTRUES
b) Apontar o mouse em Tamanho das Amostras, quando surgir a figura abaixo:
Figura 19.1
Menu de
Tamanho
das
Amostras.

- 192 -
CAPTULO 19 TAMANHO DAS AMOSTRAS
19.2 ANLISE DE VARINCIA
O programa adequado para o clculo do tamanho amostral da ANOVA, um critrio,
abrangendo de 3 a 8 tratamentos e permitindo a escolha do poder do teste, com a
recomendao de que no deve ser inferior a 0.80 a fim de no aumentar o erro tipo II
(). A escolha do nvel alfa apresenta duas alternativas: 0.05 e 0.01.

19.2.1 EXEMPLO
Determinar o tamanho da amostra para um teste de anlise da varincia, um critrio
em que se dispe de 5 tratamentos, considerando o nvel alfa de 0.05, o poder do teste
de 0.80 e tendo em vista as seguintes informaes obtidas em experimento piloto:
diferena mnima entre as mdias dos tratamentos = 39.48; desvio padro do erro
experimental = 26.18.

19.2.2 INSTRUES
a) Clicar o mouse em ANOVA;
c) Selecionar Alfa 0.05 ou Alfa 0.01, para obter os resultados.

19.3 CORRELAO LINEAR
O tamanho amostral na correlao linear teste de Pearson depende do
conhecimento prvio do valor de r obtido em testes anteriores, escolhendo-se o poder
do teste e o nvel alfa desejado.

19.3.1 EXEMPLO
Uma pesquisa-piloto revelou que o coeficiente de correlao linear entre duas
variveis era de 0.73. Calcular o tamanho da amostra, considerando o nvel alfa de
0.05 e o poder do teste de 0.85.

Figura 19.2
Tamanho da
amostra:
ANOVA.
(Exemplo
19.2.1)

- 193 -
19.3.2 INSTRUES
a) Clicar o mouse em Correlao Linear;

19.4 TESTE DE McNEMAR
O teste de McNemar, um caso especial de teste binomial, efetuado em tabelas de
contingncia 2 x 2, onde se calcula a probabilidade dos chamados pares discordantes:
a e d ou b e c. Os dados a serem introduzidos nas caixas de texto para o clculo
amostral apresentam a seguinte configurao:
a) Proporo, em decimais, de todos os pares concordantes: com o tratamento A e
com o tratamento B;
b) Proporo, em decimais, dos pares discordantes com um dos tratamentos;
c) poder do teste e o nvel alfa, informando, ainda, se o teste unilateral ou
bilateral.

19.4.1 EXEMPLO
Supondo-se que mulheres com neoplasia mamria, cujas idades variavam de 45 a 60
anos, foram submetidas a dois tipos de tratamento: A e B. Inicialmente, fez-se o
pareamento das pacientes em dois grupos, de acordo com a idade, o tempo de doena,
o grupo tnico e a situao scio-econmica. Ao final de um perodo de 4 anos,
verificou-se o seguinte:
a) em 87% de todos os pares amostrais o tratamento foi concordante, seja com o
esquema teraputico A, quer com o B;
b) dos pares discordantes, 75% ocorreram com o tratamento A.
Figura 19.3
Tamanho da
amostra:
Correlao
linear.

- 194 -
Calcular o tamanho da amostra ao nvel alfa de 0.05, poder igual a 0.85 e teste
unilateral.

19.4.2 INSTRUES
a) Clicar o mouse em McNemar;
c) Selecionar Teste Unilateral ou Teste Bilateral, para obter os resultados.

19.5 PROPORO: UMA AMOSTRA
Em diversas ocasies o pesquisador deseja realizar teste binomial para uma amostra,
considerando as seguintes informaes: o poder do teste, o nvel alfa de significncia,
o direcionamento da H
1
e o conhecimento das propores paramtrica e amostral, esta
ltima obtida em pesquisa-piloto.

19.5.1 EXEMPLO
Quantos indivduos seriam necessrios para um teste bilateral, sabendo-se que a
proporo do universo igual a 0.01 e a da amostra, obtida em pesquisa-piloto, igual
a 0.04? Dados adicionais: poder do teste 0.80 e nvel alfa 0.05.

19.5.2 INSTRUES
a) Clicar o mouse em Proporo: uma amostra;

Figura 19.4
Tamanho
da amostra:
McNemar.

- 195 -

19.6 PROPORO: DUAS AMOSTRAS
O teste para duas propores binomiais, diferente do McNemar, para amostras
independentes. Deve-se informar as propores estimadas de p de cada amostra, a
relao entre elas (1:1, 1:2, 1:0.5 etc.), o poder do teste, o nvel alfa e se o teste
bilateral ou unilateral.

19.6.1 EXEMPLO
Suponha-se que a incidncia da rubola na populao infantil no vacinada de 0.30,
e que, aps campanha vacinal, a incidncia diminuiu para 0.15. Determinar o tamanho
da amostra necessria para testar a diferena entre as duas propores, ao nvel alfa de
0.05, poder de 0.80 e teste unilateral. Nota-se que houve decrscimo na incidncia da
doena aps imunizao.

19.6.2 INSTRUES
a) Clicar o mouse em Proporo: duas amostras;
c) Selecionar, neste caso, Teste Unilateral, para obter os resultados.

Figura 19.6
Tamanho da
amostra:
Duas
Propores.
Figura 19.5
Tamanho
da amostra:
Uma
Proporo.

- 196 -
19.7 QUI-QUADRADO
O tamanho da amostra para testes do Qui-Quadrado atende testes de aderncia e de
independentes, estas dispostas em tabela de contingncia 2 x 2. As informaes sobre
os escores obtidos em teste-piloto Qui-quadrado e graus de liberdade - so
introduzidas nas caixas de texto. Escolher o nvel alfa - 0.05 ou 0.01 e o poder do
teste.

19.7.1 EXEMPLO
Por suposio, em determinado experimento piloto, obtiveram-se os dados abaixo:
I Qui-Quadrado = 4.756;
II Graus de liberdade = 1
Calcular o tamanho da amostra (n) para um teste ao nvel alfa de 0.05 e poder do teste
igual a 0.95.

19.7.2 INSTRUES
a) Clicar o mouse em Qui-Quadrado;
c) Selecionar Alfa 0.05 e Poder do teste de 0.95;
d) Pressionar Executar para resultados.

19.8 TESTE t : UMA AMOSTRA
O tamanho da amostra calculado com base nas informaes sobre o parmetro da
populao e de estatsticas obtidas em teste-piloto. O poder, o nvel de significncia e
a determinao prvia de teste bilateral ou unilateral constituem elementos que
definem o tamanho amostral.

19.8.1 EXEMPLO
Uma amostra retirada de uma populao indgena mostrou que o nvel de colesterol
no sangue perifrico dessas pessoas era em mdia igual a 159 mg/dl e o desvio padro
de 47.5 mg/dl. Tendo em vista que a mdia de colesterolemia na populao brasileira
Figura 19.7
Tamanho da
amostra: Qui-
Quadrado
.

- 197 -
de 178 mg/dl, pergunta-se: qual o tamanho da amostra necessria para confirmar
essa diferena ao nvel alfa de 0.01, com poder de 0.85, em teste unilateral ?

19.8.2 INSTRUES
a) Clicar o mouse em Teste t: uma amostra;

19.9 TESTE t : DUAS AMOSTRAS INDEPENDENTES
O clculo baseado em informaes sobre as mdias amostrais e os respectivos
desvios padres, fixando-se o tamanho da segunda amostra em relao primeira e
determinando-se o poder, o nvel alfa e o direcionamento do teste, unilateral ou
bilateral. O tamanho da segunda amostra poder ser igual ao da primeira (1:1) ou
diferente (1:2), (1:1.5), (1:0.5) etc.

19.9.1 EXEMPLO
Dados preliminares pressupem que o peso de recm-nascidos de famlias de baixo
nvel socioeconmico (BNSE) diferente do das crianas filhas de casais com
elevado nvel socioeconmico (ENSE). As estatsticas mostraram o seguinte:

Mdia de peso Desvio padro

BNSE 2950g 468g

ENSE 3240g 470g

Figura 19.8
Tamanho da
amostra:
t-teste Uma
Amostra.

- 198 -
Calcular o tamanho das amostras para testar essa possvel diferena, em teste
bilateral, ao nvel alfa de 0.05 e poder de 0.90, devendo a segunda amostra ser do
mesmo tamanho da primeira (relao 1:1).

19.9.2 INSTRUES
a) Clicar o mouse em Teste t: duas amostras independentes;

19.10 TESTE t : AMOSTRAS PAREADAS
No caso de duas amostras pareadas os dados so coletados antes e aps determinado
experimento, coletando-se as informaes dos mesmos indivduos nos dois perodos
considerados. O clculo prev o nvel alfa, o poder e, ainda, se o teste unilateral ou
bilateral.

19.10.1 EXEMPLO
Determinou-se a hemoglobina no incio da infeco malrica e 8 dias aps a cura. Os
dados coletados revelaram os seguintes valores:
Antes do tratamento: mdia = 9.5g/dl;
8 dias aps a cura: mdia = 10.7g/dl;
Desvio padro da diferena entre as mdias = 2.5g/dl.
Calcular o tamanho da amostra necessria para verificar se a diferena
estatisticamente significativa ao nvel alfa de 0.05, poder de 0.85 e teste unilateral.
Figura 19.9
Tamanho da
amostra: t
teste Duas
Amostras
Independen-
tes.

- 199 -
19.10.2 INSTRUES
a) Clicar o mouse em Teste t: duas amostras pareadas;

Figura 19.10
Tamanho da
amostra: t
teste Duas
Amostras
Pareadas.

- 200 -

- 201 -
CAPTULO 20
TRANSFORMAO DE DADOS

20.1 INTRODUO
As transformaes so procedimentos estatsticos de mudanas de escalas, com a
finalidade de obter a normalidade da distribuio dos escores e a estabilizao da
varincia.
Na distribuio normal os escores amostrais so transformados de modo linear em z-
escores, cuja mdia igual a zero (0) e o desvio padro igual a um (1). Outras
transformaes no-lineares podem ser efetuadas para atender ao modelo de
distribuio normal, sobretudo quando os escores brutos apresentam acentuada
assimetria ou quando mdias muito grandes so acompanhadas por varincias
tambm muito elevadas, com perda da normalidade, da homogeneidade e da
homocedasticidade.

O BioEstat apresenta os seguintes programas de transformaes:
a) Box e Cox;
b) Exponencial;
c) Logaritmo natural (neperiano);
d) Logaritmo decimal;
e) Percentual;
f) Quadrado;
g) Raiz quadrada;
h) Ordinal (rank);
i) Recproca.

Algumas indicaes so oferecidas nos textos de Estatstica sobre a escolha do
modelo de transformao dos escores brutos coletados.

A transformao logartmica, por exemplo, indicada quando os valores numa
distribuio linear so multiplicativos, como crescimento bacteriano, ou quando a
distribuio muito assimtrica, sendo indicada tambm em dados de pH. Esta
transformao no admite, obviamente, valores negativos ou nulos. Quando o escore
for zero, o programa adiciona 1 a todos os valores.

A transformao em raiz quadrada sugerida em variveis referentes a medidas de
superfcie ou em variveis discretas nmero de leuccitos por mm
3
, nmero de
filhos por casal etc. Emprega-se, tambm, quando o modelo de distribuio dos
escores brutos o de Poisson, no qual a mdia e a varincia tm o mesmo valor (np).
Com essa transformao a varincia e a mdia tornam-se independentes.
Quando o valor da varivel for zero, o programa acrescenta 0.5 a todos os valores.

A transformao ordinal (rank) designada para distribuies muito assimtricas,
sendo largamente usada nos testes no-paramtricos correlao de Spearman,
anlise de varincia de Kruskal-Wallis etc.

- 202 -
CAPTULO 20 TRANSFORMAO
Pode-se efetuar a transformao ordinal (rank) pela ordem numrica ou alfabtica, de
modo crescente ou decrescente. Algumas vezes h necessidade de ordenar um
conjunto de colunas, sendo a primeira aquela que conduzir os respectivos valores das
demais.

A transformao recproca empregada em pesquisas cujos escores envolvem
diluies, como ocorre em titulaes sorolgicas. Quando houver zeros entre os
dados, no dever ser usada essa transformao.

Box e Cox desenvolveram um procedimento a fim de estimar a melhor transformao
para obter a normalidade de um conjunto de escores. Trata-se de um modelo de
funo de mxima-verossimilhana, podendo o usurio, por esse mtodo, verificar
qual a transformao sugerida para seus dados.

Recomenda-se, todavia, ponderar as vantagens e as desvantagens da transformao de
dados. Quando ocorrer dvida, prefervel manter os escores originais e utilizar testes
no-paramtricos.

20.1.1 EXEMPLO 1
Determinaram-se as estatsticas dos dados inseridos no grid, verificando-se que a
varincia cerca de 25 vezes maior que a mdia, sendo a curva assimtrica positiva.
A transformao dos escores foi efetuada escolhendo-se, a ttulo ilustrativo, a
logartmica (natural), a raiz quadrada e a recproca, cujos valores esto contidos na
Figura 20.2. Os dados originais, contidos na coluna 1 do grid geral, foram ainda
submetidos ao procedimento de Box e Cox, cujo resultado est contido na Figura 20.3.
Figura 20.1
Menu de
transformao.
Figura 20.2
Dados do
Exemplo
20.1.1.

- 203 -
20.1.2 INSTRUES
a) Preencher o grid geral com os escores amostrais;
c) Apontar o mouse em Transformaes;
d) Clicar em Ln, selecionar a coluna correspondente aos valores originais;
e) Informar, ento, a coluna a ser preenchida com os valores transformados;
f) Repetir os passos d e e, para as demais transformaes.
g) Para o procedimento Box e Cox, efetuar a, b e c, pressionando a seguir nessa
opo.

Observa-se, em relao ao coeficiente varincia/mdia, o seguinte:
a) Dados originais: 25.2;
b) Transformao logartmica: 1.7;
c) Transformao raiz quadrada: 1.8;
d) Transformao recproca: 2,5.

Esses coeficientes e os valores da assimetria e curtose sugerem que a melhor
transformao para os dados originais a logartmica, confirmando a indicao do
procedimento Box e Cox.

Figura 20.3
Box e Cox
Figura 20.4
Estatstica
descritiva dos
dados
originais e
dos transfor-
mados.

- 204 -
20.1.3 EXEMPLO 2 (hipottico)
Foram inseridos no grid geral os dados referentes a diversos municpios de um estado
brasileiro e respectivos valores da populao e da rea municipal em quilmetros
quadrados.

20.1.4 INSTRUES
a) Preencher o grid geral com os municpios selecionados e respectivos valores das
populaes e reas;
c) Apontar o mouse em Transformaes e clicar em ordinal, pressionando em
ordem alfabtica ou numrica, a qual, neste exemplo, alfabtica;
d) Selecionar as colunas do grid de interesse, comeando com a coluna que ir
comandar as demais;
e) Escolher entre ordem crescente ou decrescente, e que, neste caso, foi crescente.
Figura 20.6
Rank
Alfabtico.
Figura 20.5
Dados do
Exemplo
20.1.3.

- 205 -
CAPTULO 21
GRFICOS E TABELA

21.1 INTRODUO
Os grficos constituem importantes instrumentos de comunicao rpida, clara e
efetiva, poupando, sobretudo, tempo e esforo na visualizao de dados resumidos,
permitindo fixar uma imagem duradoura, da o largo uso dessas representaes em
trabalhos estatsticos. As tabelas de freqncia permitem, tambm, condensar os
escores de modo a torn-los de fcil compreenso.

O BioEstat apresenta os seguintes grficos e tabelas de freqncia:
a) rea;
b) Box Plot: mediana e quartis;
c) Box Plot: mdia e desvios;
d) Caule e Folha (Stem and Leaf);
e) Colunas;
f) Diagrama de Disperso;
g) Diagramas IC e Pontual, Captulo 24;
h) Histograma;
i) Linha (Curva);
j) Mnimo e Mximo;
k) Pirmide Populacional, Captulo 24;
l) Polar;
m) Setor;
n) Tabelas de Freqncia.

21.1.1 INSTRUES
Dirigir o mouse para menu e clicar em Grficos, quando surgir a figura abaixo;

a) Pressionar com o mouse o grfico escolhido ou em s de
Freqncia;
b) Selecionar a(s) coluna(s) do grid, conforme o caso, e
pressionar em Executar, para resultados;
c) Configurar cada grfico de acordo com a orientao
contida no item 21.13.
Figura 21.1
Menu
Grficos.

- 206 -
CAPTULO 21 GRFICOS E TABELA
21.2 GRFICO DE REA
Destina-se a comparar as reas abrangidas pelos escores de duas ou mais amostras,
embora possa ser utilizado para apenas um conjunto de dados.

21.2.1 EXEMPLO
Tomou-se a presso arterial de 14 pessoas do sexo feminino, cujas idades variavam de
30 a 40 anos. Os dados obtidos em condies basais esto inseridos no grid padro e
representam: PAD-F: presso arterial diastlica, sexo feminino; PAS-F: presso
arterial sistlica, sexo feminino.

21.2.2 INSTRUES
a) Clicar em rea;
b) Selecionar as colunas do grid e pressionar em Executar.
Figura 21.2
Dados
do Exemplo
21.2.1
(Viso parcial)
Figura 21.3
Grfico de
rea do
Exemplo
21.2.1

- 207 -
Verifica-se que a presso arterial diastlica (cinza-escuro), embora menor,
acompanha, de modo aproximadamente paralelo e em cada indivduo, o valor da
presso sistlica (cinza-claro). Valores menos elevados da presso sistlica
correspondem a valores mais baixos da presso diastlica, e vice-versa. A correlao
linear de Pearson mostra forte associao entre as duas variveis, com valor de r =
0.813, sendo muito significativa (p = 0.0004).

21.3 GRFICO BOX-PLOT (mediana e quartis)
Trata-se de grfico muito utilizado nas reas de cincias biolgicas e mdicas,
mostrando, no box, a mediana, o primeiro e o terceiro quartis. Exibe, ainda, o menor e
o maior escores atravs do limite inferior e superior de linhas retas verticais, que se
originam do primeiro e terceiro quartis, respectivamente.

21.3.1 EXEMPLO
Foram tomadas as presses arteriais sistlica e diastlica de 40 pessoas de ambos os
sexos, no perodo de viglia e sono. Os valores esto inseridos no grid padro e
parcialmente representados na figura abaixo:

21.3.2 INSTRUES
a) Clicar em Box Plot: mediana e quartis;
b) Selecionar as colunas do grid e pressionar em Executar, para resultados.

O grfico compara valores das presses arteriais sistlicas nos perodos de viglia e de
repouso noturno (sono), o mesmo ocorrendo com as diastlicas. As posies e as
Figura 21.4
Dados do
Exemplo
21.3.1
(Viso parcial)
Figura 21.5
Colunas
selecionadas
para Box-Plot

- 208 -
amplitudes dos boxes e, ainda, o comprimento das linhas verticais evidenciam com
clareza as diferenas entre as distribuies das variveis referidas.

21.4 GRFICO BOX-PLOT (mdia e desvios)
Semelhante ao grfico anterior, mostrando, todavia, no box, a mdia e o desvio ou o
erro padro. Exibe, ainda, o menor e o maior escores atravs do limite inferior e
superior de linhas retas verticais. Pode-se verificar, tambm, a presena de valores
extremos (outliers), como ocorreu no exemplo abaixo, representados atravs de
pequenos crculos acima ou abaixo das linhas verticais do grfico. Com o mouse,
pode-se visualizar, na parte superior do grfico, o valor de cada uma dessas
estatsticas ou dos escores amostrais.

21.4.1 EXEMPLO
Foi efetuada coleta de 50 peixes de uma determinada espcie em um lago criatrio,
cujos escores esto inseridos no grid geral. Parte da amostra est contida na Fig. 21.7.
Figura 21.6
Grfico Box-
Plot do
Exemplo
21.3.1
Figura 21.7
Dados do
Exemplo
21.4.1
(Viso
parcial)

- 209 -
21.4.2 INSTRUES
a) Clicar em Box-Plot: mdia e desvios, selecionar as coluna do grid e pressionar
em Executar;
b) Escolher um dos botes de opo: Caixa (Box) = desvio padro e Suas
(Whisker) = Mximo e Mnimo, pressionando Aplicar para obter o grfico.

As linhas horizontais de cada box representam, agora, a mdia aritmtica (linha
central) e 1 desvio padro (linhas superior e inferior).

21.5 GRFICO CAULE E FOLHA (STEM AND LEAF)
Algumas vezes difcil agrupar certos escores em tabelas e represent-los
graficamente, perdendo-se, nesse propsito, o valor real de cada escore. O diagrama
caule e folha contorna esse problema, mostrando, ainda, a disposio dos dados em
forma de curva, evidenciando aspectos da simetria e da curtose.
Para sua construo, o programa separa o componente caule e respectiva folha,
sendo o primeiro representado por todos os dgitos de cada escore, menos o dgito da
direita, o qual constitui a folha. A preciso da folha pode ser escolhida pelo
usurio. Exemplos:

Escore Caule Folha Preciso da Folha
523 52 3 Unidade
46.74 46 7 Centsimo
115.8 115 8 Dcimo
523 5 2 Dezena
Figura 21.9
Grfico Box-
Plot do
Exemplo
21.4.1
Figura 21.8
Botes de
opo .
Outliers

- 210 -
O programa executa todos esses passos de acordo com as informaes inseridas nas
caixas de textos, conforme se verificar em seguimento.

21.5.1 EXEMPLO
A presso arterial sistlica de 87 pessoas do sexo masculino, cujas idades variavam de
20 a 45 anos, foram tomadas em condies basais. Os valores esto inseridos no grid
geral, parcialmente mostrados na Figura 21.10.

21.5.2 INSTRUES
a) Clicar em Caule e Folha (Stem and Leaf);
b) Selecionar a coluna do grid e pressionar o mouse em Executar;
c) O formulrio, mostrado na Figura 21.11 (lado direito), indica o maior e o menor
escore e a amplitude dos dados; deve-se, com um clique do mouse, indicar o nvel
de preciso da folha, que neste caso foi a unidade, e o nmero de linhas por
classe, o qual, neste exemplo, foram 2;
d) Pressionar em Exibir Diagrama, para resultados (Figura 21.11).

O diagrama Caule e Folha apresenta uma distribuio aproximadamente simtrica
(g
1
= 0.29) e mesocrtica (g
2
= 0.05), com todos os escores amostrais, sendo a maior
concentrao de valores em torno da mdia e da mediana, 119.8 e 119,
respectivamente.
Figura 21.10
Dados do
Exemplo
21.5.1
(Viso
parcial)
Estatsticas do Exemplo 19.4.1

Nmero de escores = 87
Mediana = 119
Mdia aritmtica = 119.8
Coef. de assimetria = 0.29
Coef. de curtose = 0.05
A figura abaixo ilustra a configurao
que precede a exibio do diagrama
de Caule e Folha.
Note a importncia da escolha
adequada do item Nvel de Preciso
da Folha.
Figura 21.11
Grfico de
Caule e Folha
do Exemplo
21.5.1

- 211 -
21.6 GRFICO DE COLUNAS
Destina-se a comparar escores de diferentes categorias representadas sob a forma de
retngulos separados, mas da mesma largura, com alturas proporcionais s grandezas
que representam. Os dados devem ser mensurados em escala nominal, ordinal ou
numrica de valores discretos. O BioEstat apresenta os seguintes modelos para este
tipo de grfico:
a) Colunas simples;
b) Colunas justapostas;
c) Colunas superpostas.
Em qualquer dos casos as colunas podem ser apresentadas sob a forma vertical ou
horizontal.

21.6.1 EXEMPLO
Em um hospital foram efetuadas cirurgias classificadas em diferentes especialidades e
realizadas no ms de maro de 1999. Os dados esto contidos no grid geral:

21.6.2 INSTRUES
a) Clicar o mouse em Colunas e pressionar em Simples;
b) Selecionar as duas colunas do grid e pressionar o mouse em Executar.
Para visualizar as Barras
de Erro, selecione na ja-
nela de Configuraes a
opo Outras e escolha
o tipo de Barra de Erro
conforme disponvel na
parte inferior da janela.

Figura 21.12
Dados do
Exemplo
21.6.1
Figura 21.13
Grfico de
Colunas
do Exemplo
21.6.1

- 212 -
21.6.3 EXEMPLO (colunas justapostas, dados hipotticos)
Foi efetuada investigao destinada a verificar a incidncia de dengue de acordo com
a escolaridade. Os dados esto inseridos no grid geral, conforme mostra a Figura
21.14.

21.6.4 INSTRUES
a) Clicar o mouse em Colunas e pressionar em Justapostas;
b) Selecionar as trs colunas do grid e pressionar em Executar.

21.6.5 EXEMPLO (colunas superpostas, dados hipotticos)
A mesma investigao do exemplo anterior, mas com o tamanho da amostra diferente
entre as diversas escolaridades. O modelo escolhido foi o de colunas superpostas,
sendo os dados das colunas apresentados em forma percentual.

Figura 21.14
Dados do
Exemplo
21.6.3
Figura 21.15
Grfico de
Colunas
justapostas
do Exemplo
21.6.3
Figura 21.16
Dados do
Exemplo
21.6.5

- 213 -
21.6.6 INSTRUES
a) Clicar o mouse em Colunas e pressionar em Superpostas;
b) Selecionar as trs colunas do grid e pressionar em Executar;
c) Aps o aparecimento do grfico, pressionar em Configuraes e escolher a opo
Outras;
d) Clicar em Percentuais.

21.7 DIAGRAMA DE DISPERSO
Grfico utilizado para duas variveis mensuradas de maneira simultnea X e Y,
como ocorre nos testes de Correlao e de Regresso.

21.7.1 EXEMPLO
Peso e comprimento de folhas de gramnea coletadas em Ipixuna, Estado do Par. Os
escores esto inseridos no grid geral (Figura 21.18).

Figura 21.18
Dados do
Exemplo
21.7.1
Figura 21.17
Grfico de
Colunas
superpostas
percentuais
do Exemplo
21.6.5

- 214 -
21.7.2 INSTRUES
a) Clicar em Diagrama de Disperso;
b) Selecionar as colunas do grid e pressionar o mouse em Executar.

Ao lado do grfico de disperso esto os resultados do teste de Correlao Linear,
mostrando o coeficiente r muito significativo, com p-valor = 0.0006. Quando este
grfico expressa os escores da regresso linear, a reta representativa da equao dos
mnimos quadrados pode ser ativada, conforme explicitado no item 21.13.

21.8 HISTOGRAMA
O histograma uma representao grfica para dados contnuos sob a forma de
retngulos justapostos. A base de cada retngulo representa o intervalo de cada classe
e a altura, a respectiva freqncia.
O programa solicita que o usurio informe se os dados esto ou no agrupados em
classes e, tambm, o nmero desejado.
Para obter melhor representao grfica, deve-se evitar que o nmero de classes seja
muito pequeno ou muito grande, pois a representao do histograma, nesses casos,
no atender as finalidades esperadas.

21.8.1 EXEMPLO
Foi tomada a presso arterial diastlica (PAD) de 45 pessoas do sexo feminino, cujas
idades variavam de 25 a 40 anos. Os dados esto inseridos no grid geral e
parcialmente reproduzidos na Figura 21.20.

Figura 21.19
Diagrama de
Disperso do
Exemplo
21.7.1
A figura abaixo
ilustra o resultado
do teste de
Correlao Linear
do Exemplo 21.7.1.

- 215 -
Dados do Exemplo 19.8.1

Nmero de escores = 45
Mnimo = 63
Mximo = 93
Mdia aritmtica = 77,067
Desvio Padro = 8,0068
Mediana = 76

21.8.2 INSTRUES
a) Pressionar o mouse em Histograma;
b) Selecionar a coluna do grid geral e clicar em Executar;
c) Preencher o formulrio Especificao das Classes (Fig.21.21):
i Tipo de Limites de Classes: inferior fechado e superior aberto ( | || | );
ii Mantenha o contedo da caixa de texto Nmero de Classe (6);
iii Ajuste os Limites Superior e Inferior, 96 e 60, respectivamente;
iv - O Limite Inferior no poder ser maior que o Limite Inferior da Amostra,
o qual corresponde ao menor valor amostral, 63 neste caso;
v O Limite Superior no poder ser menor que o Limite Superior da
Amostra, correspondente ao maior valor amostral, 93 neste exemplo;
d) Pressionar o boto Confirmar para obter o Histograma.

Figura 21.20
Viso parcial
dos dados
do Exemplo
21.8.1
Figura 21.21
Histograma
do Exemplo
21.8.1

- 216 -

O histograma pode ser associado ao polgono de freqncia, como observado na
Figura 21.23.

Figura 21.22
O BioEstat
sugere o
nmero de
classes e
os limites
superior e
inferior do
histograma
do Exemplo
21.8.1

A figura abaixo
ilustra a configurao
para exibio
do polgono de
freqncia.
Figura 21.23
Histograma
com polgono
de freqncia
do Exemplo
21.8.1

- 217 -
21.9 GRFICO DE LINHA (CURVA)
Utiliza-se este grfico sobretudo na representao de sries temporais, considerando-
se a disposio dos dados nos eixos das abscissas (X) e das ordenadas (Y).

Populaes dos pases A e B (em milhes de habitantes) determinadas a cada 10 anos,
de acordo com a recomendao das Naes Unidas, obtendo-se os dados que esto
inseridos no grid geral. Os escores da primeira coluna correspondem ao eixo das
abscissas (X) e os das demais colunas, ao eixo das ordenadas (Y).

21.9.2 INSTRUES
a) Clicar em Linha (Curva);

Figura 21.25
Grfico de
linha do
Exemplo
21.9.1
Figura 21.24
Dados do
Exemplo
21.9.1

- 218 -
21.10 GRFICO DE MXIMO E MNIMO
Permite comparar a amplitude e os valores mximo e mnimo de cada amostra.

21.10.1 EXEMPLO
A presso arterial sistlica e diastlica foi tomada de 25 pessoas do sexo feminino
e de 10 indivduos do sexo masculino, respectivamente. Os dados esto inseridos no
grid geral, com as indicaes da Legenda:

21.10.2 INSTRUES
a) Clicar em Mximo e Mnimo;

As amplitudes, tanto sistlicas como diastlicas, assinaladas na parte superior de cada
barra vertical, foram maiores nos indivduos do sexo masculino, o que demonstra
maior variao dessas variveis entre os homens. J o valor mximo da presso
sistlica foi maior entre as mulheres, enquanto o da diastlica, observou-se nas
pessoas do sexo masculino.
Figura 21.27
Grfico de
Mximo e
Mnimo do
Exemplo
21.10.1
Legenda:
1: PMS-F presso mxima sistlica,
sexo feminino;
2: PMS-M presso mxima sistlica,
sexo masculino;
3: PMD-F presso mxima diastlica,
sexo feminino;
4: PMD-M presso mxima diastlica,
sexo masculino.
Figura 21.26
Dados
parciais do
Exemplo
21.10.1

- 219 -
21.11 GRFICO POLAR
recomendado para sries temporais de carter cclico, as quais representam
determinados perodos.

Foram registrados os limites das reas endmicas de malria e dengue durante 12
meses. As distncias lineares registradas esto dimensionadas em quilmetros, em
relao sede do municpio. Os dados esto contidos na Fig. 21.28.

21.11.2 INSTRUES
b) Apontar o mouse em Grficos;
c) Clicar em Polar;
d) Selecionar as colunas do grid e pressionar o mouse em Executar.
Figura 21.28
Dados do
Exemplo
21.11.1
Figura 21.29
Resultados
do Exemplo
21.11.1

- 220 -
Apenas em um perodo (outubro) a ocorrncia de dengue ultrapassou os limites
geogrficos dos casos de malria. A sede do municpio est representada pelo centro
do grfico (cruzamento das linhas das ordenadas com as das abscissas).

21.12 GRFICO DE SETOR
Deve ser utilizado para dados nominais ou ordinais, quando o principal objetivo o
de comparar vrias parcelas com o total. Divide-se um crculo em setores, cada um
correspondendo, de forma proporcional, a uma das categorias da amostra.

Dados da vacinao efetuada em crianas de 0 a 1 ano de idade, em um Posto de
Sade da cidade de Castanhal, Par, no primeiro trimestre de 1999.

21.12.2 INSTRUES
a) Clicar em Setor;
b) Na janela do grfico selecione Configuraes;
c) Na aba Outras, selecione entre Absolutos ou Percentuais;
e) Selecionar as colunas do grid e pressionar o mouse em Executar.

facilmente visualizado que a vacina Sabin e o BCG representaram as maiores
propores de vacinaes efetuadas no perodo indicado. A fatia destacada
corresponde vacina trplice, escolhida de forma aleatria.
Figura 21.30
Dados do
Exemplo
21.12.1
Figura 21.31
Grfico de
setor do
Exemplo
21.12.1
Para destacar uma ou mais
fatias do grfico de setor,
pressione o menu
Configuraes, selecione
a janela Fontes e Cores,
clique no boto Elementos
do grfico, selecione o
nmero do(s) elemento(s)
desejado(s) e marque a
caixa Destacar.

- 221 -
21.13 MANIPULAO DE GRFICOS
Os grficos gerados pelo BioEstat podem ser alterados pelo usurio, impressos ou
copiados para o clipboard (memria auxiliar do Microsoft Windows).

21.13.1 IMPRIMIR GRFICOS
Aps a exibio do grfico, acione o menu Arquivo, Imprimir e escolha o tipo de
impresso desejada.

21.13.2 COPIAR E COLAR GRFICOS
Aps a exibio do grfico, acione o menu Editar, selecione a opo Copiar, para que
a imagem do grfico fique armazenada na memria, podendo, dessa forma, ser
colada (aplicada, visualizada) em outros programas como o Microsoft Excel, Word ou
PowerPoint, atravs do uso das teclas CTRL-V ou no acionamento do menu Editar,
Colar daqueles aplicativos.

21.13.3 CONFIGURAR APARNCIA DE GRFICOS
As caractersticas do grfico podem ser alteradas pelo acionamento do menu
Configuraes. O formulrio de Configuraes contm 4 grupos de caractersticas
que podem ser manipuladas:
a) Ttulos; b) Fontes e Cores;
c) Linhas Auxiliares; d) Outras.

21.13.3.1 - CONFIGURAR TTULOS
a) Clique na tabela Ttulos para visualizar a Figura 21.33.
b) Preencha as caixas de texto com os ttulos desejados;
c) Clique em Atualizar.

Figura 21.32
Menu de
impresso
de grficos
Figura 21.33
Configurao
de ttulos da
Figura 21.25

- 222 -
21.13.3.2 - CONFIGURAR FONTES E CORES
Clique na tabela Fontes e Cores para visualizar a Figura 21.34.

Para configurar adequadamente o item Fontes e Cores, siga as instrues abaixo:

1. Escolha a abrangncia da configurao, entre as seguintes opes:
a) Ttulo; b) Subttulos;
c) Fundo (Cor de fundo); d) Legendas.
e) Elementos do Grfico f) Explodir

2. Ajuste o tamanho dos caracteres utilizando a escala grfica abaixo.

3. Escolha a aparncia dos textos selecionados, entre as seguintes opes:
a) Negrito b) Itlico c) Sublinhado

4. Escolha a cor desejada clicando na grade colorida exibida na Figura 21.34.
5. Para alterar a cor de elementos como barras, linhas, pontos, etc.:
a) Clique no boto Elementos do Grfico;
b) Selecione o nmero do elemento, na caixa de combinao;
c) Clique na cor desejada.

21.13.3.3 - CONFIGURAR LINHAS AUXILIARES
Com os dados do Exemplo 21.7.1 e respectivo grfico, clique em Linhas
Auxiliares para visualizar a Figura 21.36.

Figura 21.35
Tamanho dos
caracteres.
Figura 21.34
Configurao
de fontes e
cores.
Figura 21.36
Configurao
de linhas
auxiliares

- 223 -
Para configurar as linhas auxiliares:
a) Escolha a linha desejada: Mdia, Desvio padro, Mximo e Mnimo, Curva
ajustada, best Fit ou Grade;
b) Clique no boto Habilitar (localizado acima da grade de cores);
c) Clique na cor desejada

As linhas tracejadas, Figura 21.37, correspondem a 1 em torno da mdia de Y. A
linha contnua horizontal representa a mdia aritmtica da mesma varivel e a linha
contnua inclinada corresponde reta de regresso ( bX a Y + =
).

21.13.3.4 OUTRAS (Dados, Dimenses, Eixos e Orientao)
De acordo com o modelo selecionado do grfico, os dados podero ser apresentados
sob a forma percentual ou em ternos absolutos, as figuras (setor) representadas em
duas ou trs dimenses, a intercesso entre os eixos cartesianos na origem (0,0) ou
em um ponto varivel determinado pelo BioEstat, e a orientao das colunas em
barras verticais ou horizontais.
Para essas finalidades deve-se selecionar em Configuraes a opo Outras,
escolhendo uma das opes conforme o tipo de grfico em questo, ou seja, Dados,
Dimenses, Eixos ou Orientao.

21.14 TABELAS DE FREQNCIA
As tabelas de freqncia constituem um modelo de representao tabular utilizado
nas descries de dados quantitativos discretos ou contnuos. Embora sua construo
manual seja relativamente simples, o BioEstat apresenta esse modelo, com os
intervalos de classes, os pontos mdios e as freqncias absoluta e percentual de cada
classe, podendo, ainda, o usurio colocar o ttulo, conforme o caso.
O nmero de classes fica a critrio do usurio, mas o programa, considerando a
amplitude total e o nmero de escores, sugere um nmero adequado, de acordo com a
frmula de Sturges.

Figura 21.37
Linhas
auxiliares.

- 224 -
Foi determinada a quantidade de consumo de oxignio, aps exerccio controlado, em
44 estudantes de uma Escola Superior de Educao Fsica, Pa., em maro de 1998. Os
dados esto inseridos no grid geral, Figura 21.38.

21.14.2 INSTRUES
a) Pressionar o mouse em Tabelas de Freqncia;
b) Selecionar a coluna do grid geral e clicar em Executar;
c) Preencher o formulrio Especificao das Classes (Fig.21.39):
i Tipo de Limites de Classes: inferior fechado e superior fechado ( | || | | || | );
ii Aumente o contedo da caixa de texto Nmero de Classes para 7;
iii Ajuste os Limites Superior e Inferior, 73 e 32, respectivamente;
iv - O Limite Inferior no poder ser maior que o Limite Inferior da Amostra,
o qual corresponde ao menor valor amostral, 33 neste caso;
v O Limite Superior no poder ser menor que o Limite Superior da
Amostra, correspondente ao maior valor amostral, 70 neste exemplo;
d) Pressionar o boto Confirmar para obter Tabela de Freqncia.
Figura 21.38
Viso parcial
do Exemplo
21.14.1
Figura 21.39
Formulrio
Especificao
das Classes

- 225 -

Se desejar a imagem desses dados, pressione o mouse em Histograma na barra superior
da Fig. 21.40.

A figura 21.39 apresenta trs opes de tipos de limites dos intervalos de classes:
a) | intervalos fechados esquerda e abertos direita, devendo-se, neste caso,
aumentar o limite superior ajustado;
b) | | intervalos fechados direita e esquerda;
c) | intervalos fechados direita e abertos esquerda, devendo-se, neste caso,
diminuir o limite inferior ajustado.

21.15 GRFICOS DE RESULTADOS
Alm dos grficos contidos neste captulo, o BioEstat 3.0 disponibiliza outros diagramas
adequados interpretao de resultados especficos, os quais s podem ser obtidos
atravs da opo Grfico que est localizada na parte superior do grid de resultados do
teste em questo.

Figura 21.40
Tabela de
Freqncia
do Exemplo
21.14.1

- 226 -

- 227 -
CAPTULO 22
FRMULAS ESTATSTICAS

22.1 INTRODUO
Neste captulo esto dispostas as frmulas dos testes estatsticos contidos no BioEstat.

22.2 ANLISE MULTIVARIADA

22.2.1 COMPONENTE PRINCIPAL
a) Matriz de covarincia:
!
!
!
!
!
"
#
$
$
$
$
$
%
&
=
pp p p
p
p
c c c
c c c
c c c
C
2 1
2 22 21
1 12 11
;
b) Autovalores:
pp p
c c c c + + + + = + + + +
33 22 11 3 2 1
;
c) Ordenao dos autovalores:
0
3 2 1

p
;
d) Autovetores:
ip i i
a a a , , ,
2 1
;
e)
i
corresponde ao i
simo
componente principal:
p ip i i i
X a X a X a Z + + + =
2 2 1 1
;
f) Varincia:
( )
i i
Z = var .

22.2.2 DISTNCIA MULTIVARIADA (Euclidiana)
i, j = indivduos; p = nmero de variveis;
( )
'
(
)
*
+
,
- =
=
p
k
jk ik ij
x x d
1
2
.

22.2.3 DISTNCIA MULTIVARIADA (Penrose)
p = nmero de variveis;
( )
-
=
=
p
k
k
kj ki
ij
pV
P
1
2

.

- 228 -
CAPTULO 22 FRMULAS ESTATSTICAS

22.2.4 DISTNCIA MULTIVARIADA (Mahalanobis)
( ) ( ) - - =
= =
p
r
p
s
sj si
rs
rj ri ij
v D
1 1
2

.

22.2.5 TESTE DE HOTELLING
a) Estimao conjunta da matriz de covarincia:
( ) ( ) { }
2
2 1
2
1
2 1
1
1
+
+
=
n n
C n C n
C
;
b) Teste de Hotelling:
( ) ( )
2 1
2 1
1 '
2 1 2 1 2
n n
x x C x x n n
T
+

=
;
( ) ( ) { } p n n T p n n F 2 / 1
2 1
2
2 1
+ + = ;
gl = (n
1
+ n
2
p 1).

22.2.6 TESTE DE BARTLETT
n = nmero de observaes;
m = nmero de amostras;
|T| = matriz da soma dos quadrados e produtos;
|W| = matriz da soma dos quadrados dentre as amostras e dos produtos cruzados;
( ) [ ] W T m p n / ln
2
1
1
!
"
#
$
%
&
=
.

22.3 ANLISE DE SOBREVIVNCIA

22.3.1 ANLISE ATUARIAL
S(t) = funo de risco, que indica a probabilidade de sobrevivncia no tempo t, para
cada t > 0;
h(t) = risco no tempo t, determinado pela equao:
( )
( ) ( )
( ) t S
t
t t S t S
t h
!
"
#
$
%
&
+
=
.

22.3.2 KAPLAN-MEIER
.
.
/
0
1
1
2
3
=
=
k
j
j
j j
n
d n
t S
1
) (
;

- 229 -
intervalos de t
(k)
a t
(k + 1)
, sendo k = 1, 2, 3, .r;
{ } { } ln var ) (
ln var
1
- =
=
k
j
j
p t S
.

22.3.3 LOG-RANK TEST
- =
=
k
i
i
a O
1
;
( ) ( )
-
+ +
=
=
k
i
i
i i i i
N
c a b a
E
1

;
( ) ( ) ( ) ( )
( )
-
+ + + +
=
=
k
i
i i
i i i i i i i i
N N
d b c a d c b a
V
1
2
1

;
( )
V
E O
X
LR
2
2
5 . 0
=
.

22.3.4 COX-MANTEL TEST
- =
=
k
i
i i
A m r U
1
2
;

( )
( ) -
=
=
k
i
i i
i
i i i
A A
r
m r m
I
1
1
1
; I U Z = .

22.3.5 GEHAN (WILCOXON GENERALIZADO)
- - =
= =
1
1
2
1
n
i
n
j
ij
U W ;

( )( ) 1

) (
2 1 2 1
2 1
1
2
2 1
+ +
-
=
+
=
n n n n
U n n
W Var
n n
i
i
; ) (W Var W Z = .

22.4 ANLISE DE VARINCIA

22.4.1 ANOVA (um critrio)
X
ij
= observaes individuais;
i = refere-se aos tratamentos (1, 2, 3it);
j = relativo s repeties (1, 2, 3jr);
rt = nmero de unidades experimentais;

- 230 -
X
i.
= totais dos tratamentos;
X
..
= total geral; r X X
i
i
/
.
. - = ;
SQ = soma dos quadrados:
rt
X
X SQ
ij total
2
.. 2
=
;
rt
X
r
X
SQ
i
s tratamento
2
..
2
.
=
;
SQ
erro
= SQ
total
SQ
tratamentos
; gl
tratamentos
= t 1; gl
erro
= t(r 1);

QM = quadrados mdios (varincias):
QM
tratamentos
= SQ
tratamentos
/ gl
tratamentos
; QM
erro
= SQ
erro
/ gl
erro
;
F
tratamentos
=
erro
s tratamento
QM
QM
.

22.4.2 ANOVA (dois critrios)
rt
X
t
X
SQ
j
blo
2
2
cos
..
.
=
; SQ
erro
= SQ
total
SQ
tratamentos
SQ
blocos
;
gl
blocos
= r 1; gl
erro
= (t 1)(r 1);
QM
blocos
= SQ
blocos
/ gl
blocos
; QM
erro
= SQ
erro
/ gl
erro
;
F
blocos
=
erro
blo
QM
QM
cos
.

22.4.3 TESTE DE FRIEDMAN
N = nmero de linhas;
k = nmero de colunas;
R
j
= soma dos postos da coluna j;
( ) 1 3
) 1 (
12
1
2 2
+
!
"
#
$
%
&
-
+
= =
=
k N R
k Nk
F X
k
j
j r r
.

22.4.4 TESTE KRUSKAL-WALLIS
k = nmero de amostras ou grupos;
N = nmero total de escores;
n
j
= nmero de escores da amostra j;
R
j
= somatrio dos postos da amostra j;
( ) 1 3
) 1 (
12
1
2
+
!
!
"
#
$
$
%
&
+
=
-
=
N R n
N N
H
k
j
j
j
.

22.4.5 TESTE Q DE COCHRAN
gl = k 1;

- 231 -
G
j
= total de sucessos no posto j;
L
i
= total de sucessos na linha i;
( )
- -
!
!
"
#
$
$
%
&
-
.
.
/
0
1
1
2
3
-
=
= =
= =
N
i
N
i
i i
k
j
k
j
j j
L L k
G G k k
Q
1 1
2
1
2
1
2
1
.

22.5 CORRELAO

22.5.1 CONTINGNCIA C
( )
- -
= =
=
r
i
k
j ij
ij ij
E
E O
1 1
2
2
;
2
2
+
=
N
C ;
N = soma de todas as categorias.

22.5.2 CONCORDNCIA DE KENDALL
( ) N N k
N
R
R
W
j
j
-
.
.
/
0
1
1
2
3 -
=
3 2
2
12
1
;
1
1
=
k
kW
r
av
S
;
k = nmero de conjuntos de postos;
N = nmero de indivduos.

22.5.3 CORRELAO DE KENDALL
N = nmero de postos;
( ) 1
2
1
=
N N
S
;
( )
( ) 1 9
5 2 2
+
=
N N
N

= z
.

- 232 -

22.5.4 COEFICIENTE DE CORRELAO PARCIAL
N = nmero de trincas de variveis (X, Y, Z);
2 2
.
1 1
yz xz
yz xz xy
z xy
r r
r r r
r

=
varivel z mantida constante;
gl = N 3.

22.5.5 COEFICIENTE DE CORRELAO LINEAR DE PEARSON

( ) ( )
( ) ( ) n Y Y n X X
n Y X XY
r
/ /
/
2 2 2 2
- - - -
- - -
=
;
n = nmero de pares (X, Y);
gl = n 2;
2
1
2
r
n r
t
=
.

22.5.6 COEFICIENTE Phi
( ) ( ) ( ) ( ) d c b a d b c a
bc ad
r phi
+ + + +
= =

.

22.5.7 COEFICIENTE DE CORRELAO DE SPEARMAN
N = nmero de pares; D = diferena entre postos;
) 1 (
6
1
2
2
-
=
N N
D
r
i
s
;
2
1
2
s
s
r
N
r t
=
.

- 233 -

22.6 DISTRIBUIO DE PROBABILIDADES

22.6.1 DISTRIBUIO BINOMIAL
n = tamanho da amostra;
E(x) = = np = mdia;
V(x) =
2
= npq = varincia;
= npq = desvio padro;
( )
x n x
q p
x n x
n
x P

=
)! ( !
!
.

22.6.2 DISTRIBUIO DE POISSON
E(x) = = np = mdia;
V(x) =
2
= np = varincia;
( )
! x
e
x P
x

=
;
e = 2.71828 (constante matemtica, base dos logaritmos neperianos).

22.6.3 DISTRIBUIO HIPERGEOMTRICA
N = tamanho da populao;
k = nmero de elementos na populao considerados sucessos;
N k = nmero de elementos na populao considerados insucessos;
x = nmero de sucessos na amostra;
E(x) = =
N
k
n
= mdia;
V(x) =
2
=
.
/
0
1
2
3
.
/
0
1
2
3
.
/
0
1
2
3
1 N
n N
N
k N
N
k
n
;
( )
( )
( )
( ) ( ) ( ) ( )
( )! !
!
! !
!
! !
!
n N n
N
x n k N x n
k N
x k x
k
x P
=
.
( )
( )
( )
( ) ( ) ( ) ( )
( )! !
!
! !
!
! !
!
n N n
N
x n k N x n
k N
x k x
k
x P
=

- 234 -
22.6.4 DISTRIBUIO EXPONENCIAL
= 1/ = mdia; = 1/ = desvio padro;
( )
x
e x P

= 0 , sendo > 0.

22.6.5 DISTRIBUIO NORMAL
N
X -
=
= mdia;
( )
N
N X X - -
=
/
2 2
2
= varincia;
2
= = desvio padro;
( )
2
2 /
2
2

=
x
e
N
Y
= equao da curva normal;
Y = freqncia;
X = escore bruto;
e = 2.71828 (constante matemtica, base dos logaritmos neperianos);
= 3.1416 (constante matemtica);

=
X
z
= escores padronizados.

22.6.6 CRIVO (Screening Test)
Tabela de contingncia 2 x 2:
Teste Doente No-doente Total
+
a b a + b

c d c + d
Total
a + c b + d a + b + c + d

100
+ c a
a
= sensibilidade;
100
+ d b
d
= especificidade;
100
+ b a
a
= valor preditivo do teste positivo;
100
+ d c
d
= valor preditivo do teste negativo;
d c b a
c a
+ + +
+
= prevalncia.
( )
x
e x P

= 0

- 235 -
22.6.7 CURVA ROC (Receiver Operating Characteristic curve)

NA = Nmero de pacientes
NN = Nmero de sadios
Ponto de Corte = 1 especificidade, sensibilidade
i
1
1 i i
dade Especifici * ) ade Sensibilid ade Sensibilid ( * 5 . 0 rea
-
=
+ =
k
i

Q1 = rea/(2 rea); Q2 = ( ) ( ) rea 1 / rea 2
2
+
Q3 = ( ) rea 1 rea ; Q4 = ( ) ( )
2
rea - Q1 1 NA
Q5 = ( ) ( )
2
rea - Q2 1 NN ;
Erro padro = ( ) ( ) NN NA / Q5 Q4 Q3 + +
( ) ( )
2 2
dade Especifici 1 ade Sensibilid 1 + = d
Eixo das ordenadas (Y) = Sensibilidade
Eixo das abscissas (X) = 1 Especificidade (Falso-positivos)

22.6.8 REGRA DE BAYES
-
=
=
k
j
j j
i i
i
B B A
B B A
A B
1
) Pr( ) Pr(
) Pr( ) Pr(
) Pr(

22.7 UMA AMOSTRA

22.7.1 KOLMOGOROV-SMIRNOV (aderncia)
k = nmero de postos; N = tamanho da amostra;
Fo(X) = distribuio terica acumulada sob H
0
;
Sn(X) = distribuio amostral acumulada;
D = mximo |Fo(X) Sn(X)| = desvio mximo;
N
D
36 . 1
, para = 0.05;
N
D
63 . 1
, para = 0.01.

22.7.2 QUI-QUADRADO (aderncia)
O = freqncia observada; E = freqncia esperada;
k = nmero de categorias;
( )
-

=
E
E O
2
2
;

- 236 -
( )
( )
-

=
E
E O
Yates
2
2
5 . 0
;
gl = k 1.

22.7.3 TESTE G (aderncia)
=
i
f freqncia observada; =
i
f
freqncia esperada;
k = nmero de categorias;

-
.
.
/
0
1
1
2
3
=
k
i
i
i
f
f
f G
ln 2
; gl = k 1.

22.7.4 TESTE BINOMAL: UMA PROPORO
p = proporo do evento amostral; p
0
= proporo do evento na populao;
N = tamanho da amostra;
Quando
0
p p < : ( ) ( ) ( ) [ ] N q p p p valor p / 2
0 0 0
= ;
Quando
0
p p : ( ) ( ) ( ) [ ] { } / 1 2
0 0 0
N q p p p valor p = .

22.7.5 TESTE t (Student)
= mdia da populao; n = tamanho da amostra;
n
X
X
i
-
=
; n s s
x
/ = ;
x
s
X
t

=
; gl = n 1.

22.7.6 TESTE Z
= mdia da populao; n = tamanho da amostra;
n
X
X
i
-
=
; n
x
/ = ;
x
X
Z

= .
22.7.7 TESTE DE POISSON

!
!
"
#
$
$
%
&
- =
=
x
k
k
k
e
p
0
0
0
!
1 2

quando x <
0

!
!
"
#
$
$
%
&
- =
=
x
k
k
k
e
p
0
0
0
!
2

quando x
0
.

- 237 -
22.8 DUAS AMOSTRAS INDEPENDENTES

22.8.1 TESTE EXATO DE FISHER
A = escore da casela A; B = escore da casela B;
C = escore da casela C; D = escore da casela D;
N = A + B + C + D;
! ! ! ! !
)! ( )! ( )! ( )! (
D C B A N
D B C A D C B A
p
+ + + +
=
.

22.8.2 TESTE DE KOLMOGOROV-SMIRNOV
k = nmero de postos; NA = tamanho da 1
a
amostra; NB = tamanho da 2
a
amostra;
Distribuio das freqncias acumuladas:
S
NA
(X) = k/NA; S
NB
(X) = k/NB;
D = mximo |S
NA
(X) S
NB
(X)| = desvio mximo;
NB NA
NB NA
D
+
=
2 2
4
;
NB NA
NB NA
D
+
36 . 1
, para = 0.05;
NB NA
NB NA
D
+
63 . 1
, para = 0.01.

22.8.3 TESTE DE MANN-WHITNEY
n
1
= tamanho da primeira amostra; n
2
= tamanho da segunda amostra;
R
1
= soma dos postos da primeira amostra;
R
2
= soma dos postos da segunda amostra;
( )
1
1 1
2 1
2
1
R
n n
n n U
+
+ =
, ou
( )
2
2 2
2 1
2
1
R
n n
n n U
+
+ =
;
2
2 1
n n
U
=
= mdia;
( ) ( ) ( )
12
1
2 1 2 1
+ +
=
n n n n
U
= desvio padro;
U
U
U
z

=
; ( ) ( ) [ ] z valor p = 1 2 .

22.8.4 TESTE DA MEDIANA
MC = mediana combinada;
A = nmero de escores da amostra 1 acima da MC;
B = nmero de escores da amostra 1 abaixo da MC;
C = nmero de escores da amostra 2 acima da MC;
D = nmero de escores da amostra 2 abaixo da MC;

- 238 -
( ) ( ) ( ) ( ) D B C A D C B A
N
BC AD N
X
+ + + +
.
/
0
1
2
3

=

2
2
2
;
gl = 1.

22.8.5 TAXA DE INCIDNCIA

( )
2 1
1 2 1
1
t t
t a a
E
+
+
= ;

( )
2
2 1
2 1 2 1
1
) ( t t
t t a a
V
+
+
= ;
a
1
e a
2
= nmero de eventos nos grupos 1 e 2;
t
1
e t
2
= nmero de pessoas nos tempos 1 e 2;

1
1 1
5 . 0
V
E a
Z

= , quando a
1
> E
1
;

1
1 1
5 . 0
V
E a
Z
+
= , quando a
1
E
1
; Teste vlido quando V
1
5.
22.8.6 ODDS RATIO (OR)
Sucesso Insucesso Total
Amostra 1
a b n
1
Amostra 2
c d n
2

Total
n
a
n
b
N

p
1
= a/n
1
; q
1
= 1 p
1
;
p
2
= c/n
2
; q
1
= 1 p
2
;
1 2
2 1
q p
q p
bc
ad
OR = =
;
( )
-

=
E
E O
X
2
2
5 .
;
C
1
= ln(OR) 1.96
d c b a
1 1 1 1
+ + +
;
C
2
= ln(OR) + 1.96
d c b a
1 1 1 1
+ + +
;
IC(95%): 2.71828
C1
OR 2.71828
C2
;
IC vlido somente quando:
n
1
p
1
q
1
5 e n
2
p
2
q
2
5.

- 239 -
22.8.7 QUI-QUADRADO
r = nmero de linhas;
( )
- -

=
= =
r
i
k
j
ij
ij ij
E
E O
1 1
2
2
;
( )
- -

=
= =
r
i
k
j
ij
ij ij
Yates
E
E O
1 1
2
2
5 . 0
;
gl = (r 1)(k 1);
Correo de Yates: somente quando gl = 1.

22.8.8 RISCO RELATIVO
Sucesso Insucesso Total
Amostra 1
a b n
1
Amostra 2
c d n
2

Total
n
a
n
b
N
p
1
= a/n
1
; q
1
= 1 p
1
;
p
2
= c/n
2
; q
1
= 1 p
2
;
1 2
2 1
q p
q p
bc
ad
RR = =
;
( )
-

=
E
E O
X
2
2
5 .
;
C
1
= ln(RR) 1.96
2 1
cn
d
an
b
+
;
C
2
= ln(RR) + 1.96
2 1
cn
d
an
b
+
;
IC(95%): 2.71828
C1
RR 2.71828
C2
;
IC vlido somente quando:
5
1
q p n e 5
2
q p n .

22.8.9 TESTE BINOMIAL: DUAS PROPORES
; 1 ,

2 1
2 2 1 1
p q
n n
p n p n
p =
+
+
=

( )
2 1
2 1
/ 1 / 1

n n q p
p p
Z
+
=
;

- 240 -
p(valor) = ( ) [ ], 1 2 Z se Z 0;

p(valor) = ( ) Z 2 , se Z < 0.

22.8.10 TESTE t DE STUDENT
n
1
= tamanho da amostra 1; n
2
= tamanho da amostra 2;
- - = =
2 2
2
1 1
1
/ ; / n X X n X X ;
( ) ( )
.
.
/
0
1
1
2
3
+
.
.
/
0
1
1
2
3
+
+
=
2 1 2 1
2
2 2
2
1 1
1 1
2
1 1
n n n n
s n s n
s
dif
;
( )
dif
s X X t /
2 1
= ;
gl = n
1
+ n
2
2.

22.8.11 TESTE Z
n
1
= tamanho da amostra 1; n
2
= tamanho da amostra 2;
- - = =
2 2
2
1 1
1
/ ; / n X X n X X ;
2 1
2 1
x x
X X
Z
;

p-valor = 1 - (z) ! teste unilateral;

p-valor = 2 (1 - (z)) ! teste bilateral

22.8.12 COEFICIENTES DE VARIAO
.
/
0
1
2
3
+
.
.
.
/
0
1
1
1
2
3
=
2
5 . 0
1
2
2
1
1
2
2 1
p
V
n
p
V
n
p
V
CV CV
Z
;
) 1
2
( ) 1
1
(
2
) 1
2
(
1
) 1
1
(
+
+
=
n n
CV n CV n
p
V ;
p-valor = 2 (1 - (z)).

22.8.13 TESTE DE POISSON
2 1
2 1
X X
X X
Z
+
=

22.9 DUAS AMOSTRAS RELACIONADAS

22.9.1 TESTE KAPPA
p
o
= probabilidade de concordncia observada;
p
e
= probabilidade de concordncia esperada;

- 241 -
e
p
e
p
o
p
K
=
1
;
( )
( )
( ) [ ]
4
'
4
(
)
4
*
4
+
,
-
=
+ +
=
c
i
i
b
i
a
i
b
i
a
e
p
e
p
e
p N
K
se
1
2
2
1
1
;
( ) K
se
K
Z =
;
( ) ( ) Z valor p = 1 .

22.9.2 TESTE DE McNemar
N
A
= total de pares discordantes tipo A;
N
D
= total de pares discordantes;
Para N
D
20:
.
/
0
1
2
3
.
.
/
0
1
1
2
3
=
4 2
1
2
2
2 D D
A
N N
N X
;
( ) ( )
2 2
1
Pr X valor p = ;
Para N
D
< 20:
- .
/
0
1
2
3
.
/
0
1
2
3
=
=
D
N
k
D
N
D
N
k
p
0 2
1
2
quando N
A
< N
D
/2;
- .
/
0
1
2
3
.
/
0
1
2
3
=
=
D
N
A
N k
D
N
D
N
k
p
2
1
2
quando N
A
N
D
/2.

22.9.3 TESTE DOS SINAIS
H
0
: P(+) = P() =
2
1
;
H
1
: P(+) P();
( ) - =
=
x
k
k n k
k n
q p C p n x k P
0
,
;
n
n x
Z

=
1 2
.

22.9.4 TESTE DE WILCOXON
T = soma dos postos do mesmo sinal;
( )
4
1 +
=
N N
T
;

- 242 -
( ) ( )
24
1 2 1 + +
=
N N N
T
;
( )
T
T
T
T Z

=
;
( ) ( ) [ ] T valor p = 1 2 .

22.9.5 TESTE t DE STUDENT
-
= N D D / ;
( )
1
2
-
=
N
D D
s
D
;
N
s
s
D
D
=
;
D
s
D
t =
; gl = N 1.

22.9.6 ANOVA (dados pareados)
a = 2 (colunas); b = nmero de itens;
=
1 A
Y mdia da coluna 1; =
2 A
Y mdia da coluna 2;
=
Bi
Y mdias aritmticas de cada par de observaes;
- - = =
= =
a
i
b
j
Y
ab
Y
1 1
1
mdia geral;
SS
A
=
( ) -
=
a
i
A
Y Y b
1
2
; gl
A
= 1; QM
A
= SS
A
/ gl
A
;
SS
B
=
( ) -
=
b
j
B
Y Y a
1
2
; gl
B
= b -1; QM
B
= SS
B
/ gl
B
;
SS
erro
=
( ) - - +
= =
a
i
b
j
B A
Y Y Y Y
1 1
2
; gl
erro
=1x(b 1); QM
erro
= SS
erro
/ gl
erro
;
F
A
= QM
A
/ QM
erro
; F
B
= QM
B
/ QM
erro
.

22.10 ESTATSTICA DESCRITIVA

22.10.1 AMPLITUDE TOTAL
At (valor mximo valor mnimo) = amplitude total.

- 243 -

22.10.2 MDIA ARITMTICA
n
X
X
n
i
i
-
=
=1
.

22.10.3 MEDIANA
a) quando o nmero de observaes for mpar:
Md = valor da posio
.
/
0
1
2
3 +
2
1 n
;
b) quando o nmero de observaes for par:
Md = mdia dos valores das posies
.
/
0
1
2
3
+ .
/
0
1
2
3
1
2

2
e
n n
.

22.10.4 VARINCIA
( )
1
2
2
-
=
n
X X
s
i
ou
( )
1
/
2
2
2
- -
=
n
n X X
s
i i
.

22.10.5 DESVIO-PADRO
2
s s = .

22.10.6 ERRO-PADRO
n
s
s
x
=
.

22.10.7 COEFICIENTE DE VARIAO (%)
100 =
X
s
CV
.

22.10.8 MOMENTOS DE ORDEM r CENTRADOS NA MDIA
r = 2, 3 e 4

( ) - =
2
2
X X m
i
;
( ) - =
3
3
X X m
i
;
( ) - =
4
4
X X m
i
.

- 244 -

22.10.9 COEFICIENTE DE ASSIMETRIA
g
1
=
( ) ( )
3
3
2 1
n n
m n
;
g
1
= 0: curva simtrica;
g
1
> 0: curva assimtrica positiva;
g
1
< 0: curva assimtrica negativa.

22.10.10 COEFICIENTE DE CURTOSE
g
2
=
( ) ( ) [ ]
( ) ( ) ( ) [ ]
4
2 2 4
3 2 1
1 3 1

+
n n n
n m m m n n
;
g
2
= 0: curva normocrtica;
g
2
> 0: curva leptocrtica;
g
2
< 0: curva platicrtica.

22.10.11 MDIA GEOMTRICA
GM = n
n
i
i
X
=1
, ou ln(G) =
n
X
i
) ln( -
GM = antiln(G).

22.10.12 VARINCIA GEOMTRICA
V1 =
n
X
i
- ) ln(
; V2 =
1
) ln(
1 1
-
n
V X
;
Var
geomtrica
=
( )
( ) 10 ln
antiln
2
V
.

22.10.13 DESVIO-PADRO GEOMTRICO
D
1
=
2
V ; Desvio-padro
geomtrico
= antiln(D
1
).

- 245 -
22.11 ESTIMAO DE PARMETROS

22.11.1 ESTIMAO DA MDIA
a) De ponto:

n
X
X
i
-
=
;
b) De intervalos:

n
s
s
x
=
;

IC(95%):
para varincia paramtrica desconhecida: ( )
x
s gl t X
05 .
;
para varincia paramtrica conhecida:
x
X 96 . 1 ;
IC(99%):
para varincia paramtrica desconhecida: ( )
x
s gl t X
01 .
;
para varincia paramtrica conhecida:
x
X 58 . 2 .

22.11.2 ESTIMAO DA PROPORO
k = nmero de eventos favorveis; n = tamanho da amostra;
a) De ponto:
p =
n
k
;
b) De intervalos:

( )
n
p p
p

=
1

;
IC(95%):
p
p 96 . 1 ;
IC(99%):
p
p 58 . 2 .

22.11.3 ESTIMAO DA DIFERENA ENTRE DUAS MDIAS

a) De ponto

A
i
A
n
X
X
-
=
;
B
j
B
n
X
X
-
=
;
E = ( )
B A
X X ;
b) De intervalos:

- 246 -

( )
2
2
2
1
2
1
2 1
n n
x x

+ =
ou
( )
2
2
2
1
2
1
2 1
n
s
n
s
s
x x
+ =

IC(95%):
( )
B A
X X 1.96
( )
2 1
x x
ou ( )
B A
X X ( )
) ( 05 .
2 1
x x
s gl t

IC(99%):
( )
B A
X X 2.58
( )
2 1
x x
ou ( )
B A
X X ( )
) ( 01 .
2 1
x x
s gl t

22.11.4 ESTIMAO DA DIFERENA ENTRE DUAS PROPORES
a) De ponto:
p
1
= proporo do evento na amostra 1;
p
2
= proporo do evento na amostra 2;
E = (p
1
p
2
);
b) De intervalos:
( )
2
2 2
1
1 1
2 1
n
q p
n
q p
p p
+ =
;
IC(95%): ( )
( )
2 1
2 1
96 . 1
p p
p p

;
IC(99%): ( )
( )
2 1
2 1
58 . 2
p p
p p

.

22.11.5 DENSIDADE E TAMANHO DA POPULAO
A = nmero total de quadros da rea investigada;
n = nmero de quadros selecionados de modo randmico;
a = tamanho de cada quadro;
n
m
m
i
-
=
= mdia de indivduos por quadro;
=
a
m
= estimador da densidade;
( )
an
V

=
;
estimada populao

= = A M ;
IC(95%): ( ) M V M

96 . 1
;
IC(99%): ( ) M V M

58 . 2
.

- 247 -

22.11.6 FENTIPOS E GENTIPOS
Sistema ABO:
-------------------------------------------------------------------------
Fentipo Gentipo Probabilidade Nmero observado
-------------------------------------------------------------------------
O OO r
2
(O)
A AA+AO

p(p+2r) (A)
B BB+BO q(q+2r) (B)
AB AB 2pq (AB)
------------------------------------------------------------------------
Funo logartmica de mxima verossimilhana:
L = (O) 2 ln r + (A){ln p + ln (p + 2 r)}+ (B){ln q + ln (q + 2r)}+ (AB)(ln p + ln q).
Substituindo:
x = p/r; y = q/r;
1 + x + y = 1/r;
Assim,
L = -2N ln(1 + x + y) + {(A) + (AB)}ln x + {(B) + (AB)}ln y + (A) ln (2 + x)+ (B)ln (2
+ y).
Estimao inicial:
[ ] O r =
'
;
[ ] [ ] O B p + =1
'
;
[ ] [ ] O A q + =1
'
;
Total = [ ] [ ] [ ] [ ] [ ] O O B O A + + + 2 ;
D 1 r p q = [ ] [ ] [ ] [ ] [ ] . 1 + + + O O B O A
Equaes de mxima verossimilhana:
( ) ( )( )
=
+
+ + +
+
=
r p
r D p D p
p
p p
2
2 2
2
' ' ' ' '

( ) ( )( )
r q
r D q D q
q
q q
2
2 2
' ' ' ' '
+
+ + +
+
;
sendo:
r = (r+ D) (1 + D);
p = p(1 + D);
q = q(1 + D);
---------------------------------------------
Total = (1 + D) (r+ p+ q+ D)

Sistema MN:
(m) = 2 (MM) + (MN);
(n) = (MN) + 2(NN);

- 248 -
Total = 2G, sendo G = tamanho da amostra;
(MM), (MN) e (NN) correspondem aos gentipos;
Propores gnicas:
m = {2(MM) + (MN)}/2G;
n = {2(NN) + (MN)}/2G;
Nmero esperado de gentipos:
Gm
2
, 2Gmn e Gn
2

Varincia = (mn)/2G
Desvio padro = ( ) G mn 2 / .

22.11.7 FOURIER (densidade)
N = nmero total de indivduos ou grupos observados;
X
i
= distncia perpendicular de cada indivduo ou grupo observado;
W = distncia perpendicular mxima;
L = distncia total inventariada (em metros);
M = nmero de termos para anlise (iterao);
k = 1, 2, 3, , M;
( ) [ ] W X k Z
i k
= 14159 . 3 cos ;
- =
=
M
k
k k
Z S
1
;
( ) [ ]
k k
S W N A = 2
;
- =
+
=
1
2
M
k
k
A U
; H = (1/W) + U + A
1
;
( ) densidade 2 = = L H N D ;
( ) [ ] ( ) ( )
!
"
#
$
%
&
+ =
2
1
2
2
1 1 1 A W A W N V
;
( ) ( ) L H N DA = 2 ; ( ) ( )
2 2
H V N N DB + = ;
DB DA DD =
2
: desvio padro;
.
/
0
1
2
3
=
2
km por grupos ou indivduos densidade 1000000 D
;
IC(95%): DD D 96 . 1 ; IC(99%): DD D 58 . 2 .

22.11.8 TAMANHO DA POPULAO (amostragem simples, mtodo direto)
t = nmero de animais capturados, marcados e devolvidos ao meio ambiente (1
a
captura);
n = nmero de animais capturados (2
a
captura);
s = nmero de animais marcados entre os indivduos da 2
a
captura;
n
s
p = = proporo de animais marcados na 2
a
captura;

- 249 -

s
nt
N =
= populao estimada;
( )
3
2
s
s n n t
p

=
;
IC (95%):
p
N 96 . 1
; IC (99%):
p
N 58 . 2
.

22.11.9 TAMANHO DA POPULAO
(amostragem simples, mtodo inverso)
t = nmero de animais capturados, marcados e devolvidos ao meio ambiente (1
a
captura);
s = nmero de animais marcados que devem ser capturados (2
a
captura);
n = nmero de animais capturados entre marcados e no-marcados (2
a
captura);
n
s
p = = proporo de animais marcados (2
a
captura);
s
nt
N =
= populao estimada;
( )
( ) 1
2

2

+
=
s s
s n n t
p
;
IC (95%):
p
N 96 . 1
; IC (99%):
p
N 58 . 2
.

22.11.10 TAMANHO DE POPULAO FECHADA (amostragem mltipla)
Mtodo de Schumacher e Eschmeyer

= N
tamanho da populao (estimao);

s = nmero de amostras;
n
i
= tamanho de cada amostra;
m
i
= nmero de animais marcados em cada amostra;
M
i
= nmero de animais marcados na populao exatamente antes da i-sima amostra ser
tomada;

-
=
-
=
=
s
i
i
M
i
m
s
i
i
M
i
n
N
2
2
2

( )
-
=
.
.
/
0
1
1
2
3
-
=
-
=
=
s
i
i
M
i
n
s
i
i
M
i
m
s
i
i
n
i
m
s
2
2
2
2
2

2
2 ~
2

- 250 -
Intervalo de Confiana:
IC =
2 / 1
2
2 2 ~
) 2 / (
2
2
2
2
.
.
/
0
1
1
2
3
-
=
-
=
-
=
s
i
i
M
i
n
s
t
s
i
i
M
i
m
s
i
i
M
i
n

22.11.11 TAMANHO DE POPULAO ABERTA (AMOSTRAGEM MLTIPLA)
Mtodo de Parker
o
N
=
o o
M
/
IC = ) ) 2 / (
2
( /
o
n
t
o o
M

22.12 META-ANLISE

22.12.1 DerSimonnian-Laird

-
=
=
k
i i
k w w
1
; .
/
0
1
2
3

=
-
=
k
i
i w
w k w
k
s
1
2 2 2
1
1

( )
.
.
/
0
1
1
2
3
=
w k
s
w k U
i
2
1 ; 1 if 0
2
= k Q
( ) ( ) 1 if / 1 > = k Q U k Q

( ) [ ]
2
*
/ 1
1
+
=
i
i
w
w ;
- -
= =
=
k
i
k
i
i i i RND
w T w T
1 1
* *
.
/

-
=
= =
k
i
i RND
w T
1
*
.
/ 1 ) ( var

- -
= =
+
k
i
i RND
k
i
i RND
w z T w z T
1
*
2 / .
1
*
2 / .
/ ! /

22.12.2 MANTEL-HAENSZEL
Tabelas de Contingncia 2 x 2:
Teste Exposto No-exposto Total
+
a
i
b
I
a
i
+ b
i

c
i
d
I
c
i
+ d
i
Total
a
i
+ c
i
b
i
+ d
I
n
i

- 251 -

( ) ( )
-
+ +
=
=
k
i
i
i i i i
n
c a b a
E
1

;
( ) ( ) ( ) ( )
( )
-
+ + + +
=
=
k
i
i i
i i i i i i i i
n n
d b c a d c b a
V
1
2
1

;
( )
V
E O
X
MH
2
2
5 . 0
=
; gl = 1.

22.12.3 P-VALOR (Fisher)

-
=
k
i
i
p
1
) log( 2 ;
Comparar o valor crtico da distribuio
2
com 2k graus de liberdade.

22.12.4 QUI-QUADRADO (aderncia) para k amostras
gl
a
= k 1, para o qui-quadrado de cada amostra;
gl
t
= gl
a
, para o qui-quadrado total;
gl
ho
= k 1, para o qui-quadrado de homogeneidade;
gl
he
= gl
t
gl
ho
, para o qui-quadrado de heterogeneidade.

22.12.5 QUI-QUADRADO (independncia): para k tabelas 2 x 2

Doente No-doente Total
Exposto
n
11
n
12
1
n
No-exposto
n
21
n
22
2
n
Total
1
n
2
n
n

22 21 12 11
/ 1 / 1 / 1 / 1 n n n n s
i
+ + + = ;
( ) ( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( )
-
.
.
/
0
1
1
2
3
.
.
/
0
1
1
2
3
- -
=
=

= =

k
i
k
i
k
i
A
i n i n
i n i n i n i n
i n i n i n i n
X
1
2
2 1 2 1
2
1 1
1 1 11
2
1
/
;

- 252 -
- =
2
2
2
2
A
i
i
H
s
a
X
; gl
A
= 1; gl
H
= k 1.
22.12.6 REGRESSO (w): para n amostras
x
2
= X
2
(X)
2
/n; y
2
= Y
2
(Y)
2
/n;
xy = XY (X)(Y)/n;

-
-
=
=
=
n
i
n
i
w
x
xy
b
1
2
1
;

( ) - =
=
n
i
Y Y SS
1
2
1
'
, com gl
1
= k(n 2);

( )
-
-
-
=
2
2
2
2
x
xy
y SS
, com gl
2
= k(n 1) 1;
SS
3
= SS
2
SS
1
, com gl
3
= k 1;
Quando o tamanho das amostras so desiguais:
gl
1
de SS
1
=
-
=
k
i
i
k n
1
2
; gl
2
de SS
2
=
-
=

k
i
i
k n
1
1
;
1 1
3 3
/
/
gl SS
gl SS
F =
.

22.12.7 RISCO RELATIVO (w): para k tabelas 2 x 2

-
-
=
=
.
.
/
0
1
1
2
3 +
.
.
/
0
1
1
2
3 +
=
k
i
i
i
i i
k
i
i
i
i i
MH
b
n
c a
a
n
d b
R R
1
1
;
i i i i i
d c b a n + + + =

22.12.8 VRIAS CORRELAES (rw combinado)
n
i
= tamanho da amostra i;
r
i
= coeficiente de correlao linear da amostra i;
( ) ( ) [ ]
i i i
r r z + = 1 ln 1 ln
2
1
;

- 253 -
( )
( )
( )
-
-
!
"
#
$
%
&
-
=
=
=
=
k
i
k
i
i
k
i
i i
i i
n
z n
z n X
1
1
2
1 2 2
3
3
3
; gl = k 1.

22.12.9 VRIAS PROPORES (pw combinado)
n
i
= tamanho de cada amostra i; x
i
= nmero de eventos de cada amostra i;
p q
n
x
p
k
i
i
k
i
i
1 ;
1
1
=
-
-
=
=
=
;
( )
( )
- =
=
=
k
i
i
i i
k gl
p p n
p n x
1
2
2
1 ;
1
;
[ ] ) 1 /( ) 1 ( ) 1 /( 5 . 0 + + + + = n X arcsen n X arcsen
i
p ;

5 . 0
35 . 410
5 . 0
35 . 410

+
+
+
=
j
n
i
n
Padro Desvio
.

22.13 NORMALIDADE

22.13.1 DAGOSTINO

( )
( )
-
-
=
=
+
=
n
i
i
n
i
x x n
i x n i
D
1
2 3
1
) ( 2 / 1
;
Valores crticos: tabelados.

22.13.2 DAGOSTINO-PEARSON
K
2
=
2
2
2
1 g
Z
g
Z +
gl = 2

22.13.3 KOLMOGOROV-SMIRNOV
= mdia da populao; = desvio padro paramtrico;
0
;

- 254 -

N
D
36 . 1
, para = 0.05;
N
D
63 . 1
, para = 0.01.

22.13.4 LILLIEFORS
Mdia e desvio padro amostrais;
0
;

N
D
886 . 0
, para = 0.05;

N
D
031 . 1
, para = 0.01.

22.13.5 SHAPIRO-WILK
V = cov (x
i
, x
j
); m = (m
1
+ m
2
, ..., m
n
)
n
i
y
y
-
= ;
m
y
V m
V m
1 ,
1 ,

= ;
R
2
= m V
1
m; C
2
= m V
1
V
1
m;
S
2
= ( ) -
n
y y
1
2
; C R b /
2
=
2 2
2
S C
b
W =

22.14 QUI-QUADRADO

22.14.1 AMOSTRAS INDEPENDENTES
r = nmero de linhas;

( )
- -

=
= =
r
i
k
j
ij
ij ij
E
E O
1 1
2
2
;

( )
- -

=
= =
r
i
k
j
ij
ij ij
Yates
E
E O
1 1
2
2
5 . 0
;
gl = (r 1)(k 1);
Correo de Yates: somente quando gl = 1.

- 255 -

22.14.2 PARTIO R x C
Parties:
R = linha; C = coluna;

Exemplo:
Tabela 3 x 4 = 3R x 4C
N
11
n
12
n
13
n
14

N
21
n
22
n
23
n
24

N
31
n
32
n
33
n
34

Modelo para a partio:
A B
C D

1a. partio 2R:2C
A = n
11
; B = n
12
;
C = n
21
; D = n
22
.

2a. partio 3R:2C
A = n
11
+ n
21
; B = n
12
+ n
22
;
C = n
31
; D = n
32
.

3a. partio 2R:3C
A = n
11
+ n
12
; B = n
13
;
C = n
21
+ n
22
; D = n
23
.

4a. partio 3R:3C
A = n
11
+ n
12
+ n
21
+ n
22
; B = n
13
+ n
23
;
C = n
31
+ n
32
; D = n
33
.

5a. partio 2R:4C
A = n
11
+ n
12
+ n
13
; B = n
14
;
C = n
21
+ n
22
+ n
23
; D = n
24
.

6a. partio 3R:4C
A = n
11
+ n
12
+ n
13
+ n
21
+ n
22
+ n
23
; B = n
14
+ n
24
;
C = n
31
+ n
32
+ n
33
; D = n
34
.
gl (para cada partio) = 1.

- 256 -

22.14.3 TENDNCIA: TABELAS DE CONTINGNCIA 2 x k

k = nmero de grupos (colunas); x
i
= sucessos no grupo i;
n
i
= nmero de unidades no grupo i;
x = nmero total de sucessos em
todos os grupos;
i
p = x
i
/n
i
= proporo de sucessos no
grupo i;
n = nmero total de unidades;
n x p / = = proporo geral de
sucessos;
p q = 1 = proporo geral de
insucessos;
S
i
= escore da varivel do grupo i;

S x S x A
k
i
i i
.
/
0
1
2
3
- =
=1
;
!
!
"
#
$
$
%
&
.
/
0
1
2
3
- .
/
0
1
2
3
- =
= =
n S n S n q p B
k
i
i i
k
i
i i
2
1 1
2
;
Quando A > 0, tendncia crescente;
Quando A < 0, tendncia decrescente;
B A X
2 2
1
= ; gl = 1; Deve ser usado somente quando 5 q p n .

22.15 REGRESSO

22.15.1 AJUSTAMENTO DE CURVAS
Equaes:
Y
= a + bX : Linear;
Y
= ae
bX
(a > 0) : Exponencial;
Y
= a + b ln(X) : Logartmica;
Y
= aX
b
(a > 0) : Geomtrica;
Coeficientes:
( ) ( ) ( )
( ) - -
- - -
=
n X X
n Y X XY
b
/
/
2 2
;
X b Y a = ;
( )
( ) - -
- - - +
=
n Y Y
n Y XY b Y a
R
/
/
2 2
2
2
;
Variveis:
Linear:
X
i
= X
i
; Y
i
= Y
i
; a = a.
Exponencial:
X
i
= X
i
; Y
i
= ln(Y
i
); a = ln(a).

- 257 -
Logartmica:
X
i
= ln(X
i
); Y
i
= Y
i
; a = a.
Geomtrica:
X
i
= ln(X
i
); Y
i
= ln(Y
i
); a = ln(a).

Mdias:
Linear: = X X/n; = Y Y/n;
Exponencial: = X X/n; Gm(Y) = antiln [ln(Y)/n];
Logartmica: Gm(X) = antiln [ln(X)/n]; = Y Y/n;
Geomtrica: Gm(X) = antiln [ln(X)/n]; Gm(Y) = antiln [ln(Y)/n].

22.15.2 REGRESSO LINEAR
n
X
X
i
-
=
;
n
Y
Y
i
-
=
;
( )( )
( ) - -
- - -
=
n X X
n Y X XY
b
Y
/
/
2 2
;
X b Y a
Y
= ; Y
= a + b
Y
X ;
x
2
= X
2
(X)
2
/n; y
2
= Y
2
(Y)
2
/n;
xy = XY (X)(Y)/n;
- -
-
=
2 2
y x
xy
r
; r
2
= (r)
2
;
2
1
2
r
n r
t
=
; gl = n 2.

22.15.3 REGRESSO MLTIPLA

Modelo de Regresso Mltipla:
- + + =
=
k
j
j j
x y
1

, sendo k o nmero de variveis independentes.
Os parmetros ,
1
,
2
, ,
k
so estimadas pelos coeficientes a, b
1
, b
2
, , b
k
,
pelo mtodo dos mnimos quadrados. Matrizes:

- 258 -
!
!
!
!
"
#
$
$
$
$
%
&
=
nm
m
m
n n
X
X
X
X X
X X
X X
2
1
2 1
22 21
12 11

1
1
1
X
;
!
!
!
!
"
#
$
$
$
$
%
&
=
n
n
Y
Y
Y
2
1
1
Y
;
!
!
!
!
!
"
#
$
$
$
$
$
%
&
=
1
1
0
1
b
p
p
b
b
b
;
!
!
!
!
!
!
"
#
$
$
$
$
$
$
%
&
- - - -
- - - -
- - - -
- - -
=
2
2 1
2
2
2 1 2 2
1 2 1
2
1 1
2 1
X X
m m m m
m
m
m
x x x x x x
x x x x x x
x x x x x x
x x x n
;

( ) ( ) Y X' X X'
b
1
1
1
=
p p p
p
;
1 1 2 2 1 1
=
p p
X b X b X b Y a ;
- + =
=
k
j
ij j i
x b a y
1
;
Teste F:
H
0
: b
1
= b
2
= b
3
= = b
p-1
= 0; H
1
: b
i
0;
( ) - =
=
n
i
i total
y y SQ
1
2
;
( ) - =
=
n
i
i erro
y y SQ
1
2
;
erro total regresso
SQ SQ SQ = ;
k gl
regresso
= ; ) 1 ( = k n gl
erro
;
regresso
regresso
regresso
gl
SQ
QM =
;
erro
erro
erro
gl
SQ
QM =
;
erro
regresso
regresso
QM
QM
F =
; F(gl) = k, n k 1.

22.15.4 REGRESSO LOGSTICA
( ) ( ) [ ] p p p = 1 / ln logit ;
( ) = p logit
0
+
1
x
1
+
2
x
2
+ ... +
k
x
k

) ...
1 1
(
1
1
k
x
k
x
e
p
+ + +
+
= ;

logit (p
A
) = +
1
x
1
+ ... +
j-1
x
j-1
+ j(1) +
j+1
x
j+1
+ ... +
k
x
k

logit (p
B
) = +
1
x
1
+ ... +
j-1
x
j-1
+ j(0) +
j+1
x
j+1
+ ... +
k
x
k

- 259 -

( )
( )
!
"
#
$
%
&
=
B B
A A
j
p p
p p
1 /
1 /
ln ;
= OR
j
e
;
) (
j
SE
j
z
=
p-valor = 2 [1 - (z)], quando z 0;
p-valor = 2 (z), quando z < 0.

22.15.5 POLINOMIAL
Y
= b
0
+ b
1
X + b
2
X
2
+ ... +
p
p
b X , sendo p o nmero de termos da regresso.

Anlise de varincia:
Modelos de Regresso
i) Linear:
Y
= a + b
1
X;
Estatstica
( ) ( ) 2 / 1
2
1
2
1

=
N R
R
F
GL regresso = 1
GL erro = N - 2

ii) Quadrtica:
Y
= a + b
1
X + b
2
X
2
;
Estatstica
( ) ( ) 3 / 1
2 /
2
2
2
2

=
N R
R
F ;
GL regresso = 2
GL erro = N 3

iii) Cbica:
Y
= a + b
1
X + b
2
X
2
+ b
3
X
3
;

Estatstica
( ) 4 /
2
3
1
3 /
2
3
.
/
0
1
2
3

=
N R
R
F ;
GL regresso = 3
GL erro = N 4

iv) Qurtica:
Y
= a + b
1
X + b
2
X
2
+ b
3
X
3
+ b
4
X
4
;

- 260 -
Estatstica
( ) 5 /
2
4
1
4 /
2
4
.
/
0
1
2
3

=
N R
R
F ;
GL regresso = 4
GL erro = N - 5

22.16 TAMANHO DAS AMOSTRAS

22.16.1 TESTE t : UMA AMOSTRA
a) Teste unilateral:

( )
( )
2
1 0
2
1 1
2

+
=

z z
n
;

b) Teste bilateral:

( )
( )
2
1 0
2
1 2 / 1
2

+
=

z z
n
.

22.16.2 TESTE t : DUAS AMOSTRAS PAREADAS

( )
( )
2
2
1 1
2
D
z z s
n
d
+
=
;

b) Teste bilateral:

( )
( )
2
2
1 2 / 1
2
D
z z s
n
d
+
=
.

22.16.3 TESTE t : DUAS AMOSTRAS INDEPENDENTES

( )( )
( )
2
1 2
2
1 1
2
2
2
1

+ +
=

z z
n
, para cada amostra;

b) Teste bilateral:

( )( )
( )
2
1 2
2
1 2 / 1
2
2
2
1

+ +
=

z z
n
, para cada amostra.

- 261 -

22.16.4 TESTE DE McNEMAR
( )
( )
D A
A A
p p
q p z z
n
2
2
1 2 / 1
5 . 0 4
2
+
=

= nmero de pares;
2n = nmero de indivduos;
p
A
= pares discordantes tipo A;
p
D
= total de todos os pares discordantes.

22.16.5 PROPORO BINOMIAL: UMA AMOSTRA

( )
2
1
2
1 1
1 1
o
o o
o o
p p
q p
q p
z z q p
n
.
.
/
0
1
1
2
3
+
=

;

b) Teste bilateral:

( )
2
1
2
1 1
1 2 / 1
o
o o
o o
p p
q p
q p
z z q p
n
.
.
/
0
1
1
2
3
+
=

.

22.16.6 PROPORO BINOMIAL: DUAS AMOSTRAS

( )
2
1 2
2
1
2 2
1 1 1 1
1
1 p p z
k
q p
q p z
k
q p n
!
!
"
#
$
$
%
&
+ +
.
/
0
1
2
3
+ =

;

b) Teste bilateral:

( )
2
1 2
2
1
2 2
1 1 2 / 1 1
1
1 p p z
k
q p
q p z
k
q p n
!
!
"
#
$
$
%
&
+ +
.
/
0
1
2
3
+ =

.
n
2
= n
1
k;
k = 0.5, 1, 2, etc. = vezes que a segunda amostra deve ser em relao primeira.

22.16.7 CORRELAO LINEAR
z
r
=
.
/
0
1
2
3
r
r
1
1
ln 5 . 0
;

- 262 -

4
2
1 2 / 1
+
!
"
#
$
%
& +
=

r
z
z z
n

.

22.17 TRANSFORMAO DE DADOS

22.17.1 BOX-COX
Y = (Y
- 1)/ (para 0);

Y = lnY (para = 0);
= 1 ! transformao linear;
= ! transformao em raiz quadrada;
= 0 ! transformao logartmica;
= -1 ! transformao recproca;

um valor maximizado por procedimento iterativo pela equao:

( )
-
+ = Y
n
v
s
v
L
T
ln 1 ln
2
2
;
v = graus de liberdade;

2
T
s = varincia do valor de Y transformado;
n = tamanho da amostra.

22.18 NOVOS APLICATIVOS

22.18.1 COX: MODELO DE RISCO PROPORCIONAL
( )
( )
k
X
k
b ... X b X b a
e t S
+ + + +
=
2 2 1 1

e = base dos logaritmos naturais (2.71828);
a = constante; b
k
= coeficiente de regresso;
X
k
= varivel;
( ) ( ) t S ln t h =

( )
( )
( )
k
X
k
b ... X b X b
e
t h
t h
+ + +
=
!
"
#
$
%
&
2 2 1 1
0

( )
( )
( )
k k
X b ... X b X b
t h
t h
ln + + + =
!
"
#
$
%
&
2 2 1 1
0

22.18.2 ANLISE DE CONGLOMERADOS
a) Distncias: ver 22.2.2, 22.2.3 e 22.2.4

- 263 -
b) Distncia Chebischev:
jv iv ij
X X max d = ;
c) Ligao simples:
( )
( )
VW , UW W UV
d min d = ;
d) Mdia do Grupo:
( )
--
=
i k
ik
W UV
d
d ;
e) Ward (Varincia Mnima): ( ) ( ) - =
=
N
j
j
'
j
x x x x ESS
1
;
f) Gower (Mediana):
-
-
=
=
=
p
v
ijv
p
v
ijv
ij
W
S
S
1
1
;
g) Centride:
( ) jk ik k j , i
; d min d = .

22.18.3 ANLISE DISCRIMINANTE
A combinao linear (Fisher) [ ] x S ' x x x ' a y
pooled
1
2 1

= =
maximizada pela equao:
( )
a S ' a
d ' a
max
pooled
2
=

( ) ( )
2
2 1
2
1
2
2 2
1
1
2
1 1
2
+
- + - +
=
= =
n n
y y y y
s
n
j
j
n
j
j
y
, sendo

j j
x ' a y
1 1
= e
j j
x ' a y
2 2
=

22.18.4 CORRELAO CANNICA

p rp r r r
X a ... X a X a U + + + =
2 2 1 1

p rp r r r
Y b ... Y b Y b V + + + =
2 2 1 1

( )
- -
-
=
b ' b a ' a
b ' a
V , U Corr
22 11
12

( ) { } ( ) - + =
+ =
r
j i
i e j
log pq . n
1
2
1 1 5 0

- 264 -
Graus de liberdade = ( )( ) 1 1 q p

X
1
X
2
... X
p
Y
1
Y
2
... Y
p

X
1

X
2

.
.
.
X
p

p x p matriz
A

p x q matriz
C

Y
1

Y
2

.
.
.
Y
p

q x p matriz
C

q x q matriz
B

22.18.5 CORRELAO INTRACLASSE
Coeficiente:

Estimao de ponto:

Interpretao de acordo com J. L. Fleiss (1986):
I
< 0.04 indica pouca reprodutibilidade;
0,04
I
< 0.75 indica boa reprodutibilidade;
I
0.75 indica excelente reprodutibilidade.

- 265 -
CAPTULO 23
ESCOLHA DO TESTE ESTATSTICO SUGESTES

23.1 INTRODUO
A escolha do teste adequado aos dados obtidos em uma investigao um passo que
deve ser decidido no planejamento de uma pesquisa. A experincia acumulada em
trabalhos anteriores, a indicao do orientador, quando o caso, e o conhecimento
pleno da Estatstica propiciam elementos capazes de se efetuar a escolha do teste mais
ajustado ao estudo em questo.

As sugestes oferecidas pelo BioEstat no esgotam todas as possibilidades na escolha
de um teste estatstico, destinando-se, sobretudo, aos iniciantes em investigaes
cientficas, mas deve ser precedida do planejamento da pesquisa, com formulao da
hiptese a ser testada, da cuidadosa definio do universo de onde a(s) amostra(s)
ser(o) coletada(s), do estabelecimento do nvel de significncia do teste (erro ), do
levantamento ou do experimento a ser efetuado, ou seja, de todas as etapas que
possibilitem, ao final, comprovar ou refutar a hiptese formulada, prevendo-se, nessa
fase, o teste estatstico que atenda ao objetivo do trabalho proposto.

Os fluxogramas apresentados em seguimento so auto-explicativos, obedecendo os
seguintes passos:
a) Nmero de amostras:
Uma amostra;
Duas amostras independentes;
Duas amostras relacionadas;
k amostras independentes;
k amostras relacionadas.
b) Nmero de variveis:
Uma varivel;
Duas variveis;
k variveis.
c) Tipo de dados:
Dados categricos;
Dados ordenativos;
Dados numricos.

Os dados categricos e ordenativos so aqueles mensurados em escala nominal e
ordinal, respectivamente, e esto geralmente relacionados a testes de distribuio
livre, abrangendo os chamados testes no-paramtricos ou estatsticas firmes, de largo
emprego nas reas de biologia e de medicina. Os dados numricos, mensurados em
escala intervalar ou de razes, dizem respeito a modelos de distribuio bem definidos
e, na sua maioria, referentes distribuio normal.

- 266 -
CAPTULO 23 ESCOLHA DO TESTE ESTATSTICO
23.2 NMERO DE AMOSTRAS

23.3 UMA AMOSTRA: UMA VARIVEL

- 267 -
23.4 UMA AMOSTRA: DUAS VARIVEIS

23.5 UMA AMOSTRA: k VARIVEIS

- 268 -
23.6 DUAS AMOSTRAS INDEPENDENTES: UMA VARIVEL (dados categricos)

23.7 DUAS AMOSTRAS INDEPENDENTES: UMA VARIVEL (dados ordenativos)

- 269 -
23.8 DUAS AMOSTRAS INDEPENDENTES: UMA VARIVEL e k VARIVEIS (dados
numricos)

23.9 DUAS AMOSTRAS RELACIONADAS: UMA VARIVEL

- 270 -
23.10 k AMOSTRAS INDEPENDENTES: UMA VARIVEL (dados categricos,
ordenativos e numricos)

23.11 k AMOSTRAS INDEPENDENTES: k VARIVEIS

- 271 -
23.12 k AMOSTRAS RELACIONADAS

23.13 DISTRIBUIO DE PROBABILIDADES

- 272 -
23.14 ESTIMAO DE PARMETROS

- 273 -
CAPTULO 24
APLICATIVOS INTRODUZIDOS NO BIOESTAT 4.0

24.1 INTRODUO
Este captulo contm os novos testes que foram inseridos na verso 4.0 do BioEstat e
est dividido nas seguintes partes:
a) Anlise Multivariada
- Anlise de Conglomerados
- Anlise Discriminante
- Correlao Cannica
b) Anlise de Sobrevivncia
- Cox: Modelo de Risco Proporcional
c) Distribuio de Probabilidades
- Ponto de Corte
d) Reamostragem: Bootstrap
e) Testes de Hiptese
1) Uma Amostra
- Teste t, Resumo Amostral
- Teste z, Resumo Amostral
2) Duas Amostras Independentes
- Teste z, Resumo Amostral
3) Duas Amostras Relacionadas
- Correlao Intraclasse
f) Grficos
- Diagrama IC (95% e 99%)
- Diagrama Pontual (Dot plot)
- Pirmide Populacional
g) Aumento do Tamanho Amostral

24.2 ANLISE DE CONGLOMERADOS
O objetivo desta anlise agrupar os indivduos em conglomerados ou clusters. Os
conglomerados so identificados como grupos que compem a populao ou a
amostra que est sendo analisada. As unidades de um grupo apresentam muitas
semelhanas entre si e muitas diferenas em relao s unidades dos demais grupos.
, pois, uma verdadeira classificao ou taxonomia, muito usada por bilogos. Dessa
forma um mtodo exploratrio, no um teste estatstico, contendo uma srie de
algoritmos para classificao dos objetos segundo o grau de similaridade, na tentativa
de estabelecer uma estrutura, mesmo sendo inexistente. A anlise pode ser realizada
segundo alguns critrios de procedimentos, os quais so selecionados conforme es
caractersticas das variveis a serem analisadas, sendo apresentados a seguir:

- 274 -
CAPTULO 24 NOVOS APLICATIVOS
Mtodo de Agregao
A medida da distncia a base da anlise de conglomerados. Originalmente, cada
objeto nico e, portanto, as distncias entre os objetos so bvias. Entretanto,
medida que os objetos so agrupados, deve-se decidir qual a forma de medir a
distncia entre um grupo (cluster) e um objeto, ou entre dois grupos. Cada mtodo de
agregao fornece um critrio diferente para definir, no espao multidimensional, o
ponto dentro do grupo que servir de referncia para calcular as distncias entre esse
grupo e outros objetos ou grupos.

Tipo de Distncia
A distncia na anlise de conglomerados um parmetro para medir o grau de
similaridade entre dois objetos. Cada varivel corresponde a uma dimenso, e cada
objeto representado por um ponto no espao multidimensional resultante. Quanto
menor a distncia mais similar sero os objetos e, portanto, aumenta a probabilidade
de pertencerem ao mesmo grupo. As frmulas que caracterizam os tipos de distncias
que podem ser aplicadas anlise de conglomerados podem ser obtidas no Captulo
22 e podem ser escolhidas durante o procedimento deste aplicativo.

Estandardizao das variveis
Os resultados da anlise de conglomerados podero ter algum vis, se os dados so
medidos em escalas diferentes. Dessa forma, por exemplo, se uma das variveis for a
altura do indivduo medida em metros e a outra for a massa corporal medida em
quilograma, aqueles tero um peso menor quando se compara a mesma informao
medida em centmetros. A maneira, tornar as variveis comparveis ser realizar a
transformao z, em outras palavras, estandardizar todas essas variveis.

24.2.1 EXEMPLO
Procurou-se verificar similitudes entre a forma escrita de diversos idiomas. As
comparaes tm como base as duas primeiras letras da grafia dos nmeros de 1 a 10
em cada idioma. Para cada letra do alfabeto foi atribudo um valor numrico. Para a
letra A (primeira letra do alfabeto) foi atribudo o valor 1, para a letra B (segunda letra
do alfabeto) foi atribudo 2 e assim sucessivamente at a letra Z que corresponde ao
nmero 26 por ser a vigsima sexta letra (foi includa a letra w).

Observe a Figura 24.1, na primeira linha da primeira coluna est localizado o grupo
que representa o idioma Portugus. Na Figura 24.2, as duas primeiras letras de cada
nmero e de cada idioma foram substitudas pelos respectivos valores numricos das
letras. Em Portugus o nmero um recebeu o escore 2113, pois a letra inicial da
palavra um (u) em a vigsima primeira (21
a
) letra do alfabeto e a segunda letra (m)
a dcima terceira (13
a
), e assim por diante.

- 275 -

Deseja-se efetuar a Anlise de Conglomerados para que sejam identificados e
agrupados os idiomas conforme as similitudes e as diferenas existentes entre eles.

24.2.2 INSTRUES
a) Clicar no menu Anlise Multivariada e na opo Anlise de Conglomerados;
c) Clicar em Executar o Teste, para obter a Figura 24.3:

d) Selecione as opes:
- Ligao Completa, como Mtodo de Agregao;
- Euclidiana, como Tipo de Distncia;
- Com Estandardizao das Variveis;
Figura 24.2
Valores que
representam
as duas
primeiras
letras de
cada idioma.
Exemplo
24.2.1
Figura 24.3
Critrios
usados na
anlise.
Figura 24.1
Nmeros
escritos por
extenso.
Exemplo
24.2.1

- 276 -
e) Clicar em Executar, para obter o Dendograma da Figura 24.4.

O dendograma (Figura 24.4) demonstra:
a) Similitude entre o idioma Portugus (01) e o Espanhol (08) e proximidade com o
Francs (07);
b) Similitude entre o Holands (05) e o Alemo (06) e proximidade com o Ingls
(02);
c) Similitude entre o Noruegus (03) e o Dinamarqus (04);
d) O idioma Hngaro (09) est separado dos demais.

24.3 ANLISE DISCRIMINANTE
uma tcnica de Anlise Multivariada que determina a separao de grupos de
indivduos de acordo com os valores de suas variveis. Na Anlise Discriminante
pode-se obter:
a) A determinao das funes discriminantes de Fisher (Y1 e Y2) capazes de
separar ou discriminar os grupos de indivduos. Y1 e Y2 so duas variveis
adimensionais, criadas de modo a permitir melhor separao entre os grupos que
esto sendo analisados.
b) O diagrama que identifica os grupos e permite a visualizao das separaes e
aproximaes grupais.
c) Atravs das funes discriminantes de Fisher, torna-se possvel a classificao de
novos indivduos, em um dos grupos determinados, sendo o clculo semelhante
ao utilizado na Regresso Linear Mltipla.
Destaque-se, por exemplo, que na rea mdica comum em psiquiatria a classificao
de pacientes dentre categorias grupais, tais como: psicose afetiva, depresso,
Figura 24.4
Resultado
do Exemplo
24.2.1

- 277 -
esquizofrenia, bipolar e outras, com apoio no exame clnico e nos sintomas
observados durante o exame inicial de rotina. Dados laboratoriais posteriores, o
seguimento dos enfermos (follow-up) e novas informaes familiares podem resultar
na alocao em uma nova categoria ou grupo, diminuindo, tanto quanto possvel, o
nmero de classificaes equivocadas. A Anlise Discriminante constitui um
instrumento importante nesse modelo de abordagem.

Foram coletadas amostras de trs espcies de ris, medindo-se o comprimento e a
largura das spalas e respectivas ptalas. Os Grupos e as respectivas Variveis foram
introduzidas no grid do BioEstat na seguinte ordem:
a) Grupo 1: Variveis da ris sp.1, contm 20 unidades;
b) Grupo 2: Variveis da ris sp.2, contm 20 unidades;
c) Grupo 3: Variveis da ris sp.3, contm 20 unidades.
Cada unidade de cada grupo est representada com os seguintes dados:
X1 = comprimento das spalas;
X2 = largura das spalas;
X3 = comprimento das ptalas;
X4 = largura das ptalas.

24.3.2 INSTRUES
a) Clicar no menu Anlise de Multivariada e selecionar em Anlise Discriminante;
c) Clicar em Executar o Teste, para obter a Figura 24.6;
d) Pressionar em OK, nessa Figura, surgindo as funes discriminantes de Fisher
(Y1 e Y2), com os respectivos estimadores das variveis X1, X2, X3 e X4.

e) Pressionar o boto Grfico, na parte superior da Figura 24.6, para obter o
diagrama representado pela Figura 24.7.
Figura 24.5
Viso parcial
dos dados
do Exemplo
24.3.1
Figura 24.6
As funes
discriminantes
de Fisher.
Exemplo
24.3.1

- 278 -

Observe os agrupamentos: o Grupo 2 est ao centro, entre os Grupos 1 e 3.
Quando desejamos classificar uma nova unidade, devemos preencher o valor de cada
uma de suas variveis e pressionar em Classificar. Por exemplo, foram introduzidos
os valores X1 = 4.7, X2 = 3.5, X3 = 1.3 e X4 = 0.22, (Figura 24.8), pressionando-se o
boto Classificar, resulta em uma unidade do Grupo 3 (ris sp.3).

Para obter um novo diagrama, pressione o boto Grfico (Figura 24.8), sendo gerado
novo diagrama com destaque para a nova unidade (Figura 24.9).
Figura 24.7
Diagrama
da funo
discriminante.
Exemplo
24.3.1
Figura 24.8
Entrada de
dados das
variveis
para obter a
classificao
de um novo
indivduo.
Exemplo
24.3.1

- 279 -

Percebe-se que a nova unidade (Objeto Classificado) est localizada entre as unidades
do Grupo 3, ris sp.3.


24.4 CORRELAO CANNICA
Trata-se de um modelo de Anlise Multivariada, que permite investigar o
relacionamento entre duas sries de variveis: um grupo de variveis X e outro de
variveis Y, a associao entre os grupos de variveis tem como resultante a
correlao (R
c
) denominada Cannica.
Assim, na rea mdica, um pesquisador poder relacionar um grupo de sintomas com
um conjunto de fatores de risco em relao a determinada doena.

OBJETIVOS
a) Determinar a magnitude da relao entre dois conjuntos de variveis;
b) Deduzir os pesos de cada grupo de variveis de forma que a correlao de cada
composio linear seja maximizada;
c) Avaliar a contribuio relativa de cada varivel na correlao cannica, no
sentido de explicar a natureza do relacionamento;
d) Para propsitos descritivos e inferenciais, devendo, neste caso, as variveis
apresentar distribuio normal.

Figura 24.9
A seta
aponta
o novo
indivduo.
Exemplo
24.3.1

- 280 -
LIMITAES
a) A Correlao Cannica reflete a variao explicada pela composio linear das
variveis;
b) Os valores cannicos derivados constituem amostra-dependente;
c) As variveis cannicas derivadas maximizam a Correlao e no a varincia
extrada;
d) As interpretaes estatsticas ainda no esto bem desenvolvidas.

24.4.1 EXEMPLO
Suponha que em um estudo epidemiolgico envolvendo enfermeiros que atuam em
unidades de sade de urgncia e emergncia, tem como objetivo determinar o nvel de
correspondncia entre um conjunto de caractersticas das atividades desenvolvidas e a
satisfao do profissional de sade pblica. As respostas a um questionrio foram
interpretadas e os dados introduzidos no grid geral conforme a Figura 24.10.

H trs variveis referentes a caractersticas da atividade:
a) Variao: Nvel de variao envolvida nas tarefas, medida em percentual;
b) Feedback: a resposta, em percentual, da satisfao das pessoas usurias do
servio de sade onde foi efetuada a pesquisa;
c) Autonomia: Percentual de liberdade admitido na realizao das tarefas.

As variveis associadas satisfao do profissional tambm so trs:
a) Satisfao: Nesta varivel cada funcionrio aponta o seu percentual de
satisfao com as perspectivas que a carreira lhe oferece;
b) Superviso: Satisfao do empregado com a chefia imediata, o estilo gerencial
do supervisor e o padro de comunicao praticado no ambiente de trabalho,
medida em percentual;
c) Salrio: Nvel de satisfao do funcionrio com salrio e outros benefcios,
usando uma escala ordinal que varia de 1 a 10, sendo 1 = insatisfeito e valor
10 = excelente.

Figura 24.10
Dados do
Exemplo
24.4.1

- 281 -
24.4.2 INSTRUES
a) Clicar no menu Anlise Multivariada e na opo Correlao Cannica;
b) Selecionar todas as colunas referentes s variveis do grid geral;
c) Clicar em Executar o Teste, para o procedimento seguinte mostrado na Figura
24.11;
d) Indique a quantidade de variveis do Grupo X
i
;
e) Indique a quantidade de variveis do Grupo Y
i
;
f) Pressionar em Executar, para obter os resultados.

A figura acima define que as variveis sero analisadas em dois grupos, onde o
primeiro grupo formado por trs colunas, o segundo grupo de variveis tambm
formado por trs colunas. Esta especificao obedece a ordem na qual as colunas
foram selecionadas na interface Seleo de Amostras para Correlao Cannica.

Figura 24.11
Definio dos
grupos de
variveis do
Exemplo
24.4.1
Figura 24.12
Resultados
da correlao
cannica.
Exemplo
24.4.1

- 282 -
A Figura 24.12 mostra as correlaes cannicas, os autovalores e as probabilidades.
A primeira correlao cannica (a correlao entre o primeiro par de variveis
cannicas) 0.9352. Este valor, tambm denominado R Cannico, representa a
melhor correlao possvel entre qualquer combinao linear das variveis de
satisfao do profissional (Grupo Y) com as variveis da caracterstica da atividade
desenvolvida (Grupo X).
A estatstica R Cannica expressa a magnitude do relacionamento entre os dois
conjuntos de variveis. Neste exemplo confirmada a associao entre os conjuntos
de variveis X
i
e Y
i
pelo Qui-Quadrado (
2
) igual a 26.7996, com gl = 9, e o
correspondente p-valor igual a 0.0015, que muito significativo.
Pode-se, ainda, determinar a matriz de Correlao entre as variveis do Grupo X
i
e as
variveis do Grupo Y
i
, bastando clicar na parte superior da Figura 24.12, cujos
resultados esto dispostos na Figura seguinte (Figura 24.13.a), onde se constata que as
correlaes X
1
vs. Y
j
, etc so significativas.

24.5 ANLISE DE SOBREVIVNCIA: COX (MODELO DE RISCO PROPORCIONAL)
uma tcnica de anlise estatstica que busca explicar o efeito que um grupo de
variveis exerce na sobrevivncia do paciente. Permite a anlise de vrios fatores de
risco simultaneamente. As variveis denominadas preditoras (explicatrias) podem
ser fatores de risco tais como: idade, sexo, peso, glicemia, durao da doena ou
variveis de controle que indicam o tipo de tratamento administrado ao paciente. O
modelo de risco proporcional introduzido por Cox conhecido na literatura como
Proporcional Hazard Regression Analysis.

INTERPRETAO DO COEFICIENTE b
Quando o Coeficiente de Regresso (b) de uma das variveis preditoras um nmero
positivo (b>0), ento entendemos que o risco (hazard) para os pacientes crescente
com a grandeza da varivel e, por via de conseqncia, o prognstico que a varivel
em questo diminui o tempo de sobrevivncia do paciente. Por outro lado, quando
uma especificada varivel caracterizada por um Coeficiente de Regresso Negativo
(b<0) devemos deduzir que a tal varivel melhora o prognstico de sobrevivncia do
paciente.
Num exemplo hipottico o risco estimado com determinada dose de uma droga
teraputica de b = !0.41, a respectiva Taxa de Risco calculada por exp(!0.41)
igual a 0.66 (66%), ou seja, a droga decresce em 34% o risco de rejeio, bito, etc.
Figura 24.13.a
Correlaes.
do Exemplo
24.4.1

- 283 -
Em outro exemplo uma varivel preditora, como a Idade do paciente, o Coeficiente de
Regresso (b), positivo, igual a 0.70. A Taxa de Risco dessa varivel de exp(0.70)
= 2.01, isto , pessoas idosas tm o risco aumentado em duas vezes (2.01).

TAXA DE RISCO (HAZARD RATE)
definida como a probabilidade, por unidade de tempo, que um paciente tenha
sobrevivido ao incio do respectivo intervalo e que falhar nesse intervalo.
Especificamente computado como o nmero de falhas por unidade de tempo no
respectivo intervalo, dividido pelo nmero mdio de casos de sobrevivncia no ponto
mdio do intervalo.

Em um grupo de 48 pacientes portadores de mieloma mltiplo, por randomizao, 24
indivduos receberam tratamento com 75mg de riluzole (Droga), e os demais
receberam placebo. Ao mesmo tempo, foram registrados, para cada paciente, os
valores referentes s seguintes variveis: Idade, Sexo, Uria sangunea, Clcio srico,
Hemoglobina e Protena de Bence-Jones. A Durao do tratamento (Tempo) e a
ocorrncia de remisso foram registradas como ocorre nas anlises de sobrevivncia.
O objetivo deste experimento , alm de testar o efeito da droga, verificar a influncia
dos demais fatores (variveis preditoras) na remisso da doena.

24.5.2 INSTRUES
a) No menu Estatsticas clique em Anlise de Sobrevivncia;
b) Selecione a opo Cox: Modelo de Risco Proporcional;
c) Na janela Seleo de Amostras, escolha inicialmente as variveis preditoras:
Droga, Idade, Sexo, Uria, Clcio srico, Hemoglobina, Protena de Bence-Jones.
d) Ainda na mesma janela selecione as colunas: Tempo e Remisso. Estas devem,
obrigatoriamente, ser as duas ltimas colunas selecionadas.
e) A janela Seleo de Amostras ser configurada conforme a visualizao abaixo.
Figura 24.13
Viso parcial
do Exemplo
24.5.1

- 284 -

f) Finalmente, clique em Executar Estatstica para obter os resultados.

A parte superior da tela de resultados da anlise de Cox apresenta:
- O Qui-Quadrado igual a 32.5782 e o correspondente p-valor < 0.0001, o qual
indica uma forte evidncia do efeito do conjunto de variveis preditoras sobre
a varivel Remisso, sobretudo os nveis de Clcio srico (p = 0.0046) e a
Hemoglobina (p = 0.0025).
- A varivel preditora Droga (riluzole) obteve o coeficiente b = !1.8432 (p =
0.0002), cuja Taxa de Risco correspondente igual a 0.1583 (15.83%), dando
uma proteo de 84.17%.
Figura 24.14
Seleo de
variveis
do Exemplo
24.5.1
Figura 24.15
Parte
superior do
grid de
resultados
do Exemplo
24.5.1

- 285 -

Na parte superior da figura 24.15 est localizada a opo que permite visualizar a
Curva de Sobrevivncia.

24.6 PONTO DE CORTE
Determinar o melhor Ponto de Corte (Cut off point) para um teste diagnstico.

24.6.1 EXEMPLO
A Enzima Alfa-GST usada como marcador de leso heptica causada pela Hepatite
C. Foram testados 72 indivduos, sendo 40 doentes e 32 sadios.

24.6.2 INSTRUES
a) Introduzir os dados no grid (ver Figura 24.18), em duas colunas as quais
representam, neste caso, os grupos Doentes e Sadios, podendo as amostras ter
tamanhos diferentes;
b) Selecionar no menu principal do BioEstat: Distribuio de Probabilidades,
Probabilidade Condicional e clicar em Ponto de Corte, nessa ordem;
Figura 24.16
Viso parcial
dos resultados
do Exemplo
24.5.1
Figura 24.17
Grfico
do Exemplo
24.5.1

- 286 -
c) O BioEstat solicitar que o usurio responda seguinte pergunta: O grupo
DOENTES apresenta os valores mais elevados?. Neste caso a resposta
afirmativa, portanto clicar no boto Sim para visualizar a Figura 24.19 que
contm a Curva ROC e as especificaes: Ponto de Corte (4.000) e sua
respectiva Distncia (d), Sensibilidade, Especificidade e a Prevalncia.

Ser instantaneamente exibido o diagrama abaixo.

Para obter os Valores Preditivos pressione na parte superior da figura 24.19.

Figura 24.19
Curva ROC,
Ponto de
Corte,
Sensibilidade,
Especificidade
e a menor
Distncia (d) ao
Padro Ouro,
Exemplo
24.6.1
Figura 24.18
Viso parcial
dos dados
do Exemplo
24.6.1
Figura 24.20
Valores
Preditivos,
Exemplo
24.6.1

- 287 -
24.7 REAMOSTRAGEM BOOTSTRAP
Trata-se de um procedimento de reamostragem a partir de uma pequena amostra
aleatria, de onde se retira um grande nmero de amostras do mesmo tamanho da
amostra inicial, sempre com reposio, tendo por objetivo a estimao da mdia e da
varincia da amostra original e das reamostragens. Os resultados alcanados das
medidas de tendncia central e de variao se aproximam dos valores paramtricos.

24.7.1 EXEMPLO
De uma populao de 5 mil pacientes, com faixa etria entre 20 e 40 anos, retirou-se
amostra de 9 indivduos. Determinou-se a mdia e o desvio padro e em seguida,
efetuou-se as reamostragens cujos resultados esto contidos na Figura 24.22.

24.7.2 INSTRUES
a) Pressionar o mouse em Teste t: Resumo Amostral;
b) Introduzir os dados no grid Resumo Amostral (Figura 24.21);

A reamostragem apresentou Mdia Aritmtica = 31.8105 e Desvio Padro = 17.4633,
sendo estes valores considerados estimaes dos valores paramtricos.
Figura 24.21
Entrada de
dados do
Exemplo
24.7.1
Figura 24.22
Resultados
do Exemplo
24.7.1

- 288 -
24.8 TESTE t UMA AMOSTRA (RESUMO AMOSTRAL)

24.8.1 EXEMPLO
Dados coletados da temperatura (graus Centgrados) de 27 caranguejos:
a) Tamanho da amostra = 27;
b) Mdia da temperatura dos caranguejos = 24.9
0
C;
c) Varincia da amostra = 0.38;
d) Mdia da temperatura do Meio Ambiente (Populao) = 25.16
0
C.
H
0
:

=

0
;
H
1
:

0
;
Nvel de deciso: = 0.05.

24.8.2 INSTRUES
b) Introduzir os dados no grid Resumo Amostral (Figura 24.23);

A diferena estatisticamente significativa (p < 0.05). A temperatura dos animais foi
inferior observada no meio ambiente.

Figura 24.23
Entrada de
dados do
Exemplo
24.8.1
Figura 24.24
Resultados
do Exemplo
24.8.1

- 289 -
24.9 TESTE z UMA AMOSTRA (RESUMO AMOSTRAL)

24.9.1 EXEMPLO
Dados coletados da altura de uma espcie de planta submetida a detrminado
fertilizante, comparados com a mdia da populao obtida de plantas da mesma
espcie e coletadas no meio ambiente.
a) Tamanho da amostra = 53;
b) Mdia da altura das plantas com fertilizante = 54.4 cm;
c) Desvio Padro da populao = 8.2;
d) Mdia da Populao das plantas coletadas no meio ambiente = 51.9 cm.
Hipteses:
H
0
:

=

0
;
H
1
:

0
;

24.9.2 INSTRUES
g) Pressionar o mouse em Teste z: Resumo Amostral;
h) Introduzir os dados no grid de Resumo Amostral (Figura 24.25);
i) Clicar em Executar, para Resultados.

A diferena significativa (p < 0.05), tendo o fertilizante aumentado o tamanho das
plantas submetidas ao tratamento.
Figura 24.25
Entrada de
dados do
Exemplo
24.9.1
Figura 24.26
Resultados
do Exemplo
24.9.1

- 290 -
24.10 TESTE t DUAS AMOSTRAS INDEPENDENTES (RESUMO AMOSTRAL)

24.10.1 EXEMPLO
Duas amostras de plantas para verificao do crescimento, submetidas a diferentes
fertilizantes:
Amostra A: fertilizante XX;
Amostra B: fertilizante YY.
Dados amostrais: contidos no grid do Resumo Amostral.
H
0
:
1
=

0
;
H
1
:
1
0
;

24.10.2 INSTRUES
b) Introduzir os dados no grid de Resumo Amostral (Figura 24.27);

A diferena muito significativa (p < 0.01). O fertilizante YY foi superior ao XX em
termos de crescimento das plantas submetidas aos tratamentos.
Figura 24.27
Entrada de
dados do
Exemplo
24.10.1
Figura 24.28
Resultados
do Exemplo
24.10.1

- 291 -
24.11 TESTE z DUAS AMOSTRAS INDEPENDENTES (RESUMO AMOSTRAL)

24.11.1 EXEMPLO
Duas drogas: A (primeira amostra) e B (segunda amostra) foram testadas em dois
grupos de pacientes para alvio de dores nas panturrilhas depois de caminhada de
5000 metros. O tempo decorrido entre a ingesto da droga e o desaparecimento das
dores foi registrado em minutos. Os dados amostrais e as respectivas varincias das
populaes esto registradas no grid Resumo Amostral.
H
0
:
1
=

0
;
H
1
:
1
0
;
Nvel de deciso: = 0.05

24.11.2 INSTRUES
a) Pressionar o mouse em Teste z: Resumo Amostral;
b) Introduzir os dados no grid de Resumo Amostral (Figura 24.29);
c) Clicar em Executar, para obter os resultados (Figura 24.30).

O tempo decorrido entre a ingesto das drogas e o alvio do sintoma foi menor com o
emprego da droga A (p < 0.05).
Figura 24.29
Entrada de
dados do
Exemplo
24.11.1
Figura 24.30
Resultados
do
Exemplo
24.11.1

- 292 -
24.12 TESTE t - DUAS AMOSTRAS RELACIONADAS (RESUMO AMOSTRAL)

24.12.1 EXEMPLO
Um psiclogo acredita que a parte lateral do hipotlamo esteja envolvida no
comportamento do apetite. Dez (10) ratos foram submetidos a uma cirurgia de
implante de eletrodos: em cada animal foram implantados dois (2) eletrodos: um na
parte lateral do hipotlamo e o outro em um rea comprovadamente sem qualquer
efeito sobre o apetite. Cada rato foi submetido estimulao durante 30 minutos em
cada eletrodo, com perodo de repouso entre os estmulos. No perodo de estimulao
de cada rea foi determinada a quantidade de alimento ingerido por animal, com os
seguintes resultados:
a) Tamanho da amostra (n) =10;
b) Mdia aps estmulo do hipotlamo: 17.3g
c) Mdia aps estmulo da rea neutra: 11.89g
d) Mdia das diferenas: 5.41g;
e) Desvio padro das diferenas: 3.31g.
H
0
:
1
=

0
;
H
1
:
1
0
;

24.12.2 INSTRUES
a) Selecionar no menu:
- Duas Amostras Relacionadas;
- Teste t;
- Resumo Amostral.
b) Introduzir os dados no formulrio (Figura 24.31);
c) Clicar em Executar, para obter os resultados (Figura 24.32).

A estimulao eltrica do hipotlamo
afeta o comportamento alimentar dos
ratos (p < 0.01).

Figura 24.31
Dados
do Exemplo
24.12.1
Figura 24.32
Resultados
do Exemplo
24.12.1

- 293 -
24.13 CORRELAO INTRACLASSE (DADOS CONTNUOS)
A correlao Intraclasse um aplicativo para testar a replicabilidade amostral para
dados contnuos, no sendo tratadas as variveis como X e Y mas sim como
Replicao 1 e Replicao 2. , desse modo, medida de replicabilidade amostral.

24.13.1 EXEMPLO
Foram determinados os nveis de Testosterona Livre em 6 pacientes, tendo sido
retiradas amostras sanguneas de cada indivduo, sendo cada amostra dividida em dois
frascos distintos (A e B), os quais forma enviados, aleatoriamente, a dois laboratrios,
tornando-se impossvel distinguir para os tcnicos laboratoriais a Replicao 1 da
Replicao 2.

24.13.2 INSTRUES
a) Introduzir os dados no grid do BioEstat (Figura 24.33);
b) Clicar em Duas Amostras Relacionadas e, a seguir, em Replicabilidade;
c) Pressionar o mouse em Correlao Intraclasse;
d) Clicar em Executar, para Resultados;

Replicabilidade foi considerada Excelente, com valor da Correlao Intraclasse igual
a 0.9712 e o p-valor = 0.002. Nos 6 pacientes, os nveis de Testosterona Livre em
ambos os labo-ratrios podem ser considerados seme-lhantes.
Figura 24.33
Dados do
Exemplo
24.13.1
Figura 24.34
Dados do
Exemplo
24.13.1

- 294 -
24.14 DIAGRAMA IC (95% e 99%)
Este grfico aplicado quando em uma amostra h relao entre duas variveis: uma
categrica (nominal ou ordinal) e outra numrica (discreta ou contnua), sobretudo
quando a categrica , no mnimo, dicotmica (sexo masculino e feminino vs. idade,
doentes e no doentes vs. nveis de colesterol).
O diagrama descreve graficamente a estimao da mdia e o respectivo intervalo de
confiana (95% ou 99%) da varivel numrica de cada categoria. Permite, ainda,
comparar as mdias e intervalos de confiana das categorias com a mdia geral e seu
intervalo de confiana, o qual abrange todos os valores.
Trata-se de uma estimao de parmetros de cada categoria, com base na distribuio
Z (1.96 e 2.58) quando as amostras forem maiores que 30; e na distribuio t, se o
tamanho amostral for igual ou inferior a 30 unidades.
Para este diagrama, o BioEstat estabelece o limite de 10 categorias.

24.14.1 EXEMPLO 1
Foi efetuada avaliao da cardiotoxicidade do antimoniato de meglumina no
tratamento da leishmaniose tegumentar americana. Um grupo de 15 pacientes,
escolhidos de maneira aleatria, recebeu a dose de 15 mg/kg/dia dessa droga durante
um perodo de 20 dias. Foram efetuados eletrocardiogramas convencionais de cada
paciente, antes e logo aps o tratamento, determinando-se o intervalo PR de cada
traado. Critrios idnticos foram efetuados com outros 15 pacientes mudando-se
apenas a dose do medicamento para 20 mg/kg/dia. O total de eletrocardiogramas
atingiu 60 unidades, com a seguinte distribuio:
a) 15 Eletrocardiogramas antes do tratamento com dosagem de 15/mg/kg/dia;
b) 15 Eletrocardiogramas aps o tratamento com dosagem de 15/mg/kg/dia;
c) 15 Eletrocardiogramas antes do tratamento com dosagem de 20/mg/kg/dia;
d) 15 Eletrocardiogramas aps o tratamento com dosagem de 20/mg/kg/dia;

24.14.2 INSTRUES
a) Introduzir os dados da seguinte forma:
Primeira coluna: Contm as categorias. Neste exemplo os valores so de 1 a 4,
correspondentes s dosagens de 15 e 20 mg/kg/dia, antes e aps os tratamentos.
Figura 24.35
Viso parcial
dos dados
do
Exemplo
24.14.1

- 295 -
Segunda coluna: Os valores da varivel numrica. Neste caso o valor do
Intervalo PR, em cada situao indicada na primeira coluna.
Terceira e quarta colunas: indicam o nmero e o nome das categorias.
b) Clicar em Grficos e, a seguir, em Diagrama IC 95% e selecionar as 4 colunas;
c) Pressionar em Executar para obter o diagrama abaixo.

Verifica-se que as mdias dos intervalos PR das amostras antes dos tratamentos foram
ligeiramente superiores mdia geral (150.0), ocorrendo o oposto aps a medicao.
Por sua vez, o IC (95%) da mdia geral foi o menor de todos os ICs, em decorrncia
do tamanho amostral (60), o qual reuniu todas as amostras.

24.14.3 EXEMPLO 2
Em indivduos infectados pelo H. pylori na mucosa gstrica, a avaliao das idades de
299 destes indivduos apresentou a seguinte distribuio: 103 assintomticos; 100
com gastrite; 65 com lcera gstrica ou duodenal e 31 com cncer do estmago.

Figura 24.36
Diagrama
IC 95%
do
Exemplo
24.14.1
Figura 24.37
Viso parcial
dos dados
do
Exemplo
24.14.3

- 296 -
24.14.4 INSTRUES
a) Introduzir os dados da seguinte forma:
Primeira coluna: Contm as categorias. Neste exemplo os valores so de 1 a 4 e
correspondem s categorias:
1) assintomticos (controles);
2) com gastrite;
3) com lcera gstrica ou duodenal;
4) com cncer do estmago.
Obs: No h necessidade de ordenao prvia desses valores, conforme se verifica na
Figura 24.37. O programa computacional efetua os respectivos ranks numricos,
sendo essa uma das vantagens deste aplicativo.
Segunda coluna: Varivel numrica. Esta coluna contm o valor das idades de
cada grupo: controles, gastrite, etc.
Terceira e quarta colunas: indicam o nmero e o nome das categorias.
a) Clicar em Grficos e, a seguir, em Diagrama IC 95% e selecionar as 4 colunas;
b) Pressionar em Executar para obter o diagrama abaixo.

Percebe-se, nitidamente, o deslocamento da mdia e do IC dos acometidos de cncer
gstrico. Neste grupo a mdia etria foi igual a 54.35 anos e o limite inferior (49.09)
do respectivo IC foi maior que o limite superior do IC da mdia geral (45.83).
A mdia geral (43.57), por sua vez, foi menor que a mdia dos acometidos de gastrite
(44.19) ou de lcera gstrica ou duodenal (44.58), mas superou a dos indivduos
controles (39.09).
O Intervalo de Confiana (95%) da mdia geral, como seria o esperado, em face do
tamanho amostral (n = 299), foi o menor (41.31 a 45.83), ou seja, de 4.52 anos.

Figura 24.38
Diagrama
IC 95%
do
Exemplo
24.14.3

- 297 -
24.15 DIAGRAMA PONTUAL (DOT PLOT)
Este diagrama descreve graficamente duas ou mais amostras (at sete), permitindo a
visualizao pontual dos escores em sentido vertical e as respectivas comparaes.

24.15.1 EXEMPLO
O peso em gramas de sementes de duas variedades (A e B) da mesma espcie foram
coletados de modo aleatrio, e esses valores foram inseridos no grid do BioEstat,
conforme viso parcial contida na Figura 24.39.

24.15.2 INSTRUES
a) Clicar em Grficos e, a seguir, em Diagrama Pontual;
b) Pressionar em Executar para Resultados.

.

.

Observa-se que o peso das sementes da Variedade A inferior ao da Variedade B.
Figura 24.40
Diagrama
Pontual
do
Exemplo
24.15.1
Figura 24.39
Viso parcial
dos dados
do
Exemplo
24.15.1

- 298 -
24.16 PIRMIDE POPULACIONAL
A maioria dos grficos estatsticos refere-se s amostras. Pode-se, contudo,
representar Populaes atravs de Pirmides, as quais podem representar grupos
etrios, propores sexuais, locais de residncias, estados civis e outras variveis.

24.16.1 EXEMPLO 1
A populao do Estado do Par (IBGE) no ano 2000 foi tabulada em relao aos
grupos etrios e respectivos sexos.

24.16.2 INSTRUES
a) Inserir no grid as informaes obtidas do IBGE;
b) Pressionar em Grficos e, a seguir, em Pirmide Populacional;
c) Clicar em Executar para Resultados.

H ligeiro predomnio de indivduos do sexo masculino nos primeiros anos de vida e
do sexo feminino aps os 60 anos de vida.

Figura 24.41
Viso parcial
dos dados
do
Exemplo
24.16.1
Figura 24.42
Pirmide
populacional
do
Exemplo
24.16.1

- 299 -
24.16.3 EXEMPLO 2
grupos etrios e locais de residncia, urbana e rural.

24.16.6 INSTRUES

Enquanto no ano 2000 a proporo de residentes na rea rural era de 33.45%, no ano
de 1970 a populao dessa mesma rea chegava a 52.56%.

Figura 24.43
Viso parcial
dos dados
do
Exemplo
24.16.3
Figura 24.44
Pirmide
populacional
do
Exemplo
24.16.3

- 300 -
24.16.5 EXEMPLO 3
grupos etrios e locais de residncia, urbana e rural.

24.16.4 INSTRUES

H predominncia de moradores na rea urbana quando comparados com os da rea
rural, denotando uma migrao para as cidades em todo o Estado do Par.

Figura 24.45
Viso parcial
dos dados
do
Exemplo
24.16.5
Figura 24.46
Pirmide
populacional
do
Exemplo
24.16.5

- 301 -
24.16.7 EXEMPLO 4
A populao do Estado do Par foi tabulada em relao aos grupos etrios, sexos e
estado civil (solteiros e outros). Os dados so hipotticos, apenas para demonstrar a
possibilidade da introduo de 3 variveis.

24.16.8 INSTRUES

Esta pirmide representa trs variveis: faixa etria, sexo, estado civil (solteiros e no
solteiros).

Figura 24.47
Viso parcial
dos dados
do
Exemplo
24.16.7
Figura 24.48
Pirmide
populacional
do
Exemplo
24.16.7

- 302 -
24.17 AUMENTO DO TAMANHO AMOSTRAL
um mtodo computacional de gerao de dados a partir de valores observados, com
o objetivo de gerar novas e maiores amostras, cujo tamanho ser decidido pelo
pesquisador. possvel, assim, aumentar o poder do teste, sobretudo quando as
amostras iniciais so pequenas por indisponibilidade de indivduos.

24.17.1 EXEMPLO
A partir de modelos animais foram obtidas duas amostras independentes de tamanho
n = 4, cujos escores medidos em escala ordinal expressam resultados de anlise
histolgica, sendo identificados conforme o grau da leso:
- Escore 1: leve;
- Escore 2: moderada;
- Escore 3: alta.
A figura abaixo contm os escores observados no experimento. No teste de Mann-
Whitney o p-valor obtido no foi significativo (p = 0.1266).

24.17.2 INSTRUES
a) Inserir no grid os dados obtidos;
b) Selecionar no menu Amostragem: Escores do Grid e Aumento da Amostra;
c) Na janela Seleo de Amostras, escolha apenas uma coluna de cada vez;
d) Clique em Executar Estatstica;
e) Informe o tamanho da amostra a ser gerada;
f) O BioEstat 4.0 informar em qual coluna ser inserida a reamostragem;
g) Repita o procedimento para a segunda amostra;
h) Execute o teste em questo com as novas amostras obtidas.

Neste exemplo, com amostras geradas de tamanho = 20, foi aplicado o teste de Mann-
Whitney o qual mostrou diferenas significativas, apresentando p-valor = 0.0002. Este
procedimento poder ser aplicado para k amostras, como nas anlises de varincias.
Figura 24.49
Dados do
Exemplo
24.17.1
Figura 24.50
Dados do
Exemplo
24.17.1, viso
parcial da
reamostragem
gerada e o
resultado do
teste de Mann-
Whitney

- 303 -

GLOSSRIO

Amostra: parte da populao.
Amostra aleatria, casual, randmica: amostra escolhida sem a interferncia do
pesquisador, obtida por sorteio, pelos nmeros aleatrios ou por procedimento computadorizado
(pseudo-randmico), constituindo, do ponto de vista matemtico, amostra probabilstica.
Amostra estratificada: amostra retirada de camadas da populao denominadas estratos
no-superpostos, caracterizando-se, de um lado, pela maior homogeneidade da varivel investigada
dentre cada estrato e, de outro, pela maior heterogeneidade entre as camadas, como, por exemplo,
nvel socioeconmico de populao urbana: baixo, mdio e elevado. De cada camada retiram-se
amostras aleatrias de tamanho proporcional a cada estrato.
Amostra por conglomerados: amostra probabilstica cujas unidades simples so obtidas
de modo randmico de unidades coletivas, pressupondo-se que estas ltimas apresentem
homogeneidade entre si. Colmeias, cardumes, blocos residenciais, so exemplos de unidades
coletivas de onde so retiradas amostras randmicas.
Amostra sistemtica: amostra probabilstica cuja primeira unidade obtida ao acaso e as
demais, a partir da primeira, escolhidas a cada k intervalo sistemtico, definido pela razo entre o
tamanho da populao e o tamanho da amostra.
Amostras independentes: dois ou mais subconjuntos randmicos da populao retirados
de modo independente e de tamanhos iguais ou desiguais.
Amostras pareadas: subconjuntos randmicos da populao em que a varivel estudada
mensurada antes e depois de um certo procedimento. Exemplo: medio do pulso radial antes e aps
esforo fsico controlado. As amostras so necessariamente do mesmo tamanho.
Amostragem: procedimento de estudo de uma parte do universo. Sinnimo: Sondagem.
Anlise de sobrevivncia: anlise estatstica do tempo de ocorrncia de determinado
evento, o qual, na rea mdica, pode ser o bito, a recidiva de uma doena, a resposta teraputica a
uma droga etc. As instituies securitrias utilizam esse modelo de anlise. O BioEstat apresenta os
seguintes programas de anlise de sobrevivncia: Atuarial, Cox-Mantel, Gehan (Wilcoxon
generalizado), Kaplan-Meier e Log-Rank test.
Anlise multivariada: compreende testes estatsticos nos quais so consideradas de
maneira simultnea n variveis de k amostras, destacando-se nesta verso do BioEstat os programas:
Componente Principal, Distncia Multivariada (Euclidiana, Penrose e Mahalanobis), teste de
Hotelling, teste de Bartlett, Regresso Linear Mltipla e Regresso Logstica Mltipla.
ANOVA: teste estatstico cujo modelo de distribuio de probabilidades o da varincia
para k amostras ou tratamentos independentes. As amostras podem ser do mesmo tamanho ou
desiguais, no caso de k tratamentos (um critrio), e devem ser iguais quando for o caso de k
tratamentos e r blocos (dois critrios). Este teste tambm conhecido como teste F, em homenagem
a R. A. Fisher, e destina-se a comparar diferenas entre mdias atravs das varincias, cujos escores
amostrais devem ser mensurados a nvel intervalar ou de razes.
Bioestatstica ou Biometria: estatstica aplicada s cincias biolgicas e da sade.
Bonferroni: procedimento de comparao entre mdias de vrios tratamentos, no sentido
de verificar a significncia estatstica das diferenas entre essas medidas de tendncia central,

- 304 -
GLOSSRIO
determinando-se, a priori, o nvel alfa de deciso. A comparao efetuada aps a anlise da
varincia e somente se o valor de F for significativo.
Bootstrap: procedimento que consiste em retirar de uma pequena amostra numerosas
amostras, com reposio, cada uma com probabilidade 1/n de ser obtida, sendo tambm conhecido
como tcnica de reamostragem ou de simulao.
Caixa de texto: espao destinado entrada de uma determinada informao, requerida para
o teste.
Clicar: ato de pressionar um dos botes do mouse (em geral o da esquerda).
Coeficiente de assimetria: medida de forma de distribuio dos escores de variveis
aleatrias contnuas, podendo ser simtrica, assimtrica positiva (curva cuja cauda est desviada
para a direita) e assimtrica negativa (curva cuja cauda est desviada para a esquerda).
Coeficiente de curtose: medida de forma de distribuio de variveis aleatrias contnuas,
podendo ser mesocrtica (em forma de sino), leptocrtica (afilada) ou platicrtica (achatada).
Coeficiente de determinao (R
2
): o quadrado do coeficiente de correlao (r),
representando a quantidade da variao de uma varivel dependente explicada pela varivel
preditiva.
Coeficiente de regresso: uma constante que determina o grau de inclinao da reta de
regresso, simbolizado pela letra b. Na regresso mltipla h tantos coeficientes de regresso quanto
o nmero de variveis independentes testadas.
Coeficiente de variao: razo entre o desvio padro e a mdia aritmtica, vezes 100 (%).
Coeficiente Phi (

r ): coeficiente de correlao entre duas variveis qualitativas e
dicotmicas, dispostas em tabela de contingncia 2 x 2.
Concordncia de Kendall (W): teste de associao entre k variveis dispostas em vrios
conjuntos de postos e mensuradas a nvel ordinal.
Contingncia C: teste de associao entre conjuntos de variveis mensuradas a nvel
nominal, dispostas em tabelas de contingncia l (linhas) x c (colunas), isto , com quaisquer
nmeros de categorias.
Coorte: grupo bem definido de uma populao, possuindo alguma caracterstica em
comum e cujos indivduos permanecem no conjunto durante determinado tempo, registrando-se e
avaliando-se as ocorrncias havidas entre os elementos no perodo considerado.
Correo de Williams: correo do teste G para obter melhor aproximao com o teste do
Qui-Quadrado.
Correo de Yates: correo de continuidade do teste do Qui-Quadrado, onde se subtrai
0.5 do numerador de cada termo, desde que o grau de liberdade seja igual unidade (1).
Correlao de Kendall: teste de associao entre duas variveis mensuradas a nvel
ordinal (postos), calculando-se a correlao pelo coeficiente de Kendall .
Correlao de Spearman: teste de associao entre duas variveis mensuradas a nvel
ordinal (postos), calculando-se a correlao pelo coeficiente de Spearman r
s
.
Correlao linear (Pearson): teste de associao linear entre duas variveis mensuradas a
nvel intervalar ou de razes, medindo-se o grau e a direo pelo Coeficiente de correlao linear r.
Correlao Parcial: teste de associao de duas variveis quantitativas X e Y as quais
so testadas juntamente com uma outra varivel Z , a fim de se verificar se a correlao existente
entre as primeiras alterada pela presena da terceira varivel introduzida.

- 305 -
GLOSSRIO
Correlao: teste de associao entre variveis, medindo-se a magnitude e o sentido ou
somente o grau dessa correlao, conforme o teste empregado. No h qualquer dependncia
funcional de uma varivel em relao outra.
Curva ROC (Receiver Operanting Characteristic Curve): um mtodo estatstico e
grfico para determinar o melhor ponto de corte (cutoff point) de um teste diagnstico.
Dados: escores obtidos de observaes ou de experimentos, podendo ser de fontes
primrias ou secundrias e de amostras ou de populaes.
DAgostino: teste empregado para testar a normalidade dos dados amostrais.
DAgostino-Pearson: teste destinado a verificar a normalidade dos dados amostrais.
Desvio padro: raiz quadrada da varincia.
Distribuio binomial: modelo de distribuio de probabilidades de variveis aleatrias
discretas, consistindo de n provas idnticas e independentes, cada uma apresentando apenas dois
resultados: sucesso (p) e insucesso (q = 1 - p).
Distribuio de Poisson: modelo de distribuio de probabilidades de variveis aleatrias
discretas, cujos eventos so raros e referentes ao tempo e ao espao. A mdia igual varincia.
Distribuio exponencial: modelo de distribuio de probabilidades de variveis aleatrias
contnuas, referente ao intervalo de tempo decorrido entre eventos raros e discretos.
Distribuio hipergeomtrica: modelo de distribuio de probabilidades de variveis
aleatrias discretas, com as mesmas caractersticas da distribuio binomial. O tamanho da amostra,
contudo, relativamente grande em relao ao tamanho da populao, alterando-se em grau
acentuado a probabilidade dos elementos do universo pela retirada de cada unidade sem reposio.
Distribuio normal: modelo de distribuio de probabilidades de variveis aleatrias
contnuas de largo emprego em estatstica, caracterizando-se por ser simtrica, em forma de sino,
assinttica, cuja rea sob a curva igual unidade.
Erro amostral: vis observado nas amostras aleatrias, decorrente da natural variabilidade
dos elementos constituintes das populaes, assinalando-se o fato de que nem todas as unidades do
universo participam da amostra. O erro amostral reduzido pelo aumento do tamanho amostral e
medido pelo erro padro.
Erro padro: o desvio padro de uma populao de mdias amostrais, o qual
corresponde ao quociente do desvio padro do universo de onde as amostras foram retiradas pela
raiz quadrada do tamanho amostral. Quando se desconhece o desvio padro paramtrico, utiliza-se
no clculo o desvio padro da amostra
Erro tipo I (alfa): rejeio da hiptese de nulidade quando ela verdadeira.
Erro tipo II (beta): aceitao da hiptese de nulidade quando ela falsa.
Escala de razes: caracteriza-se por apresentar unidade constante e comum de
mensurao, atribuindo-se um nmero real a cada escore, havendo uma razo conhecida entre dois
intervalos quaisquer, um quociente conhecido entre dois valores quaisquer e um verdadeiro ponto
zero como origem. Exemplo: peso em gramas.
Escala intervalar: semelhante escala de razes, havendo apenas uma razo conhecida
entre dois intervalos quaisquer, sendo a unidade de medio e o ponto zero arbitrrios. Exemplo:
temperatura em graus centgrados.
Escala nominal: escala na qual as diversas categorias ou modalidades de uma varivel so
contadas. a mais simples das escalas, havendo relao de equivalncia entre e dentre as categorias.
Exemplo: estado civil solteiro, casado, divorciado e vivo.
Escala ordinal ou por postos: escala na qual as modalidades de uma varivel so
ordenadas em graus ou magnitudes convencionadas, havendo uma relao matemtica maior do

- 306 -
GLOSSRIO
que ou menor do que dos elementos entre as diversas categorias e de equivalncia das unidades
dentre cada modalidade. Exemplo: conceitos escolares Excelente, Bom, Regular e Insuficiente.
Escores padronizados: transformao dos escores brutos em escores z, onde a mdia
igual a zero e o desvio padro igual unidade (1), simbolizados por N (0,1).
Especificidade: percentagem de indivduos sem o evento (sem a afeco investigada, por
exemplo), cujo teste tuberculnico, por exemplo negativo ().
Estatstica descritiva: parte da estatstica cujo objetivo a coleta, a organizao, a
classificao dos dados amostrais ou das populaes, as apresentaes tabular e grfica e o clculo
de determinadas medidas: mdia, mediana, varincia, desvio padro, coeficiente de variao, de
assimetria, de curtose e outras.
Estatsticas (no plural): valores numricos das amostras: mdia, mediana, varincia,
coeficiente de assimetria etc., constituindo nas amostras probabilsticas estimativas no enviesadas
dos parmetros, conforme demonstrado pelo Teorema do Limite Central.
Estimao de parmetros: parte da inferncia estatstica, cujo procedimento indutivo
consiste em generalizar os valores numricos amostrais para o universo investigado.
Estudo longitudinal: aquele no qual se coletam informaes sobre os indivduos
selecionados ao longo de um intervalo de tempo especificado.
Estudo prospectivo: estudo longitudinal no qual os indivduos so observados a partir de
um dado momento, prosseguindo-se ao longo do tempo previamente fixado.
Estudo retrospectivo: estudo longitudinal no qual as informaes de interesse esto
contidas em registros anteriores, em arquivos de dados como, por exemplo, em pronturios
hospitalares.
Estudo transversal: dados coletados de um grupo de indivduos em um momento definido,
avaliando-se sobretudo a prevalncia de uma determinada afeco.
Experimento: estudo analtico no qual h interveno do pesquisador nos indivduos
submetidos pesquisa, com controle efetivo dos fatores causais e dos respectivos efeitos.
Fentipo: caracterstica de um indivduo resultante do produto dos genes e expressada de
diversas maneiras. As pessoas do sistema sangneo ABO, por exemplo, so classificadas em
fentipos dos grupos A, B, AB ou O.
Gentipo: conjunto de todos os genes que determinado indivduo possui. No caso, por
exemplo, do sistema sangneo ABO, as pessoas do grupo A possuem o gentipo AA ou AO; do
grupo B, gentipo BB ou BO; do grupo AB, gentipo AB; e do grupo O, gentipo OO.
Goodness of fit: teste estatstico de modelo de distribuio de probabilidades, no qual as
propores observadas se ajustam s propores esperadas, deduzidas matematicamente ou
estabelecidas de acordo com alguma teoria. tambm denominado de teste de aderncia.
Graus de liberdade (gl): so parmetros indexadores estatsticos correspondentes ao
nmero de observaes independentes, como se observam nas distribuies t de Student, F da
ANOVA, Qui-Quadrado e r da correlao linear de Pearson.
Grid geral: uma espcie de planilha eletrnica do BioEstat onde os dados, da maior parte
dos testes estatsticos, devem ser introduzidos. Sinnimo Matriz de Dados.
Grid especfico: similar ao grid geral, utilizado apenas para determinados testes
estatsticos.
Hiptese de nulidade (H
0
): a hiptese que se testa considerando-se no haver diferenas
entre os grupos especficos objetos do estudo, representada, por exemplo:
1
=
2
.
Hiptese alternativa (H
1
): a hiptese que contraria a de nulidade, no sentido de afirmar
que h diferena entre os grupos especficos objetos da pesquisa, representada, por exemplo:
1

2

- 307 -
GLOSSRIO
Heterogeneidade das amostras: um modelo probabilstico que indica se as amostras
investigadas no so oriundas da mesma populao, sendo utilizado nos testes G, do Qui-Quadrado,
da correlao linear e da regresso linear.
Heterocedasticidade: vide Heterogeneidade das varincias.
Heterogeneidade das varincias: um modelo probabilstico que revela se as varincias
dos subconjuntos testados so desiguais, no sendo oriundas da mesma populao, e empregado no
F teste da ANOVA, no t teste de Student para duas amostras independentes e na regresso linear.
Sinnimo: heterocedasticidade.
Homogeneidade das amostras: um modelo probabilstico que indica se as amostras
investigadas so oriundas da mesma populao, sendo utilizado nos testes G, do Qui-Quadrado, da
correlao linear e da regresso linear.
Homocedasticidade: vide Homogeneidade das varincias.
Homogeneidade das varincias: um modelo probabilstico que revela se as varincias
dos subconjuntos testados so iguais, oriundas, portanto, da mesma populao, sendo empregado no
F teste da ANOVA, no t teste de Student para duas amostras independentes e na regresso linear.
Sinnimo: homocedasticidade.
Incidncia: estudo epidemiolgico de ocorrncia de casos novos de determinada doena,
constatados ao longo de um perodo de tempo prefixado como, por exemplo, 6 meses, um ano, e
assim por diante. Os estudos relativos incidncia so denominados de longitudinais.
Inferncia estatstica: mtodo indutivo de generalizao dos valores numricos amostrais
para a populao de onde os dados foram retirados. As generalizaes estatsticas, diferentes das leis
universais, admitem excees, mas proporcionam conhecimentos de relevncia em termos
cientficos.
Intercepto: uma constante relativa ao valor de Y nas equaes de regresso quando o
escore de X igual a zero, sendo simbolizada pela letra a. Representa, portanto, o valor da varivel
dependente quando o valor da varivel preditiva igual a zero.
Intervalos de confiana: rea abrangida por n erros padres em torno da estimativa
pontual, para mais e/ou para menos, e definidos em termos probabilsticos pela Regra Emprica e
pelo Teorema do Limite Central. Os intervalos de confiana mais usados so de 95% e 99%,
correspondentes, no caso do modelo da distribuio normal, a
x
X 96 . 1 e
x
X 58 . 2 ,
respectivamente.
Kolmogorov-Smirnov: teste estatstico no-paramtrico, de aderncia ou de
independncia, para uma ou duas amostras, respectivamente. O teste de aderncia utilizado
tambm para testar a normalidade dos escores amostrais.
Levantamentos ou surveys: estudos caracterizados pela coleta de dados, descrevendo-se os
escores amostrais e calculando-se estatsticas que estimam os parmetros da populao investigada.
Nos levantamentos pode-se, ainda, estudar a relao de causa e efeito de variveis, mas sem o
controle efetivo dos elementos causais.
Lilliefors: teste de aderncia empregado para testar a normalidade amostral.
Matriz de Dados: uma espcie de planilha eletrnica do BioEstat onde os dados, da
maior parte dos testes estatsticos, devem ser introduzidos. Sinnimo Grid Geral.
Mdia aritmtica: medida de tendncia central de largo emprego em estatstica,
representada pela razo do somatrio dos valores pelo nmero de escores.
Mdia geomtrica: medida de tendncia central representada pela raiz n do produto dos
escores e indicada, sobretudo, quando os dados esto dispostos em progresso geomtrica.

- 308 -
GLOSSRIO
Mdia harmnica: medida de tendncia central para grandezas inversamente
proporcionais como, por exemplo, tempo e velocidade.
Mediana: medida de tendncia central que separa os escores em dois grupos: 50%
inferiores e 50% superiores mediana.
Menu: lista de opes do BioEstat que ativada com um clique do mouse. encontrado na
parte superior da tela.
Meta-Anlise: conjunto de procedimentos destinados a examinar, de modo simultneo,
vrios estudos, diversas pesquisas, sobre um mesmo tpico. Largamente utilizado na esfera das
cincias mdicas.
Moda: o valor mais freqente de um conjunto de dados.
Modelo: forma simblica de um princpio fsico expressado por uma equao ou por uma
frmula.
Newman-Keuls: procedimento de comparao entre mdias de vrios tratamentos, no
sentido de verificar a significncia estatstica das diferenas entre essas medidas de tendncia
central. A comparao efetuada aps a anlise da varincia e somente se o valor de F for
significativo.
Nvel de significncia: valor probabilstico do limite de rejeio da hiptese de nulidade,
do erro alfa (Tipo I). Em geral adota-se o valor alfa de 0.05 ou 0.01, admitindo-se, ao rejeitar a
hiptese de nulidade, a probabilidade de ocorrncia de 1 erro em 20 (5%) ou 1 em 100 (1%),
respectivamente.
Observao censurada: observao na anlise de sobrevivncia que no cumpriu o
seguimento estabelecido, desconhecendo-se o motivo (abandono etc.).
Odds ratio: teste estatstico simbolizado por OR para determinar a vantagem ou
desvantagem de um evento em relao ao outro, no estudo de casos nos quais o nmero de controles
fixado previamente pelo investigador.
p-valor: a probabilidade obtida em um teste de hiptese inferncia estatstica
variando de 0 a 1. Quando o p-valor igual ou menor que o nvel alfa previamente estabelecido,
rejeita-se a hiptese de nulidade.
Parmetros: valores numricos das populaes representando constantes de cada varivel
do universo investigado.
Poder do teste: capacidade de um teste estatstico de rejeitar a hiptese de nulidade quando
de fato ela falsa.
Populao ou Universo: conjunto de todos os indivduos, itens, eventos, membros ou
unidades, circunscritos em uma rea e em determinado tempo. O tamanho da populao
simbolizado pela letra N.
Populao aberta: o universo que altera seu tamanho durante o perodo da pesquisa, em
decorrncia de nascimentos, bitos e fenmenos migratrios.
Populao fechada: o universo que no altera seu tamanho durante o perodo de
investigao.
Preciso amostral: a proximidade entre os valores das estatsticas obtidas de vrias
amostras do mesmo tamanho e da mesma populao.
Prevalncia: estudo epidemiolgico de ocorrncia de casos de determinada doena
constatados em um determinado momento. Os estudos relativos prevalncia so denominados de
transversais.
Probabilidade: uma escala de mensurao usada para descrever a chance de ocorrncia
de um valor especfico (evento) de uma varivel aleatria.

- 309 -
GLOSSRIO
Regra de Bayes: modelo de distribuio de probabilidade condicional onde se calcula a
probabilidade a posteriori do evento (A) dada a ocorrncia do (B) (A!B) , em funo do
conhecimento a priori da probabilidade de ocorrncia do evento B, desde que o evento A tenha
ocorrido Pr (B!A). Para dois eventos o BioEstat apresenta o chamado crivo ou screening test,
enquanto que para trs ou mais, o programa dispe do modelo da regra de Bayes.
Regresso linear simples: teste estatstico que determina o modelo estimador dos valores
de Y a partir dos escores de X.
Regresso linear mltipla: teste estatstico que determina o modelo estimador dos escores
da varivel Y a partir dos valores de duas ou mais variveis preditivas: X
1
, X
2
, , X
n
.
Regresso logstica simples: teste estatstico de regresso no qual a varivel dependente
Y sempre binria, assumindo valores de 1 (sucessos) e 0 (insucessos). Por outro lado, a varivel
independente X , em geral, binria, mas pode assumir valores contnuos. Este teste tem larga
aplicao nas cincias mdicas.
Regresso logstica mltipla: semelhante regresso logstica simples, mas o nmero de
variveis independentes, em geral binrias, mltiplo - 2 ou mais. A varivel dependente sempre
binria.
Risco relativo: teste estatstico simbolizado por RR, representando a razo entre o
coeficiente de incidncia de determinado evento em pessoas expostas (a uma doena, por exemplo) e
o coeficiente de incidncia do mesmo evento em indivduos no expostos.
Sensibilidade de um teste: percentagem de indivduos com o evento (determinada afeco,
por exemplo) cujo teste tuberculnico, por exemplo positivo (+).
Srie categrica ou especificativa: uma srie estatstica na qual o elemento varivel o
fenmeno estudado, mantendo-se fixos o tempo e o local de observao.
Srie cronolgica, temporal, evolutiva ou histrica: uma srie estatstica na qual o
tempo varia, mantendo-se fixos o local e o fenmeno estudado.
Srie geogrfica: uma srie estatstica na qual o local (fator geogrfico) varivel,
mantendo-se fixos o tempo e o fenmeno observado.
Shapiro-Wilk: teste empregado para verificar a normalidade dos dados amostrais.
Sondagem: procedimento de estudo de uma parte da populao voltado, sobretudo, para
pesquisas de opinio e de mercado. Sinnimo: amostragem.
Tabelas de freqncia: so representaes tabulares nas quais os escores se apresentam
em correspondncia com suas repeties, com freqncias dispostas em valores absolutos e/ou em
percentuais, podendo haver agrupamento de dados em classes previamente definidas.
Tabelas de contingncia: tabelas nas quais se dispem as freqncias observadas de duas
ou mais amostras, cada uma com duas ou mais categorias, em tabelas de l linhas e c colunas (2 x 2, 3
x 2, 2 x 3, 3 x 3 etc.).
Teste de aderncia: aquele em que se observa o ajustamento ou concordncia dos
escores observados aos valores tericos esperados ou deduzidos do ponto de vista matemtico.
Chama-se na literatura inglesa de goodness of fit. Os testes G e do Qui-Quadrado, para uma amostra,
so exemplos de testes de aderncia.
Teste bilateral: teste estatstico no qual a hiptese alternativa no especifica a direo da
diferena a ser detectada, com esta representao:
1

0
, podendo
1
ser maior ou menor que
0
.
Teste binomial (duas propores): teste estatstico baseado na distribuio binomial ou na
aproximao curva normal, onde se comparam as propores de duas amostras.
Teste binomial (uma proporo): teste estatstico baseado na distribuio binomial ou na
aproximao curva normal, onde se compara a proporo de uma amostra com a do parmetro.

- 310 -
GLOSSRIO
Teste da Mediana: teste estatstico no-paramtrico de distribuio livre, para duas
amostras independentes, no sentido de constatar se provieram de uma populao com a mesma
mediana. Os dados devem ser mensurados, pelo menos, em escala ordinal.
Teste de Cochran: teste estatstico de modelo livre de distribuio de probabilidades, onde
os dados esto contidos em n linhas e k colunas. Todos os escores nominais ou ordinais
dicotomizados so definidos somente com dois valores: 1 (sim = sucesso) e 0 (no = insucesso).
Teste de Coeficientes de Variao: teste estatstico da diferena entre dois coeficientes de
variao, para verificar se os mesmos provieram da mesma populao.
Teste de Friedman: teste estatstico de modelo livre de distribuio de probabilidades
abrangendo 3 ou mais amostras relacionadas, para comparao das respectivas mdias, cujos escores
so mensurados em escala nominal ou ordinal (postos). As amostras devem ser do mesmo tamanho.
Teste de Kruskal-Wallis: teste estatstico de modelo livre de distribuio de
probabilidades, para anlise de mdias de k amostras independentes, do mesmo tamanho ou
desiguais, cujos dados devem ser mensurados, no mnimo, a nvel ordinal.
Teste de Mann-Whitney: teste estatstico no-paramtrico de distribuio livre, para duas
amostras independentes do mesmo tamanho ou desiguais e dados mensurados, no mnimo, a nvel
ordinal. tambm conhecido como Wilcoxon rank-sum test.
Teste de McNemar: teste estatstico para dados dispostos em tabela de contingncia 2 x 2,
a fim de comparar propores de dois grupos pareados, onde so observados os pares concordantes e
os discordantes em relao a dois tratamentos A e B , avaliando-se, em termos probabilsticos,
somente os pares discordantes em relao a esses mesmos tratamentos: (+ ) e ( +).
Teste de Parker: teste de estimao do tamanho de populao atravs de amostragem
mltipla em universos abertos.
Teste de Poisson: teste para uma amostra, cujos eventos so raros e ocorridos em
determinado perodo, comparando-se, pelo modelo de distribuio de Poisson, os dados amostrais
com os da populao.
Teste de Schumacher e Eschmeyer: teste de estimao do tamanho da populao atravs
de amostragem mltipla em universos fechados.
Teste de Wilcoxon: teste no-paramtrico de distribuio livre, para duas amostras
pareadas, cujos dados devem ser mensurados, pelo menos, a nvel ordinal. tambm conhecido
como Wilcoxon signed-rank test.
Teste do Qui-Quadrado (amostras independentes): teste estatstico para n amostras
independentes, cujas propores observadas nas diversas modalidades esto dispostas em tabelas de
contingncia l x c, sendo os valores esperados deduzidos matematicamente, e onde se procura
determinar se as propores observadas nas diferentes categorias so independentes ou esto
associadas. O Qui-Quadrado apresenta uma famlia de distribuio de variveis com (l 1) x (c 1)
graus de liberdade.
Teste dos Sinais: teste estatstico no-paramtrico para duas amostras pareadas, onde se
leva em considerao apenas o sinal das diferenas entre cada par de escores (+ ou ),
independentemente, portanto, da magnitude das diferenas.
Teste Exato de Fisher: teste estatstico, para duas amostras independentes cujas
propores esto dispostas em tabela de contingncia 2 x 2, devendo ser escolhido quando os
valores observados so pequenos, inclusive com propores cujos escores so iguais a zero (0).
Teste G (amostras independentes): teste estatstico para n amostras cujas propores das
diversas modalidades esto dispostas em tabelas de contingncia l x c, sendo os valores esperados
deduzidos matematicamente, procurando-se determinar se as propores observadas nas diferentes

- 311 -
GLOSSRIO
categorias so independentes ou esto associadas. Os graus de liberdade neste teste so calculados
como segue: (l 1) x (c 1).
Teste Kappa: teste estatstico no-paramtrico destinado a comparar as propores da
mesma varivel mensurada a nvel nominal em duas ocasies distintas. Testa-se a reprodutibilidade
dos resultados, no sentido da haver ou no concordncia nas propores observadas nos diferentes
perodos. Os dados so dispostos em tabela de contingncia 2 x 2.
Teste no-paramtrico: aquele em que no h pressuposto sobre modelo de distribuio
nem quanto aos parmetros, no se aplicando ao mesmo o Teorema do Limite Central.
Teste paramtrico: aquele com pressuposto de um modelo de distribuio normal,
binomial etc. , cujos parmetros assumem um desses modelos, aplicando-se-lhe o Teorema do
Limite Central.
Teste unilateral: teste estatstico no qual a hiptese alternativa especifica a direo da
diferena a ser detectada, assim representado:
1
<
0
ou
1
>
0
.
Testes t (Student): testes paramtricos para uma amostra, duas amostras pareadas ou duas
amostras independentes, baseados no modelo de distribuio de Student e geralmente efetuados
quando se desconhece as varincias paramtricas. O modelo de Student constitui uma famlia de
distribuio e est relacionado com os graus de liberdade.
Testes Z: testes paramtricos para uma amostra ou duas amostras independentes, baseados
no modelo de distribuio normal e geralmente efetuados quando as varincias das populaes so
conhecidas. Nos estudos estatsticos a distribuio normal constitui, como sabemos, um dos modelos
mais importantes em termos probabilsticos.
Transformao de dados: mudana de escala dos dados de uma varivel, podendo ser
efetuada pelos logaritmos, pela raiz quadrada, pela ordenao dos escores (rank), pelo quadrado dos
valores etc.
Unidade: indivduo, elemento, item, membro ou unidade estatstica onde se estuda uma ou
mais variveis. A unidade estatstica pode ser simples: pessoa, objeto, animal, planta, protozorio,
etc., ou coletiva: cardume, blocos residenciais, turmas escolares, colmeias, colnias bacterianas e
outras.
Universo: o mesmo que populao.
Valor preditivo de um teste negativo: probabilidade de que um indivduo com teste
negativo () seja uma pessoa sem o evento objeto da investigao (determinada doena, por
exemplo).
Valor preditivo de um teste positivo: probabilidade de que um indivduo com teste
positivo (+) apresente o evento objeto da investigao (determinada doena, por exemplo).
Valor extremo: escore muito afastado da maioria dos valores amostrais, decorrente da
incluso no universo investigado de elemento estranho, de erro de observao, de falha instrumental,
de equvoco de registro ou de introduo do dado na planilha de clculos. Pode, entretanto, ser um
valor verdadeiro, devendo-se examin-lo cuidadosamente antes de sua excluso da anlise dos
dados. Na literatura inglesa denomina-se outlier .
Varincia: soma dos quadrados dos desvios em relao mdia, dividida pelo nmero de
observaes da amostra menos um (n 1).
Variveis independentes: so variveis consideradas preditivas de uma outra varivel
denominada dependente.
Varivel: determinada caracterstica dos indivduos ou elementos objetos da investigao,
como so exemplos o sexo dos animais, o estado civil, a etnia, o peso de recm-nascidos etc.

- 312 -
GLOSSRIO
Varivel dependente: a varivel decorrente de uma ou mais variveis, estas denominadas
independentes ou preditivas.
Vis ou Bias: diferena entre o valor de uma estatstica e a do parmetro.
Vis ou Bias ocasionais: so aqueles decorrentes de erros de cobertura superposio,
incluso ou excluso de unidades , da escolha no-aleatria das amostras, de erros de observao,
de defeitos instrumentais e outros.

- 313 -

REFERNCIAS BIBLIOGRFICAS

Abuabara, M. A. P. & Petrere Jr. M. (1997). Estimativas da Abundncia de Populaes Animais.
EDUEM Editora da Universidade Estadual de Maring, Paran.
Allen, R.G.D. (1979). Estatstica para Economistas. Zahar Editores, Rio de Janeiro.
Ayres, M. & Ayres Jr., M. (1987). Aplicaes Estatsticas em BASIC. McGraw-Hill do Brasil, So
Paulo.
Ayres, M., Ayres Jr., M., Ayres, D.L., Santos, A. S. (1998). BioEstat. Verso 1.0, Sociedade Civil
Mamirau, MCT CNPq, Belm, Par, Brasil.
Beiguelman, B. (1979). Gentica Mdica, vol. 3. Edart-So Paulo Livraria Editora, Ed. da Universidade
de So Paulo.
Beiguelman, B. (1994). Curso Prtico de Bioestatstica. 3.

ed., Revista Brasileira de Gentica.
Beiguelman, B. (1994). Dinmica dos Genes nas Famlias e nas Populaes. Sociedade Brasileira de
Gentica, Ribeiro Preto, So Paulo.
Berkeley, E.C. (1965). Sorte ou Azar. Editora Universidade de Braslia, Braslia.
Berqu, E.S., Souza, J.M.P. & Gotlieb, S.L.D. (1980). Bioestatstica. Editora Pedaggica e
Universitria, So Paulo.
Blank, S., Seiter, C. & Bruce., P. (2001). Resampling Stats in Excel. Resampling Stats, Inc., Arlington,
Virginia.
Bradley, E. & Tibshirani, R. J. (1993). An Introduction to the Bootstrap. Chapman & Hall/CRC,
London.
Brown, F.L., Amos, J.R. & Mink, O.G. (1975). Statistical Concepts. 2rd. ed., Harper & Row,
Publishers, New York.
Burleson, D.R. (1980). Elementary Statistics. Winthrop Publishers, Inc., Cambridge, Massachusetts.
Bussad, W.O. (1988). Anlise de Varincia e Regresso. 2. ed., Editora Atual, So Paulo.
Butcher, H.J. (1966). Sampling in Educational Research. Manchester University Press, Manchester.
Caldeira, A.M.S. & Ferreira, M.L.B. (1974). Estatstica Instruo Programada, vols. 1 e 2.
Conquista, Rio de Janeiro.
Callegari-Jacques, S. (2003). Bioestatstica: princpios e aplicaes. Artmed Editora S.A., Porto
Alegre, Brasil.
Calot, G. (1979). Cours de Statistique Descriptive. Deuxime dition, Dunod, Paris.
Camel, F. (1991). Estadstica Mdica y Planificacin de la Salud, I y II. Consejo de Publicaciones de la
Universidad de Los Andes, Mrida, Venezuela.
Campbell, R.C. (1994). Statistics for Biologists. 3rd. ed., Cambridge University Press, Cambridge.
Canavos, G.C. (1988). Probabilidad y Estadstica. McGraww-Hill, Mxico.
Castle, W.M. (1977). Statistics in Small Doses. 2rd. ed., Churchill Livingstone, London.
Centeno, A.J. (1982). Curso de Estatstica Aplicada Biologia. Editora. da Universidade Federal de
Gois, Goinia.
Chacn, E. (1972). Curso de Estatstica. Livro Ibero-Americano, Rio de Janeiro.
Chatfield, C. & Collins, A.J. (1986). Introduction to Multivariate Analysis. Chapman and Hall, London.

- 314 -
Chernick, M.R. & Friis, R.H. (2003). Introductory Biostatisitcs for the Health Science. Wiley
Intercience, New Jersey.
Cochran, W.G. (1977). Sampling Techniques. 3rd. ed.., John Wiley & Sons, Inc., New York.
Cohen, J. (1977). Statistical Power Analysis for the Behavioral Sciences. 2rd. ed., Lawrence Erlbaum
Associates, Publishers, New Jersey.
Collett, D (1996). Modelling Survival Data in Medical Research. Chapman & Hall, London.
Cooke, D., Craven, A.H. & Clarke, G.M. (1984). Basic Statistical Computing. Edward Arnold
(Publishers), London.
Costa, J.J.S. (1981). Elementos de Estatstica. Editora Campus, Rio de Janeiro.
Costa, S.F. (1988). Introduo Ilustrada Estatstica. Editora Harbra, So Paulo.
Cox, D.R. (1972). Regression Models and Life-Tabels. J. Roy. Statist. Soc. , 34: 187-220.
Crespo, A.A. (1997). Estatstica Fcil. 15. ed., Editora Saraiva, So Paulo.
Cunha, O.S. & Ramos, F.A.O. (1976). Iniciao Estatstica: Volumes I e II. Tipografia do
Carvalhido, P.
Cunha, S.E. (1978). Estatstica Descritiva na Psicologia e na Educao. Forense-Universitria, Rio de
Janeiro.
Daniel, W.W. (1999). Biostatistics: A Foundation for Analysis in the Health Sciences. 7th. ed., John
Wiley & Sons, New York.
Dawson-Saunders, B. & Trapp, R.G. (1994). Basic & Clinical Bioestatstics. 2rd. ed., Appleton &
Lange, Norwalk, Connecticut.
DeGroot, M.H. (1988). Probabilidad y Estadstica. 2. ed., Addison-Wesley Iberoamericana,
Wilmington, Delaware.
Di Dio, R.A.T. (1979). Estatstica, Instruo Programada. Editora Pedaggica e Universitria, So
Paulo.
Dress, F. (2004). Probabilits et Statistique de A Z. Dunod, Paris.
Edwards, A.L. (1984). An Introduction to Linear Regression and Correlation. 2nd. ed., W. H. Freeman
and Company, New York.
Elston, R.C. & Johnson, W.D. (1994). Essentials of Biostatistics. 2nd. ed., F. A. Davis Company,
Philadelphia.
Essex-Sorlie, D. (1995). Medical Bioestatstics & Epidemiology. Appleton & Lange, Norwalk,
Connecticut.
Fisher, L.D. & Van Belle, G. (1993). Biostatistics. John Wyley & Sons, Inc., New York.
Fisher R.A. (1946a). The fitting of gene frequencies to data on Rhesus reactions. Ann. Eug. 13:150-155.
Fisher R.A. (1946b). Note on the calculation of the frequencies of Rh allelomorphs. Ann. Eug. 13:223-
224.
Fisher, R.A. (1993). Statistical Methods Experimental Design and Scientific Inference. Oxford
University Press, Oxford.
Fisher, R.A. & Yates, F. (1954). Tablas Estadisticas. Aguilar Ediciones, Madrid.
Fogiel, M. (1996). The Statistics Problem Solver. Research and Education Asscociation, New Jersey.
Freund, R.J. & Wilson, W.J. (1997). Statistical Methods. Revised Edition, Academic Press, New York.
Galambos, J. (1984). Introductory Probability Theory. Marcel Dekker, Inc., New York.
Gatts, R.R. (1978). Elementos de Probabilidade e Inferncia. Editora Atlas, So Paulo.
Glantz, S.A. (1997). Primer of Biostatistics. 4th. ed., McGraw-Hill, NewYork.
Gnedenko, B.V. & Khintchine, A.I. (1974). Introduo Teoria das Probabilidades e Estatstica.
Editorial Estdios Cor, Lisboa.

- 315 -
Gonick, L. & Smith, W. (1993). The Cartoon Guide To Statistics. HarperPerennial, HarperCollins
Greenberg, R.S., Daniels, S.R., Flanders, W.D., Eley, J.W. & Boring, J.R. (1996). Medical
Epidemiology. 2nd. ed., Appleton & Lange, Norwalk, Connecticut.
Groeneveld, R.A. (1979). An Introduction to Probability and Statistics Using Basic. Marcel Dekker,
Inc., New York.
Groves, R.M. (1989). Survey Errors and Survey Costs. John Wiley & Sons, New York.
Guedes, M.L.S. & Guedes, J.S. (1988). Bioestatstica para Profissionais de Sade. Ao Livro Tcnico,
Rio de Janeiro.
Guimares, R.C. & Cabral, J. A.S. (1997). Estatstica. McGraw-Hill de Portugal, Porto,
Gullon, A. (1971). Introduccion a la Estadstica Aplicada. Editorial Alhambra, Madrid.
Hayslett Jr., H.T. (1968). Statistics Made Simple. Doubleday, New York.
Hedges, L. V. & Olkin, I. (1985). Statistical Methods for Meta-Analysis. Academic Press, New York.
Herzon, F.D. & Hooper, M. (1976). Introduction to Statistics for the Social Sciences. Thomas Y.
Crowell Company, New York.
Hine, J. & Wetherill, G.B. (1975). A Programmed Text in Statistics: Book One, Summarizing Data.
Chapman and Hall, London.
Hinkle, D.E., Wiersma, W. & Jurs, S.G. (1994). Applied Statistics for the Behavioral Sciences. 3rd. ed.,
Houghton Mifflin Company, Boston.
Hoel, P.G. (1979). Estatstica Elementar. Editora Atlas, So Paulo.
Hosmer, D.W. & Lemeshow, S. (1989). Applied Logistic Regression. John Wiley & Sons, New York.
Hosmer, D.W. & Lemeshow, S. (1998). Applied Survival Analysis, John Wiley & Sons, New York.
Howell, D.C. (1993). Fundamental Statistics for the Behavioral Sciences. 2nd. ed., PWS-KENT
Publishing Company, Boston.
Huck, S.W. & Sandler, H.M. (1984). Statistical Illusions: Solutions. Harper & Row, Publishers, New
York.
Huff, D. (1993). How to Lie with Statistics. W. W. Norton & Company, Inc., New Yourk.
Ingelfinger, J.A., Mosteller, F., Thibodeau, L.A. & Ware, J.H. (1994). Biostatistics in Clinical
Medicine. 3rd. ed., McGraw-Hill, New York.
Jabardo, W.R.S. (1985). Gentica. Editora McGraw-Hill do Brasil, So Paulo.
Johnson, D. E. (1998). Mtodos Multivariados Aplicados al Anlisis de Datos. International Thomson
Editores, Mxico.
Johnson, R.A. & Wichern, D.W. (1998). Applied Multivariate Statistical Analysis. 4th. ed., Prentice
Hall, Inc., New Jersey.
Kaar, A.F. (1986). Point Processes and Their Statistical Inference. Marcel Dekker, Inc., New York
Kachigan, S. K. (1991). Multivariate Statistical Analysis A Conceptual Introduction. 2nd Ed.. Radius
Press. New York.
Kalbfleisch, J.G. (1985). Probability and Statistical Inference, vols. 1, 2. 2rd. ed., Springer-Verlag,
New York.
Kaplan, D. T. (1999). Resampling Stats in MATLAB. Resamplibg Stats. Inc., Arlington, Virginia.
Katz, D. L. (2001). Epidemiologia, Bioestatstica e Medicina Preventiva. Livraria e Editora RevinteR
Ltda., Rio de Janeiro.
Kellner, S.R.O., Cavas, C.S.T. & Nick, E. (1979). Exerccios de Estatstica. Editora Renes, Rio de
Janeiro.
Kirkwood, B.R. (1995). Essencials of Medical Statistics. Blackwell Science, Oxford.

- 316 -
Lang, T.A. & Secic M. (1997). How to Report Statistics in Medicine. American College of Physicians,
Philadelphia.
Lange, K. (1997). Mathematical and Statistical Methods for Genetic Analysis. Springer-Verlag, New
York.
Lapponi, J.C. (1997). Estatstica usando Excel 5 e 7. Lapponi Treinamento e Editora, So Paulo.
Laurenti, R., Mello Jorge, M.H.P., Lebro, M.L. & Gotlied S.L.D. (1987). Estatsticas de Sade. 2. ed.,
Editora Pedaggica e Universitria, So Paulo.
Lee, E.T. (1992). Statistical Methods for Survival Data Analysis. 2nd. ed., John Wiley & Sons, Inc.,
New York.
Levin, J. (1978). Estatstica Aplicada a Cincias Humanas. Editora Harper & Row do Brasil, So
Paulo.
Levy, P.S. & Lemeshow, S. (1991). Sampling of Populations. John Wiley & Sons, Inc., New York.
Lindley, D.V. & Scott, W.F. (1984). New Cambridge Elementary Statistical Tables. Cambridge
University Press, Cambridge.
Manly, B.F.J. (2000). Multivariate Statistical Methods- A Primer, Third Ed., Chapman and Hall,
London.
Martinelli, J.M. (2005). Estrutura Populacional dos Camares Penaeidae no Esturio do Rio Caet,
litoral Norte do Brasil, Tese de Doutorado, Belm, Par, Brasil.
Martins, G.A. & Donaire, D. (1979). Princpios de Estatstica. Editora Atlas, So Paulo.
Massad, E., Menezes, R.X., Silveira, P.S.P. & Ortega, N.R.S. (2004). Mtodos Quantitativos em
Medicina. Editora Manole, So Paulo, Brasil.
Mattar, F.N. (1994). Pesquisa de Marketing, 1 e 2. Editora Atlas, So Paulo.
Matthews, D.E. & Farewell, V.T. (1996). Using and Understanding Medical Statistics. 3rd. ed., Karger,
Basel.
Maxwell, A.E. (1977). Multivariate Analysis in Behavioural Research. Chapman and Hall, London.
McCuen, R.H. (1993). Microcomputer Applications in Statistical Hidrology. Prentice Hall, New Jersey.
Mendenhall, W. & Beaver, R.J. (1991). Introduction to Probability and Statistics. 8th. ed., PWS-KENT
Michelson, S. & Schofield, T. (1996). The Biostatistics Cookbook. Kluwer Academic Publishers,
Boston.
Miller, S. (1977). Planejamento Experimental e Estatstica. Zahar Editores, Rio de Janeiro.
Minium, E.W., King, B.M. & Bear, G. (1993). Statistical Reasoning in Psychology and Education.
Third ed., John Wiley & Sons, Inc., New York.
Morettin, P.A. & Bussab, W.O. (2004). Estatstica Bsica, 5a. Ed., Editora Saraiva, SoPaulo.
Mosteller, F. & Rourke, R.E.K. (1993). Estatsticas Firmes. Edies Salamandra, Lisboa.
Murteira, B.J.F. (1990). Probabilidades e Estatstica, vols. I e II. 2. ed., McGraw-Hill de Portugal,
Lisboa.
Neave, H.R. (1985). Elementary Statistics Tables. George Allen & Unwin, London.
Neter, J., Kutner, M.H., Nachtsheim, C.J. & Wasserman, W. (1996). Applied Linear Regression
Models. 3rd. ed., IRWIN, Chicago.
Neter, J., Kutner, M.H., Nachtsheim, C.J. & Wasserman, W. (1996). Applied Linear Statistical Models.
4th. ed., IRWIN, Chicago.
Nick, E. & Kellner, S.R.O. (1971). Fundamentos de Estatstica para as Cincias do Comportamento.
Editora Renes, Rio de Janeiro.
Oliveira, T.F.R. (1976). Estatstica na Escola. Ao Livro Tcnico, Rio de Janeiro.

- 317 -
Ott, R.L. & Mendenhall, W. (1995). Understanding Statistics. 6th. ed., Duxbury Press, Belmont,
California.
Pagano, R.R. (1994). Understanding Statistics in the Behavioral Sciences. 4th. ed., West Publishing
Company, New York.
Peters, W.S. & Summers, G.W. (1978). Anlise Estatstica e Processo Decisrio. 2. ed., Editora da
Fundao Getlio Vargas, Rio de Janeiro.
Rameau, C. (1971). As Estatsticas: um Instrumento de Gesto, 1
0
e 2
0
. Livraria Clssica Editora,
Lisboa.
Rees, D.G. (1990). Essential Statistics. 2rd. ed., Chapman and Hall, London.
Reichmann, W.J. (1975). Uso e Abuso das Estatsticas. Editora Artenova, Rio de Janeiro.
Reis, E. (1997). Estatstica Multivariada Aplicada. Edies Slabo, Lda., Lisboa.
Reis, M.D. (1978). Elementos Bsicos de Estatstica. 2. ed., Editora Estrutura, So Paulo.
Reszczynski, O. (1969). Sumatorias. Centro Interamericano de Enseanza de Estadstica, Santiago.
Rivera, D.P.S. (1989). Estadstica Modelos y Mtodos, 1. Fundamentos. Alianza Editorial, Madrid.
Rocha, M.V. (1975). Curso de Estatstica. 3. ed., Fundao Instituto Brasileiro de Geografia e
Estatstica (IBGE), Rio de Janeiro.
Rosner, B. (1995). Fundamentals of Biostatistics. 4th. ed., Duxbury Press, Boston.
Rothenberg, R.I. (1991). Probability and Statistics. Harcout Brace Jovanovich, Publishers, New York.
Rowntree, D. (1981). Statistics Without Tears - A Primer for Non-mathematicians. Penguin Books,
New York.
Sahai, H. & Martnez, W. (1996). Tablas y Frmulas Estadsticas para las Ciencias Biolgicas,
Sociales y Fsicas. Grupo Editorial Iberoamrica, de C.V., Mxico.
Salaru, N.N. (1989). Blood groups in large sample from city of So Paulo (Brazil): allele and haplotype
frequencies for MNSs, Kell-Cellano, Rh and ABO systems. Rev. Brasil. Genet. 12, 2, 625-643.
Shapiro, S.S. & Wilk, M.B. (1965). An Analysis of variance test for normality (complete samples).
Biometrika, 52: 591- 411.
Shapiro, S.S., Wilk, M.B. & Chen, H.J. (1968). A comparative study of various tests for normality.
J. Amer. Statist. Assoc. 63: 1343 1372.
Scheaffer, R.L., Mendenhall, W. & Ott, L. (1990). Elementary Survey Sampling. 4th. ed., PWS-KENT
Shiavi, R. (1991). Introduction to Applied Statistical Signal Analysis. Aksen Associates Incorporated
Publishers, Boston.
Shiffler, R. E. & Adams, A. J. (1999). Succeding Statistics. Duxbury Press, New York.
Siegel, S. & Castellan Jr., N.J. (1988). Nonparametric Statstics for the Behavioral Sciences. 2nd. ed.,
Mc Graw-Hill, Inc., New York.
Sincich, T. (1993). Statistics by Example. 5th. ed., Prentice Hall, New Jersey.
Snedecor, G.W. & Cochran, W.G. (1978). Statistical Methods. 6th. ed., The Iowa State University
Press, Ames, Iowa.
Soares, J.F. & Siqueira, A.L. (2002). Introduo Estatstica Mdica. Departamento de Estatstica
UFMG, Belo Horizonte, Brasil.
Sokal, R.R. & Rohlf, F.J. (1995). Biometry. 3rd. ed., W. H. Freeman and Company, New York.
Sounis, E. (1985). Bioestatstica. 3. ed., Livraia Atheneu, Rio de Janeiro.
Spiegel, M.R. (1984). Estatstica. 2. ed., McGraw-Hill do Brasil, So Paulo.
Stansfield, W.D. (1985). Gentica. 2. ed., McGraw-Hill do Brasil, So Paulo.
Steel, R.G.D., Torrie, J.H. & Dickey, D.A. (1997). Principles and Procedures of Statistics A
Biometrical Approach. 3rd. ed., McGraw-Hill, New York.

- 318 -
Stevens, W.L. (1938). Estimation of blood-groups gene frequencies. Ann. Eug. 8:362-217.
Stevens, W.L. (1950). Statistical analysis of the A-B-O blood groups. Hum. Biol. 22:191-217.
Sutton, A. J., Abrams, K. R., Jones, D. R., Sheldin, T. A. & Song. F. (2000). Methods for Meta-
Analysis in Medical Research. John Wiley & Sons, Ltd., New York.
Tanis, E.A. (1987). Statistics II Estimation and Tests of Hypotheses. Harcout Brace Jovanovich,
Tippett, L.H.C. (1968). Estatstica. 2. ed., Coleo SABBER, Publicaes Europa-Amrica, Lisboa.
Toledo, G.L. & Ovalle, I.I. (1995). Estatstica Bsica. 2. ed., Editora Atlas, So Paulo.
Triola, M.F. (1999). Introduo Estatstica. 7. ed., LTC Livros Tcnicos e Cientficos Editora, Rio
de Janeiro.
Van Belle. G. (2002). Statistical Rules of Thumb. Wiley Interscience, New York.
Vicente, P., Reis, E. & Ferro, F. (1996). Sondagens. Edies Slabo, Lisboa.
Vieira, S. (1981). Introduo Bioestatstica. Editora Campus, Rio de Janeiro.
Weaver, J. H. (2001). Conquering Statistics Numbers Without The Crunch. Perseus Publishing,
Cambridge, Massachusetts.
Wetherill, G.B. (1967). Elementary Statistical Methods. Methuen & Co. Ltd., London.
White, J., Yeats, A. & Skipworth, G. (1979). Tables for Statisticians. 3rd. ed., Stanley Thornes
(Publishers) Ltd., Cheltenham.
Wonnacott, R.J. & Wonnacott, T.H. (1985). Introductory Statistics. 4th. ed., John Wiley & Sons, New
York.
Zar, J.H. (1999). Biostatistical Analysis. 4th. ed., Prentice Hall, New Jersey.

- 319 -
NDICE

A
Abrindo arquivos, 10
Aderncia,
G, teste, 93, 155
Kolmogorov-Smirnov, 94
Lilliefors, 95
Qui-Quadrado, 96/97
Ajustamento de curvas, 180
Amostras, tamanho, 191
Amostragem, tipos de,13
Aleatrias do grid, 17
Aleatrias simples, 14
Estratificadas, 15
Por conglomerados, 15
Sistemticas, 14
Anlise multivariada, 19
Componente principal, 19
Conglomerados, 273
Correlao cannica, 279
Discriminante, 276
Distncia Euclidiana, 21
Distncia de Penrose e Mahalanobis, 22
Teste de Hotelling, 24
Teste de Bartlett, 25
Anlise de resduos, 182
Anlise de sobrevivncia, 27
atuarial, 27
Cox-Mantel, 35
Cox: Modelo de Risco Proporcional, 282
Gehan, 36
Kaplan-Meier, 29
Log-Rank test, 31
Mantel-Haenszel, 36
ANOVA, 39
dois critrios, 44
duas amostras pareadas, 109
fatorial a x b, 45

fatorial a x b x c, 47
Friedman, 48
Kruskal-Wallis, 50
Q de Cochran, 52
um critrio, 39
rea, grfico de, 206
B
Bartlett, teste de, 25
Bayes, regra de, 85
Binomial, distribuio, 75
Binomial, teste, 92, 104
Bootstrap, 55, 287
Box-plot, 207, 208
C
Casas decimais, expresso de, 3
Caule e folha, diagrama, 209
Cochran, teste Q de, 52
Coeficientes de variao, teste de,114
Colunas, grfico de , 211
Configurando o BioEstat, 12
Componente principal, 19
Conglomerados, amostras por, 15
Conglomerados, anlise, 273
Correlao, 65
cannica, 279
concordncia de Kendall, 71
contingncia C, 70
de Kendall, 72
intraclasse, 193
linear de Pearson, 65
linear < 0 ou > 0, 69
matriz de, 66
parcial, 68

- 320 -
NDICE
Phi, 73
Spearman, 74
Curva, grfico de, 217
Cox-Mantel , 35
Cox: Modelo de Risco Proporcional, 282
Crivo (screening test), 82

D
DAgostino, teste, 165
DAgostino-Pearson, teste, 166
Densidade e tamanho da populao, 134
Diagrama de disperso, grfico, 213
Diagrama IC, 294
Diagrama Pontual, 297
Discriminante, anlise, 276
Distncia multivariada, 21
Euclidiana, 21
Penrose e Mahalanobis, 22
Distribuio de probabilidades, 75
binomial, 75
crivo (Screening test), 82
curva ROC, 83
exponencial, 78
F, 86
hipergeomtrica, 76
normal, 79
Poisson, 77
Qui-Quadrado, 87
Regra de Bayes, 85
Sensibilidade/Especificidade, 85
t Student, 87
Z, 88
Duas amostras independentes, 99
coeficiente de variao, 114
Odds Ratio (OR), 110
Risco Relativo, (RR), 112
taxa de Incidncia, 113
teste binomial, 104
teste exato de Fisher, 100
teste G, 105
teste de Kolmogorov-Smirnov, 106
teste de Mann-Whitney, 107
teste da Mediana, 108
teste de Poisson, 115
teste do Qui-Quadrado, 109
teste t de Student, 100
teste Z, 102
Duas amostras relacionadas, 117
ANOVA, 119
teste de McNemar, 120
teste de Wilcoxon, 124
teste dos Sinais, 122
teste Kappa, 123

E
Entrando com os dados, 8
Escolha do teste estatstico, sugestes, 265
Escolhendo o teste, 11
Estatstica descritiva, 125
Estimao de parmetros, 129
da diferena entre duas mdias, 131
da diferena entre duas propores, 133
da mdia,129
da proporo, 130
densidade e tamanho da populao, 134
fentipos e gentipos, 135
Fourier (densidade) , 136
Hardy-Weinberg, 137
tamanho da populao, 138, 139 ,139, 141
Estratificadas, amostras, 15
Euclidiana, distncia, 21
Executando o teste, 9
Exponencial, distribuio, 78
F
F, distribuio, 86
Fatorial, anova, 45, 47
Fentipos e gentipos, 135
Frmulas estatsticas,
anlise multivariada, 227
anlise de sobrevivncia, 228
anlise de varincia, 229
correlao, 231
distribuio de probabilidades, 233
duas amostras independentes, 237
duas amostras relacionadas, 240

- 321 -
NDICE
estatstica descritiva, 242
estimao de parmetros, 245
meta-anlise, 250
normalidade, 253
Qui-Quadrado, 254
regresso, 256
tamanho das amostras, 260
transformao de dados, 262
uma amostra, 235
Fisher, teste exato, 104
Fourier (densidade), 136
Freqncia, tabelas de, 223
Friedman, teste de, 48
G
G, teste , 93, 105, 155
Gehan, 36
Glossrio, 303
Grficos e tabela, 205
rea, 206
box-plot (mediana), 207
box-plot (media), 208
caule e folha, 209
coluna, 211
curva, 217
diagama IC, 294
diagrama pontual,, 297
disperso, 213
histograma, 214
manipulao, 221
mximo e mnimo, 218
pirmide populacional, 298
polar, 219
resultados, 225
setor, 220
tabelas de freqncia, 223
H
Hipergeomtrica, distribuio, 76
Histograma, grfico, 214
Hotelling, teste de, 24
I
Imprimindo, 11
Incidncia, taxa de, 113
Independncia,
duas amostras, 99
Qui-Quadrado, 151
ndice, 319
Instalando o BioEstat, 3
K
Kaplan-Meier, 29
Kappa, teste, 123
Kendall
coeficiente de concordncia, 71
coeficiente de correlao, 72
Kolmogorov-Smirnov, teste de
aderncia, 94, 167
independncia, 106
uma amostra, 94
Kruskal-Wallis, teste de, 50
L
Lilliefors, teste de, 95, 167
Linear, correlao, 65, 69
Linear mltipla, regresso , 179
Linear simples, regresso, 177
Logstica mltipla, regresso, 187
Logstica simples, regresso , 185
Log-Rank test, 31
M
Mahalanobis, distncia de, 22
Manipulao, Grficos, 221
Mann-Whitney, teste de, 107
Mantel-Haenszel, 36, 148
Mximo e mnimo, grfico, 218
McNemar, teste de, 120
Mdia, estimao da, 129
Mediana, teste da, 108
Meta-Anlise, 143
DerSimonian-Laird, 144

- 322 -
NDICE
Dados Contnuos, 146
Grficos, 159
Mantel-Haenszel, 148
p-valor, 149
Qui-Quadrado, 150, 151
Regresso, 153
Risco Relativo, 154
Teste G, 155
Vrias Correlaes, 157
Vrias Propores, 158
Kolmogorov-Smirnov, teste de , 94, 106
Multivariada, anlise, 19
Mltipla, regresso linear, 179
Mltipla, regresso logstica, 187
N
Normal, distribuio, 79
Normalidade, 165
D'Agostino, teste de, 165
D'Agostino-Pearson, teste de, 166
Kolmogorov-Smirnov, teste de, 167
Lilliefors, teste de, 167
Shapiro-Wilk, teste de, 168
Valores extremos, 169, 170
O
Obtendo ajuda, 12
Odds-ratio, 110, 144, 148
P
Parcial, correlao, 68
Pearson, correlao de, 65, 69
Penrose, distncia de, 22
Pirmide Populacional, 298
Ponto de Corte, 285
Populao, tamanho,
amostragem simples direta, 138
amostragem simples inversa, 139
amostragem mltipla pop. aberta, 139
amostragem mltipla pop. fechada, 141
densidade e tamanho, 134
Poisson, distribuio de, 77
Poisson, teste, 98, 115
Polgono de freqncia, 214
Polinomial, regresso, 188
Probabilidades, distribuio, 75
Proporo,
estimao da, 130
uma amostra, 92
duas amostras, 104
vrias propores, 158
Q
Q, de Cochran, 52
Qui-Quadrado,
amostras independentes, 109
distribuio do, 87
homogeneidade, aderncia, 150
homogeneidade, independncia, 151
Mantel-Haenszel, 148
partio, 173
tendncia, 174
uma amostra, 96/97
vrias propores, 158
R
Reamostragem: bootstrap, 287
Referncias bibliogrficas, 313
Regra de Bayes, 85
Regresso, 177
ajustamento de curvas, 180
anlise de resduos, 182
homogeneidade, 153
linear mltipla, 179
linear simples, 177
logstica mltipla, 187
logstica simples, 185
polinomial, 188
Requerimentos de sistema, 2
Risco relativo, 112, 154
S
Salvando os dados, 9
Setor, grfico de, 220

- 323 -
NDICE
Sensibilidade/Especificidade, 85
Shapiro-Wilk, teste, 168
Sinais, teste dos, 122
Spearman, correlao de , 74
Sugestes, escolha do teste estatstico, 265
T
t de Student, distribuio, 87
Tabela de freqncia, 223
Tamanho da populao
amostragem simples direta, 138
amostragem simples inversa, 139
amostragem mltipla pop. aberta, 139
amostragem mltipla pop. fechada, 141
Tamanho das amostras, 191
anlise de varincia, 192
correlao linear, 192
McNemar, 193
proporo
duas amostras, 195
uma amostra, 194
Qui-Quadrado, 173
teste t
amostras pareadas, 117
uma amostra, 89
Taxa de incidncia, 113
Teste binomial
duas propores, 104
uma proporo, 92
Teste da Mediana, 108
Teste de Bartlett, 25
Teste de Cox-Mantel, 34
Teste DAgostino, 165
Teste DAgostino-Pearson, 1166
Teste de Gehan, 35
Teste de Friedman, 48
Teste de Hotelling, 24
Teste de Kappa, 123
Teste de Kaplan-Meier, 29
Teste de Kolmogorov-Smirnov
uma amostra, 84, 167
Teste de Kruskal-Wallis, 50
Teste de Lilliefors, 95, 167
Teste de Mantel-Haenszel, 36, 148
Teste de Mann-Whitney, 107
Teste de McNemar, 120
Teste de Parker, 141
Teste de Poisson, 98, 115
Teste de Shapiro-Wilk, 136
Teste de Schumacher e Eschmeyer, 139
Teste de Wilcoxon, 124
Teste do Qui-Quadrado
homogeneidade, 150, 151
partio, 173
tendncia, 174
uma amostra, 96/97
vrias propores, 158
Teste dos sinais, 122
Teste exato de Fisher, 104
Teste G
uma amostra, 93
homogeneidade, 155
Teste Kappa, 123
Teste Q de Cochran, 52
Teste t
duas amostras independentes, 100, 288
duas amostras relacionadas, 117, 292
Teste Z
duas amostras independentes, 102, 291
Transformao de dados, 201
U
Uma amostra, 89
binomial, teste, 92
teste G, 93
teste de Kolmogorov-Smirnov, 94
teste de Lilliefors, 95
teste do Qui-Quadrado, 96/97
teste de Poisson, 98
teste Z, 91

- 324 -
NDICE
V
Valores extremos, 169 e 171
Vrias propores, 158
Variao, coeficiente de, 114
Varincia, anlise de, 39
W
Wilcoxon, teste de, 124
Z
Z, distribuio, 88
Z, teste para duas amostras independentes, 102
Z, para uma amostra, 91

Manual BioEstat

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Manual BioEstat

Загружено:

Авторское право:

Доступные форматы

APLICAES ESTATSTICAS

NAS REAS DAS CINCIAS BIO-MDICAS

0.42 + 0.35 x ln (X).

. No entanto, de modo indireto, pode-se examinar a varivel

64.97 + 0.4682 X 0.0010 X

64.97 + 0.4682 x 75 0.0010 x 75

tamanho da populao (estimao);

- 1)/ (para 0);

um valor maximizado por procedimento iterativo pela equao:

Вам также может понравиться