SPSS 2010

ESTATSTICA COMPUTACIONAL
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
Paulo R. Margotto
www.paulomargotto.com.br
pmargotto@gmail.com
Professor do Curso de Medicina da Escola Superior de Cincias da Sade
(ESCS)/SES/DF
I- INTRODUO
II- COMO CRIAR UM COMANDO DE DADOS
III- ESTATSTICAS DESCRITIVAS
-tipo de variveis
IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS
V- ESTATSTICA ANALTICA
-teste de hipteses
-tamanho da amostra
V-1-Teste t de Student
V-2- Anlise de Varincia
V-3- Qui-quadrado
V-4- Risco Relativo e Odds Ratio
VI- CORRELAO E REGRESO LINEAR SIMPLES
VII- REGRESSO LOGSTICA BINRIA
VIII-TESTES NO PARAMTRICOS
-teste de Kolmogorov-Smirnov e Shapiro-Wilk para testar normalidade
VIII-1- Teste U de Mann- Whitney
VIII-2-Teste T de Wilcoxon
VIII-3 Teste de Kruskal-Wallis
VIII-3- Teste de Friedman
VIII-4- Coeficiente de correlao de Spearman
IX-CURVA DE KAPLAN-MEIER
X-CURVA ROC
XI-REFERNCIAS BIBILIOGRFICAS
Braslia, 01 de julho de 2010
ESCOLA SUPERIOR DE CINCIAS DA SADE/SES/DF
ESTATSTICA COMPUTACIONAL
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
(utilizamos os conceitos de Wagner MB, Motta VT e Dornelles C em SPSS-Passo a Passo, Editora
da Universidade de Caxias do Sul, 2004., com exemplo na base de dados do estudo de Margotto PR e cl,
ainda no publcado sobre Uso do Corticosteride Pr-natal na Maternidade do Hospital Regional da
Asa Sul)
Torture os nmeros e eles admitiro qualquer coisa

Paulo R. Margotto
Professor do Curso de Medicina DA Escola superior de Cincias da Sade (ESCS)/SES/DF
Brasilia, 01 de janeiro de 2010
O SPPS um programa que executa anlises estatsticas , desde as simples estatsticas
descritivas (mdia, desvio-padro e tabelas de frequencias) a mtodos avanados (anlise de
variancia, modelos de regresso multivaravel e outros). O programa pode gerar tabelas e grficos
que resumem os dados.
I- INTRODUO
Como iniciar o SPSS
Ao clicar no programa (SPSS for Windows) ser aberta a janela SPSS for Windows,
contendo no centro, a Caixa de Dilogo (Fig.1)
Fig. 1-Janela SPSS for Windows com a Caixa de Dilogos

A partir desta caixa de dilogos, escolha o que voc deseja fazer e clicar em [OK].
-run the tutorial: iniciar o tutorial
-type in data: digitar os dados, criando assim um novo arquivo de dados
-run na existing query: importar dados a partir de uma base de dados
-open an existing data source: abrir um arquivo de dados j existentes
-open another type of file: abrir outro tipo de arquivo
Com o melhor conhecimento do programa podemos usar um maior nmero de opes que
esto disponveis por meio de acesso s janelas e aos menus do SPSS. Na barra de tarefas do SPSS
encontram-se os seguintes menus:
File: comanda todo o gerenciamento de arquivos (criar, abrir, ler, salvar e imprimir arquivos)
Edit: utilizado para copiar ou colar informaes, bem como apagar as informaes das clulas; a
opo option permite configurar as sadas do output (tamanho da fonte, bordas das tabelas,
definio do padro dos tipos de variveis)
View: possibilita a visualizao ou no de barras de ferramentas (Toolbars) e barra de estado
(Status Bar) nas janelas; ativa e desativa linhas de grade; mostra os tipos de fontes utilizadas;
estabelece a apresentao de rtulos de variveis e valores (variable and value labels)
Data: permite a definio de variveis, ordenar os dados segundo algum critrio escolhido, inserir
ou retirar observaes ou variveis, unir arquivos (merge files), criar subgrupos para anlise (split
file), selecionar casos especficos (select cases). As mudanas so temporrias, a no ser que sejam
salvas
Transform: cria novas variveis a partir das existentes, modifica dados e variveis por meio de
clculos. As mudanas so temporrias a no ser que sejam salvas.
Analyze: aqui encontramos os diversos procedimentos estatsticos realizados pelo SPSS
(regresso, anlises descritivas, testes de comparao). A cada nova verso do SPSS novos testes
so agregados, aumentando o alcance do SPSS.
Graphs: usado para criar e modificar grficos; h vrias opes de grficos, como barra, linha,
coluna, torta, histograma, disperso, etc, devendo ser escolhido aquele que melhor representa os
dados e as variveis em estudo. Um duplo clique no mouse sobre o objeto abrir a janela Chart
Editor, onde possvel modificar as fontes, cores, escalas e tamanho dos diversos elementos do
grfico.
Utilities: permite a obteno de informaes sobre as variveis e o banco de dados (opo
variables)
Window: mostra as janelas que esto em execuo no SPSS
Help: contem uma janela de ajuda que contem informaes como usar o SPSS
Mostra
denominaes
aos
valores de uma
atribudas
Vai at o
Insere
Descreve
Insere
II - COMO CRIAR UM BANCO DE DADOS
No SPSS os dados podem ser tanto digitados no teclado como lidos de um arquivo externo.
O formato do SPSS *.sav.Os dados no SPSS so digitados diretamente na janela Editor de
Dados (Data Editor), como numa planilha eletrnica .Assim possvel criar um arquivo no SPSS
(*.sav) (Figura 2) As variveis podem ser quantitativas (altura, peso), categricas (sexo), de data
9tipo calendrio) ou alfanumricas (letra).
Fig.2.Janela Editor de Dados (Data Editor)

Ao se criar um banco de dados, o primeiro passo definir as variveis, no Variable view
(visualizao das variveis). Na coluna Nome (Name), criar um nome para a varivel com o
mximo de 8 caracteres. Em Type definir se numrica, especificando o nmero de casos
decimais(Decimals). Se a varivel for categrica, especificar o nmero de caracteres que compem
o nome de cada categoria (Width). Na coluna Label (rtulo da varivel), voc pode digitar o nome
completo da varivel e ser este nome que vai aparecer na janela de output (resultados). Em Values
podem ser criados rtulos para as variveis. Os valores Missing (valores omissos) podem ser
representados por vazios na hora da digitao. Align determina o alinhamento da informao
dentro da clula. A coluna Measure classifica a varivel em escalar, ordinal ou nominal (veja
resumo na Tabela 1)).
Tabela 1. Opes nas definies das variveis (Wagner MB e cl, 2004)

Lembrar que cada coluna representa uma varivel e cada linha uma observao ou um
caso.
Seja o exemplo: digitar na primeira coluna o nome das variveis que esto apresentadas na Tabela
2
Sexo: (1)feminino; (2) masculino; peso em kg; altura em cm; glicemia em mg%
Tabela 2.Dados de cinco sujeitos de um estudo (Wagner MB e cl, 2004
Aps digitar cada varivel, pressionar Enter e o SPSS automaticamente assume o tipo de
varivel. No final, a tela Data Editor na opo Variable View, dever ficar como na Figura 3.
Figura 3. Visualizao da tela do Data Editor na opo Variable View para as variveis do
Exemplo 1 (Tabela 1)
5
A seguir, ir para o Data Editor na opo Data View para inserir os dados da Tabela 2. As
informaes devem ser digitadas conforme apresentadas na Figura 4.
Fig. 4.Opo Data View da janela Data Editor com os nomes das variveis no cabealho e os
dados do exemplo da Tabela 2
possvel corrigir os dados depois de inseridos na tabela, assim como apagar clulas.
possvel tambm inserir novos casos: escolher Data>Insert Cases, assim como inserir novas
variveis: escolher Data>Insert Variable.
Dependendo do interesse do pesquisador, novas variveis podem ser criadas a partir das j
existentes.Para isto, basta ir ao menu Transform e escolha o comando compute. Suponhamos que
queiramos inserir presso arterial (PA)(Figura 5);
Fig. 5.Seleo do comando Compute

Aps ter terminado a insero dos dados, salvar o arquivo clicando em File >Save
as...Escolha o diretrio no qual o arquivo deve ficar, nomeando-o. Veja na Figura 6.
Figura 6.Caixa de dilogo Save Data As
III- ESTATSTICAS DESCRITIVAS

Os dados referem-se a variveis que por sua vez podem ser qualitativas e
quantitativas. Varivel toda caracterstica ou condio que pode ser mensurada ou
observada.
Varivel qualitativa:
-nominal: diferentes categorias sem valores numricos. Os dados podem ser
distribudos em categorias mutuamente exclusivas. Exemplo: Sexo - permite distinguir
duas categorias, masculina e feminina; cor, causa de morte, grupo sangneo.
-ordinal: os dados podem ser distribudos em categorias mutuamente exclusivas que
tm ordenao natural. Exemplo: grau de instruo (as pessoas podem ser distribudas
em categorias mutuamente exclusivas, na seguinte ordem: primrio, 2 ano e superior),
aparncia, status social, estgio da doena
Varivel quantitativa ou contnua: os dados so expressos por nmeros. Exemplo:
idade, estatura, peso corporal.
-Discretas( associao entre valores e nmeros inteiros): idade em anos completos
-Contnua (pode assumir qualquer valor no subconjunto de nmeros reais): peso
A Estatstica Descritiva encarrega-se do levantamento, organizao, classificao e

descrio dos dados em tabelas, grficos ou outros recursos visuais, alm de parmetros
representativos destes dados.
Uma vez criada a base de dados, passamos agora a utilizar os procedimentos estatsticos.
Nestes exerccios vamos usar o arquivo corticosteride pre-natal.sav. Na janela SPSS DATA
Editor. Selecionar File>Open>Data. Aps localizar o arquivo, clicar em [Abrir].
No menu Analyze>Descriptive Statistics, encontram-se os comandos Frequencies,
Descriptive, Explores e Crosstabs.
III-1- Comando Frequencies

Este comando serve para obter tabelas de freqncias, tanto para variveis categricas
quanto quantitativas. Tambm podem ser obtidas estatsticas descritivas clssicas, como mdia,
desvio-padro, mnimo, mximo e outras.
No menu, escolha Analyze>Descriptive Statistics>Frequencies e teremos (Figura 7):
Fig. 7.Construo de Tabelas de Freqncias (observem a caixa de dilogo de Frequencies)

Na caixa de dilogo de Frequencies, selecione as variveis uso de corticide, uso do O 2
com 36 semanas de idade gestacional ps-concepo e tipo de parto e movam-nas para a caixa
8
Variable(s), clicando no boto []. importante que a opo Dispaly frequency tables esteja
marcada para a obteno da tabela de freqncias. Em seguida, pressionar [OK]. Vejam que as
variveis que enviamos para a direita, desaparece na esquerda. Ao mover a varivel da esquerda
para a direita, selecione-a e pressione [].
Na janela Ouput Viewer vamos ter uma tabela de freqncias para as variveis
selecionadas (Figura 8)
Frequencies
Frequency Table
Figura 8-Resultado da tabela de freqncias para as variveis solicitadas.

Observem que temos 219 recm-nascidos estudados, dos quais 52,5% das suas mes
receberam corticosteride pr-natal; 9,6% apresentaram dependncia de O2 com 36 semanas de
idade ps-concepo; o nascimento por cesariana ocorreu em 60,3%.
Para obter as estatsticas descritivas do comando Frequencies, selecionar as variveis
quantitativas peso, idade gestacional, altura e permetro ceflico de vida e mova-as para a esquerda
(que a caixa Variable(s). pressionando no boto [] (Figura 9).
Fig. 9. Seleo das variveis

A seguir pressionar[Statistics]: na caixa de dilogo Frequencies: Statistics escolha
Quartiles (quartis), Mean (mdia), Std Desviation (devio-padro), Minimum (mnimo), Mximum
(mximo) e S.E. mean (erro-padro mdia) e pressione [Continue] para voltar a caixa de dilogo
Frequencies (Figura 10).
Fig.10. Caixa de dilogo Frequencies:Statistics

Pressione [OK] e na janela output viewer vamos ter:, teremos (Figura 11 ).
Figura 11.Janela de Output Viewer com os resultados do comando Frequencies para as variveis
peso, idade gestacional, estatura e permetro ceflico.
Observem que houve 1 caso omisso para a estatura e 1 para o permetro ceflico..
Para identificar a simetria da varivel, h as seguintes formas
10
-relao entre mdia e desvio-padro: na imensa maioria dos casos, as variveis

simtricas que seguem a distribuio normal, o desvio padro menor do que a metade
da mdia (dp<mdia/2)
-mdia e mediana muito prximas ou diferena no mximo de uns 20% uma em
relao a outra para a varivel simtrica
-Testes de normalidade: Kolmogorov-Smirnov e Shapiro-Wilk (veja adiante)
O aparecimento de resultados muito pequenos ou muito grandes, o SPSS
chamada notao cientfica. Por exemplo, um erro-padro da mdia (Std. Error of
Mean) apresentado como 9.729E-03, est no
formato de notao cientfica: E-03
representa 10-3; assim o valor passa a ser 9,729 x103.

3-2- Comando Descriptive
Este comando mais usado para variveis quantitativas. No menu escolha
Analyze>Descriptive Statistics>Descriptives (Figura 12)
Fig.12. Passos para o Comando Descriptive

Na caixa de dilogo do comando Descriptives, selecionar as variveis peso
estatura e mov-las para a esquerda (caixa Variabe(s), tal como feito no comando
Frequencies (Figura 12)
11
Figura 12. Caixa de dilogo para seleo de variveis no comando Descriptive

A seguir pressionar [0ptions] e selecionar as estatsticas e as opes desejadas.
Neste comando j esto selecionadas previamente as estatsticas Mean (mdia), Std
.Desviation (desvio padro), Minimum (mnimo) e Mximum (mximo). Este comando
permite classificar os resultados segundo critrios de ordem de seleo, como ordem
crescente de mdias (Ascending means) (Figura 13).
Fig.13.Estatstica do Comando Descriptive
A seguir, pressionar [Continue] e em seguida, [OK]. Os resultados vo aparecer da

seguinte forma no Output viewer (Figura 14)
Fig. 14. Output viewer do comando Descriptives

3-3-Comando Explore
12
Este comando apresenta maiores opes de estatsticas descritivas, alm de dispor de testes
estatsticos para normalidade e grficos especiais. utilizado exclusivamente com variveis
quantitativas e permite comparar tipo de dados entre dois ou mais grupos. Podemos obter:
-medidas de tendncia central:mdia, moda, mediana
-medidas de disperso: desvio-padro, varincia, amplitude e quartis
-outliers: anlise de valores discrepantes
-testes especficos para avaliar a normalidade (Kolmogorov-Smirnov e Shapiro-Wilk
-boxplot
-medidas descritivas adicionais, como assimetria, curtose e outras
Como usar este comando: no menu Analyze Descriptive>Statistics>Explore
Exemplo: Na caixa de dilogo Explore, escolha a varivel que se pretende explorar,
colocando-a na lista de variveis dependentes (Dependent List). Na varivel classificatria (Factor
List) coloca-se, geralmente, uma varivel categrica. No nosso exemplo, vamos explorar a
varivel idade gestacional com o uso de corticosteride pr-natal (Figura 15)
Fig.15.Caixa de dilogo para seleo de variveis no comando Explore

Na opo Display, selecionar Both (ambos), para se obter tanto as medidas de sntese como
os grficos. Pressionar [Statistics] para abrir a caixa Explore: Statistics e escolha as opes de
medidas numricas de sntese (Fig.16).
Fig.16. Caixa de dilogo Statistics
13
A seguir, pressione [Continue] para retornar a caixa anterior. De volta caixa Explore,
clicar no boto [Plots] para abri a caixa Explore:Plots e selecionar Boxplot: Factor levels togheter
(os boxplot estaro juntos no mesmo grfico), Histogram (histograma ou grfico de barras) e
Normality plots with test (grficos e testes para normalidade da dependente) (Figura 17)
Fig.17.Caixa de dilogo Plots

Prosseguindo, pressionar o boto [Continue] para voltar caixa Explore. Nesta caixa, clicar
no boto [Continue]. Os resultados da anlise surgiro na janela Output Viewer(Figuras 18).O
comando Explorer produz uma tabela chamada Case Processem Somar que contm os casos
vlidos e omissos includos na anlise para a varivel Apgar trs no 5 minuto estratificada por uso
de corticosteride.
Fig.18.Output viewer do comando Explore
14
Observem que a Tabela Descriptives produz para cada um dos estratos da varivel
classificatria (idade gestacional) uma lista de estatsticas descritivas: mdia, intervalo de
confiana de 95% para a mdia, mdia aparada em 5% (mdia recalculada excluindo os 5% mais
extremos, ou seja, 2,5% inferiores e 2,5% superiores), o erro-padro da mdia, coeficientes de
assimetria e de curtose, que nos possibilita avaliar como os valores se distribuem.
Na Figura 19 temos a tabela Percentiis que mostra diferentes percentis para a varivel
idade gestacional nos dois grupos (que usou e o que no usou corticosteride pr-natal), segundo
dois mtodos distintos: weights average e Tukeys Hinges.
Fig.19. Output viewer do comando Explore

Tambm podemos obter o Extreme Value (valores extremos) para cada grupo (os 5 maiores
e os 5 menores)
A tabela Test of Normality mostra o resultado de dois testes de normalidade: KolmogorovSmirnov e o Shapiro-Wilk. Os dois testes testam a hiptese de que os dados apresentam uma
distribuio normal. No caso de amostras menores (<50 casos), o teste Shapiro-Wilk mais
poderoso. Um valor abaixo da significncia indica um desvio na distribuio dos dados em relao
Curva Normal(de preferncia deve estar abaixo de 0,05 ou mesmo 0,01) (Figura 20)
Fig.20. Output viewer do comando Explore

Observem que a varivel idade gestacional no segue uma distribuio normal (p(0.0001).
Tambm podemos obter o Extreme Value (valores extremos) para cada grupo (os 5 maiores
e os 5 menores).
O comando Explore produz ainda uma sequncia de grficos, como o histograma (equivale
representao grfica de uma tabela de freqncias) e o boxplot (caixa de bigodes). Quanto ao
boxplot: a representao em forma de grficos dos quartis da distribuio; apresenta, de forma
compacta, diversas informaes sobre um conjunto de dados. A caixa formada pela mediana
(linha central) e pelos quartis inferior e superior (percentis 25 e 75), que so obtidos pelos mtodos
Tukeys Hinges. A mediana d uma estimativa de tendncia central; a altura das caixas (percentil
75percentil 25 a amplitude interquartil (interquatile range) e estima a variabilidade dos dados. A
presena ou no de simetria dada pela posio da mediana (central ou mais prxima dos quartis).
As linhas verticais que saem da caixa so conhecidas como whiskers (bigodes de gato em
ingls).Nas sries assimtricas, os dados mximos e mnimos distanciam-se das hinges de Tukey
(percentil 75-percentil 25), sendo os seus valores assinalados separadamente no boxplot com um
pequeno crculo (outlines) e os valores que se distanciam substancialmente so considerados
extremos (extremes) e so assinalados com um asterisco (Figura 21).
15
Fig.21. Grfico Boxplot de idade gestacional e uso de corticosteride pr-natal

No observamos nenhum valor discrepante e extremo. Ao se detectar estes valores,
podemos retornar ao Data Editor para consultar o caso assinalado.
3-4- Comando Crosstabs Este comando est relacionado diretamente com a obteno
de testes estatsticos (qui-quadrado e exato de Fischer) e de medidas de fora de associao, que
sero estudados mais adiante (Estatstica Analtica). Antes, vejamos a Manipulao e Criao de
Novas Variveis
16
IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS

O SPSS disponibiliza o menu Transform para reclassificar variveis (categoria 1 e 2) e
para transformar uma varivel (por exemplo comprimento em metros para cm) ou criar nova
varivel a partir das existentes (por exemplo, a partir do peso, obter o ndice ponderal, que o
peso/comprimento ao cubo).(Figura 22)
Fig.22. Menu Transform em detalhe

Compute: realiza clculos; o SPSS disponibiliza mais de 70 funes matemticas (raiz
quadrada, logaritmo, coseno, etc)
Recode: reclassifica variveis, tanto quantitativas como categricas
Visual Bander: permite a criao de novas variveis com base no agrupamento de valores
contnuos de variveis existentes em categorias distintas)
Count: possibilita contar quantas vezes determinado valor aparece
Rank Cases: classifica as observaes em ordem crescente ou decrescente, obtendo assim
os ranks (postos)
Automatic recode: transforma automaticamente valores descontnuos e afastados entre si
em uma srie de valores numricos inteiros e contguos. til para transformar uma varivel
alfanumrica (string) em uma varivel numrica para poder ser utilizada em anlises estatsticas
que requerem categorias numricas
Create time series: cria variveis novas baseado em funes de variveis numricas de
sries temporais
Replace missing values: permite substituir os dados omissos (missing) por valores
numricos vlidos a serem usados em anlises estatsticas. Indicado quando a proporo de
omissos pequena (<10%) e quando a varivel quantitativa.
Randon Number Seed: gera nmeros pseudo-aleatrios, sendo possvel, assim, determinar
o ponto de partida para a gerao automtica destes nmeros pelo SPSS.
17
COMANDO COMPUTE|:
Vamos criar uma varivel a partir da existente, como: Calcular o ndice ponderal (IP=
peso/altura3).
-Na janela Data Editor, escolha: Transform> Compute e surgir( Figura 23):
Fig.23. Seleo do comando Compute

No campo Target Variable (Varivel destino), escrever o nome da varivel que ser
transformada. No exemplo ser criada a varivel IP (ndice ponderal). Digitar IP no campo Target
Variable; clicar a seguir na opo Type&Label e adicionar o rtulo (label) ndice ponderal.
Observe que o SPSS assume tratar-se de uma varivel numrica com duas casas decimais. A
seguir, desloque para o campo Numeric Expression as variveis envolvidas, usando [],
adicionando as operaes matemticas necessrias.; para a exponenciao use asterisco duplo
multiplicado 3 vezes por ela mesma, como na Figura 24.
Fig.24. Definio da expresso numrica

da nova varivel IP
Pressione [OK] e o resultado aparece imediatamente na janela Data Editor, como mostrado
na Figura 25:
18
Fig.25. Resultado do clculo da nova varivel IP

Havendo valores omissos em peso ou em altura, o SPSS coloca um . (ponto).
Output Viewer: uma vez executado um procedimento no SPSS, os resultados so
apresentados no Output Viewer, que um visualizador de resultados, estando colocados na ordem
em que foram realizados. Voc pode copiar a tabela clicando o boto direito do mouse e
selecionando copy e cole onde for necessrio.
Voc tambm pode manipular tabelas, como por exemplo, traduz-las. Para isto, basta ativar
o Pivot Table Editor, clicando o boto direito do mouse na tabela e assim, a tabela fica pronta para
ser editada na prpria janela Pivot Table Editor. Possibilita tambm uma viso e edio de uma
tabela larga e longa (Figura 26). Veja o exemplo a seguir:
Fig.26. Como ativar o Pivot Table Objet

Uma vez pressionado Open, teremos (Figura 27)
19
Fig27. Tabela a ser editada no Pivot Table

Como usar os Comandos Split e Select:
Estes comandos permitem obter resultados das anlises divididas em categorias, como
sexo masculino e feminino.
Comando Split
-Split : vejamos a estratificao da anlise usando uma varivel categrica, por exemplo,
sexo. Selecionar Data>Split>File (Figura 28).
Fig.28. Passos para o uso do Split
20
Uma vez aberta a caixa de dilogo Split File, marcar Compare groups e colocar a
varivel sexo na caixa Groups Based on e clicar [OK] (Figura 29).
Fig.29. Caixa de dilogo Split File

Selecionar agora Analyze>Descriptive Statistics.Descritives...Options (Mean, Std
Desviation, Minimum e Maximum)....variveis peso e altura (Figura 30). Observem que
os resultados na janela Output Viewer vo aparecer agrupados pela varivel sexo.
Fig.30.Caixa de dilogo Descriptives

Clicar em [OK] e no Output Viewer (Figura 31), vai aparecer
Fig.31. Resultados do comando Split File>Compare groups
21
Se no Split File voc marcar Organize output by groups, vamos ter os resultados de um
grupo e de outro grupo (Figura 32).
Fig.32. Caixa de dilogo Split Fire

Veja o resultado no Output Viewer (Figura 33).
Fig.33. Resultados do comando Split File>Organize output by group
Para retornar condio anterior, ou seja, anlises no agrupadas, selecione Data>Split

File e marcar Analyze all cases, do not reate grous e clicar [OK] (Figura 34).
22
Fig.34. Caixa de dilogo Split File

Comando Select
Este comando seleciona apenas uma categoria especfica dos casos de um arquivo
de dados. Escolher Data Select Cases, selecione a categoria a ser analisada, por
exemplo, da varivel categrica sexo, sero selecionados somente os casos do sexo
masculino (Figura 35)
Fig.35. Menu Data>Select Cases
23
Na caixa de dilogo Select Case, marcar IF conditions is satisfied e clicar em [IF]

(Figura 36).
Fig.36. Caixa de dilogo Select Cases

Agora, selecione a varivel sexo e usando os sinais no centro da caixa de dilogo, digite
a expresso condicional, clicando no centro da caixa de dilogo (Figura 37)
Fig.37. Caixa de dilogo Select Cases:IF

Clicar [Continue] e em seguida [OK].No Data Editor, os casos sexo=2 (feminino)
aparecem com um trao sobre o nmero indicador do caso na margem numerada. Estes
casos sero excludos da anlise (Figura 38).
24
Fig.38. Janela Data Editor com os casos no selecionados assinalados (observem a seta)
Ao utilizar o comando Select, o SPSS cria automaticamente uma varivel chamada
filter4, na ltima coluna e aparece tambm na barra de ferramentas.
Para restaurar os dados do arquivo, escolher Data>Select Case...All cases e clicar [OK]
(Figura 39).
Fig. 39.Caixa de dilogo Select Cases

Assim, os dados originais do arquivo voltam ao estado anterior, sendo usada toda
a amostra para a anlise. No fazendo isto, voc pode salvar os seus dados modificados
do original. Ento, para evitar, salvar sempre para outro arquivo ou voc poder vir a
perder o banco de dados original.
25
V-ESTATSTICA ANALTICA
A Estatstica Analtica trabalha com os dados de forma a estabelecer hipteses,
procede a sua comprovao e no final, elabora concluses cientficas
Teste de Hiptese e Tamanho da Amostra para melhor compreenso da significncia
estatstica
Teste de Hipteses
Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo
examinado apenas parte desta populao (amostra). Este processo chama-se de
inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos.
Para a compreenso de um teste estatstico preciso que entendamos o que vem
a ser Hiptese Nula (H0) e Hiptese Alternativa (H1).
Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo
com certos critrios, ser ou no rejeitada.
Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena
entre os grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do
fenmeno ou resultado observado.
Hiptese Alternativa ou experimental (H1): aquela que afirma que h
diferena entre os grupos estudados.
O principal objetivo de testar uma hiptese responder seguinte questo:
dadas duas amostras, so elas realmente diferentes ou pertencem a uma mesma
populao, ou em outras palavras, as diferenas encontradas entre duas ou mais
amostras so verdadeiras ou podem ser explicadas pelo acaso.
O processo de testar hiptese consiste em seis etapas:
1.
2.
3.
4.
5.
Estabelecer a H1 ( se l ag 1)
Estabelecer a H0 ( se l ag zero)
Determinar o tamanho da amostra
Colher os dados
Realizar teste estatstico para verificar a probabilidade
de que a H0 seja verdadeira
6. Rejeitar ou no a H0
Ao afastar a hiptese nula, estamos afirmando a validez da hiptese alternativa.
Todo experimento realizado para testar uma hiptese. O pesquisador formula
uma hiptese, observa, analisa e em seguida conclui. Aps observar, o pesquisador
descreve e mede.
Jamais atribuindo juzos de valor ao que est sendo visto, o pesquisador pode
decidir erroneamente e rejeitar a hiptese nula sendo ela verdadeira (Erro tipo I). Assim,
o pesquisador aceita como verdade uma diferena que na realidade no existe e que na
verdade, se deve variabilidade das amostras. Quando a hiptese H 0 falsa e o
26
pesquisador no a rejeita, dizemos que ele cometeu um Erro tipo II, significando que
existia, de fato, uma diferena que no foi reconhecida.
Assim:
Erro tipo I: rejeita a H0 sendo verdadeira (fato obtido por azar: rara
ocorrncia estatstica): erro alfa
Erro tipo II : aceita a H0 sendo falsa (erro mais freqente):erro beta
A probabilidade (p) de rejeitar a H 0 quando a H0 verdadeira, o que

chamamos de nvel de significncia do teste. O estatstico no sabe quando rejeita a
H0, se est ou no cometendo erro, mas sabe a probabilidade de cometer este tipo de
erro. Se a probabilidade for suficientemente pequena (<= 5%), a deciso de rejeitar a H 0
est bem fundamentada. O nvel de significncia representado pela letra grega (l-se
alfa). O nvel de significncia o nome com que se designa a probabilidade .
Vejamos o exemplo:
Feito um experimento com duas drogas (A, B), o pesquisador pergunta se a
droga A cura tanto quanto a droga B.
O estatstico v a pergunta do pesquisador como duas hipteses:
a) H0: a proporo de pacientes curados com a droga A igual proporo de
pacientes curados com a droga B
b) H1: a proporo de pacientes curados com a droga A diferente da proporo de
pacientes curados com a droga B.
Feitas as hipteses, o estatstico estabelece o nvel de significncia do teste. O

nvel de significncia seria a probabilidade (p) de afirmar que uma das drogas determina
maior proporo de curas, quando na verdade, a proporo de pacientes curados a
mesma, seja a droga A ou B. usual manter o nvel de significncia de 1% e 5%; um
de 5% (0.05) significa que cometemos um erro (tipo I) de 5% em rejeitar a H0 (sendo
verdadeira) e aceitar H1 (1 em cada 20 se comete o Erro tipo I ao rejeitar a H0). Um de
1% (0,01), significa que ao rejeitar a H0 e aceitar a H1, o risco de estarmos errando, ou
seja, cometendo um erro tipo I de 1%. O nvel de significncia representa a mxima
probabilidade de tolerar um erro tipo I.
O erro tipo I ocorre quando se acredita que existe um efeito verdadeiro na
populao e de fato no h. Usando o critrio de Fisher, a probabilidade de erro 0.05
(ou 5%) quando no existe efeito na populao. Segundo Fisher devemos somente
acreditar que o resultado verdadeiro quando tivermos 95% de confiana de que ele
ou quando houver somente 5% de chance de que os resultados possam ocorrer ao
acaso.
O oposto o erro tipo II que ocorre quando acredita-se que no exista um efeito
na populao, mas na realidade ele existe. O ideal que a probabilidade deste erro seja
bem pequena (se existe um efeito na populao importante que possamos detect-lo).
27
Cohen sugere que a probabilidade mxima aceitvel para um erro tipo II seria
0,2 (20%), definvel como beta (). Se tomarmos 100 amostras de dados da populao
na qual um efeito existe, vamos falhar em detectar este efeito em 20 destas amostras
(perderamos 1 em 5 dos efeitos verdadeiros).
Portanto, para fazer um erro tipo I no deve haver efeito na populao, enquanto
para fazer um erro tipo II vale o contrrio, ou seja, deve haver um efeito que perdemos.
A probabilidade de cometer um erro tipo I diminui a medida que a aumenta
probabilidade de cometer um erro tipo II.
Assim:
Os erros ocorrem ao testar hipteses por diferentes motivos:
-
Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto
menores forem; numa amostra maior, estas diferenas se diluiriam).
Erro tipo II: amostras pequenas
grande quantidade de amostras
Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa,
considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente
10 20%.
Tamanho da Amostra
conveniente planejar o tamanho da amostra para que se possa ter amostras
grandes o suficiente para detectar diferenas importantes. Por outro lado, amostras
exageradamente grande alm de elevar o custo do estudo, podem tornar diferenas
irrelevantes em estatisticamente significativas.
Para determinar o tamanho da amostra preciso estabelecer qual a diferena
deve ser considerada significativa. Esta uma deciso arbitrria do pesquisador,
baseada na experincia, na literatura e/ou na relevncia clnica.
Para determinar o tamanho da amostra, deve-se considerar o nvel de
significncia adequado: quanto de probabilidade aceitvel para que H0 seja verdadeira.
Geralmente considera-se uma probabilidade menor ou igual a 5% como adequada (p
0,05). Poder do teste: a probabilidade que um determinado teste ir encontrar um
efeito assumindo que um j existia; lembrem-se que corresponde probabilidade de
falha em detectar um efeito que realmente existe (erro tipo I). Assim, a probabilidade de
detectar um efeito, se um existe, deve ser o oposto da probabilidade de no detectar
aquele efeito, isto , 1-. Como j vimos, Cohen sugere que deveramos esperar uma
probabilidade de 0.2 na falha em detectar um efeito verdadeiro e assim, o nvel
corresponde do poder recomendado por ele foi de 1.0-0.2=0.8. Portanto o objetivo
alcanar um poder de 0,8 ou 80% de probabilidade de detectar um efeito se ele
realmente existe. Por exemplo, um poder de 80% significa que, se de fato houver
alguma diferena, haver uma probabilidade de 80% de detect-la.
Uma vez conhecido o valor de alfa e beta, podemos usar pesquisas anteriores ou
experimentos similares para estimar o tamanho do efeito que se espera detectar com um
experimento. Assim, podemos usar esse tanto de efeito estimado para calcular quantos
28
participantes necessitamos para detectar este efeito, com base nos valores de alfa e beta
que escolhemos.
Os clculos exatos so volumosos, devendo ser usados programas de
computador. Entre estes, citamos o G*Power (grtis) e o nQuery Adviser (pago), o
disponvel no Epiinfo e no Laboratrio der Epidemiologia e Estatstica.
Utilizando o site Lee - Laboratrio de Epidemiologia e
Estatstica, clicar em Pesquisa e entrar a seguinte caixa:
Clicar Clculo de tamanho de amostra
29
Prosseguindo com o exemplo, vamos clicar em Estudo de coorte (estudo de coorte:

comparao entre um grupo exposto a um fator de risco e outro grupo no exposto. Visa
verificar se indivduos expostos ao fator de risco desenvolvem a doena em questo, em
maior ou menor proporo, do que um grupo de indivduos no expostos) e teremos:
30
Explicaes:
Proporo de casos entre os expostos: equivale proporo de pessoas
expostas ao fator de risco que desenvolveram a doena
Proporo de casos entre os no expostos: equivale proporo de pessoas que no

foram expostas ao fator de risco, mas que desenvolveram a doena
Risco relativo: proporo de pessoas expostas ao fator de risco que desenvolveram a
doena sobre a proporo de pessoas no expostas que desenvolveram a doena. Vale 1
se as pessoas expostas e no expostas desenvolveram a doena na mesma proporo.
Nvel de significncia: indica a probabilidade de cometer um erro do tipo I, ou seja,
rejeitar a hiptese nula quando esta for verdadeira. Em outras palavras, a chance de
dizer que existe diferena entre as propores quando na realidade elas so iguais.
Poder do teste: indica a probabilidade de deciso correta baseada na hiptese
alternativa. Geralmente interpretado como a chance de detectar uma real diferena
entre as propores, ou seja, detectar a diferena se ela realmente existir.
Teste de hiptese:
teste monocaudal: teste cuja hiptese alternativa uma desigualdade. Em estudos de
coorte o teste monocaudal equivale ao teste em que o interesse saber se o risco relativo
maior ou menor que 1, ou seja, se a proporo de doentes maior (ou menor) entre os
expostos ao fator de risco.
teste bicaudal: teste cujo objetivo testar apenas se as propores so iguais ou
diferentes e no estabelecer qual delas maior ou menor. Em estudos de coorte o teste
bicaudal equivale ao teste em que o interesse saber somente se o risco relativo
diferente de 1, ou seja, se a chance de doena entre expostos e no expostos ao fator de
risco a mesma ou no.
31
Para calcularmos a mostra esperando uma incidncia de 10% de hemorragia

intraventricular no grupo com corticosteride e 20% no grupo sem corticosteride,
fazemos:
Clicar em envia e teremos:
Portanto, em um estudo de coorte de gestantes que usaram e no usaram

corticosteride no pr-natal, com um nvel de significncia de 5%, com um poder do
teste de 75%, para detectar uma diferena de proporo de 10% e 20% entre os grupos,
32
expostos e no expostos a corticoterapia, POSSIVELMENTE necessitaramos de 135

mes para cada grupo, num total de 270 gestantes.
No entanto, devemos ter em mente o que cita os autores do Laboratrio de
Epidemiologia e Estatstica citam: importante ressaltar que os clculos feitos aqui
devem servir apenas como orientao para o planejamento do estudo e no serem
tomados como deciso final.
Para fins prticos, segundo Cohen: participantes para detectar efeito mdio
(r=0.3), so necessrios 85 e para efeito grande (r=0,5), so necessrios 28; para efeito
pequeno (r-0,1), precisamos de 783.
-
Amostras grandes:
n > 100
Amostras mdias:
n > 30
Amostras pequenas:
n < 30
Amostras muito pequenas: n < 12
Lembrar que: quanto menor a diferena a ser detectada, maior dever ser o
tamanho da amostra; quando menor o nvel de significncia (p), maior deve ser o
tamanho da amostra.
A etapa seguinte consiste na coleta de dados, lembrando que maus dados levam
igualmente a ms concluses. Segundo Field, procedimentos estatsticos so uma forma
de processar nmeros e, portanto, se voc colocar baboseiras em uma anlise, mesmo
assim obter concluses com significado estatstico, mas que provavelmente no tero
sentido emprico (prtico). A estatstica no uma forma milagrosa, apenas um
recurso. Na determinao da verdade. Na anlise estatstica no existe um substituto
para o pensamento emprico.
Uma vez obtidos os dados, faz-se a anlise estatstica aplicando-se testes
escolhidos em funo do tipo de dados disponveis.
V-1-Teste t de Student
Este teste usado para avaliar a hiptese de que duas mdias so iguais ou no.
O valor do t calculado (tc) tanto maior quanto maior for a diferenas entre as mdias. O
nome deste teste refere-o ao pseudnimo usado por W.L. Gosset, uma vez que a
companhia na qual trabalhava (Guinnes Brewing Company) no permitiu publicar sua
pesquisa usando seu prprio nome e assim publicou com o nome Student.
importante para a aplicao do Teste t que a varivel em estudo tenha
distribuio normal ou aproximadamente normal.
O SPSS pode executar trs aplicaes do teste t em mdias: para uma amostra,
amostras independentes e amostras emparelhadas.
-para uma amostra: o objetivo verificar se a diferena entre o valor mdio,
que representamos por X obtido em uma amostra difere ou no significativamente da
populao referncia. Ou seja, testar se Ho: o = X onde o a mdia da populao
onde a amostra foi retirada. No se conhece o desvio padro () )da populao.
No menu SPSS, abrir os comandos File>Open>Data... e na e na caixa de
dilogo selecionar o arquivo corticosteride pr-natal.sav. importante verificar se a
33
distribuio dos dados segue uma distribuio normal (teste de Kolmogorov-Smirnov e

Shapiro-Wilk). Na janela Data Editor, selecionar Analyze>Compare means>One
Sample T-test (Figura 40).
Fig.40. Menu Analyze>Compare Mean>One-Sample T-test

-selecionar altura como Test Variable(s). -Em Test Value escreva o valor de 50 cm
(parmetro de referncia)(Figura 51)
Fig,51.Caixa de dilogo One-Sample T-test

-Clicar em [OK] e teremos na tela do Output Viewer (Figura 52).
T-test
34
Fig,52. Resultados da janela Output Viewer

Interpretao: Na tabela One-Sample temos o valor do teste t (-40,627) e a
significncia do teste (Sig. 0,0000 (p<0,001) que permite rejeitar a hiptese nula (H o)
para o nvel de significncia de alfa<=0,05. Podemos ento dizer que a amostra de 218
recm-nascidos estudados vem de uma populao cuja mdia diferente (neste caso
menor) do que 50 cm.
-amostras independentes: sero comparadas duas mdias; as variveis devem ter
distribuio normal.
-Selecionar Analyze>Compare Means>Independent-Samples T-test (Figura 53).
Figura 53.Menu Analyze>Compare Means>Independent-Samples T-test
-Selecionar a altura como Test Variable (s)

-Selecionar a varivel que vai definir o s grupos de casos (ex. sexo) como Grouping
Variable (varivel de agrupamento) (Figura 54).
35
Fig. 54. Caixa de dilogo Independent-Sample T-test

-Clicar em [Define Groups] para definirmos grupos (Figura 55)
Fig.55. Caixa de dilogo Independent Sample T-test

-Digite os valores correspondentes usados para a varivel sexo: 1 e 2
-Clique em [Continue] (Figura 56)
Fig.56. Caixa de dilogo Independent Sample T-test

-Clicar em [OK]. Na tela de sada do Output Viewer ser mostrado (Figura 57):
Group Statistics
36
Fig.57. Resultado do Test t para amostras independentes

Na tabela Independent Samples test, temos os resultados do teste estatstico
escolhido, calculado de duas formas distintas:
-Equal variances assumed (assumindo igualdade de varincias)
-Equal variances not assumed (assumindo que as varincias so desiguais)
Para decidirmos sobre quais destes resultados vamos utilizar, o SPSS
disponibiliza o teste de Levene que testa a hiptese de igualdade das varincias.
Se a significncia do teste for <=0.05: rejeita-se a igualdade das varincias; se a
significncia do teste for >0.05 , as varincias so iguais
No nosso exemplo, a significncia do teste de Levene foi 0,53 e assim usamos o
teste t para varincias iguais (Equal variances assumed). Neste caso, o valor do teste a
ser interpretado ser t=-0,624. Como a significncia maior que 0.05, no rejeitamos a
hiptese nula, ou seja, no h uma diferena estaticamente significativa entre as mdias
de peso dos RN submetidos a corticoterapia pr-natal em relao aos RN no
submetidos a corticoterapia pr-natal.
-Test t para amostras emparelhadas
s vezes os pesquisadores estudam os efeitos de um tratamento comparando-se:
-pares de indivduos (um gmeo recebe um tratamento e o outro, no).
-dois lados de um mesmo indivduo (aplicao de um tratamento para a
preveno de cries em um lado da arcada dentria e o outro lado sem tratamentocontrole).
-mesmo indivduo duas vezes (presso arterial antes e aps o tratamento em um
mesmo indivduo)
-diferenas entre as mdias das hemoglobina antes e depois da cirurgia
Ao usar o SPSS, temos que ter a certeza de que os dados foram digitados no
formato de duas variveis diferentes para cada caso.
No nosso banco de dados no temos amostras emparelhadas, ou seja, no temos
varivel de cada indivduo medida antes de depois de uma interveno. Citando o
exemplo de Wagner e cl: a diferena entre as mdias de hemoglobina antes e depois da
cirurgia so atribudas ao acaso? Importante: como so amostras emparelhadas,
necessrio que os dados sejam digitados no formato de duas variveis diferentes para
cada caso, como hb1 e hb2 (pr-operatrio e ps-operatrio).
-Selecione Analyze>Compare Means>Paired-Simples T-test (Figura 58)
37
Figura 58: Menu Analyze>Compare Means>Paired-Simples T-test

-Selecione as duas variveis emparelhadas e coloquem-nas no Paired Variables(s)
(Figura 59)
Fig.59. Caixa de dilogo Paired-Samples T-test

Clicar [OK] a seguir
A tabela do Output Viewer mostrar (Figura 58)
38
Fig. 58. Resultado do teste t para amostras emparelhadas

A tabela Paired Samples Correlations mostra o valor do coeficiente de correlao
de Pearson (vide adiante), assim como o valor da significncia para o coeficiente.
Devido as duas variveis representarem o mesmo grupo medido em momentos
diferentes (ou dois grupos emparelhados), o valor do coeficiente de correlao de
Pearson dever ser alto e o valor de significncia dever ser inferior a 0,05.
A tabela Paired Samples Test mostra diversas estatsticas, como mdia da
diferena entre os pares, desvio padro, erro padro da mdia, o valor do teste t,o
nmero dos graus de liberdade (df) e o valor da significncia do teste. A hiptese de que
no h diferena entre as hemoglobinas no pr e ps-operatrio (H o ) rejeitada, pois o
teste de significncia (2-tailed) <0,05) (Figura 59)
Paired Samples Test
Figura 59. Resultado do teste t para amostras emparelhadas
V-2.Anlise de Varincia, Teste F ou Teste de Tukey

At o presente momento discutimos formas de comparar dois grupos de pacientes
ou duas amostras. Muitas vezes torna-se necessrio comparar mdias de mais de duas
populaes.
Suponhamos que queiramos testar quatro drogas diferentes ao mesmo tempo
(quatro diurticos diferentes A,B,C,D) e que desejamos avaliar o efeito de cada uma das
drogas sobre o dbito urinrio em 16 voluntrios.
Para sabermos se os grupos so significativamente diferentes uns dos outros, se
algum dos diurticos testados tem um efeito diurtico importante, utilizando o teste t,
podemos comparar os grupos dois a dois, por meio de 6 testes t separados, o que poder
revelar uma diferena significativa entre os diurticos. Alm da perda de tempo com
este procedimento, poderamos estar incorrendo num erro tipo I, pois ao aceitar 5% de
erro em cada uma das 6 anlises separadas, haveria uma chance de 30% ( 6 x 5%) de
encontrar, por mero acaso, uma diferena estatisticamente significativa.
39
O uso da anlise da varincia (ANOVA: abreviao proposta por Tukey para

Analysis of Variance) indicar a probabilidade de que a hiptese nula seja verdadeira, ou
seja, probabilidade de que nenhuma diferena existe entre quaisquer dos grupos. Se a
hiptese nula (H0) for rejeitada, ser o indcio de que h diferena de potncia em algum
dos diurticos testados. Para localizar o diurtico envolvido, ser necessrio um teste
ANOVA de comparao de pares. Os testes de ANOVA se apiam na hiptese de que se
os grupos so semelhantes, a varincia em cada um (dentro) dos grupos semelhante
quela entre os grupos; o que estes fazem comparar a variabilidade das mdias de
todas as amostras com a variabilidade dentro das amostras.
Assim , o teste precisa determinar a variabilidade dentro de cada amostra, bem
como a variabilidade que existe entre mdias das amostras. Ao fazermos isto, geramos
uma estatstica chamada F, cuja frmula :
F=
estimao da varincia ENTRE os grupo

estimao da varincia DENTRO dos grupos
F: distribuio F de R.A Fischer; o F observado ao F crtico, rechaa a hiptese nula

de que no h diferena entre as varincias.
Lembrem-se sempre que:
H0 (hiptese nula): no h diferena entre os grupos

H1 (hiptese experimental) : h diferena entre os grupos
Com relao ao tipo de dados a ser introduzido no SPSS, a varivel dependente

dever ser quantitativa. A varivel independente (conhecida como Factor no
comando One-Way ANOVA : nico critrio de classificao), dever ser numrica
discreta (ou seja nmeros inteiros) na definio das categorias a serem comparadas.
As amostras devem ter uma distribuio normal (gaussiana); tambm assume a
igualdade de varincia entre os grupos das amostras a serem comparadas (o teste de
Levene verifica a homogeneidade de varincias).
Procedimento de anlise: Na janela Data Editor do SPSS, escolha:
Analyze>Compare Means> One-Way ANOVA (Figura 60)
40
Figura 60.Menu Analyze>Compare Means> One-Way ANOVA

Na caixa de dilogo One-Way ANOVA, colocar idade gestacional como
Dependente List e Apgar como Factor. A seguir, clicar em [Options] (Figura 61)
Fig.61. Caixa de dilogo One-Way ANOVA

Na caixa de dilogo One-Way ANOVA Options, selecionar Descriptives,
Homogeneity of variances, Means plot e Exclude cases analysis by analysis e em
seguida, clicar em [Continue] para voltar a janela anterior e finalize clicando em [OK]
(Figura 62)
Fig.62. Caixa de dilogo One-Way ANOVA: Options
41
Na janela Output Viewer, vai aparecer (Figura 63):
Fig. 63. Resultados do comando One-Way-ANOVA

Como interpretar? Esta primeira tabela mostra resultados de estatsticas
descritivas, como j vimos (nmero de observaes, mdia, desvio-padro, etc para
cada grupo e para o total de observaes.
A segunda tabela do Output Viewer mostra os resultados do teste de Levene (Figura 64):
Test of Homogeneity of Variances
Idade Gestacional
Levene
Statistic
1,390
df1
8
df2
209
Sig.
,203
Figura 64. Resultados do comando One-Way-ANOVA

Como o valor de sig. >0,05, aceita-se H o, que mostra a igualdade de varincias
entre os 10 grupos.
A ltima tabela corresponde tpica tabela de apresentao do teste de ANOVA (Figura
65).
ANOVA
Idade Gestacional
Between Groups
Within Groups
Sum
of
Squares
211,110
933,501
df
8
209
Total
1144,612
217
Mean Square
26,389
4,467
F
5,908
Sig.
,000
Fig.65. Resultados do comando One-Way-ANOVA

Nesta tabela vemos o nome da varivel dependente (Idade Gestacional), a soma
dos quadrados (Sum of Squares), quadrado mdios (Mean Square), Valor do teste de F
(F), a significncia (Sig) que representa a probabilidade de afastar (F obtido superior ou
igual ao F crtico) ou aceitar a Ho (F obtido inferior ao F crtico). Consulte Margotto,
Entendendo Bioestatstica Bsica (www.paulomargotto.com.br
em Entendendo
Bioestatstica Bsica). F crtico o valor de F encontrado nas tabelas dos valores de F.
A variao total dividida em dois componentes:
42
1-Between Groups (entre os grupos): significa variao das mdias dos quatro grupos
em torno da mdia geral para 95 observaes)
2-Within groups (dentro dos grupos): representa a variao das observaes individuais
em torno da mdia do respectivo grupo
Valores de significncia baixos indicam diferenas entre as mdias dos grupos.
Como a significncia foi 0,000 (valor de p<0,05), indica que h , pelo menos, uma
diferena entre os grupos analisados. Assim, rejeitamos a hiptese nula (a variabilidade
ENTRE os grupos foi suficientemente grande face variabilidade DENTRO dos
grupos). Portanto, podemos dizer que a idade gestacional mdia no igual entre os 10
grupos de Apgar no 5 minuto. No grfico das mdias para os 10 grupos de Apgar no 5
minuto, o grupo 3 (menor idade gestacional) destaca-se dos demais grupos (Figura 66).
Fig.66. Grfico das mdias para os 10 grupos de Apgar no 5 minuto. O grupo 3

destaca-se dos demais.
Testes de comparaes de mltiplas mdias

Na anlise de varincia, quando a diferena entre os grupos no significante,
no necessrio nenhum outro teste mais. No entanto havendo diferena significante
pelo F-teste, isto no quer dizer que todos os grupos difiram entre si. A ANOVA informa
somente se h ou no diferena estatisticamente significativa entre dois ou mais grupos,
mas no informa quais os grupos envolvidos. Vejam que aplicando a ANOVA no
exemplo que estamos estudando, as mdias dos 10 grupos no so estatisticamente
iguais. Mas qual ou quais so as mdias diferentes entre si?
Para identificar os grupos, deve-se realizar uma comparao entre os pares - pair
wise comparision test - que ir comparar cada grupo com cada um dos outros. Para
saber onde est a diferena, so necessrios testes de comparaes mltiplas de mdias
(Post Hoc).
Como
anteriormente,
escolha
na
janela
Analyze>Compare>Means>One-Way ANOVA.
43
Data
Editor
do
SPSS
Na caixa de dilogo One-Way ANOVA, alm das opes que foram escolhidas no
procedimento anterior, clicar n em [Post Hoc].
Fig.67. Caixa de dilogo do comando One-Way ANOVA

Na caixa de dilogo One-Way ANOVA: Pos Hoc, selecionar a opo Tukey e
clicar no boto [Continue] para voltar janela e em seguida, clicar [OK] (Figura 68).
Fig.68. Caixa de dilogo do comando One-Way ANOVA: Post Hoc Multiple

Comparisons
Alm das tabelas anteriores, surgira a tabela Post Hoc Multiple comparisons, onde se
encontram as comparaes entre as mdias dos dois grupos (Figura 69).
44
Fig.69. Resultados do comando One-Way ANOVA

-A coluna Mean diference mostra a diferena entre as mdias das amostras. As
diferenas significativas so mostradas com asteriscos (*).
45
-A coluna Sig mostra a significncia estatstica (p) para a diferena entre as mdias das
amostras (significante se p<0,05).
-A prxima coluna mostra os limites dos intervalos de confiana de 95% para as
diferenas entre as mdias das amostras.
Interpretao:Vejam que o Grupo 3 apresentou diferena significativa em relao
aos grupos 4,7 9 e 10, mas no em relao aos grupos 1 e 8.
Obtendo o grfico Boxplot como j vimos anteriormente (obtido com o comando
Explore,) d uma melhor viso do que o Means Plot, a distribuio da idade gestacional
no grupos de Apgar ao 5 minuto (Figura 70).Vejam:
Fig. 70.Grfico Boxplot de idade gestacional e Apgar no 5 minuto.
V-3.Qui-quadrado
46
A estatstica do qui-quadrado (Chi-square) adequada para variveis

qualitativas, com duas ou mais categorias, ou seja dados nominais (aqueles
distribudos em categorias nominais sem qualquer ordem, como sexo, raa, via de
parto,cor dos cabelos). A prova do qui-quadrado (X2) utilizada para comprovar se
existem diferenas estatisticamente significativas entre duas distribuies: mede o grau
de discrepncia entre um conjunto de freqncias observadas e um conjunto de
freqncias esperadas; o seu valor ser zero quando no houver diferena entre os
nmeros observados e os esperados.
O qui-quadrado quantifica a associao entre variveis qualitativas, comparando
as diferenas entre os valores observados e os esperados. Quanto maior for o valor da
estatstica X2, maior ser o grau de associao existente entre as duas variveis.
O qui-quadrado tambm pode ser usado para variveis quantitativas, uma vez
que possvel criar categorias para estas variveis, como, durao da internao,
categorizadas nas classes at 2 dias e mais de 2 dias.
Na aplicao do qui-quadrado, as freqncias tericas para cada casinha devem
ser iguais ou superiores a 5.
Como obter o qui-quadrado no SPSS: Analyze> Descritives> Crosstabs (Figura 71)
Fig.71. Menu Analyze> Descritives> Crosstabs
Na caixa de dilogo Crosstabs, selecionar uso sexo nas Row (s) (linhas) e uso
de corticosteride nas Column(s) (colunas) (Figura 72)
47
Fig.72. Caixa de dilogo do Crosstabs

Clicar em Cells e selecionar em Counts: Observed e em Percentages: Row (Figura 73)
Fig.73.Caixa de dilogo Crosstabs: Cell Display

Clicar [Continue]
Selecionar [Statistics] e selecionar Chi-Square, pressionar [Continue] (Figura 74)
48
Fig.74. Caixa de dilogo do Crosstabs:Statistics

Clicar [OK]
No Output Viewer sero mostradas a seguintes tabelas (Figura 75).
Fig.75.Resultados do teste do qui-quadrado utilizando o Crosstabs para o uso de

corticosteride pr-natal e sexo.
Podemos observar que no existe relao entre o uso de corticosteride no prnatal e sexo dos recm-nascidos, pois o valor do X2 pequeno (veja que o valor de p
-asymp.sig- maior que 0,05). Assim, so variveis independentes.
49
V-4- Risco Relativo e Odds Ratio

O Risco Relativo (RR) e Odds Ratio (OD) so medidas de fora de associao
(medidas de efeito), ou seja, medem a associao da varivel de desfecho com a
varivel de exposio: quanto da probabilidade de ocorrncia da varivel dependente
deve-se sua relao com a varivel independente. Os termos associao e efeito
referem-se ao fato de que uma varivel teria uma relao ou exerceria um efeito sobre
outra varivel. Como os resultados so decorrentes de uma razo, o valor de nulidade
para esses de 1 (um).
Selecionar Analyze>Descriptives Statistics>Crosstabs
Na caixa de dilogo do Crosstabs, selecionar PNIU (pneumonia) nas Column(s) (coluna
(s), e uso do corticosteride pr-natal nas Row (s) (linhas). Clicar em [Cells] e
selecionar Counts: Observed e Percentages: Row (Figura 76)
Fig.76. Caixa de dilogo Crosstabs: Statistics

Clicar [Continue]
Na caixa de dilogo Crosstabs, pressionar [Statistics]. Na caixa Crosstabs: Statistics
assinalar Chi-Square e Risk. Pressionar [Continue] (Figura 77)
50
Fig.77. Caixa de dilogo Crosstabs:Statistics

Clicar [OK]
No Output viewer teremos as tabelas. (Figura 78)
Fig.78.Resultados do X2
Interpretao: observamos que a pneumonia ocorreu significativamente menos nos
RN cujas mes receberam corticosteride pr-natal (OR: 0,31, com intervalo de
confiana de 0,12-0,77)ou seja, houve diminuio da pneumonia intra-uterina em 69%
(1-0,31=0,69 x 100= 69%) nos RN expostos ao corticosteride pr-natal em relao aos
RN no expostos e a estimativa da variabilidade foi de 23% a 88% (1-0,77=0,23 x
51
100=23% e 1-0,12=0,88 x 100= 88%). Esta associao significativa por no conter a

unidade no intervalo de confiana. Observe da significncia no Pearson Chi-Square em
Asymp.Sig (2-sided) que foi de 0,009
O Risco Relativo (RR) a medida da fora da associao entre a exposio e o
evento (resultado). A razo das chances (odds ratio - OR) definida como a
probabilidade de que um evento ocorra dividido pela probabilidade de que ele no
ocorra, ou seja o quociente entre a quantidade de eventos e a quantidade livre de
eventos (o mesmo modo que o RR avalia-se a variabilidade amostral da OR atravs do
clculo do intervalo de confiana e a interpretao a mesma do RR, ou seja, se o
intervalo de confiana da OR contiver a unidade, significa ausncia de associao). A
OR pode ser estimada em estudo tipo coorte (populao seguida da causa para o efeito)
e em estudo tipo caso- controle (populao seguida do efeito para causa). J o RR s
pode estimado em estudos tipo coorte e no em estudos tipo caso-controle, porque este
tipo de estudo no permite estimativa da taxa populacional do evento nos grupos
estudados.
Quando o RR ou a OR igual a 1, significa que no h efeito com o tratamento,
ou seja, o efeito do tratamento o mesmo nos dois grupos. Se o RR/OR < 1, significa
que o risco do evento menor no grupo tratado que no controle. A variabilidade
amostral do estudo pode ser avaliada atravs de testes de significncia ou via intervalo
de confiana. Aqui daremos preferncia segunda abordagem. Para um dado nvel de
significncia (p<= 0,05), o intervalo de confiana representa o intervalo onde deve estar
o parmetro, ou seja, o risco relativo verdadeiro. Se o valor 1, que se refere nulidade
da associao, no estiver contido no intervalo, temos uma confiana que na populao
de onde nossa amostra foi extrada, o RR diferente de 1, sendo, portanto significativo
o achado da amostra. Para a realizao dos clculos do risco relativo e o intervalo de
95% de confiana, assim como o seu significado, consulte www.paulomargotto.com.br,
em Entendendo Bioestatstica e Exerccio da Medicina Baseado em Evidncias.
O intervalo de confiana mostra o limite dentro do qual existe a certeza do
verdadeiro efeito do tratamento; estima a magnitude da associao e informa a
variabilidade da estimativa, atravs dos limites inferior e superior.
O site a seguir fornece Programa de Clculos Estatsticos, com Risco Relativo,
Odds Ratio e Teste Diagnstico.
Estatistica
Vejamos um exemplo: Uso de drogas na Sala de Parto e Uso do corticosteride pr-natal
52
Digite APENAS nas caselas de cor laranja e NUNCA nas caselas azuis.
Juntamente com o resultado da odds ratio temos o intervalo de confiana. Interpretao:
houve diminuio do uso de drogas na sala de parto em 48% (1-0,52=0,48 x 100) no
grupo do corticosteride, porm no foi significativo, pois no intervalo de confiana
contem a unidade.
Voc pode tambm usar este site para realizar clculos estatsticos em Testes
Diagnsticos, obtendo a sensibilidade, especificidade, valor preditivo positivo e o valor
preditivo negativo, alm de poder obter a Estatstica Kappa, descrita por Cohen, o
chamado ndice Kappa para avaliar o grau de acerto do procedimento, ou seja, para
avaliar o quanto o resultado do procedimento escapa do azar. Temos usado a seguinte
escala de interpretao:
0,75 - 1: muito bom; 0,4< 0,74: regular a bom; 0,35: ruim (o diagnstico
no explicado pelo procedimento e sim pelo azar em 95% das vezes). Vejamos um
exemplo:
importante conhecer o intervalo de confiana a 95% do ndice Kappa para dar-lhe mais peso
ao resultado achado. A significncia dar-se- pela ausncia da unidade no intervalo de confiana
VI-CORRELAO E REGRESSO LINEAR SIMPLES

O termo correlao descreve a associao entre duas variveis numricas
(quantitativas); quantifica a fora da associao entre estas duas variveis. No
53
exemplo, peso e altura, em quanto aumenta o peso medida que a estatura aumenta? O
comportamento conjunto de duas variveis quantitativas pode ser observado atravs de
um grfico denominado Diagrama de Disperso e medido atravs do Coeficiente de
correlao.
Diagrama de Disperso:
Na representao grfica, importante sempre colocar no eixo das abscissas
(horizontal) a varivel independente ou explanatria ou preditora (X) e no eixo das
ordenadas (vertical), a varivel dependente ou desfecho. A correlao quantifica quo
bem X e Y variam em conjunto
Correlao linear de Pearson
O coeficiente de correlao (r de Pearson) expressa quantitativamente as
relaes entre duas variveis. um nmero puro, usado para classificar a correlao
em: r = 1: perfeita; r = 0,80 - <1: muito alta; r = 0.60 - <0,80: alta; r = 0.40 - <60:
moderada; r = 0,20 - <0.40: baixa; r = 0 - <0.20 muito baixa; r = 0: nula forte. O
coeficiente de correlao um ndice de magnitude na qual se associam duas variveis.
Antes de se realizar uma anlise de correlao, devemos fazer um grfico de
disperso (Scatterplot) para a verificao do comportamento das variveis.
No menu Graphs, selecionar Scatter (Figura 79).
Fig.79. Menu Graphs>Scatter

Na caixa de dilogo com representaes grficas para Scatterplot, escolher
Simple (Figura 80).
54
Fig.80. Caixa de dilogo Scatterplot

Na janela Simple Scatterplot, colocar no Y Axis (eixo Y) a varivel peso e no X Axis
(eixo X) a varivel altura e clicar [OK] (Figura 81)
Fig.81. Caixa de dilogo Simple Scatterplot

Na janela Output Viewer vai aparecer a seguinte figura (Figura 82)
55
Fig.82. Resultado do Scatterplot para as variveis peso e estatura

Dando um clik duplo com o mouse sobre o grfico, ser aberta a janela Chart
Editor, podendo assim ser editado o grfico. Selecionar Elements e Ft Line at
total(Figura 83).
Fig.83. Janela Chart Editor

Assim ser possvel a colocao da reta de regresso representando a associao
linear entre as duas variveis(Figura 84).
Reta de
Regresso
56
r2
Fig.84. Scatterplot com a reta de regresso, representando a associao linear entre as

duas variveis
Observe que no canto direto do grfico aparece o R sq Linear, que representa o
coeficiente de Pearson ao quadrado (r2) (veja mais adiante)
Aps a avaliao do Scatterplot, solicita-se a anlise de correlao propriamente
dita: Analyze>Correlate>Bivariate e ser aberta a caixa de dilogo Bivariate
Correlations (Figura 85).
Fig.85. Menu Analyze>Correlate>Bivariate
Selecionar peso e estatura e transferir para a caixa Variables. As opes Pearson e

Two-tailed so selecionadas como padro (Figura 86)
57
Fig.86.Caixa de dilogo Bivariate Correlations onde se obtm o coeficiente de

correlao de Pearson
A seguir, clicar [OK]. Na janela do Output Viewer ser apresentada uma matriz
simtrica com o coeficiente de correlao de Pearson, alm do valor da significncia e
o nmero de casos vlidos (Correlations) (Figura 87)
Fig. 87.Resultado do clculo do coeficiente de correlao linear de Pearson com a sua

significncia
Assim, vemos que h uma correlao significativa (veja o Sig. (2-tailed:<0.05)
entre estatura e peso 0,44.
Regresso linear simples
Como vimos, a correlao indica o grau de associao entre duas variveis, ao
passo que a regresso diz respeito capacidade de prever um valor baseado no
conhecimento do outro (de prever Y dado que X seja conhecido). A regresso tem como
objetivo quantificar o efeito do X sobre o Y. O conceito de regresso deve-se a Galton e
consiste em aproximar uma linha reta (reta de regresso) de uma nuvem de pontos de
um diagrama de disperso, ou seja, representa mediante uma reta a nuvem de pontos.
58
O conceito de linearidade refere-se ao fato de que a relao entre duas variveis

possa ser representada mediante uma funo linear, ou seja, o incremento de uma
varivel produz o mesmo na outra varivel, de forma linear e constante
Quando a anlise de regresso linear envolve somente uma varivel explanatria
(X), a tcnica denominada Regresso Linear Simples. Quando so envolvidas duas
ou mais variveis explicativas, emprega-se a expresso Regresso Linear Mltipla.
A seguir vamos realizar uma regresso simples com peso como varivel
dependente e a estatura como varivel independente (a que explica).
Analyze>Regression>Linear. Vai aparecer a caixa de dilogo de regresso linear.
Escolha o peso como varivel dependente e a estatura como varivel independente
(Figura 88)
Fig.88. Caixa de dilogo Linear Regression

Clicar em [Statistics] e selecionar Estimates, Model Fit, R squared chance e
Descriptives (Figura 89).
Fig.89. Caixa de dilogo Linear Regression: Statistics

Clicar [Continue] e em seguida, [OK]. Na janela do Output Viewer ser mostrado
(Figura 90)
59
Fig.90.Output viewer da anlise de regresso linear simples

Como j descrevemos existe uma correlao entre peso e estatura (r=0.44), ou
seja certa proporo da variabilidade do peso pode ser explicada pelo estatura. No
havendo correlao entre duas variveis, dizemos que elas so variveis independentes.
Na tabela Model Summary, vemos o r Squared (r2) igual a 0,193. O r2 conhecido
60
como coeficiente de determinao (deve ser interpretado como a proporo da variao

total que explicada) e estima que 19,3% (0,19) da variabilidade do peso explicada
pela estatura (tal como mostramos o grfico com a reta de regresso obtida no Chart
Editor, selecionando Elements e Ft Line at total(consulte a Figura 84).
J o Coeficiente de Alienao calculado 1- r2, sendo interpretado como a
proporo da variabilidade de Y que no explicada pela variabilidade de X. No
presente exemplo, 80,7% do peso no explicada pela altura do recm-nascido.
Na tabela Coefficients, temos o coeficiente de regresso linear de estatura
(Unstandardized Coefficients:B), indicando que para cada modificao de unidade de
estatura, o peso modifica-se em 38,4g
Correlao Parcial
A correlao parcial consiste na relao existente entre duas variveis,
eliminando a influncia de outras. No exemplo anterior, vamos controlar a idade
gestacional.
Analyze>Correlate>Partial (Figura 91)
Fig.91.Menu Analyze>Correlate>Partial
Na caixa de dilogo Partial Correlations, escolhemos controlar (Controlling for)
a idade gestacional. Clicar em [OK] (Figura 92).
61
Fig.92. Caixa de dilogo Partial Correlations

A janela do Output Viewer mostrar (Figura 93):
Fig.93. Output da anlise de Partial Correlations

Podemos ver que a correlao entre a estatura e o peso continua significativa
(p<0,001) e a correlao de 0,39. O r 2 (coeficiente de determinao) de 0,15 (a
estatura explica a variabilidade do peso do RN em 15%, quando controlamos a idade
gestacional).
Havendo vrios previsores, estaremos realizando uma Regresso Mltipla (esta
uma extenso lgica dos princpios da regresso linear simples quando h vrios
previsores). J a Regresso Logstica, que veremos a seguir, uma regresso mltipla,
mas com uma varivel de sada categrica dicotmica (dependente) e variveis
previsoras (explicativas ou independentes) contnuas ou categricas. Assim podemos
prever a qual de duas categorias provvel que esta varivel pertena, dada certas
informaes. Quando a varivel de sada dicotmica (como sim/no), no podemos
usar a regresso linear a despeito da semelhana entre a regresso linear e a logstica.
Para uma regresso linear se vlida, os dados observados devem ter uma relacionamento
linear. Quando a varivel de sada dicotmica, esta hiptese normalmente violada.
Atravs de uma transformao logartmica voc pode contornar este problema,
mantendo a forma do relacionamento linear enquanto o prprio relacionamento em si
no linear.
VII - REGRESO LOGSTICA BINRIA: Noes bsicas

A regresso logstica vem sendo utilizada em diversas reas. Este mtodo, tal
como as regresses linear e mltipla, estuda a relao entre uma varivel resposta e uma
62
ou mais variveis independentes. A diferena entre estas tcnicas de regresso se deve

ao fato de que na regresso logstica as variveis dependentes esto dispostas em
categorias (sim/no/alto/baixo/bom/ruim), enquanto na regresso linear estas variveis
so contnuas. A resposta na regresso logstica expressa por meio de uma
probabilidade de ocorrncia, enquanto na regresso simples, obtm-se um valor
numrico. Portanto, a regresso logstica binria apresenta-se como um mtodo na
determinao da probabilidade de ocorrncia dos valores preditos de uma varivel
dicotmica.Na regresso logstica as variveis independentes podem ser tanto fatores
quanto covariantes (dados contnuos) e as variveis dependentes podero estar dispostas
em duas ou mais categorias. Assim, temos a Regresso Logstica Binria (duas
categorias), Ordinria e Nominal. A escolha de qual mtodo a ser utilizado depende do
nmero de categorias e das caractersticas da varivel resposta. Veja a tabela 3, a seguir:
Tabela 3: Tipos de varivel resposta (Penha RN, 2002)
Uma varivel binria aquela que aceita apenas dois nveis de resposta, como
sim ou no. J uma varivel ordinria segue uma ordenao natural das coisas, como
pequeno, mdio e grande ou classificao como ruim, bom ou excelente. A varivel
nominal tem mais de trs nveis sem nenhuma ordenao (objeto azul, preto, amarelo e
vermelho ou na previso do tempo, ensolarado, nublado, chuvoso).
No exemplo a seguir vamos realizar uma Regresso Logstica Binria
utilizando o SPSS. No exemplo, a varivel resposta ser a ocorrncia de Apgar<= 3 no
5 minuto (sim ou no), caracterizando uma varivel binria. As variveis independentes
escolhidas foram aquelas que se associaram individualmente ao Apgar <=3 no 5
minuto: corticide, hipertenso materna, tipo de parto e pr-natal.
Analyze>Regression>Binary Logistic (Figura 94)
Fig.9
4. Menu Analyze>Regression>Binary Logistic
Na caixa de dilogo Logistic Regression, selecionamos apgar5minmenor3
(Apgar <=3: sim e >3: no no 5 minuto) como varivel dependente (binria),que
varivel de sada e corticosteride pr-natal (cortico), hipertenso, parto e pr-natal em
Covariates (covariveis), que sero as variveis previsoras. Clicar em Options e
selecionar Cl for exp(B(Figura 95)
63
Fig. 95 Caixa de dilogo principal da regresso logstica

Como na regresso mltipla, existem vrios mtodos diferentes que podem ser
utilizados na regresso logstica. Selecionar o mtodo clicando na seta que aponta para
baixo prximo ao quadro denominado em [Method]. Optamos por Enter (Figura 96)
Fig.96. Mtodos de regresso

Neste nosso exemplo, existem 3 variveis independentes (previsoras) categricas
que so o parto (cesrea ou normal), hipertenso (sim ou no) e corticosteride (sim ou
no). Uma das qualidades da regresso logstica que ela aceita previsores categricos.
Assim, necessrio indicar ao SPSS quais variveis so categricas, clicando em
[Categorical] na caixa de dilogo da regresso logstica para ativar uma nova caixa de
dilogo Define Categorical Variables e envie para a direita a varivel categrica
cortico, como est na Figura 97.A seguir pressione [Continue].
64
Fig.97. Definindo as variveis categricas na regresso logstica

Retornando a Caixa de dilogo principal da regresso logstica, pressionar
[Save] e selecionar toas as opes disponveis, como mostra a Figura 98. O exame dos
resduos extremamente importante para verificar a qualidade do ajuste do modelo aos
dados observados.
Fig 98. Caixa de dilogo para a determinao de resduos de regresso.

A seguir, na caixa de dilogo principal da regresso logstica, clicar em
[Options]. (Figura 99). Em geral as opes padres so suficientes. Nesta caixa de
dilogo voc pode solicitar ao SPSS que apresente um intervalo de confiana para a
estatstica exp b. Voc tambm pode solicitar a estatstica de aderncia de HosmerLemeshow que pode ser utilizada para avaliar quo bem o modelo escolhido se ajusta
aos dados,comparando as freqncias observadas e as esperadas. Pressionar [Continue]
para retornar a caixa de dilogo principal da regresso logstica
65
Fig. 99. Caixa de dilogo para as opes da regresso logstica

Pressionar [Continue] para retornar a caixa de dilogo principal da regresso logstica e
seguir, clicar em [OK]) e o Output Viewer mostrar (Figura 100-1 e 100-2)
-codificao da varivel dependente
codificao das variveis previsoras
Fig.100-1. Output viewer da regresso logstica

A ltima linha desta tabela apresenta a estatstica qui-quadrado dos resduos
como 14,019 que significante (p<0,05) ( chamada de Overal Statistics-estatstica
global). Esta estatstica informa que os coeficientes para as variveis que no esto no
modelo so significativamente diferentes de zero, ou seja, que a adio de uma ou mais
destas variveis ao modelo ir afetar significativamente o seu modelo de previso; se o
p fosse >0.05, isto significaria que nenhuma das variveis excludas do modelo
contribuiria de forma significativa para o poder preditivo do modelo e assim, a anlise
terminaria neste estgio.
A coluna Score mostra o valor da estatstica do escore eficiente de Roa.
Observem que a hipertenso, seguida pelo corticosteride e o tipo de parto apresentam
maior escore eficiente de Roa significativos.
Estimativa dos coeficientes dos previsores includos no modelo: fornece os coeficientes
e estatsticas para as variveis que foram includas no modelo:
66
Fig.100-2.Output viewer da regresso logstica: estimativa dos coeficientes dos

previsores
Uma estatstica importante a estatstica de Wald que tem uma distribuio quiquadrado e nos informa se o coeficiente b para um dado previsor difere
significativamente de zero. Se isto ocorrer, podemos dizer que o previsor est
contribuindo de modo significativo para a previso da sada. Assim , com relao a
estes dados, podemos dizer que o uso do corticosteride pr-natal um previsor
significativo para a no ocorrncia de Apgar <= 3 e que a hipertenso materna
representa um fator de risco. A exp b(Exp (b) interpretada como uma mudana nas
chances: se o valor for maior que 1, ele indica que medida que o previsor aumenta,
aumentam as chances de uma sada ocorrer; j um valor menor que 1, indica que
medida que o previsor aumenta, as chances de uma sada ocorrer diminuem. Neste
exemplo, podemos afirmar que as chances do RN cuja me recebeu esteride pr-natal
de apresentar um Apgar < =3 reduziu em 57,3% (Exp (B) de 0,427: 1- 0,427=0,573 x
100= 57,3%) em relao ao RN no exposto ao esteride pr-natal. J a hipertenso
materna constituiu um fator de risco, aumentando em 2,3 vezes mais o risco de do RN
cuja me teve hipertenso de apresentar um Apgar <= 3 em relao ao RN cuja me
no teve hipertenso. Observe que no intervalo de confiana de ambas variveis
previsora includas no modelo NO contm a unidade).
Vejamos a interpretao de outro exemplo: Regresso logstica para a Sepse. As
variveis individualmente associadas significativamente com a sepse (corticoide, Apgar
no 1 minuto, Apgar no 5 minuto, reanimao, uso do CFR, necessidade de intubao,
uso de drogas para a reanimao, Apgar <=3 no 5 minuto) entraram no modelo de
regresso logstica. Aps realizar os passos anteriormente explicados, obtemos as
estimativa dos coeficientes dos previsores includos no modelo (Figura 101)
Fig.101. Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
Como interpretar: A regresso logstica binria apresenta-se um mtodo para
determinar a probabilidade de ocorrncia dos valores preditos de uma varivel
dicotmica. A apresentao tem como componentes chaves o P-value, o valor dos
coeficientes e as odds ratio (Exp (B). A interpretao dos resultados est focalizada
nestes componentes. Assim, vejam que as duas variveis que permaneceram no modelo
foram o corticosteride pr-natal (Exp(B) de 0,545 (Odds ratio ajustada), que traduz
uma diminuio da sepse nos RN expostos ao esteride pr-natal de 46% (1-0,545=0,46
67
x100=46%) e a Intubao que constituiu um fator de risco (aumento de 2,78 vezes a

sepse nos RN intubados em relao aos no intubados).
Veja outro exemplo da aplicao da regresso logstica: o estudo de Whelan B
et al avaliou a o sdio srico como um fator de risco para a mortalidade intrahospitalar
em pacientes grave admisso. A Odds ratio para a morte dentro de 30 dias da
admisso foi de 4,07 (IC a 95%%: 2,95-5,63) quando o paciente apresentava
hipernatremia e 3,36 (IC a 95% de 2,59-4,36) quando apresentava hiponatremia. A
regresso logstica foi usada para calcular a Odds ratio ajustada: fatores que foram
includos neste ajuste foram o escore de severidade da doena, permanncia na UTI,
efeito da idade, sexo, transfuso de sangue e sepse. Aps o ajuste, para hipernatremia, a
Odds ratio (ajustada) para a morte passou para 1,41 (Intervalo de confiana de 0,972,07: no alcanou a significncia, pois no intervalo de confiana contm a unidade) e a
Odds ratio (ajustada) para hiponatremia passou para 2,00 (Intervalo de confiana a
95% de 1,44-2,77, ou seja, foi menor, porm continuou significativa, pois no intervalo
de confiana no contm a unidade). Assim, o sdio srico um poderoso marcador
inicial para a mortalidade, mas a mortalidade no grupo hipernatrmico primariamente
um fator de severidade da doena. J para a hiponatremia o aumento da mortalidade
independente de outras variveis. Portanto, os dados deste estudo nos informam que o
sdio srico na admisso um importante determinante da mortalidade intrahospitalar
em todos os pacientes. O sdio na admisso pode ser usado para estratificar os pacientes
que vo necessitar de uma terapia mais agressiva e maior monitorizao e em particular
a hiponatremia que necessita de tratamento cuidadoso para evitar um excesso de
mortalidade que independentemente associada com anormalidade deste distrbio.
Quanto multicolinearidade, apenas a ttulo de informao: a
multicolinearidade existe quando observamos uma forte correlao entre dois ou mais
previsores (variveis explicativas) em um modelo de regresso; este fato dificulta a
avaliao da importncia individual de um previsor (se ambos previsores so altamente
correlacionados e cada um responsvel por uma varincia similar dos resultados,
como vamos poder dizer qual entre as duas variveis a mais importante? Na verdade
no podemos dizer, pois o modelo pode incluir qualquer uma delas de forma
intercambivel. Na regresso mltipla, o SPSS produz vrios diagnsticos de
colinearidade, entre eles o VIF (Fator de Inflao da Varincia). O FIV indica se um
previsor tem um relacionamento linear forte com outro(s) previsor (es): um valor acima
de 10 leva-nos a preocupao. Tal preocupao da colinearidade com a regresso
mltipla, ocorre tambm com a regresso logstica., sendo ento essencial testar a
colinearidade numa anlise de regresso logstica. Como o SPSS no tem opo para
fazer um diagnstico de colinearidade na regresso logstica, podemos obter estatsticas
tais como as de tolerncia (Valor menor que 0,1 indica um problema srio de
colinearidade) e VIF simplesmente executando uma anlise de regresso linear
utilizando as mesmas variveis de sada e os mesmos previsores. Em Analyze
>Regression>Linear. Clicar em Statistics e depois selecione Colinearity diagnostics
(diagnstico de colinearidade) e desmarque todas as opes padres e clicar em
[Continue] para volta caixa de regresso linear e pressionar [OK]. No Output viewer
(sada do SPSS), vamos ter a Tolerance (tolerncia) e a VIF.(Consultem as Figuras 105
a,b c).Vejamos um exemplo: aps identificar as variveis associadas individualmente
com o bito,realizamos uma regresso logstica e no modelo, as variveis que
persistiram foram a ventilao mecnica e o tipo de parto ( tanto a ventilao mecnica
como o parto normal aumentaram significativamente o bito:OR de 5,63, com IC a 95%
68
de 2,37-13,37 e OR de 2,22 com IC a 95% de 1,02-4,85). Vejamos a colinearidade da

regresso logstica que realizamos entre Ventilao Mecnica e Tipo de Parto
Fig. 101a: Caixa de dilogo para a regresso linear para os dados de bito
Fig. 101b: Caixa de dilogo para a Statistics da regresso linear selecionando Colinearity diagnostics
Fig. 101c: Output viewer do diagnstico de colinearidade para os dados do bito

Como podemos observar podemos concluir com segurana que no existe colinearidade
entre as variveis previsoras, uma vez que a tolerncia (Tolerance) e o Fator de Inflao da
Varincia (VIF) das variveis previsoras so >0,1 e <10, respectivamente. Assim, o segundo
previsor tem uma probabilidade maior de ser responsvel por uma varincia dos resultados do
que quando existia um nico previsor.
VIII- TESTES NO PARAMTRICOS

Os estatsticos escolhem um teste paramtrico (a maioria dos testes de hipteses
vistos anteriormente) quando esto seguros de que a distribuio normal no foi violada
e testes no paramtricos porque no esto seguros de que a distribuio normal foi
69
encontrada (estes ltimos no so to eficientes quanto aos paramtricos para detectar

diferenas na populao).
Estes testes no requerem a estimao da varincia e da mdia da populao.
So testes que podem ser usados tanto para variveis nominais como para
variveis ordinais ou quantitativa
Entre os testes no paramtricos, vamos comentar sobre os mais usados
-qui-quadrado, j estudado; usado na anlise de dados categricos. Em amostras
pequenas (n<40), usar o Teste de Fischer (produz menos erro tipo I e tipo II).
-Teste de Kolmogorov-Smirnov: avalia a normalidade de variveis quantitativas, como
exemplo, o peso, permetro ceflico e estatura
Analyze>Nonparametric Test e realizamos como j comentamos anteriormente (Figura
102) e selecionar 1.Sample K-S (Figura 103).
Fig.102. Menu Analyze>Nonparametric Test
Fig.103. Caixa de dilogo One-Sample Kolmogorov-Smirnov Test

Clicar em [OK] e o Output viewer mostrar (Figura 104)
70
Fig. 104. Output viewer do One-Sample Kolmogorov-Smirnov Test

Como podemos ver, as varivel estatura e permetro ceflico (PC) mostraram-se
com caractersticas de variveis que seguem a distribuio normal (p=0,29 e 010), o que
no ocorreu com a varivel peso (p<0.05). Toda vez que o teste de KolmogorovSmirnov apresentar p <0.05, significa fuga de normalidade.
VIII-1-Teste U de Mann-Whitney
Usado para a comparao de variveis ordinais ou quantitativas entre dois
grupos independentes,quando a distribuio no simtrica (normal), ou seja quando h
ruptura dos pressupostos paramtricos; corresponde ao teste t de Student para amostras
independentes.
Quando a amostra tiver mais de 20 observaes, a estatstica U tende a uma
distribuio normal; no Output Viewer ser apresentado o resultado da estatstica z,
alm do resultado do teste U, mas a significncia pelo valor p, ser a mesma.
Selecionar Analyze>Nomparametric Test>2 Independent Samples (Figura 105)
Fig.105.Menu Analyze>Nomparametric Test>2 Independent Samples

Vamos utilizar as variveis peso e uso do corticosteride pr-natal para calcular o
teste de Mann-Whitney. Na caixa de dilogo Two-Independent-Samples Test, selecionar
as variveis peso em Test Variable List e uso do corticosteride pr-natal com Grouping
Variable. Pressionar Define Groups e definir Group 1 como 1 e Group 2 como 2.
Neste exemplo estamos usando uma varivel quantitativa que no tem a
distribuio gaussiana (NORMAL) que o peso (veja anteriormente o Teste de
Kolmogorov-Smirnov) e vamos comparar com os RN cujas mes receberam
corticosteride pr-natal (cortico-1) e mes que no receberam corticosteride pr-natal
(cortico-2) (Figura 106)
71
Fig.106. Caixa de dilogo Two-Independent-Samples Test

Fig. 107. Output viewer do teste U de Mann-Whitney

Podemos observar que no h diferena entre os pesos dos RN das mes que
receberam corticosteride pr-natal e dos RN cuja mes no receberam (p>0.05).
VIII-2- Teste T de Wilcoxon

Este teste substitui o teste t de Student para amostras emparelhadas, quando no
seguem a distribuio Normal. Baseia-se nos postos (ranks) das diferenas intrapares.
Como na nossa base de dados no temos amostras emparelhadas, vamos dar o exemplo
de Wagner MB e cl; hemoglobina no pr-operatrio e hemoglobina no ps-operatrio.
Na caixa de dilogo Two-Related-Samples Test>2 Related Samples (Figura 108)
72
Fig.108. Caixa de dilogo Two-Related-Samples Test

Na caixa de dilogo Two-Related-Samples Tests, selecionar o par de variveis a
ser comparado, colocando-os na lista de pares de variveis (Test Pair(s) List). Em Test
List, escolher o teste de Wilcoxon (Figura 109).
Fig.109. Caixa de dilogo Two-Related-Samples Test, de onde pode ser obtido o teste de
Wilcoxon
73
Fig. 110. Resultado do teste T de Wilcoxon.
VIII-3-Teste H de Kruskal-Wallis
Este teste uma alternativa no paramtrica para a anlise de varincia de um
critrio de classificao (One-Way ANOVA). Pode ser usado para comparar vrias
amostras independentes. Ao ser usado 2 grupos para comparao, os resultados so os
mesmos dos teste de U de Mann-Whitney. Como ocorre no teste F de uma NOVA
paramtrica, um valor significativo de F no indica onde se encontra a diferena,
devendo ser realizado o teste de Tukey. J no teste H de Kruskal-Wallis, para identificar
a diferena, deve ser realizado o teste de Dunn, no disponvel no SPSS.
Selecionar Analyze>Nonparametrics Test>K Independent Samples (Figura 111)
Fig.111. Menu Analyze>Nonparametrics Test>K Independent Samples

Na caixa de dilogo Test for Several Independent Samples, selecionar as variveis
a testar (idade gestacional, Apgar no 5 minuto e peso, variveis assimtricas, como
demonstrado pelo teste de Kolmogorov-Smirnov) em Test Variable List. Selecionar a
varivel que define os grupos em Grouping Variable. Pressionar Define Range e indicar
os cdigos dos grupos (Figura 112)
74
Fig. 112. Caixa de dilogo Test for Several Independent Samples de onde se obtm o
teste H de Kruskal-Wallis
Na janela do Output Viewer, vamos ter (Figura 113):
Fig. 113. Resultado do teste H de Kruskal-Wallis

Podemos observar que no diferena significativa entre a idade gestacional e o
peso ao nascer dos RN de mes que receberam corticosteride em relao aos RN das
mes que no receberam, o que NO ocorre com o Apgar no 5 minuto (os RN das
mes que receberam corticosteride no pr-natal tiveram significativamente maior
Apgar no 5 minuto).
VI-4- Teste de Friedman

Este teste uma extenso do teste de Wilcoxon; usado para o caso de diversas
amostras emparelhadas, com distribuio assimtrica. Ao usar 2 grupos, os resultados
so semelhantes ao teste de T de Wilcoxon.
Como no nosso arquivo no temos dados para esta situao especfica, vamos
usar o exemplo de Wagner MB e cl: Hb antes e aps a cirurgia. Veremos a semelhana,
ao examinar os resultados na janela do Output viewer, com o teste T de Wilcoxon.
Analyze>Nonparametrics Test>K Related Samples (Figura 114)
75
Fig.114. Menu Analyze>Nonparametrics Test>K Related Samples

Na caixa de dilogo Test for several Related Samples, adicionar as variveis hb1 e
hb2 (Figura 115)
Fig.115. Caixa de dilogo Test for several Related Samples, de onde se obtm o teste de
Friedman
Clicar em [OK] e a janela do Output Viewer mostrar (Figura 116)
76
Fig.116. Resultado do teste de Friedman

Podemos observar as semelhanas dos dois testes, Wilcoxon e Friedman.
VIII-5- Coeficiente de correlao de Spearman

Este coeficiente o substituto do coeficiente de Pearson, sendo empregado
quando as variveis quantitativas forem assimtricas. Exige que as variveis tenham
sido medidas em escala ordinal. Apresenta a mesma amplitude no resultado do
coeficiente de Pearson, variando de -1 (correlao negativa perfeita) a + 1 (correlao
positiva perfeita), passando por zero (ausncia de correlao). A interpretao
semelhante ao coeficiente de Pearson, porm o coeficiente de Spearman indica a
correlao entre os postos e no entre os valores efetivamente medidos.
Para exemplificar, vamos fazer uma correlao entre peso ao nascer e idade
gestacional
Analyze>Correlate>Bivariate (Figura 117)
Fig.117. Menu Analyze>Correlate>Bivariate

Na caixa de dilogo Bivariate Correlations, colocar as variveis em estudo, peso e
idade gestacional (apresentam distribuio assimtrica como comprovamos com o teste
de Komogorov-Smirnov) e marcar Spearman em Correlation Coefficients (Figura 118)
77
Fig. 118. Caixa de dilogo Bivariate Correlations, de onde se obtm o coeficiente de

Spearman
Pode-se obter estatstica descritiva se for pressionado [Options] e marcado
means and stardard desviation, na caixa de dilogo Bivariate Correlations (Figura
119).
Fig.119. Caixa de dilogo Bivariate Correlations: Options

Na janela Output Viewer, vamos observar (Figura 120)
Fig.119. Resultado do coeficiente de Spearman entre peso e altura.
Fig.119. Resultado do coeficiente de Spearman entre peso e altura.

O coeficiente de correlao de Spearman entre idade gestacional e o peso foi de
0,22, uma correlao fraca.
Outros coeficientes de correlao no paramtricos podem ser obtidos no SPSS,
como os coeficientes propostos por Kendall (tau), Goodman-Kruskal (gamma) e
Somers (d). Estes coeficientes no so encontrados no menu de testes no paramtricos.
Os coeficientes de Spearman e Kendal, alm do paramtrico Pearson, so encontrados
78
em Analyze>Correlate Bivariate. J os demais podem ser encontrados dentro das

opes (Statistics) do comando Crosstabs (Analyze>Descriptive Crosstabs).
IX- CURVA DE KAPLAN-MEIER

Muitos estudos, em medicina, so planejados para determinar se uma droga,
tratamento ou procedimento novo tem melhor desempenho do que outro normalmente
usado, ou seja, so feitas avaliaes dos efeitos de curto prazo. No entanto tambm
importante a avaliao dos resultados a longo prazo, incluindo a morbimortalidade.
Nos estudos de avaliao das taxas de sobrevivncia entre pacientes submetidos
a certos tratamentos ou a certos procedimentos, o resultado ser binrio-sobrevivncia
ou morte do paciente e o objetivo ser estimar o intervalo de tempo que os pacientes
sobrevivem com tipos especficos de tratamento ou em condies especficas.
Na anlise de sobrevivncia, a varivel dependente (resultado) sempre o
tempo at a ocorrncia de determinado evento (j na anlise estatstica clssica, a
varivel dependente a ocorrncia de determinado evento, como cura, desenvolvimento
da doena, efeito colateral).
Vejam assim que na anlise de sobrevivncia compara-se a rapidez com que os
participantes desenvolvem determinado evento, ao contrrio de comparar as
percentagens de doentes que desenvolvem o evento, ao fim de um determinado perodo
de tempo. O evento final da anlise de sobrevivncia pode no ser somente a morte,
podendo ser outro evento, como recidiva, progresso da doena, efeito colateral.
Quando se fala em tempo de sobrevida na anlise de sobrevivncia no significa que
seja necessariamente o tempo at a morte e sim o tempo at a ocorrncia de
determinado evento. Assim, devido diferena do tipo de varivel dependente usada,
todos os mtodos estatsticos que usamos normalmente na anlise clssica, no podem
ser usados quando realizamos anlise de sobrevivncia, devido diferena do tipo de
varivel dependente que utilizada. A anlise clssica e a de sobrevivncia tem mtodos
prprios (consulte a tabela 3)
79
Tabela 3. Tcnicas estatsticas usadas na anlise clssica e na anlise de

sobrevivncia (Botelho F et al)
Nos estudos de seguimento, principalmente aqueles de longa durao, os
pacientes que no atingem o tempo total de seguimento previsto, so excludos. J na
anlise de sobrevivncia, os dados destes pacientes so aproveitados na anlise final,
mesmo que no desenvolvam o evento em estudo. Quando isto ocorre, designa-se o
indivduo como censurado. Portanto, a anlise de sobrevivncia permite usar a
informao de todos os participantes at o momento em que desenvolveram o evento ou
foram censurados, constituindo uma tcnica ideal para analisar respostas binrias (ter ou
no ter o evento) em estudos longitudinais que se caracterizam por tempo de
seguimento diferente entre os indivduos e perdas de segmento.
Como feita a anlise dos dados na anlise de sobrevivncia/aparecimento de
eventos? O mtodo de Kaplan-Meier consiste em dividir o tempo de seguimento em
intervalos, cujos limites correspondem ao tempo de seguimento em que houve eventos.
Este mtodo calcula a sobrevivncia cada vez que um paciente morre, o mtodo mais
usado. Observem a Curva de Kaplan-Meier do estudo de Been JV et al sobre o Papel da
corioamnionite na resposta ao surfactante nos recm-nascidos pr-termos
(Chorioamnionitis Alters the Response to Surfactant in Preterm Infants. J Pediatr
2010;156:10-5) (Figura 120)
80
Fig. 120. Curvas de Kaplan-Meier analisando o tempo at a extubao aps primeira

dose (A) e segunda (B) dose de surfactante exgeno para os grupos com base na
histologia da placenta
Observamos pela Curva de Kaplan-Meier apresentada, que com 12 horas aps o
uso da primeira dose do surfactante pulmonar exgeno, no havia diferena entre os 3
grupos estudados (corioamnionite fetal, corioamnionite sem envolvimento fetal e sem
corioamnionite) quanto ao tempo de extubao, o que no ocorreu com 24, 36 e 48
horas de vida, em que se observa o prolongamento do tempo de extubao com a
gravidade da corioamnionite, ou seja, aquela com envolvimento fetal (com 486 horas,
aqueles com grave corioamnionite, 85% estavam intubados, versus 60% daqueles
aqueles com corioamnionite menos grave ou ausncia de corioamnionite) (p<0,047,
determinado pela estatstica do logrank de Cox-Mantel-veja adiante).
Vejam ento que esta anlise de Kaplan-Meier permite avaliar corretamente o
ritmo em que os eventos vo ocorrendo nos diferentes grupos em estudo.
Dos grficos com as curvas de Kaplan-Meier pode-se estimar diretamente o
percentual de evento ao final de qualquer intervalo temporal, Para isto, trace uma linha
vertical ao nvel temporal que se pretende apurar o nvel de ocorrncia de evento, que
no nosso caso a extubao. Vejam que no exemplo anterior, com 42 horas aps o uso
do surfactante exgeno, 65% dos RN nos grupos com corioamnionite leve e sem
corioamnionite estavam intubados, versus 85% dos RN com histria de mes com
corioamnionite severa.
Para avaliar a significncia estatstica procedemos tal como na anlise clssica,
analisando o valor de p ou o intervalo de confiana. Para o clculo deste p, o teste de
significncia mais utilizado o Logrank test (tambm conhecido por estatstica do
logrank de Mantel, estatstica do logrank de Cox-Mantel). Este teste compara o
nmero de eventos observados em cada grupo com o nmero de eventos que seria
esperado com base no nmero de eventos dos dois grupos combinados, ou seja, no
importa a que grupo pertence o indivduo. Um teste do qui-quadrado aproximado
usado para testar a significncia de uma expresso matemtica envolvendo o nmero de
eventos esperados e observados.
81
Para a determinao de um efeito independente de um fator, temos que realizar

uma anlise multivariada, que no caso de anlise de sobrevida geralmente implica na
utilizao da Regresso de Cox; uma tcnica estatstica que utilizada para
determinar a relao entre sobrevivncia e vrias variveis independentes exploratrias;
fornece uma estimativa do tratamento sobre a taxa de sobrevivncia, aps o ajuste da
varivel exploratria. Esta regresso permite obter resultados ajustados para possveis
variveis de confundimento.
No estudo assinalado anteriormente a respeito da alterao da resposta ao
surfactante nos RN cujas mes tiveram corioamnionite com envolvimento fetal, os
autores tambm realizaram uma anlise de regresso de Cox para anlise multivariada
para identificar se a idade gestacional poderia explicar a menor chance de extubao
aps corioamnionite. A regresso de Cox foi realizada com ajuste para a idade
gestacional e peso. Os autores evidenciaram assim, que os RN do grupo corioamnionite
com comprometimento fetal teve significativamente menor probabilidade de extubao
48 horas aps o uso da primeira dose surfactante exgeno (hazard rate-HR- de 0,12 com
intervalo de confiana de 0,01-0,06 p=0,46), demonstrando um efeito independente da
corioamnionite no prolongamento da intubao destes RN com corioamnionite grave
(Figura 121)
Fig. 121. Regresso de Cox estimando o tempo de extubao aps a segunda

dose de surfactante exgeno, ajustado para a idade gestacional e peso nos grupos de
acordo com a histologia da placenta, p <0,05 HC+F VS HC-
Podemos observar que o tamanho da amostra diminui ao longo do tempo de

observao e assim, as estimativas nos perodos finais de observao (parte direita da
curva) so bastante imprecisas. Tambm vale a pena ressaltar que a censura dos
participantes (aqueles que no completaram o estudo ou porque abandonaram o estudo,
ou foram perdidos no seguimento). no est relacionada com o seu prognstico e que
82
semelhante para os participantes recrutados no incio e no fim do estudo. Quando o

nmero total de censurados antes do trmino do estudo pequeno, evidentemente o vis
de seguimento ser pequeno.
Anlise de Sobrevivncia usando o SPSS para Windows, usando o mtodo
de Kaplan-Meier e obteno de Curvas de Sobrevivncia e compar-las mediante a
realizao do teste logrank
Para fazer este tipo de estudo necessrio que se defina a data de incio
(diagnstico da doena, internao no hospital, incio do tratamento) e a data de
finalizao do seguimento (determinado pelo investigador), para que se possa calcular
posteriormente os tempos de sobrevivncia (data do incio do seguimento at a data do
ltimo contato) dos pacientes. No seguimento, pode ser que os pacientes ou morram,
continuem com vida na data da finalizao do estudo ou so perdidos (casos censurados,
como discutido anteriormente). O mtodo de Kaplan-Meier um mtodo no
paramtrico, sendo o nico que supe que os indivduos censurados comportaram do
mesmo modo dos indivduos seguidos at que ocorra o evento. Para cada perodo de
tempo se calcula a probabilidade de sobreviver.
O tempo de seguimento uma varivel quantitativa (expressa em dias, meses,
anos) e expressa a diferena entre as datas de incio e de finalizao do estudo.
O estado do paciente ao final do seguimento uma varivel categrica
dicotmica (1: evento que pode ser morte, recada, etc e 0: no ocorreu evento, casos
censurados ou apresentaram um evento aps o trmino do estudo).
Vejamos como proceder no SPSS-18 (vamos usar uma base de dados de Aguayo
Canela M e Lora Monge E, do Hospital Universitrio Virgem Macarena, Sevilla, com
informao de 56 pacientes com cncer coloretal, includos no seguimento (data de
entrada ou inicial) no momento de ser submetidos radioterapia pr-operatria e
seguidos at o seu falecimento. Da mesma base de dados, vamos calcular o teste
estatstico logrank para comparar duas curvas de sobrevivncia (dois grupos de
pacientes, um grupo que recebeu menos de 5000 rads e outro grupo que recebeu >=5000
rads no pr-operatrio). H diferenas na sobrevivncia de ambos os grupos ou a dose
de radioterapia pr-operatria influenciou significativamente na sobrevivncia destes
pacientes?
Analyze>Survival e selecionar Kaplan-Meier (Figura 122)
83
Fig.122. Menu Analyse>Survival>Kaplan-Meier

E ser aberto uma nova caixa de dilogo (Kaplan-Meyer) (Figura 123)
Fig. 123. Caixa de dilogo Kaplan-Meier
Selecionar a varivel que mede o tempo de seguimento e coloc-la em Time

(Tempo). Em Status (Estado) colocar a varivel categrica dicotmica que define o
estado individual durante o seguimento; esta varivel tem duas opes: valor
censurado/valor morte ou outro evento que se avalia). O programa pede para definir o
84
evento (Define Event), devendo especificar o valor que mostra o resultado que se avalia
(neste caso, o valor 1=morte) (Figuras 124 e 125)
Fig. 125. Kaplan-Meier:Define Event
A seguir, clicar em Options

e marcar Survival table(s) (tabela(s) de
sobrevivncia) e Mean and median survival (mdia e mediana de sobrevivncia) e
Quartilies (Figura 126). Em Plots, marcar Survival (sobrevivncia) para gerar a Curva
de Kaplan-Meier
85
Fig. 126- Kaplan-Meier : Options

A seguir, clicar em [OK] e o Output Viewer (sada do SPSS), mostrar uma
tabela (Tabela 4-reproduo parcial) que contm na primeira coluna da esquerda (Time)
o tempo durante o qual diferentes indivduos esto em seguimento, ordenados por
tempos crescentes. A segunda coluna (Status) indica se tem produzido o efeito avaliado
ou no (morte, censurado). A coluna seguinte (Cumulative survival) a sobrevivncia
acumulada, ou a proporo de casos para os quais no ocorreu o evento em cada tempo.
A coluna seguinte (Standard Error) o erro padro correspondente a estimao pontual
de Kaplan-Meier em cada tempo. A quinta coluna (Cumulative events) contem os
eventos acumulados, isto , os que morreram at este tempo. A ltima coluna (Number
remaining) o nmero de pessoas que permanecem em cada momento sem que haja
ocorrido com eles o evento final ou o desenlace avaliado e representa os indivduos que
esto em risco no prximo perodo.
86
Tabela 4- Tabela de sobrevivncia

O SPSS tambm informa o nmero total de pacientes avaliados (Number of
cases), o nmero de censurados (Censored) e o nmero de eventos ocorridos (Events).
Vamos observar os valores do tempo de sobrevivncia (Survival Time) e a mediana
(Median) da sobrevivncia (o tempo em que 50% dos pacientes seguem sem apresentar
o evento), com os seus correspondentes erros padres (Standard Error) e os intervalos
de confiana a 95% (95% Confidence Interval) (Figura 127)
87
Fig. 127. Mdias e mediana da sobrevivncia e percentis.

A seguir o programa mostra a Curva de Sobrevivncia de Kaplan-Meyer (Figura
128).
Fig.128. Curva de Sobrevivncia (Curva de Kaplan-Meier).
Observamos que na ordenada, fica a Sobrevivncia Acumulada (Cum Survival)

em termos de probabilidade (entre 0 e 1) e no eixo da abscissa, o tempo de
sobrevivncia. Este grfico pode ser editado clicando sobre ele com o boto esquerdo
do mouse (Editar). Assim, podemos responder a seguinte pergunta: quantos pacientes
com cncer coloretal sobrevivem mais de dois anos?. Traando uma linha vertical no
tempo de 25 meses, vamos observar que a sobrevivncia seriam aproximadamente 75%
(Figura 129)
88
Fig.129. Curva de Kaplan-Meier editada.
Passos para comparar duas ou mais curvas de sobrevivncia.
A seguir, vamos comparar duas ou mais curvas de sobrevivncia. A hiptese nula

que os grupos que se compararam tem uma sobrevivncia igual, sendo o teste de
hiptese mais empregado, como j vimos o logrank test que leva em conta as
diferenas de sobrevivncia entre os grupos em todos os pontos que dura o seguimento.
No exemplo a seguir, usando a mesma base de dados do exemplo anterior, vamos
responder a pergunta: a sobrevivncia foi diferente entre os que receberam o
tratamento radioterpico com menos de 5000 rads e os que 5000 ou mais rads? Ou o
mesmo, h diferena significativa na sobrevivncia entre os que receberam menos e
mais radioterapia pr-operatria?
Na caixa de dilogo Kaplan-Meier da Figura 7, selecionamos a varivel que vai
separar os grupos de pacientes e colocar em Factor uma varivel categrica (no
presente exemplo, vamos colocar a varivel dose de radioterapia pr-operatria.).
(Figura 130).
89

Clicar em Compare Factor... (Comparar Fator...), selecionar o estatstico
Logrank e logo se ativar a opo Pooled trend factor levels (Combinada sobre os
estratos) (Figura 131)
Fig. 131. Kaplan-Meier: Compare Factor Levels
Clicar em [Continue] e em [OK] e o Output Viewer mostrar (Figura 132 e 133).
90
Fig. 132. Resultado do teste estatstico Logrank, mostrando no haver

diferena entre os grupos (p<0.102).
Fig. 133. Curva de sobrevivncia de Kaplan-Meier de ambos os grupos

Interpretao: como podemos observar o valor do estatstico logrank foi de
2,67, com 1 grau de liberdade (neste exemplo se compararam dois grupos) e o valor p
associado foi de 0,10, o que NO nos permiti afastar a hiptese nula, isto , NO H
DIFERENA ESTATISTICAMENTE SIGNIFICATIVA NA SOBREVIVNCIA
ENTRE OS DOIS GRUPOS. Observando as curvas de sobrevivncia de ambos os
grupos (Figura 16), o grupo de maior dose de radioterapia parece sobreviver mais,
porm o estatstico logrank no alcana valor crtico que nos permite afastar a hiptese
nula.
X- CURVA ROC
91
Muitos exames dos nossos pacientes tem valores medidos numa escala numrica
e assim a sensibilidade e a especificidade dependem de onde se coloca o ponto de corte
(cut off) entre os resultados positivos e negativos.
Uma forma mais eficiente de demonstrar a relao normalmente antagnica
entre a sensibilidade e a especificidade dos exames que apresentam resultados
contnuos so as Curvas de Caractersticas de Operao do Receptor (Curvas ROCReceiver Operating Characteristic). A Curva ROC uma ferramenta poderosa para
medir e especificar problemas no desempenho do diagnstico em medicina por permitir
estudar a variao da sensibilidade e especificidade para diferentes valores de corte.
A Curvas ROC foram desenvolvidas no campo das comunicaes como uma
forma de demonstrar as relaes entre sinal-rudo. Interpretando o sinal como os
verdadeiros positivos (sensibilidade) e o rudo, os falsos positivos (1-especificidade),
podemos entender como este conceito pode ser aplicado em medicina.
A Curva ROC um grfico de sensibilidade (ou taxa de verdadeiros positivos)
versus taxa de falsos positivos (Figura 134)
Fig.134.Curva de Caracterstica de Operao

do Receptor (Curva ROC)
A linha diagonal pontilhada corresponde a um teste que positivo ou negativo,

aleatoriamente. A Curva ROC Permite evidenciar os valores para os quais existe maior
92
otimizao da sensibilidade em funo da especificidade que corresponde ao ponto em

que se encontra mais prxima do canto superior esquerdo do diagrama, uma vez que o
ndice de positivos verdadeiro 1 e o de falsos positivos zero.
A medida que um critrio para o teste positivo torna-se mais rigoroso, o ponto
da curva correspondente a sensibilidade e a especificidade (ponto A) movimenta-se
para baixo e para a esquerda (sensibilidade menor e especificidade maior). Se adotar um
critrio menos evidente, para identificar os positivos, o ponto da curva (ponto B)
movimenta-se para cima e para a direita (sensibilidade maior, especificidade menor).
A Curva ROC permite comparar dois ou mais exames diagnsticos e constitui
uma das maiores virtudes das curvas ROC. No exemplo (Figura 135) a seguir, o Teste
A- tem melhor acurcia que o teste B (teste invlido: os seus resultados no so
melhores do que os da chance). O ponto 1confere maior valor de sensibilidade e
especificidade; o ponto 2 confere maior sensibilidade, porem menor especificidade e j
o ponto 3, maior especificidade, porm, menor sensibilidade
Falso- positivo (1-especificidade)

Fig.135 Curva ROC (diferentes pontos de cortes)
O exemplo a seguir (Figura 136) de Maulik et al que compararam 4 ndices

correspondentes nos traados Doppler da artria umbilical, no que se refere a uma
preciso para prever a evoluo perinatal desfavorvel. Podemos observas que 3
ndices so praticamente semelhantes , mas um deles, o IP (ndice de pulsatilidade) era
muito menos preciso.
93
Fig. 136. Fig. 3.Curvas de caractersticas de operao do receptor para os

ndices Doppler da artria umbilical. Os pontos de dados so os valores medidos
dos ndices. IR: ndice de resistncia; D/A: relao diastlica mdia; IP: ndice de
pulsatilidade Maulik et al.
A Curva ROC descrimina entre dois estados, onde cada ponto da curva
representa um compromisso diferente entre a sensibilidade e o falso positivo que pode
ser definido pela adoo de um diferente valor do ponto de corte de anormalidade.
Assim, podemos ter diferentes correspondncias na curva. Um critrio restrito (paciente
Spositivo quando a evidncia da doena muito forte) aquele que traduz uma pequena
frao de falsos positivos e tambm uma pequena frao de verdadeiros positivos
e
(canto inferior esquerdo da Curva ROC. O uso de critrios menos restritos, conduzem a
nmaiores fraes de ambos os tipos (pontos colocados no canto direito da curva (Figura
137)
s
i
b
i
l
i
d
a
94
1-especificidade (falsos positivos)

Fig.137. Curva ROC para uma dada capacidade de discriminao, com a
variao do ponto de corte (critrio de deciso) (Braga ACS, 2003)
O valor do ponto de corte definido com um valor que pode ser selecionado
arbitrariamente pelo pesquisador entre os valores possveis para a varivel de deciso,
acima do qual o paciente classificado como positivo (teste positivo, paciente com a
doena) e abaixo do qual classificado como negativo (teste de diagnstico negativo,
ausncia de doena).
Para cada ponto de corte so calculados valores de sensibilidade e
especificidade, que podem ento serem dispostos no grfico. Um classificador perfeito
corresponderia a uma linha horizontal no topo do grfico, porm esta dificilmente ser
alcanada. Na prtica, curvas consideradas boas estaro entre a linha diagonal e a linha
perfeita, onde quanto maior a distncia da linha diagonal, melhor o sistema. A linha
diagonal indica uma classificao aleatria, ou seja, um sistema que aleatoriamente
seleciona sadas como positivas ou negativas, como jogar uma moeda para cima e
esperar cara ou coroa. Finalmente, a partir de uma curva ROC, devemos poder
selecionar o melhor limiar de corte para obtermos o melhor desempenho possvel.
Para a determinao se duas ou mais Curvas ROC so significativamente
diferentes, a avaliao feita atravs da determinao da rea sob a curva, usando uma
modificao do teste da soma de ordens de Wilcoxon para esta comparao. Assim
possvel quantificar a exatido de um teste diagnstico (proporcional rea sob a
curva), alm da possibilidade de comparar testes diagnsticos.
Como realizar a Curva ROC pelo SPSS
Vamos usar o exemplo disponvel no programa SPSS 18: hivassay.
95
Um laboratrio farmacutico est desenvolvendo um teste rpido para deteco

de infeco pelo HIV. O atraso na obteno de resultados de testes tradicional reduz a
sua eficcia, porque muitos pacientes no retornam para saber os resultados. O desafio
desenvolver um teste que fornea resultados em 10 a 15 minutos e to preciso quanto
os testes tradicionais. Os resultados do ensaio so oito tons de vermelho, com tons mais
profundos, indicando maior probabilidade de infeco. O teste rpido, mas preciso?
Para ajudar a responder esta pergunta, um ensaio laboratorial foi realizado em 2.000
amostras de sangue, metade dos quais estavam infectadas com o HIV e metade, no. Os
resultados esto em hivassay.sav. Vamos usar a Curva ROC para determinar em que
tom de vermelho o mdico deve assumir que o paciente HIV-positivo.
Em Analyse escolha Roc Curve (Figura 138) e ser aberta a caixa de
dilogo Roc Curve (Figura 139)
Fig.138. Analyse>ROC Curve
96
Fig. 139.Caixa de dilogo ROC Curve

Na caixa de dilogo ROC Curve, selecione assay result como Test variai e em
State variabele, selecione actual satate e o tipo 1, como seu valor positivo. No Display,
selecione With diagonal reference line, Standard error and confidence interval e
Coordinate points of the ROC (Figura 140)
Fig.140.Caixa de dilogo ROC Curve
A seguir, clicar em [ OK] e teremos a Curva ROC, que um ndice visual da preciso
do ensaio (Figura 141)
97
Fig.141 Curva ROC

A Curva est difcil de visualizar porque est muito prximo ao eixo vertical,
ou seja, maior sensibilidade na deteco dos pacientes com HIV positivo e com baixo
falso positivo.
O conhecimento da rea sob a curva possibilita quantificar exatido de um teste
diagnstico (proporcional rea sob a curva), alm de possibilitar a comparao de
testes diagnsticos. A rea sob a curva ROC constitui um dos ndices mais usados para
sumarizar a qualidade da curva.
A rea sob a curva ROC uma medida do desempenho de um teste (ndice de
exatido do teste). Um teste totalmente incapaz de discriminar indivduos doentes e no
doentes, teria uma rea sob a curva de 0.5 (seria a hiptese nula).Acima de 0,70
considerado desempenho satisfatrio. Vejam o clculo da rea sob curva do presente
exemplo (Figura 142)
Area Under the Curve (rea sob a Curva)

Test Result Variable(s):Assay result
98
Area Under the Curve (rea sob a Curva)

Asymptotic 95% Confidence
Interval
Area
Std. Error
,996
Asymptotic
Sig.b
Lower Bound Upper Bound
,001
,000
,994
,999
Figura 142. Clculo da rea sob a curva

A rea sob a curva um resumo estatstico til para a determinao da acurcia
do teste. A seguir, precisamos escolher um critrio especfico um critrio especfico em
que as amostras de sangue so classificados e estimar a sensibilidade e a especificidade
do ensaio nesse critrio. Veja as coordenadas da curva para comparar diferentes pontos
de corte (Figura 143).
Coordinates of the Curve
Test Result Variable(s):Assay result
A varivel resultado do teste (s)
Fig.143.
Positive if
Greater Than Sensitivit
or Equal Toa
y
Coordenadas da
Curva ROC:
A varivel resultado
do teste(s)
1Specificity
,00
1,000
1,000
1,50
,997
,058
2,50
,995
,040
3,50
,993
,024
4,50
,988
,017
5,50
,978
,015
6,50
,973
,012
7,50
,965
,003
9,00
,000
,000
Esta tabela relata a

sensibilidade e 1- especificidade para cada ponto de corte possvel para a classificao
positiva. A sensibilidade a proporo de amostras de HIV-positivos com os resultados
do teste maior que o corte e 1-especificidade a proporo de amostras de HIVnegativo com os resultados do teste maior que o de corte. No ponto de corte 0
99
equivalente a assumir que todos so HIV-positivos. No ponto de corte 9 equivalente a

assumir que todos HIV-negativos. Vejam assim, que ambos os extremos so
insatisfatrios, o desafio escolher um corte que devidamente equilibrar as
necessidades de sensibilidade e especificidade.
Por exemplo, considere o ponto de corte 5.5. Usando este ponto de corte vamos
ter uma sensibilidade de 0,978 e 1-especificidade de 0,015. Assim, aproximadamente
97,8% de todas as amostras do HIV-positivos seriam corretamente identificadas como
tal, e 1,5% de todas as amostras do HIV-negativo poderiam ser incorretamente
identificadas como positivas.
Se usarmos o ponto de corte 2,52, 99,5% de todas as amostras do HIV-positivos
seriam corretamente identificados como tal e 4,0% de todas as amostras de HIVnegativo poderiam ser incorretamente identificadas como positivas.
A escolha do ponto de corte ser decidida pela necessidade de aumentar a
sensibilidade ou a especificidade e vai depender do pesquisador. Devemos notar que os
valores desta tabela representam as melhores orientaes para os quais devemos
considerar os pontos de cortes. Esta tabela no inclui as estimativas de erro, portanto,
no h garantia da exatido da sensibilidade ou especificidade para um dado ponto de
corte na tabela.
O uso da Curva ROC possibilitou-nos avaliar a acurcia deste teste. A rea sob a
curva mostrou que a utilizao do teste melhor do que a chance, mas, alm disto, as.
coordenadas da curva foi muito til porque forneceu algumas orientaes para
determinar qual o melhor ponto de corte para a determinao os resultados do teste
positivo e negativo.
Vejamos agora, exemplo de estudos com o uso da Curva ROC na neonatologia,
comparando ndices Prognsticos CRIB (clinical risk index for babies), CRIB II e
SNAPPE-II (score for neonatal acute physiology-perinatal extension).
Parry G et al desenvolveram o CRIB-II para RN de 32 semanas aps 1 hora de
admisso na UTI sendo excluda a FiO2 uma vez que esta no representa uma medida
fisiolgica verdadeira por ser determinada pelo cuidador. Assim, o CRIB II foi
calculado a partir de 5 itens: sexo, peso ao nascer, idade gestacional, pior base excess e
temperatura na admisso A rea sob a curva ROC para morte ou graves anormalidades
cerebrais foi de 0,82, de 0,79 pra o CRIB, 0,80 para a idade gestacional e 0,77 para o
peso ao nascer . Portanto, o CRIB II mostrou maior acurcia em relao ao CRIB, a
idade gestacional e o peso ao nascer para a morte ou graves anormalidades cerebrais.
Gagliardi I et al, comparando CRIB, CRIB-II e SNAPE-II, relataram maior grau
de descriminao para o CRIB e CRIB II em relao ao SNAPPE-II (rea sob a Curva
ROC de 0,90 e 0,91 versus 0,84-p <0,0004). Vejamos a Curva ROC deste estudo (Fig.
144)
100
Fig. 144. Curva ROC para o CRIB, CRIB II e SNAPPE-PE. A rea sob a
curva foi: CRIB, 0,903; CRIB-II, 0,907; SNAPPE-II, 0,837.
Observem que as Curva do CRIB e CRIB-II esto mais prximas do canto
superior esquerdo do diagrama, o que confere maior rea sob a curva e portanto, maior
poder de discriminao em relao ao SNAPPE-II.
Finalizando, segundo Field A, os procedimentos estatsticos so uma forma de
processar nmeros e, portanto, se voc colocar baboseiras em uma anlise mesmo assim
obter concluses que tem significado estatstico, mais que provavelmente no tero
sentido prtico. Existe uma tentao de ver a estatstica como uma forma milagrosa de
determinar a verdade, mas a estatstica somente um recurso. Se voc entra com lixo,
voc vai obter lixo. Na anlise estatstica no existe um substituto para o pensamento
emprico. Tenha sempre isto em mente.
Torture os nmeros e eles admitiro qualquer coisa
Nota: este texto ser continuamente revisado e ampliado medida quer for sendo
discutido com os estudantes do 6 Ano da Escola Superior de Cincias da Sade
(ESCS) /SES/DF (Faculdade de Medicina da Secretaria de Estado de Sade do
Distrito Federal).
101
XI- REFERNCIAS
1- Wagner MB, Mota VT, Dornelles CC. SPSS Passo a Passo, Educs, Caxias do Sul,
2004
2- Field A. Descobrindo a Estatstica usando o SPSS, Artmed,2 Edio Porto Alegre,
2009
3-Filho Doria U. Introduo a Bioestatstica (Para simples mortais), Negcio Editora,
So Paulo, 2 Edio,1999
4-Arango HG.Bioestatstica Terica e Computacional, Guanabara Koogan, Rio de
Janeiro,2001
5- Vieira S. Introduo Bioestatstica, Editora Campus, 2 Edio, Rio de Janeiro,
1991
6-Sounis E. Bioestatstica.Princpios fundamentais, metodologia estatstica, Aplicao
s Cincias Biolgicas,Livraria Atheneu
7-Bisquerra R, Sarriera JC, Martinez G. Introduo Estatstica. Enfoque Informtico
com o Pacote Estatstico SPSS, Artmed, Porto Alegre, 2004
8. Margotto PR. Entendendo Bioestatstica Bsica. Boletim Informativo Peditrico
(Enfoque Perinatal), No65, Ano 22, Braslia, p.6-108, 2002. Disponvel em
www.paulomargotto.com.br, em Entendendo Bioestatstica Bsica (Acessado em
30 de outubro de 2009)
9-Margotto PR. Como exercer a Medicina/Neonatologia baseado em evidncias. In.
Margotto PR. Assistncia ao Recm-Nascido de Risco, Hospital Anchieta, 3
Edio, Braslia, no prelo. Disponvel em www.paulomargotto.com.br em
Exerccio da Medicina Baseado em Evidncia (Acessado em 20 de outubro de
2009)
10-Penha RN. Um estudo sobre regresso logstica binria. Universidade de Itajub,
Instituto de Engenharia Mecnica, Departamento de Produo. Disponvel em
UM ESTUDO SOBRE REGRESSO LOGSTICA BINRIA Renata Neves
Penha ... (Acessado em 30 de novembro de 2009)
11.Batistela G C, Rodrigues AS, Bononi JTCM. Estudo sobre a evaso escolar usando
regresso logstica: anlise dos alunos do Curso de Administrao da Fundao
Educacional de Ituverava. Tkhne Lgos, Botucatu, SP, v.1, n.1, p.53-66,
out.2009. Disponvel em ESTUDO SOBRE A EVASO ESCOLAR
USANDO REGRESSO LOGSTICA: ANLISE ...
12- Programas desenvolvidos na Braile Biomdica S/A. Disponvel em Estatistica
(Acessado em 30 de dezembro de 2009)
13-NRM Consultoria Estatstica Ltda. Curso de Estatstica com a Utilizao do SPSS,
ESCS, 2009
14.Whelan B, Bennett K et al. Serum sodium as a risk factor for in-hospital mortality in
acute unselected general medical patients. QJ Med 2009;102:175-182
15-Silva AP. Curso Bsico de Estatstica utilizando o SPSS. ESCS, julho de 2006
16-Laboratrio de Epidemiologia e Estatstica. Lee - Laboratrio de Epidemiologia e
Estatstica (Acessado em 21 de abril de 2010)
17-Botelho F, Silva C, Cruz F. Epidemiologia explicada-anlise de sobrevivncia. Acta
Urolgica 2009;26:4:33-38. Disponvel em Epidemiologia explicada Anlise de
Sobrevivncia (acessado em 14 de maio de 2010)
102
18-Aguayo Canela M, Lora Monge E. Cmo hacer paso a paso um anlisis de

supervivncia com SPSS para Windows. Fabis (Fundacion Andaluza Beturia
para La investigation em salud). Disponvel em Cmo hacer paso a paso un
Anlisis de Supervivencia con SPSS ... (acessado em 15 de maio de 2010)
19-Dawson B, Trapp RG. Anlise dos temas de pesquisa sobre sobrevivncia. In.
Dawson B, Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3
Edio, 2003, p.187-205
20-Bee JV, Rours IG et al. Chorioamnionitis alters the response to surfactant in preterm
infants. J Pediatr 2010;156:10-5
21-Martinez EZ, Lozada-Neto F, Pereira BB. Cadernos Sade Coletiva, Rio de Janeiro
2003;11:7-31 (disponvel em [PDF] A curva ROC para testes diagnsticos
22- Braga ACS. Curvas ROC: Aspectos funcionais e aplicaes. Tese de Doutorado,
Universidade do Minho, dezembro de 2003, Portugal
23- Dawson B, Trapp RG. Mtodos da medicina baseada em evidncias. In. Dawson B,
Trapp RG Bioestatstica Bsica e Clnica, McGrawHill, Rio de Janeiro, 3 Edio, 2003,
p.233-249
24- Maulik D, Yarlagadda P, Youngblood JP, Ciston P. Comparative efficacy of
umbilical arterial Doppler ndices for predicting adverse perinatal outcome. Am J Obstet
Gynecol 1991;164:1434-1440
21-Parry G, Tucker J et al. CRIB II: an update of the clinical risk index for babies score.
Lancet 361:1789, 2003
22- Gagliardi L, Cavazza A, et al. Assessing mortality risk in very low birthweight
infants: a comparison of CRIB, CRIB-II, and SNAPPE-II. Arch Dis Child Fetal
Neonatal Ed. 89:F419, 2004
Pesquisado, digitado, revisado por Paulo R. Margotto
www.paulomargotto.com.br
pmargotto@gmail.com.br
Braslia, 11 de junho de 2010
103

SPSS 2010

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

SPSS 2010

Загружено:

Авторское право:

Доступные форматы

ESTATSTICA COMPUTACIONAL

ESCOLA SUPERIOR DE CINCIAS DA SADE/SES/DF

Torture os nmeros e eles admitiro qualquer coisa

Fig. 1-Janela SPSS for Windows com a Caixa de Dilogos

II - COMO CRIAR UM BANCO DE DADOS

Fig.2.Janela Editor de Dados (Data Editor)

Tabela 1. Opes nas definies das variveis (Wagner MB e cl, 2004)

Fig. 5.Seleo do comando Compute

Figura 6.Caixa de dilogo Save Data As

III- ESTATSTICAS DESCRITIVAS

A Estatstica Descritiva encarrega-se do levantamento, organizao, classificao e

III-1- Comando Frequencies

No menu, escolha Analyze>Descriptive Statistics>Frequencies e teremos (Figura 7):

Fig. 7.Construo de Tabelas de Freqncias (observem a caixa de dilogo de Frequencies)

Figura 8-Resultado da tabela de freqncias para as variveis solicitadas.

Fig. 9. Seleo das variveis

Fig.10. Caixa de dilogo Frequencies:Statistics

-relao entre mdia e desvio-padro: na imensa maioria dos casos, as variveis

formato de notao cientfica: E-03

representa 10-3; assim o valor passa a ser 9,729 x103.

Fig.12. Passos para o Comando Descriptive

Figura 12. Caixa de dilogo para seleo de variveis no comando Descriptive

Fig.13.Estatstica do Comando Descriptive

A seguir, pressionar [Continue] e em seguida, [OK]. Os resultados vo aparecer da

Fig. 14. Output viewer do comando Descriptives

Fig.15.Caixa de dilogo para seleo de variveis no comando Explore

Fig.16. Caixa de dilogo Statistics

Fig.17.Caixa de dilogo Plots

Fig.18.Output viewer do comando Explore

Fig.19. Output viewer do comando Explore

Fig.20. Output viewer do comando Explore

Fig.21. Grfico Boxplot de idade gestacional e uso de corticosteride pr-natal

IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS

Fig.22. Menu Transform em detalhe

Fig.23. Seleo do comando Compute

Fig.24. Definio da expresso numrica

Fig.25. Resultado do clculo da nova varivel IP

Fig.26. Como ativar o Pivot Table Objet

Fig27. Tabela a ser editada no Pivot Table

Fig.28. Passos para o uso do Split

Fig.29. Caixa de dilogo Split File

Fig.30.Caixa de dilogo Descriptives

Fig.31. Resultados do comando Split File>Compare groups

Fig.32. Caixa de dilogo Split Fire

Fig.33. Resultados do comando Split File>Organize output by group

Para retornar condio anterior, ou seja, anlises no agrupadas, selecione Data>Split

Fig.34. Caixa de dilogo Split File

Fig.35. Menu Data>Select Cases

Na caixa de dilogo Select Case, marcar IF conditions is satisfied e clicar em [IF]

Fig.36. Caixa de dilogo Select Cases

Fig.37. Caixa de dilogo Select Cases:IF

Fig. 39.Caixa de dilogo Select Cases

A probabilidade (p) de rejeitar a H 0 quando a H0 verdadeira, o que

Feitas as hipteses, o estatstico estabelece o nvel de significncia do teste. O

Clicar Clculo de tamanho de amostra

Prosseguindo com o exemplo, vamos clicar em Estudo de coorte (estudo de coorte:

Proporo de casos entre os no expostos: equivale proporo de pessoas que no

Para calcularmos a mostra esperando uma incidncia de 10% de hemorragia

Clicar em envia e teremos:

Portanto, em um estudo de coorte de gestantes que usaram e no usaram

expostos e no expostos a corticoterapia, POSSIVELMENTE necessitaramos de 135

distribuio dos dados segue uma distribuio normal (teste de Kolmogorov-Smirnov e

Fig.40. Menu Analyze>Compare Mean>One-Sample T-test