Академический Документы
Профессиональный Документы
Культура Документы
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
Paulo R. Margotto
www.paulomargotto.com.br
pmargotto@gmail.com
Professor do Curso de Medicina da Escola Superior de Cincias da Sade
(ESCS)/SES/DF
I- INTRODUO
II- COMO CRIAR UM COMANDO DE DADOS
III- ESTATSTICAS DESCRITIVAS
-tipo de variveis
IV- MANIPULAO E CRIAO DE NOVAS VARIVEIS
V- ESTATSTICA ANALTICA
-teste de hipteses
-tamanho da amostra
V-1-Teste t de Student
V-2- Anlise de Varincia
V-3- Qui-quadrado
V-4- Risco Relativo e Odds Ratio
VI- CORRELAO E REGRESO LINEAR SIMPLES
VII- REGRESSO LOGSTICA BINRIA
VIII-TESTES NO PARAMTRICOS
-teste de Kolmogorov-Smirnov e Shapiro-Wilk para testar normalidade
VIII-1- Teste U de Mann- Whitney
VIII-2-Teste T de Wilcoxon
VIII-3 Teste de Kruskal-Wallis
VIII-3- Teste de Friedman
VIII-4- Coeficiente de correlao de Spearman
IX-CURVA DE KAPLAN-MEIER
X-CURVA ROC
XI-REFERNCIAS BIBILIOGRFICAS
Braslia, 01 de julho de 2010
ESTATSTICA COMPUTACIONAL
USO DO SPSS
(STATISTICAL PACKAGE FOR THE SOCIAL
SCIENCES): O ESSENCIAL
(utilizamos os conceitos de Wagner MB, Motta VT e Dornelles C em SPSS-Passo a Passo, Editora
da Universidade de Caxias do Sul, 2004., com exemplo na base de dados do estudo de Margotto PR e cl,
ainda no publcado sobre Uso do Corticosteride Pr-natal na Maternidade do Hospital Regional da
Asa Sul)
I- INTRODUO
Como iniciar o SPSS
Ao clicar no programa (SPSS for Windows) ser aberta a janela SPSS for Windows,
contendo no centro, a Caixa de Dilogo (Fig.1)
Mostra
denominaes
aos
valores de uma
atribudas
Vai at o
Insere
Descreve
Insere
No SPSS os dados podem ser tanto digitados no teclado como lidos de um arquivo externo.
O formato do SPSS *.sav.Os dados no SPSS so digitados diretamente na janela Editor de
Dados (Data Editor), como numa planilha eletrnica .Assim possvel criar um arquivo no SPSS
(*.sav) (Figura 2) As variveis podem ser quantitativas (altura, peso), categricas (sexo), de data
9tipo calendrio) ou alfanumricas (letra).
Sexo: (1)feminino; (2) masculino; peso em kg; altura em cm; glicemia em mg%
Tabela 2.Dados de cinco sujeitos de um estudo (Wagner MB e cl, 2004
Aps digitar cada varivel, pressionar Enter e o SPSS automaticamente assume o tipo de
varivel. No final, a tela Data Editor na opo Variable View, dever ficar como na Figura 3.
Figura 3. Visualizao da tela do Data Editor na opo Variable View para as variveis do
Exemplo 1 (Tabela 1)
5
A seguir, ir para o Data Editor na opo Data View para inserir os dados da Tabela 2. As
informaes devem ser digitadas conforme apresentadas na Figura 4.
Fig. 4.Opo Data View da janela Data Editor com os nomes das variveis no cabealho e os
dados do exemplo da Tabela 2
possvel corrigir os dados depois de inseridos na tabela, assim como apagar clulas.
possvel tambm inserir novos casos: escolher Data>Insert Cases, assim como inserir novas
variveis: escolher Data>Insert Variable.
Dependendo do interesse do pesquisador, novas variveis podem ser criadas a partir das j
existentes.Para isto, basta ir ao menu Transform e escolha o comando compute. Suponhamos que
queiramos inserir presso arterial (PA)(Figura 5);
Variable(s), clicando no boto []. importante que a opo Dispaly frequency tables esteja
marcada para a obteno da tabela de freqncias. Em seguida, pressionar [OK]. Vejam que as
variveis que enviamos para a direita, desaparece na esquerda. Ao mover a varivel da esquerda
para a direita, selecione-a e pressione [].
Na janela Ouput Viewer vamos ter uma tabela de freqncias para as variveis
selecionadas (Figura 8)
Frequencies
Frequency Table
Figura 11.Janela de Output Viewer com os resultados do comando Frequencies para as variveis
peso, idade gestacional, estatura e permetro ceflico.
Observem que houve 1 caso omisso para a estatura e 1 para o permetro ceflico..
Para identificar a simetria da varivel, h as seguintes formas
10
11
12
Este comando apresenta maiores opes de estatsticas descritivas, alm de dispor de testes
estatsticos para normalidade e grficos especiais. utilizado exclusivamente com variveis
quantitativas e permite comparar tipo de dados entre dois ou mais grupos. Podemos obter:
-medidas de tendncia central:mdia, moda, mediana
-medidas de disperso: desvio-padro, varincia, amplitude e quartis
-outliers: anlise de valores discrepantes
-testes especficos para avaliar a normalidade (Kolmogorov-Smirnov e Shapiro-Wilk
-boxplot
-medidas descritivas adicionais, como assimetria, curtose e outras
Como usar este comando: no menu Analyze Descriptive>Statistics>Explore
Exemplo: Na caixa de dilogo Explore, escolha a varivel que se pretende explorar,
colocando-a na lista de variveis dependentes (Dependent List). Na varivel classificatria (Factor
List) coloca-se, geralmente, uma varivel categrica. No nosso exemplo, vamos explorar a
varivel idade gestacional com o uso de corticosteride pr-natal (Figura 15)
13
A seguir, pressione [Continue] para retornar a caixa anterior. De volta caixa Explore,
clicar no boto [Plots] para abri a caixa Explore:Plots e selecionar Boxplot: Factor levels togheter
(os boxplot estaro juntos no mesmo grfico), Histogram (histograma ou grfico de barras) e
Normality plots with test (grficos e testes para normalidade da dependente) (Figura 17)
14
Observem que a Tabela Descriptives produz para cada um dos estratos da varivel
classificatria (idade gestacional) uma lista de estatsticas descritivas: mdia, intervalo de
confiana de 95% para a mdia, mdia aparada em 5% (mdia recalculada excluindo os 5% mais
extremos, ou seja, 2,5% inferiores e 2,5% superiores), o erro-padro da mdia, coeficientes de
assimetria e de curtose, que nos possibilita avaliar como os valores se distribuem.
Na Figura 19 temos a tabela Percentiis que mostra diferentes percentis para a varivel
idade gestacional nos dois grupos (que usou e o que no usou corticosteride pr-natal), segundo
dois mtodos distintos: weights average e Tukeys Hinges.
15
16
17
COMANDO COMPUTE|:
Vamos criar uma varivel a partir da existente, como: Calcular o ndice ponderal (IP=
peso/altura3).
-Na janela Data Editor, escolha: Transform> Compute e surgir( Figura 23):
Pressione [OK] e o resultado aparece imediatamente na janela Data Editor, como mostrado
na Figura 25:
18
19
20
Uma vez aberta a caixa de dilogo Split File, marcar Compare groups e colocar a
varivel sexo na caixa Groups Based on e clicar [OK] (Figura 29).
21
Se no Split File voc marcar Organize output by groups, vamos ter os resultados de um
grupo e de outro grupo (Figura 32).
22
23
24
Fig.38. Janela Data Editor com os casos no selecionados assinalados (observem a seta)
Ao utilizar o comando Select, o SPSS cria automaticamente uma varivel chamada
filter4, na ltima coluna e aparece tambm na barra de ferramentas.
Para restaurar os dados do arquivo, escolher Data>Select Case...All cases e clicar [OK]
(Figura 39).
25
V-ESTATSTICA ANALTICA
A Estatstica Analtica trabalha com os dados de forma a estabelecer hipteses,
procede a sua comprovao e no final, elabora concluses cientficas
Teste de Hiptese e Tamanho da Amostra para melhor compreenso da significncia
estatstica
Teste de Hipteses
Na maioria das vezes, o pesquisador toma deciso para toda populao, tendo
examinado apenas parte desta populao (amostra). Este processo chama-se de
inferncia. Na pesquisa cientfica, a inferncia feita com a ajuda de testes estatsticos.
Para a compreenso de um teste estatstico preciso que entendamos o que vem
a ser Hiptese Nula (H0) e Hiptese Alternativa (H1).
Hiptese uma conjectura, uma resposta presumida e provisria que, de acordo
com certos critrios, ser ou no rejeitada.
Hiptese Nula (H0): aquela que simplesmente afirma que no h diferena
entre os grupos estudados; trata-se de uma hiptese que atribui ao acaso a ocorrncia do
fenmeno ou resultado observado.
Hiptese Alternativa ou experimental (H1): aquela que afirma que h
diferena entre os grupos estudados.
O principal objetivo de testar uma hiptese responder seguinte questo:
dadas duas amostras, so elas realmente diferentes ou pertencem a uma mesma
populao, ou em outras palavras, as diferenas encontradas entre duas ou mais
amostras so verdadeiras ou podem ser explicadas pelo acaso.
O processo de testar hiptese consiste em seis etapas:
1.
2.
3.
4.
5.
Estabelecer a H1 ( se l ag 1)
Estabelecer a H0 ( se l ag zero)
Determinar o tamanho da amostra
Colher os dados
Realizar teste estatstico para verificar a probabilidade
de que a H0 seja verdadeira
6. Rejeitar ou no a H0
Ao afastar a hiptese nula, estamos afirmando a validez da hiptese alternativa.
Todo experimento realizado para testar uma hiptese. O pesquisador formula
uma hiptese, observa, analisa e em seguida conclui. Aps observar, o pesquisador
descreve e mede.
Jamais atribuindo juzos de valor ao que est sendo visto, o pesquisador pode
decidir erroneamente e rejeitar a hiptese nula sendo ela verdadeira (Erro tipo I). Assim,
o pesquisador aceita como verdade uma diferena que na realidade no existe e que na
verdade, se deve variabilidade das amostras. Quando a hiptese H 0 falsa e o
26
pesquisador no a rejeita, dizemos que ele cometeu um Erro tipo II, significando que
existia, de fato, uma diferena que no foi reconhecida.
Assim:
Erro tipo I: rejeita a H0 sendo verdadeira (fato obtido por azar: rara
ocorrncia estatstica): erro alfa
Erro tipo II : aceita a H0 sendo falsa (erro mais freqente):erro beta
Cohen sugere que a probabilidade mxima aceitvel para um erro tipo II seria
0,2 (20%), definvel como beta (). Se tomarmos 100 amostras de dados da populao
na qual um efeito existe, vamos falhar em detectar este efeito em 20 destas amostras
(perderamos 1 em 5 dos efeitos verdadeiros).
Portanto, para fazer um erro tipo I no deve haver efeito na populao, enquanto
para fazer um erro tipo II vale o contrrio, ou seja, deve haver um efeito que perdemos.
A probabilidade de cometer um erro tipo I diminui a medida que a aumenta
probabilidade de cometer um erro tipo II.
Assim:
Os erros ocorrem ao testar hipteses por diferentes motivos:
-
Erro tipo I: amostras pequenas (h uma maior chance de serem diferentes quanto
menores forem; numa amostra maior, estas diferenas se diluiriam).
Erro tipo II: amostras pequenas
grande quantidade de amostras
Algum erro sempre ocorre, sendo til admitir que para o Erro tipo I ou alfa,
considera-se que 5% aceitvel e para o tipo II ou beta, aceita-se geralmente
10 20%.
Tamanho da Amostra
conveniente planejar o tamanho da amostra para que se possa ter amostras
grandes o suficiente para detectar diferenas importantes. Por outro lado, amostras
exageradamente grande alm de elevar o custo do estudo, podem tornar diferenas
irrelevantes em estatisticamente significativas.
Para determinar o tamanho da amostra preciso estabelecer qual a diferena
deve ser considerada significativa. Esta uma deciso arbitrria do pesquisador,
baseada na experincia, na literatura e/ou na relevncia clnica.
Para determinar o tamanho da amostra, deve-se considerar o nvel de
significncia adequado: quanto de probabilidade aceitvel para que H0 seja verdadeira.
Geralmente considera-se uma probabilidade menor ou igual a 5% como adequada (p
0,05). Poder do teste: a probabilidade que um determinado teste ir encontrar um
efeito assumindo que um j existia; lembrem-se que corresponde probabilidade de
falha em detectar um efeito que realmente existe (erro tipo I). Assim, a probabilidade de
detectar um efeito, se um existe, deve ser o oposto da probabilidade de no detectar
aquele efeito, isto , 1-. Como j vimos, Cohen sugere que deveramos esperar uma
probabilidade de 0.2 na falha em detectar um efeito verdadeiro e assim, o nvel
corresponde do poder recomendado por ele foi de 1.0-0.2=0.8. Portanto o objetivo
alcanar um poder de 0,8 ou 80% de probabilidade de detectar um efeito se ele
realmente existe. Por exemplo, um poder de 80% significa que, se de fato houver
alguma diferena, haver uma probabilidade de 80% de detect-la.
Uma vez conhecido o valor de alfa e beta, podemos usar pesquisas anteriores ou
experimentos similares para estimar o tamanho do efeito que se espera detectar com um
experimento. Assim, podemos usar esse tanto de efeito estimado para calcular quantos
28
participantes necessitamos para detectar este efeito, com base nos valores de alfa e beta
que escolhemos.
Os clculos exatos so volumosos, devendo ser usados programas de
computador. Entre estes, citamos o G*Power (grtis) e o nQuery Adviser (pago), o
disponvel no Epiinfo e no Laboratrio der Epidemiologia e Estatstica.
Utilizando o site Lee - Laboratrio de Epidemiologia e
Estatstica, clicar em Pesquisa e entrar a seguinte caixa:
29
30
Explicaes:
Proporo de casos entre os expostos: equivale proporo de pessoas
expostas ao fator de risco que desenvolveram a doena
32
Amostras grandes:
n > 100
Amostras mdias:
n > 30
Amostras pequenas:
n < 30
Amostras muito pequenas: n < 12
Lembrar que: quanto menor a diferena a ser detectada, maior dever ser o
tamanho da amostra; quando menor o nvel de significncia (p), maior deve ser o
tamanho da amostra.
A etapa seguinte consiste na coleta de dados, lembrando que maus dados levam
igualmente a ms concluses. Segundo Field, procedimentos estatsticos so uma forma
de processar nmeros e, portanto, se voc colocar baboseiras em uma anlise, mesmo
assim obter concluses com significado estatstico, mas que provavelmente no tero
sentido emprico (prtico). A estatstica no uma forma milagrosa, apenas um
recurso. Na determinao da verdade. Na anlise estatstica no existe um substituto
para o pensamento emprico.
Uma vez obtidos os dados, faz-se a anlise estatstica aplicando-se testes
escolhidos em funo do tipo de dados disponveis.
V-1-Teste t de Student
Este teste usado para avaliar a hiptese de que duas mdias so iguais ou no.
O valor do t calculado (tc) tanto maior quanto maior for a diferenas entre as mdias. O
nome deste teste refere-o ao pseudnimo usado por W.L. Gosset, uma vez que a
companhia na qual trabalhava (Guinnes Brewing Company) no permitiu publicar sua
pesquisa usando seu prprio nome e assim publicou com o nome Student.
importante para a aplicao do Teste t que a varivel em estudo tenha
distribuio normal ou aproximadamente normal.
O SPSS pode executar trs aplicaes do teste t em mdias: para uma amostra,
amostras independentes e amostras emparelhadas.
-para uma amostra: o objetivo verificar se a diferena entre o valor mdio,
que representamos por X obtido em uma amostra difere ou no significativamente da
populao referncia. Ou seja, testar se Ho: o = X onde o a mdia da populao
onde a amostra foi retirada. No se conhece o desvio padro () )da populao.
No menu SPSS, abrir os comandos File>Open>Data... e na e na caixa de
dilogo selecionar o arquivo corticosteride pr-natal.sav. importante verificar se a
33
34
35
36
37
38
39
40
41
df1
8
df2
209
Sig.
,203
Between Groups
Within Groups
Sum
of
Squares
211,110
933,501
df
8
209
Total
1144,612
217
Mean Square
26,389
4,467
F
5,908
Sig.
,000
1-Between Groups (entre os grupos): significa variao das mdias dos quatro grupos
em torno da mdia geral para 95 observaes)
2-Within groups (dentro dos grupos): representa a variao das observaes individuais
em torno da mdia do respectivo grupo
Valores de significncia baixos indicam diferenas entre as mdias dos grupos.
Como a significncia foi 0,000 (valor de p<0,05), indica que h , pelo menos, uma
diferena entre os grupos analisados. Assim, rejeitamos a hiptese nula (a variabilidade
ENTRE os grupos foi suficientemente grande face variabilidade DENTRO dos
grupos). Portanto, podemos dizer que a idade gestacional mdia no igual entre os 10
grupos de Apgar no 5 minuto. No grfico das mdias para os 10 grupos de Apgar no 5
minuto, o grupo 3 (menor idade gestacional) destaca-se dos demais grupos (Figura 66).
43
Data
Editor
do
SPSS
Na caixa de dilogo One-Way ANOVA, alm das opes que foram escolhidas no
procedimento anterior, clicar n em [Post Hoc].
Alm das tabelas anteriores, surgira a tabela Post Hoc Multiple comparisons, onde se
encontram as comparaes entre as mdias dos dois grupos (Figura 69).
44
45
-A coluna Sig mostra a significncia estatstica (p) para a diferena entre as mdias das
amostras (significante se p<0,05).
-A prxima coluna mostra os limites dos intervalos de confiana de 95% para as
diferenas entre as mdias das amostras.
Interpretao:Vejam que o Grupo 3 apresentou diferena significativa em relao
aos grupos 4,7 9 e 10, mas no em relao aos grupos 1 e 8.
Obtendo o grfico Boxplot como j vimos anteriormente (obtido com o comando
Explore,) d uma melhor viso do que o Means Plot, a distribuio da idade gestacional
no grupos de Apgar ao 5 minuto (Figura 70).Vejam:
V-3.Qui-quadrado
46
Na caixa de dilogo Crosstabs, selecionar uso sexo nas Row (s) (linhas) e uso
de corticosteride nas Column(s) (colunas) (Figura 72)
47
48
49
50
Fig.78.Resultados do X2
Interpretao: observamos que a pneumonia ocorreu significativamente menos nos
RN cujas mes receberam corticosteride pr-natal (OR: 0,31, com intervalo de
confiana de 0,12-0,77)ou seja, houve diminuio da pneumonia intra-uterina em 69%
(1-0,31=0,69 x 100= 69%) nos RN expostos ao corticosteride pr-natal em relao aos
RN no expostos e a estimativa da variabilidade foi de 23% a 88% (1-0,77=0,23 x
51
Estatistica
Vejamos um exemplo: Uso de drogas na Sala de Parto e Uso do corticosteride pr-natal
52
Digite APENAS nas caselas de cor laranja e NUNCA nas caselas azuis.
Juntamente com o resultado da odds ratio temos o intervalo de confiana. Interpretao:
houve diminuio do uso de drogas na sala de parto em 48% (1-0,52=0,48 x 100) no
grupo do corticosteride, porm no foi significativo, pois no intervalo de confiana
contem a unidade.
Voc pode tambm usar este site para realizar clculos estatsticos em Testes
Diagnsticos, obtendo a sensibilidade, especificidade, valor preditivo positivo e o valor
preditivo negativo, alm de poder obter a Estatstica Kappa, descrita por Cohen, o
chamado ndice Kappa para avaliar o grau de acerto do procedimento, ou seja, para
avaliar o quanto o resultado do procedimento escapa do azar. Temos usado a seguinte
escala de interpretao:
0,75 - 1: muito bom; 0,4< 0,74: regular a bom; 0,35: ruim (o diagnstico
no explicado pelo procedimento e sim pelo azar em 95% das vezes). Vejamos um
exemplo:
importante conhecer o intervalo de confiana a 95% do ndice Kappa para dar-lhe mais peso
ao resultado achado. A significncia dar-se- pela ausncia da unidade no intervalo de confiana
53
exemplo, peso e altura, em quanto aumenta o peso medida que a estatura aumenta? O
comportamento conjunto de duas variveis quantitativas pode ser observado atravs de
um grfico denominado Diagrama de Disperso e medido atravs do Coeficiente de
correlao.
Diagrama de Disperso:
Na representao grfica, importante sempre colocar no eixo das abscissas
(horizontal) a varivel independente ou explanatria ou preditora (X) e no eixo das
ordenadas (vertical), a varivel dependente ou desfecho. A correlao quantifica quo
bem X e Y variam em conjunto
Correlao linear de Pearson
O coeficiente de correlao (r de Pearson) expressa quantitativamente as
relaes entre duas variveis. um nmero puro, usado para classificar a correlao
em: r = 1: perfeita; r = 0,80 - <1: muito alta; r = 0.60 - <0,80: alta; r = 0.40 - <60:
moderada; r = 0,20 - <0.40: baixa; r = 0 - <0.20 muito baixa; r = 0: nula forte. O
coeficiente de correlao um ndice de magnitude na qual se associam duas variveis.
Antes de se realizar uma anlise de correlao, devemos fazer um grfico de
disperso (Scatterplot) para a verificao do comportamento das variveis.
No menu Graphs, selecionar Scatter (Figura 79).
54
55
Reta de
Regresso
56
r2
57
58
59
Fig.91.Menu Analyze>Correlate>Partial
Na caixa de dilogo Partial Correlations, escolhemos controlar (Controlling for)
a idade gestacional. Clicar em [OK] (Figura 92).
61
62
Uma varivel binria aquela que aceita apenas dois nveis de resposta, como
sim ou no. J uma varivel ordinria segue uma ordenao natural das coisas, como
pequeno, mdio e grande ou classificao como ruim, bom ou excelente. A varivel
nominal tem mais de trs nveis sem nenhuma ordenao (objeto azul, preto, amarelo e
vermelho ou na previso do tempo, ensolarado, nublado, chuvoso).
No exemplo a seguir vamos realizar uma Regresso Logstica Binria
utilizando o SPSS. No exemplo, a varivel resposta ser a ocorrncia de Apgar<= 3 no
5 minuto (sim ou no), caracterizando uma varivel binria. As variveis independentes
escolhidas foram aquelas que se associaram individualmente ao Apgar <=3 no 5
minuto: corticide, hipertenso materna, tipo de parto e pr-natal.
Analyze>Regression>Binary Logistic (Figura 94)
Fig.9
4. Menu Analyze>Regression>Binary Logistic
Na caixa de dilogo Logistic Regression, selecionamos apgar5minmenor3
(Apgar <=3: sim e >3: no no 5 minuto) como varivel dependente (binria),que
varivel de sada e corticosteride pr-natal (cortico), hipertenso, parto e pr-natal em
Covariates (covariveis), que sero as variveis previsoras. Clicar em Options e
selecionar Cl for exp(B(Figura 95)
63
64
65
66
Fig.101. Output viewer da regresso logstica: estimativa dos coeficientes dos previsores
Como interpretar: A regresso logstica binria apresenta-se um mtodo para
determinar a probabilidade de ocorrncia dos valores preditos de uma varivel
dicotmica. A apresentao tem como componentes chaves o P-value, o valor dos
coeficientes e as odds ratio (Exp (B). A interpretao dos resultados est focalizada
nestes componentes. Assim, vejam que as duas variveis que permaneceram no modelo
foram o corticosteride pr-natal (Exp(B) de 0,545 (Odds ratio ajustada), que traduz
uma diminuio da sepse nos RN expostos ao esteride pr-natal de 46% (1-0,545=0,46
67
68
Fig. 101a: Caixa de dilogo para a regresso linear para os dados de bito
Fig. 101b: Caixa de dilogo para a Statistics da regresso linear selecionando Colinearity diagnostics
69
70
VIII-1-Teste U de Mann-Whitney
Usado para a comparao de variveis ordinais ou quantitativas entre dois
grupos independentes,quando a distribuio no simtrica (normal), ou seja quando h
ruptura dos pressupostos paramtricos; corresponde ao teste t de Student para amostras
independentes.
Quando a amostra tiver mais de 20 observaes, a estatstica U tende a uma
distribuio normal; no Output Viewer ser apresentado o resultado da estatstica z,
alm do resultado do teste U, mas a significncia pelo valor p, ser a mesma.
Selecionar Analyze>Nomparametric Test>2 Independent Samples (Figura 105)
72
Fig.109. Caixa de dilogo Two-Related-Samples Test, de onde pode ser obtido o teste de
Wilcoxon
Clicar em [OK] e o Output viewer mostrar (Figura 110)
73
VIII-3-Teste H de Kruskal-Wallis
Este teste uma alternativa no paramtrica para a anlise de varincia de um
critrio de classificao (One-Way ANOVA). Pode ser usado para comparar vrias
amostras independentes. Ao ser usado 2 grupos para comparao, os resultados so os
mesmos dos teste de U de Mann-Whitney. Como ocorre no teste F de uma NOVA
paramtrica, um valor significativo de F no indica onde se encontra a diferena,
devendo ser realizado o teste de Tukey. J no teste H de Kruskal-Wallis, para identificar
a diferena, deve ser realizado o teste de Dunn, no disponvel no SPSS.
Selecionar Analyze>Nonparametrics Test>K Independent Samples (Figura 111)
74
Fig. 112. Caixa de dilogo Test for Several Independent Samples de onde se obtm o
teste H de Kruskal-Wallis
Na janela do Output Viewer, vamos ter (Figura 113):
75
Fig.115. Caixa de dilogo Test for several Related Samples, de onde se obtm o teste de
Friedman
Clicar em [OK] e a janela do Output Viewer mostrar (Figura 116)
76
77
78
79
80
81
82
83
84
evento (Define Event), devendo especificar o valor que mostra o resultado que se avalia
(neste caso, o valor 1=morte) (Figuras 124 e 125)
85
86
87
88
89
90
X- CURVA ROC
91
Muitos exames dos nossos pacientes tem valores medidos numa escala numrica
e assim a sensibilidade e a especificidade dependem de onde se coloca o ponto de corte
(cut off) entre os resultados positivos e negativos.
Uma forma mais eficiente de demonstrar a relao normalmente antagnica
entre a sensibilidade e a especificidade dos exames que apresentam resultados
contnuos so as Curvas de Caractersticas de Operao do Receptor (Curvas ROCReceiver Operating Characteristic). A Curva ROC uma ferramenta poderosa para
medir e especificar problemas no desempenho do diagnstico em medicina por permitir
estudar a variao da sensibilidade e especificidade para diferentes valores de corte.
A Curvas ROC foram desenvolvidas no campo das comunicaes como uma
forma de demonstrar as relaes entre sinal-rudo. Interpretando o sinal como os
verdadeiros positivos (sensibilidade) e o rudo, os falsos positivos (1-especificidade),
podemos entender como este conceito pode ser aplicado em medicina.
A Curva ROC um grfico de sensibilidade (ou taxa de verdadeiros positivos)
versus taxa de falsos positivos (Figura 134)
93
94
96
A seguir, clicar em [ OK] e teremos a Curva ROC, que um ndice visual da preciso
do ensaio (Figura 141)
97
98
Area
Std. Error
,996
Asymptotic
Sig.b
Lower Bound Upper Bound
,001
,000
,994
,999
Fig.143.
Positive if
Greater Than Sensitivit
or Equal Toa
y
Coordenadas da
Curva ROC:
A varivel resultado
do teste(s)
1Specificity
,00
1,000
1,000
1,50
,997
,058
2,50
,995
,040
3,50
,993
,024
4,50
,988
,017
5,50
,978
,015
6,50
,973
,012
7,50
,965
,003
9,00
,000
,000
100
Fig. 144. Curva ROC para o CRIB, CRIB II e SNAPPE-PE. A rea sob a
curva foi: CRIB, 0,903; CRIB-II, 0,907; SNAPPE-II, 0,837.
Observem que as Curva do CRIB e CRIB-II esto mais prximas do canto
superior esquerdo do diagrama, o que confere maior rea sob a curva e portanto, maior
poder de discriminao em relao ao SNAPPE-II.
Finalizando, segundo Field A, os procedimentos estatsticos so uma forma de
processar nmeros e, portanto, se voc colocar baboseiras em uma anlise mesmo assim
obter concluses que tem significado estatstico, mais que provavelmente no tero
sentido prtico. Existe uma tentao de ver a estatstica como uma forma milagrosa de
determinar a verdade, mas a estatstica somente um recurso. Se voc entra com lixo,
voc vai obter lixo. Na anlise estatstica no existe um substituto para o pensamento
emprico. Tenha sempre isto em mente.
Torture os nmeros e eles admitiro qualquer coisa
Nota: este texto ser continuamente revisado e ampliado medida quer for sendo
discutido com os estudantes do 6 Ano da Escola Superior de Cincias da Sade
(ESCS) /SES/DF (Faculdade de Medicina da Secretaria de Estado de Sade do
Distrito Federal).
101
XI- REFERNCIAS
1- Wagner MB, Mota VT, Dornelles CC. SPSS Passo a Passo, Educs, Caxias do Sul,
2004
2- Field A. Descobrindo a Estatstica usando o SPSS, Artmed,2 Edio Porto Alegre,
2009
3-Filho Doria U. Introduo a Bioestatstica (Para simples mortais), Negcio Editora,
So Paulo, 2 Edio,1999
4-Arango HG.Bioestatstica Terica e Computacional, Guanabara Koogan, Rio de
Janeiro,2001
5- Vieira S. Introduo Bioestatstica, Editora Campus, 2 Edio, Rio de Janeiro,
1991
6-Sounis E. Bioestatstica.Princpios fundamentais, metodologia estatstica, Aplicao
s Cincias Biolgicas,Livraria Atheneu
7-Bisquerra R, Sarriera JC, Martinez G. Introduo Estatstica. Enfoque Informtico
com o Pacote Estatstico SPSS, Artmed, Porto Alegre, 2004
8. Margotto PR. Entendendo Bioestatstica Bsica. Boletim Informativo Peditrico
(Enfoque Perinatal), No65, Ano 22, Braslia, p.6-108, 2002. Disponvel em
www.paulomargotto.com.br, em Entendendo Bioestatstica Bsica (Acessado em
30 de outubro de 2009)
9-Margotto PR. Como exercer a Medicina/Neonatologia baseado em evidncias. In.
Margotto PR. Assistncia ao Recm-Nascido de Risco, Hospital Anchieta, 3
Edio, Braslia, no prelo. Disponvel em www.paulomargotto.com.br em
Exerccio da Medicina Baseado em Evidncia (Acessado em 20 de outubro de
2009)
10-Penha RN. Um estudo sobre regresso logstica binria. Universidade de Itajub,
Instituto de Engenharia Mecnica, Departamento de Produo. Disponvel em
UM ESTUDO SOBRE REGRESSO LOGSTICA BINRIA Renata Neves
Penha ... (Acessado em 30 de novembro de 2009)
11.Batistela G C, Rodrigues AS, Bononi JTCM. Estudo sobre a evaso escolar usando
regresso logstica: anlise dos alunos do Curso de Administrao da Fundao
Educacional de Ituverava. Tkhne Lgos, Botucatu, SP, v.1, n.1, p.53-66,
out.2009. Disponvel em ESTUDO SOBRE A EVASO ESCOLAR
USANDO REGRESSO LOGSTICA: ANLISE ...
12- Programas desenvolvidos na Braile Biomdica S/A. Disponvel em Estatistica
(Acessado em 30 de dezembro de 2009)
13-NRM Consultoria Estatstica Ltda. Curso de Estatstica com a Utilizao do SPSS,
ESCS, 2009
14.Whelan B, Bennett K et al. Serum sodium as a risk factor for in-hospital mortality in
acute unselected general medical patients. QJ Med 2009;102:175-182
15-Silva AP. Curso Bsico de Estatstica utilizando o SPSS. ESCS, julho de 2006
16-Laboratrio de Epidemiologia e Estatstica. Lee - Laboratrio de Epidemiologia e
Estatstica (Acessado em 21 de abril de 2010)
17-Botelho F, Silva C, Cruz F. Epidemiologia explicada-anlise de sobrevivncia. Acta
Urolgica 2009;26:4:33-38. Disponvel em Epidemiologia explicada Anlise de
Sobrevivncia (acessado em 14 de maio de 2010)
102
103