Вы находитесь на странице: 1из 21

Raquel Pereira Alvares

Apostila de SPSS
Curso - MEIOS

Belo Horizonte
Outubro de 2009
Introdução

O SPSS é um software para a elaboração de análises estatísticas de matrizes de dados.


Através de seu uso é possível gerar relatórios tabulados, gráficos e todas as demais
ferramentas necessárias para a realização de uma análise descritiva e inferências a partir de
correlações.

A apostila viabiliza as informações básicas para a manipulação do SPSS. Ela


abordará, mesmo que superficialmente, todas as etapas de uma análise: edição de matrizes de
dados, manipulação de arquivos, transformação de dados, edição de relatórios e elaboração
de análises descritivas e de correlação entre as variáveis.

A apostila foi organizada com o intuito de seguir e fornecer as soluções práticas dos
freqüentes usuários do software.

2
Abrir o SPSS

Ao clicar no ícone do programa, será aberta esta janela. A primeira caixa de diálogo
deve ser ignorada, não é necessário fazer a opção nela. Trabalha-se diretamente no SPSS.

Janelas

Data editor: contém o banco que será analisado. É onde abrimos, salvamos, fechamos
os arquivos, criamos novos arquivos, inserimos informações, realizamos mudanças e
rodamos as análises estatísticas do SPSS.

Data Viewer: apresenta o resultado de todas as análises realizadas, em ordem de


execução. Todos os resultados são passíveis de modificação, tanto das cores das tabelas
quanto do formato do arquivo salvo, por exemplo. Tais modificações podem ser feitas com o
uso do mouse.

2
Construção de uma matriz de dados

Após a aplicação dos questionários seguem-se as fases de codificação e validação da


informação obtida para, a partir disso, construir uma matriz de dados.

Idade Indígena Branca Preta Amarela Parda Total

15-17 822 101900 27938 411 134370 265441

18-20 411 96966 34923 822 126556 259678

21-23 1232 105604 38212 1233 133117 279398

24-26 822 108054 37390 411 143800 291299

27-29 822 105183 46435 1233 121629 275302

Total 4109 517707 184898 4110 659472


1371118
0,30% 37,76% 13,49% 0,30% 48,10%
Fonte: PNAD 2007.

Para conceber as informações em uma apresentação numérica dos dados em linhas e


colunas distribuídas de modo ordenado, é necessário o estabelecimento de alguns critérios:

● A codificação dos dados recolhidos é feita em função do tipo de questões do questionário.


O questionário deve ser aplicado da maneira mais uniforme possível e elaborado
cuidadosamente.

● As categorias de resposta das perguntas fechadas estão definidas a priori.

● As perguntas abertas são codificadas posteriormente, em função da sua pertinência


sociológica, frequência, semelhança, etc.

● As variáveis que devem ser desconsideradas na análise devem ser codificadas como
missing, no Variable View.

● A confiabilidade das informações (distância do erro) está intimamente relacionada à


responsabilidade de quem as coleta.

● Esforço para não deixar perguntas sem resposta.

Dicas:

2
● Questionário

- Questões fechadas: número definido de opções de resposta, o que significa


praticidade na tabulação dos dados.

- Opção “Outros”: combinação com respostas abertas que podem ou não ser
categorizadas.

- Dar instruções claras no questionário.

- Oferecer opções de resposta o mais precisamente possível.

- Evitar questões longas e complexas.

- Evitar negativas duplas.

- Evitar jargões ou abreviações.

- Evitar palavras com duplo sentido.

- Evitar palavras carregadas de emoção ou que induzem a uma resposta socialmente


adequada.

- Evitar perguntas que induzem determinadas respostas.

- Quando apropriado, devem ser consideradas as alternativas “Não se aplica”


(NA:77); “Não respondeu” (NR:88) e “Não sabe” (NS:99). Caso os valores 77, 88 e 99
constem como resposta, devem ser usados outros algarismos para não ter o mesmo código
para informações distintas

- Sempre identificar o questionário.

●Dicionário

É um arquivo que permite o resgate das variáveis, são informações guardadas para
futuras consultas.

- Definir e nomear cada variável.

- Designar um número para cada possível resposta.

Manipulação de arquivos e edição de matrizes

2
A seção do SPSS denominada SPSS Data Editor é onde é feita a entrada, manipulação
e execução dos dados. É uma estrutura muito semelhante à do Excel, nela cada linha
representa um caso e cada coluna uma variável. Ou seja, cada coluna corresponde a uma
questão do questionário e cada linha, um questionário respondido.

Para a criação de uma matriz, como a apresentada abaixo, além do preenchimento das
informações, deve ser feita a descrição da variável, seu nome e outras características.

Podemos ver, no SPSS:

1) Cabeçalho: nome do arquivo, ou da matriz de dados que estamos trabalhando


(Untitled).

2) Abaixo da barra de ferramentas: o endereço da casela e o seu conteúdo.

3) Os nomes das variáveis: gênero, idade, etc., por exemplo (onde se lê var).

4) Número de casos: 8 (número de linhas, no canto esquerdo da tela).

5) Parte branca da tabela: casos nas linhas e variáveis nas colunas.

Manipulação

2
Os arquivos do SPSS são caracterizados pela terminação (*.sav). Para abrir arquivos
neste formato, na barra de ferramentas do programa deve ser selecionada a opção FILE,
depois OPEN. Na caixa de diálogo, na parte Examinar, deve ser selecionado o diretório onde
se localiza a matriz que vai ser trabalhada.

É possível também abrir arquivos em outros formatos compatíveis com o SPSS, tais
como Excel (*.xls), SAS (*.sas) e SigmaPlot(*.spw). Basta selecionar o tipo do arquivo e
seguir os demais passos.

Máscara

2
A máscara é o questionário adaptado para a posterior tabulação no SPSS. É feita na
outra aba, chamada Variable View.

No Variable View existem 10 colunas. Cada linha é uma variável e as colunas que
seguem funcionam como o detalhamento dela.

Name: é o nome dado à variável para identificá-la no banco.

2
Type: se a variável é do tipo numérica (Numeric), útil para variáveis ordinais e categóricas;
de data (Date), onde pode ser editado o formato de campo para a entrada de datas; dinheiro
(Dollar), entrada de valores monetários; ou aberta (String) quando as informações são alfa
numéricas, ou seja, contém qualquer tipo de informação desejada.

Width: tamanho, capacidade de caracteres. Caso a resposta seja aberta, deve-se sempre
aumentar o número de caracteres.

Decimals: número de casas decimais, usadas quando a variável é do tipo numérica.

Label: descrição mais extensa da variável, ou a transcrição da questão.

Values: significados dos valores de cada código, definição das diversas categorias de
resposta. (Ex.: 1=sim; 2=não)

Missing: indicar missig values para o banco, os valores que não devem ser considerados nas
análises estatísticas. (Ex.: Não respondeu=88) Pode ser feito também por intervalos.

Columns: alterar a largura da coluna na tabela da matriz, necessário quando a variável tem
mais de 8 caracteres.

Align: alinhamento (à direita ou à esquerda, por exemplo).

Measure: tipo de medida de cada variável. Scale, para medidas contínuas em intervalos,
categóricas; Nominal, para dados nominais; e Ordinal, para dados ranqueados ou ordenados.

Na coluna “Value Labels” é possível copiar e colar, nos casos em que as opções são
as mesmas para diferentes questões. É recomendável atenção redobrada nestes casos para não
haver multiplicação de erros. Os erros, quando identificados, devem ser imediatamente
corrigidos.

Dica: marcar a coluna onde está o problema, e clicar em “Find” (binóculo), digitar o
valor estranho e clicar em “Find Next”. Identificar, verificar e corrigir

Como reunir arquivos

2
Com o SPSS é viável a junção de informações contidas em arquivos diferentes.
Podem ser agregados mais casos no final do arquivo ou mais variáveis em cada caso. É
necessário o uso de uma variável chave, que deve ser igual nos dois bancos, para a agregação
para não ocorrer erros de conexão entre questionário e resposta. A variável chave deve ser
colocada em “sort ascending”, nos dois bancos e é imprescindível salvar.

Adicionar casos:

1) Abrir o 1º arquivo que deseja juntar.

2) Data → Merge files → Add cases.

3) Na caixa de diálogo External SPSS data file escolher o arquivo.

4) Continue → OK.

Adicionar Variáveis

1) Organizar em ordem crescente a variável chave (Data → Sort cases → ‘nome da


variável chave’).

2) Data → Merge files → Add variables.

3) Na caixa de diálogo External SPSS data file escolher o arquivo.

4) Excluded variables Box: variável chave das variáveis listadas.

5) Clicar em variável chave → Match cases on key variables.

6) Mover a variável chave para key variables box: todas as informações vão combinar
pela variável chave.

7) OK.

Sort Cases

Ordenamento dos dados de acordo com os valores de uma variável selecionada. A


ordem pode ser crescente ou decrescente.

2
Select cases

Separação de alguns casos para a análise mais detalhada, de acordo com o


estabelecimento de uma variável base. As opções de seleção de dados são All cases, todos os
casos; If Condition is Satisfied, se a condição for satisfeita; Random Sample Cases,
amostragem aleatória de casos; Based on Case Range, baseado em intervalo de caso e; User
Filter Variable, uso de variável filtro (esta opção exige um tipo especial de variável - dummy
– composta apenas de variáveis 0 e 1, dentre os quais somente os valores 1 serão
selecionados).

Split file

Determinação de uma variável categórica que será destacada nas análises posteriores
através da divisão das categorias desta variável, ou seja, separação do banco de dados em
grupos de análise.

Recode

Às vezes, uma variável precisa ser modificada antes de ser usada no SPPS. Esta
ferramenta transformar uma variável em outra diferente e nova. Exemplo: transformar a idade
simples em faixa etária.

2
Existem duas formas de realizar o “recode”, o mais fácil é deixar o SPSS fazer um
“recode” automático, nele serão selecionados os valores string do mais alto para o mais
baixo, ou vice versa, e dar números aos respectivos valores. Também é possível colocar os
valores string como “label” para variáveis numéricas.

Dica: sempre que fizer um “recode”, transformar em uma variável diferente.

1) Transform.

2) Recode.

3) Recode into different variable.

Cálculos envolvendo variáveis já existentes

Em alguns casos as variáveis podem se tornar melhores e forem mais detalhadas. É


possível fazer isso através da criação de uma nova variável que resultaria da operação
matemática com as outras variáveis envolvidas.

2
Frequência

Fornece o número de vezes que um valor ou um subconjunto de valores do domínio e


uma variável aleatória aparecem em uma experiência ou em uma observação. É útil para um
número pequeno de casos. Frequências simples ou absolutas são os valores que realmente
representam o número de dados de cada classe. Frequências relativas são os valores das
razões entre as frequências simples e a frequência total. Frequência acumulada é o total das
frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe.
Frequência acumulada relativa de uma classe é a freqüência acumulada da classe, dividida
pela frequência total da distribuição. Útil apenas para variáveis categóricas.

2
Gráficos

Estatísticas descritivas

Nesta ferramenta é possível gerar estatísticas úteis para resumir, de modo bem
conciso, as informações contidas em um conjunto de dados. Entre elas estão: a média, a
moda, a mediana e o desvio padrão, que são as mais usadas.

1) Analyse.

2) Descriptive Statistics: definição das informações desejadas.

Crosstabs

Geração de tabelas de contenção ou de dupla entrada. Dispõe a relação entre duas


variáveis categóricas no formato tabular, informações sobre relações bivariadas.

Correlação

Teste para verificar a existência de correlação entre duas variáveis contínuas.

1) Analyse.
2) Correlate.
3) Bivariate.

Associação com o Controle de Variáveis (Elaboração de um modelo)

Em um Crosstabs o pesquisador pode desejar o controle dos efeitos de uma


terceira variável. Isto pode ser feito computando as medidas de associação da
tabela original (X x Y) e de uma tabela semelhante para cada valor de Z
(Exemplo: voto e religião x sexo). A comparação de um coeficiente adequado na
tabela original com o outro, das tabelas de cada caso, alguns efeitos podem ser
notados:

 Sem efeito: quando as tabelas controladas apresentam medidas de associação


equivalentes, em magnitude e sinal, às da tabela original.

2
 Explicação: ocorre quando as variáveis de controle são causas anteriores das
variáveis independentes e dependentes, ou quando são variáveis de um estado
hipotético interno usadas para explicar a relação entre as variáveis observadas, e não
tem um modelo de relação causal direta entre as independente e as dependentes.
Nesse caso, as associações das sub tabelas se aproximam de zero consequentemente,
devem ser analisadas como não significativas. Nestes casos a associação original é
dita espúria, sendo assim, sua diferenciação, embora diferenciada estatisticamente,
deve ser feita em outra base, como o conhecimento de sequencias temporais dos
eventos relatados.
 Explicação parcial: ocorre quando existe um modelo direto da variável independente
para a dependente, mas a variável controle é também uma causa anterior ou uma
variável de confusão. Neste caso a associação das sub tabelas cai para
aproximadamente 0, comparada à associação original. Se a associação cai o
suficiente, mas não tanto a ponto de não ser significativa, isto é considerado um
indicativo de explicação, não de explicação parcial.
 Supressão: ocorre quando a variável controle tem efeito positivo na variável
dependente em uma parte do modelo e efeito negativo na outra. Para modelos com
três variáveis, a supressão ocorre quando tem um numero estranho de indicações
negativas. Nestas situações, a variável controle atua em uma direção. Quando a
supressão ocorre, a associação das sub tabelas será mais alta que a da tabela original.

- Dentro de cada casela está o número de casos que se encaixam naquele tipo
particular de combinação de respostas.

- O SPSS ainda pode disponibilizar na linha, na coluna e/ou no total, o percentual de


cada célula da tabela.

- O Crosstabs deve ser usado apenas com variáveis discretas, aquelas medidas
nominalmente ou em escalas ordinais.

2
Chi-square ou Qui-quadrado (x2)

Para saber se as diferenças nas respostas apresentadas nos Crosstabs são


significativas, deve ser feito um teste estatístico. Com o Qui-quadrado temos a significância
estatística da relação estabelecida. A regra geral estabelece que, para ser feira uma análise
correta dos dados, a freqüência esperada deve ser maior que 5, por isso se diz que este teste é
extremamente sensível ao tamanho da amostra.

Contingency coefficient

É uma medida baseada na relação entre duas variáveis categóricas. Sua amplitude vai
de 0 a 1 sendo que, 0 significa completa independência.

Lambda

Medida de associação para variáveis nominais. Mede a melhora percentual na


previsibilidade da variável dependente, dado o valor da outra variável.

Phi and Cramer’s V

Mede a força de associação entre as duas variáveis quando uma delas, ou ambas, são
do tipo nominal. Phi é apropriado para tabelas 2x2 enquanto Cramer’s V, é apropriado para
os demais casos. (Pode ser usado nos casos de freqüências iguais ou inferiores a 5).

Gamma ou Goodman and Kruskal’s gamma

É uma medida simétrica que varia de +1 a -1, baseada na diferença entre pares
concordantes (P) e pares discordantes (Q). (Deve ser usado com variáveis ordinais).

Somers’d

É o teste Gamma, modificado para penalizar os pares atados ao x somente em


hipóteses direcionais (assimétricas) nas quais x causa a predição de y; e para penalizar os
pares atados somente ao y, nas hipóteses em que y causa a predição de x. Sendo que P são
pares de concordância e Q são pares de discordância; Y0 são os pares no Y e X0 são os pares
no X. (Deve ser usado com variáveis ordinais).

2
Kendall’s tau-b

Mede a associação baseada no número de concordância e discordância em


observações pareadas. (Deve ser usado com variáveis ordinais).

Kendall’s tau-c

Medida de associação apropriada quando as duas variáveis são ordinais e não tem o
mesmo número de categorias. (Deve ser usado com variáveis ordinais).

Qui-quadrado de adequação (x2)

Teste para verificar se a distribuição de freqüências entre as categorias é equitativa


(Teste feito a partir de “Non-parametric tests”).

Explore

São ferramentas da estatística descritiva que exigem um pouco mais de conhecimento.


Neste ícone podem ser feitos histogramas, Box plot, diagramas de ramos e folhas, opção pelo
uso dos outliers, cálculo do percentil e escolha do intervalo de confiança.

1) Analyse.

2) Descriptve Statistics.

3) Explore.

Teste de hipótese

Hipóteses
H0 as variáveis são independentes.
Teste
H1 as variáveis são dependentes.
Teste
H0 a distribuição é normal.
H1 a distribuição não é normal
H0 as variâncias são iguais.
Teste
H1 as variâncias são diferentes
Teste
H0 µ = X.
H1 µ ≠ X.
H0 µa = µb.
Teste
H1 µa ≠ µb.
H0 µa = µb = µc.
Teste pelo menos uma população tem média
H1 diferente.

Se a probabilidade observada do teste de hipótese for inferior a 0.05, rejeita-se a


hipótese nula, caso contrário diz-se que não há evidência suficiente para rejeitar a Hipótese
Nula, ou seja, ela é aceita.
P ≥ 0,10 Não existe evidência contra H0

P < 0,10 Fraca evidência contra H0

P < 0,05 Evidência significativa...

P < 0,01 Evidência altamente significativa... 2


P < 0,001 “ Evidência clara”
Teste de hipótese simples

Todos os testes de hipótese envolvem uma amostra prescindem de uma hipótese nula.
A hipótese alternativa, por sua vez, pode ser de três tipos diferentes. Neste teste é verificado
se no intervalo de confiança da média amostral tem um valor “x”.

H0: µ=µ0

Left-tailed H1: µ<µ0 Right-tailed H1: µ>µ0 Two-tailed H1: µ≠µ0

1) Analyse.

2) Compare means.

3) One-Simple T Test

Teste Kolmogorov-Smirnov

Pode ser usado para testar se a característica estudada da amostra é oriunda de uma
população com distribuição normal.

1) Analyse.

2) Non parametric tests.

3) Sample K-S.

Teste T de Student para amostras independentes

Testa se existem diferenças significativas entre as médias, de uma determinada


variável, de dois grupos (α=0,05).
1) Analyse.
2) Compare means.
3) Independent-Samples T Test.

Teste T de Student para amostras emparelhadas

Análise transversal.

H0: µ0 - µ2 = 0 ou H0: µ0 = µ2.

H1: µ0 - µ2 > 0 ou H0: µ0 > µ2 (teste unilateral à direita).

Teste Fisher

É usado para amostras pequenas e produz menos erro em relação ao teste do Qui-
quadrado. Ele permite calcular a probabilidade das características analisadas serem
independentes. Usado quando a)n<20 e; b) 20<n<40, e a menor frequencia esperada for menos
que 5. O teste de Fisher calcula a probabilidade de que a tabela usada tenha sido obtida por

2
acaso e, portanto, sem mudar os totais das colunas e linhas, o teste de Fisher contrai todas as
tabelas possíveis. (São usados os mesmos comando do teste Qui-quadrado).

Teste McNemar

Testa se há uma mudança significativa no padrão após algum evento. (Campanha


publicitária).

1) Analyse.

2) Nonparametric tests.

Teste Levene

É usado para testar se k amostras tem a mesma variância. (Mesmos comandos do


Teste T).

Teste F ou One-Way ANOVA

One-Way ANOVA compara três ou mais grupos separados, baseado na hipótese de


que a distribuição é normal. Verifica, por exemplo, qual o efeito de uma variável
independente de natureza qualitativa (nominal ou ordinal), numa variável dependente de
natureza quantitativa.
1) Analyse.
2) Compare Means.
3) One-Way ANOVA.
Teste Bonferroni ou Post-hoc
Faz múltiplas comparações de médias quando, ao se rejeitar a hipótese nula, verifica-
se a probabilidade haver uma diferença entre as médias dos grupos analisados.
1) Analyse.
2) Compare Means.
3) One-Way ANOVA.
4) Post-Hoc.
5) Bonferroni.
Syntax

Este formato de comando do SPSS é um arquivo de texto com os comandos, o que


possibilita o acesso rápido, fácil e detalhado às informações. Ele pode ser criado usando um
editor de texto; colando, uma opção da caixa de diálogo do SPSS ou colando do output.

2
Regras para edição e escrita dos comandos da syntax

- Cada comando deve começar em uma nova linha e deve terminar com um ponto
final.

- A maioria dos sub comandos são separados por barras (/). A barra antes do primeiro
comando é opcional.

- Os nomes das variáveis devem ser escritos por inteiro.

- Texto entre apóstrofos ou outras marcas de citação devem estar em uma única linha.

- Cada linha do comando da syntax não pode exceder 80 caracteres.

- Os nomes das variáveis não podem terminar em ponto final.

- Os comandos da syntax são insensíveis aos casos.

2
Usando um editor de texto para criar a syntaxe
Deve-se estar familiarizado com os comandos do SPSS para tal feito. Siga as
instruções do editor de texto para criar e salvar como um arquivo do SPSS.

Bibliografia

http://iss.leeds.ac.uk/info/326/statistical_analysis/143/getting_started_with_spss_for_window
s_13/21

http://www.stat.tamu.edu/spss.php

http://www.nadn.navy.mil/Users/polisci/purkitt/slide1.htm

Pallant, Julie. SPSS survival manual: a step by step guide to data analysis using SPSS for
Windows (version 12).

Вам также может понравиться