Академический Документы
Профессиональный Документы
Культура Документы
Dados
Introdução
O primeiro passo em qualquer análise de dados consiste
em explorar os dados coletados.
1
Classificação das variáveis
As variáveis, de acordo a sua natureza se classificam em
quantitativas (discretas e contínuas) e qualitativas (nominal e
ordinal).
Variáveis
2
Análise das relações entre variáveis
Análise Univariada
Objetivo: apresentar característica ou tendência dos
dados de uma variável.
Tabulação de variáveis
Representação gráfica
3
Exemplo de tabela de frequências
10 |--- 20 38
20 |--- 30 45
30 |--- 40 30
40 |--- 50 22
50 |--- 60 10
60 |--- 70 15
Total 160
4
Representação Gráfica
850
750
650
Freqüência
550
450
350
250
150
Gradiente Panasonic Phillips Samsung Toshiba
Marcas
Representação Gráfica
Histograma: Renda por Estado Civil
500
450
400
350
300
250
200
150
100
50
Número de observações
0
0.68 6.46 12.24 18.02 23.80 29.58 0.68 6.46 12.24 18.02 23.80 29.58
3.57 9.35 15.13 20.91 26.69 3.57 9.35 15.13 20.91 26.69
Solteiro Divorciado
500
450
400
350
300
250
200
150
100
50
0
0.68 6.46 12.24 18.02 23.80 29.58 0.68 6.46 12.24 18.02 23.80 29.58
3.57 9.35 15.13 20.91 26.69 3.57 9.35 15.13 20.91 26.69
Outros Casado
Renda
10
5
Representação Gráfica
Box Plot das Alturas
210
200
190
180
170
160
150
140
130
ALTURA
11
Representação Gráfica
12
6
Avaliação de assimetria
freq Assimétrica freq. Assimétrica
à esquerda à direita
ou negativa ou positiva
Simétrica
13
Medidas de assimetria
3( x − med )
As =
s
mediana
média
desvio-padrão
14
7
Análise Bivariada
Variáveis qualitativas: realizações são atributos.
15
Tabela de Contingência
TABELA 3. Tipo de parto segundo categoria de internação em
nascidos vivos de parto único. São Luís - MA, 1997/98
16
8
Análise Bivariada
Variáveis quantitativas: valores numéricos
17
Gráfico de Dispersão
90
80
70
Peso
60
50
40
1,45 1,5 1,55 1,6 1,65 1,7 1,75 1,8 1,85 1,9
Altura
18
9
Coeficiente de Correlação de Pearson
A correlação é calculada independente da unidade de medida das
variáveis.
Fórmula: ∑ ( x − x)( y
i =1
i i − y)
r=
n n
∑ ( x − x) × ∑ ( y
i =1
i
2
i =1
i − y)2
19
20
10
Coeficiente de Correlação Linear de Pearson
20 20 60
50
15 15
40
10 10 30
20
5 5 10
0 0
0
0 5 10 0 5 10
0 5 10
r = +1 r ≈ + 0,80 r≈0
Relação
30
perfeita 25
30 Relação
25
20 20 perfeita
15 15
10 10
r ≈ - 0,80 5 5
r=-1
0 0
0 5 10 0 5 10
21
Normalidade
22
11
Teste de Normalidade
Teste Shapiro-Wilk ou Kolmogorov-Simirnov
23
Recodificação e Transformação
Criar novas variáveis usando condições fixadas.
Recodificação:
Criar novos valores para uma variável qualitativa.
Agrupar os valores de uma variável quantitativa contínua
em classes, através de expressões numéricas que têm
como resultados caracteres.
Transformação:
Criar novas variáveis quantitativas através da aplicação
de operações matemáticas às variáveis existentes.
24
12
Transformação
Diversas técnicas estatísticas são baseadas na
suposição de que os dados provêm de uma distribuição
normal ou, pelo menos, aproximadamente simétrica.
Transformação
A transformação logarítmica é a mais comum e geralmente
resolve os problemas de assimetria.
26
13
Observações atípicas
Dados atípicos (outliers) em relação aos demais, influenciam
enormemente as médias e a variabilidade dos dados,
podendo até mesmo distorcer conclusões.
27
Observações Atípicas
Detectando Observações atípicas (Outliers)
Box-plots
28
14