Академический Документы
Профессиональный Документы
Культура Документы
ESTATÍSTICA DESCRITIVA
Prf: Vicente Cancho
Prfa: Katherine Zavaleta
2019
O que é Estatística ?
2
Definição de Estatística
3
Estatística Descritiva e Análise Exploratória
Etapas iniciais. Utilizadas para descrever e resumir
os dados. A disponibilidade de uma grande
quantidade de dados e de métodos computacionais
muito eficientes revigorou estas áreas da Estatística.
Probabilidade
Permite estudar os fenômenos aleatórios, ou seja,
aqueles em que está presente a incerteza sobre os seus
resultados.
4
Estatística
5
O que fazer com os dados coletados?
6
Variável
Qualquer característica de interesse associada aos elementos
de uma população.
Classificação de variáveis
Nominal Cor, tipo de máquina
Qualitativa
Ordinal Classe social, grau de desgaste
Contínua
Peso, viscosidade, pressão
Quantitativa
Discreta Número de filhos, número de
defeitos
7
Variáveis Quantitativas
8
9
Amostragem
Exemplos:
• Pesquisa de mercado,
• Pesquisa de opinião,
• Avaliação do processo de produção.
10
Amostragem Aleatória
Cada elemento da população tem
uma chance conhecida de ser
selecionado.
Amostragem Estratificada
Classificar a população em pelo
menos dois estratos e selecionar
uma amostra de cada um.
Amostragem Sistemática
Selecionar um elemento a cada k.
11
Amostragem por Conglomerados
Dividir a população em conjuntos
homogêneos, mas com elementos
heterogêneos. Selecionar aleatoriamente
alguns destes conjuntos e tomar amostras
deles.
12
Medidas de posição
Moda (Mo): É o valor (ou atributo) que ocorre com maior
freqüência.
Ex. Dados: 4,5,4,6,5,8,4,4
mo = 4
n
Média: x 1 + x 2 + x 3 + ... + x n
i= 1
xi
x = =
n n
Ex. Dados: 2,5,3,7,11
x = (2+5+3+7+11)/5 = 5,6
13
Mediana (Md)
A mediana é o valor que ocupa a posição central de um
conjunto de n valores ordenados.
Posição da mediana: pm = (n+1)/2
14
Quantis
O quantil de ordem p, em um conjunto de dados com n
observações, é o valor que ocupa a posição p x (n+1) nos
dados ordenados.
Casos particulares:
Quantil 0,5 = mediana ou segundo quartil (md)
Quantil 0,25 = primeiro quartil (Q1)
Quantil 0,75 = terceiro quartil (Q3)
15
Exemplos
Ex. 1. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
(n = 10)
Posição da Md: 0,5(n+1)=0,5x11=> Md =(3+3,1)/2 = 3,05
Posição de Q1: 0,25(11)=2,75 => Q1 = (2+2,1)/2 = 2,05
Posição de Q3: 0,75(11)=8,25 => Q3 = (3,7+6,1)/2 = 4,9
Ex. 2. 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6
(n = 11)
Md = 5,3
Q1 = 1,7
Q3 = 12,9
16
Considere as notas de uma prova aplicada a três grupos de alunos:
Grupo 1: 3, 4, 5, 6, 7; Grupo 2: 1, 3, 5, 7,9; e Grupo 3: 5,5,5,5,5.
0 10
G1
10
0
G2
0 10
G3
5
x 1 = x 3 = x 3 = 5; Md 1 = Md 3 = Md 3 = 5
17
Medidas de Dispersão
Grupo 1: A = 4
Grupo 2: A = 8
Grupo 3: A = 0
18
Intervalo interquartil (dq)
Ex. 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Q1 = 2,05 e Q3 = 4,9
19
Variância (s2)
n
2
2 2 2
ix x
(x x) +(x x) +...+(x x)
S2 = 1 2 n
= i=1
n 1 n 1
20
Cálculo da variância para o grupo 1:
2 ( 3 5 )2 +( 4 5 )2 +( 5 5 )2 +( 6 5 )2 +( 7 5 )2 10
S = = = 2,5
5 1 4
Desvio padrão
2
G1 : s = 2,5 s 1,58
2
G2 : s = 10 s = 3,16
2
G3 : s = 0 s = 0
21
Coeficiente de variação (CV)
S
CV = 100 ,
|x|
see x 0 .
22
Exemplo. Altura e peso de alunos
23
Organização e representação dos dados
24
Exemplo. Variável “Grau de instrução” (variável qualitativa)
Grau de fi fr
Contagem
instrução i
1o Grau 12 0,3333
2o Grau 18 0,5000
Superior 6 0,1667
Total n = 36 1,0000
fi : frequência absoluta da categoria i (número de indivíduos
que pertencem à categoria i)
fi
fr= : frequência relativa da categoria i
i
n
25
Representação gráfica de variáveis qualitativas
60,00%
50,00%
50,00%
40,00%
33,33%
30,00%
20,00% 16,70%
10,00%
0,00%
1o Grau 2o Grau Superior
Grau de instrução
26
Diagrama circular para a variavel grau de instrução
Diagrama circular para a variável grau de
1oGrau (33.3%)
instrução
Superior
17% 1o Grau
33%
2oGrau (50.0%) Superior (16.7%)
2o Grau
50%
27
2. Organização e representação de variáveis quantitativas
28
Representação gráfica
29
Determinação das medidas de posição e medidas de
dispersão para variáveis quantitativas discretas agrupados
em tabela de freqüências: k
Média: x f + x f ++ xk f k x f i i
x= 1 1 2 2 = i=1
n n
Mediana:
Dados ordenados: 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5
=> pm = (20+1) / 2 = 10,5 => Md = 2
30
Variância:
k
2
(x1 x )2 f1 + (x2 x )2 f 2 + + (xk x )2 f k
2
i
(x
i=1
x ) fi
s = =
n 1 n 1
Exemplo.
31
2.2 Procedimento de construção de tabelas de freqüência para
variáveis contínuas
PRIMEIRO INTERVALO:
Limite inferior: LI1 =MIN
Limite superior: LS1 =LI 1 +h
32
SEGUNDO INTERVALO:
Limite inferior: LI2 =LS1
Limite superior: LS2 =LI 2 +h
i-ÉSIMO INTERVALO:
Limite inferior: LIi =LS i− 1
Limite superior: LSi =LI i +h
Prossiga até que seja obtido um intervalo que contenha o valor máximo
(MAX).
33
• Ponto médio (ou marca de classe) de cada intervalo de classe:
* LSi + LIi
x =
i
2
•Freqüências absolutas de cada intervalo de classe.
•Freqüências relativas de cada intervalo de classe.
•Freqüências acumuladas absolutas de cada intervalo de classe.
i
Fi = f 1 + f 2 + + f i =
j= 1
fj
34
Exemplo. Variável peso (em kg).
Procedimento:
• Considere k = 5.
• MIN = 4; MAX = 23,30.
• A = MAX – MIN = 23,30 – 4 = 19,30
• h = 19,3/5 = 3,86
• Adotamos h = 3,9
• Cálculo dos limites de cada intervalo:
Primeiro intervalo
LI 1 = 4
LS 1 = 4 + 3,9 = 7,9
Segundo intervalo
LI 2 = 7,9
LS 2 = 7,9 + 3,9 = 11,8
35
Pontos médios: x1* =
4+7,9 = 5,95; x2* =
7,9+11,8 = 9,85; etc
2 2
36
Representação gráfica.
• Histograma (freqüências ou densidades)
37
• Densidade de freqüência (ou densidade):
f ri
f di
=
h
• Propriedade: soma das áreas dos retângulos = 1, pois
k
k f ri
k
i 1
h f di
h
h
f ri
1.
i 1 i 1
38
Histograma (freqüências relativas acumuladas, em %)
39
Exemplo em R
0.08
0.08
0.06
0.06
Densidade
Densidade
0.04
0.04
0.02
0.02
0.00
0.00
75 80 85 90 95 100
75 80 85 90 95 100
Rendimento (%)
Rendimento (%)
40
Escolha do número de classes (k)
k=31 k=13
0.4
0.3
Densidade
Densidade
0.2
0.2
0.1
0.0
0.0
7 8 9 10 11 12 13 7 8 9 10 12
X X
k=7 k=4
0.00 0.10 0.20 0.30
0.20
Densidade
Densidade
0.10
0.00
6 7 8 9 10 12 6 8 10 12 14
X X
41
Medidas de posição e medidas de dispersão para variáveis contínuas
agrupadas em classes.
k
Média: * * * x *
i fi
x f1 + x f 2 + x f k
1 2 k i =1
x =
n n
x1 + x 2 + + x 36 4 + 4,36 + + 23 ,30
x= = = 11,12
36 36
42
k
f x *
i i x
2
Variância: s2 i=1
n 1
Exemplo. Tabela na lâmina 45 x = 11 ,15
5
2
f i xi* x
699,66
s2 i=1
=
= 19,99
36 1 35
s = 4,47 ( Desvio padrão )
43
Gráfico de caixas (boxplot)
Representação dos dados por meio de um retângulo construído
com os quartis. Fornece informação sobre valores extremos
(dq = Q3 – Q1)
44
Boxplot em R
8 0 8 5 9 0 9 5
R e n d im e n to (% )
45
Boxplot em R
120
100
Redução de volume
80
60
40
20
0
A B C D E F G H
T i p o d e a d i ti vo
46
Associação entre variáveis quantitativas
Propriedades: (a) –1 r 1 e
(b) |r| = 1 se, e somente se, a relação entre x e y for linear.
47
Associação entre variáveis quantitativas
48
Associação entre variáveis quantitativas
49
Associação entre variáveis quantitativas
50
Associação entre variáveis quantitativas
E xemplo 1 E xemplo 2
10 11
9
Correlações:
8
9
Exemplo 1:
7
8
Y
Y
0,8164
6
7
5
6
Exemplo 2:
4
5
0,8162
3
4
4 6 8 10 12 14 4 6 8 10 12 14
Exemplo 3:
X X
0,8163
E xemplo 3 E xemplo 4 Exemplo 4:
0,8165
12
12
10
10
Y
8
8
6
6
4 6 8 10 12 14 8 10 12 14 16 18
X X
51
Exemplo em R. Dados na lâmina 17.
46
44
10 11 12 13 14 15 16
E s p e s s u ra
52
Exemplo em R. Dados na lâmina 17.
1
2
3
50
4
48
Resistência
46
44
10 11 12 13 14 15 16
E s p e s s u ra
53