Академический Документы
Профессиональный Документы
Культура Документы
multivariada
grficos
medidas-resumo
moda)
medidas de disperso (amplitude, desvio-padro,
erro-padro)
medidas separatrizes (percentis, quartis, decis)
INFERNCIA ESTATSTICA
conjunto de tcnicas que tem como objetivo
estudar uma populao atravs de evidncias
fornecidas por uma amostra.
Teste de hipteses
Estimao
Permite ao pesquisador ir alm da descrio dos
dados e fazer inferncias sobre a populao com
base nas amostras.
Estas inferncias tm limitaes no se podendo
ter certeza absoluta de que esto corretas.
TESTE DE HIPTESES
HIPTESES H0 : = 1,65m
ESTATSTICAS H1 : > 1,65m
HIPTESES ESTATSTICAS
H0 : Hiptese de igualdade ou nulidade
H1 : Hiptese alternativa
Aplicar um teste de hipteses significa calcular
as probabilidades de errar ao se aceitar ou
rejeitar a hiptese de nulidade H0
A deciso sempre tomada em relao H0:
Aceita-se ou rejeita-se H0
ESTIMAO
Qual a distribuio da altura dos brasileiros
adultos?
1 possibilidade:
medir a altura de todos os Brasileiros adultos
no necessrio usar Inferncia Estatstica!
2 possibilidade:
escolher estrategicamente uma amostra
(X1,X2,...,Xn) de brasileiros adultos, que seja
representativa da populao de adultos, e atravs
dessa amostra inferir sobre os parmetros ( e 2)
da populao.
Estimao de parmetros populacionais
por ponto
mdia aritmtica e varincia populacionais
Estimao de parmetros
populacionais por intervalo
Intervalo de confiana: Seria impossvel construir
calculado com base na um intervalo de 100% de
amostra. confiana a menos que se
medisse toda a populao.
Pressupe-se que cubra o
parmetro de interesse com Se coletarmos infinitas
um certo grau de confiana. amostras e construirmos os
IC de 95%, em 95% das
95% o grau de confiana vezes os IC estaro corretos
mais utilizado (cobriro o parmetro) e em
5% das vezes estaro
errados.
Exemplos:
Tcnicas de Tcnicas de
interdependncia dependncia
(mtodos exploratrios) (mtodos de inferncia)
1 5,0
2 5,5
3 4,3
4 3,0
1 CONCEITO B
5 3,3
6 1,2 5 CONCEITOS C
7 4,4
8 5,4
9 3,0 14 CONCEITOS D
10 2,2
11 4,1
12 7,0
13 1,0
14 3,9
15 4,2
16 2,6
17 5,9
18 6,2
19 3,2
20 1,8
ANLISE DE CLUSTER
SOLUO = 6
GRUPOS
0 1 2 3 4 5 6 7
Notas avaliao
Agrupamento -Anlise de Clusters
a1 a F 1 0 1 1 Doena X
a1
a2 b M 0 0 1 1
a2 a3 a7 Doena Y
. c F 1 1 1 0
. a8 a10 a a9
5
d F 1 0 0 0
. a4 a6
e M 1 1 0 1 a11
Doena Z
Nome Sexo Sintomas
Nmero de Clusters = 3 Conceito = Doena
Anlise das variveis e dos objetos
Outliers e seleo das variveis
Deve-se localizar os outliers de cada varivel
Cabe ao pesquisador decidir se as variveis so
relevantes
Problemas com multicolinearidade
Padronizao das variveis
Medidas/escalas diferentes distorcem a
estrutura do agrupamento
Padronizao resolve problema de diferentes
escalas ou magnitudes das variveis
Padronizao faz com que seja atribudo o
mesmo peso para cada varivel
Tipos de padronizao
z-score
Mtodo range -1 a +1
Mtodo range 0 a 1
Mtodo da mxima amplitude
Mtodo da mdia=1
Mtodo do dp=1
Medidas de distncia
Distncia em geral
Qualquer funo d(x,y) que satisfaa as seguintes propriedades:
d(i,j) 0
d(i,i) = 0
d(i,j) = d(j,i)
d(i,k) d(i,j) + d(j,k) (desigualdade triangular)
Distncia poderada