Академический Документы
Профессиональный Документы
Культура Документы
Estatstica Descritiva
Considere um conjunto de dados obtidos via amostra (ou mesmo toda a populao).
O objetivo nesse momento ser o de organizar, resumir e apresentar estes dados, de tal forma que possamos interpret-los luz dos objetivos da pesquisa. Esta parte do tratamento de dados chamada de Estatstica Descritiva.
Dados Estatsticos
Em um conjuntos de dados, temos os indivduos e as informaes relativas a esses indivduos, as variveis. Segue que: a) Indivduo ou unidade elementar: a entidade de base sobre a qual o observador realiza um certo nmero de medies. Exemplo: um paciente, um usurio, um empregado, um dente, uma cidade, um pas, um eleitor, etc...
Dados Estatsticos
b) Variveis: conjunto de informaes levantadas para cada indivduo. Exemplo: no caso de um estudo clnico, os indivduos seriam os pacientes atendidos e as variveis seriam o sexo, a idade, presso d/s, altura, tipo de sangue, nmero de cries Quanto ao tipo as variveis podem ser quantitativas e qualitativas. Quanto funo no estudo as variveis podem ser respostas ou explicativas. A tcnica estatstica depende do tipo de varivel.
Tipos de Variveis
- Quantitativa: quando seus possveis valores so assumidos numa escala numrica: salrio, idade, altura, peso, etc... Pode ser:
Pode ser: Discreta: resultado de uma contagem; Contnua: resultado de uma medio.
Tipos de Variveis
- Qualitativa: quando seus possveis valores assumem modalidades no numricas (categricas), como sexo, profisso, escolaridade, regio, nvel hierrquico, etc...
Pode ser:
Nominal: vrios atributos; Ordinal: varivel ordenada (nvel hierrquico, nvel de satisfao).
Planilha de dados
VAR 2
...................
VAR p
TABELAS
Variveis Quantitativas
Tabela de freqncias (nmero de casos) Consiste em agrupar os dados em classes prestabelecidas tais que, quando reunidos, abrangem todo o conjunto de dados.
Tabelas de Freqncias
O nmero de casos em cada classe chamado freqncia absoluta. A percentagem de dados em cada classe estamos nos referindo freqncia relativa. A soma das freqncias (absoluta ou relativa) das classes anteriores chamada freqncia acumulada (absoluta ou relativa respectivamente).
Tabelas de Freqncias
classes freq. absoluta (fa) freq. relativa (fr) (%) freq. acumulada freq. acumulada absoluta (FA) relativa (FR) (%)
100(%)
n = total de dados -
100 (%) -
Tabelas de Freqncias
O nmero de classes uma escolha arbitrria. Em geral, usam-se de 5 (cinco) a 20 (vinte) classes.
Variveis Qualitativas
Consiste em colocar as categorias e as respectivas freqncias (absoluta e relativa) de cada categoria.
Tabelas de Freqncias
S exo
Frequncia Sexo Feminino Masculino T otal No Respondeu T otal 290 191 481 1 482
Tabelas de Freqncias
Qual a rea preferida?
Exatas
Freqncia 72
% 14,9
% Vlido 19,2
Humanas
Biomdicas Total No Total
198
105 375 107 482
41,1
21,8 77,8 22,2 100,0
52,8
28,0 100,0
GRFICOS
Variveis Quantitativas
Histograma Polgono de Freqncias Box-Plot Grfico de Mdias
Histograma
A Figura a seguir mostra um histograma, construdo a partir de uma tabela de freqncias. So retngulos justapostos, feitos sobre as classes da varivel em estudo. Sobre cada classe tem-se um retngulo, cuja altura corresponde freqncia observada desta classe. O histograma pode ser construdo tanto com as freqncias absolutas quanto com as freqncias relativas.
Histograma
300
200
100
80
60
40
20
Co leste rol
0 0, 39 0 0, 37 0 0, 35 0 0, 33 0 0, 31 0 0, 29 0 0, 27 0 0, 25 0 0, 23 0 0, 21 0 0, 19 0 0, 17 0 0, 15 0 0, 13 0 0, 11
Histograma
Histograma
160 140 120 100 80 60 40 20 0 25,0 75,0 125,0 175,0 225,0 275,0 325,0 375,0 425,0 475,0 525,0
Histograma
160 140 120 100 80 60 40 20 0 135 ,0 140 ,0 145 ,0 150 ,0 155 ,0 160 ,0 165 ,0 170 ,0 175 ,0 177 ,5 137 ,5 142 ,5 147 ,5 152 ,5 157 ,5 162 ,5 167 ,5 172 ,5
Polgono de freqncias
16 14 12 10 8 6 4 2 0 0 5 15 25 35 45 55 65 75
Grfico de Linhas
Dados Prevalncia e Incidncia 1980 a 1998
40
30
20
10 prevalncia 0 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 incidncia
ANO
Variveis Qualitativas
Grfico de Barras
40
28,0% Exatas
Percentual
30
19,2%
20
10
Medidas de posio
Objetivam resumir um conjunto de valores em um nico valor.
Medidas
Medidas
Posio
Disperso
Assimetria
Curtose
Medida de Achatamento
Medidas de Posio
DMedidas de Posio Digite o ttulo aqui
Tendncia Central
Medidas de Ordem
- Quartil - Percentil
Mediana
A mediana o valor que divide a distribuio dos dados ao meio. Ou seja, deixa os 50% menores valores de um lado, e os 50% maiores valores do outro lado. Para se calcular a mediana, os dados devem estar ordenados. Por exemplo, ordenando-se as notas da turma D temos: 0, 5, 6, 7, 7.3, 7.5, 8.5. A mediana da turma C a 4a. (quarta) observao ordenada, porque essa observao deixa 3 outras de um lado (0, 5, 6) e 3 do outro (7.3, 7.5, 8.5). Logo a mediana vale 7.
Mediana
Nem todos os conjuntos de dados tm um valor central to ntido como exposto acima. Por exemplo, se tivermos um nmero par de observaes? Assim, vamos definir um critrio para acharmos a mediana: A mediana de um conjunto de dados ordenados, representada por Md ser o valor que: n mpar o valor que ocupa a posio (n + 1)/2. n par: a mdia dos valores que ocupam as posies (n/2) e (n/2 + 1)
Vantagens da Mediana
Fcil de calcular;
no afetada por valores extremos; um valor nico; pode ser aplicada nas escalas ordinal, intervalar e proporcional.
Desvantagens da Mediana
Difcil de incluir em equaes matemticas;
No utiliza todos os valores da varivel.
Moda
Moda (Mo) o valor da varivel que mais se repete, o que possui maior freqncia. Uma varivel pode ter mais de uma moda (bimodal, trimodal, etc...). A moda uma medida resistente, pois est relacionada somente com a freqncia de um ou mais valores da varivel. Por exemplo, a mudana de um valor da varivel pode no afetar a moda.
Vantagens da Moda
Fcil de calcular;
No afetada por valores extremos; Pode ser aplicada em qualquer escala: nominal, ordinal, intervalar e proporcional.
Desvantagens da Moda
Pode estar afastada do centro dos valores;
Difcil de incluir em equaes matemticas; No utiliza todos os valores da varivel; A varivel pode ter mais de uma moda; Algumas variveis no tm moda.
Mdia Aritmtica
O conceito de mdia aritmtica, ou simplesmente mdia, bastante familiar. Matematicamente, ela a soma de todos os valores divididos pelo nmero de valores somados.
Mdia Aritmtica
Caractersticas Importantes da Mdia: 1. A mdia est posicionada de forma equilibrada entre os valores da varivel; 2. Todos os valores da varivel so includos no clculo da mdia; 3. A mdia um valor nico que pertence ao intervalo dos dados; 4. A mdia influenciada pelos valores extremos.
Vantagens da Mdia
Fcil de compreender e aplicar;
utiliza todos os valores da varivel; um valor nico;
Desvantagens da Mdia
afetada por valores extremos;
necessrio conhecer todos os valores da varivel.
Medidas de Ordem
O interesse est em conhecer a posio de um determinado valor em relao ao grupo de valores.
Calcular: Quartis Percentis
Quartis
Os quartis so os valores que dividem os dados ordenados em quatro partes, com igual nmero de dados. O primeiro quartil (Q1) delimita os 25% menores valores. O terceiro quartil (Q3) o valor que separa os 25% maiores valores. O segundo quartil a prpria mediana.
Box-Plot
O diagrama dos 5 nmeros uma forma de resumir os dados com os quartis, extremos e o nmero de observaes do conjunto de dados. Atravs desses nmeros podemos ter informaces sobre a posio central, disperso e assimetria da distribuio de freqncias. uma maneira de representar graficamente aspectos relevantes de uma distribuio de freqncias.
Box-Plot
Basicamente, traa-se dois retngulos: um representando o espao entre o quartil inferior e a mediana; e o outro o espao entre a mediana e o quartil superior. Esses dois retngulos representam a faixa dos 50% valores mais tpicos da distribuio. Entre os Quartis e os extremos, traase uma linha. Essa linha traada at o limite de Q3 + 1,5(Q3 Q1) para a parte superior e Q1 1,5(Q3 Q1) para a inferior. Valores que caem fora dessas linhas so considerados valores discrepantes, sendo indicados por pontos.
Box-Plot
400 300
200
100
3 9
0
N = 4 0
T axa d e co le ste ro l
Percentis
Ordenados os dados, os percentis so medidas que separam percentuais dos dados. Percentil 1: separa 1% dos menores dados; Percentil 20: separa 20% dos menores dados; Percentil 80: separa 80% dos menores dados e 20% dos maiores; etc....
Medidas de Disperso
Medem o grau de variabilidade de um conjunto de dados
MEDIDAS DE DISPERSO
DESVIO MDIO: soma dos mdulos dos desvios dividido pelo total de dados. VARINCIA: soma dos quadrados dos desvios dividido pelo total de dados menos 1 (amostra).
Exemplo
Exemplo: A tabela abaixo mostra as notas finais dos alunos de trs turmas e a nota mdia de cada turma.
TURMA A B C 4 1 0 5 2 6 NOTAS DOS ALUNOS 5 6 6 7 4 6 6 9 7 7 7 7,5 7 10 7,5 8 10 MDIA 6,0 6,0 6,0
Medidas de Disperso
Essas medidas do uma idia de quo homogneos ou heterogneos so os dados.
Para calcularmos essas medidas, devemos considerar os desvios de cada valor em relao mdia. Depois, constri-se uma mdia desses desvios. Por exemplo, considere as notas da turma A:
Desvio da Mdia
Notas da turma A 4 5 5 6 6 7 7 8 Soma Desvio = Nota Mdia 4 6 = 2 5 6 = 1 5 6 = 1 66= 0 66= 0 76= 1 76= 1 86= 2 0
Varincia
Notas da turma A 4 5 5 6 6 7 7 8 Soma Desvio = Nota Mdia 4 6 = 2 5 6 = 1 5 6 = 1 66= 0 66= 0 76= 1 76= 1 86= 2 0 (Desvio)2 4 1 1 2 0 s 0 1 1 4 12
i 1 xi x
n
n1
Varincia
sempre um nmero positivo;
se todos os valores de uma amostra forem iguais, a varincia zero;