Академический Документы
Профессиональный Документы
Культура Документы
O que é Estatística
Definição Formal:
2
Exemplos de Aplicação
•Quanto será produzido de soja no Brasil em 2010?
•Qual a idade média das mulheres ao engravidarem
pela primeira vez?
•Qual o tempo médio de espera para consultas na
rede pública de saúde?
•Quem vencerá as eleições para prefeito de João
Pessoa em 2012?
•Qual o nível de escolaridade mais frequente dentre os
paraibanos?
•Quais são as variáveis que mais impactam o preço
dos imóveis em João Pessoa?
3
Os dois ramos da estatística
Estatística descritiva
Trata da organização, resumo e apresentação
dos dados.
Estatística Inferencial
A partir de uma amostra, tirar conclusões sobre
a população
4
Objetivo da estatística descritiva
Na estatística descritiva o objetivo é resumir os
•
5
CONCEITOS BÁSICOS
População
O conjunto de todas as respostas, medidas ou
contagens que sejam de interesse.
Amostra
Uma parte ou subconjunto da população.
População: Amostra: 6
CONCEITOS BÁSICOS
Parâmetro
Descrição numérica de uma característica da
população.
Ex: Média, Mediana, Desvio-Padrão.
Estimador
Característica numérica estabelecida para uma
amostra.
Ex: Média amostral, Mediana amostral, Desvio
Padrão amostral.
7
CONCEITOS BÁSICOS
Estimativa
Valor numérico assumido por um estimador numa
determinada amostra.
Variável Estatística:
Característica de interesse a ser investigada na
população ou na amostra. As informações observadas
na variável podem ser de natureza quantitativa ou
qualitativa.
8
Classificação das
variáveis
Classificação dos Dados
1. Qualitativos: Consistem em atributos, classificações ou
registros não numéricos.
Ex.: Casse Social, Grau de Instrução, Tipo Sangüíneo,
Porto de Embarque, Tipo de Navio, Exportador.
10
Dados Qualitativos
Nominais: não existe ordem entre os possíveis
valores.
Ex: gênero, bairro, curso, etc.
11
Dados Quantitativos
Discretos:Assumem apenas valores pertencentes a
um conjunto finito ou enumerável, em geral números
resultantes de contagens.
Ex: Número de filhos, quantidade de dias da semana em
que pratica atividade física, número de livros lidos, etc.
Contínuos: Assumem qualquer valor num intervalo de
variação.
Ex: peso (massa), altura, taxa de câmbio, Teor alcoólico
de bebidas etc.
12
Censo X Estudos por amostragem
•
Censo: quando todos os indivíduos de uma
população são pesquisados.
•
Estudo por amostragem: quando utilizamos uma
amostra de indivíduos de uma determinada
população.
1.Definição do problema
2.Planejamento
6.Análise e interpretação
1. Definição do problema
•
Formulação completa do problema a ser
estudado.
•
Definir a meta a ser alcançada diante do
problema em questão.
•
Levantamento de outros trabalhos realizados
no mesmo campo e trabalhos análogos, pois
parte da informação que o pesquisador
necessita poderá ser encontrada em trabalhos
anteriores e trabalhos em áreas correlatas.
2. Planejamento
•
Consiste em se determinar o procedimento
necessário para resolver o problema e, em
especial, como levantar informações sobre o
objeto de estudo. Nesta fase, deve-se levar em
consideração:
a)A correta formulação das perguntas que serão
feitas;
•
No resumo, calculam-se medidas cuja
finalidade principal é descrever o fenômeno que
se está investigando.
6. Análise e interpretação
•
O interesse maior reside em se tirar
conclusões que auxiliem o pesquisador a
resolver seu problema.
•
As conclusões são baseadas na observação
das tabelas, gráficos e medidas resumo.
Apresentação de dados
Apresentação tabular
•
Uma tabela é o meio mais simples de se resumir um
conjunto de observações.
•
Barras (horizontais ou verticais)
•
Setores (pizza)
•
Linhas
•
Dispersão
•
Gráfico de barras (verticais ou horizontais): tipicamente
utilizado na representação de variáveis qualitativas,
onde as grandezas relativas às categorias da variável
são representadas por retângulos de mesma base e
alturas proporcionais às grandezas. Exemplo:
•
Gráfico de setores (de pizza ou torta): utilizados para
representar valores absolutos ou porcentagens
complementares e são úteis quando se quer comparar
as categorias de uma variável qualitativa quanto as
suas grandezas. Exemplo:
Vendas por Linha de Produto da
empresa A
20%
Linha A
50% Linha B
Linha C
30%
Gráficos de linhas: bastante utilizados na representação
de séries de tempo. Úteis na verificação de flutuações
dos valores da variável ao longo do tempo.
•
Sua construção se dá através da marcação dos pontos
correspondentes às grandezas e posterior união através
de segmentos de reta. Exemplo:
Gráficos de dispersão bidimensional: utilizados na
análise do relacionamento entre duas variáveis.
•
Sua construção se dá através da marcação no plano
dos pontos correspondentes às duas variáveis em
análise. Exemplo:
Dispersão: Renda X Consumo
1400,00
1200,00
1000,00
800,00
600,00
mo
su
n
C
400,00
200,00
0,00
0 500 1000 1500 2000 2500 3000 3500
Renda
Distribuição de Frequência
Definição: é uma tabela que mostra categorias
ou classes (intervalos de dados), juntamente
com as frequências correspondentes.
A escolha do número de intervalos e da amplitude
dos intervalos deve levar em consideração o
conhecimento do pesquisador sobre o problema.
Frequências acumuladas não fazem sentido para
variáveis qualitativas nominais.
Exemplo
•
O eixo horizontal exibe os limites dos intervalos, enquanto
que o eixo vertical mostra a frequência, absoluta ou relativa,
das observações pertencentes a cada intervalo.
•
A escala do eixo vertical deve se iniciar em zero.
•
As frequências, absolutas ou relativas, serão representadas
por retângulos justapostos cujas bases são iguais às
amplitudes dos intervalos e cujas alturas são proporcionais às
frequências das observações em cada intervalo.
Exemplo
i Preço (R$) Freq. Abs
(Fi)
1 5,40 |– 10,04 5
2 10,04 |– 14,68 5
3 14,68 |– 19,32 8
4 19,32 |– 23,96 5 Distribuição dos Preços do Produto A
5 23,96 |– 28,60 2
9
Total 25 8
7
6
5
Freq. Abs 4
3
2
1
0
7,72 12,36 17,00 21,64 26,28
Preço (R$)
Polígono de Frequências
•
Polígono de Frequências: presta-se ao mesmo fim que o
histograma.
•
Como nos histogramas, o eixo horizontal exibe os limites dos
intervalos, enquanto que o eixo vertical mostra a frequência,
absoluta ou relativa, das observações pertencentes a cada
intervalo.
•
Para sua construção, marcamos os pontos correspondentes aos
pontos médios dos intervalos e suas respectivas frequências. Em
seguida, fazemos a união dos pontos através de segmentos de
retas.
•
Também marcamos no eixo horizontal os pontos médios dos
intervalos precedentes e imediatamente seguintes aos intervalos
que contém os dados.
Exemplo
Medidas –resumo
Medidas –resumo
Medidas de posição: média, mediana, moda.
n
1 x1 x 2⋯x n
x = ∑ xi =
n i=1 n
Observação 2: a média só pode ser calculada para variáveis
quantitativas.
Mediana
Mediana (Md): Valor que divide um conjunto de dados
ordenados em duas partes iguais.
A série ordenada é 2.7, 2.8, 2.9, 3.1, 3.7, 3.9 e o valor central
está entre 2.9 e 3.1
Neste caso,
2.9 3.1
Md 3
2
De maneira geral temos:
•
Se o número de observações for ímpar, a mediana será o
valor central da série ordenada.
•
Se o número de observações for par, teremos dois valores
centrais e a mediana será a média entre esses dois valores
centrais.
Observação 1: ao contrário da média, a mediana não é
sensível à presença de observações extremas.
Observação 2: a mediana pode ser calculada para variáveis
quantitativas e, se o número de observações for ímpar,
também pode ser calculada para variáveis qualitativas
ordinais.
Moda
•
Se E C não for inteiro, use a aproximação adequada
k
Observação 1: os percentis mais utilizados são 25,
50 e 75, também conhecidos como 1º, 2º e 3º quartil
respectivamente.
2
∑i=1 xi − x 2
S =
n−1
Exemplo
A variância do preço do pacote de ações A
2
xi x i −x x i− x n
S =
56 – 5,5 30,25 n−1
57 – 4,5 20,25
58 – 3,5 12,25 2 188,5
S = =20,94
61 – 0,5 0,25 9
63 1,5 2,25
63 1,5 2,25
67 5,5 30,25
67 5,5 30,25 Soma dos quadrados
dos desvios com
67 5,5 30,25 relação a média
188,50
Exercício
Calcular a variância para pacote de ações B.
Desvio padrão
Desvio padrão: raiz quadrada da variância
S =S 2
•
Prefere-se usar o desvio padrão porque este é expresso na
mesma unidade dos dados, enquanto que a variância é
expressa na unidade dos dados elevada ao quadrado e isso
nem sempre faz sentido
Coeficiente de Variação
Coeficiente de Variação: medida de dispersão relativa dada
por:
S
CV =
x
•
Perceba que ao dividir o desvio padrão pela média obtém-se
um valor adimensional.
•
O CV mede o grau de concentração dos dados em torno de
sua média.
•
Através do CV, podemos comparar duas ou mais variáveis
ou dois ou mais conjuntos de dados com relação à
variabilidade.
•
Quanto maior o coeficiente de variação, maior a dispersão
em torno da média.
Coeficiente de Variação
Exemplo: considere uma amostra de 10 máquina, da
qual são conhecidos os pesos (em gramas) e os
comprimentos (em centímetros).
Recém-nascido
Maquina 1 2 3 4 5 6 7 8 9 10
Comprimento (X) 52 48 45 49 51 54 47 50 46 51
Peso (Y) 3300 3200 2950 3150 3350 3450 2900 3300 3150 3250
Nesse caso,
C 75 C 25
K
2 C 90 C 10