Академический Документы
Профессиональный Документы
Культура Документы
DISCIPLINA
ESTATISTICA APLICADA
Éder Nunes
Professor:
2) Conceito de Estatistica......................................................................................................2.
5) Amostragem......................................................................................................................4.
6) Variável.............................................................................................................................4.
1
2
Aquisição do vocabulário básico estatístico
1) Abordagem Histórica da Estatística
Embora a palavra estatística ainda não existisse, existem indícios de que ha 3000anos
a.C. já se faziam censos na Babilônia, China e Egito.
A própria Bíblia leva-nos a esse resgate histórico, como o livro quarto do Velho Testamento,
intitulado “Números”, começa com a seguinte instrução a Moises: ”Fazer um levantamento dos
homens de Israel que estivessem aptos para guerrear”; na época do Imperador Cesar Augusto,
saiu um edito para que se fizesse o censo em todo o Império Romano. Por isso Maria e Jose
teriam viajado para Belém.
A Estatística teve origem na necessidade do Estado Politico em conhecer os seus
domínios. Sob a palavra estatística, provavelmente derivada da palavra “status” (estado, em
latim), acumularam-se descrições e dados relativos ao Estado. Nas mãos dos governantes, a
Estatística passou a constituir-se verdadeira ferramenta administrativa.
Em 1085, Guilherme, o Conquistador, ordenou que se fizesse um levantamento
estatístico da Inglaterra, que deveria incluir informações sobre terras, proprietários, uso da terra,
empregados, animais e que serviria também de base para o calculo de impostos. Esse
levantamento originou um volume intitulado “Domesday Book” (Livro do dia do juízo final).
No século XVII, ganhou destaque na Inglaterra, a partir das Tabuas de mortalidade de
Jonh Graunt e William Petty, a aritmética politica que consistiu de exaustivas analises de
nascimentos e mortes. Dessas analises resultou a conclusão, entre outras, de que a percentagem
de nascimentos de crianças do sexo masculino era ligeiramente superior a de crianças do sexo
feminino.
Em 1708, foi organizado o primeiro curso de Estatística na Universidade de Yena, na
Alemanha.
2) Conceito de Estatística
Estatística é um ramo do conhecimento que consta de um conjunto de processos
cujo objetivo é a observação, a classificação formal e a análise de fenômenos coletivos
ou de massa (finalidade descritiva) e, também, a possibilidade de efetuar inferências
indutivas válidas, a partir de dados observados, e buscar métodos para permitir essa
inferência (finalidade indutiva). Portanto, é uma parte da matemática aplicada que
fornece métodos para coleta, organização, descrição, análise e interpretação de dados e
para a utilização dos mesmos na tomada de decisões.
Fonte: www.inf.ufsc.br/~verav/ensino-2013-2/amostragem.pdf
Estatística é a ciência que se preocupa com a organização, descrição, analise e
interpretação dos dados experimentais. É uma coleção de métodos para planejar
experimentos, obter dados e organizá-los, resumi-los, analisa-los, interpretá-los e deles
extrair conclusões.
Fonte: Estatística básica/Flávio Alves Pozzi-Curitiba:Fael,2015.
2.1 Dicionário Significado de Estatística, s.f 1. Ciência que tem por objetivo o
agrupamento metódico e o estudos fenômenos que se prestam a avaliação numérica. 2.
Conjunto de dados numéricos relativos a uma categoria de fatos.
Fonte: MINIDICIONARIO Luft
2.2 Site
Significado de Estatística é substantivo feminino, Ramo das matemáticas aplicadas
cujos princípios decorrem da teoria das probabilidades e que tem por objeto o estudo,
bem como o agrupamento metódico, de séries de fatos ou de dados numéricos.
Fonte: https://www.dicio.com.br
2
pela ênfase aos métodos generalizadores (Inferência Estatística), em acréscimo aos
métodos puramente descritivos.
Sejamos os exemplos que ilustram a necessidade dos métodos generalizadores
como prever a duração media da vida útil de uma calculadora, com base no desempenho
de muitas dessas calculadoras, comparar a eficiência de duas dietas para reduzir peso,
com base nas perdas de peso de pessoas que se submeteram as dietas que determinaram
a dosagem ideal de um novo medicamento, com base em testes feitos em pacientes
voluntários de hospitais selecionados aleatoriamente que prevê o fluxo de trafego de
uma rodovia ainda em construção, com base no trafego observado em rodovias
alternativas.
Em todas essas situações existe incerteza porque dispomos apenas de
informações parciais, incompletas ou indiretas. A Inferência Estatística trata de
problemas onde a incerteza e inerente, utilizando métodos que se fundamentam na
teoria das probabilidades. Os métodos de inferência tornam-se necessários para avaliar a
confiabilidade dos resultados observados.
4) População e Amostra
4.1) População
Em estatística, população é o conjunto de todos os elementos ou resultados sobre
a investigação. Podemos, então, pensar que uma população consiste em um conjunto de
indivíduos que compartilham de, pelo menos, uma característica comum, seja ela a
espécie, etnia, cidadania, filiação a uma associação, matrícula em uma universidade.
4.2) Amostra
Amostra diz respeito a um subconjunto da população, fração ou uma parte do
grupo, ou seja, em um conjunto de indivíduos retirados de uma população, a fim de que
seu estudo estatístico possa fornecer informações importantes sobre aquela população.
É difícil encontrar duas coisas exatamente iguais. Ha um pouco de variabilidade
em quase tudo. De modo bem geral, podemos dizer que o objetivo da Estatística é
fornecer métodos para se conviver, de modo racional, com a variabilidade. Isto e feito
através da descoberta de regularidade nos dados relativos às situações em estudo. Para
isso, duas ideias são de fundamental importância. Primeiramente, embora as
observações sejam variáveis e sempre que possível associar a elas a ideia de
regularidade e expressar essa regularidade matematicamente. Por outro lado, devido a
variabilidade inerente aos indivíduos, os pontos de interesse da Estatística são referentes
aos grupos de indivíduos, ou seja, estudamos os indivíduos através dos grupos. Quando
3
estudamos uma determinada característica, geralmente, queremos obter conclusões para
o conjunto de todos os indivíduos que apresentam tal característica. Chamamos de
população o conjunto de todos os indivíduos ou objetos que apresentam uma
característica em comum. Na maioria dos casos, ao estudarmos uma população, não
temos acesso a todos os seus elementos.
O estudo e feito, então, a partir de uma parte desta população, denominada
amostra, que tem por objetivo representa-la.
5) Amostragem
Amostragem é o processo pelo qual se obtém informação sobre um todo
(população), examinando-se apenas uma parte do mesmo (amostra).
5.1 Tipos de amostragem
Basicamente, existem dois métodos para obtenção da amostra: probabilístico ou
não.
Nas amostragens probabilísticas as unidades amostrais são escolhidas mediante
mecanismos de sorteio. Ou seja, são métodos em que a seleção dos indivíduos da
população é feita de forma a que todos tenham as mesmas chances de participar da
amostra.
Nas amostragens não probabilísticas os elementos são escolhidos de maneira
aproximada ou intencionalmente. Esse tipo de amostragem algumas vezes procura usar
procedimento aleatório, mas sem um sorteio, ou seja, sem utilizar dispositivos aleatórios
confiáveis. Exemplo: escolher vizinhos ou amigos.
6) O que é variável
O conceito de variável é a característica de interesse que é medida em cada
elemento da amostra ou população. Seus valores variam de elemento para elemento. As
variáveis podem ter valores numéricos ou não numéricos. Variáveis podem ser
classificadas da seguinte forma:
6.1 Variáveis Qualitativas (ou categóricas): são as características que não
possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou
seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais.
4
6.1.1 Variável aleatória discreta: características mensuráveis que podem
assumir apenas um número finito ou infinito contável de valores e, assim, somente
fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos:
número de filhos, número de bactérias por litro de leite, número de cigarros fumados
por dia, números de filhos de um casal.
6.1.2 Variável aleatória contínua: características mensuráveis que assumem
valores em uma escala contínua (na reta real), para as quais valores fracionais fazem
sentido. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial,
idade.
6.2.2 Variáveis aleatória Quantitativas: são as características que podem ser
medidas em uma escala quantitativa, ou seja, apresentam valores numéricos que fazem
sentido.
7) Gráfico
É uma representação de dados obtidos nos experimentos na forma de figuras
geométricas como diagramas, desenhos, figuras ou imagens, de modo a fornecer ao
leitor uma interpretação de forma mais rápida e objetiva.
5
7.2) Gráficos em colunas ou barras:
É a representação de uma série estatística por meio de retângulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras). Todos os retângulos devem
apresentar a mesma largura, ficando os seus comprimentos proporcionais aos
respectivos dados. Normalmente esses gráficos são mais empregados nas séries
qualitativas ou cronológicas.
6
7
7.2.2) Gráficos em colunas ou barras múltiplas
Colunas ou Barras Múltiplas: Geralmente empregados quando queremos
representar, simultaneamente, dois ou mais fenômenos, com o propósito
de comparação.
Desmatamento:
8
7.3) Gráfico histograma de frequência
Um histograma nada mais é que uma representação gráfica, que mostra a
frequência de uma ocorrência num determinado intervalo de classe.
São utilizados nas mais diversas áreas como para verificar o numero de produtos
não conforme ou determinar a dispersão de valores de medidas em peças entre outros.
9
7.4) Gráficos em setores (pizza).
10
Trabalho escravo no Brasil 10/2018
11
12
Cartograma 1 – Efetivo de bovinos e cabeças abatidas, segundo as Unidades da Federação –
2015.
13
7.7) Gráfico polar
Um gráfico polar exibe uma série como um conjunto de pontos agrupados por
categoria em um círculo de 360 graus. Os valores são representados pelo comprimento
do ponto, conforme medido do centro do círculo. Quanto mais distante o ponto está do
centro, maior é o seu valor. São exibidos rótulos de categoria no perímetro do gráfico.
Os gráficos polares são usados com mais frequência para fazer gráficos de dados
polares, nos quais cada ponto de dados é determinado por um ângulo ou uma distância.
14
8. Medidas Estatísticas
15
8.1) Medidas de tendência central
As medidas de Tendência central é um valor central ou valor típico para uma
distribuição de probabilidade. É chamada ocasionalmente como média ou apenas centro
da distribuição.
1) Média
Média Aritmética Simples
É uma das medidas de tendência central mais utilizadas no cotidiano. É
determinada pelo resultado da divisão do somatório dos números dados pela quantidade
de números somados. Por exemplo, vamos determinar a média dos números
3, 12, 23, 15, 25.
Para isso basta somarmos todos os números e dividirmos pela quantidade de números,
ou seja: Média Aritmética=3+12+23+15+25= 78/5= 15,6
O cálculo da Média Aritmética é frequentemente usado nas escolas para efetuar
a média final dos alunos, em campeonatos de futebol para se obter a média de gols de
uma determinada rodada ou mesmo do campeonato, é também utilizado em diversas
pesquisas estatísticas, pois determina o direcionamento das ideias expressas em
determinados estudos.
16
A média geométrica é definida, para números positivos, como a raiz n-ésima do
produto de n elementos de um conjunto de dados.
Fórmula
MG:média geométrica
n:número de elementos do conjunto de dados
x1, x2, x3, ..., xn: valores dos dados.
Media harmônica
A média harmônica está relacionada ao cálculo matemático das situações
envolvendo as grandezas inversamente proporcionais. Como exemplo, temos a relação
entre velocidade e tempo. Suponha que, em uma determinada viagem, um carro
desenvolva duas velocidades distintas, durante a metade do percurso ele manteve a
velocidade de 50 km/h e durante a metade restante sua velocidade foi de 60 km/h.
Vamos determinar a velocidade média do veículo durante o percurso.
De acordo com a média harmônica temos a seguinte relação:
17
8.1.2) Moda
É a medida de tendência central que consiste no valor observado com mais
frequência em um conjunto de dados.
Por exemplo, digamos que o Palmeiras em determinado torneio de futebol fez,
em dez partidas, a seguinte quantidade de gols:
5, 4, 2, 1, 3, 7, 1, 1, 2 e 1.
Para essa sequência de gols marcados, a moda é de 1 gol, pois é o número que
aparece mais vezes.
Outra situação comum seria se dentre 7 pessoas tomássemos suas idades, a
saber:15 anos, 20 anos, 32 anos, 13 anos, 55 anos, 43 anos e 90 anos. Nesse caso, não
há moda, pois nenhuma idade se repetiu mais vezes que a outra.
Quando um conjunto de dados não apresenta moda, dizemos que esse conjunto
é amodal.
Caso exista uma moda, denominamos o conjunto de Unimodal. Existindo duas
modas, denominamos o conjunto de bimodal e assim sucessivamente.
8.1.3) Mediana
É a medida de tendência central que indica exatamente o valor central de um
conjunto de dados quando organizados em ordem crescente ou decrescente. Vejamos
alguns exemplos, considerando que um aluno tirou as seguintes notas em cinco provas
de uma determinada matéria: 5, 8, 7, 4 e 8.
Colocando as cinco notas na ordem crescente, se obtém 4<5<7<8=8.
a mediana é o valor que está no centro dessa sequência, ou seja, 7.
mas, se ao invés de cinco notas fossem seis, nesse caso ao ordenarmos os números,
teremos dois termos centrais ao invés de um outro exemplo, digamos que as notas agora
são: 5, 2, 8, 7, 4 e 8.
Então colocando em ordem crescente, temos 2<4<5<7<8=8
Aqui, os dois termos centrais seriam 5 e 7. Portanto, a Mediana desse conjunto de dados
é a Média Aritmética dos dois termos centrais, ou seja,
Mediana= 5+7= 6
2
18
Resumindo o cálculo da Mediana:
8.2.1) Amplitude
Em estatística, a amplitude representa a diferença entre o maior e o menor valor
de um conjunto de dados. Ela mostra a dispersão dos valores de uma série.
1- Liste os elementos de seu conjunto de dados: 14, 19, 20, 24, 25 e 28.
2- Identifique os números mais alto e mais baixo no conjunto. Neste caso, o
número mais baixo no conjunto é 14 e o número mais alto é 28.
3- Subtraia o menor número em seu conjunto de dados do maior número.
Subtraia 14 a partir de 28 (28 - 14) para obter 14, a amplitude do conjunto.
8.2.2) Variância
Variância é uma medida de dispersão que mostra quão distantes os valores estão
da média. Nesse caso, como estamos analisando todos os valores de cada funcionário, e
não apenas uma “amostra”, trata-se do cálculo da variância populacional (var).
O cálculo da variância populacional é obtido através da soma dos quadrados da
diferença entre cada valor e a média aritmética, dividida pela quantidade de elementos
observados.
19
Variância → Funcionário A:
var (A) = (10 – 10)² + (9 – 10)² + (11 – 10)² + (12 – 10)² + (8 – 10)²
5
Variância → Funcionário B:
var (B) = (15 – 12,8)² + (12 – 12,8)² + (16 – 12,8)² + (10 – 12,8)² + (11 – 12,8)²
5
Variância → Funcionário C:
var (C) = (11 – 10,4)² + (10 – 10,4)² + (8 – 10,4)² + (11 – 10,4)² + (12 – 10,4)²
5
20
Variância → Funcionário D:
var (D) = (8 – 11)² + (12 – 11)² + (15 – 11)² + (9 – 11)² + (11 – 11)²
5
21
dp(D) = √var (D)
dp(D) = √6,0
dp(D) ≈ 2,45
Como o coeficiente de variação analisa a dispersão em termos relativos, ele será dado
em %. Se o CV:
For menor ou igual a 15% → baixa dispersão: dados homogêneos
For entre 15 e 30% → média dispersão
For maior que 30% → alta dispersão: dados heterogêneos
Exemplo: Em um grupo de moradores de determinada região foram analisadas a idade
(em anos) e a altura (em metros) das pessoas. Deseja-se comparar a dispersão em
termos relativos em torno da média dos dois conjuntos de dados, a fim de verificar qual
deles é mais homogêneo. Na coleta dos dados verificou-se que:
Idade das pessoas: X ?=41,6 e s = 0,82
Altura das pessoas: X ?=1,67 e s = 0,2
Qual conjunto de dados apresenta menor dispersão relativa em torno da média?
Cálculo do CV da idade.
Cálculo do CV da altura.
22
Cv= s .100
X
Cv= 0,2 .100
1,67
Cv= 0,119 .100 cv= 11,9%
Interpretação dos dados: como o coeficiente de variação da idade foi menor que
o coeficiente de variação da altura, pode-se afirmar que os dados relativos à idade são
mais homogêneos que os dados da altura.
https://pt.wikihow.com/Calcular-a-Amplitude
http://brasilescola.uol.com.br/matematica/media-harmonica.html
https://pictobike.wordpress.com/o-que-sao-pictogramas
https://www.gestaodesegurancaprivada.com.br/histograma/conceito.
http://leg.ufpr.br
https://apublica.org/2017/10/no-mapa-o-trabalho-escravo-no-brasil
https://technet.microsoft.com/pt-br/library/ms159755(v=sql.100).aspx
www.ebah.com.br/content/ABAAAANBcAE/introducao-a-estatistica?part=3
https://www.matematica.pt/util/resumos/tipos-graficos-estatisticos.php
http://www.ufpa.br/dicas/biome/biodavar.html
Fonte: www.inf.ufsc.br/~verav/ensino-2013-2/amostragem.pdf
https://www.todamateria.com.br/media-geometrica
23