Вы находитесь на странице: 1из 29

PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

I - Distribuição de freqüência e gráficos 1. Tabulação dos dados quantitativos


Os dados quantitativos representam informações resultantes de características susceptíveis de serem
Uma vez que estamos com os dados coletados, a simples inspeção dos valores obtidos não é medidas que podem ser de natureza discreta (dados discretos, como exemplo número de peças com
suficiente para se chegar a alguma conclusão. A nossa mente não está preparada para processar defeitos), ou de natureza contínua (dados contínuos, como exemplo, temperatura do forno).
tantas informações ao mesmo tempo, portanto é conveniente apresentar os dados em uma forma
Podemos resumir os dados qualitativos em uma tabela com os valores apresentados individualmente
mais simples e compacta de forma a facilitar o trabalho e a interpretação dos dados.
(dados agrupados sem classe) ou apresentados em intervalos (dados agrupados em classe).
Um dos objetivos da Estatística é, então, organizar e sintetizar (ou condensar) os dados obtidos de
forma a tornar o trabalho mais fácil de quem está analisando os dados. Essa síntese é feita através 1.1 - Dados brutos versus rol
de tabelas e/ou gráficos.
Os dados brutos são os dados originais da forma como foram coletados, não tendo qualquer tipo de
Algumas normas da ABNT (Associação Brasileira de Normas Técnicas) para apresentação de organização. A lista dos dados brutos é chamada, algumas vezes, de tabela primitiva. Abaixo temos
tabelas e gráficos podem ser vistas no manual (pag. 29 a 33) para apresentação de trabalhos os salários dos 20 funcionários da empresa da empresa XYZ.
científicos, teses, dissertações e monografias disponível no site da PUC Minas:
Salário dos funcionários
http://www.pucminas.br/documentos/normalizacao_monografias.pdf 4,6 8,5 6,9 9,0 7,4 5,3 11,1 11,6 13,2 14,7
19,4 9,1 7,6 13,6 9,4 18,8 17,3 10,5 23,3 12,8
Abaixo é mostrado um exemplo de formatação de uma tabela usada nos relatórios do IBGE -
Instituto Brasileiro de Geografia e Estatística. A rol é uma lista com os valores ordenados em ordem crescente (ou decrescente). Essa é a forma de
organização mais simples dos dados.
EXEMPLO DE FORMATAÇÃO USADA EM TABELA
Salário (ordenado em ordem crescente) dos funcionários
4,6 5,3 6,9 7,4 7,6 8,5 9,0 9,1 9,4 10,5
11,1 11,6 12,8 13,2 13,6 14,7 17,3 18,8 19,4 23,3

1.2 - Distribuição de freqüência de dados agrupados sem classe


Abaixo temos os dados do número de filhos dos 20 funcionários da empresa XYZ.

Quantidade (ordenada) de filhos por funcionário da empresa XYZ


0 0 0 0 0 0 1 1 1 1
1 1 1 1 2 2 2 3 3 4

Os dados da Tabela 1 mostram que 8 funcionários têm um filho, o que corresponde a 30% dos
funcionários. Vemos também que 70% dos funcionários têm um filho ou menos.

TABELA 1 – Quantidade de filhos dos


funcionários na empresa XYZ no ano 2000
Quantidade Nº de
%
de filhos funcionários
0 6 30,0
1 8 40,0
2 3 15,0
3 2 10,0
4 1 5,0
Total 20 100,0
FONTE: Empresa XYZ

1 2
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

1.3 - Distribuição de freqüência de dados agrupados com classe EXEMPLO: Usando os dados na Tabela 2, complete o que é pedido abaixo:

Abaixo temos os salários dos 20 funcionários mostrados da empresa XYZ. a) ____ funcionários recebem menos de 20 SM, o que corresponde a _____%.
b) ____ funcionários recebem 16 SM ou mais, o que corresponde a _____%..
Salário (ordenado) dos funcionários da empresa XYZ
4,6 5,3 6,9 7,4 7,6 8,5 9,0 9,1 9,4 10,5 c) O limite inferior da 5ª classe é l5 = _____e o limite superior é L5 = _____. Portanto, a
11,1 11,6 12,8 13,2 13,6 14,7 17,3 18,8 19,4 23,3 amplitude dessa classe é h5 = _____.
d) A amplitude total da distribuição é AT = _____ (= diferença entre o limite superior da
Os dados da Tabela 2 mostram que sete funcionários recebem de 12,0 a menos de 16,0 SM, o que última classe e o limite inferior da primeira classe).
corresponde a 20% dos funcionários. Vemos também que 80% dos funcionários recebem menos de
e) A classe com maior número de funcionários é a _____ classe, que apresenta uma freqüência
16,0 SM.
simples absoluta igual a _____.
TABELA 2 – Número de funcionários em cada faixa salarial f) A classe com menor número de funcionários é a _____ classe, que apresenta uma freqüência
Nº de % Nº acumulado % simples absoluta igual a _____.
Salário (em SM) Funcionários de funcionários Acumulado g) ____ funcionários recebem menos de 4,0 SM e _____% dos funcionários recebem no
(fi) (fri) (Fi) (Fri) mínimo 4,0 SM.
4,0 | 8,0 5 25,0 5 25,0
Respostas: a) 19 e 95% b) 4 e 20% c) 20, 24 e 4 d) 20 (= 24,0 – 4,0) e) 2ª classe com f2 = 7 funcionários f) 5ª
8,0 | 12,0 7 35,0 12 60,0 classe com f5 = 1 funcionário g) 0 e 100%
12,0 | 16,0 4 20,0 16 80,0
16,0 | 20,0 3 15,0 19 95,0
20,0 | 24,0 1 5,0 20 100,0
Total 20 100,0 -- -- 1.3.1. - Etapas para a elaboração de uma tabela de freqüência com classe
FONTE: Empresa XYZ SM = salário-minimo
A Tabela 2 foi construída com 5 classes. Qual o motivo de ter escolhido 5 classes? Por que as
classes têm a mesma amplitude de 4? Por que o limite inferior da primeira classe não começou
Como a tabela foi construída? exatamente em 4,6, que é o menor salário?
No exemplo acima, optamos por trabalhar com 5 classes (ou intervalos), sendo que um número Não existe um critério rígido para a elaboração de uma tabela de freqüência. As etapas a seguir são
razoável de classes seria de 5 a 20 classes. Um critério para nos ajudar a decidir pelo número de critérios arbitrários, servindo apenas como sugestões para auxiliar a construção da tabela de
classes será apresentado mais a frente. freqüência.
Na quarta classe, 16 | 20 SM, temos três funcionários com salário de 16,0 a menos de 20,0 SM o Etapas
que corresponde a 15%. Dezenove funcionários recebem menos de 20,0 SM, o que corresponde a 1) Ordenar em ordem crescente os dados brutos e calcular a amplitude: A t = Maior − Menor
95%.
2) Determinar o número de classes (k)
Então, temos na 4ª classe 6,0 | 20,0 • Alguns autores propõem que seja um número de 5 a 20 classes (quanto maior o
f4 = 4 fr4 = 15% (= 3/20) número de observações, maior será o número de classes).
F4 = 19 (= 5+7+4+3) Fr4 = 95% (= 25+35+20+15) • Usar a fórmula de Sturges: k = 1 + 3,3 ⋅ log (n )
10

• Outros autores preferem uma fórmula mais simples: k = n


Freqüência simples absoluta (fi) → n= ∑f i = f1 + f 2 + L + f k se a tabela tiver k classes 3) Determinar a amplitude do intervalo de classe (h)
Freqüência simples relativa (fri)
fi fi At
→ fri = = • h=
∑ fri n k
Freqüência absoluta acumulada (Fi) → Fi = f 1 + f 2 + L + f i Caso seja necessário, arredonde o valor obtido para um número mais adequado aos seus
dados, de forma a facilitar a construção e análise da tabela. O arredondamento é
Fi
Freqüência relativa acumulada (Fri) → Fri = fr1 + fr2 + L + fri ou Fri = arbitrário.
n
4) Determinar os limites (inferior e superior) das classes. O limite inferior da primeira classe
pode ser o menor valor do conjunto de observações ou um valor um pouco menor, de modo
O símbolo1 | indica que a extremidade esquerda está incluía e a direita não (a | b → a ≤ x < b)
que facilite a construção e análise da tabela.
5) Construir a tabela de freqüência usando fi, fri, Fi, Fri
1
• Outros símbolos podem ser usados: a || b (= a ≤ x ≤ b); a | b (= a < x ≤ b) ou a  b ( = a < x < b)

3 4
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

EXEMPLO: Considerando os salários dos 20 funcionários, determine o número, a amplitude e os


limites das classes seguindo as etapas descritas anteriormente. 2. Gráficos estatísticos
Etapas
A apresentação em forma de gráfico é um complemento importante da apresentação tabular dos
1) A t = 23,3 − 4,6 = 18,7 dados. A principal vantagem de um gráfico sobre a tabela é o fato de que ele permite que seja
visualizada de maneira simples e eficiente a distribuição dos dados observados.
2) Determinar o número de classes (k)
“Uma imagem vale mais do que mil palavras"
• Pela fórmula de Sturges: k = 1 + 3,3 ⋅ log10 (n )
Provérbio chinês
k = 1 + 3,3 ⋅ log10 (20) = 1 + 3,3 ⋅ (1,3010) = 5,29 ≈ 5 a 6 classes
2.1 - Gráficos indicadas para variáveis quantitativas
• k = 20 = 4,47 ≈ 4 a 5 classes Vamos escolher k = 5 classes
2.1.1. Para dados agrupados sem Classe
3) Determinar a amplitude de classe (h)
• Gráfico em hastes (ou bastão)
At 18,7
• h= = = 3,7 ≈ 4 → h=4
k 5 Esse tipo de gráfico é indicado para representação de dados numéricos não agrupados em
classes. Este gráfico é bem parecido com o gráfico de colunas, porém, em vez das colunas,
4) Menor valor = 4,6. O limite da primeira classe poderia começar em 4,6 ou mesmo 4,5, mas
temos uma linha vertical.
vamos optar pelo valor 4,0 como início.
1ª classe 2ª classe 3ª classe 4ª classe 5ª classe Para ilustrar, o Gráfico 1 mostra o número de filhos de cada funcionário da empresa XYZ em
4,0 | 8,0 8,0 | 12,0 12,0 | 16,0 16,0 | 20,0 20,0 | 24,0 2000 sintetizado na Tabela 1.

+ 4 (= h) GRÁFICO 1 – Quantidade de filhos


8
5) Construção da tabela de freqüência
7

Veja como ficou a Tabela 2.

Nº de funcionário
6

0
0 1 2 3 4
Quantidade de filhos

• Gráfico de pontos

Esse gráfico é muito simples e é indicado para representação de dados numéricos


individualmente, onde cada valor da variável é representado através de um ponto. Com esse
tipo de gráfico, podemos estudar as distribuição dos valores da variável e também verificar se
há presença de valores extremos ou atípicos (outliers).

Para ilustrar, vamos usar os dados brutos dos salários e número de filhos dos funcionários da
empresa XYZ.

5 6
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

GRÁFICO 2 – Quantidade de filhos dos funcionários EXEMPLO: Usando o GRÁFICO 4, complete o que é pedido abaixo:

a) ____ funcionários recebem 12 SM ou mais, o que corresponde a _____%.


outlier
b) ____ funcionários recebem de 8 a menos de 16 SM, o que corresponde a _____%..
c) ____ funcionários recebem mais de 24,0 SM.
Respostas: a) 8 40% b) 11 e 55% c) 0
0 1 2 3 4
Número de filhos
• Polígono de freqüências
GRÁFICO 3 – Salários dos funcionários
outlier Esse gráfico é também uma representação do contorno do histograma. Ele é construído
conectando os pontos médios das bases superiores dos retângulos do histograma. Para conectar
o polígono de freqüência ao eixo das abscissas, duas classes fictícias são criadas somente para
2 4 6 8 10 12 14 16 18 20 22 24
“fechar” o polígono.
Salário

GRÁFICO 5 – Poligonal Característica dos salários


2.1.2. Para dados agrupados em intervalos (classe) 7

Número de funcionários (fi)


6
• Histograma
5
O histograma é um gráfico bidimensional formado por vários retângulos justapostos (não há
espaço entre os retângulos). No eixo horizontal do gráfico (eixo das abscissas) temos a variável 4
de interesse e no eixo vertical (eixo das ordenadas) temos a freqüência da classe. Em cada classe
é desenhado um retângulo, cuja altura corresponde à freqüência da respectiva classe. 3

Para ilustrar, os dados da Tabela 2 foram utilizados para construir o histograma mostrado no 2
Gráfico 4. Se fosse optado pela freqüência relativa, o “formato” do histograma seria o mesmo,
1
mudando apenas os valores do eixo vertical.
0
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
GRÁFICO 4 – Histograma dos salários Salário
7 Classes fictícias
Número de funcionários (fi)

5
• Ogiva de Galton (Polígono de freqüências acumuladas)
4
A Ogiva de Galton é um gráfico que representa as freqüências acumuladas. A variável de interesse
3
é colocada no eixo das abscissas e a freqüência acumulada (absoluta ou relativa) no eixo da
2 ordenadas. È comum também conectar os limites superiores de cada classe (ou conectar os pontos
médios das bases superiores dos retângulos). Veja o GRÁFICO 6.
1

0
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
Salário

7 8
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

GRÁFICO 6 – Ogiva de Galton O gráfico de ramo-e-folha é utilizado para mostrar como os dados estão distribuídos e com a
100
vantagem de ainda conhecer os valores da cada observação. O exemplo abaixo mostra a distribuição
das notas de 60 alunos utilizando um gráfico de ramo-e-folha. Pelo gráfico, é possível notar as notas

Frequência relativa acumulada (Fri)


se concentram em torno de 60 pontos, sendo que abaixo de 50 pontos temos 13 alunos e de 41 a 49
80 pontos temos 6 alunos: um aluno com 41 pontos, um com 42, um com 47 e três com 49 pontos.

Gráfico de ramo-e-folha para as notas dos alunos


2 679
60
3 1889
4 127999
5 12237
40 6 000000000011234555557888
7 00234555679
8 02225
20 9 67

0 EXEMPLO: Construa um gráfico de ramo-e-folha para as notas finas de uma turma de estatística.
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
Salário 68 63 51 60 65 73 60 60 67 60 62 49 60 52 61
79 41 60 60 64 27 47 60 85 68 72 75 60 49 26
65 68 70 65 60 75 49 29 74 61 65 38 39 80 42
• Gráfico de Ramo-e-folha (Stem-and-leaf) 82 65 38 52 57 53 70 82 76 82 97 31 96 77 75

O gráfico de ramo-e-folha usa em sua representação os próprios valores de um conjunto de dados. Ramo e Folhas das Notas N = 60 (Stem-and-leaf)
Unidade da Folha = 1.0 (Leaf Unit)
Cada valor é mostrado no gráfico em duas partes:
Folha: consiste de um dígito, sendo que o mais comum é usar o dígito que corresponde a 3 2 679
unidade2 do valor para ser usada no gráfico. 7 3 1889
Ramo: consiste dos dígitos restantes 13 4 127999
18 5 12237
(24) 6 000000000011234555557888
Os dígitos das folhas são dispostos à esquerda de uma linha vertical, enquanto que os dígitos dos 18 7 00234555679
ramos são dispostos à direita da linha. Por exemplo, os valores 68, 63, 69, 76, 78 e 80 seriam 7 8 02225
representados da seguinte maneira: 2 9 67
6 389 representando os valores 63, 68 e 69
68; 63; 69; 76; 78 e 80 → 7 68 representando os valores 76 e 78 O gráfico de ramo-e-folha quando é feito no pacote estatístico Minitab exibe três colunas:
8 0 representando o valor 80 • Coluna (1): A contagem (count) - Se a contagem de uma linha está entre parênteses indica que
a mediana (valor central) dos dados está na referida linha. Os valores para as linhas acima e
Os valores decimais 5,7; 4,5; 5,7; 7,3; 7,8 seriam representados como: abaixo da linha da mediana são cumulativos.
4 5 • Coluna (2): O ramo (stem) - Cada valor representa o(s) dígito(s) imediatamente à esquerda do
5,7; 4,5; 5,7; 7,3; 5,8 → 5 778 unidade da folha = 0,1 dígito da folha.
6 • Coluna (3): As folhas (leaves) - Cada valor representa um dígito de uma observação. A
7 3 “unidade da folha” (leaf unit) declarada acima do gráfico especifica qual dígito foi usado.
No exemplo acima, vemos que as decimais formaram as folhas e as unidades formaram os ramos.
Dependendo da unidade de folha usada, podemos representar um valor optando pelo
arredondamento ou não. Veja as representações dos valores 1232 e 1389 abaixo:

Dados Leaf unit = 1.0 Leaf unit = 10 Leaf unit = 10


1232 1389 123 2 12 3 12 3
138 9 13 8 14 0
Obs: O valor 1389 foi representado por 1380 Obs: O valor 1389 foi representado por 1400 (valor
arredondado)

2
Dependendo dos dados, pode ser usados também o dígito da dezena ou centena.

9 10
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

2.2 – Outros gráficos

• Gráfico de Pareto

O gráfico de Pareto é um gráfico de barras que dispõe as informações (em ordem decrescente) de
modo que se torna possível a identificação dos principais problemas enfrentado pela empresa ou
das principais causas de um problema. O princípio de Pareto foi inicialmente estabelecido por J. M.
Juran, que adaptou aos problemas da qualidade a teoria para modelar a distribuição de renda
desenvolvida pelo sociólogo e economista italiano Vilfredo Pareto (1843-1923). A lei de Pareto diz,
em linhas gerais, que a maioria dos defeitos pode ser creditada apenas a umas poucas categorias
(“poucos vitais”) devendo, portanto, ser atacadas inicialmente, deixando as demais categorias
(“muitos triviais”) para uma outra oportunidade.

EXEMPLO: Uma indústria fabricante de lentes de contato classificou uma amostra retirada da
produção de uma semana de acordo com os tipos de defeitos detectados (Werkema, 1995, p. 77).

Com os resultados obtidos, foi construído o gráfico de Pareto (GRÁFICO 7). Pelo gráfico vemos
que os defeitos que mais se destacam é o revestimento e a trinca, pois juntos correspondem a 75,6%
de todos os defeitos. Portanto, a prioridade é tentar solucionar esses dois tipos defeitos.

GRÁFICO 7 – Gráfico de Pareto para o tipo de


defeito nas lentes de contato
140
100

Percentual acumulado (Fri)


Frequência absoluta (fi)

120

100 80

80 60
60
40
40
20
20

0 0
Tipo de defeito to ca o ra a o s
en in hã su ad tr
tim Tr an es ab Ou
rr p ac
es A Es o
R ev Nã
Frequencia 55 41 12 11 5 3
% 43,3 32,3 9,4 8,7 3,9 2,4
%Acum 43,3 75,6 85,0 93,7 97,6 100,0

• Gráfico de Série temporal


<<< completar >>>

11 12
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

EXEMPLO 01: Uma pequena empresa trabalha com apenas quatro máquinas de encher
II - Medidas estatísticas para descrição de dados pacotes de café de 500 gramas. Os pesos de 40 pacotes selecionados de cada máquina
estão mostrados no gráfico de pontos abaixo2. Descreva os quatros gráficos de pontos.

Na unidade anterior, o nosso esforço foi tentar organizar e resumir os dados coletados Solução ---------------------------------------------------------------------------------------------
de forma a facilitar o trabalho de quem está analisando os dados. Com a ajuda das
tabelas de freqüência e dos gráficos, vistos anteriormente, podemos ver como é a Os pacotes de café enchidos pela máquina “A” apresentam um peso típico em torno de
distribuição dos valores assumidos por uma variável, ou seja, podemos ver quais os 490 gramas (10 gramas a menos do especificado), enquanto que, na máquina B, os
valores que ocorrem com mais freqüência e quais os valores que ocorrem com menos pacotes apresentam um peso típico em torno de 510 gramas (10 gramas a mais). Quanto
freqüência. à dispersão (ou variabilidade) dos pesos, parece que eles estão igualmente dispersos em
torno dos valores típicos. Podemos ainda destacar a presença de um pacote com peso
O Gráfico 1 mostra a distribuição do PIB per capita1 dos municípios brasileiros. Neste considerado extremo3 na máquina “A” (peso de 480 gramas).
gráfico podemos observar que a maioria dos municípios brasileiros apresenta PIB
per capita abaixo de 45 mil reais. É ainda possível observar uma pequena minoria de Na máquina “C”, os pesos dos pacotes giram em torno de 500 gramas (igual ao
municípios com PIB per capita acima de 90 mil reais. especificado), mas a dispersão dos pesos é muito grande, indicando uma instabilidade
na máquina (os pesos estão variando de 481 gramas a 520 gramas).
GRÁFICO 1 – Distribuição do PIB per capita dos municípios brasileiros em 2004.
Na máquina “D”, encontramos uma situação que podemos dizer ideal, os pesos giram
2500
em torno do valor especificado (de 500 gramas) e com uma pequena dispersão dos
pesos.
2000
Esse pacote pesou
Quantidade de municípios

480 gramas

1500
10 Máquina A
média
0
1000 90 135 180 225 270 315
Máquina B

500 Máquina C
zoom

0
10 45 90 135 180 225 270 315
PIB per capita (em mil reais)

Máquina D
Pelo Gráfico 1, podemos notar que há outras características da distribuição que devem 480 485 490 495 500 505 510 515 520 525
ser consideradas em uma análise estatística. Uma das características que devemos Peso dos pacotes (em gramas)
destacar é o valor típico da distribuição e a outra é a dispersão dos valores em torno
desse valor típico. A dispersão dos valores e o valor típico desempenham um papel tão
importante na estatística que eles são expressos em números (ou seja, eles são As medidas abaixo ajudam a descrever uma distribuição.
quantificados), tornando mais fácil fazer comparações entre as diversas distribuições. • Medidas de posição (central e não-central);
Por exemplo, podemos comparar as distribuições do PIB per capita dos municípios ano • Medidas de variabilidade ou dispersão;
a ano ou mesmo entre estados. • Medidas de assimetria;
• Medidas de curtose.

1 2
O Produto Interno Bruto per capita de cada município foi estimado pelo quociente entre o valor do PIB Lembre-se de que, em um gráfico de ponto, cada ponto representa o peso de um pacote de café.
3
do município por sua população residente. Em estatística, costumamos chamar esse valor extremo de outlier.

13 14
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

• Mediana amostral (Md ou ~x )


1. Medidas de Posição Central A mediana amostral é o valor que está no centro de um conjunto ordenado de valores,
isto é, metade dos valores está abaixo da mediana e a outra metade está acima. A
É uma medida estatística que “melhor” representa um conjunto de dados, ela tende a ser
mediana pode ser denotada por Md ou ~ x (leia-se x til)
o valor mais típico ou o mais representativo dos dados. As medidas mais usuais são:
média simples, média ponderada, mediana e a moda.
Dependendo se o tamanho da amostra n é ímpar ou par, o conjunto ordenado poderá ter
Em uma análise estatística, ou estamos trabalhando com uma amostra ou uma um único valor central ou dois valores centrais.
população. Como trabalhar com população é uma situação incomum de acontecer, daqui
para frente vamos assumir que os dados correspondem a uma amostra de n elementos. é ímpar → a mediana será o único valor central.
n
1.1 Medidas de posição central para dados não-agrupados em tabelas de é par → a mediana será a média dos dois valores centrais.
freqüência (dados brutos) Se n for ímpar Se n for par
~ ~ 10 + 15
• Média amostral ( x ) x = {8, 10, 15} → x = 10 x = {8, 10, 15, 30} → x= = 12,5
2
A média amostral é representada pela média aritmética simples dos dados. É denotada
por x (leia-se x barra). Podemos formalizar um procedimento para obter a mediana da seguinte maneira:
n
∑ xi • Ordene o conjunto de dados em ordem crescente e calcule pos = n 2 que é a
i =1
x1 + x 2 + L + x n posição da mediana no conjunto ordenado;
x= =
nn • Se pos não for inteiro, arredonde pos para cima (maior inteiro mais próximo) e a
onde mediana será o valor central que está na posição pos.
xi = i-ésimo valor da variável
• Se pos for inteiro, então a mediana será a média entre os valores centrais que estão
n = número de valores somados (tamanho da amostra)
na posição pos e pos +1.
EXEMPLO 02 – A empresa XYZ selecionou uma amostra de 5 funcionários e registrou
a distância (em km) que esses funcionários percorrem até chegar à empresa. Os valores EXEMPLO 04 – Volte ao EXEMPLO 2 e calcule a mediana da distância percorrida
obtidos foram 12, 4, 12, 9 e 3 km. Calcule a distância média percorrida por esses pelos funcionários.
funcionários.
Solução ---------------------------------------------------------------------------------------------
Solução ---------------------------------------------------------------------------------------------
n Dados ordenados: 3 4 9 12 12
∑ xi 12 + 4 + 12 + 9 + 3 40
média
i =1 A posição da mediana é pos = 5/2 = 2,5. Como esse valor não é inteiro, será
x= = = = 8,0 km
n 5 5 3 4 5 6 7 8 9 10 11 12 arredondado para cima (pos = 3). Então a mediana da distância percorrida está na 3ª
Distância percorrida
posição, que é Md = 9.
A distância média percorrida pelos funcionários até a empresa é 8,0 km. mediana

3 4 5 6 7 8 9 10 11 12
EXEMPLO 03 – Abaixo temos a diferença entre as notas das duas provas feitas por Distância percorrida
cada uma dos seis alunos de uma sala. Construa o gráfico de ponto abaixo, calcule a Cerca de 50% dos funcionários percorrem até a empresa 9 km ou menos.
média dos valores e depois localize a média no gráfico de pontos.
EXEMPLO 05 – Volte ao EXEMPLO 03, calcule a mediana das diferenças entre as
-1 -3 5 1 -1 5 notas e depois localize a mediana no gráfico de pontos.

15 16
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

Comparação entre a média e a mediana • Média aparada de k%


A média amostral x usa todos os valores do conjunto de dados. Por isso, ela acaba É a média simples dos dados que permanecem, quando k% das observações ordenadas
sendo bastante influenciada pelos valores extremos (valores atípicos ou discrepantes) são removidas (aparadas) de cada extremidade. A média aparada é uma medida de
denominados de outliers na estatística. Por outro lado, a mediana ~x sofre uma menor posição central mais robusta (menos sensível) aos valores extremos (outliers). É
influência dos outliers (dizemos que a mediana é mais robusta aos outliers). denotada por x ap .

EXEMPLO 06 – Suponha que EXEMPLO 02, a distância de 12 km foi registrada O procedimento para obter a média aparada de k% é:
erradamente como 120 km. Calcule a média e a mediana da distância percorrida pelos • Ordene o conjunto de dados em ordem crescente;
funcionários. • Calcule T = k⋅n/100, quantidade de valores a serem retirados de cada extremidade;
• Arredonde o valor de T para um número inteiro;
Solução ---------------------------------------------------------------------------------------------
• Retirar de cada extremidade T valores;
Média amostral • Calcule a média aritmética simples dos valores que permaneceram
n
∑ xi 12 + 4 + 120 + 9 + 3 140
x= i =1
= = = 28,0 km EXEMPLO 07 – Em uma sala de aula, foram registradas as idades de 20 alunos.
n 5 5 8, 75, 21, 19, 18, 21, 19, 20, 21, 19, 19, 20, 22, 21, 21, 20, 19, 19, 21, 19

O valor alto de 120 km fez com a média pulasse de 8 km para 28 km. O cálculo Vamos considerar que de fato há um aluno com 75 anos e que o valor 8 foi erro de
matemático da média está correto, mas uma média de 28 km não está representando digitação. Calcule a média aparada de 10%.
bem as distâncias percorridas pelos funcionários. Com a exceção de um, todos os
valores são menores do que 28 km. Solução ---------------------------------------------------------------------------------------------
Dados ordenados:
Mediana amostral 8, 18, 19, 19, 19, 19, 19, 19, 19, 20, 20, 20, 21, 21, 21, 21, 21, 21, 22, 75
Dados ordenados: 3 4 9 12 120 Retirar de cada extremidade 2 valores (T = 10⋅20/100 = 2). Os valores retirados são: 8,
A mediana está na posição pos = 5/2 = 2,5 ≈ 3 (3ª posição), portanto Md = 9. 18, 22 e 75.
Mesmo com o valor alto de 120 km, a mediana permaneceu em 9 km. Dizemos, então, 19 + 19 + L + 21 319
x ap = = = 19,9 anos
que a mediana foi pouco influenciada pelo valor extremo. 16 16

• Moda (Mo)
• Média ponderada ( x p )
É o valor que ocorre com mais freqüência no conjunto de dados. É denotada por Mo.
O salário modal dos empregados de uma indústria é o salário mais comum, isto é, o É a média das observações x1, x2, ..., xn levando em consideração seus respectivos pesos
salário recebido pelo maior número de empregados. w1, w2, ..., wn. A média ponderada é dada por
n
No caso do EXEMPLO 02, a distância modal foi Mo = 12 km, mas algumas vezes ∑ wi x i w1 x1 + w2 x 2 + L + wn x n
podemos ter conjuntos de dados com mais de uma moda: xp = i =1
=
n
w1 + w2 + L + wn
∑ wi
3, 4, 4, 4, 9, 10, 12, 12, 12 → Mo = 4 e 12 (bimodal) i =1
3, 4, 4, 4, 9, 10, 10, 10, 12, 12, 12 → Mo = 4, 10 e 12 (trimodal)

ou mesmo não ter moda


3, 4, 9, 10, 12 → amodal (não tem moda)

17 18
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

EXEMPLO 08 – Um professor aplicou quatro avaliações com os seguintes pesos 1, 2, 4


Algumas observações
e 8. Um aluno tirou as seguintes notas nessas avaliações 20, 25, 28 e 10. Qual a média
das notas ponderadas pelos pesos das provas?
Propriedades da média
Solução --------------------------------------------------------------------------------------------- Suponha que os dados do conjunto x = {x1, x2,..., xn} têm uma média x :

nota 20 25 28 10 i) A soma dos desvios em relação a média é sempre zero.


peso 1 2 4 8 O desvio do valor x i em relação a media x é dado por : di = x i − x
n n
∑ wixi 1 ⋅ 20 + 2 ⋅ 25 + 4 ⋅ 28 + 8 ⋅ 10 A soma desses desvios é: ∑ di = 0
i =1
x p == n
= = 17,47 pontos i =1
1+ 2 + 4 + 8
∑ wi ii) Somando-se (ou subtraindo-se) uma constante b de todos os valores de uma
i =1
variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.
A nota média ponderada pelos pesos foi igual a 17,47 pontos. Se y i = x i ± b ⇒ y=x±b

Caso não tivesse levado em consideração os pesos, a nota média seria igual a 20,75 iii) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
pontos (maior do que 17,47 pts). O motivo dessa queda é que o aluno tirou uma nota constante b, a média do conjunto fica multiplicada (ou dividida) dessa constante.
muito baixa em uma prova com maior peso. Se y i = bx i ⇒ y = bx
Uma maneira mais prática de calcular a média ponderada é trabalhar com os dados em
uma tabela. Média Populacional

(1) (2) (3) Quando temos os dados de uma população (o que é uma raridade), a média passa a ser
n
xi wi wi⋅xi ∑ wi x i denominada de média populacional e denotada pela letra grega µ (leia-se mi). Na
20 1 20 i =1 262 realidade, o cálculo é igual ao da média amostral, a única mudança está na notação
x p == n
= = 17,47 pts
25 2 50 15 usada.
28 4 112 ∑ wi N
i =1
10 8 80 ∑ xi x1 + x 2 + L + x N
i =1
µ= =
- ∑wi = 15 ∑wi⋅xi = 262 N N
onde
Observação: xi = i-ésimo valor da variável X
N = número de valores somados (tamanho da população)
Se os pesos forem todos iguais, então a média ponderada será igual a média aritmética
simples. Por exemplo, se wi = k, então:
n

kx1 + kx 2 + L + kx n k (x 1 + x 2 + L + x n ) x1 + x 2 + L + x n ∑ xi
i =1
xp = = = = =x
k + k +L+ k n⋅k n n

19 20
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

EXEMPLO 09 – Considere o conjunto X = {1, 2, 3, 3, 4, 5}, cuja média é x = 3. 1.2 Medidas de posição central para dados agrupados em tabelas de
a) Qual a soma dos desvios de cada valor xi em relação à média x ? freqüência
b) Se cada valor xi for somado o valor 6, qual será a média dos ‘novos’ valores?
c) Se cada valor xi for multiplicado pelo valor 4, qual será a média dos ‘novos’
1.2.1. Dados agrupados sem intervalos de classe
valores?

Solução --------------------------------------------------------------------------------------------- • Média amostral ( x )

Vamos aplicar as propriedades vistas acima. Em tabelas de freqüência sem intervalos de classe, as freqüências (absoluta ou relativa)
de cada valor xi da variável funcionam como fatores de ponderação, já que elas podem
a) A soma dos desvios de cada valor xi em relação à média é SEMPRE zero. Se ser vistas como indicadores da intensidade de cada valor da variável.
di é o desvio, então ∑ d i = 0 (veja a coluna 2 da tabela abaixo).
Por esse motivo, o cálculo da média amostral é bem parecido com o cálculo da média
b) Se yi = xi + 6, então y = x + 6 = 3 + 6 = 9 (veja a coluna 3 da tabela abaixo) ponderada, tendo as freqüências como pesos dos valores.
c) Se yi = 4*xi, então y = 4 * x = 4*3 = 12 (veja a coluna 4 da tabela abaixo)
x=
∑ x ifi
∑ fi
(1) (2) (3) (4) onde xi = i-ésimo valor da variável
xi di = x i − x yi = xi + 6 yi = 4*xi fi = freqüência de xi
1 -2 7 4
2 -1 8 8 EXEMPLO 11 – A Tabela 1 mostra a distribuição do o número de filhos para uma
3 0 9 12 amostra de 20 funcionários. Calcule o número médio de filhos desses funcionários.
3 0 9 12
4 1 10 16 TABELA 1 - Quantidade de
5 2 11 20 filhos dos funcionários
Quantidade de
média = 3 soma = 0 média = 9 média = 12 Número de
funcionários
Filhos
(fi)
EXEMPLO 10 – O salário médio de 20 funcionários é 800 reais. Cada funcionário 0 5
recebeu um aumento de 20% (ou seja, seu salário foi multiplicado por 1,20), determine 1 7
o salário médio após o aumento. 2 5
3 2
Solução --------------------------------------------------------------------------------------------- 4 1
O salário médio após o aumento é de 960 reais (= 800 * 1,20 → usei a 3ª propriedade
da média). Solução ---------------------------------------------------------------------------------------------

Para facilitar o cálculo da média, vamos acrescentar coluna xifi que é o produto de cada
valor xi pela sua respectiva freqüência fi.

Da tabela ao lado temos: ∑fi = 20 e ∑xifi = 27.


xi fi xifi
0 5 0 Portanto,
1 7 7
2 5 10 x=
∑ x i f i = 27 = 1,35 filho
3 2 6 ∑ f i 20
4 1 4
Total ∑fi = 20 ∑xifi = 27 Obs: Pode parecer estranho dizer 1,35 filho, mas esse
valor é uma média. Seria estranho se dissermos que uma
família, em específico, tem 1,35 filho.

21 22
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

• Mediana (Md ou ~
x) • Moda (Mo)

O procedimento para cálculo da mediana é bem semelhante àquele utilizado em dados A moda é o valor da variável com maior freqüência (absoluta ou relativa).
não-agrupados. A única diferença é o acréscimo da coluna com as freqüências
acumuladas para que a localização da mediana na tabela seja agilizada.
EXEMPLO 14 – Volte ao EXEMPLO 11 e obtenha a moda do número de filhos desses
• Determine a freqüência absoluta acumulada (Fi); funcionários.
• Calcule pos = n 2 que é a posição da mediana (lembre-se: n = ∑ f i )
Solução ---------------------------------------------------------------------------------------------
• Localize a mediana como sendo o valor cuja freqüência acumulada (Fi) é
imediatamente superior à posição pos da mediana;
xi fi Da tabela vemos que a moda é o valor 1 (um), visto que ele
0 5 apresenta uma freqüência absoluta (fi = 7)
Observação:
No caso de existir uma freqüência acumulada Fi exatamente igual a pos = (n+1)/2, a 1 7
2 5 Portanto, a moda é Mo = 1 filho.
mediana será a média aritmética entre o valor da variável correspondente a essa
freqüência acumulada é a seguinte. 3 2
4 1
Total ∑fi = 20
EXEMPLO 12 – Volte ao EXEMPLO 11 e calcule a mediana do número de filhos
desses funcionários. EXEMPLO 15 – Numa amostra de 150 candidatos ao vestibular, foi registrado o
número de vestibulares prestados por cada um até aquele momento. Assim, pela Tabela
Solução --------------------------------------------------------------------------------------------- 2 vemos que 75 candidatos prestaram vestibular uma única vez e assim por diante.

xi fi Fi A posição da mediana é pos = 20/2 = 10 a) Qual o número médio de vestibulares prestados pelos candidatos?
0 5 5 b) Qual é a moda e a mediana do número de vestibulares prestados pelos
1 7 12 Da tabela vemos que a mediana é o valor 1 (um), candidatos?
2 5 17 já que a freqüência absoluta acumulada é 12
3 2 19 (imediatamente superior a pos =10). TABELA 2 - Quantidade de filhos dos funcionários
4 1 20 Vestibular prestado Nº de candidatos
Portanto, a mediana é Md = 1 filho (xi) (fi)
Total ∑ fi = 20 --
1 75
2 47
EXEMPLO 13 – Calcule a mediana da variável X abaixo. 3 21
4 7
Solução --------------------------------------------------------------------------------------------- Total 150

xi fi Fi
0 4 5 A posição da mediana é pos = n/2 = 20/2 = 10
1 6 10 Como existe uma Fi = 10, então
2 7 17 Md = (1+2)/2 = 1,5 filho
3 2 19
4 1 20 Portanto, a mediana é Md = 1,5 filho
Total ∑fi = 20 --

23 24
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

1.2.2. Dados agrupados com intervalos de classe • Mediana amostral (Md ou ~


x)

• Média amostral ( x ) Para obter a mediana em dados agrupados com classe, o procedimento é o seguinte:

Em tabelas de freqüência com intervalos de classe, as freqüências (absoluta ou relativa) • Determine a freqüência absoluta acumulada (Fi);
também funcionam como fatores de ponderação dos valores da variável. Mas é aí que • Calcule pos = n 2 que é a posição da mediana (lembre-se: n = ∑ f i )
está o problema, que valor do intervalo deverá ser usado? • Localize a classe mediana como sendo a classe com a freqüência acumulada (Fi)
imediatamente superior à posição pos da mediana;
Como estamos trabalhando com intervalo temos que decidir qual valor usar para a • Calcule a mediana usando um dos dois métodos abaixo:
variável em cada classe. Se optar por trabalhar com o limite inferior das classes, a média
tende a ser subestimada (menor do que realmente deveria ser), por outro lado, se optar ~ l * + L*
Mediana bruta x= (ponto médio da classe mediana)
por trabalhar com o limite superior das classes, a média tende a ser superestimada 2
(maior do que realmente deveria ser).
Método da interpolação linear ~
x = l* +
(
pos − Fant*
)(
⋅ L* − l * )
f i*
Para evitar a subestimação e superestimação da média, assumimos que os valores estão
distribuídos de forma uniforme dentro da classe e calculamos o ponto médio xi de cada onde,
classes fi Fi
classe. Desta forma, o cálculo da média amostral seria: f i* , l * e L* = freqüência absoluta, limite inferior e
x=
∑ x ifi superior da classe mediana, respectivamente. ... *
f ant *
Fant
∑ fi *
Fant = freqüência absoluta acumulada anterior à
fi*
Fi*
* l * | L*
classe mediana. classe mediana ... * *
onde: xi = ponto médio da classe i f pos Fpos
fi = freqüência da classe i Observação:
No caso de existir uma freqüência acumulada Fi exatamente igual a pos = n 2 , a
EXEMPLO 16 – A Tabela 3 mostra a distribuição dos salários para uma amostra de 20 mediana será o limite superior da classe correspondente.
funcionários. Calcule o salário médio desses funcionários.
EXEMPLO 17 – Volte ao EXEMPLO 16 e calcule a mediana dos salários desses
TABELA 3 - Salários dos funcionários funcionários. Use a interpolação linear para obter a medina.
Quantidade de
Salários
funcionários Solução ---------------------------------------------------------------------------------------------
(em SM)
fi
4,0 | 8,0 5 Salários xi fi xifi Fi
8,0 | 12,0 7 4,0 | 8,0 6 5 30 5
12,0 | 16,0 4 8,0 | 12,0 10 7 70 12
16,0 | 20,0 3 12,0 | 16,0 14 4 56 16
20,0 | 24,0 1 16,0 | 20,0 18 3 54 19
SM = salário-mínimo 20,0 | 24,0 22 1 22 20
Total --- ∑ = 20 ∑ = 232 --
Solução ---------------------------------------------------------------------------------------------
Antes de responder devemos acrescentar as colunas xi e x i f i
A posição da mediana é pos = n/2 = 20/2 = 10. A classe mediana é a classe 8 | 12,
pois a sua freqüência absoluta acumulada é 12 (imediatamente superior a pos =10).
Salários xi fi xifi Da tabela ao lado temos:
∑fi = 20 e ∑xifi = 232. Da tabela temos: l * = 8 , L* = 12 , f i * = 7 e Fant
*
=5
4,0 | 8,0 6 5 30
8,0 | 12,0 10 7 70
12,0 | 16,0 14 4 56 Portanto, Mediana bruta Método da interpolação linear
16,0 | 20,0 18 3 54 ∑ x i f i = 232 = 11,6 SM ~
x=
8 + 12
= 10 SM ~
x =8+
(10 − 5) ⋅ (12 − 8) = 10,86 SM
x=
20,0 | 24,0 22 1 22 ∑ fi 20 2 7
Total --- ∑ = 20 ∑ = 232
Resposta: A mediana é Md = 10,86 SM (ou Md = 10 SM usando a mediana bruta).

25 26
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

• Moda (Mo) EXEMPLO 18 – Volte ao EXEMPLO 16 e calcule a moda dos salários desses
funcionários. Use o método de Czuber.
A moda em uma tabela de freqüência com classe provavelmente está dentro da classe
com a maior freqüência. Essa classe é denominada de classe modal. Solução ---------------------------------------------------------------------------------------------

Identificar a classe modal e calcule a moda usando um dos dois métodos abaixo: Salários fi xi xifi Fi Da tabela temos:
*
l +L * 4,0 | 8,0 5 6 30 5 l * = 8, L* = 12,
Moda bruta Mo = 8,0 | 12,0 7 10 70 12 f i* = 7 f ant
* *
= 5 f pos =4
2
12,0 | 16,0 4 14 56 16
D1
Método de Czuber Mo = l * +
D1 + D 2
(
⋅ L* − l * ) 16,0 | 20,0 3
1
18
22
54
22
19
20
D1 = f i* − f ant
*
=7-5=2
20,0 | 24,0
* Total ∑ = 20 --- ∑ = 232 -- D 2 = f i* − f pos
*
=7-4=3
f pos
Método de King Mo = l +*
*
f ant *
+ f pos
(
⋅ L −l * *
)
Método de Czuber
Método de Pearson4 Mo = 3 ⋅ Md − 2 ⋅ x D1
Mo = l * +
D1 + D 2
(
⋅ L* − l * ) → Mo = 8 +
2
2+3
⋅ (12 − 8) = 9,6 SM
onde,
D1 = f i* − f ant
* classes fi A moda usando o método Czuber é Mo = 9,6 SM
D2 = f i* − *
f pos ... *
f ant
l *
e L = limite inferior e superior da
*
l | L*
*
f i* → Outros métodos
classe modal, respectivamente *
classe modal ... f pos
f i* = freqüência absoluta da classe modal.
Método de King
*
f ant = freqüência absoluta da classe anterior à classe modal. *
f pos
*
f pos = freqüência absoluta da classe posterior à classe modal. Mo = l * + *
f ant *
+ f pos
(
⋅ L* − l * ) → Mo = 8 +
4
5+4
⋅ (12 − 8) = 9,8 SM

Método de Pearson
Mo = 3 ⋅ Md − 2 ⋅ x → Mo = 3 ⋅ 10,86 − 2 ⋅ 11,6 = 9,4 SM

4
O método de Pearson fornece boa aproximação para o cálculo da moda quando a distribuição analisada
apresenta uma razoável simetria em torno da média. Algumas outras relações também são interessantes, a
partir desse método. Por exemplo, Md = (Mo + 2 ⋅ x ) 3 ou x = (3 ⋅ Md − Mo ) 2 .

27 28
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

2. Medida de dispersão ou de variabilidade 2.1 Medidas de dispersão para dados não-agrupados em tabelas de
freqüência (dados brutos)
A medida de dispersão ou de variabilidade procura “medir” o quanto os valores de um
conjunto de dados estão afastados ou dispersos em relação a uma medida central,
• Amplitude amostral (At)
normalmente a média aritmética.
A amplitude amostral é diferença entre o maior e o menor valor do conjunto de dados
As medidas de posição central (média, mediana, etc) vistas anteriormente, não
conseguem sozinhas descrever bem uma distribuição de valores. No exemplo 1, onde
A t = Máximo − Mínimo
foram mostrados os pesos dos pacotes enchidos pelas máquinas ‘A’, ‘B’, ‘C’ e ‘D’, nós
podemos notar que os pesos médios dos pacotes amostrados das máquinas ‘C’ e ‘D’ são
bem próximos. Uma análise baseada apenas na média concluiria que ambas as máquinas Para o conjunto x = {9, 4, 5, 10, 7} a amplitude amostral será:
trabalham de forma bem parecida. O que não é verdade, como pode ser visto nos
gráficos de pontos. A máquina ‘C’ apresenta uma variação muito maior nos pesos do A t = 10 − 4 = 6
que na máquina ‘D’ e essa variação é muito importante na avaliação da performance das
máquinas em uma produção. Além de encher os pacotes com peso médio de 500 É a medida mais simples de dispersão. Quanto maior for a amplitude, mais afastados
gramas, as máquinas também devem apresentar uma pequena variabilidade nos pesos, estão os valores (maior dispersão ou variabilidade). A amplitude será sempre maior ou
caso contrário, a máquina produziria pacotes com peso bem acima do especificado (a igual a zero, NUNCA negativa.
empresa estaria tendo prejuízo) ou bem abaixo do especificado (a empresa estaria
prejudicando o consumidor). Apesar de sua simplicidade, a amplitude deixa um pouco a desejar, principalmente
quando temos grandes conjuntos de dados, pois ela só leva em consideração os valores
Considere a quantidade de gols de dois times nos últimos sete anos. extremos (mínimo e máximo) de um conjunto, deixando de lado os valores
intermediários.

Time A: 80, 78, 80, 85, 75, 85, 80 3


30 4
40 5
50 6
60 7
70 8 90
80 9 100
10 EXEMPLO 19 – Calcule a amplitude amostral dos dois conjuntos abaixo.
Distância percorrida
x = {9, 4, 5, 10, 7} y = {7, 7, 4, 7, 10}

Time B: 50, 78, 67, 85, 88, 94, 98 3


30 4
40 5
50 6
60 7
70 8 90
80 9 100
10
Solução ---------------------------------------------------------------------------------------------
Distância percorrida

Cada time fez, em média, 80 gols em cada ano, nos levando a crer que ambos os times Os dois conjuntos abaixo têm mesma amplitude, deixando a entender que ambos têm a
tiveram desempenhos iguais nos últimos sete anos. Analisando a quantidade de gols mesma variabilidade, mas o que vemos pelo diagrama de pontos é que a variabilidade
marcados pelos times, notaremos que essa quantidade varia de 75 a 85 gols no time ‘A’, não é igual (é maior no segundo conjunto).
enquanto que a do time ‘B’ varia de 50 a 98 gols, e com essa análise da variação na
quantidade de gols marcados podemos ver que o desempenho é bem distinto de ambos
os times. y = {7, 7, 4, 7, 10} At = 6
3 4 5 6 7 8 9 10 11 12
Distância percorrida
Para quantificar a variação presente em um conjunto de dados, temos de nos valer das
medidas de dispersão ou de variabilidade. As medidas usuais são: x = {9, 4, 5, 10, 7} At = 6
3 4 5 6 7 8 9 10 11 12
Distância percorrida
Medidas de dispersão absoluta
Desvio-padrão A amplitude amostral tem grande aplicação na área de controle de qualidade ou em
Variância situações onde desejamos uma rápida medida de variabilidade dos dados.
Amplitude
Desvio médio absoluto

Medidas de dispersão relativa


Coeficiente de variação

29 30
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

• Desvio médio absoluto (DMA) Apesar de usar todos os valores do conjunto e resolver aquele “problema” apresentado
pela amplitude, o desvio médio absoluto também apresenta alguns pontos fracos, dentre
O grande inconveniente da amplitude amostral é que ela usa apenas os valores extremos eles:
dos dados, deixando de lado os demais valores. Uma medida que considera todos os • O DMA é bastante influenciado pelos valores extremos (outliers);
valores do conjunto seria mais interessante e mais justo para representar a variabilidade • Pelo fato de trabalhar com o módulo, certas propriedades estatísticas do DMA
dos dados. são difíceis de serem verificadas5.

O desvio médio absoluto (DMA) é uma das medidas de dispersão que leva em
consideração todos os valores do conjunto. O DMA analisa a dispersão dos dados em • Variância amostral (s2) e desvio-padrão amostral (s)
torno de um valor central, representado pela média aritmética. O desvio médio absoluto
é dado pela fórmula abaixo: A variância amostral, representada por s2, é uma medida de variabilidade baseada nos
n desvios de cada valor em torno da média. Como esses desvios podem assumir valores
∑ xi − x x1 − x + x 2 − x + L + x n − x positivos e negativos, a soma de todos eles será sempre zero. Para evitar que a soma dê
i =1
DMA = = sempre zero, a variância trabalha com os desvios elevados ao quadrado6. A variância é
n n
onde dada pela fórmula abaixo:
n
xi = i-ésimo valor da variável
∑ (x i − x )
2
n = número de valores (tamanho da amostra) 2 i =1
s =
x i − x = módulo do desvio de xi em relação à média n −1
onde
n
Como se vê, o desvio médio absoluto pode ser visto como uma média do afastamento
∑ (x i − x ) = (x 1 − x ) (x 2 − x ) + L + (x n − x ) (soma dos desvios ao quadrado)
2 2 2 2
dos valores em relação à média do conjunto. Quanto maior o DMA, mais afastados os i =1
valores estarão da média, portanto maior será a variabilidade. O DMA é uma medida
sempre maior ou igual a zero, NUNCA negativa. A variância é uma média dos desvios ao quadrado. Quanto maior a variância, mais
afastados os valores estarão da média, portanto maior será a variabilidade dos valores. A
EXEMPLO 20 – Volte ao EXEMPLO 19 e calcule o desvio médio absoluto dos dois variância é uma medida sempre maior ou igual a zero, NUNCA negativa.
conjuntos de dados.
EXEMPLO 21 – Volte ao EXEMPLO 19 e calcule a variância dos dois conjuntos de
Solução --------------------------------------------------------------------------------------------- dados.

O modo mais prático de calcular o desvio médio absoluto é formar uma tabela com os Solução ---------------------------------------------------------------------------------------------
valores e calcular o módulo dos desvios em torno da média. Veja abaixo como ficariam
os cálculos. O modo mais prático é também formar uma tabela com os valores,

Conjunto X Conjunto Y Conjunto X Conjunto Y


xi x i − x xi − x yi yi − y yi − y xi xi − x (x i − x )2 yi yi − y (y i − y)2
7 0 0 9 2 2 7 0 0 9 2 4
7 0 0 4 -3 3 7 0 0 4 -3 9
4 -3 3 5 -2 2 4 -3 9 5 -2 4
7 0 0 10 3 3 7 0 0 10 3 9
10 3 3 7 0 0 10 3 9 7 0 0
- ∑=0 ∑=6 - ∑=0 ∑ = 10 - ∑=0 ∑ = 18 - ∑=0 ∑ = 26
n n n n
∑ (x i − x ) ∑ (y i − y )
2 2
∑ xi − x 6
∑ yi − y 10 18 26
DMA X = i =1
= = 1,2 DMA Y = i =1
= = 2,0 s 2x = i =1
= = 4,5 s 2y = i =1
= = 6,5
n 5 n 5 n −1 5 −1 n −1 5 −1

Como o DMAY foi maior que o DMAX, conclui-se que o conjunto Y apresenta maior
variabilidade em seus valores do que o conjunto X.
5
Verificar se um estimador é não-viciado e com menor variabilidade.
6
O DMA calcula o módulo de cada desvio, em vez de elevar cada desvio ao quadrado.

31 32
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

Como o s 2X foi menor que o s 2Y , conclui-se que o conjunto X apresenta menor O salário médio de ambas as empresas é 1500 reais, então a pessoa interessada deve
estar ciente de que o seu salário vai girar em torno desse valor. Analisando o desvio-
variabilidade em seus valores do que o conjunto Y (os valores de X são mais
padrão, vemos que a variabilidade dos salários na empresa ‘A’ é muito menor indicando
homogêneos).
que os salários dessa empresa estão bem próximos de 1500 do que os salários da
Pelo fato de trabalhar com os desvios elevados ao quadrado, a unidade de medida da empresa ‘B’. Então, se a escolha não fosse influenciada por outros fatores (plano de
variância é também elevada ao quadrado também. Por exemplo, se conjunto X do carreira, plano de saúde, vale refeição, etc), a empresa ‘A’ seria mais interessante do
exemplo 19 se referir à idade (em anos) de cinco crianças, então a variância será igual a que a ‘B’.
4,5 anos2. Se o conjunto se referir ao salário (em mil reais) de cinco funcionários, então
a variância será igual a 4.500 reais2 e, por fim, se o conjunto se referir ao número de
Variância e desvio-padrão populacional
filhos de cinco famílias, então a variância será igual 4,5 filhos2.

Fica difícil ter alguma interpretação prática para a variância, já que sua unidade de Quando temos os dados de uma população (o que é uma raridade), o desvio-padrão
medida não é a mesma dos dados originais. Para resolver essa pequena inconveniência, passa a ser denominado de desvio-padrão populacional e denotado pela letra grega σ
bastou tirar a raiz quadrada do valor da variância, dessa forma, surgiu o desvio-padrão. (leia-se sigma). A fórmula do desvio-padrão populacional é:

O desvio-padrão amostral, representada por s, é apenas a raiz quadrada da variância. N


∑ (x i − µ )
2
Portanto sua fórmula é dada por: i =1
n σ=
∑ (x i − x ) N
2

i =1 onde
s = variância → s=
n −1 xi = i-ésimo valor da variável X
µ = média populacional
EXEMPLO 22 – Volte ao EXEMPLO 21 e calcule o desvio-padrão dos dois conjuntos N = número de valores somados (tamanho da população)
de dados.
A variância populacional é denotada por σ2 é calculada por:
Solução ---------------------------------------------------------------------------------------------
N
O desvio-padrão do conjunto X é s x = 4,5 = 2,12
∑ (x i − µ )
2

2 i =1
O desvio-padrão do conjunto Y é s y = 6,5 = 2,55 σ =
N
Quanto maior for o desvio-padrão, mais afastados os valores estarão da média, portanto
maior será a variabilidade dos valores. A unidade de medida do desvio-padrão é a
mesma unidade dos dados originais. Por exemplo, se conjunto X do exemplo 19 se Por que na variância a divisão é por n - 1 e não por n?
referir à idade (em anos) de cinco crianças, então o desvio-padrão será igual a 2,12 anos.
Se o conjunto se referir ao salário (em mil reais) de cinco funcionários, então o desvio- Quando temos os dados de toda a população, o cálculo da variância é feito dividindo a
padrão será igual a 2.120 reais e, por fim, se o conjunto se referir ao número de filhos de soma dos desvios ao quadrado pelo tamanho da população N, obtendo, então, uma
cinco famílias, então o desvio-padrão será igual 2,12 filhos. média desses desvios. Entretanto, na estatística, freqüentemente trabalhamos com uma
amostra apenas e o desejo é usar essa amostra para obter estimativas de parâmetros da
O que de fato é o desvio-padrão? população, entre eles a variância populacional (σ2).
Essa é a pergunta mais freqüente do aluno. O que podemos dizer é que o desvio-padrão Ao calcular a variância amostral (s2) usando n no denominador, o valor obtido de s2
é uma medida do quanto os valores estão afastados da média (ou uns dos outros para ser estará subestimando a real variância (σ2). Então, para melhorar a estimativa da real
mais fácil de entender), sua utilidade é mais visível quando ele é usado para comparar a variância (σ2), calculamos a variância usando o n – 1 no denominador, em vez de n.
variabilidade entre diversos conjuntos de valores. Por exemplo, suponha alguém esteja
interessado em um emprego oferecido por duas pelas empresas. O resumo dos salários
dessas empresas está na tabela abaixo:

Desvio-padrão
Empresa Salário médio
dos salários
A 1500 reais 50 reais
B 1500 reais 250 reais

33 34
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

• Coeficiente de variação (CV)


Fórmula alternativa de calcular a variância e/ou o desvio-padrão
A amplitude, o desvio médio absoluto, a variância e o desvio-padrão são medidas
Há uma fórmula alternativa que nos permite calcular a variância e o desvio-padrão absolutas de dispersão.
amostral.
O coeficiente de variação, representado por CV, é uma medida relativa de dispersão,
2 pois leva em consideração a média do conjunto de dados. Ele é a razão entre o desvio-
 n 
n
∑ xi  padrão s e a média x , isto é:
∑ x i2 −  i =1 
n s
Variância 2
s = i =1
CV =
n −1 x
2
 n  Como se pode ver, o CV é adimensional (não tem unidade de medida) e multiplicando o
n
∑ xi  valor obtido por 100, ele será expresso em percentual (%). O coeficiente de variação é
 

i =1
2
xi − i =1

n
indicado para comparar variabilidade de variáveis com unidades diferentes ou comparar
Desvio-padrão s= variabilidade entre conjuntos com médias bem diferentes.
n −1
EXEMPLO 24 – Considere os quatro conjuntos de valores:
n n X = Peso de recém-nascidos (em kg) = {4, 5, 6, 5}
onde: ∑ xi
i =1
= x1 + x 2 + L + x n ∑x
i =1
2
i = x12 + x 22 + L + x 2n Y = Peso da mãe (em kg) = {65, 75, 68, 60}
Z = Altura da mãe (em cm) = {178, 176, 170, 160}
Z = Altura do pai (em cm) = {185, 180, 175, 160}
EXEMPLO 23 – Volte ao EXEMPLO 19 e calcule a variância e o desvio-padrão do
conjunto X usando a fórmula alternativa. QUADRO RESUMO
X = Peso de recém- Y = Peso da mãe dos Z = Altura da mãe Q = Altura do pai
nascidos recém-nascidos dos recém-nascidos dos recém-nascidos
Conjunto X (em kg) (em kg) (em cm) (em cm)
xi x i2 média = 5 kg média = 67 kg média = 171 cm média = 175 cm
7 49 dp = 0,82 kg dp = 6,78 kg dp = 8,08 cm dp = 10,8 cm
7 49 CV = 16,3% CV = 9,4% CV = 4,7% CV = 6,2%
4 16 dp = desvio-padrão
7 49
10 100
Comparando variabilidade entre as variáveis X e Y
∑ x i = 35 ∑ x i2 = 263
→ As unidades de medidas são as mesmas para ambas as variáveis, porém o peso médio
da mãe (67 kg) é muito diferente do peso médio da criança (5 kg). Nesse caso, a
(35)2 melhor forma de comparar a variabilidade é usar o coeficiente de variação
263 − (CVX = 16,3% e CVY = 9,4%). Comparando os resultados, vê-se que a variação
Variância s2 = 5 = 4,5 relativa dos pesos7 é maior para os recém-nascidos do que para as mães.
5 −1
Desvio-padrão s = 4,5 = 2,12 Comparando variabilidade entre as variáveis Y e Z
→ As unidades de medidas são bem diferentes (kg para peso e cm para altura). Nesse
caso, a única forma de comparar a variabilidade é usando o coeficiente de variação
(CVY = 9,4% e CVZ = 9,4%). Comparando os resultados, vê-se que a variação
relativa é maior para os pesos das mães.

7
Variação em torno da média.

35 36
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

Comparando variabilidade entre as variáveis Z e Q 2.2 Medidas de dispersão para dados agrupados em tabelas de freqüência
→ As unidades de medidas são as mesmas e as médias são bem parecidas (171 cm das
mães e 175 cm dos pais). Nesse caso, podemos usar tanto o desvio-padrão quanto o 2.2.1. Dados agrupados sem intervalos de classe
coeficiente de variação. Comparando os resultados, vê-se que há uma maior
variabilidade nas alturas dos pais (dp = 10,8 cm e cv = 6,2%) do que nas alturas das Se os dados estão agrupados em tabela sem classe, então xi é o valor da nossa variável
mães (dp = 8,08 cm e cv = 4,7%). de interesse e fi é a freqüência desse valor. Da mesma forma que levamos em
consideração as freqüências fi no cálculo da média (ver seção 2.2.1), também devemos
considerá-las no cálculo da variância e desvio-padrão. As duas fórmulas dão os mesmos
Propriedades do desvio-padrão resultados e, em se tratando de tabelas, a segunda fórmula abaixo é mais prática.

Suponha que os dados do conjunto x = {x1, x2,..., xn} têm um desvio-padrão sx: 2
 n 
i) Somando-se (ou subtraindo-se) uma constante b a todos os valores de uma variável, n
 ∑ xifi 
n
 
∑ (x i − x ) ∑
2 2 i =1
o desvio-padrão do conjunto não se altera. fi xi fi −
2 i =1 2 i =1 n
Se y i = x i ± b ⇒ sy = sx s = ou s =
n −1 n −1
ii) Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
EXEMPLO 26: Volte ao EXEMPLO 11 e calcule a variância e o desvio-padrão do
constante b, o desvio-padrão do conjunto fica multiplicado (ou dividido) dessa
número de filhos dos funcionários.
constante.
Se y i = bx i ⇒ s y = bs x Solução ---------------------------------------------------------------------------------------------
Antes de responder devemos criar as colunas x i f i e x i2 f i
EXEMPLO 25 – Considere o conjunto X = {1, 2, 3, 3, 4, 5}, cujo desvio-padrão é
sx = 1,4142.
xi fi x i fi x i2 f i
a) Se cada valor xi for somado o valor 6, qual será o desvio-padrão dos ‘novos’
valores? 0 5 0 0
b) Se cada valor xi for multiplicado pelo valor 4, qual será o desvio-padrão dos 1 7 7 7 Lembrando de que, em uma
‘novos’ valores? 2 5 10 20 tabela de freqüência,
3 2 6 18 ∑ fi = n
Solução --------------------------------------------------------------------------------------------- 4 1 4 16
Total ∑fi = 20 ∑ x i f i = 27 ∑ x i2 f i = 61
Vamos aplicar as propriedades vistas acima.

a) Se yi = xi + 6, então s y = s x = 1,4142 (veja a coluna 2 da tabela abaixo) Da tabela ao lado temos: ∑ f i = 20 ∑ x i f i = 27 ∑ x i2 f i = 61


b) Se yi = 4*xi, então s y = 4 ⋅ s x = 4*1,4142 = 5,6568 (veja a coluna 3 da tabela
Variância amostral
abaixo) 2
 n 
 ∑ xifi 
(1) (2) (3)
n
  (27)2
xi yi = xi + 6 yi = 4*xi
∑ 2
xi fi − i =1

n
61 −
20
2
s = i =1
= = 1,29 (filho)2
1 7 4 n −1 20 − 1
2 8 8
3 9 12 Desvio-padrão amostral
3 9 12 s = 1,29 = 1,14 filho
4 10 16
5 11 20
sx = 1,4142 sy = 1,4142 sy = 5,6569
Obs: Deixarei como exercício os cálculos dos desvios-padrões

37 38
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

2.2.2. Dados agrupados com intervalos de classe


3. Medida de Posição Não-Central
Se os dados estão agrupados em tabela com intervalo de classe, então xi é o ponto médio
da classe e fi é a freqüência dessa classe. As duas fórmulas dão os mesmos resultados e,
em se tratando de tabelas, a segunda fórmula abaixo é mais prática. As medidas de posição central (média, mediana, ...) e as medidas de dispersão
2 (variância, desvio-padrão, ...) desempenham um papel importante na estatística, pois
 n 
n
 ∑ xifi  conseguem descrever as duas principiais características de uma distribuição de valores:
n
∑ (x i − x )
2
fi ∑ x i2 f i −  i =1  o valor central e a variabilidade. A mediana, além de representar o valor central de uma
2 i =1 2 i =1 n distribuição, também apresenta uma característica interessante que é a de dividir a
s = ou s = distribuição em duas partes iguais quanto ao número de elementos em cada parte.
n −1 n −1
Usando essa última idéia da mediana podemos também dividir a distribuição em quatro,
EXEMPLO 27 – Volte ao EXEMPLO 16 e calcule a variância e o desvio-padrão dos dez ou cem partes iguais quanto ao número de elemento. As medidas que dividem a
salários dos funcionários. distribuição em quatro, dez e cem partes iguais são denominados de quartis, decis e
percentis, respectivamente. No geral, essas medidas são conhecidas como medidas
Solução --------------------------------------------------------------------------------------------- separatrizes ou medidas de posição não-central.
Antes de responder devemos criar as colunas x i f i e x i2 f i
3.1 Medidas de posição não-central para dados não-agrupados
Salários xi fi x i fi x i2 f i
4,0 | 8,0 6 5 30 180 • Quartil (Q)
8,0 | 12,0 10 7 70 700
12,0 | 16,0 14 4 56 784 Há três quartis (Q1, Q2, Q3), que juntos dividem a distribuição em quatro partes iguais
16,0 | 20,0 18 3 54 972 com cerca de um quarto (ou seja, 25%) dos elementos em cada parte.
20,0 | 24,0 22 1 22 484
Primeiro Quartil
Total --- ∑ fi = 20 ∑ x i f i = 232 ∑ x i2 f i = 3120
Obs. xi = ponto médio da classe i Simbolizado por Q1 é o valor que divide o conjunto ordenado de valores em duas
partes, tais que um quarto (ou 25%) dos valores sejam menores do que ele e três quartos
(ou 75%) dos valores dos restantes sejam maiores (ver figura a).
Da tabela ao lado temos: ∑ f i = 20 ∑ x i f i = 232 ∑ x i2 f i = 3120
Segundo Quartil
Variância amostral
 n 
2
Simbolizado por Q2 é o valor que divide o conjunto ordenado de valores em duas
 ∑ xifi  partes, tais que dois quartos (ou 50%) dos valores sejam menores do que ele e dois
n
  (232) 2

∑ 2
xi fi − i =1

n
3120 −
20
quartos (ou 50%) dos valores dos restantes sejam maiores. Note que o segundo quartil é
2
s = i =1
= = 22,574 (SM)2 a própria mediana, ou seja, Q2 = Md (ver figura b).
n −1 20 − 1
Terceiro Quartil
Desvio-padrão amostral
s = 22,57 = 4,75 SM Simbolizado por Q3 é o valor que divide o conjunto ordenado de valores em duas
partes, tais que três quartos (ou 75%) dos valores sejam menores do que ele e um quarto
(ou 25%) dos valores dos restantes sejam maiores (ver figura c).

25% 75% 50% 50% 75% 25%

Q1 Q2 = Md Q3
(a) (b) (c)

39 40
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

Segundo quartil (Q2)


Abaixo mostramos um desenho esquematizando a divisão de uma distribuição em
k = 2 posição → pos = 2 ⋅ 20 4 = 10 (o Q1 será a média dos valores que estão na
quatro partes com 25% dos elementos em cada grupo. Note que de Q1 a Q3 temos
metade (ou 50%) dos valores. 10ª e 11ª posição no conjunto ordenado)

8+8 Cerca de 50% dos funcionários percorrem menos de 8


Q2 = = 8,0 km km até a empresa e os restantes (50%) percorrem mais
2
de 8 km.
25% 25% Obs: O cálculo acima não precisava ser feito. Um número entre 8 e 8 só pode ser o 8 mesmo.
25%
25%
Terceiro quartil (Q3)
Q1 Q2 Q3 Livro do Barbeta, 2004 k = 3 posição → pos = 3 ⋅ 20 4 = 15 (o Q1 será a média dos valores que estão na
15ª e 16ª posição no conjunto ordenado)
Primeiro
Quartil Segundo Terceiro
Quartil Quartil
9 + 15 Cerca de 75% dos funcionários percorrem menos de 12
Q3 = = 12,0 km
Não há um consenso mundial sobre um procedimento único para obter os quartis. 2 km até a empresa e os restantes (25%) percorrem mais
Vamos usar o seguinte procedimento: de 12 km.

• Ordene o conjunto de dados em ordem crescente e calcule pos = ( k ⋅ n ) 4 que é a


posição do Quartil Qk (k = 1, 2 ou 3);
• Se pos não for inteiro, arredonde pos para cima (maior inteiro mais próximo) e o
Quartil Qk será o valor que está na posição pos.
• Se pos for inteiro, então o Quartil Qk será a média entre os valores que estão na
posição pos e pos +1.

EXEMPLO 28 – Os dados abaixo se referem à distância percorrida até a empresa para


uma amostra de 20 funcionários. Calcule os três quartis e interprete-os
8, 7, 6, 2, 9, 8, 15, 15, 16, 3, 18, 8, 8, 3, 9, 18, 2, 6, 6, 2

Solução ---------------------------------------------------------------------------------------------
Ordenando os dados: 2, 2, 2, 3, 3, 6, 6, 6, 7, 8, 8, 8, 8, 9, 9, 15, 15, 16, 18, 18 n = 20

Primeiro quartil (Q1)


k = 1 posição → pos = 1 ⋅ 20 4 = 5 (o Q1 será a média dos valores que estão na 5ª e
6ª posição no conjunto ordenado)

3+ 6 Cerca de 25% dos funcionários percorrem menos de 4,5


Q1 = = 4,5 km
2 km até a empresa e os restantes (75%) percorrem mais
de 4,5 km.

41 42
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

• Percentil Percentil 72 (P72)


k = 72 posição → pos = 72 ⋅ 20 100 = 14,4 ≈ 15 (o P72 será o valor que está na 15ª
Há 99 percentis (P1, P2, ..., P99), que juntos dividem a distribuição em cem partes iguais
posição no conjunto ordenado)
com cerca de 1% dos elementos em cada parte.

Percentil k (k = 1, 2, ...., 99) P72 = 15 km Cerca de 72% dos funcionários percorrem menos de 9 km até a
empresa e os 28% restantes percorrem mais de 9 km.
Simbolizado por Pk é o valor que divide o conjunto ordenado de valores em duas
partes, tais que k% dos valores sejam menores do que ele e os restantes sejam maiores.

Por exemplo: Relação entre os quartis e os percentis.


Q1 = P25 Q2 = P50 = mediana Q3 = P75
Percentil 70 (P70)
É o valor que divide em duas partes, tais que 70% dos valores sejam menores do que
ele e os 30% restantes sejam maiores.
Procedimento usado pelo Minitab para calcular os percentis.
Percentil 50 (P50)
É o valor que divide em duas partes, tais que 50% dos valores sejam menores do que Há alguns procedimentos diferentes para obtenção dos percentis e quartis. Abaixo será
ele e os 50% restantes sejam maiores. Note que o P50 é a mediana. mostrado o procedimento usado pelo pacote estatístico Minitab.

O procedimento que vamos usar é o mesmo usado para o cálculo dos quartis. • Ordene o conjunto de dados em ordem crescente e calcule pos = k ⋅ (n + 1) 100 que
é a posição do Percentil Pk (k = 1, 2, ..., 99);
• Ordene o conjunto de dados em ordem crescente e calcule pos = k ⋅ n 100 que é a • Se pos for inteiro, então o Percentil Pk será o valor que está na posição pos.
posição do Percentil Pk (k = 1, 2, ..., 99); • Se pos não for inteiro, então o Percentil Pk será o valor obtido usando interpolação
• Se pos não for inteiro, arredonde pos para cima (maior inteiro mais próximo) e o linear entre os valores que estão na posição pos e pos +1. Escrevendo a posição com
Percentil Pk será o valor que está na posição pos. duas casas decimais pos = A,BC, então
• Se pos for inteiro, então o Percentil Pk será a média entre os valores que estão na X [A,BC ] = X [A ] + 0, BC ⋅ ( X [A +1] − X [A ] )
posição pos e pos +1. Onde X[r] representa o valor que está na posição “r”.

Vamos repetir com o EXEMPLO 29, porém usando o procedimento do Minitab.


EXEMPLO 29 – Os dados abaixo se referem a distância percorrida até a empresa para Percentil 72 (P72)
uma amostra de 20 funcionários. Calcule e interprete o Percentil 34 e o Percentil 78.
k = 72 posição → pos = 72 ⋅ ( 20 + 1) 100 = 15,12 (A = 15 e BC = 12)
8, 7, 6, 2, 9, 8, 15, 15, 16, 3, 18, 8, 8, 3, 9, 18, 2, 6, 6, 2
X [15,12 ] = X [15 ] + 0,12 ⋅ (X [15+1] − X [15 ] ) = 9 + 0,12 ⋅ (15 − 9) = 9,72
Solução ---------------------------------------------------------------------------------------------
Ordenando os dados: 2, 2, 2, 3, 3, 6, 6, 6, 7, 8, 8, 8, 8, 9, 9, 15, 15, 16, 18, 18 n = 20 Percentil 72 (P72)
↑ ↑ k = 72 posição → pos = 72 ⋅ ( 20 + 1) 100 = 15,12 (A = 15 e BC = 12)
Percentil 34 (P34) X [15,12 ] = X [15 ] + 0,12 ⋅ (X [15+1] − X [15 ] ) = 9 + 0,12 ⋅ (15 − 9) = 9,72
k = 34 posição → pos = 32 ⋅ 20 100 = 6,4 ≈ 7 (o P34 será o valor que está na 7ª
posição no conjunto ordenado)

P34 = 6 km Cerca de 34% dos funcionários percorrem menos de 6 km até a


empresa e os 66% restantes percorrem mais de 6 km.

43 44
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

Percentis para dados agrupados em tabelas de freqüência • Percentil 95 (P95)


pos = 95 ⋅ 20 100 = 19 (como existe um pos = Fi = 19, então o percentil será uma
O cálculo dos quartis e percentis para dados agrupados em tabelas de freqüência (com média do valor xi = 3 dessa linha com o valor xi = 4 da linha
ou sem intervalo de classe) segue o mesmo raciocínio empregado no cálculo da mediana seguinte)
para dados agrupados (ver seção 1.2). 3+ 4
P95 = = 3,5
Como há uma relação entre os percentis e os quartis, os cálculos que serão visto a 2
seguir serão feitos apenas para os percentis.
Então, o valor do Percentil 95 é P95 = 3,5 filhos

• Terceiro Quartil (Q3)


3.2.1. Dados agrupados em tabelas de freqüência sem classe
Basta lembrar que Q3 = P75
Então, o valor do terceiro quartil é Q3 = 2 filhos (já calculado anteriormente)
Etapas a serem seguidas
• Determine a freqüência absoluta acumulada (Fi);
• Calcule pos = k ⋅ n 100 que é a posição do Percentil Pk (lembre-se: n = ∑ f i )
3.2.2. Dados agrupados em tabelas de freqüência com classe
• Localize o Percentil Pk como sendo o valor cuja freqüência acumulada (Fi) é
imediatamente superior à posição pos do Percentil.
Etapas a serem seguidas:
• Determine a freqüência absoluta acumulada (Fi);
Observação:
No caso de existir uma freqüência acumulada Fi exatamente igual a pos = k⋅n/100, o • Calcule pos = k ⋅ n 100 que é a posição do Percentil Pk (lembre-se: n = ∑ f i )
Percentil será a média aritmética entre o valor da variável correspondente a essa • Localize a classe do percentil como sendo a classe com a freqüência acumulada
freqüência acumulada é a seguinte. (Fi) imediatamente superior à posição pos do percentil;
• Calcule o percentil usando o método da interpolação linear abaixo:

EXEMPLO 30 – Volte ao EXEMPLO 11 e calcule o Percentil 75, o Percentil 95 e o Pk = l * +


( pos − Fant)(
*
)
⋅ L* − l *
terceiro Quartil. f i*
onde,
Solução --------------------------------------------------------------------------------------------- classes fi Fi
f i* , l * e L* = freqüência absoluta, limite inferior e
superior da classe do percentil, respectivamente. ... *
f ant *
Fant
Número de filhos *
fi Fi Fant = freqüência absoluta acumulada anterior à
xi * l * |
 L* fi*
Fi*
0 5 5 classe do percentil. classe do percentil ... * *
f pos Fpos
1 7 12
2 5 17 Observação:
3 2 19 No caso de existir uma freqüência acumulada Fi exatamente igual a pos = k ⋅ n 100 , o
4 1 20 percentil será o limite superior da classe correspondente.
Total ∑ fi = 20 --

• Percentil 75 (P75)
pos = 75 ⋅ 20 100 = 15 (terceira linha da tabela, pois é Fi = 17 é imediatamente
superior a pos = 15)

Então, o valor do Percentil 75 é P75 = 2 filhos

45 46
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

EXEMPLO 31 – Volte ao EXEMPLO 16 e calcule a calcule o Percentil 75, o Percentil 3.2 Construção do Box-plot
95 e o terceiro Quartil.
O gráfico Box-plot (ou gráfico de caixa) é uma representação gráfica que descreve as
Solução --------------------------------------------------------------------------------------------- seguintes características importantes de uma distribuição de dados: medida de posição
central, medida de dispersão, desvio da simetria e identificação de valores extremos
Salários xi fi xifi Fi (outliers).
4,0 | 8,0 6 5 30 5
8,0 | 12,0 10 7 70 12 Há duas formas de construir o Box-plot. Uma delas é a construção do gráfico sem se
12,0 | 16,0 14 4 56 16 preocupar com a identificação de valores extremos e a segunda com a identificação dos
16,0 | 20,0 18 3 54 19 valores extremos (caso existam).
20,0 | 24,0 22 1 22 20
Total --- ∑ = 20 ∑ = 232 -- a) Box-plot sem identificação de valores extremos (outliers).

• Percentil 75 (P75) A linha se estende até A linha se estende


o menor valor. até o maior valor.
pos = 75 ⋅ 20 100 = 15 (P75 está na terceira classe, pois é Fi = 16 é imediatamente
superior a pos = 15) D = Q3 – Q1 = distância interquatílica

Da tabela temos: l * = 12 , L* = 16 , f i * = 4 e Fant * = 12

Pk = 12 +
(15 − 12 )
⋅ (16 − 12 ) = 15 Q1 Q2 Q3
4
b) Box-plot com identificação de valores extremos (outliers).
Então, o salário que corresponde ao Percentil 75 é P75 = 15 SM
Segundo o critério usado pelo Box-plot, todo valor acima de Q3 + 1,5⋅(Q3- Q1) é
• Percentil 95 (P95)
considerado um valor muito grande (valor extremo) e todo valor abaixo de
pos = 95 ⋅ 20 100 = 19 (P95 está na quarta classe, pois é Fi = 20 é imediatamente Q1 - 1,5⋅(Q3- Q1) é considerado um valor muito pequeno (valor extremo). Esses
superior a pos = 19) valores extremos são identificados no gráfico com o asterisco (*).

Da tabela temos: l * = 20 , L* = 24 , f i * = 1 e Fant


*
= 19 A linha se estende até o A linha se estende até o
menor valor, desde que ele maior valor, desde que ele
seja maior que Q1 -1,5D seja menor que Q3 +1,5D
Pk = 20 +
(19 − 19 )
⋅ (24 − 20 ) = 20
1
* * *
Então, o salário que corresponde ao Percentil 95 é P95 = 20 SM
Valor extremo Valores extremos

• Terceiro Quartil (Q3) Q1 - 1,5D Q1 Q2 Q3 Q 3 + 1,5D


Basta lembrar que Q3 = P75
D = Q3 – Q 1 = distância interquatílica
Então, o valor do terceiro quartil é Q3 = 15 SM (já calculado anteriormente)
As linhas verticais em Q1 - 1,5⋅(Q3 - Q1) e Q3 + 1,5⋅(Q3 - Q1) não precisam estar no
gráfico, elas só foram colocadas para ajudá-lo a visualizar os limites máximo e mínimo
3.2.3. Usando a Ogiva de Galton (gráfico de freqüência acumulada) dos valores considerados “normais” (que não são valores extremos) .
<<<< completar depois >>>>
Quanto maior o comprimento da caixa maior é variabilidade dos dados, portanto a
distância interquatílica (D = Q3 – Q1) pode ser vista também como uma medida de
dispersão,tal como são a variância e o desvio-padrão.

47 48
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

EXEMPLO 32 - Considere a renda per-capita para uma amostra de 9 famílias de cada


Os gráficos Box-plot abaixo comparam as notas finais de uma disciplina em três turmas. região abaixo. Construa os gráficos boxplot para essas rendas e comente-os. Observe
A inspeção dos gráficos revela que existe uma grande variabilidade nas notas dos alunos que alguns quartis já estão calculados.
na turma B e uma pequena variabilidade nas notas na turma A8. A performance foi
melhor na turma A e pior na turma C9. Quartis
Região Rendimento familiar per capita (em SM) Q1 Q2 Q3
Existe um valor extremo (um aluno com uma nota muito grande) na turma A e um Brasil 30 44 80 100 130 150 180 352 580 ? 130 180
alunos com nota muito pequena na turma C. Não existe nenhum valor extremo em B. São Paulo 50 82 150 180 208 250 300 500 650 150 208 300
Nordeste 10 15 55 65 68 75 80 192 300 55 68 ?
FONTE: Dados hipotéticos SM (salário-minimo em 1999) = 136,00 reais
100

90
900
80
800
Notas finais

70 700

600

Salário-mímimo
60

500
50
400
40
300
30
200
Turma A Turma B Turma C
100

Brasil São Paulo Nordeste

8
Observe que a caixa, na turma B, é mais comprida (maior D =distância interquatílica), enquanto que, na
turma A, a caixa é menor em comprimento.
9
Observe a linha do meio (a linha da mediana), ela está em torno de 80 pts, na turma A, e em torno de
60 pts na turma C.

49 50
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

4. Medida de Assimetria Classificação da assimetria com base no valor do índice de assimetria Pearson (As)

Em algumas situações é interessante analisarmos a "forma" da distribuição, ou seja, A assimetria será negativa se As < 0 e positiva se As > 0. A intensidade da assimetria é
como os dados se distribuem. Essa distribuição pode ser simétrica ou assimétrica em determinada pela magnitude de As. Se:
torno da média.
• As ≈ 0 Aistribuição não é assimetria (ou melhor, ela é simétrica)
Na distribuição simétrica, as modas, a média e a mediana coincidem teoricamente, mas
• As < 0,15 Distribuição tem uma fraca assimetria
na prática elas tendem a coincidir. Então, se você tem um conjunto de dados, onde a
média, mediana e moda são próximos uns dos outros é bem provável que a distribuição • 0,15 < As < 1 Distribuição tem uma moderada assimetria
seja simétrica. • As > 1 Distribuição tem uma forte assimetria
Na distribuição assimétrica à direita, a média tende a estar à direita da mediana, Obs: As = módulo de As
enquanto que na distribuição assimétrica à esquerda, a média tende a estar à esquerda
da mediana (veja as "formas" teóricas na figura abaixo). Então, se você tem um Assimetria negativa Assimetria positiva
conjunto de dados, onde a média é bem maior do que a mediana é provável que seus
dados apresentem assimetria à direita, por outro lado se a média for bem menor do que -1 -0,15 0 +0,15 +1
a mediana, então provavelmente seus dados apresentam assimetria à esquerda. Forte Moderada Fraca Moderada Forte
assimetria assimetria assimetria assimetria assimetria
Uma medida simples da assimetria em torno da média é o índice de assimetria de
Pearson, representado por As.
EXEMPLO 33 – Em cada distribuição abaixo, calcule o coeficiente de assimetria de
3 ⋅ (x − Md )
As = Pearson e identifique o tipo de assimetria dos dados.
s
Distribuição 1 Distribuição 2 Distribuição 3
média = 9,95 média = 2,38 média = 0,85
mediana = 9,90 mediana = 2,23 mediana = 0,94
desvio-padrão = 1,90 desvio-padrão = 1,03 desvio-padrão = 0,19

Solução ---------------------------------------------------------------------------------------------

3 ⋅ (9,95 − 9,90)
Distribuição 1: As = = 0,08 → Fraca assimetria positiva
1,90 (Quase simétrica)
3 ⋅ (2,38 − 2,23)
Distribuição 2: As = = 0,44 → Moderada assimetria positiva
FONTE: Mário Triola – Introdução à Estatística (9ª. edição)
1,03
3 ⋅ (0,85 − 0,94)
Distribuição 3: As = = -1,42 → Forte assimetria negativa
0,19

EXEMPLO 34 – Em cada histograma abaixo, identifique o tipo de assimetria.

120
100

40
30

80

30
20

60

20
40
10

10
20
0

0
1 2 3 4 5 6 7 0.2 0.4 0.6 0.8 1.0 6 8 10 12 14
distribuição 2 distribuição 3 distribuição 1

(a) (b) (c)

51 52
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

Relação entre gráfico Box-plot e a assimetria de uma distribuição Exercícios adicionais


Abaixo estão exibidas quatro distribuições teóricas hipotéticas destacando a assimetria EXERCÍCIO 01 - Uma amostra de 10 funcionários da empresa XYZ foi escolhida e
de cada uma e comparando-as com o gráfico Box-plot. registrada a distância em km que esses funcionários percorrem até chegar à empresa.

x = distância percorrida = {13, 5, 15, 9, 3, 15, 9, 12, 15, 7}

a) Desenhe um gráfico de pontos para os dados acima.


b) Qual a distância média percorrida pelos funcionários?
c) Qual a mediana e a moda da distância percorrida pelos funcionários?
d) Um funcionário que percorre 20 km foi acrescentado à amostra acima, mas
vamos supor que o responsável pela entrada de dados errou na digitação e
acabou registrando 200. Calcule novamente as medidas estatísticas que você
calculou em ‘b’ e ‘c’. O que você reparou?
e) Vamos imaginar que uma obra está sendo feito na estrada que leva à empresa
XYZ, de forma que cada funcionário teria que percorrer mais 1,25 km para
chegar à empresa. Calcule a distância média percorrida por esses funcionários
considerando essa obra agora.

EXERCÍCIO 04 - Considere os salários de 4 funcionários de um setor.


x = salário em reais = {800, 700, 900, 15000},
FONTE: Estatística – Teoria e Aplicações à Estatística .
a) Calcule a média amostral e a mediana amostral e diga qual dessas medidas
Levine, Stephan, Khehbiel, Berenson, 3ª edição estatísticas “melhor” representa os salários desses funcionários.
b) Troque o valor de 15000 por 150000 e compare as mudanças ocorridas na média
e na mediana.
Se a linha no meio (que representa a mediana) do gráfico boxplot estiver bem no centro
da caixa é provável que os dados venham de uma distribuição simétrica (ver painel A).
EXERCÍCIO 05 – Calcule a média aparada de 5% para os dados abaixo, que se referem
Caso a linha do meio esteja mais próxima do terceiro quartil (Q3) é provável que os
a distância percorrida até a empresa para uma amostra de 20 funcionários.
dados venham de uma distribuição com assimetria negativa (ver painel B).
x = {5, 6, 6, 2, 2, 2, 3, 3, 3, 8, 8, 8, 8, 9, 9, 9, 15, 13, 15, 11}
Caso a linha do meio esteja mais próxima do primeiro quartil (Q1) é provável que os
dados venham de uma distribuição com assimetria positiva (ver painel C).
EXERCÍCIO 06 - Dona Maria foi à feira e encontrou batatas a R$ 1,50 o quilo e
resolveu comprar 8 kg de batatas. Andando mais um pouco pela feira, ela encontrou
batatas a R$ 1,00 kg e comprou mais 4 kg. No caminho de casa, notou que a quitanda
do Sr. Manoel estava vendendo as batatas por R$ 0,60 e resolveu comprar mais 15 kg
(vai gostar de batata, hein!). Qual foi o preço médio que Dona Maria pagou pelo quilo
da batata?
Dica: Use a média ponderada
Preço Quilo
(xi) (wi)
1,50 8
1,00 4
0,60 15

53 54
PUC Minas Virtual Disciplina: Probabilidade e Estatística PUC Minas Virtual Disciplina: Probabilidade e Estatística

EXERCÍCIO 07 – De uma amostra de 500 divórcios ocorridos em uma cidade, foi EXERCÍCIO 09 – Apresentamos o histograma das notas finas de uma turma da
registado a duração do casamento (em anos). Os dados estão na tabela abaixo. disciplina Introdução à Estatística. O eixo vertical representa a quantidade de aluno (ou
seja, a freqüência absoluta fi). Obtenha as seguintes medidas estatísticas: nota média
~
a) Qual a duração média dos casamentos? ( x ), nota mediana ( x ), moda das notas e o desvio-padrão das notas ( s ).
b) Qual é a moda e a mediana da duração dos casamentos? 30

24
TABELA Duração dos casamentos

Quantidade de alunos (fi)


Quantidade 20
Anos de
de divórcios
casamentos
(fi) 11
0 | 6 280 10

6 | 12 140 4
6
5 5
3
12 | 18 60 2

18 | 24 15 0

24 | 30 5 20 30 40 50 60 70 80 90 100

Notas
Total 500

EXERCÍCIO 08 – Numa amostra de 150 candidatos ao vestibular, foi registrado o EXERCÍCIO 10 – Abaixo estão listados os salários (em reais) de 12 funcionários de
número de vestibulares prestados por cada um até aquele momento. Assim, pela tabela uma empresa.
vemos que 75 candidatos prestaram vestibular uma única vez e assim por diante.
funcionário 1 2 3 4 5 6 7 8 9 10 11 12
c) Qual o número médio de vestibulares prestados pelos candidatos? salário 2210 2255 2825 2350 2380 2390 2420 2380 2440 2450 2550 2630
d) Qual é a moda e a mediana do número de vestibulares prestados pelos a) Se a empresa determinou que os funcionários com salários inferiores ao Decil 4
candidatos? (D4) receberiam aumento salarial. Quais desses funcionários receberiam o
aumento?
TABELA Número de vestibulares prestados b) Classifique o salário 2825 reais como sendo "usual" ou "raro" usando o escore z.
Número de Quantidade de Justifique.
vestibular candidatos c) Salários acima de LS são considerados atípicos por serem muito grandes em
prestado (fi) relação aos demais salário. Salários abaixo de LI são também considerados
1 75 atípicos por serem muito pequenos em relação aos demais salário. Dos
2 47 funcionários amostrados, liste (se houver) os funcionários com rendimentos
3 21 considerados muito pequenos ou grandes.
4 7 LI = Q 1 − 1,5 ⋅ (Q 3 − Q 1 ) LS = Q 3 + 1,5 ⋅ (Q 3 − Q 1 )
Total 150 d) Uma outra forma de verificar valores atípicos é usar a regra abaixo:
• valor muito • valor muito grande
pequeno se valor > x + 2 ⋅ s
se valor < x − 2 ⋅ s
Use a regra acima e liste (se houver) os funcionários amostrados com salários
considerados muito pequenos ou grandes.

55 56
PUC Minas Virtual Disciplina: Probabilidade e Estatística

5. Um jornal anunciou que uma pessoa gasta, em média, 45 minutos por dia ouvindo
música (The Des Moines Register, 5 de Dezembro de 1997). Os seguintes dados
foram obtidos para o número de minutos gastos ouvindo música em uma amostra de
30 indivíduos.

88,3 4,3 4,6 7 9,2 0 99,2 34,9 81,7 0


85,4 0 17,5 45 53,3 29,1 28,8 0 98,9 64,5
4,4 67,9 94,2 7,6 56,6 52,9 145,6 70,4 65,1 63,6

a) Calcule o tempo médio que estes indivíduos amostrados ouvem música. Os


dados amostrados são coerentes com a média populacional anunciada pelo
jornal?
b) Calcule a mediana.
c) Calcule e interprete os três Quartis.

57

Вам также может понравиться