Unid 2 PDF

Unidade II
Unidade II
5 MEDIDAS OU PARÂMETROS ESTATÍSTICOS
O estudo que fizemos anteriormente diz respeito ao agrupamento de dados coletados e à

representação gráfica de alguns deles. Cumpre agora estudarmos as medidas estatísticas. Esses
valores nos darão a imagem sintetizada do comportamento de uma amostra, permitindo que,
com relativamente poucas informações, possamos chegar a conclusões sobre essa amostra
estudada.
Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado
pelas medidas de tendência central, também chamadas de medidas de posição, que informam a
magnitude da amostra estudada. Essas medidas nos dão uma visão global da amostra sem se aterem às
características individuais de seus elementos.
No entanto, como é necessário que tenhamos ideia das variações dos elementos da amostra em
torno de suas medidas centrais, iremos estudar, também, um segundo grupo de medidas estatísticas: as
medidas de dispersão, também chamadas de medidas de variabilidade.
5.1 Medidas de posição
As medidas de posição ou medidas de tendência central, como o próprio nome indica,

preocupam‑se com definir uma posição central da amostra, ou seja, um valor que seja representativo
do que é típico da amostra. Iremos trabalhar com as três principais medidas desse tipo: a média, a
mediana e a moda.
5.1.1 Média
De todas as medidas de posição, a média é, seguramente, a mais usada. É chamada de

média simples quando a frequência dos diversos valores é igual a 1, ou seja, cada valor
aparece uma única vez na amostra, e de média ponderada quando os dados são dotados de
certa frequência.
Existem vários métodos diferentes para calcularmos as médias. Iremos nos preocupar com a principal
delas, a média aritmética. As demais (geométrica, quadrática e harmônica), além de serem muito menos
utilizadas, seguem os mesmos princípios da média aritmética, apenas com a utilização de operações
matemáticas diferentes.
A média aritmética é o resultado da soma dos valores de todos os elementos dividido pelo
número total de elementos, ou seja, pela frequência total. Em outras palavras, se tivermos um
54
ESTATÍSTICA
conjunto de valores S = {x1, x2, x3,………xn}, a média aritmética desse conjunto será calculada por
meio das fórmulas:
x1 + x2 + x 3 + .... + xn
X=
N
Ou
Σx i
X=
N
Onde:
X é a média aritmética;
x1, x2, etc. são os diversos valores;
N é a quantidade total de elementos da amostra.
Exemplo 1. Calcular a média aritmética dos valores relacionados a seguir:
S = {2; 5; 7; 9; 10; 12; 16; 18}
Observe que são oito elementos de diferentes valores, portanto:
Σx i 2 + 5 + 7 + 9 + 10 + 12 + 16 + 18
X= ⇒X= ⇒ X = 9, 9
N 8
Exemplo de aplicação
1. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos

correspondentes a cada um. Os dados estão na tabela a seguir:
Tabela 25
12% 13% 18% 9% 10% 11%

13% 15% 16% 14% 8% 17%
A partir desse dado, podemos dizer que o rendimento médio dessas aplicações é de:
A) 13%
B) 12%
55
Unidade II
C) 15%
D) 18%
E) 16%
Caso os valores sejam repetidos na amostra, ou seja, caso tenham uma frequência diferente
de 1 (x 1 com f 1; x 2 com f 2 e assim por diante), então a fórmula para o cálculo da média
aritmética é:
Σxifi
X=
Σfi
Este último conceito define a média ponderada; eventualmente, as frequências podem ser
substituídas por “pesos” que conferem importância diferenciada a cada valor.
O exemplo a seguir mostra o cálculo para dados não agrupados em classe:
Exemplo 2. Calcular a média aritmética dos valores relacionados a seguir:
Tabela 26
Valor Frequência simples
xi fi
25 37
42 28
57 54
62 62
39 12
Como no exemplo anterior, o cálculo da média aritmética consiste na soma de todos os valores
dividida pela quantidade total de elementos. Porém, cada um dos valores da tabela aparece certo
número de vezes, diferente de 1; por exemplo, o valor 25 aparece 37 vezes, portanto precisamos
somar 25 com ele mesmo 37 vezes; ou, de maneira mais direta, precisamos multiplicar 25 por
37. A coluna C mostra todos os cálculos desse tipo. Quando somamos essa coluna, obtemos o
valor 9.491, que corresponde à soma de todos os elementos da amostra (193 elementos). Assim,
a média é:
56
ESTATÍSTICA
Tabela 27
A B C=AxB
Valor Frequência simples Valor x Frequência
xi fi xi . fi
25 37 925
42 28 1176
57 54 3078
62 62 3844
39 12 468
ft 193 9491
Σxifi 9491
X= ⇒X= ⇒ X = 49, 2
Σfi 193
No caso de dados agrupados em classes, o processo de cálculo é idêntico ao anterior, com a diferença de
que o valor a ser usado é o ponto médio de classe (lembre‑se de que já definimos esse valor anteriormente):
xi = pmi
O exemplo a seguir mostra‑nos, passo a passo, o cálculo da média aritmética ponderada para dados
agrupados por classes:
2. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos

ocorreram na linha de produção. Na tabela a seguir, estão relacionados as informações referentes aos
últimos 120 dias de produção.
Tabela 28
Número de defeitos diários Número de dias

6 20
7 23
8 21
9 18
10 16
12 13
13 5
14 3
15 1
57
Unidade II
Nessas condições o número médio de defeitos diários é de aproximadamente:
A) 7,9
B) 10,0
C) 9,3
D) 8,0
E) 8,7
Exemplo 3. Dada a tabela de frequências a seguir, calcular a média aritmética.
Tabela 29
A B C D E = (C + D)/2 F=DxE
Ponto Frequência
Limites de classe Frequência médio x ponto
Classe simples de classe médio
li ls fi pmi fi x pmi
1,0 3,0 |------- 414,0 14,0 208,5 2.919,0
2,0 414,0 |------- 825,0 19,0 619,5 11.770,5
3,0 825,0 |------- 1.236,0 41,0 1.030,5 42.250,5
4,0 1.236,0 |------- 1.647,0 53,0 1.441,5 76.399,5
5,0 1.647,0 |------- 2.058,0 32,0 1.852,5 59.280,0
6,0 2.058,0 |------- 2.469,0 27,0 2.263,5 61.114,5
7,0 2.469,0 |------- 2.880,0 20,0 2.674,5 53.490,0
8,0 2.880,0 |------- 3.291,0 11,0 3.085,5 33.940,5
9,0 3.291,0 |------| 3.702,0 8,0 3.496,5 27.972,0
∑= ft = 225,0 369.136,5
A tabela anterior apresenta os valores e cálculos necessários para determinarmos a média aritmética
para uma amostra que estivermos descrevendo.
As áreas sombreadas da tabela mostram os cálculos necessários para a obtenção da média aritmética.
O uso de uma tabela para esses cálculos facilita as operações, além de estas serem mais facilmente
trabalhadas em computador.
Nesse exemplo, somamos os valores de todos os elementos da amostra, ficando na seguinte situação:
o valor da soma dos 225 elementos da amostra é 369136,5, portanto a média aritmética será de:
58
ESTATÍSTICA
Σxifi 369136, 5
X= ⇒X= ⇒ X = 1640, 6
Σfi 225
É importante observar as seguintes propriedades das médias aritméticas:
• a soma algébrica dos afastamentos (ou desvios, ou resíduos) de um conjunto de números tomados
em relação à média é nula;
• se multiplicarmos ou dividirmos todas as informações por uma constante, a média aritmética

ficará multiplicada ou dividida por essa constante;
• somando‑se ou subtraindo‑se uma constante de todos os valores de um conjunto de informações,

a média aritmética ficará somada ou subtraída dessa constante;
• a soma dos quadrados dos desvios tomados em relação à média aritmética é mínima (essa
propriedade é muito importante para a definição de desvio‑padrão, que veremos mais à frente)
3. Uma pequena agência de publicidade relacionou, na tabela a seguir, o custo das suas 120 últimas
campanhas publicitárias:
Tabela 30
Custo das campanhas publicitárias Quantidade de campanhas

Classes (limites) publicitárias (frequência simples)
A R$ 5.000 |‑‑‑‑ R$ 10.000 12
B R$ 10.000 |‑‑‑‑ R$ 15.000 15
C R$ 15.000 |‑‑‑‑ R$ 20.000 18
D R$ 20.000 |‑‑‑‑ R$ 25.000 23
E R$ 25.000 |‑‑‑‑ R$ 30.000 25
F R$ 30.000 |‑‑‑‑ R$ 35.000 14
G R$ 35.000 |‑‑‑‑ R$ 40.000 13
Nessas condições, podemos afirmar que o custo médio das campanhas publicitárias dessa agência é
de aproximadamente:
A) R$ 22.833,00
B) R$ 22.500,00
C) R$ 20.000,00
59
Unidade II
D) R$ 25.833,00
E) R$ 20.833,00
5.1.2 Mediana
Conceitualmente, definimos mediana como o valor, em um conjunto de valores ordenados, que

divide exatamente esse conjunto em duas metades, com 50% dos valores superiores à mediana e 50%
inferiores. Essa definição precisa adaptar‑se ao número N de elementos da amostra:
• caso N seja um número ímpar, a mediana será o valor do elemento central (chamado de elemento
mediano);
• caso N seja um número par, a mediana será a média aritmética simples dos dois elementos
centrais (o elemento mediano passa a ser um elemento teórico intermediário). Veja no
exemplo a seguir:
Exemplo 1. Dados os seguintes conjuntos de notas de alunos de Estatística, calcule a mediana:
Grupo A = {6,2; 4,2; 8,7; 6,4; 2,8; 9,1; 5,0; 3,9; 7,1}.
Para calcular a mediana é necessário colocar os dados em ordem crescente:
{2,8; 3,9; 4,2; 5,0; 6,2; 6,4; 7,1; 8,7; 9,1}
Como o número de elementos é ímpar (N = 9), a mediana será o valor do elemento central (o quinto
elemento), ou seja, o valor da mediana será 6,2.
Poderíamos dar uma roupagem mais matemática ao cálculo utilizando as fórmulas a seguir, onde:
Eme é o elemento mediano e Me a mediana:
N +1 9 +1
Eme = => Eme = => Eme = 5º
2 2
O valor do quinto elemento é a mediana:
Me = 6,2
Grupo B = { 8,4; 6,3; 9,2; 4,9; 6,5; 8,0}
Ordenando:
{4,9; 6,3; 6,5; 8,0; 8,4; 9,2}

60
ESTATÍSTICA
N +1 6 +1
Eme = => Eme = => Eme = 3, 5o
2 2
Evidentemente, não existe um elemento 3,5º. A mediana será a média aritmética entre o valor do
terceiro e do quarto elemento:
x3 + x4 6, 5 + 8, 0
Me = => Me = => Me = 7, 25
2 2
Cálculo semelhante se fará quando trabalhamos com dados agrupados, seja em classes ou não.
Primeiro, veremos quando os dados não forem agrupados em classes. Nesse caso, o procedimento é
semelhante ao feito no Exemplo 1, com a diferença de que precisaremos calcular a frequência acumulada
crescente para permitir localizarmos o elemento mediano.

correspondentes a cada um. Os dados estão na tabela a seguir:
Tabela 31
12% 13% 18% 9% 10% 11%

13% 15% 16% 14% 8% 17%
A partir desse dado, podemos dizer que o rendimento mediano dessas aplicações é de:
A) 18%
B) 12%
C) 15%
D) 13%
E) 16%
O exemplo 2 mostra o cálculo em duas situações diferentes:
Exemplo 2. Calcular a mediana para os dados relacionados a seguir, relativos ao número de filhos
por família moradora em determinada cidade.
61
Unidade II
Tabela 32 – Cidade A
Número de filhos Quantidade de familias

por família na cidade Frequência
acumulada crescente
xi fi fac
0 15 15
1 18 33
2 12 45
3 8 53
4 5 58
5 3 61
6 1 62
Mais do que 6 1 63
Soma 63
Perceba que o número de elementos (N = 63) é ímpar, logo o elemento mediano será o 32º:
63 + 1
Eme = => Eme = 32º
2
O 32º elemento tem o valor 18, isso porque, com os valores ordenados, os 15 primeiros referem‑se a famílias
com 0 filho; o 16º ao 33º valor referem‑se a famílias com 1 filho, e assim por diante. Logo a mediana será:
Me = 18
Portanto, podemos afirmar que 50% das famílias têm um filho ou menos, e 50% das famílias têm
um filho ou mais.
Tabela 33 – Cidade B
Número de filhos Quantidade de famílias

por família na cidade Frequência acumulada
crescente
xi fi fac
0 15 15
1 21 36
2 16 52
3 9 61
4 6 67
5 4 71
6 1 72
Mais do que 6 0 72
Soma 72
62
ESTATÍSTICA
Perceba que o número de elementos (N = 72) é par, logo o elemento mediano seria o 36,5º, que,
evidentemente, não existe.
72 + 1
Eme = => Eme = 36, 5o
2
O 36º elemento tem o valor 1, e o 37º, o valor o valor 2, portanto o 36,5º seria um valor médio entre
esses dois valores, ou seja, a mediana será:
1+ 2
Me = => Me = 1, 5
2
Portanto, podemos afirmar que 50% das famílias têm menos de 1,5 filho e 50% das famílias tem
mais de 1,5 filho.

ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos
Tabela 34
Número de Número de dias

defeitos diários
6 20
7 23
8 21
9 18
10 16
12 13
13 5
14 3
15 1
Nessas condições, o número médio de defeitos diários é de aproximadamente:
A) 7,9
B) 10,0
C) 9,3
63
Unidade II
D) 8,0
E) 8,7
O cálculo da mediana, quando trabalhamos com dados agrupados em classes, é mais trabalhoso
porque conseguimos determinar o elemento mediano e a classe da qual o elemento faz parte, mas não
o valor exato da mediana. A maneira de contornarmos esse inconveniente é utilizando os conceitos de
interpolação.
Lembrete
No nosso contexto, interpolar significa encontrar, dentro de uma faixa

de valores, aquele valor que melhor corresponde às condições estabelecidas,
normalmente situado entre dois outros valores conhecidos.
No caso do cálculo da mediana, o processo de interpolação gera a seguinte fórmula, que sempre
iremos usar:
E − f 
Me = liMe +  me ac ant  × h
 fMe 
Onde:
Me = Mediana.
lime = Limite inferior da classe que contém o elemento mediano (classe mediana).
Eme = Elemento mediano.
fac ant = Frequência acumulada crescente até a classe anterior à classe mediana.
fme = Frequência da classe mediana.
h = Amplitude da classe mediana.
O Exemplo 3, a seguir, demonstra o cálculo da mediana para uma distribuição de vendas em reais
agrupadas por classe.
Exemplo 3. Calcular a mediana para a tabela a seguir, que apresenta a distribuição de vendas de
determinada empresa.
64
ESTATÍSTICA
Tabela 35
Classes Vendas mensais em R$ Quantidade de meses Frequência

número Valor frequência acumulada crescente
li ls fi fac
1 R$ 50.000,00 |---- R$ 80.000,00 12 12
2 R$ 80.000,00 |---- R$ 110.000,00 18 30
3 R$ 110.000,00 |---- R$ 140.000,00 27 57
4 R$ 140.000,00 |---- R$ 170.000,00 26 83
5 R$ 170.000,00 |---- R$ 200.000,00 21 104
6 R$ 200.000,00 |---- R$ 230.000,00 18 122
7 R$ 230.000,00 |---- R$ 260.000,00 12 134
8 R$ 260.000,00 |---| R$ 290.000,00 9 143
TOTAL 143
O elemento mediano é dado por:
143 + 1
Eme = => Eme = 72º
2
O 72º elemento está na quarta classe, que chamamos de classe mediana, ou seja, a mediana é um
valor entre R$ 140.000,00 e R$ 170.000,00. Obteremos o resultado usando a fórmula da interpolação:
E − f   72 − 57 
Me = liMe +  me ac ant  × h = 140.000 +  × 30.0000 => Me = 157.307, 69
 fMe   26 
Portanto, podemos afirmar que 50% das vendas mensais dessa empresa estão acima de R$
157.307,69, e 50%, abaixo desse valor.
6. Uma pequena agência de publicidade relacionou, na tabela seguinte, o custo das suas 120 últimas
Tabela 36
Quantidade de campanhas
Classes Custo das campanhas publicitárias publicitárias (frequência simples)
A R$ 5.000 ï‑‑‑‑ R$ 10.000 12
B R$ 10.000 ï‑‑‑‑ R$ 15.000 15
C R$ 15.000 ï‑‑‑‑ R$ 20.000 18
D R$ 20.000 ï‑‑‑‑ R$ 25.000 23
E R$ 25.000 ï‑‑‑‑ R$ 30.000 25
F R$ 30.000 ï‑‑‑‑ R$ 35.000 14
G R$ 35.000 ï‑‑‑‑ R$ 40.000 13
65
Unidade II
Nessas condições podemos afirmar que o custo mediano das campanhas publicitárias dessa agência
é de aproximadamente:
A) R$ 22.370
B) R$ 22.500
C) R$ 23.370
D) R$ 25.833
E) R$ 20.833
5.1.3 Moda
O conceito de moda é o mais simples entre as medidas estatísticas. Trata‑se do valor

que mais vezes se repete numa distribuição de frequências, ou seja, aquele dotado de maior
frequência.
O cálculo da moda para dados isolados ou para dados não agrupados em classes é imediato: decorre
de simples observação, como mostra o Exemplo 1; já para dados agrupados necessitamos adotar algumas
recomendações feitas por estatísticos renomados. No Exemplo 2, apresentamos um cálculo deste último
tipo de distribuição.
Exemplo 1. Calcular a moda para os conjuntos de dados mostrados a seguir, referentes ao consumo
de rolamentos (em unidades) em várias linhas de produção.
Linha A: {21; 22; 24; 24; 25; 25; 25; 27; 28}
A moda evidentemente é: Mo = 25
Linha B: {8; 8; 9; 9; 9; 9; 10; 11; 11; 11; 11; 12; 12; 12}
Neste conjunto temos duas modas: Mo = 9 e Mo = 11. Chamamos de amostra multimodal.
Linha C: {15; 18; 25; 32; 43; 50; 61}
Não existe um valor que se repita mais de uma vez. Temos uma amostra sem moda, ou seja, amodal.
66
ESTATÍSTICA
Tabela 37
Quantidade de rolamentos Número de vezes em que

conumidos ocorreu o consumo
xi fi
Valor Frequência
8 18
10 25
12 32
13 45
15 28
16 21
17 12
21 8
A moda é o valor de maior frequência; portanto, para a linha D, teríamos Mo = 13

correspondentes a cada um. Os dados estão na tabela que segue:
Tabela 38
12% 13% 18% 9% 10% 11%

13% 15% 16% 14% 8% 17%
A partir desse dado, podemos dizer que o rendimento modal dessas aplicações é de:
A) 18%
B) 13%
C) 15%
D) 12%
E) 16%

ocorreram na linha de produção. Na tabela a seguir estão relacionadas as informações referentes aos
67
Unidade II
Tabela 39
Número de Número
defeitos de dias
diários
6 20
7 23
8 21
9 18
10 16
12 13
13 5
14 3
15 1
Nessas condições, o número modal de defeitos diários é de aproximadamente:
A) 7,0
B) 6,0
C) 9,0
D) 8,0
E) 8,7
Exemplo 2. Calcular a moda para a distribuição de rendas familiares apresentada na tabela

a seguir.
Quantidade
Classes Rendas familiares mensais em R$ de meses
número
Valor Frequência
li ls fi
1 R$ 650,00 |---- R$ 1.100,00 16
2 R$ 1.100,00 |---- R$ 1.550,00 21
3 R$ 1.550,00 |---- R$ 2.000,00 28
4 R$ 2.000,00 |---- R$ 2.450,00 31
5 R$ 2.450,00 |---- R$ 2.900,00 18
6 R$ 2.900,00 |---- R$ 3.350,00 16
7 R$ 3.350,00 |---- R$ 3.800,00 12
Total 142
68
ESTATÍSTICA
Você pode notar que os valores se repetem mais na classe 4 (a frequência é a maior de todas), logo
a moda deve ser um valor entre R$ 2.000,00 e R4 2.450,00. Mas exatamente qual é o valor da moda?
Normalmente esse cálculo pode ser feito por três recomendações diferentes: as formulas de Czuber,
King e Pearson, que utilizaremos a seguir.
Observação
Recomendação é diferente de equacionamento matemático. Decorre

de estudos, normalmente empíricos, que apresentam validade prática, mas
não exatidão matemática. São, portanto, aproximações.
Recomendação de Czuber
Para utilizarmos a recomendação de Czuber devemos inicialmente localizar a classe que tem maior
frequência, a chamada classe modal. No nosso exemplo essa classe é a de número 4, como já falamos.
Em seguida aplicamos a seguinte fórmula:
 (fMo − fant ) 
Mo = liMo +   ×h
 (fMo − fant ) + (fMo − fpost ) 
Onde:
Mo = Moda.
Limo = Limite inferior da classe modal.
fmo = Frequência da classe modal.
fant = Frequência da classe imediatamente anterior à classe modal.
fpost = Frequência da classe imediatamente posterior à classe modal.
h = Amplitude da classe modal.
No nosso exemplo, ficaria:
 (31 − 28) 
Mo = 2.000 +   × 450 => Mo = R$2.034, 61
 (31 − 28) + (31 − 18) 
69
Unidade II
Recomendação de King
Como no cálculo anterior, para utilizarmos a recomendação de King, devemos inicialmente localizar
a classe que tem maior frequência, a chamada classe modal. No nosso exemplo, essa classe é a de
número 4, como já falamos. Em seguida, aplicamos a seguinte fórmula:
 fpost 
Mo = liMo +   ×h
 fant + fpost 
Onde:
Mo = Moda.
limo = Limite inferior da classe modal.
fant = Frequência da classe imediatamente anterior à classe modal.
fpost = Frequência da classe imediatamente posterior à classe modal.
h = Amplitude da classe modal.
No nosso exemplo ficaria:
 18 
Mo = 2.000 +  × 450 => Mo = R$2.176, 09
 28 + 18 
Recomendação de Pearson
No caso de Pearson, a recomendação parte de conceito diferente do adotado nas anteriores. Baseia‑se
no uso da média e da mediana:
Mo = 3 × Me − 2 × X
Onde:
Mo = Moda.
Me = Mediana.
X = Média.
70
ESTATÍSTICA
No nosso exemplo teríamos:
Me = R$ 2.094,36
X = R$ 2.123,59
Logo, a moda seria:
Mo = 3 x 2.094,36 - 2 x 2.123,59 => Mo = R$ 2.035,90
Cada recomendação resultou em um valor diferente. Isso ocorre porque são recomendações que partem de
considerações diferentes. A experiência nos ensina qual é a melhor recomendação a utilizar em cada caso prático.
9. Uma pequena agência de publicidade relacionou na seguinte tabela o custo das suas 120 últimas
Tabela 40
Quantidade de
Custo das campanhas publicitárias
Classes campanhas publicitárias
(limites) (frequência simples)
A R$ 5.000 |‑‑‑‑ R$ 10.000 12
B R$ 10.000 |‑‑‑‑ R$ 15.000 15
C R$ 15.000 |‑‑‑‑ R$ 20.000 18
D R$ 20.000 |‑‑‑‑ R$ 25.000 23
E R$ 25.000 |‑‑‑‑ R$ 30.000 25
F R$ 30.000 |‑‑‑‑ R$ 35.000 14
G R$ 35.000 |‑‑‑‑ R$ 40.000 13
Nessas condições, podemos afirmar que o custo modal (pelo Método de King) das campanhas
publicitárias dessa agência é de aproximadamente:
A) R$ 27.500
B) R$ 30.000
C) R$ 28.370
D) R$ 25.000
E) R$ 26.892
71
Unidade II
O uso de cada uma dessas medidas depende da situação prática que se apresenta. Bruni (2007)
apresenta uma série de vantagens e desvantagens de cada uma delas, as quais podem ser resumidas no
quadro a seguir:
Quadro 2
Medida de posição Vantagens Desvantagens

É afetada por valores extremos da série, não
É de fácil compreensão, podendo ser representando com precisão a distribuição
calculada diretamente usando-se calculadoras em que esses valores ocorrem com frequencia
apropriadas. acentuada.
Depende de todos os valores da distribuição, É necessário conhecer todos os valores da
usando todos os dados disponíveis. distribuição.
Média Evidencia bastante estabilidade de amostra A média não tem, necessáriamente, existência
para amostra. real.
Possibilita a manipulação de dados, com Pode ser obtida uma média de número
cálculo de médias combinadas fracionario inexistente, por exemplo, 6,7 alunos.
Pode ser facilmente incluida em equações
matemáticas
Se for determinada a mediana dos grupos
Mesmo que alguns valores da série sejam separados, não será encontrada a mediana do
modificados, ela pode manter-se inalterada grupo.
Os valores extremos não interferem no seu
resultado, por isso é indicada quando existem
Mediana valores discrepantes.
Mesmo que os valores mais altos ou mais
baixos da série não estejam definidos, ela pode
ser determinada.
Pode ser utilizada para dados que têm a
possibilidade de ser ordenados.
Caso algum valor da série seja modificado, não A moda tem de ter, necessariamente, um valor
real, já que ela é representada por algum valor
necessariamente a moda se alterará. da série.
Quando utilizadas para calcular distribuições de
Moda Os valores extremos não interferem no seu classe aberta, não pode ser determinada a moda
resultado. empregando-se algum procedimento aritmético
elementar.
Pode ser calculada em distribuições que
possuam classe indeterminada.
Fonte: Bruni (2007).
5.2 Medidas de dispersão
As medidas de dispersão completam a informação contida nas medidas de posição, revelando

o afastamento ou o desvio dos elementos do valor central. Quanto menor for a dispersão de uma
amostra, maior será a qualidade da informação contida na medida de posição, ou, em outras palavras,
menor a margem de erro que será assumida, considerando a medida de posição como representante
de toda a amostra.
72
ESTATÍSTICA
Essas medidas, também chamadas de medidas de variabilidade, caracterizam a homogeneidade ou

heterogeneidade da amostra. Quanto menor o valor, mais homogênea a amostra será.
Existem basicamente dois grandes grupos de medidas de dispersão:
• medidas de dispersão absolutas: levam em conta a dispersão propriamente dita;
• medidas de dispersão relativas: levam em conta, simultaneamente, uma medida de posição

e a medida de dispersão correspondente. São úteis para efetuarmos comparações entre
amostras.
O objetivo deste tópico é tomarmos contato com ambos os grupos.
5.2.1 Medidas de dispersão absolutas
5.2.1.1 Amplitude total
A amplitude total (AT) já é nossa conhecida e é a mais elementar das medidas de dispersão. É
extremamente fácil de ser calculada, mas de difícil interpretação, em especial quando os dados extremos
são muito grandes ou muito pequenos. Portanto, é mais utilizada quando as distribuições apresentam
certa homogeneidade. Por exemplo, suponha que tenhamos as valorizações mensais das ações de duas
diferentes empresas, A e B, com os seguintes valores (dados em porcentagem):
Empresa A = {21,5; 18,0; 26,3; 32,4; 45,1; 18,6; 37,6}
Empresa B = {15,3; 19,7; 23,9; 16,7; 25,9; 14,6; 18,9; 25,8}
As amplitudes seriam, respectivamente, de 45,1 – 18,0 = 27,1% para as ações da empresa A e de

25,9 – 14,6 = 11,3% para a empresa B. Em outras palavras, as variações máximas seriam de 27,1% para
as ações da empresa A e de 11,3% para a empresa B. Logo, o risco de oscilação é maior para a empresa
A do que para a empresa B.
5.2.1.2 Desvio médio
Definido como a média aritmética do módulo dos desvios dos elementos em relação à média destes.
Lembrete
Módulo ou valor absoluto de um número é a distância deste número

para zero, independentemente do sinal, ou seja, módulo de um número
será o próprio número, se ele for positivo, ou seu simétrico (positivo), se
for negativo.
73
Unidade II
Saiba mais
Os conceitos básicos sobre módulo ou valor absoluto podem ser revistos

no seguinte artigo:
MIRANDA, D. Definição de módulo de um número real. Mundo Educação,

Goiânia, [s.d.]. Disponível em: <http://www.mundoeducacao.com/matematica/
definicao‑modulo‑um‑numero‑real.htm>. Acesso em: 6 dez. 2013.
Entende‑se por desvio a diferença entre o valor de um elemento da amostra e a média dessa mesma amostra:
di = xi − X
Portanto, o desvio médio será dado pela fórmula:
Σni =1| di |
dm =
N
O exemplo a seguir deixará mais claro esse processo.
Exemplo 1. Calcular o desvio médio da amostra {18; 21; 22; 27; 28; 29; 32; 37}.
O primeiro passo será calcular a média aritmética desses valores e, em seguida, os desvios de cada um
dos valores. Depois, somaremos o módulo desses valores dividindo‑os pelo número total de elementos
da amostra. A tabela a seguir mostra passo a passo esses cálculos:
Tabela 41
Ordem dos Valores Desvios Módulo dos desvios
elementos xi di = xi - X | di = xi - X |
1 18 18 - 27 = -9 9
2 21 21 - 27 = -6 6
3 22 22 - 27 = -5 5
4 27 27 - 27 = 0 0
5 28 28 - 27 = 1 1
6 29 29 - 27 = 2 2
7 33 33 - 27 = 6 6
8 38 38 - 27 = 11 11
Soma 216 0 40
Média ( X ) 216/8=27 Desvio médio (dm) 40/8 = 5
Observe que a soma dos desvios é zero. O próprio conceito de média (valor equidistante de todos os
elementos da amostra) nos conduz a isso. O conceito de desvio médio só tem sentido quando utilizamos
74
ESTATÍSTICA
o módulo dos desvios. Para ficar mais claro, veja a seguir os cálculos feitos, utilizando‑se das fórmulas
informadas:
Cálculo da média:
Σx i 216
X= ⇒X= ⇒ X = 27
N 8
Cálculo do desvio médio:
n
∑ | di | => dm = 40 => dm = 5
dm = i=1
N 8
Quando trabalhamos com dados agrupados em classes ou não, utilizamos exatamente o mesmo
processo de cálculo, evidentemente, com alterações nas fórmulas de cálculo, introduzindo o conceito
de frequência simples, como mostramos a seguir:
n
∑ | di | ×fi
dm = i=1 n
∑ i=1fi
Observar que, para dados agrupados em classes, o cálculo dos desvios é dado por:
di = pmi − X
Os exemplos a seguir demonstram esses cálculos.
Exemplo 2. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao número de

acidentes diários numa estrada federal.
Tabela 42 – Distribuição de acidentes por dia – Estrada X
Número de Módulo dos

Dias pesquisados Valor x Módulo dos
acidentes diários Desvios desvios x
frequência desvios
Valor Frequência Frequência
xi fi xi.fi di = xi - X | di = xi - X | | di | x fi
0 12 0 -3,6 3,6 43,5
1 15 15 -2,6 2,6 39,4
2 28 56 -1,6 1,6 45,6
4 23 92 0,4 0,4 8,6
5 19 95 1,4 1,4 26,1
6 8 48 2,4 2,4 19,0
8 6 48 4,4 4,4 26,2
75
Unidade II
10 4 40 6,4 6,4 25,5

11 2 22 7,4 7,4 14,7
12 1 12 8,4 8,4 8,4
Somas 118 428 257,0
Média 3,6 Desvio médio 2,2
n
∑ | di | ×fi => dm = 257 => dm = 2, 2
dm = i=1 n
∑ i=1fi 118
Exemplo 3. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao tempo de mão
de obra gasto com a manutenção dos aviões de uma empresa aérea.
Tabela 43 – Distribuição de horas de manutenção – Aero X

Pontos Módulo dos
Manutenções Valor x Módulo dos
médios Desvios desvios x
Limites de classes pesquisadas frequência desvios
de classe frequência
Classes
Valor Frequência
li ls pmi fi pmi.fi di = xi - X | di = xi - X | | d i | x fi
1 0 |--- 3 1,5 26 39 -4,1 4,1 106,0
2 3 |--- 6 4,5 20 90 -1,1 1,1 21,5
3 6 |--- 9 7,5 16 120 1,9 1,9 30,8
4 9 |--- 12 10,5 10 105 4,9 4,9 49,2
5 12 |--| 15 13,5 6 81 7,9 7,9 47,5
Somas 78 435 255,1
Média 5,6 Desvio médio 3,3
n
∑ | di | ×fi => dm = 255,1 => dm = 3, 3
dm = i=1 n
∑ i=1fi 78
5.2.1.3 Variância
A definição de desvio médio leva em consideração os desvios dos elementos tomados à primeira
potência. Matematicamente, demonstra‑se que os efeitos de desvio são mais bem‑representados
quando tomados ao quadrado.
Observação
Dois motivos justificam os desvios ao quadrado: a soma dos quadrados

dos desvios tomados ao quadrado é mínima; e, elevando ao quadrado,
resolvemos o problema de alguns desvios serem positivos e outros negativos,
gerando soma algébrica zero.
76
ESTATÍSTICA
Essa consideração nos leva à definição das duas mais importantes medidas de variabilidade absolutas:
a variância e o desvio‑padrão, que veremos em seguida.
A variância é o somatório dos desvios tomados ao quadrado, ou seja, é basicamente a mesma

definição do desvio médio, alterando‑se apenas a potência dos desvios:
n
2
S =
∑ d2
i=1 i
N −1
Observação
O denominador N – 1 justifica‑se pelos chamados graus de liberdade,

que podem ser entendidos com o número de espaços entre os dados. No
decorrer do curso, utilizaremos a fórmula apresentada para amostras e a
mesma fórmula com denominador igual a N para populações.
No caso em que estivermos trabalhando com dados agrupados, a fórmula, naturalmente, deverá
incluir o conceito de frequência simples, ou seja:
n
S2
=
∑ d2 × fi
i=1 i
n
∑ i=1fi − 1
Os Exemplos de 1 a 3 no próximo subtópico mostram o cálculo da variância nos vários casos possíveis.
5.2.1.4 Desvio‑padrão
O cálculo ou a análise da variância tem um grande inconveniente prático: apresenta unidades ao

quadrado em relação à medida de tendência central. Por exemplo, suponha que queiramos descrever
uma amostra de salários de uma empresa. Poderíamos afirmar que o salário médio da empresa é de
1.340 reais, e a variância, de 11.025 reais ao quadrado.
Observe a estranheza que causa a unidade: “reais ao quadrado”. Sem falar do número extravagante
que resultou dos cálculos. Para contornar esse problema, define‑se a mais utilizada das medidas de
variabilidade: o desvio‑padrão.
Conceitualmente, o desvio‑padrão é a raiz quadrada da variância e é simbolizado pela letra S

(maiúscula). Dessa forma, é calculado pelas fórmulas:
n
S=
∑ i=1di2
N −1
77
Unidade II
para dados isolados e
n
S=
∑ i=1di2 × fi
n
∑ i=1fi − 1
para dados agrupados em classes ou não.
Nos Exemplos de 1 a 3 a seguir, são calculados os valores do desvio‑padrão e da variância, de

maneira semelhante ao que foi feito anteriormente para o desvio médio. Observe que o cálculo obedece
aos seguintes passos, em ambos os casos:
• calcular a média da distribuição;
• calcular os desvios de cada elemento;
• calcular o quadrado dos desvios;
• somar o quadrado dos desvios (usando o conceito de frequência, caso sejam dados agrupados);
• dividir a soma obtida pelo número de elementos menos 1, obtendo‑se a variância;
• extrair a raiz quadrada, obtendo‑se o desvio‑padrão.
Exemplo 1. Calcular a média e o desvio‑padrão da amostra {18; 21; 22; 27; 28; 29; 32; 37}.
Tabela 44
Ordem dos Valores Desvios Desvios ao

elementos xi di = xi - X quadrado di2
1 18 18 - 27 = -9 81
2 21 21 - 27 = -6 36
3 22 22 - 27 = -5 25
4 27 27 - 27 = 0 0
5 28 28 - 27 = 1 1
6 29 29 - 27 = 2 4
7 33 33 - 27 = 6 36
8 38 38 - 27 = 11 121
Soma 216 0 304
Variância 304/7 = 43,4
Média 216/8=27
Desvio-padrão 6,6
78
ESTATÍSTICA
Cálculo da média:
Σx i 216
X= ⇒X= ⇒ X = 27
N 8
Cálculo da variância:
n
2
S =
∑ d2
i=1 i
=> S2 =
304
=> S2 = 43, 4
N −1 8 −1
Cálculo do desvio‑padrão:
n
S=
∑ i=1di2 => S = 304
=> S = 43, 4 => S = 6, 6
N −1 8 −1
Mo = 26.892
10. As últimas dez ligações telefônicas para um call center duraram, em minutos, os seguintes
valores:
Tabela 45
15 12 16 18 14
11 17 16 12 13
Para esses dados, podemos dizer que o valor aproximado do desvio‑padrão é:
A) 3,0
B) 3,2
C) 1,6
D) 2,4
E) 2,2
79
Unidade II
Exemplo 2. Calcular a variância e o desvio‑padrão da amostra de distribuição a seguir, relativa ao

número de acidentes diários numa estrada federal.
Tabela 46 – Distribuição de acidentes por dia – Estrada X
Número de Valor Quadrado

Dias pesquisados Quadrado
acidentes diários x Desvios dos desvios x
dos desvios
Valor Frequência Frequência Frequência
xi fi xi.fi di = xi - X di2 di2 x fi
0 12 0 -3,6 13,2 157,9
1 15 15 -2,6 6,9 103,5
2 28 56 -1,6 2,6 74,1
4 23 92 0,4 0,1 3,2
5 19 95 1,4 1,9 35,8
6 8 48 2,4 5,6 45,0
8 6 48 4,4 19,1 114,7
10 4 40 6,4 40,6 162,5
11 2 22 7,4 54,4 108,7
12 1 12 8,4 70,1 70,1
Somas 118 428 875,6
Média 3,6 Variância 7,5
Desvio médio 2,7
n
S2
=
∑ d2 × fi
i=1 i
=> S2 =
875, 6
=> S2 = 7, 5
n 118 − 1
∑ i=1fi − 1
n
S=
∑ i=1di2 × fi => S = 875, 6
=> S = 7, 5 => S = 2, 7
n 118 − 1
∑ i=1fi − 1
11. A CIPA de uma empresa relacionou o número de acidentes ocorridos nos últimos seis anos,
montando a seguinte tabela:
80
ESTATÍSTICA
Tabela 47
Número de acidentes por mês Número de meses

0 38
1 12
2 9
3 7
4 4
5 2
O desvio‑padrão dos acidentes nessa empresa é de:
A) 0,4
B) 0,5
C) 0,6
D) 0,7
E) 0,8
Exemplo 3. Calcular o desvio‑padrão da amostra de distribuição a seguir, relativa ao tempo de mão

de obra gasto com a manutenção dos aviões de uma empresa aérea.
Tabela 48 – Distribuição das horas de manutenção – Aero X
Pontos Quadrado
Manutenções Quadrado
Limites de médios de Valor x dos
pesquisadas Desvios dos
classes classe Frequência desvios x
Classes desvios
Valor Frequência Frequência
li ls pmi fi pmi.fi di = xi - X di2 di2 x fi
1 0 |--- 3 1,5 26 39 -4,1 16,6 432,2
2 3 |--- 6 4,5 20 90 -1,1 1,2 23,2
3 6 |--- 9 7,5 16 120 1,9 3,7 59,2
4 9 |--- 12 10,5 10 105 4,9 24,2 242,4
5 12 |--| 15 13,5 6 81 7,9 62,8 376,7
Somas 78 435 1133,5
Média 5,6 Variância 14,7
Desvio-padrão 3,8
81
Unidade II
n
S2
=
∑ d2 × fi
i=1 i
=> S2 1133, 5
= => S2 = 14, 7
n 78 − 1
∑ i=1fi − 1
n
S=
∑ i=1di2 × fi => S = 1133, 5
=> S = 14, 7 => S = 3, 8
n 78 − 1
∑ i=1fi − 1
O desvio‑padrão é a mais utilizada medida de dispersão, e, quando relacionada com a média, informa
a quantidade de elementos da amostra ou da população que se situam em torno da média.
O mais comum, na Estatística, é que essa relação entre média e desvio‑padrão seja feita pela chamada
distribuição normal, à qual nós voltaremos na disciplina Estatística Aplicada. Nessa relação, válida na
maior parte dos casos práticos, há os seguintes intervalos:
• entre a média mais uma vez o desvio‑padrão e a média menos uma vez o desvio‑padrão, estão
contidos 68% dos elementos da amostra ou da população;
• entre a média mais duas vezes o desvio‑padrão e a média menos duas vezes o desvio‑padrão,
estão contidos 85% dos elementos da amostra ou da população;
• entre a média mais três vezes o desvio‑padrão e a média menos três vezes o desvio‑padrão, estão
contidos 99,74% dos elementos da amostra ou da população;
• entre a média mais quatro vezes o desvio‑padrão e a média menos quatro vezes o desvio‑padrão,
estão contidos 100% dos elementos da amostra ou da população.
Exemplo 4. Um estudo estatístico com 4.850 alunos de Administração da Produção de uma

universidade mostrou que a nota final média deles foi de 5,3 com desvio‑padrão de 1,2. Quantos alunos
tiveram médias finais entre 4,1 e 6,5?
Observe que as notas: 4,1 e 6,5 correspondem exatamente à média menos um desvio‑padrão
(5,3 – 1,2 = 4,1) e à média mais um desvio‑padrão (5,3 + 1,2 = 6,5). Portanto, 68% dos alunos estão
contidos nesse intervalo, ou seja: 68% de 4.850 são 3.298 alunos.
Como 60% de 4.850 é 3.298, podemos afirmar que essa é a quantidade de alunos que tiveram notas
entre 4,1 e 6,5.
82
ESTATÍSTICA
12. Certa repartição pública anotou e relacionou os tempos de inspeção que faz nas empresas,
chegando à seguinte distribuição de frequências:
Tabela 49
Tempo de inspeção em Número de inspeções

minutos realizadas
10 ï‑‑‑‑ 20 3
20 ï‑‑‑‑ 30 6
30 ï‑‑‑‑ 40 15
40 ï‑‑‑‑ 50 36
50 ï‑‑‑‑ 60 19
O desvio‑padrão do tempo de inspeção nessa repartição é:

A) 10,2
B) 9,5
C) 12,3
D) 11,9
E) 8,3
5.2.2 Medidas de dispersão relativas
A maneira mais comum de se informar de maneira sintética (resumida) dados quantitativos é por meio
de uma medida de posição (média, mediana ou moda) em conjunto com uma medida de dispersão absoluta
(desvio médio, variância ou desvio‑padrão). O mais comum é o par de informações média – desvio‑padrão.
Frequentemente, no entanto, é interessante utilizar as chamadas medidas de dispersão relativas,

que analisam simultaneamente uma medida de posição e a mediada de dispersão correspondente. São
especialmente interessantes essas medidas quando fazemos comparações entre amostras diferentes.
A rigor, podemos obter essas medidas, costumeiramente chamadas de coeficientes de variação,

dividindo uma medida de dispersão por uma medida de posição; no entanto, as mais comuns são:
1. Coeficiente de variação de Pearson: divisão do desvio‑padrão pela média:
S S
Cvp = ou Cvp = × 100
X X
83
Unidade II
2. Coeficiente de variação de Thorndike: divisão do desvio‑padrão pela mediana:
S S
Cvp = ou Cvp = × 100
Me Me
O Exemplo 1 a seguir mostra uma aplicação dos coeficientes de variação, num caso de ordem prática.
Exemplo 1. Um especialista estudou, estatisticamente, dois tipos de investimentos, chegando às

conclusões da tabela que segue. Qual é o investimento que apresenta menor risco?
Aplicações
Estatísticas Observações
X Y
O especialista teria chegado a essas
conclusões através de um estudo
Retorno esperado 12% 20% estatístico no qual pesquisou e resumiu
os retornos ocorridos no passado,
conforme vimos no item 3.1.1
Analogamente o especialista teria
Desvio-padrão 9% 10% calculado o desvio-padrão conforme
vimos no item 3.2.1.4
Observe que se o especialista comparasse as aplicações somente com base em seus desvios padrões, ele
preferiria a aplicação X, uma vez que essa aplicação tem um desvio‑padrão menor que Y (9% versus 10%).
Essa comparação seria baseada no fato de que, sendo mais homogênea a aplicação A, “daria menos sustos”.
No entanto, se ele calculasse e comparasse os coeficientes de variação, chegaria a conclusões diferentes:
Aplicações
Estatísticas
X Y
Retorno esperado 12% 20%
Desvio-padrão 9% 10%
Coeficiente de Variação 75% 50%
de Pearson
9
Cvpa = × 100 => Cvpa = 75%
12
10
Cvpb = × 100 => Cvpa = 50%
20
A comparação dos coeficientes de variação das aplicações mostra que o especialista estaria cometendo
um erro sério se escolhesse a aplicação X em vez da aplicação Y, já que a dispersão relativa, ou risco, das
aplicações, conforme refletida no coeficiente de variação, é menor para o ativo Y do que para o X (50%
versus 75%). Evidentemente, o uso do coeficiente de variação para comparar o risco da aplicação é melhor
porque este também considera o tamanho relativo, ou retorno esperado, das aplicações.
84
ESTATÍSTICA
13. A tabela a seguir relaciona médias e desvios‑padrões de três diferentes amostras de investimentos
feitos por um aplicador financeiro:
Tabela 50
Investimento Rendimento médio Desvio‑padrão

A 18,0% 6,0%
B 14,5% 4,9%
C 9,3% 5,0%
Acerca dessas informações, não podemos dizer que:
A) A maior rentabilidade média é a do investimento C.
B) O investimento que apresenta maior homogeneidade é o investimento B.
C) O melhor compromisso entre posição e variabilidade é o do investimento C.
D) O maior coeficiente de variação é o do investimento A e vale 33,3%.
E) O coeficiente de variação do investimento C é o menor e vale 25,9%.
14. Foram comparados os dados referentes a acidentes de trabalho em dois grupos de ramos
diferentes de indústria. Nas 35 indústrias do ramo A foi notada uma taxa média de 2,62 acidentes por
mil homens/hora de trabalho, com desvio‑padrão de 0,72. Nas 35 empresas das indústrias do ramo B
foi notada taxa média de 3,10 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,80.
Com base nesses dados, informou‑se:
I – Em termos absolutos, as empresas do ramo A apresentaram menor variação na taxa de acidentes

porque o desvio‑padrão delas é menor.
II – Em termos relativos, as empresas do ramo A também apresentam menor variação na taxa de

acidentes, porque têm maior coeficiente de variação.
III – As empresas do ramo B apresentam menor variação relativa, pois têm menor coeficiente de
variação.
Em relação a essas afirmativas, podemos garantir que:
A) Todas estão corretas.
B) Estão corretas as afirmativas I e II.

85
Unidade II
C) Estão corretas as afirmativas I e III.
D) Estão corretas as afirmativas II e III.
E) Todas estão erradas.
6 RELAÇÕES GRÁFICAS ENTRE AS MEDIDAS ESTATÍSTICAS
Nos estudos e análises estatísticos, é interessante e importante visualizar as informações contidas

nos dados por meio do uso dos diversos gráficos, assunto que tratamos na unidade I.
Quando utilizamos os histogramas, é facilmente perceptível que as frequências dos valores mais
centrais tendem a ser maiores que as dos valores extremos. Esse comportamento nos permitirá tirar
conclusões importantes no tópico da Estatística Indutiva, porque, via de regra, ocorre de modo repetitivo.
Observações do padrão de comportamento das distribuições mostram que grande parte delas tende
a apresentar‑se da maneira conhecida como distribuição normal.
A figura 22 mostra o comportamento estatístico de uma distribuição de frequências relativa aos pesos
de um grupo de pessoas qualquer. Observe que os pesos próximos da média têm maior frequência, e os
mais afastados, menor frequência. Observe também a curva que se forma pela distribuição das colunas.
40
35
30
Frequência simples
25
20
15
10
0
30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105
Peso em quilos
Figura 23 – Pesos corporais
No curso de Estatística Aplicada, retornaremos ao assunto, quando diremos, por exemplo, que é
pouco provável alguém ter peso acima de 100 kg ou abaixo de 35 kg, e utilizaremos essa curva para
determinar qual é essa probabilidade, se houver.
86
ESTATÍSTICA
Por ora, iremos nos preocupar com a variação de formatos desse tipo de curva, chamada de curva
normal, curva de Gauss ou, ainda, de curva do sino.
Em teoria, espera‑se que essa curva tenha o comportamento mostrado nas curvas desenhadas em
linha contínua nas Figuras 23 e 24. Na prática, porém, ocorrem deformações nessas curvas, demonstradas
nas curvas pontilhadas das mesmas figuras. Essas deformações são chamadas, respectivamente, de
assimetria (Figura 23) e curtose (Figura 24).
Simétrica
Assimétrica positiva Assimétrica negativa
Frequência simples
0
0 Média Variável
Figura 24 – Assimetria
Curva leptocúrtica
Frequência simples
Curva mesocúrtica
Curva platicúrtica
Média Variável
Figura 25 – Curtose
6.1 Assimetria
A assimetria mede o quanto a distribuição se afasta da média. Esse afastamento pode ocorrer para a
direita ou para a esquerda, gerando, respectivamente, as assimetrias positiva e negativa.
O grau de assimetria é dado, frequentemente, pelo chamado 1º coeficiente de Pearson:
As = X −Me
S
87
Unidade II
Onde:
As = Coeficiente de assimetria.
X = Média.
Me = Mediana.
S = Desvio‑padrão.
Esse coeficiente pode assumir diferentes valores. De acordo com o sinal desses valores, a assimetria
será numa direção, como se vê a seguir:
As = 0 – A distribuição é simétrica.
As > 0 – A distribuição é assimétrica positiva ou à direita.
As < 0 – A distribuição é assimétrica negativa ou à esquerda.
Por esse critério, costuma‑se classificar as distribuições da seguinte maneira:
Caso As ≤ ‑1: assimétrica negativa forte.
Caso ‑1 < As < 0: assimétrica negativa fraca.
Caso As = 0: simétrica.
Caso 0 < As < 1: assimétrica positiva fraca.
Caso As ≥ 1: assimétrica positiva forte.
6.2 Curtose
A curtose mede o quanto a distribuição se alonga ou se achata em relação à curva teórica. A

curva teórica é chamada de mesocúrtica; as mais alongadas, de leptocúrticas; e as mais achatadas, de
platicúrticas.
O grau de curtose é dado, frequentemente, pelo coeficiente:
∑di4 × fi
K=
∑fi − 3
S4
88
ESTATÍSTICA
Onde:
K = Coeficiente de curtose.
di = Desvios.
fi = Frequências simples.
S = Desvio‑padrão.
Assim como na assimetria, também na curtose os coeficientes podem assumir diferentes valores. De
acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir:
K = 0: a distribuição é mesocúrtica.
K > 0: a distribuição é leptocúrtica.
K < 0: a distribuição é platicúrtica.
Lembrete
Existem outras medidas de assimetria e curtose além das apresentadas

aqui, mas que não são objeto do nosso curso.
Vamos usar o exemplo a seguir para demonstrar o cálculo da assimetria e da curtose de uma
distribuição referente ao consumo de energia elétrica entre 1.245 famílias de determinada região.
Observando os resultados obtidos (expostos a seguir), notamos que a distribuição (e a curva dela
decorrente) é assimétrica negativa fraca, ou seja, ligeiramente deslocada para a nossa direita, e que
é platicúrtica, ou seja, achatada. A curva teria a aparência aproximada da figura que segue (a curva
pontilhada é a do exercício; a cheia é a padrão):
Frequência simples
Média Variável
Figura 26 – Assimetria e curtose
89
Unidade II
Tabela 51
Consumo Desvio
Pontos
mensal por número Frequência Pontos Desvios ao Desvios à Desvios à quarta
Classes médios
de famílias acumulada médios x Desvios ao quadrado quarta potência x
número de
crescente Frequências quadrado x potência Frequências
classe
Frequências
Valor Frequência
li | ---- ls fi pmi fac pmi x fi di = xi - X di2 di2 x fi di4 di4 x fi

1 0 | ---- 50 158 25 158 3.950 -192 36.944 5.837.189 1.364.876.602 215.650.503.107
2 50 | ---- 100 100 75 258 7.500 -142 20.223 2.022.335 408.984.000 40.898.400.046
3 100 | ---- 150 112 125 370 14.000 -92 8.502 952.277 72.291.984 8.096.702.259
4 150 | ---- 200 164 175 534 28.700 -42 1.782 292.180 3.174.048 520.543.855
5 200 | ---- 250 175 225 709 39.375 8 61 10.623 3.685 644.833
6 250 | ---- 300 280 275 989 77.000 58 3.340 935.149 11.154.389 3.123.228.929
7 300 | ---- 350 84 325 1.073 27.300 108 11.619 975.991 134.999.655 11.339.970.993
8 350 | ---- 400 63 375 1.136 23.625 158 24.898 1.568.577 619.912.976 39.054.517.468
9 400 | ---- 450 56 425 1.192 23.800 208 43.177 2.417.921 1.864.267.846 104.398.999.377
|
10 450 500 53 475 1.245 25.175 258 66.456 3.522.183 4.416.437.760 234.071.201.262
---- |
Somatórios 1.245 270.425 18.534.426 657.154.712.129
• Cálculo da média:
=
∑xifi =>= 270.425 =>= 217, 2
∑fi 1.245
• Cálculo do desvio‑padrão:
n
S=
∑ i=1di2 × fi => S = 18.534.426
=> S = 14.899 => S = 122,1
n 1.245 − 1
∑ i=1fi − 1
• Cálculo da mediana:
— elemento mediano:
N +1 1.245 + 1
Eme = => Eme = => Eme = 623º
2 2
— mediana:
E − f   623 − 534 
Me = liMe +  me ac ant  × h = 200 +  × 50 => Me = 225, 4
 fMe   175 
90
ESTATÍSTICA
Cálculo da assimetria:
X − Me 217, 2 − 225, 4
As = => As = => As = −0, 067
S 122,1
Portanto, a curva é fracamente assimétrica negativa.
• Cálculo da curtose:
∑di4 × fi 657.154.712.129
K=
∑ i − 3 => K =
f 1245 − 3 => K = −0, 625
S4 (122,1)4
Portanto, a curva é platicúrtica.
15. Com relação à assimetria e à curtose das distribuições, foram feitas as seguintes afirmações:
I – Uma curva assimétrica positiva tem uma média superior à curva simétrica.
II – Curvas platicúrticas têm desvio‑padrão maior do que curvas leptocúrticas.
III – Curvas com coeficiente menor do que zero têm deslocamento para a esquerda em relação à
curva simétrica.
IV – Análise da curtose consiste em estudar o achatamento ou o alongamento da distribuição.
Em relação a essas afirmações, podemos dizer que:
A) Todas estão incorretas.
B) Existe uma alternativa incorreta.
C) Existem duas alternativas incorretas.
D) Existem três alternativas incorretas.
E) Todas estão corretas.
16. Duas distribuições foram estudadas e chegou‑se aos seguintes coeficientes mostrados a seguir:
91
Unidade II
Tabela 52
Coeficiente de Coeficiente de
Distribuição assimetria curtose
A ‑ 1,34 1,89
B 0,87 ‑1,34
A partir desses coeficientes, não podemos afirmar:
A) A distribuição A tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.
B) A distribuição B tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.
C) Ambas as distribuições não são simétricas nem mesocúrticas.
D) A curva A é mais alongada do que a curva B.
E) As duas curvas têm assimetrias opostas.
7 TEORIA ELEMENTAR DAS PROBABILIDADES
Em Estatística, quando nos referimos a uma previsão de comportamento de uma população a partir
do conhecimento de uma amostra, ou, ao contrário, à previsão do comportamento esperado de uma
amostra retirada de uma população conhecida, temos o cuidado de utilizar a palavra provavelmente
antes de cada informação.
Assim, por exemplo, quando após uma pesquisa eleitoral o veículo de comunicação informa que se a
eleição fosse naquele momento o candidato X teria 35% dos votos, ele quer dizer que provavelmente o
candidato X tivesse essa quantidade de votos. É uma afirmação provável de ocorrer, não quer dizer que
certamente ocorrerá. Uma tolerância nessa informação é esperada.
Neste tópico veremos o que significa e como são calculadas as probabilidades, ramo de estudo
da Matemática, e não exatamente da Estatística. Inicialmente iremos verificar casos absolutamente
teóricos e posteriormente evoluiremos para situações mais próximas da realidade.
Tentaremos utilizar o raciocínio lógico para resolver as questões e, no final do tópico, faremos uma
revisão teórica, apresentando os conceitos e as fórmulas utilizadas na Teoria Elementar das Probabilidades.
O importante é você dominar o mecanismo de cálculo da probabilidade.
7.1 Definições de probabilidades
Caso você procure a definição de probabilidade em um dicionário, o Houaiss (2009), por exemplo,
irá encontrar algo do tipo:
92
ESTATÍSTICA
“Probabilidade: característica do que é provável; perspectiva favorável de que algo venha a ocorrer;
possibilidade, chance.”
Como é fácil de notar, essa definição não acrescenta nada ao conceito intuitivo que temos de
probabilidade; isso porque esse conceito é circular, ou seja, define‑se probabilidade utilizando‑se seus
próprios termos.
Desenvolve‑se atualmente uma abordagem axiomática na definição de probabilidade, mantendo‑se

seu conceito indefinido, algo semelhante ao que acontece em Geometria com as definições de ponto e
reta.
Estatisticamente, no entanto, adotam‑se três abordagens diferentes na definição de probabilidades:

a abordagem clássica, a abordagem como frequência relativa e a abordagem subjetiva.
Antes de seguirmos, no entanto, na definição de probabilidade, é necessário definir alguns termos

que serão utilizados.
• Experimento: significará, para nós, observar ou executar determinado processo sob certas
circunstâncias controladas. Todas as nossas questões e problemas trabalhados em estatísticas são
experimentos que devem ser corretamente definidos. Podemos citar alguns exemplos para clarear
nosso entendimento. O comportamento das ações numa Bolsa de Valores; a produtividade de um
processo; a variação de estoques ao longo de determinado período; o controle de qualidade dos
produtos recebidos por um empresa; os resultados de um jogo, por exemplo, a Mega‑Sena, entre
outros, são exemplos de experimentos.
• Experimento aleatório: são aqueles que, apesar de serem repetidos exatamente da mesma
maneira, não apresentam resultados obrigatoriamente iguais. Por exemplo: você pode jogar um
dado exatamente da mesma maneira duas vezes, e nada garantirá que irá obter o mesmo resultado.
Rigorosamente, experimentos aleatórios são, exclusivamente, jogos de azar. Em Administração,
vamos trabalhar, normalmente, com experimentos aproximadamente aleatórios, os quais, apesar
de apresentarem determinado grau de aleatoriedade, não são exclusivamente aleatórios. Por
exemplo, o jogo de cartas conhecido como 21 é aleatório; já o “buraco” é aproximadamente
aleatório.
Saiba mais
A obra a seguir é um interessante estudo sobre o efeito do acaso

(aleatoriedade) nas nossas vidas. Vale a pena ler:
MLODINOW, L. O andar do bêbado: como o acaso determina nossas

vidas. Rio de Janeiro: Zahar, 2009.
93
Unidade II
• Espaço amostral (ou conjunto universo ou espaço das probabilidades): é o conjunto formado
por todos os resultados possíveis de um experimento aleatório. Por exemplo, o espaço amostral de
um jogo de um dado “honesto” é dado por:
S = {1, 2, 3, 4, 5, 6}. O dado deve ser “honesto”; se não for, o experimento não será aleatório.
• Evento: é um determinado subconjunto formado por um ou mais elementos do espaço amostral.

Por exemplo, num jogo de dados, o evento número primo é formado por:
E = {1, 2, 3, 5}
Observação
Por definição, um número positivo será primo se for maior do que 1 e for
divisível apenas por 1 e por ele mesmo. Por essa definição, o número 1 seria
primo, apesar de que, por conveniência, normalmente não é considerado
como tal. Neste material, será incluído entre os números primos.
7.2 Cálculos das probabilidades elementares
Usando esses conceitos, podemos determinar estatisticamente o termo probabilidade.
• Abordagem clássica: probabilidade é a razão (divisão) entre o número de elementos (ou

resultados) favoráveis a um determinado evento e o número total de elementos (ou resultados)
do espaço amostral, ou seja:
n( A )
P( A ) =
n(S)
Sendo:
P(A) a probabilidade de ocorrer o evento A.
n(A) o número de elementos favoráveis ao evento A.
n(S) o número total de elementos do espaço amostral.
Por exemplo:
Qual é a probabilidade de, ao jogarmos um dado “honesto”, obtermos um número primo?

Enúmeros primos : A = {1, 2, 3, 5} ∴n( A ) = 4 S = {12
, , 3, 4, 5, 6} ∴n( A ) = 6
94
ESTATÍSTICA
n( A ) 4
P( A ) = ⇒ P( A ) = = 0, 667 = 66, 7%
n(S) 6
• Abordagem como frequência relativa: probabilidade é a razão entre o número de vezes em que
determinado resultado ocorre, quando repetimos o experimento aleatório (ou aproximadamente
aleatório) por um número elevado de vezes. Por exemplo: jogamos uma moeda mil vezes, e em
512 dessas vezes saiu cara. Podemos dizer, por esta definição, que a probabilidade de sair cara
nessa moeda é de 512/1000, ou seja, 51,2%. Esse raciocínio seria simbolizado da seguinte forma:
fA 512
P( A ) = fRA = ⇒ P( A ) = fRA = = 0, 512 = 512
, %
fT 1000
Esse resultado não é o mesmo que o calculado pela definição anterior (50%). Isso pode decorrer do
fato de a moeda usada não ser “honesta” (portanto, com resultados aleatórios), ou do fato de o número
de jogadas não ter sido suficientemente grande. Aumentando o número de jogadas, a probabilidade
tenderá ao valor teórico de 50%, se a moeda for “honesta”.
• Abordagem subjetiva: ao contrário das definições anteriores, nesta, a probabilidade não é um

valor objetivo, mas algo que indica a “crença” do analista naquela ocorrência. Evidentemente essa
probabilidade não é fruto de um “palpite, um chute”, mas algo embasado em dados objetivos, mas
complementados por aspectos pessoais. É o caso, por exemplo, do meteorologista que prevê 80%
de chances de ocorrerem chuvas num determinado período. Esse tópico da Estatística é estudado
em Análise Bayesiana de Decisão.
Durante nosso curso iremos utilizar as duas primeiras abordagens, de acordo com o campo
de estudo em que estivermos. Deve‑se notar que a primeira abordagem é eminentemente teórica
e pressupõe experimentos aleatórios em que os elementos são equiprováveis. Já na segunda
abordagem podem ser introduzidos fatores diversos, característicos de determinadas situações não
totalmente aleatórias.
Apesar de basicamente o cálculo de probabilidades envolver uma das duas relações descritas, existem
axiomas, teoremas e propriedades que devem ser conhecidos para o correto uso da teoria. Antes de
nos preocuparmos com a teoria envolvida, porém, iremos nos ater à lógica que permeia o cálculo de
probabilidades. Para tanto, analisaremos as questões a seguir.
1. Uma moeda “honesta” é jogada uma única vez; qual é a probabilidade de que o resultado seja cara?
Pelo modo como o exercício é proposto, devemos calcular a probabilidade como uma razão entre o
número de elementos favoráveis ao evento cara e o número total de elementos possíveis.
Número de elementos do evento cara: n(A) = 1, porque A = {cara}
Número de elementos total: n(S) = 2, porque S = {cara; coroa}

95
Unidade II
n( A ) 1
P( A ) = ⇒ P(cara) =
n(S) 2
2. Duas moedas “honestas” são jogadas simultaneamente; qual é a probabilidade de que pelo menos
uma seja cara?
Neste caso, o espaço amostral tornou‑se ligeiramente mais complexo:
S = {CaraCara; CaraCoroa; CoroaCara; CoroaCoroa)
O evento pedido é:
E = {CaraCara; CaraCoroa; CoroaCara)
Logo, a probabilidade é:
n( A ) 3
P(pelo menos uma cara) = ⇒ P(pelo menos uma cara) = = 0, 75 = 75%
n(S) 4
Observação
Do ponto de vista do cálculo de probabilidade, jogar simultaneamente duas

moedas é o mesmo que jogar uma, anotar o resultado e depois jogar outra.
7.3 Árvores de decisões
O cálculo de probabilidades é, no fundo, um exercício de lógica, característica na qual, muitas vezes,

reside sua dificuldade. Para facilitar esse raciocínio lógico, costuma‑se usar a árvore de decisões, que,
por meio de uma sistemática de análise e síntese, conduz à compreensão do experimento. Trata‑se de
uma ferramenta relativamente trabalhosa, mas costuma ser importante no entendimento de problemas
mais complexos ou extensos. Por meio da continuação da sequência de exercícios, aprenderemos o
funcionamento dessa ferramenta.
3. Quatro moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham pelo
menos duas caras?
Ficou muito mais complexo estabelecer o espaço amostral e o evento solicitado. O princípio é o
mesmo dos exercícios anteriores, mas, como o número de moedas aumentou, as dificuldades envolvidas
também aumentaram.
Para facilitar nosso raciocínio, introduziremos a árvore de decisões e, na sequência, a análise

combinatória.
96
ESTATÍSTICA
A árvore de decisões consiste em representar graficamente todas as possibilidades de resultados

dos experimentos aleatórios, de modo que não percamos nenhum evento e, ao mesmo tempo,
compreendamos a mecânica do experimento.
Cara
Joga-se uma
moeda “honesta”.
Os resultados
podem ser:
Coroa
Figura 27
A seguir está desenhada a árvore de decisões do experimento “jogar quatro moedas ‘honestas’
simultaneamente”. Com certeza, não esquecemos nenhum dos resultados possíveis.
Resulta- 1ª moeda 2ª moeda 3ª moeda 4ª moeda

dos da: jogada jogada jogada jogada
Cara Caminho 1
Cara
Coroa Caminho 2
Cara
Cara Caminho 3
Coroa
Coroa Caminho 4
Cara
Cara Caminho 5
Cara
Coroa Caminho 6
Coroa
Joga-se Cara Caminho 7
uma Coroa
moeda Coroa Caminho 8
“honesta”
sucessiva- Cara Caminho 9
mente 4 Cara
vezes Coroa Caminho 10
Cara
Cara Caminho 11
Coroa
Coroa Caminho 12
Coroa
Cara Caminho 13
Cara
Coroa Caminho 14
Coroa
Cara Caminho 15
Coroa
Coroa Caminho 16
Figura 28
De posse da árvore de decisões, conseguimos responder mais facilmente ao solicitado na Questão

3. Depois de jogarmos a moeda pela quarta vez, teremos um total de 16 soluções (caminhos) possíveis.
97
Unidade II
Observe o caminho nº 1: na primeira vez em que jogamos a moeda, saiu cara; na segunda jogada,
saiu cara de novo, assim como na terceira e na quarta jogada, ou seja, o caminho nº 1 formado pelos
eventos sucessivos: cara – cara – cara – cara.
Da mesma forma, teremos outras 15 combinações possíveis, das quais as de números 1, 2, 3, 4, 5,

6, 7, 9, 10, 11 e 13 apresentam a resposta que desejamos, ou seja, pelo menos duas caras; as demais
apresentam uma ou nenhuma cara, portanto não nos interessam. Assim, temos uma total de 16
elementos no espaço amostral, e 11 deles são favoráveis à nossa pergunta, portanto a probabilidade de
que ocorra pelo menos uma cara é de 11 possibilidades em 16, ou seja:
n( A ) 11
P( A ) = ⇒ P(pelo menos uma cara) = = 0, 6875 = 68, 75%
n(S) 16
O número de possibilidades (ou seja, elementos) do espaço amostral cresce continuamente. Caso
jogássemos uma quinta vez a moeda, teríamos 32 resultados diferentes. Uma maneira de trabalharmos
com essa grande quantidade de números é o uso da análise combinatória.
Observação
Aqui trabalharemos superficialmente com esse assunto. Utilizaremos

apenas as ferramentas que nos são importantes neste tópico.
Saiba mais
Com a leitura dos textos a seguir, você poderá recordar e complementar

seus conhecimentos sobre análise combinatória:
MIRANDA, D. Análise combinatória. Brasil Escola, Goiânia, [s.d]. Disponível

em: <http://www.brasilescola.com/matematica/analise‑combinatoria.
htm>. Acesso em: 5 dez. 2013.
______. Análise combinatória. Mundo Educação, Goiânia, [s.d.].

Disponível em: <http://www.mundoeducacao.com/matematica/
analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
7.4 Análises combinatórias
O cálculo de probabilidade continuará a ser feito por meio da razão entre o número de elementos
favoráveis ao evento que estamos estudando e o número total de elementos do espaço amostral. A
análise combinatória nos servirá para calcular de maneira menos trabalhosa essas quantidades.
98
ESTATÍSTICA
Se você olhar a árvore de decisões do jogo de moedas, perceberá que o espaço amostral aumenta em
número de elementos da seguinte maneira:
Tabela 53
Número de jogadas da moeda Número de resultados diferentes

1 2
2 4
3 8
4 16
É fácil notar que a relação matemática existente entre o número de jogadas e o número de resultados
possíveis é de ab, onde a é o número de resultados possíveis de ocorrer numa única repetição do
experimento (no caso, a = 2, porque os resultados possíveis são cara ou coroa) e b é o número de
repetições do experimento (no caso da tabela anterior, temos n variando de 1 a 4). Desse modo, se
quisermos saber o número de elementos do espaço amostral de seis jogadas de uma moeda, bastaria
fazermos o cálculo 26 = 64 resultados diferentes.
Em análise combinatória, esse procedimento é conhecido como cálculo do número de arranjos com
repetição.
Arn,x = ab
Observação
A fórmula anterior é lida da seguinte forma: “número de arranjos com

repetições de a elementos repetidos b vezes”.
Em contrapartida, observando a árvore de decisões, podemos contar o número de caras que podem
aparecer na quarta jogada montando a tabela que segue.
Tabela 54
Número de Número de Quantidade

coroas que caras que “Caminhos” de caminhos
apareceu apareceu
4 0 16 1
3 1 8‑12‑14‑15 4
2 2 4‑6‑7‑10‑11‑13 6
1 3 2‑3‑5‑9 4
0 4 4 1
99
Unidade II
Segundo a análise combinatória, o número de caminhos é dado pelo número de combinações, obtido
por meio da fórmula:
n!
Cn,x =
x !(n − x )!
Onde:
n = número total de repetições do experimento; no caso, n = 4 (quatro vezes em que a moeda é

jogada).
x = números de resultados desejados; no caso, x varia de 0 a 4 (número de caras desejadas).
Observação
A fórmula anterior é lida da seguinte forma: “número de

combinações de n elementos tomados x a x vezes”. Utiliza o conceito
de fatorial (!).
Lembrete
Fatorial de um número a, simbolizado por a!, é a multiplicação de

todos os números inteiros e positivos desde a unidade até o valor a,
ou seja:
a! = 1 x 2 x 3 x 4 x..... x a
Por exemplo: 6! é igual a 720 porque:
6! = 1 x 2 x 3 x 4 x 5 x 6 = 720
Por definição, 0! é igual a 1.
A tabela a seguir mostra o cálculo das combinações do exemplo dado. Verifique que coincide com os
números obtidos por meio da árvore de decisões.
100
ESTATÍSTICA
Tabela 55
Número de caras que Números de

Fórmula do cálculo das combinações
queremos obter combinações obtidas
4! 4! 24
Zero cara C4 ,0 = = = =1 1
0! (4 − 0) 0! (4 )! 1 × 24
4! 4! 24
Uma cara C4 ,1 = = = =4 4
1! (4 − 1) 0! (1)! 1 × 6
4! 4! 24
Duas caras C4 ,2 = = = =6 6
2! (4 − 2) 2! (2)! 2 × 2
4! 4! 24
Três caras C4 ,3 = = = =4 4
3! (4 − 3) 3! (1)! 6 × 1
4! 4! 24
Quatro caras C4 ,4 = = = =4 1
4 ! (4 − 4 ) 4 ! (0)! 24 × 1
Temos agora todas as informações necessárias para o cálculo das probabilidades envolvidas no
experimento referente a “quatro jogadas sucessivas de uma moeda ‘honesta’”. A tabela a seguir resume
esses valores.
Tabela 56
Número total de resultados Número total de resultados

do espaço amostral favoráveis ao evento
Eventos (número de “caminhos”) Probabilidade de ocorrência
Calculado usando-se
Calculado usando-se combinações
arranjos com repetições
1
Obter zero cara 16 1 = 0, 0625 = 6, 25%
16
4
Obter uma cara 16 4 = 0, 2500 = 25, 00%
16
6
Obter duas caras 16 6 = 0, 3750 = 37, 50%
16
4
Obter três caras 16 4 = 0, 2500 = 25, 00%
16
1
Obter quatro caras 16 1 = 0, 0625 = 6, 25%
16
Somatório 100%
101
Unidade II
Essa tabela resume todos os possíveis resultados do experimento de “jogar quatro vezes uma moeda
‘honesta’”. Cada um desses resultados é um evento diferente, e a probabilidade de cada um destes
ocorrer é obtida pela divisão do número de vezes em que ocorre pelo número total de resultados do
experimento.
O evento pedido na questão, “pelo menos duas caras”, é a soma dos eventos, encontrados no quadro
anterior, “obter duas ou três ou quatro caras”, ou seja:
0,3750 + 0,2500 + 0,0625 = 0,6875 = 68,75
Como já havíamos determinado anteriormente.
Com esses conceitos podemos calcular o exemplo a seguir, mais trabalhoso:
4. Vinte moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham

exatamente oito caras?
Essa questão é muito semelhante à anterior, mas envolve uma quantidade de moedas e resultados
que inviabiliza o uso da árvore de decisões. Sabemos, porém, calcular questões desse tipo usando os
conceitos de análise combinatória:
• O número total de resultados possíveis é o número de arranjos com repetições de vinte moedas
que podem apresentar dois resultados diferentes.
Arn,x = ab = 220 = 1.048.576
• O número total de resultados que nos interessam é o número de combinações de vinte moedas
das quais oito sejam caras.
n! 20! 20! 2.432.902.008..176.640.000

Cn,x = ⇒ C20,8 = = = = 125.970
x !(n − x )! 8!(20 − 8)! 8!× 12! 40.320 × 479.001.600
• A probabilidade de ocorrer oito caras é de:
n( A ) 125.970
P( A ) = ⇒ P(exatamente 8 caras) = = 0,12001 = 12, 01%
n(S) 1.048.576
Observação
Os números envolvidos no exemplo anterior são relativamente grandes,

mas, com uma calculadora científica ou na planilha de Excel®, o trabalho é
102
ESTATÍSTICA
relativamente simples. Mesmo o cálculo do número de combinações poderá

ser facilitado se utilizarmos o conceito de simplificação, como mostrado a
seguir:
•
• 2 • • •
20 12 × 13× 14 × 15× 16 × 17× 18 × 19× 20
C20,8 = = = 125.970
8!× 12! 1 × 2 × 3 × 4 × 5 × 6 × 7 × 8 × 12!
Vamos utilizar esses conhecimentos adquiridos para fazer um cálculo que talvez não deixe você
satisfeito.
5. Qual é a probabilidade de se ganhar o prêmio máximo na Mega‑Sena fazendo‑se um jogo com

sete dezenas?
Observe que na Mega‑Sena é necessário acertar seis dezenas para se ganhar o prêmio máximo. Caso
se jogue sete dezenas, temos sete chances de acertar as seis dezenas:
n! 7! 7! 5040
Cn,x = ⇒ C7,6 = = = =7
x !(n − x )! 6!(7 − 6)! 6!× 1! 720 × 1
Mas quantos resultados diferentes podem ocorrer?
Na Mega‑Sena existem sessenta números possíveis, dos quais você deve acertar seis, ou seja:
n! 60! 60!
Cn,x = ⇒ C60,6 = = = 50.063.860
x !(n − x )! 6!(60 − 6)! 6!× 54 !
Resumindo, você tem 7 chances em 50.063.860 de acertar na Mega‑Sena, o que dá uma probabilidade
de:
n( A ) 7
P( A ) = ⇒ P(ganhar na mega sena) = = 0,00000014 = 0,000014 %
n(S) 50.063.860
Melhor continuar estudando, não é?
7.5 Experimentos aproximadamente aleatórios
Até aqui, sempre que nos referimos às moedas, frisamos que eram honestas. Por que isso? Porque
uma moeda “honesta” é absolutamente aleatória, ou seja, por mais que a joguemos, nunca iremos saber
qual o próximo resultado que irá ocorrer, e também porque a probabilidade de cair cara numa moeda
“honesta” é de 50% assim como de sair coroa.
103
Unidade II
Nem sempre será assim. Poderemos ter moedas “viciadas”, e, em situações mais próximas da realidade
do dia a dia, com certeza os experimentos não serão absolutamente aleatórios, mas aproximadamente
aleatórios, e as probabilidades de ocorrência serão dadas pelas frequências relativas observadas.
Imagine que você tenha nas mãos uma moeda, que não sabe se é “honesta” ou “viciada”. Como
poderia saber? Testando‑a, ou seja, jogando‑a repetidas vezes e anotando os resultados.
Caso os resultados tendam para 50% de sair cara e 50% de sair coroa, a moeda é “honesta”; caso
contrário, é “viciada”. Obviamente, quanto maior o número de vezes que a testar, maior a segurança que
terá nessa resposta.
O quadro a seguir mostra uma sucessão teórica de testes em duas moedas:
Tabela 57
Número Moeda A Moeda B

de vezes
em que a Nº de Probabilidade Nº de Probabilidade Nº de Probabilidade Nº de Probabilidade
moeda foi caras de cara coroas de coroa caras de cara coroas de coroa
lançada
10 6 60,0% 4 40,0% 5 50,0% 5 50,0%

30 14 46,7% 16 53,3% 16 53,3% 14 46,7%
40 19 47,5% 21 52,5% 23 57,5% 17 42,5%
50 27 54,0% 23 46,0% 29 58,0% 21 42,0%
100 52 52,0% 48 48,0% 57 57,0% 43 43,0%
500 249 49,8% 251 50,2% 290 58,0% 210 42,0%
1000 505 50,5% 495 49,5% 589 58,9% 411 41,1%
10000 5010 50,1% 4990 49,9% 5809 58,1% 4191 41,9%
Algumas características importantes:
• Para poucos lançamentos, não é possível assumir se as moedas são “honestas” ou “viciadas”. O
número de observações não é suficiente. Isso é constante na Estatística Indutiva. Precisamos de
uma quantidade de observações mínima para chegarmos a alguma conclusão.
• À medida que o número de observações vai crescendo, cristalizamos a ideia de que a moeda A
é “honesta”, e a moeda B, “viciada”. Perceba que, em dez jogadas, não há nada de estranho em
obtermos seis caras e quatro coroas, mas, quando jogamos a moeda cem vezes e obtemos 57
caras, algo não acidental está ocorrendo. Não é possível que seja uma questão de “sorte” ou “azar”.
• A partir dessas observações, podemos assumir que a moeda A é “honesta” e que a probabilidade de
obtermos cara é igual à de obtermos coroa, no valor de 50% (o fato de os cálculos não resultarem
exatamente em 50% é efeito de variações aceitáveis).
104
ESTATÍSTICA
• Já a moeda B é “viciada”: a probabilidade de obtermos cara é de 58% (aproximadamente), e a de

obtermos coroa é de 42%.
A partir desses conceitos, podemos expandir um pouco mais os nossos cálculos, resolvendo a questão
do próximo tópico.
7.6 Eventos soma e Eventos produto
6. Jogamos a moeda B, mencionada anteriormente, três vezes em sequência. Qual é a probabilidade

de obtermos pelo menos duas caras?
Vamos entender a questão por meio do uso da árvore de decisões. É a mesma árvore usada
anteriormente, com uma diferença: sobre cada decisão (simbolizada pelas flechas) colocaremos a
probabilidade correspondente:
Cada “caminho” será formado por várias decisões em sequência, cada uma delas com probabilidades
diferentes. A probabilidade de ocorrência de um caminho em especial é dada pela multiplicação das
probabilidades individuais. A isso chamamos evento produto.
Observe, na figura a seguir, o cálculo dos vários caminhos:
Resulta- 1ª moeda 2ª moeda 3ª moeda

dos da: jogada jogada jogada
Probabilidades de cada caminho:
0,58 Cara Caminho 1 0.58 x 0.58 x 0.58 = 0.583 = 0.1951
Cara
0,58 0.42 Coroa Caminho 2 0.58 x 0.58 x 0.42 = 0.582 x 0.42 = 0.1413
Cara
0,58 0.42 0,58 Cara Caminho 3 0.58 x 0.42 x 0.58 = 0.582 x 0.42 = 0.1413
Coroa
Joga-se
uma 0.42 Coroa Caminho 4 0.58 x 0.42 x 0.42 = 0.58 x 0.422 = 0.1023
moeda
“viciada”
sucessiva-
mente 4 0,58 Cara Caminho 5 0.42 x 0.58 x 0,58 = 0.582 x 0.42 = 0.1413
vezes
Cara
0.42 0,58
0.42 Coroa Caminho 6 0.42 x 0,58 x 0.42 = 0.58 x 0.422 = 0.1023
Coroa
0,58 Cara Caminho 7 0.42 x 0.42 x 0,58 = 0.58 x 0.422 = 0.1023

0.42
Coroa
0.42 Coroa Caminho 8 0.42 x 0.42 x 0,42 = 0.423 = 0,0741
Somatório = 1 ou 100%
Figura 29
105
Unidade II
Pelo menos duas caras significa duas ou três caras, logo os caminhos 1, 2, 3, e 5 nos interessam; os
demais ou têm apenas uma cara, ou nenhuma.
Qualquer um desses quatro caminhos que vierem a ocorrer responderá à nossa pergunta, ou seja, a
probabilidade de ocorrer pelo menos duas caras é a soma das probabilidades de ocorrer o caminho nº 1,
ou então o nº 2, ou então o nº 3, ou, ainda, o nº 5. Poderíamos escrever isso assim:
P(pelo menos uma cara) = P(ca-ca-ca) + P(ca-ca-co) + P(ca-co-ca) + P(co-ca-ca)
Logo, o resultado seria:
P(pelo menos uma cara) = 0,1951 + 0,1413 + 0,1413 + 0,1413 = 0, 6190 = 61, 90%
Essa soma de eventos gera o que chamamos de evento soma.
Cada vez que jogamos a moeda, ocorre um resultado diferente. A cada um desses resultados damos o
nome de evento. Vários eventos podem ser combinados, criando os eventos soma e os eventos produto,
já mostrados anteriormente.
O evento soma representa uma alternativa entre vários eventos simples, caracterizando‑se pela
palavra ou. Por exemplo, a questão “Qual é a probabilidade de um aluno passar em Estatística?” é
respondida por um evento soma: o aluno pode passar sem exame ou com exame. A probabilidade será
a soma das probabilidades dos dois eventos simples.
O evento produto representa uma obrigação entre várias situações e caracteriza‑se pela palavra
e. Por exemplo, “Qual é a probabilidade de um aluno cursar Administração e passar em Estatística?”.
O aluno tem de cursar Administração e passar em Estatística. A probabilidade será o produto entre a
probabilidade de um aluno estudar Administração e a probabilidade de passar de Estatística.
Vamos firmar esse conceito por meio do seguinte exemplo:
7. Dois caçadores, Pedro e João, atiram contra uma caça simultaneamente. Sabemos que Pedro
tem uma probabilidade de acertar esse tipo de caça de 40%, enquanto João acerta em 55% das vezes.
Calcular a probabilidade de:
a) A caça ser atingida.
b) Ambos atingirem simultaneamente a caça.
Antes de resolvermos a questão, vamos sublinhar como foram obtidas essas probabilidades.
Presumimos que Pedro e João já foram caçar diversas vezes esse tipo de caça e, a cada tiro que deram,
anotaram o resultado. Após algum tempo, eles têm uma série de observações suficientemente grande
para calcular as probabilidades relacionadas.
106
ESTATÍSTICA
Pedro atirou um número x de vezes e acertou quatro a cada dez tiros que deu; assim, ele pode
afirmar que tem 40% de chances de acertar um tiro qualquer nessas mesmas condições. João, em
raciocínio semelhante, chegou à probabilidade de 55%.
Se Pedro tem 40% de chances de acertar, tem 60% de chances de errar, assim como João tem 55%
de probabilidade de acertar e 45% de errar. Chegamos a essa conclusão porque acertar e errar são
eventos complementares, ou seja, um completa o outro sem a existência de um terceiro, e a soma dos
dois resulta em 100%.
Com essas probabilidades individuais, podemos montar a árvore de decisões apropriada:
Cálculo das Probabilidades
Acerta o 0,40 x 0,55 = 0,22 ou 22%

0,45 tiro
Acerta o João
tiro atira
0,40 0,55
Erra o 0,40 x 0,45 = 0,18 ou 18%
tiro
Pedro
atira
Acerta o 0,60 x 0,55 = 0,33 ou 33%
0,45 tiro
0,60
Erra o João
tiro atira
0,55
Erra o 0,60 x 0,45 = 0,27 ou 27%
tiro
Figura 30
Podemos então responder às questões.
A caça será atingida se Pedro ou João ou os dois a atingirem. Existe alternativa, portanto é um
evento soma:
P(caça ser atingida) =

= P (Pedro acertar e João acertar) + P(Pedro acertar e João errar) + P(Pedro errar e João acertar)
P(caça ser atingida) = 0,22 + 0,18 + 0,33 = 0,73 = 73%
Portanto, a resposta ao item a) é: a probabilidade de a caça ser atingida é de 73%.

107
Unidade II
Já para ambos atingirem a caça, é necessário que Pedro e João a atinjam, ou seja, é um evento produto:
P(ambos atingirem a caça) = P(Pedro acertar) x P(João acertar)
P(ambos atingirem a caça) = 0,40 x 0,55 = 0,22 = 22%
Portanto, a resposta ao item b) é: a probabilidade de ambos acertarem a caça é de 22%.
7.7 Eventos independentes e eventos vinculados
Na questão anterior, os tiros de Pedro não interferem nos tiros de João e vice‑versa, ou seja, o fato de
Pedro acertar ou errar não torna mais ou menos provável os acertos ou erros de João. É o que se chama
de eventos independentes.
Nem sempre, entretanto, isso ocorre. Eventualmente, a ocorrência de um evento altera a probabilidade
de ocorrência do evento seguinte. São os eventos vinculados, ou condicionados, ou dependentes.
A próxima questão exemplifica esse conceito:
8. Temos uma caixa que contém um total de 45 bolinhas, sendo 20 verdes, 15 brancas e 10 pretas.
Retiramos dessa caixa uma bolinha, anotamos sua cor, colocamos de lado e, em seguida, retiramos da
caixa uma segunda bolinha.
a) Qual é a probabilidade de as duas bolinhas retiradas formarem a combinação verde e branca?
b) Qual é a probabilidade de as duas bolinhas retiradas formarem a combinação preta e branca?
Uma combinação verde e branca corresponde a retirar uma primeira bolinha verde e uma segunda
bolinha branca, ou uma primeira bolinha branca e uma segunda bolinha verde. Raciocínio semelhante é
utilizado para a combinação preta e branca.
Novamente vamos utilizar a árvore de decisões para entender e esquematizar o problema, seguindo
o raciocínio anteriormente estabelecido:
108
ESTATÍSTICA
Cálculo das Probabilidades

Bolinha 20 19 380
19 verde
× = = 0,1919 1
45 44 1980
44
Depois de Caixa contendo: 15
Bolinha retirada a 19 bolinhas verdes; 44 Bolinha 20 15 300
verde 1ª bolinha 15 brancas e branca × = = 0,1515 2
45 44 1980
a caixa irá 10 pretas
ficar com:
Bolinha 20 10 200
20 preta
× = = 0,1010 3
45 44 1980
45
Bolinha 15 20 300
20 × = = 0,1515 4
verde 45 44 1980
15 44
Caixa contendo: Caixa contendo: 14
Depois de
20 bolinhas verdes; 45 Bolinha retirada a 20 bolinhas verdes; 44 Bolinha 15 14 210
15 brancas e branca 14 brancas e branca
× = = 0,1061 5
1ª bolinha 45 44 1980
10 pretas a caixa irá 10 pretas
ficar com: 10
Total de 45 Total de 44 Bolinha 15 10 150
bolinhas
44 × = = 0, 0757 6
bolinhas preta 45 44 1980
10
10 20 200
45 Bolinha × = = 0,1010 7
20 verde 45 44 1980
Caixa contendo: 44
15
Depois de 10 15 150
Bolinha 20 bolinhas verdes; 44 Bolinha × = = 0, 0757
preta
retirada a
15 brancas e 45 44 1980
8
1ª bolinha branca
a caixa irá 9 pretas
ficar com: 9 10 9 90
Total de 44 Bolinha × = = 0, 0455 9
44
bolinhas preta 45 44 1980
Figura 31
Observe que, dos nove caminhos existentes (eventos produtos), dois correspondem a uma combinação
verde e branca: os caminhos 2 e 4. Portanto, um ou outro atendem ao solicitado (portanto, evento
soma). Dessa forma:
P(combinação verde e branca) = P(1ª verde / 2ª branca) + P(1ª bolinha branca / 2ª verde)
P(combinação verde e branca) = 0,1515 = 0,1515 = 0,3030 = 30,30%
A probabilidade de obtermos uma combinação verde e branca é de 30,30%.
Raciocínio semelhante é feito para a combinação preta e branca (siga os caminhos 6 e 8):
P(combinação verde e branca) = P(1ª branca / 2ª preta) + P(1ª bolinha preta/ 2ª branca)
P(combinação preta e branca) = 0,0757 + 0,0757 = 0,1514 = 15,14%
17. Uma caixa contém 20 canetas iguais, das quais 7 são defeituosas, e outra caixa contém 12, das
quais 4 são defeituosas. Uma caneta é retirada aleatoriamente de cada caixa. As probabilidades de que
ambas não sejam defeituosas e de que uma seja perfeita e a outra não são, respectivamente, de:
A) 88,33% e 45,00%
B) 43,33% e 45,00%
109
Unidade II
C) 43,33% e 55,00%
D) 23,33% e 45,00%
E) 23,33% e 55,00%
18. Certo tipo de motor pode apresentar dois tipos de falhas: mancais presos e queima do induzido.
Sabendo‑se que as probabilidades de ocorrência dos defeitos são de 0,2 e 0,03, respectivamente,
determine a probabilidade de que, num motor daquele tipo, selecionado ao acaso, não ocorram,
simultaneamente, as duas falhas.
A) 6%
B) 19,4%
C) 99,4%
D) 21,8%
E) 77,6%
8 REVISÃO TEÓRICA DOS CONCEITOS ESTUDADOS
• Experimento: processo pelo qual ocorre uma determinada sucessão de acontecimentos. Por
exemplo: realizar uma reação química; investir em ações; jogar dados.
• Experimento matemático ou determinístico: é aquele em que os resultados podem ser previstos

de modo exato utilizando‑se a ciência. Por exemplo: realizar uma reação química.
• Experimento aleatório: é aquele cujos resultados não são sempre os mesmos, apesar de se
repetirem várias vezes em condições semelhantes. Por exemplo: jogar dados.
• Experimentos aproximadamente aleatórios: são aqueles que, apesar de terem uma tendência de
ocorrência, não podem ter seus resultados definidos de modo exato pela ciência. Por exemplo:
investir em ações.
• Espaço amostral ou conjunto universo: conjunto formado por todos os resultados possíveis de
um experimento. Por exemplo: o conjunto formado pelos números 1; 2; 3; 4; 5 e 6, resultados
possíveis de um jogo de dados.
• Evento: é qualquer subconjunto de um espaço amostral. Por exemplo, os números 2; 4 e 6, evento

“números pares” de um jogo de dados.
110
ESTATÍSTICA
• Evento simples: é aquele formado por um único elemento do espaço amostral. Por exemplo, o
número 5 num jogo de dados.
• Evento composto: é aquele formado por mais de um elemento do espaço amostral. Por exemplo,
os números 1; 3 e 5, evento “números ímpares” de um jogo de dados.
• Evento complementar: de um evento A qualquer, é o evento B (chamado complementar de A), tal

que todos os elementos do espaço amostral que não pertençam a A pertençam a B e vice‑versa.
Observar que S = A + B. Por exemplo, o conjunto A = {1, 3, 5} é complementar ao conjunto B =
{2, 4, 6}, num jogo de dados, visto que, ao serem somados, dão origem ao espaço amostral S =
{1, 2, 3, 4, 5, 6}. Não falta nem sobra elemento algum.
• Eventos mutuamente exclusivos: Suponha dois eventos A e B, no qual a ocorrência de A impede a

ocorrência de B e vice‑versa. Dizemos que eles são mutuamente exclusivos. Por exemplo: num jogo
de dados, a ocorrência de um número par (1, 2, 3) impede a ocorrência de um número ímpar (2, 4,
5), portanto tais eventos são mutuamente exclusivos. Não confunda eventos complementares com
eventos mutuamente exclusivos. Todos os eventos complementares são mutuamente exclusivos,
mas o contrário não é verdade.
• Eventos independentes: dizemos que dois ou mais eventos são independentes quando não
exercem ações recíprocas, comportando‑se cada um da maneira que lhe é própria, sem influenciar
os demais. Por exemplo: o lançamento de duas moedas, simultaneamente.
• Eventos vinculados ou condicionados: são eventos cujo aparecimento de um dependa do

aparecimento de outro (ou seja influenciado por este), no mesmo experimento. Por exemplo:
retirada de duas cartas de um baralho. Quando você retira a primeira carta, existem 52 cartas
no baralho, 26 vermelhas e 26 pretas. Quando você for retirar a segunda carta, o baralho
terá apenas 51 cartas, e poderão ser 25 vermelhas e 26 pretas ou 26 vermelhas e 25 pretas,
dependendo da cor da primeira carta. Portanto, o segundo evento está condicionado ou
vinculado ao primeiro.
• Evento soma: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de

um ou de outro nos interessa, temos o evento soma. Perceba a importância da palavra ou na
formulação do princípio e da ideia de alternativa. Por exemplo: jogo um dado e quero que saia
um número par ou um número primo. Os números pares são {2, 4, 6}, e os números primos são
{1, 2, 3, 5}. Como me interessam os números pares ou primos, fico satisfeito com a ocorrência de
qualquer um dos seguintes números {1, 2, 3, 4, 5}. Esse conjunto é a soma dos dois anteriores,
descontadas as intersecções (no caso, o número 2).
• Evento produto: quando relacionamos dois eventos de um mesmo experimento e a ocorrência de

um e simultaneamente a do outro nos interessa, temos o evento produto. Perceba a importância
da palavra e na formulação do princípio, e da ideia de obrigação. Por exemplo: jogo um dado e
quero que saia um número par e primo. Os números pares são {2, 4, 6}, e os números primos são
{1, 2, 3, 5}. Como me interessa que o número seja par e simultaneamente primo, fico satisfeito
111
Unidade II
somente com a ocorrência do número: {2}. Note que esse conjunto é a intersecção dos dois
anteriores, ou seja, valores que pertencem simultaneamente aos dois conjuntos.
• Definição de probabilidades matemática: é a razão (divisão) entre o número de elementos do

evento estudado pelo número de elementos do espaço amostral, ou seja:
n( A )
P( A ) =
n(S)
• Definição de probabilidades estatística: presumindo que um experimento seja repetido uma

quantidade considerável de vezes e seus resultados sejam anotados, definimos a probabilidade de
ocorrência de eventos daquele experimento como a frequência relativa deste:
fA
P( A ) = fRA =
fT
• Axiomas das probabilidades: são verdades a partir das quais se estabelecem os conceitos de
probabilidades:
— Dado um evento A, dentro de um espaço amostral S, temos:
0 ≤ P( A ) ≤ 1
— A probabilidade do espaço amostral, ou da soma de todos os eventos possíveis, é:
P(S) = 1
Para dois eventos mutuamente exclusivos, temos:
P( A ∪ B) = P( A ) + P(B)
Se o evento A é complementar de B, então:
P(A) + P(B) = 1 ou P(A) = 1 - P(B)
Lembrete
Houaiss (2009) define axioma como “premissa considerada

necessariamente evidente e verdadeira, fundamento de uma demonstração,
porém ela mesma indemonstrável, originada, segundo a tradição
racionalista, de princípios inatos da consciência ou, segundo os empiristas,
de generalizações da observação empírica”.
112
ESTATÍSTICA
Teorema da Soma: se A e B são dois eventos não mutuamente exclusivos, a probabilidade da

ocorrência de A ou B ou ambos é dada por:
P( A ∪ B) = P( A ) + P(B) − P( A ∩ B)
Exemplo: numa caixa existem oito bolinhas idênticas, numeradas de 1 a 8. Qual a probabilidade de,
ao retirarmos uma bolinha, ela ser múltiplo de 2 ou de 5?
Espaço amostral: S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} ‑> n(S) = 10
Evento A – múltiplos de 2: A = {2, 4, 6, 8, 10) ‑> n(A) = 5
Evento B – múltiplos de 5: B = {5, 10) ‑> n(B) = 2
Intersecção entre A e B: A∩B = {10} ‑> n(A∩B) = 1
n( A ) n(B) n( A ∪ B)
P( A ∪ B) = P( A ) + P(B) − P( A ∩ B) ⇒ P( A ∪ B) = + −
n(S) n(S) n(S)
5 2 1 6
P( A ∪ B) = + − = = 0, 60 = 60%
10 10 10 10
• Teorema do Produto para eventos independentes: caso tenhamos dois eventos, A e B, que não sejam
mutuamente exclusivos, a probabilidade de ocorrer um resultado que pertença simultaneamente
aos dois eventos é dada por:
P( A ∩ B) = P( A )xP(B)
Esse conceito pode ser estendido para mais de dois eventos.
Por exemplo: temos duas caixas com bolinhas nas seguintes quantidades:
— Caixa A: 10 bolinhas azuis, 15 bolinhas brancas e 30 bolinhas vermelhas. Total 55: bolinhas.
— Caixa B: 20 bolinhas azuis, 18 bolinhas brancas e 22 bolinhas vermelhas. Total: 60 bolinhas.
Retiramos uma bolinha de cada urna. Qual é a probabilidade de que ambas as bolinhas retiradas
sejam azuis?
— Caixa A: probabilidade de uma bolinha retirada ser azul:
113
Unidade II
10
P( Azul) =
55
— Caixa B: probabilidade de uma bolinha retirada ser azul:
20
P( Azul) =
60
Probabilidade de ambas serem azuis:
10 20 200
P( Azul ∩ Azul) = P(Urna A/bolinha Azul)xP(Urna B/bolinha Azul) = × =
55 60 3300
P( Azul ∩ Azul) = 0, 0606 = 6, 06%
• Teorema do Produto para eventos vinculados: a probabilidade de ocorrência simultânea de

dois eventos A e B vinculados é dada pelo produto da probabilidade de um dos eventos pela
probabilidade condicional do outro evento:
P( A ∩ B) = P( A )xP(B / A )
O símbolo P(B/A) é lido como: probabilidade de ocorrência do evento B tendo ocorrido o evento A.
É a chamada probabilidade condicional. Esse conceito pode ser estendido para mais de dois eventos.
O exemplo a seguir deixa essa situação mais evidente:
Retiramos sem reposição três caras de um baralho de 52 cartas. Qual a probabilidade de que as três
sejam vermelhas?
Probabilidade de a primeira carta ser vermelha:
26
P( vermelha) =
52
Probabilidade de a segunda carta ser vermelha:
25
P( vermelha) =
51
Probabilidade de a terceira carta ser vermelha:
114
ESTATÍSTICA
24
P( vermelha) =
50
Probabilidade de as três serem vermelhas:
P( Vrm ∩ Vrm ∩ Vrm) = P(1a carta Vrm)xP(2a carta Vrm / 1a carta Vrm))xP(3a carta Vrm / 2a carta Vrm)
26 25 24 26 × 25 × 24 15.626
P( Vrm ∩ Vrm ∩ Vrm) = × × = = = 0,1178 = 11, 78%
52 51 50 52 × 51 × 50 132.6000
19. Suponhamos que existam, num certo mercado, duas fábricas de lâmpadas. A fábrica A produz
500 lâmpadas, das quais 25% apresentam defeitos, e a fábrica B produz 550 lâmpadas, das quais 26%
são defeituosas; vamos supor também que as 1.050 lâmpadas sejam vendidas por um único vendedor.
Por fim, suponhamos que um cliente vá comprar uma lâmpada sem especificar marca e que estas
tenham sido dispostas ao acaso na prateleira. Calcular:
I – A probabilidade de ele receber uma lâmpada defeituosa.
II – A probabilidade de, tendo recebido uma lâmpada perfeita, ela ser da marca B.
A alternativa que apresenta as respostas corretas é a:
A) I = 47,62% e II = 26,00%
B) I = 26,00% e II = 52,05%
C) I = 25,52% e II = 26,00%
D) I = 25,50% e II = 50,00%
E) I = 25,52% e II = 52,05%
Resumo
Nesta unidade voltamos nossos olhares para o cálculo das chamadas

medidas estatísticas e, em seguida, para o estudo elementar das probabilidades.
Esses assuntos são importantes porque a partir do conhecimento de uma
amostra e da probabilidade de o comportamento dessa amostra reproduzir
uma população é que poderemos prever ou induzir acontecimentos.
115
Unidade II
Medidas ou parâmetros estatísticos são informações resumidas e

focadas de uma população e vão, em estudos posteriores, permitir a
extensão dessas informações para as populações.
Iniciamos estudando as medidas de posição, também chamadas de

medidas de tendência central, que, como o próprio nome indica, dão uma
ideia central da amostra. Vimos as médias, as medianas e as modas, as
mais importantes, porém não únicas, medidas de posição. Para cada uma
dessas medidas, verificamos como devem ser feitos os cálculos, seja quando
apresentados de maneira isolada, seja quando agrupados em classes.
Alguns termos muito importantes para a Estatística foram definidos, como
média aritmética, média ponderada etc. Além disso, foram consideradas
as diferenças entre média, mediana e moda, bem como enfatizado que,
apesar de muito importantes, as medidas de posição não são suficientes
para entendermos uma amostra.
Para o correto entendimento de uma amostra e, posteriormente, de

uma população, conceituamos as medidas de dispersão, também chamadas
de medidas de variabilidade. Essas medidas tentam mostrar como cada
um e todos os elementos de uma amostra se desviam da medida de
posição. São especialmente importantes, nesse campo, o desvio‑padrão e
a variância. Observamos também a maneira de se comparar duas ou mais
amostras utilizando os coeficientes de variação, em especial o de Pearson.
Por fim, nesta etapa, vimos o comportamento gráfico das distribuições de
frequência, assimetria e curtose, assunto que iremos recuperar no próximo
semestre.
Com medidas desses três grupos é possível entendermos como uma

amostra se comporta e, futuramente, em Estatística Aplicada, como a
população da qual essa amostra foi retirada se comporta. Essa relação entre
populações e amostras é possível porque uma amostra retirada de uma
população tem comportamentos provavelmente iguais.
Isso nos conduziu ao último item do nosso curso, a Teoria Elementar das
Probabilidades, na qual verificamos o que é probabilidade, como podemos
calcular uma probabilidade e os conceitos que envolvem o estudo das
probabilidades. Neste momento, conceituamos o que são experimentos e
eventos aleatórios; como se encadeiam esses eventos em eventos soma
e eventos produto e, também, em eventos vinculados e independentes, e
abrimos frente para o estudo das distribuições de probabilidades, a ser feito
na disciplina de Estatística Aplicada. Nessa linha de raciocínio, passamos os
olhos também sobre análise combinatória, que foi e será importante para
os cálculos mais complexos, ainda a serem feitos.
116
ESTATÍSTICA
Como resultado deste nosso curso, sabemos como coletar, organizar

e trabalhar dados estatísticos de uma amostra, permitindo entendê‑la e
obter conclusões, e, em contrapartida, compreender como probabilidades
são importantes para entender as relações entre populações e amostras. De
posse dessas informações, estamos preparados para adentrar a Estatística
Indutiva, nosso próximo campo de trabalho.
Exercícios
Questão 1 (SEFAZ 2011 – Adaptado). Com base no resultado do concurso para o cargo de
Especialista em Políticas Públicas e Gestão Governamental da Seplag, prova realizada pelo Ceperj em 1º
ago. 2010, as frequências para o número de acertos obtidos nas cinco questões de Estatística pelos 1.535
candidatos que realizaram a prova estão mostradas na tabela a seguir:
Tabela 58
Nenhum acerto → 393 candidatos

1 acerto → 627 candidatos
2 acertos → 417 candidatos
Total 1.535 candidatos
A figura que segue mostra a frequência relativa dos acertos.
Estatística – Prova para EPPGG
45,0%
40,8%
40,0%
35,0%
30,0% 27,2%
25,6%
25,0%
20,0%
15,0%
10,0%
5,3%
5,0%
0,8% 0,3%
0,0%
Figura 32
117
Unidade II
Com base na tabela e na figura, julgue as afirmativas a seguir:
I – A moda e a mediana da distribuição são iguais.
II – A amplitude interquartílica é igual a 2.
III – A média da distribuição é igual a 2.
IV – A probabilidade de um candidato, escolhido ao acaso entre os 1.535, ter acertado no máximo

duas questões é igual a 66,4%.
São corretas apenas as afirmativas:
A) I e II.
B) I e III.
C) I, III e IV.
D) II, III e IV.
E) II e IV.
Resposta correta: alternativa A.
Análise das afirmativas
I) Afirmativa correta.
Justificativa: a moda será igual a 1 (valor com maior frequência) e a mediana também será igual a 1
(neste valor, a frequência já alcançará 50% da distribuição).
II) Afirmativa correta.
Justificativa: o primeiro quartil será igual a 0 (neste valor, a frequência já alcançará 25% da
distribuição), e o terceiro quartil será igual a 2 (neste valor, a frequência já alcançará 75% da distribuição).
A amplitude interquartílica será: Q3 - Q1 = 2 - 0 = 2.
III) Afirmativa incorreta.
Justificativa: podemos usar a frequência relativa para calcular a média do número de acertos, igual
a: (0 × 0,256) + (1 × 0,408) + (2 × 0,272) + (3 × 0,053) + (4 × 0,008) + (5 × 0,003) = 0 + 0,408 + 0,544
+ 0,159 + 0,032 + 0,015 = 1,158.
118
ESTATÍSTICA
IV) Afirmativa incorreta.
Justificativa: a probabilidade de ter acertado, no máximo, duas questões (acertar 0, 1 ou 2 questões)

será de: 25,6% + 40,8% + 27,2% = 93,6%.
Questão 2. Fez-se uma pesquisa sobre o número de pacientes que frequentaram os estabelecimentos
de saúde públicos e particulares no Brasil. Os dados a seguir representam o sumário da pesquisa.
Tabela 59
Estabelecimentos
Espécie
Públicos (PU) Particulares (PA)
Hospital (H) 1.002 5.132
Pronto-socorro (PS) 150 156
Policlínicas (P) 1.531 6.136
Outros¹ (O) 14.393 472
¹ Inclui postos de saúde, centros de saúde e unidades mistas
Fonte: VIEIRA (2008, p.18).
Retira-se, ao acaso, um estabelecimento da população de 28.972 unidades. Sejam H, PS, P e O os

eventos que representam se o estabelecimento retirado é hospital, pronto-socorro, policlínicas ou outros,
respectivamente. Da mesma forma, PU e PA são eventos que representam o tipo de estabelecimento
(público ou particular). Assinale a alternativa incorreta.
A) A probabilidade de o paciente ter escolhido o estabelecimento público é de aproximadamente

0,5894, ou 58,94%.
B) A probabilidade de o paciente ter escolhido o hospital ou ser um estabelecimento particular é de

0,6223, ou 62,23%.
C) A probabilidade de o paciente ter escolhido o pronto-socorro e ser um estabelecimento público é

de 0,0052, ou 0,52%.
D) A probabilidade de o paciente ter escolhido o hospital ou policlínicas é de 0,4764, ou 47,64%.
E) A probabilidade de o paciente ter escolhido o hospital e ser um estabelecimento particular é de

0,1771, ou 17,71%.
Resolução desta questão na plataforma.
119
REFERÊNCIAS
ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatística aplicada à administração e economia. 2.

ed. São Paulo: Thomson Learning, 2007.
BRUNI, A. B. Estatística aplicada à gestão empresarial. São Paulo: Atlas, 2007.
BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 3. ed. São Paulo: Atual, 1986.
COSTA NETO, P. L. O. Estatística. São Paulo: Edgard Blücher, 1979.
COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974.
DOWNING, D.; CLARK, J. Estatística aplicada. São Paulo: Saraiva, 1998.
FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística aplicada. São Paulo: Atlas, 1995.
GITMAN, L. J. Princípios de administração financeira. São Paulo: Harbra, 2003.
GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991.
HOUAISS, A. Dicionário eletrônico Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2009. 1 CD‑ROM.
KAZMIER, L. J. Estatística aplicada a economia e administração. São Paulo: Makron Books, 1982.
KUNE, H. Métodos estatísticos para a melhoria da qualidade. São Paulo: Gente, 1993.
LAPPONI, J. A. Estatística usando Excel. 4. ed. Rio de Janeiro: Elsevier, 2005.
MEDEIROS, E. et al. Estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São
Paulo: Atlas, 1997. v. 1‑2.
______. Tabelas de estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São
Paulo: Atlas, 1999.
MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: Livros Técnicos e Científicos, 1976.
MILONE, G.; ANGELINI, F. Estatística aplicada. São Paulo: Atlas, 1995.
MIRANDA, D. Análise combinatória. Brasil Escola, Goiânia, [s.d]. Disponível em: <http://www.
brasilescola.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
______. Análise combinatória. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.
mundoeducacao.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
120
MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009.
MOORE, D. A estatística básica e sua prática. Rio de Janeiro: LTC, 2000.
MOORE, D. et al. A prática da estatística empresarial: como usar dados para tomar decisões. Rio de
Janeiro: LTC, 2006.
SALSBURG, D. Uma senhora toma chá: como a Estatística revolucionou a ciência no século XX. Rio de
Janeiro: Zahar, 2009.
SPIEGEL, M. R. Estatística. São Paulo: Makron Books, 1993.
STEVENSON, W. J. Estatística aplicada à administração. São Paulo: Habra, 1981.
TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005.
VIEIRA, S. Introdução à Bioestatística. 3. ed. Rio de Janeiro: Elsevier, 2008. p. 18.
WITTE, R. S.; WITTE, J. S. Estatística. 7. ed. Rio de Janeiro: LTC, 2005.
Sites
<http://super.abril.com.br/>.
<http://www.alea.pt>.
<www.ibge.gov.br>.
Exercícios
Unidade I – Questão 3: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2006: Administração.
Questão 7, p. 5. Disponível em: <http://download.inep.gov.br/download/enade/2006/Provas/PROVA_
DE_ADMINISTRACAO.pdf>. Acesso em: 9 dez. 2013.
Unidade I – Questão 11: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (Enade) 2006: Administração.
Questão 6, p. 5. Disponível em: <http://download.inep.gov.br/download/enade/2006/Provas/PROVA_
DE_ADMINISTRACAO.pdf>. Acesso em: 9 dez. 2013.
Unidade II – Questão 1: CEPERJ. Prova do Concurso Público de Fiscal da Fazenda. Rio de Janeiro, 2011.
Questão 42, p.7. Disponível em: <http://www.concurso.ceperj.rj.gov.br/concursos/sefazfazenda/prova.
pdf>. Acesso em: 23 dez. 2013.
121
ANEXO 1 – GABARITO
Unidade I
1. B.
2. B.
3. E.
4. C.
5. D.
6. D.
7. B.
8. B.
9. C.
10. C.
11. A.
Unidade II
1. A.
2. E.
3. A.
4. D.
5. D.
6. C.
7. B.
8. A.
122
9. E.
10. D.
11. C.
12. A.
13. D.
14. C.
15. B.
16. A.
17. B.
18. C.
19. E.
123
124
125
126
127
128
Informações:
www.sepi.unip.br ou 0800 010 9000

Unid 2 PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Unid 2 PDF

Загружено:

Авторское право:

Доступные форматы

Unidade II

O estudo que fizemos anteriormente diz respeito ao agrupamento de dados coletados e à

5.1 Medidas de posição

As medidas de posição ou medidas de tendência central, como o próprio nome indica,

De todas as medidas de posição, a média é, seguramente, a mais usada. É chamada de

x1, x2, etc. são os diversos valores;

N é a quantidade total de elementos da amostra.

Exemplo 1. Calcular a média aritmética dos valores relacionados a seguir:

S = {2; 5; 7; 9; 10; 12; 16; 18}

Observe que são oito elementos de diferentes valores, portanto:

1. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos

12% 13% 18% 9% 10% 11%

O exemplo a seguir mostra o cálculo para dados não agrupados em classe:

Exemplo 2. Calcular a média aritmética dos valores relacionados a seguir:

Valor Frequência simples

2. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos

Número de defeitos diários Número de dias

Nessas condições o número médio de defeitos diários é de aproximadamente:

Exemplo 3. Dada a tabela de frequências a seguir, calcular a média aritmética.

É importante observar as seguintes propriedades das médias aritméticas:

• se multiplicarmos ou dividirmos todas as informações por uma constante, a média aritmética

• somando‑se ou subtraindo‑se uma constante de todos os valores de um conjunto de informações,

Custo das campanhas publicitárias Quantidade de campanhas

Conceitualmente, definimos mediana como o valor, em um conjunto de valores ordenados, que

Exemplo 1. Dados os seguintes conjuntos de notas de alunos de Estatística, calcule a mediana:

Para calcular a mediana é necessário colocar os dados em ordem crescente:

{2,8; 3,9; 4,2; 5,0; 6,2; 6,4; 7,1; 8,7; 9,1}

O valor do quinto elemento é a mediana:

Grupo B = { 8,4; 6,3; 9,2; 4,9; 6,5; 8,0}

{4,9; 6,3; 6,5; 8,0; 8,4; 9,2}

4. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos

12% 13% 18% 9% 10% 11%

O exemplo 2 mostra o cálculo em duas situações diferentes:

Número de filhos Quantidade de familias

Número de filhos Quantidade de famílias

5. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos

Número de Número de dias

Nessas condições, o número médio de defeitos diários é de aproximadamente:

No nosso contexto, interpolar significa encontrar, dentro de uma faixa

Eme = Elemento mediano.

fme = Frequência da classe mediana.

h = Amplitude da classe mediana.

Classes Vendas mensais em R$ Quantidade de meses Frequência

O elemento mediano é dado por:

O conceito de moda é o mais simples entre as medidas estatísticas. Trata‑se do valor

Neste conjunto temos duas modas: Mo = 9 e Mo = 11. Chamamos de amostra multimodal.

Linha C: {15; 18; 25; 32; 43; 50; 61}

Quantidade de rolamentos Número de vezes em que

A moda é o valor de maior frequência; portanto, para a linha D, teríamos Mo = 13

7. Uma corretora de valores relacionou 12 investimentos feitos recentemente e os rendimentos

12% 13% 18% 9% 10% 11%

8. O departamento de produção de uma empresa de confecções anota diariamente quantos defeitos

Nessas condições, o número modal de defeitos diários é de aproximadamente:

Exemplo 2. Calcular a moda para a distribuição de rendas familiares apresentada na tabela

Recomendação é diferente de equacionamento matemático. Decorre

Limo = Limite inferior da classe modal.

fmo = Frequência da classe modal.

fant = Frequência da classe imediatamente anterior à classe modal.

fpost = Frequência da classe imediatamente posterior à classe modal.

h = Amplitude da classe modal.

No nosso exemplo, ficaria:

limo = Limite inferior da classe modal.

fant = Frequência da classe imediatamente anterior à classe modal.