Академический Документы
Профессиональный Документы
Культура Документы
Unidade II
5 MEDIDAS OU PARÂMETROS ESTATÍSTICOS
Existem basicamente dois grandes grupos de medidas estatísticas. O primeiro grupo é formado
pelas medidas de tendência central, também chamadas de medidas de posição, que informam a
magnitude da amostra estudada. Essas medidas nos dão uma visão global da amostra sem se aterem às
características individuais de seus elementos.
No entanto, como é necessário que tenhamos ideia das variações dos elementos da amostra em
torno de suas medidas centrais, iremos estudar, também, um segundo grupo de medidas estatísticas: as
medidas de dispersão, também chamadas de medidas de variabilidade.
5.1.1 Média
Existem vários métodos diferentes para calcularmos as médias. Iremos nos preocupar com a principal
delas, a média aritmética. As demais (geométrica, quadrática e harmônica), além de serem muito menos
utilizadas, seguem os mesmos princípios da média aritmética, apenas com a utilização de operações
matemáticas diferentes.
A média aritmética é o resultado da soma dos valores de todos os elementos dividido pelo
número total de elementos, ou seja, pela frequência total. Em outras palavras, se tivermos um
54
ESTATÍSTICA
conjunto de valores S = {x1, x2, x3,………xn}, a média aritmética desse conjunto será calculada por
meio das fórmulas:
x1 + x2 + x 3 + .... + xn
X=
N
Ou
Σx i
X=
N
Onde:
X é a média aritmética;
Σx i 2 + 5 + 7 + 9 + 10 + 12 + 16 + 18
X= ⇒X= ⇒ X = 9, 9
N 8
Exemplo de aplicação
Tabela 25
A partir desse dado, podemos dizer que o rendimento médio dessas aplicações é de:
A) 13%
B) 12%
55
Unidade II
C) 15%
D) 18%
E) 16%
Caso os valores sejam repetidos na amostra, ou seja, caso tenham uma frequência diferente
de 1 (x 1 com f 1; x 2 com f 2 e assim por diante), então a fórmula para o cálculo da média
aritmética é:
Σxifi
X=
Σfi
Este último conceito define a média ponderada; eventualmente, as frequências podem ser
substituídas por “pesos” que conferem importância diferenciada a cada valor.
Tabela 26
xi fi
25 37
42 28
57 54
62 62
39 12
Como no exemplo anterior, o cálculo da média aritmética consiste na soma de todos os valores
dividida pela quantidade total de elementos. Porém, cada um dos valores da tabela aparece certo
número de vezes, diferente de 1; por exemplo, o valor 25 aparece 37 vezes, portanto precisamos
somar 25 com ele mesmo 37 vezes; ou, de maneira mais direta, precisamos multiplicar 25 por
37. A coluna C mostra todos os cálculos desse tipo. Quando somamos essa coluna, obtemos o
valor 9.491, que corresponde à soma de todos os elementos da amostra (193 elementos). Assim,
a média é:
56
ESTATÍSTICA
Tabela 27
A B C=AxB
Valor Frequência simples Valor x Frequência
xi fi xi . fi
25 37 925
42 28 1176
57 54 3078
62 62 3844
39 12 468
ft 193 9491
Σxifi 9491
X= ⇒X= ⇒ X = 49, 2
Σfi 193
No caso de dados agrupados em classes, o processo de cálculo é idêntico ao anterior, com a diferença de
que o valor a ser usado é o ponto médio de classe (lembre‑se de que já definimos esse valor anteriormente):
xi = pmi
O exemplo a seguir mostra‑nos, passo a passo, o cálculo da média aritmética ponderada para dados
agrupados por classes:
Exemplo de aplicação
Tabela 28
57
Unidade II
A) 7,9
B) 10,0
C) 9,3
D) 8,0
E) 8,7
Tabela 29
A B C D E = (C + D)/2 F=DxE
Ponto Frequência
Limites de classe Frequência médio x ponto
Classe simples de classe médio
li ls fi pmi fi x pmi
1,0 3,0 |------- 414,0 14,0 208,5 2.919,0
2,0 414,0 |------- 825,0 19,0 619,5 11.770,5
3,0 825,0 |------- 1.236,0 41,0 1.030,5 42.250,5
4,0 1.236,0 |------- 1.647,0 53,0 1.441,5 76.399,5
5,0 1.647,0 |------- 2.058,0 32,0 1.852,5 59.280,0
6,0 2.058,0 |------- 2.469,0 27,0 2.263,5 61.114,5
7,0 2.469,0 |------- 2.880,0 20,0 2.674,5 53.490,0
8,0 2.880,0 |------- 3.291,0 11,0 3.085,5 33.940,5
9,0 3.291,0 |------| 3.702,0 8,0 3.496,5 27.972,0
∑= ft = 225,0 369.136,5
A tabela anterior apresenta os valores e cálculos necessários para determinarmos a média aritmética
para uma amostra que estivermos descrevendo.
As áreas sombreadas da tabela mostram os cálculos necessários para a obtenção da média aritmética.
O uso de uma tabela para esses cálculos facilita as operações, além de estas serem mais facilmente
trabalhadas em computador.
Nesse exemplo, somamos os valores de todos os elementos da amostra, ficando na seguinte situação:
o valor da soma dos 225 elementos da amostra é 369136,5, portanto a média aritmética será de:
58
ESTATÍSTICA
Σxifi 369136, 5
X= ⇒X= ⇒ X = 1640, 6
Σfi 225
• a soma algébrica dos afastamentos (ou desvios, ou resíduos) de um conjunto de números tomados
em relação à média é nula;
• a soma dos quadrados dos desvios tomados em relação à média aritmética é mínima (essa
propriedade é muito importante para a definição de desvio‑padrão, que veremos mais à frente)
Exemplo de aplicação
3. Uma pequena agência de publicidade relacionou, na tabela a seguir, o custo das suas 120 últimas
campanhas publicitárias:
Tabela 30
Nessas condições, podemos afirmar que o custo médio das campanhas publicitárias dessa agência é
de aproximadamente:
A) R$ 22.833,00
B) R$ 22.500,00
C) R$ 20.000,00
59
Unidade II
D) R$ 25.833,00
E) R$ 20.833,00
5.1.2 Mediana
• caso N seja um número ímpar, a mediana será o valor do elemento central (chamado de elemento
mediano);
• caso N seja um número par, a mediana será a média aritmética simples dos dois elementos
centrais (o elemento mediano passa a ser um elemento teórico intermediário). Veja no
exemplo a seguir:
Grupo A = {6,2; 4,2; 8,7; 6,4; 2,8; 9,1; 5,0; 3,9; 7,1}.
Como o número de elementos é ímpar (N = 9), a mediana será o valor do elemento central (o quinto
elemento), ou seja, o valor da mediana será 6,2.
Poderíamos dar uma roupagem mais matemática ao cálculo utilizando as fórmulas a seguir, onde:
Eme é o elemento mediano e Me a mediana:
N +1 9 +1
Eme = => Eme = => Eme = 5º
2 2
Me = 6,2
Ordenando:
N +1 6 +1
Eme = => Eme = => Eme = 3, 5o
2 2
Evidentemente, não existe um elemento 3,5º. A mediana será a média aritmética entre o valor do
terceiro e do quarto elemento:
x3 + x4 6, 5 + 8, 0
Me = => Me = => Me = 7, 25
2 2
Cálculo semelhante se fará quando trabalhamos com dados agrupados, seja em classes ou não.
Primeiro, veremos quando os dados não forem agrupados em classes. Nesse caso, o procedimento é
semelhante ao feito no Exemplo 1, com a diferença de que precisaremos calcular a frequência acumulada
crescente para permitir localizarmos o elemento mediano.
Exemplo de aplicação
Tabela 31
A partir desse dado, podemos dizer que o rendimento mediano dessas aplicações é de:
A) 18%
B) 12%
C) 15%
D) 13%
E) 16%
Exemplo 2. Calcular a mediana para os dados relacionados a seguir, relativos ao número de filhos
por família moradora em determinada cidade.
61
Unidade II
Tabela 32 – Cidade A
Perceba que o número de elementos (N = 63) é ímpar, logo o elemento mediano será o 32º:
63 + 1
Eme = => Eme = 32º
2
O 32º elemento tem o valor 18, isso porque, com os valores ordenados, os 15 primeiros referem‑se a famílias
com 0 filho; o 16º ao 33º valor referem‑se a famílias com 1 filho, e assim por diante. Logo a mediana será:
Me = 18
Portanto, podemos afirmar que 50% das famílias têm um filho ou menos, e 50% das famílias têm
um filho ou mais.
Tabela 33 – Cidade B
62
ESTATÍSTICA
Perceba que o número de elementos (N = 72) é par, logo o elemento mediano seria o 36,5º, que,
evidentemente, não existe.
72 + 1
Eme = => Eme = 36, 5o
2
O 36º elemento tem o valor 1, e o 37º, o valor o valor 2, portanto o 36,5º seria um valor médio entre
esses dois valores, ou seja, a mediana será:
1+ 2
Me = => Me = 1, 5
2
Portanto, podemos afirmar que 50% das famílias têm menos de 1,5 filho e 50% das famílias tem
mais de 1,5 filho.
Exemplo de aplicação
Tabela 34
A) 7,9
B) 10,0
C) 9,3
63
Unidade II
D) 8,0
E) 8,7
O cálculo da mediana, quando trabalhamos com dados agrupados em classes, é mais trabalhoso
porque conseguimos determinar o elemento mediano e a classe da qual o elemento faz parte, mas não
o valor exato da mediana. A maneira de contornarmos esse inconveniente é utilizando os conceitos de
interpolação.
Lembrete
No caso do cálculo da mediana, o processo de interpolação gera a seguinte fórmula, que sempre
iremos usar:
E − f
Me = liMe + me ac ant × h
fMe
Onde:
Me = Mediana.
lime = Limite inferior da classe que contém o elemento mediano (classe mediana).
fac ant = Frequência acumulada crescente até a classe anterior à classe mediana.
O Exemplo 3, a seguir, demonstra o cálculo da mediana para uma distribuição de vendas em reais
agrupadas por classe.
Exemplo 3. Calcular a mediana para a tabela a seguir, que apresenta a distribuição de vendas de
determinada empresa.
64
ESTATÍSTICA
Tabela 35
143 + 1
Eme = => Eme = 72º
2
O 72º elemento está na quarta classe, que chamamos de classe mediana, ou seja, a mediana é um
valor entre R$ 140.000,00 e R$ 170.000,00. Obteremos o resultado usando a fórmula da interpolação:
E − f 72 − 57
Me = liMe + me ac ant × h = 140.000 + × 30.0000 => Me = 157.307, 69
fMe 26
Portanto, podemos afirmar que 50% das vendas mensais dessa empresa estão acima de R$
157.307,69, e 50%, abaixo desse valor.
Exemplo de aplicação
6. Uma pequena agência de publicidade relacionou, na tabela seguinte, o custo das suas 120 últimas
campanhas publicitárias:
Tabela 36
Quantidade de campanhas
Classes Custo das campanhas publicitárias publicitárias (frequência simples)
A R$ 5.000 ï‑‑‑‑ R$ 10.000 12
B R$ 10.000 ï‑‑‑‑ R$ 15.000 15
C R$ 15.000 ï‑‑‑‑ R$ 20.000 18
D R$ 20.000 ï‑‑‑‑ R$ 25.000 23
E R$ 25.000 ï‑‑‑‑ R$ 30.000 25
F R$ 30.000 ï‑‑‑‑ R$ 35.000 14
G R$ 35.000 ï‑‑‑‑ R$ 40.000 13
65
Unidade II
Nessas condições podemos afirmar que o custo mediano das campanhas publicitárias dessa agência
é de aproximadamente:
A) R$ 22.370
B) R$ 22.500
C) R$ 23.370
D) R$ 25.833
E) R$ 20.833
5.1.3 Moda
O cálculo da moda para dados isolados ou para dados não agrupados em classes é imediato: decorre
de simples observação, como mostra o Exemplo 1; já para dados agrupados necessitamos adotar algumas
recomendações feitas por estatísticos renomados. No Exemplo 2, apresentamos um cálculo deste último
tipo de distribuição.
Exemplo 1. Calcular a moda para os conjuntos de dados mostrados a seguir, referentes ao consumo
de rolamentos (em unidades) em várias linhas de produção.
Linha A: {21; 22; 24; 24; 25; 25; 25; 27; 28}
A moda evidentemente é: Mo = 25
Linha B: {8; 8; 9; 9; 9; 9; 10; 11; 11; 11; 11; 12; 12; 12}
Não existe um valor que se repita mais de uma vez. Temos uma amostra sem moda, ou seja, amodal.
66
ESTATÍSTICA
Tabela 37
Exemplo de aplicação
Tabela 38
A partir desse dado, podemos dizer que o rendimento modal dessas aplicações é de:
A) 18%
B) 13%
C) 15%
D) 12%
E) 16%
67
Unidade II
Tabela 39
Número de Número
defeitos de dias
diários
6 20
7 23
8 21
9 18
10 16
12 13
13 5
14 3
15 1
A) 7,0
B) 6,0
C) 9,0
D) 8,0
E) 8,7
Quantidade
Classes Rendas familiares mensais em R$ de meses
número
Valor Frequência
li ls fi
1 R$ 650,00 |---- R$ 1.100,00 16
2 R$ 1.100,00 |---- R$ 1.550,00 21
3 R$ 1.550,00 |---- R$ 2.000,00 28
4 R$ 2.000,00 |---- R$ 2.450,00 31
5 R$ 2.450,00 |---- R$ 2.900,00 18
6 R$ 2.900,00 |---- R$ 3.350,00 16
7 R$ 3.350,00 |---- R$ 3.800,00 12
Total 142
68
ESTATÍSTICA
Você pode notar que os valores se repetem mais na classe 4 (a frequência é a maior de todas), logo
a moda deve ser um valor entre R$ 2.000,00 e R4 2.450,00. Mas exatamente qual é o valor da moda?
Normalmente esse cálculo pode ser feito por três recomendações diferentes: as formulas de Czuber,
King e Pearson, que utilizaremos a seguir.
Observação
Recomendação de Czuber
Para utilizarmos a recomendação de Czuber devemos inicialmente localizar a classe que tem maior
frequência, a chamada classe modal. No nosso exemplo essa classe é a de número 4, como já falamos.
Em seguida aplicamos a seguinte fórmula:
(fMo − fant )
Mo = liMo + ×h
(fMo − fant ) + (fMo − fpost )
Onde:
Mo = Moda.
(31 − 28)
Mo = 2.000 + × 450 => Mo = R$2.034, 61
(31 − 28) + (31 − 18)
69
Unidade II
Recomendação de King
Como no cálculo anterior, para utilizarmos a recomendação de King, devemos inicialmente localizar
a classe que tem maior frequência, a chamada classe modal. No nosso exemplo, essa classe é a de
número 4, como já falamos. Em seguida, aplicamos a seguinte fórmula:
fpost
Mo = liMo + ×h
fant + fpost
Onde:
Mo = Moda.
18
Mo = 2.000 + × 450 => Mo = R$2.176, 09
28 + 18
Recomendação de Pearson
No caso de Pearson, a recomendação parte de conceito diferente do adotado nas anteriores. Baseia‑se
no uso da média e da mediana:
Mo = 3 × Me − 2 × X
Onde:
Mo = Moda.
Me = Mediana.
X = Média.
70
ESTATÍSTICA
Me = R$ 2.094,36
X = R$ 2.123,59
Cada recomendação resultou em um valor diferente. Isso ocorre porque são recomendações que partem de
considerações diferentes. A experiência nos ensina qual é a melhor recomendação a utilizar em cada caso prático.
Exemplo de aplicação
9. Uma pequena agência de publicidade relacionou na seguinte tabela o custo das suas 120 últimas
campanhas publicitárias:
Tabela 40
Quantidade de
Custo das campanhas publicitárias
Classes campanhas publicitárias
(limites) (frequência simples)
A R$ 5.000 |‑‑‑‑ R$ 10.000 12
B R$ 10.000 |‑‑‑‑ R$ 15.000 15
C R$ 15.000 |‑‑‑‑ R$ 20.000 18
D R$ 20.000 |‑‑‑‑ R$ 25.000 23
E R$ 25.000 |‑‑‑‑ R$ 30.000 25
F R$ 30.000 |‑‑‑‑ R$ 35.000 14
G R$ 35.000 |‑‑‑‑ R$ 40.000 13
Nessas condições, podemos afirmar que o custo modal (pelo Método de King) das campanhas
publicitárias dessa agência é de aproximadamente:
A) R$ 27.500
B) R$ 30.000
C) R$ 28.370
D) R$ 25.000
E) R$ 26.892
71
Unidade II
O uso de cada uma dessas medidas depende da situação prática que se apresenta. Bruni (2007)
apresenta uma série de vantagens e desvantagens de cada uma delas, as quais podem ser resumidas no
quadro a seguir:
Quadro 2
Caso algum valor da série seja modificado, não A moda tem de ter, necessariamente, um valor
real, já que ela é representada por algum valor
necessariamente a moda se alterará. da série.
Quando utilizadas para calcular distribuições de
Moda Os valores extremos não interferem no seu classe aberta, não pode ser determinada a moda
resultado. empregando-se algum procedimento aritmético
elementar.
Pode ser calculada em distribuições que
possuam classe indeterminada.
72
ESTATÍSTICA
A amplitude total (AT) já é nossa conhecida e é a mais elementar das medidas de dispersão. É
extremamente fácil de ser calculada, mas de difícil interpretação, em especial quando os dados extremos
são muito grandes ou muito pequenos. Portanto, é mais utilizada quando as distribuições apresentam
certa homogeneidade. Por exemplo, suponha que tenhamos as valorizações mensais das ações de duas
diferentes empresas, A e B, com os seguintes valores (dados em porcentagem):
Definido como a média aritmética do módulo dos desvios dos elementos em relação à média destes.
Lembrete
73
Unidade II
Saiba mais
Entende‑se por desvio a diferença entre o valor de um elemento da amostra e a média dessa mesma amostra:
di = xi − X
Σni =1| di |
dm =
N
O exemplo a seguir deixará mais claro esse processo.
Exemplo 1. Calcular o desvio médio da amostra {18; 21; 22; 27; 28; 29; 32; 37}.
O primeiro passo será calcular a média aritmética desses valores e, em seguida, os desvios de cada um
dos valores. Depois, somaremos o módulo desses valores dividindo‑os pelo número total de elementos
da amostra. A tabela a seguir mostra passo a passo esses cálculos:
Tabela 41
Ordem dos Valores Desvios Módulo dos desvios
elementos xi di = xi - X | di = xi - X |
1 18 18 - 27 = -9 9
2 21 21 - 27 = -6 6
3 22 22 - 27 = -5 5
4 27 27 - 27 = 0 0
5 28 28 - 27 = 1 1
6 29 29 - 27 = 2 2
7 33 33 - 27 = 6 6
8 38 38 - 27 = 11 11
Soma 216 0 40
Média ( X ) 216/8=27 Desvio médio (dm) 40/8 = 5
Observe que a soma dos desvios é zero. O próprio conceito de média (valor equidistante de todos os
elementos da amostra) nos conduz a isso. O conceito de desvio médio só tem sentido quando utilizamos
74
ESTATÍSTICA
o módulo dos desvios. Para ficar mais claro, veja a seguir os cálculos feitos, utilizando‑se das fórmulas
informadas:
Cálculo da média:
Σx i 216
X= ⇒X= ⇒ X = 27
N 8
n
∑ | di | => dm = 40 => dm = 5
dm = i=1
N 8
Quando trabalhamos com dados agrupados em classes ou não, utilizamos exatamente o mesmo
processo de cálculo, evidentemente, com alterações nas fórmulas de cálculo, introduzindo o conceito
de frequência simples, como mostramos a seguir:
n
∑ | di | ×fi
dm = i=1 n
∑ i=1fi
Observar que, para dados agrupados em classes, o cálculo dos desvios é dado por:
di = pmi − X
75
Unidade II
n
∑ | di | ×fi => dm = 257 => dm = 2, 2
dm = i=1 n
∑ i=1fi 118
Exemplo 3. Calcular o desvio médio da amostra de distribuição a seguir, relativa ao tempo de mão
de obra gasto com a manutenção dos aviões de uma empresa aérea.
n
∑ | di | ×fi => dm = 255,1 => dm = 3, 3
dm = i=1 n
∑ i=1fi 78
5.2.1.3 Variância
A definição de desvio médio leva em consideração os desvios dos elementos tomados à primeira
potência. Matematicamente, demonstra‑se que os efeitos de desvio são mais bem‑representados
quando tomados ao quadrado.
Observação
Essa consideração nos leva à definição das duas mais importantes medidas de variabilidade absolutas:
a variância e o desvio‑padrão, que veremos em seguida.
n
2
S =
∑ d2
i=1 i
N −1
Observação
No caso em que estivermos trabalhando com dados agrupados, a fórmula, naturalmente, deverá
incluir o conceito de frequência simples, ou seja:
n
S2
=
∑ d2 × fi
i=1 i
n
∑ i=1fi − 1
Os Exemplos de 1 a 3 no próximo subtópico mostram o cálculo da variância nos vários casos possíveis.
5.2.1.4 Desvio‑padrão
Observe a estranheza que causa a unidade: “reais ao quadrado”. Sem falar do número extravagante
que resultou dos cálculos. Para contornar esse problema, define‑se a mais utilizada das medidas de
variabilidade: o desvio‑padrão.
n
S=
∑ i=1di2
N −1
77
Unidade II
n
S=
∑ i=1di2 × fi
n
∑ i=1fi − 1
para dados agrupados em classes ou não.
• somar o quadrado dos desvios (usando o conceito de frequência, caso sejam dados agrupados);
Exemplo 1. Calcular a média e o desvio‑padrão da amostra {18; 21; 22; 27; 28; 29; 32; 37}.
Tabela 44
78
ESTATÍSTICA
Cálculo da média:
Σx i 216
X= ⇒X= ⇒ X = 27
N 8
Cálculo da variância:
n
2
S =
∑ d2
i=1 i
=> S2 =
304
=> S2 = 43, 4
N −1 8 −1
Cálculo do desvio‑padrão:
n
S=
∑ i=1di2 => S = 304
=> S = 43, 4 => S = 6, 6
N −1 8 −1
Mo = 26.892
Exemplo de aplicação
10. As últimas dez ligações telefônicas para um call center duraram, em minutos, os seguintes
valores:
Tabela 45
15 12 16 18 14
11 17 16 12 13
A) 3,0
B) 3,2
C) 1,6
D) 2,4
E) 2,2
79
Unidade II
Cálculo da variância:
n
S2
=
∑ d2 × fi
i=1 i
=> S2 =
875, 6
=> S2 = 7, 5
n 118 − 1
∑ i=1fi − 1
Cálculo do desvio‑padrão:
n
S=
∑ i=1di2 × fi => S = 875, 6
=> S = 7, 5 => S = 2, 7
n 118 − 1
∑ i=1fi − 1
Exemplo de aplicação
11. A CIPA de uma empresa relacionou o número de acidentes ocorridos nos últimos seis anos,
montando a seguinte tabela:
80
ESTATÍSTICA
Tabela 47
A) 0,4
B) 0,5
C) 0,6
D) 0,7
E) 0,8
Pontos Quadrado
Manutenções Quadrado
Limites de médios de Valor x dos
pesquisadas Desvios dos
classes classe Frequência desvios x
Classes desvios
Valor Frequência Frequência
li ls pmi fi pmi.fi di = xi - X di2 di2 x fi
1 0 |--- 3 1,5 26 39 -4,1 16,6 432,2
2 3 |--- 6 4,5 20 90 -1,1 1,2 23,2
3 6 |--- 9 7,5 16 120 1,9 3,7 59,2
4 9 |--- 12 10,5 10 105 4,9 24,2 242,4
5 12 |--| 15 13,5 6 81 7,9 62,8 376,7
Somas 78 435 1133,5
Média 5,6 Variância 14,7
Desvio-padrão 3,8
81
Unidade II
Cálculo da variância:
n
S2
=
∑ d2 × fi
i=1 i
=> S2 1133, 5
= => S2 = 14, 7
n 78 − 1
∑ i=1fi − 1
Cálculo do desvio‑padrão:
n
S=
∑ i=1di2 × fi => S = 1133, 5
=> S = 14, 7 => S = 3, 8
n 78 − 1
∑ i=1fi − 1
O desvio‑padrão é a mais utilizada medida de dispersão, e, quando relacionada com a média, informa
a quantidade de elementos da amostra ou da população que se situam em torno da média.
O mais comum, na Estatística, é que essa relação entre média e desvio‑padrão seja feita pela chamada
distribuição normal, à qual nós voltaremos na disciplina Estatística Aplicada. Nessa relação, válida na
maior parte dos casos práticos, há os seguintes intervalos:
• entre a média mais uma vez o desvio‑padrão e a média menos uma vez o desvio‑padrão, estão
contidos 68% dos elementos da amostra ou da população;
• entre a média mais duas vezes o desvio‑padrão e a média menos duas vezes o desvio‑padrão,
estão contidos 85% dos elementos da amostra ou da população;
• entre a média mais três vezes o desvio‑padrão e a média menos três vezes o desvio‑padrão, estão
contidos 99,74% dos elementos da amostra ou da população;
• entre a média mais quatro vezes o desvio‑padrão e a média menos quatro vezes o desvio‑padrão,
estão contidos 100% dos elementos da amostra ou da população.
Observe que as notas: 4,1 e 6,5 correspondem exatamente à média menos um desvio‑padrão
(5,3 – 1,2 = 4,1) e à média mais um desvio‑padrão (5,3 + 1,2 = 6,5). Portanto, 68% dos alunos estão
contidos nesse intervalo, ou seja: 68% de 4.850 são 3.298 alunos.
Como 60% de 4.850 é 3.298, podemos afirmar que essa é a quantidade de alunos que tiveram notas
entre 4,1 e 6,5.
82
ESTATÍSTICA
Exemplo de aplicação
12. Certa repartição pública anotou e relacionou os tempos de inspeção que faz nas empresas,
chegando à seguinte distribuição de frequências:
Tabela 49
A maneira mais comum de se informar de maneira sintética (resumida) dados quantitativos é por meio
de uma medida de posição (média, mediana ou moda) em conjunto com uma medida de dispersão absoluta
(desvio médio, variância ou desvio‑padrão). O mais comum é o par de informações média – desvio‑padrão.
S S
Cvp = ou Cvp = × 100
X X
83
Unidade II
S S
Cvp = ou Cvp = × 100
Me Me
O Exemplo 1 a seguir mostra uma aplicação dos coeficientes de variação, num caso de ordem prática.
Aplicações
Estatísticas Observações
X Y
O especialista teria chegado a essas
conclusões através de um estudo
Retorno esperado 12% 20% estatístico no qual pesquisou e resumiu
os retornos ocorridos no passado,
conforme vimos no item 3.1.1
Analogamente o especialista teria
Desvio-padrão 9% 10% calculado o desvio-padrão conforme
vimos no item 3.2.1.4
Observe que se o especialista comparasse as aplicações somente com base em seus desvios padrões, ele
preferiria a aplicação X, uma vez que essa aplicação tem um desvio‑padrão menor que Y (9% versus 10%).
Essa comparação seria baseada no fato de que, sendo mais homogênea a aplicação A, “daria menos sustos”.
No entanto, se ele calculasse e comparasse os coeficientes de variação, chegaria a conclusões diferentes:
Aplicações
Estatísticas
X Y
Retorno esperado 12% 20%
Desvio-padrão 9% 10%
Coeficiente de Variação 75% 50%
de Pearson
9
Cvpa = × 100 => Cvpa = 75%
12
10
Cvpb = × 100 => Cvpa = 50%
20
A comparação dos coeficientes de variação das aplicações mostra que o especialista estaria cometendo
um erro sério se escolhesse a aplicação X em vez da aplicação Y, já que a dispersão relativa, ou risco, das
aplicações, conforme refletida no coeficiente de variação, é menor para o ativo Y do que para o X (50%
versus 75%). Evidentemente, o uso do coeficiente de variação para comparar o risco da aplicação é melhor
porque este também considera o tamanho relativo, ou retorno esperado, das aplicações.
84
ESTATÍSTICA
Exemplo de aplicação
13. A tabela a seguir relaciona médias e desvios‑padrões de três diferentes amostras de investimentos
feitos por um aplicador financeiro:
Tabela 50
14. Foram comparados os dados referentes a acidentes de trabalho em dois grupos de ramos
diferentes de indústria. Nas 35 indústrias do ramo A foi notada uma taxa média de 2,62 acidentes por
mil homens/hora de trabalho, com desvio‑padrão de 0,72. Nas 35 empresas das indústrias do ramo B
foi notada taxa média de 3,10 acidentes por mil homens/hora de trabalho, com desvio‑padrão de 0,80.
Com base nesses dados, informou‑se:
III – As empresas do ramo B apresentam menor variação relativa, pois têm menor coeficiente de
variação.
Quando utilizamos os histogramas, é facilmente perceptível que as frequências dos valores mais
centrais tendem a ser maiores que as dos valores extremos. Esse comportamento nos permitirá tirar
conclusões importantes no tópico da Estatística Indutiva, porque, via de regra, ocorre de modo repetitivo.
Observações do padrão de comportamento das distribuições mostram que grande parte delas tende
a apresentar‑se da maneira conhecida como distribuição normal.
A figura 22 mostra o comportamento estatístico de uma distribuição de frequências relativa aos pesos
de um grupo de pessoas qualquer. Observe que os pesos próximos da média têm maior frequência, e os
mais afastados, menor frequência. Observe também a curva que se forma pela distribuição das colunas.
40
35
30
Frequência simples
25
20
15
10
0
30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105
Peso em quilos
No curso de Estatística Aplicada, retornaremos ao assunto, quando diremos, por exemplo, que é
pouco provável alguém ter peso acima de 100 kg ou abaixo de 35 kg, e utilizaremos essa curva para
determinar qual é essa probabilidade, se houver.
86
ESTATÍSTICA
Por ora, iremos nos preocupar com a variação de formatos desse tipo de curva, chamada de curva
normal, curva de Gauss ou, ainda, de curva do sino.
Em teoria, espera‑se que essa curva tenha o comportamento mostrado nas curvas desenhadas em
linha contínua nas Figuras 23 e 24. Na prática, porém, ocorrem deformações nessas curvas, demonstradas
nas curvas pontilhadas das mesmas figuras. Essas deformações são chamadas, respectivamente, de
assimetria (Figura 23) e curtose (Figura 24).
Simétrica
Assimétrica positiva Assimétrica negativa
Frequência simples
0
0 Média Variável
Figura 24 – Assimetria
Curva leptocúrtica
Frequência simples
Curva mesocúrtica
Curva platicúrtica
Média Variável
Figura 25 – Curtose
6.1 Assimetria
A assimetria mede o quanto a distribuição se afasta da média. Esse afastamento pode ocorrer para a
direita ou para a esquerda, gerando, respectivamente, as assimetrias positiva e negativa.
As = X −Me
S
87
Unidade II
Onde:
As = Coeficiente de assimetria.
X = Média.
Me = Mediana.
S = Desvio‑padrão.
Esse coeficiente pode assumir diferentes valores. De acordo com o sinal desses valores, a assimetria
será numa direção, como se vê a seguir:
As = 0 – A distribuição é simétrica.
Caso As = 0: simétrica.
6.2 Curtose
∑di4 × fi
K=
∑fi − 3
S4
88
ESTATÍSTICA
Onde:
K = Coeficiente de curtose.
di = Desvios.
fi = Frequências simples.
S = Desvio‑padrão.
Assim como na assimetria, também na curtose os coeficientes podem assumir diferentes valores. De
acordo com o sinal desses valores, a assimetria será numa direção, como se vê a seguir:
K = 0: a distribuição é mesocúrtica.
Lembrete
Vamos usar o exemplo a seguir para demonstrar o cálculo da assimetria e da curtose de uma
distribuição referente ao consumo de energia elétrica entre 1.245 famílias de determinada região.
Observando os resultados obtidos (expostos a seguir), notamos que a distribuição (e a curva dela
decorrente) é assimétrica negativa fraca, ou seja, ligeiramente deslocada para a nossa direita, e que
é platicúrtica, ou seja, achatada. A curva teria a aparência aproximada da figura que segue (a curva
pontilhada é a do exercício; a cheia é a padrão):
Frequência simples
Média Variável
89
Unidade II
Tabela 51
Consumo Desvio
Pontos
mensal por número Frequência Pontos Desvios ao Desvios à Desvios à quarta
Classes médios
de famílias acumulada médios x Desvios ao quadrado quarta potência x
número de
crescente Frequências quadrado x potência Frequências
classe
Frequências
Valor Frequência
• Cálculo da média:
=
∑xifi =>= 270.425 =>= 217, 2
∑fi 1.245
• Cálculo do desvio‑padrão:
n
S=
∑ i=1di2 × fi => S = 18.534.426
=> S = 14.899 => S = 122,1
n 1.245 − 1
∑ i=1fi − 1
• Cálculo da mediana:
— elemento mediano:
N +1 1.245 + 1
Eme = => Eme = => Eme = 623º
2 2
— mediana:
E − f 623 − 534
Me = liMe + me ac ant × h = 200 + × 50 => Me = 225, 4
fMe 175
90
ESTATÍSTICA
Cálculo da assimetria:
X − Me 217, 2 − 225, 4
As = => As = => As = −0, 067
S 122,1
• Cálculo da curtose:
∑di4 × fi 657.154.712.129
K=
∑ i − 3 => K =
f 1245 − 3 => K = −0, 625
S4 (122,1)4
Exemplo de aplicação
15. Com relação à assimetria e à curtose das distribuições, foram feitas as seguintes afirmações:
I – Uma curva assimétrica positiva tem uma média superior à curva simétrica.
III – Curvas com coeficiente menor do que zero têm deslocamento para a esquerda em relação à
curva simétrica.
16. Duas distribuições foram estudadas e chegou‑se aos seguintes coeficientes mostrados a seguir:
91
Unidade II
Tabela 52
Coeficiente de Coeficiente de
Distribuição assimetria curtose
A ‑ 1,34 1,89
B 0,87 ‑1,34
A) A distribuição A tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.
B) A distribuição B tem menor média do que se fosse simétrica e é mais achatada do que a mesocúrtica.
Em Estatística, quando nos referimos a uma previsão de comportamento de uma população a partir
do conhecimento de uma amostra, ou, ao contrário, à previsão do comportamento esperado de uma
amostra retirada de uma população conhecida, temos o cuidado de utilizar a palavra provavelmente
antes de cada informação.
Assim, por exemplo, quando após uma pesquisa eleitoral o veículo de comunicação informa que se a
eleição fosse naquele momento o candidato X teria 35% dos votos, ele quer dizer que provavelmente o
candidato X tivesse essa quantidade de votos. É uma afirmação provável de ocorrer, não quer dizer que
certamente ocorrerá. Uma tolerância nessa informação é esperada.
Neste tópico veremos o que significa e como são calculadas as probabilidades, ramo de estudo
da Matemática, e não exatamente da Estatística. Inicialmente iremos verificar casos absolutamente
teóricos e posteriormente evoluiremos para situações mais próximas da realidade.
Tentaremos utilizar o raciocínio lógico para resolver as questões e, no final do tópico, faremos uma
revisão teórica, apresentando os conceitos e as fórmulas utilizadas na Teoria Elementar das Probabilidades.
O importante é você dominar o mecanismo de cálculo da probabilidade.
Caso você procure a definição de probabilidade em um dicionário, o Houaiss (2009), por exemplo,
irá encontrar algo do tipo:
92
ESTATÍSTICA
“Probabilidade: característica do que é provável; perspectiva favorável de que algo venha a ocorrer;
possibilidade, chance.”
Como é fácil de notar, essa definição não acrescenta nada ao conceito intuitivo que temos de
probabilidade; isso porque esse conceito é circular, ou seja, define‑se probabilidade utilizando‑se seus
próprios termos.
• Experimento: significará, para nós, observar ou executar determinado processo sob certas
circunstâncias controladas. Todas as nossas questões e problemas trabalhados em estatísticas são
experimentos que devem ser corretamente definidos. Podemos citar alguns exemplos para clarear
nosso entendimento. O comportamento das ações numa Bolsa de Valores; a produtividade de um
processo; a variação de estoques ao longo de determinado período; o controle de qualidade dos
produtos recebidos por um empresa; os resultados de um jogo, por exemplo, a Mega‑Sena, entre
outros, são exemplos de experimentos.
• Experimento aleatório: são aqueles que, apesar de serem repetidos exatamente da mesma
maneira, não apresentam resultados obrigatoriamente iguais. Por exemplo: você pode jogar um
dado exatamente da mesma maneira duas vezes, e nada garantirá que irá obter o mesmo resultado.
Rigorosamente, experimentos aleatórios são, exclusivamente, jogos de azar. Em Administração,
vamos trabalhar, normalmente, com experimentos aproximadamente aleatórios, os quais, apesar
de apresentarem determinado grau de aleatoriedade, não são exclusivamente aleatórios. Por
exemplo, o jogo de cartas conhecido como 21 é aleatório; já o “buraco” é aproximadamente
aleatório.
Saiba mais
93
Unidade II
• Espaço amostral (ou conjunto universo ou espaço das probabilidades): é o conjunto formado
por todos os resultados possíveis de um experimento aleatório. Por exemplo, o espaço amostral de
um jogo de um dado “honesto” é dado por:
S = {1, 2, 3, 4, 5, 6}. O dado deve ser “honesto”; se não for, o experimento não será aleatório.
E = {1, 2, 3, 5}
Observação
Por definição, um número positivo será primo se for maior do que 1 e for
divisível apenas por 1 e por ele mesmo. Por essa definição, o número 1 seria
primo, apesar de que, por conveniência, normalmente não é considerado
como tal. Neste material, será incluído entre os números primos.
n( A )
P( A ) =
n(S)
Sendo:
Por exemplo:
94
ESTATÍSTICA
n( A ) 4
P( A ) = ⇒ P( A ) = = 0, 667 = 66, 7%
n(S) 6
• Abordagem como frequência relativa: probabilidade é a razão entre o número de vezes em que
determinado resultado ocorre, quando repetimos o experimento aleatório (ou aproximadamente
aleatório) por um número elevado de vezes. Por exemplo: jogamos uma moeda mil vezes, e em
512 dessas vezes saiu cara. Podemos dizer, por esta definição, que a probabilidade de sair cara
nessa moeda é de 512/1000, ou seja, 51,2%. Esse raciocínio seria simbolizado da seguinte forma:
fA 512
P( A ) = fRA = ⇒ P( A ) = fRA = = 0, 512 = 512
, %
fT 1000
Esse resultado não é o mesmo que o calculado pela definição anterior (50%). Isso pode decorrer do
fato de a moeda usada não ser “honesta” (portanto, com resultados aleatórios), ou do fato de o número
de jogadas não ter sido suficientemente grande. Aumentando o número de jogadas, a probabilidade
tenderá ao valor teórico de 50%, se a moeda for “honesta”.
Durante nosso curso iremos utilizar as duas primeiras abordagens, de acordo com o campo
de estudo em que estivermos. Deve‑se notar que a primeira abordagem é eminentemente teórica
e pressupõe experimentos aleatórios em que os elementos são equiprováveis. Já na segunda
abordagem podem ser introduzidos fatores diversos, característicos de determinadas situações não
totalmente aleatórias.
Apesar de basicamente o cálculo de probabilidades envolver uma das duas relações descritas, existem
axiomas, teoremas e propriedades que devem ser conhecidos para o correto uso da teoria. Antes de
nos preocuparmos com a teoria envolvida, porém, iremos nos ater à lógica que permeia o cálculo de
probabilidades. Para tanto, analisaremos as questões a seguir.
1. Uma moeda “honesta” é jogada uma única vez; qual é a probabilidade de que o resultado seja cara?
Pelo modo como o exercício é proposto, devemos calcular a probabilidade como uma razão entre o
número de elementos favoráveis ao evento cara e o número total de elementos possíveis.
n( A ) 1
P( A ) = ⇒ P(cara) =
n(S) 2
2. Duas moedas “honestas” são jogadas simultaneamente; qual é a probabilidade de que pelo menos
uma seja cara?
O evento pedido é:
Logo, a probabilidade é:
n( A ) 3
P(pelo menos uma cara) = ⇒ P(pelo menos uma cara) = = 0, 75 = 75%
n(S) 4
Observação
3. Quatro moedas são jogadas simultaneamente; qual é a probabilidade de que se obtenham pelo
menos duas caras?
Ficou muito mais complexo estabelecer o espaço amostral e o evento solicitado. O princípio é o
mesmo dos exercícios anteriores, mas, como o número de moedas aumentou, as dificuldades envolvidas
também aumentaram.
Cara
Joga-se uma
moeda “honesta”.
Os resultados
podem ser:
Coroa
Figura 27
A seguir está desenhada a árvore de decisões do experimento “jogar quatro moedas ‘honestas’
simultaneamente”. Com certeza, não esquecemos nenhum dos resultados possíveis.
Cara Caminho 1
Cara
Coroa Caminho 2
Cara
Cara Caminho 3
Coroa
Coroa Caminho 4
Cara
Cara Caminho 5
Cara
Coroa Caminho 6
Coroa
Joga-se Cara Caminho 7
uma Coroa
moeda Coroa Caminho 8
“honesta”
sucessiva- Cara Caminho 9
mente 4 Cara
vezes Coroa Caminho 10
Cara
Cara Caminho 11
Coroa
Coroa Caminho 12
Coroa
Cara Caminho 13
Cara
Coroa Caminho 14
Coroa
Cara Caminho 15
Coroa
Coroa Caminho 16
Figura 28
Observe o caminho nº 1: na primeira vez em que jogamos a moeda, saiu cara; na segunda jogada,
saiu cara de novo, assim como na terceira e na quarta jogada, ou seja, o caminho nº 1 formado pelos
eventos sucessivos: cara – cara – cara – cara.
n( A ) 11
P( A ) = ⇒ P(pelo menos uma cara) = = 0, 6875 = 68, 75%
n(S) 16
O número de possibilidades (ou seja, elementos) do espaço amostral cresce continuamente. Caso
jogássemos uma quinta vez a moeda, teríamos 32 resultados diferentes. Uma maneira de trabalharmos
com essa grande quantidade de números é o uso da análise combinatória.
Observação
Saiba mais
O cálculo de probabilidade continuará a ser feito por meio da razão entre o número de elementos
favoráveis ao evento que estamos estudando e o número total de elementos do espaço amostral. A
análise combinatória nos servirá para calcular de maneira menos trabalhosa essas quantidades.
98
ESTATÍSTICA
Se você olhar a árvore de decisões do jogo de moedas, perceberá que o espaço amostral aumenta em
número de elementos da seguinte maneira:
Tabela 53
É fácil notar que a relação matemática existente entre o número de jogadas e o número de resultados
possíveis é de ab, onde a é o número de resultados possíveis de ocorrer numa única repetição do
experimento (no caso, a = 2, porque os resultados possíveis são cara ou coroa) e b é o número de
repetições do experimento (no caso da tabela anterior, temos n variando de 1 a 4). Desse modo, se
quisermos saber o número de elementos do espaço amostral de seis jogadas de uma moeda, bastaria
fazermos o cálculo 26 = 64 resultados diferentes.
Em análise combinatória, esse procedimento é conhecido como cálculo do número de arranjos com
repetição.
Arn,x = ab
Observação
Em contrapartida, observando a árvore de decisões, podemos contar o número de caras que podem
aparecer na quarta jogada montando a tabela que segue.
Tabela 54
99
Unidade II
Segundo a análise combinatória, o número de caminhos é dado pelo número de combinações, obtido
por meio da fórmula:
n!
Cn,x =
x !(n − x )!
Onde:
Observação
Lembrete
a! = 1 x 2 x 3 x 4 x..... x a
6! = 1 x 2 x 3 x 4 x 5 x 6 = 720
A tabela a seguir mostra o cálculo das combinações do exemplo dado. Verifique que coincide com os
números obtidos por meio da árvore de decisões.
100
ESTATÍSTICA
Tabela 55
4! 4! 24
Zero cara C4 ,0 = = = =1 1
0! (4 − 0) 0! (4 )! 1 × 24
4! 4! 24
Uma cara C4 ,1 = = = =4 4
1! (4 − 1) 0! (1)! 1 × 6
4! 4! 24
Duas caras C4 ,2 = = = =6 6
2! (4 − 2) 2! (2)! 2 × 2
4! 4! 24
Três caras C4 ,3 = = = =4 4
3! (4 − 3) 3! (1)! 6 × 1
4! 4! 24
Quatro caras C4 ,4 = = = =4 1
4 ! (4 − 4 ) 4 ! (0)! 24 × 1
Temos agora todas as informações necessárias para o cálculo das probabilidades envolvidas no
experimento referente a “quatro jogadas sucessivas de uma moeda ‘honesta’”. A tabela a seguir resume
esses valores.
Tabela 56
101
Unidade II
Essa tabela resume todos os possíveis resultados do experimento de “jogar quatro vezes uma moeda
‘honesta’”. Cada um desses resultados é um evento diferente, e a probabilidade de cada um destes
ocorrer é obtida pela divisão do número de vezes em que ocorre pelo número total de resultados do
experimento.
O evento pedido na questão, “pelo menos duas caras”, é a soma dos eventos, encontrados no quadro
anterior, “obter duas ou três ou quatro caras”, ou seja:
Essa questão é muito semelhante à anterior, mas envolve uma quantidade de moedas e resultados
que inviabiliza o uso da árvore de decisões. Sabemos, porém, calcular questões desse tipo usando os
conceitos de análise combinatória:
• O número total de resultados possíveis é o número de arranjos com repetições de vinte moedas
que podem apresentar dois resultados diferentes.
• O número total de resultados que nos interessam é o número de combinações de vinte moedas
das quais oito sejam caras.
n( A ) 125.970
P( A ) = ⇒ P(exatamente 8 caras) = = 0,12001 = 12, 01%
n(S) 1.048.576
Observação
102
ESTATÍSTICA
•
• 2 • • •
20 12 × 13× 14 × 15× 16 × 17× 18 × 19× 20
C20,8 = = = 125.970
8!× 12! 1 × 2 × 3 × 4 × 5 × 6 × 7 × 8 × 12!
Vamos utilizar esses conhecimentos adquiridos para fazer um cálculo que talvez não deixe você
satisfeito.
Observe que na Mega‑Sena é necessário acertar seis dezenas para se ganhar o prêmio máximo. Caso
se jogue sete dezenas, temos sete chances de acertar as seis dezenas:
n! 7! 7! 5040
Cn,x = ⇒ C7,6 = = = =7
x !(n − x )! 6!(7 − 6)! 6!× 1! 720 × 1
Na Mega‑Sena existem sessenta números possíveis, dos quais você deve acertar seis, ou seja:
n! 60! 60!
Cn,x = ⇒ C60,6 = = = 50.063.860
x !(n − x )! 6!(60 − 6)! 6!× 54 !
Resumindo, você tem 7 chances em 50.063.860 de acertar na Mega‑Sena, o que dá uma probabilidade
de:
n( A ) 7
P( A ) = ⇒ P(ganhar na mega sena) = = 0,00000014 = 0,000014 %
n(S) 50.063.860
Até aqui, sempre que nos referimos às moedas, frisamos que eram honestas. Por que isso? Porque
uma moeda “honesta” é absolutamente aleatória, ou seja, por mais que a joguemos, nunca iremos saber
qual o próximo resultado que irá ocorrer, e também porque a probabilidade de cair cara numa moeda
“honesta” é de 50% assim como de sair coroa.
103
Unidade II
Nem sempre será assim. Poderemos ter moedas “viciadas”, e, em situações mais próximas da realidade
do dia a dia, com certeza os experimentos não serão absolutamente aleatórios, mas aproximadamente
aleatórios, e as probabilidades de ocorrência serão dadas pelas frequências relativas observadas.
Imagine que você tenha nas mãos uma moeda, que não sabe se é “honesta” ou “viciada”. Como
poderia saber? Testando‑a, ou seja, jogando‑a repetidas vezes e anotando os resultados.
Caso os resultados tendam para 50% de sair cara e 50% de sair coroa, a moeda é “honesta”; caso
contrário, é “viciada”. Obviamente, quanto maior o número de vezes que a testar, maior a segurança que
terá nessa resposta.
Tabela 57
• Para poucos lançamentos, não é possível assumir se as moedas são “honestas” ou “viciadas”. O
número de observações não é suficiente. Isso é constante na Estatística Indutiva. Precisamos de
uma quantidade de observações mínima para chegarmos a alguma conclusão.
• À medida que o número de observações vai crescendo, cristalizamos a ideia de que a moeda A
é “honesta”, e a moeda B, “viciada”. Perceba que, em dez jogadas, não há nada de estranho em
obtermos seis caras e quatro coroas, mas, quando jogamos a moeda cem vezes e obtemos 57
caras, algo não acidental está ocorrendo. Não é possível que seja uma questão de “sorte” ou “azar”.
• A partir dessas observações, podemos assumir que a moeda A é “honesta” e que a probabilidade de
obtermos cara é igual à de obtermos coroa, no valor de 50% (o fato de os cálculos não resultarem
exatamente em 50% é efeito de variações aceitáveis).
104
ESTATÍSTICA
A partir desses conceitos, podemos expandir um pouco mais os nossos cálculos, resolvendo a questão
do próximo tópico.
Vamos entender a questão por meio do uso da árvore de decisões. É a mesma árvore usada
anteriormente, com uma diferença: sobre cada decisão (simbolizada pelas flechas) colocaremos a
probabilidade correspondente:
Cada “caminho” será formado por várias decisões em sequência, cada uma delas com probabilidades
diferentes. A probabilidade de ocorrência de um caminho em especial é dada pela multiplicação das
probabilidades individuais. A isso chamamos evento produto.
Cara
0,58 0.42 Coroa Caminho 2 0.58 x 0.58 x 0.42 = 0.582 x 0.42 = 0.1413
Cara
0,58 0.42 0,58 Cara Caminho 3 0.58 x 0.42 x 0.58 = 0.582 x 0.42 = 0.1413
Coroa
Joga-se
uma 0.42 Coroa Caminho 4 0.58 x 0.42 x 0.42 = 0.58 x 0.422 = 0.1023
moeda
“viciada”
sucessiva-
mente 4 0,58 Cara Caminho 5 0.42 x 0.58 x 0,58 = 0.582 x 0.42 = 0.1413
vezes
Cara
0.42 0,58
0.42 Coroa Caminho 6 0.42 x 0,58 x 0.42 = 0.58 x 0.422 = 0.1023
Coroa
Somatório = 1 ou 100%
Figura 29
105
Unidade II
Pelo menos duas caras significa duas ou três caras, logo os caminhos 1, 2, 3, e 5 nos interessam; os
demais ou têm apenas uma cara, ou nenhuma.
Qualquer um desses quatro caminhos que vierem a ocorrer responderá à nossa pergunta, ou seja, a
probabilidade de ocorrer pelo menos duas caras é a soma das probabilidades de ocorrer o caminho nº 1,
ou então o nº 2, ou então o nº 3, ou, ainda, o nº 5. Poderíamos escrever isso assim:
P(pelo menos uma cara) = P(ca-ca-ca) + P(ca-ca-co) + P(ca-co-ca) + P(co-ca-ca)
Logo, o resultado seria:
P(pelo menos uma cara) = 0,1951 + 0,1413 + 0,1413 + 0,1413 = 0, 6190 = 61, 90%
Cada vez que jogamos a moeda, ocorre um resultado diferente. A cada um desses resultados damos o
nome de evento. Vários eventos podem ser combinados, criando os eventos soma e os eventos produto,
já mostrados anteriormente.
O evento soma representa uma alternativa entre vários eventos simples, caracterizando‑se pela
palavra ou. Por exemplo, a questão “Qual é a probabilidade de um aluno passar em Estatística?” é
respondida por um evento soma: o aluno pode passar sem exame ou com exame. A probabilidade será
a soma das probabilidades dos dois eventos simples.
O evento produto representa uma obrigação entre várias situações e caracteriza‑se pela palavra
e. Por exemplo, “Qual é a probabilidade de um aluno cursar Administração e passar em Estatística?”.
O aluno tem de cursar Administração e passar em Estatística. A probabilidade será o produto entre a
probabilidade de um aluno estudar Administração e a probabilidade de passar de Estatística.
7. Dois caçadores, Pedro e João, atiram contra uma caça simultaneamente. Sabemos que Pedro
tem uma probabilidade de acertar esse tipo de caça de 40%, enquanto João acerta em 55% das vezes.
Calcular a probabilidade de:
Antes de resolvermos a questão, vamos sublinhar como foram obtidas essas probabilidades.
Presumimos que Pedro e João já foram caçar diversas vezes esse tipo de caça e, a cada tiro que deram,
anotaram o resultado. Após algum tempo, eles têm uma série de observações suficientemente grande
para calcular as probabilidades relacionadas.
106
ESTATÍSTICA
Pedro atirou um número x de vezes e acertou quatro a cada dez tiros que deu; assim, ele pode
afirmar que tem 40% de chances de acertar um tiro qualquer nessas mesmas condições. João, em
raciocínio semelhante, chegou à probabilidade de 55%.
Se Pedro tem 40% de chances de acertar, tem 60% de chances de errar, assim como João tem 55%
de probabilidade de acertar e 45% de errar. Chegamos a essa conclusão porque acertar e errar são
eventos complementares, ou seja, um completa o outro sem a existência de um terceiro, e a soma dos
dois resulta em 100%.
Acerta o João
tiro atira
0,40 0,55
Erra o 0,40 x 0,45 = 0,18 ou 18%
tiro
Pedro
atira
Acerta o 0,60 x 0,55 = 0,33 ou 33%
0,45 tiro
0,60
Erra o João
tiro atira
0,55
Erra o 0,60 x 0,45 = 0,27 ou 27%
tiro
Figura 30
A caça será atingida se Pedro ou João ou os dois a atingirem. Existe alternativa, portanto é um
evento soma:
Já para ambos atingirem a caça, é necessário que Pedro e João a atinjam, ou seja, é um evento produto:
Na questão anterior, os tiros de Pedro não interferem nos tiros de João e vice‑versa, ou seja, o fato de
Pedro acertar ou errar não torna mais ou menos provável os acertos ou erros de João. É o que se chama
de eventos independentes.
Nem sempre, entretanto, isso ocorre. Eventualmente, a ocorrência de um evento altera a probabilidade
de ocorrência do evento seguinte. São os eventos vinculados, ou condicionados, ou dependentes.
8. Temos uma caixa que contém um total de 45 bolinhas, sendo 20 verdes, 15 brancas e 10 pretas.
Retiramos dessa caixa uma bolinha, anotamos sua cor, colocamos de lado e, em seguida, retiramos da
caixa uma segunda bolinha.
Uma combinação verde e branca corresponde a retirar uma primeira bolinha verde e uma segunda
bolinha branca, ou uma primeira bolinha branca e uma segunda bolinha verde. Raciocínio semelhante é
utilizado para a combinação preta e branca.
Novamente vamos utilizar a árvore de decisões para entender e esquematizar o problema, seguindo
o raciocínio anteriormente estabelecido:
108
ESTATÍSTICA
Figura 31
Observe que, dos nove caminhos existentes (eventos produtos), dois correspondem a uma combinação
verde e branca: os caminhos 2 e 4. Portanto, um ou outro atendem ao solicitado (portanto, evento
soma). Dessa forma:
P(combinação verde e branca) = P(1ª verde / 2ª branca) + P(1ª bolinha branca / 2ª verde)
P(combinação verde e branca) = 0,1515 = 0,1515 = 0,3030 = 30,30%
Raciocínio semelhante é feito para a combinação preta e branca (siga os caminhos 6 e 8):
P(combinação verde e branca) = P(1ª branca / 2ª preta) + P(1ª bolinha preta/ 2ª branca)
P(combinação preta e branca) = 0,0757 + 0,0757 = 0,1514 = 15,14%
Exemplo de aplicação
17. Uma caixa contém 20 canetas iguais, das quais 7 são defeituosas, e outra caixa contém 12, das
quais 4 são defeituosas. Uma caneta é retirada aleatoriamente de cada caixa. As probabilidades de que
ambas não sejam defeituosas e de que uma seja perfeita e a outra não são, respectivamente, de:
A) 88,33% e 45,00%
B) 43,33% e 45,00%
109
Unidade II
C) 43,33% e 55,00%
D) 23,33% e 45,00%
E) 23,33% e 55,00%
18. Certo tipo de motor pode apresentar dois tipos de falhas: mancais presos e queima do induzido.
Sabendo‑se que as probabilidades de ocorrência dos defeitos são de 0,2 e 0,03, respectivamente,
determine a probabilidade de que, num motor daquele tipo, selecionado ao acaso, não ocorram,
simultaneamente, as duas falhas.
A) 6%
B) 19,4%
C) 99,4%
D) 21,8%
E) 77,6%
• Experimento: processo pelo qual ocorre uma determinada sucessão de acontecimentos. Por
exemplo: realizar uma reação química; investir em ações; jogar dados.
• Experimento aleatório: é aquele cujos resultados não são sempre os mesmos, apesar de se
repetirem várias vezes em condições semelhantes. Por exemplo: jogar dados.
• Experimentos aproximadamente aleatórios: são aqueles que, apesar de terem uma tendência de
ocorrência, não podem ter seus resultados definidos de modo exato pela ciência. Por exemplo:
investir em ações.
• Espaço amostral ou conjunto universo: conjunto formado por todos os resultados possíveis de
um experimento. Por exemplo: o conjunto formado pelos números 1; 2; 3; 4; 5 e 6, resultados
possíveis de um jogo de dados.
110
ESTATÍSTICA
• Evento simples: é aquele formado por um único elemento do espaço amostral. Por exemplo, o
número 5 num jogo de dados.
• Evento composto: é aquele formado por mais de um elemento do espaço amostral. Por exemplo,
os números 1; 3 e 5, evento “números ímpares” de um jogo de dados.
• Eventos independentes: dizemos que dois ou mais eventos são independentes quando não
exercem ações recíprocas, comportando‑se cada um da maneira que lhe é própria, sem influenciar
os demais. Por exemplo: o lançamento de duas moedas, simultaneamente.
somente com a ocorrência do número: {2}. Note que esse conjunto é a intersecção dos dois
anteriores, ou seja, valores que pertencem simultaneamente aos dois conjuntos.
n( A )
P( A ) =
n(S)
fA
P( A ) = fRA =
fT
• Axiomas das probabilidades: são verdades a partir das quais se estabelecem os conceitos de
probabilidades:
0 ≤ P( A ) ≤ 1
P(S) = 1
P( A ∪ B) = P( A ) + P(B)
Lembrete
P( A ∪ B) = P( A ) + P(B) − P( A ∩ B)
Exemplo: numa caixa existem oito bolinhas idênticas, numeradas de 1 a 8. Qual a probabilidade de,
ao retirarmos uma bolinha, ela ser múltiplo de 2 ou de 5?
n( A ) n(B) n( A ∪ B)
P( A ∪ B) = P( A ) + P(B) − P( A ∩ B) ⇒ P( A ∪ B) = + −
n(S) n(S) n(S)
5 2 1 6
P( A ∪ B) = + − = = 0, 60 = 60%
10 10 10 10
• Teorema do Produto para eventos independentes: caso tenhamos dois eventos, A e B, que não sejam
mutuamente exclusivos, a probabilidade de ocorrer um resultado que pertença simultaneamente
aos dois eventos é dada por:
P( A ∩ B) = P( A )xP(B)
Por exemplo: temos duas caixas com bolinhas nas seguintes quantidades:
— Caixa A: 10 bolinhas azuis, 15 bolinhas brancas e 30 bolinhas vermelhas. Total 55: bolinhas.
Retiramos uma bolinha de cada urna. Qual é a probabilidade de que ambas as bolinhas retiradas
sejam azuis?
113
Unidade II
10
P( Azul) =
55
20
P( Azul) =
60
10 20 200
P( Azul ∩ Azul) = P(Urna A/bolinha Azul)xP(Urna B/bolinha Azul) = × =
55 60 3300
P( Azul ∩ Azul) = 0, 0606 = 6, 06%
P( A ∩ B) = P( A )xP(B / A )
O símbolo P(B/A) é lido como: probabilidade de ocorrência do evento B tendo ocorrido o evento A.
É a chamada probabilidade condicional. Esse conceito pode ser estendido para mais de dois eventos.
Retiramos sem reposição três caras de um baralho de 52 cartas. Qual a probabilidade de que as três
sejam vermelhas?
26
P( vermelha) =
52
25
P( vermelha) =
51
114
ESTATÍSTICA
24
P( vermelha) =
50
P( Vrm ∩ Vrm ∩ Vrm) = P(1a carta Vrm)xP(2a carta Vrm / 1a carta Vrm))xP(3a carta Vrm / 2a carta Vrm)
26 25 24 26 × 25 × 24 15.626
P( Vrm ∩ Vrm ∩ Vrm) = × × = = = 0,1178 = 11, 78%
52 51 50 52 × 51 × 50 132.6000
Exemplo de aplicação
19. Suponhamos que existam, num certo mercado, duas fábricas de lâmpadas. A fábrica A produz
500 lâmpadas, das quais 25% apresentam defeitos, e a fábrica B produz 550 lâmpadas, das quais 26%
são defeituosas; vamos supor também que as 1.050 lâmpadas sejam vendidas por um único vendedor.
Por fim, suponhamos que um cliente vá comprar uma lâmpada sem especificar marca e que estas
tenham sido dispostas ao acaso na prateleira. Calcular:
II – A probabilidade de, tendo recebido uma lâmpada perfeita, ela ser da marca B.
A) I = 47,62% e II = 26,00%
B) I = 26,00% e II = 52,05%
C) I = 25,52% e II = 26,00%
D) I = 25,50% e II = 50,00%
E) I = 25,52% e II = 52,05%
Resumo
115
Unidade II
Isso nos conduziu ao último item do nosso curso, a Teoria Elementar das
Probabilidades, na qual verificamos o que é probabilidade, como podemos
calcular uma probabilidade e os conceitos que envolvem o estudo das
probabilidades. Neste momento, conceituamos o que são experimentos e
eventos aleatórios; como se encadeiam esses eventos em eventos soma
e eventos produto e, também, em eventos vinculados e independentes, e
abrimos frente para o estudo das distribuições de probabilidades, a ser feito
na disciplina de Estatística Aplicada. Nessa linha de raciocínio, passamos os
olhos também sobre análise combinatória, que foi e será importante para
os cálculos mais complexos, ainda a serem feitos.
116
ESTATÍSTICA
Exercícios
Questão 1 (SEFAZ 2011 – Adaptado). Com base no resultado do concurso para o cargo de
Especialista em Políticas Públicas e Gestão Governamental da Seplag, prova realizada pelo Ceperj em 1º
ago. 2010, as frequências para o número de acertos obtidos nas cinco questões de Estatística pelos 1.535
candidatos que realizaram a prova estão mostradas na tabela a seguir:
Tabela 58
45,0%
40,8%
40,0%
35,0%
30,0% 27,2%
25,6%
25,0%
20,0%
15,0%
10,0%
5,3%
5,0%
0,8% 0,3%
0,0%
Figura 32
117
Unidade II
A) I e II.
B) I e III.
C) I, III e IV.
E) II e IV.
I) Afirmativa correta.
Justificativa: a moda será igual a 1 (valor com maior frequência) e a mediana também será igual a 1
(neste valor, a frequência já alcançará 50% da distribuição).
Justificativa: o primeiro quartil será igual a 0 (neste valor, a frequência já alcançará 25% da
distribuição), e o terceiro quartil será igual a 2 (neste valor, a frequência já alcançará 75% da distribuição).
A amplitude interquartílica será: Q3 - Q1 = 2 - 0 = 2.
Justificativa: podemos usar a frequência relativa para calcular a média do número de acertos, igual
a: (0 × 0,256) + (1 × 0,408) + (2 × 0,272) + (3 × 0,053) + (4 × 0,008) + (5 × 0,003) = 0 + 0,408 + 0,544
+ 0,159 + 0,032 + 0,015 = 1,158.
118
ESTATÍSTICA
Questão 2. Fez-se uma pesquisa sobre o número de pacientes que frequentaram os estabelecimentos
de saúde públicos e particulares no Brasil. Os dados a seguir representam o sumário da pesquisa.
Tabela 59
Estabelecimentos
Espécie
Públicos (PU) Particulares (PA)
Hospital (H) 1.002 5.132
119
REFERÊNCIAS
BUSSAB, W. O.; MORETIN, P. A. Estatística básica. 3. ed. São Paulo: Atual, 1986.
COSTA NETO, P. L. O.; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blücher, 1974.
FONSECA, J. S.; MARTINS, G. A.; TOLEDO, G. L. Estatística aplicada. São Paulo: Atlas, 1995.
GUERRA, M.; GUERRA, M. J.; DONAIRE, D. Estatística aplicada. São Paulo: Ciência e Tecnologia, 1991.
HOUAISS, A. Dicionário eletrônico Houaiss da língua portuguesa. Rio de Janeiro: Objetiva, 2009. 1 CD‑ROM.
KAZMIER, L. J. Estatística aplicada a economia e administração. São Paulo: Makron Books, 1982.
KUNE, H. Métodos estatísticos para a melhoria da qualidade. São Paulo: Gente, 1993.
MEDEIROS, E. et al. Estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São
Paulo: Atlas, 1997. v. 1‑2.
______. Tabelas de estatística para os cursos de economia, administração e ciências contábeis. 2. ed. São
Paulo: Atlas, 1999.
MEYER, P. L. Probabilidade: aplicações à estatística. Rio de Janeiro: Livros Técnicos e Científicos, 1976.
MIRANDA, D. Análise combinatória. Brasil Escola, Goiânia, [s.d]. Disponível em: <http://www.
brasilescola.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
______. Análise combinatória. Mundo Educação, Goiânia, [s.d.]. Disponível em: <http://www.
mundoeducacao.com/matematica/analise‑combinatoria.htm>. Acesso em: 5 dez. 2013.
120
MLODINOW, L. O andar do bêbado: como o acaso determina nossas vidas. Rio de Janeiro: Zahar, 2009.
MOORE, D. et al. A prática da estatística empresarial: como usar dados para tomar decisões. Rio de
Janeiro: LTC, 2006.
SALSBURG, D. Uma senhora toma chá: como a Estatística revolucionou a ciência no século XX. Rio de
Janeiro: Zahar, 2009.
Sites
<http://super.abril.com.br/>.
<http://www.alea.pt>.
<www.ibge.gov.br>.
Exercícios
Unidade II – Questão 1: CEPERJ. Prova do Concurso Público de Fiscal da Fazenda. Rio de Janeiro, 2011.
Questão 42, p.7. Disponível em: <http://www.concurso.ceperj.rj.gov.br/concursos/sefazfazenda/prova.
pdf>. Acesso em: 23 dez. 2013.
121
ANEXO 1 – GABARITO
Unidade I
1. B.
2. B.
3. E.
4. C.
5. D.
6. D.
7. B.
8. B.
9. C.
10. C.
11. A.
Unidade II
1. A.
2. E.
3. A.
4. D.
5. D.
6. C.
7. B.
8. A.
122
9. E.
10. D.
11. C.
12. A.
13. D.
14. C.
15. B.
16. A.
17. B.
18. C.
19. E.
123
124
125
126
127
128
Informações:
www.sepi.unip.br ou 0800 010 9000