Академический Документы
Профессиональный Документы
Культура Документы
ESTATÍSTICA DESCRITIVA
2018
CAPÍTULO 1: O QUE É ESTATÍSTICA
2
• Sociometria: e
estudo
studo de problemas sociais através da Estatística
O crescimento e desenvolviment
desenvolvimento o da Estatística foram impulsionados
pelo avanço das técnicas computacionais. Foram desenvolvidos diversos
pacotes estatísticos utilizados no meio acadêmico, em indústrias, bancos,...,
tais como Minitab, Splus, SPSS, SAS, Sisvar, R, Biostat, Eviews,
Estatística,
ística, Origin,...
O trabalho da estatística envolve a análise exploratória do conjunto
de dados (estatística descritiva) a modelagem (probabilidade, regressão,..)
do mesmo e a tomada de decisões (inferência) em situações de incerteza.
Assim, a estatísticaa pode ser dividida em:
• Estatística Descritiva: conjunto de técnicas destinadas a descrever e
resumir os dados a fim de tirar conclusões a respeito de características
de interesse. Através dela obtem
obtem-sese a maior quantidade possível de
informações que permi
permitam
tam indicar modelos que expliquem o conjunto
de dados ou que permitam tomar decisões a cerca do problema em
questão (medidas de posição, variabilidade, assimetria e técnicas
gráficas).
• Probabilidade: teoria matemática utilizada para se estudar a
incerteza associada a fenômenos aleatórios.(modelos probabilísticos)
• Inferência Estatística: técnicas que possibilitam a extrapolação, a um
grande conjunto de dados (população), das informações e conclusões
obtidas a partir de um subconjunto de valores (amostra).
Dessa
essa forma, a Estatística busca descrever a população de forma mais
fidedigna possível.
3
CAPÍTULO 2: INTRODUÇÃO À AMOSTRAGEM
2.1 INTRODUÇÃO
1
Censo: Estudo de todos os elementos da população.
4
população. Existem dois caminhos diferentes no processo de
amostragem para se determinar uma amostra: amostragem probabilística
e amostragem não probabilística.
Quando se planeja uma pesquisa por amostragem, considera-se
que todas as amostras possíveis da população tem probabilidade
diferente de zero de serem selecionadas. Assim, a seleção da amostra é
feita de modo aleatório, permitindo a aplicação da teoria da Probabilidade
Estatística e a obtenção de uma estimativa do erro amostral. Nesse caso,
diz-se que a amostragem é probabilística.
Em situações nas quais restrições práticas impedem que a seleção
da amostra seja totalmente aleatória, obtém-se amostras não
probabilísticas. A amostragem não probabilística é a amostragem
subjetiva, ou por julgamento, na qual a variabilidade amostral não pode
ser estabelecida com precisão.
O uso da Amostragem só não é interessante quando:
5
Amostra: Parte da população em que o estudo será conduzido. Um
exemplo é um grupo de tamanho n=130 dos estudantes da UFSJ, os
quais foram escolhidos por sorteio.
EXEMPLOS:
População:
Amostra:
Variável:
População:
Amostra:
Variável:
População:
Amostra:
Variável:
6
Se o conjunto de dados é uma população ou uma amostra depende
do contexto da vida real, da proposta da pesquisa.
∑x ∑ (x −X)
2
i i
x
X = i
, S2 = i
, p=
N N −1 n
7
REFERÊNCIAS:
8
CAPÍTULO 3: ESTATÍSTICA DESCRITIVA - RESUMO DE
DADOS
NOMINAL
(sem ordenação)
QUALITATIVA
(Atributo ou qualidade)
ORDINAL
(ordenação)
VARIÁVEL
DISCRETA
QUANTITATIVA (Contagem; enumerável)
(Numérica)
CONTÍNUA
(intervalo de números reais)
9
Tabela 1: Aspectos socioeconômicos dos 36 empregados da seção de
orçamentos da Companhia MB
10
As variáveis como número de filhos, salário (expresso como fração do
salário mínimo), idade (medida em anos e meses), apresentam como
possíveis resultados números resultantes de uma contagem ou
mensuração, logo, estas variáveis são chamadas de variáveis
quantitativas. A realização da variável número de filhos apresenta valores
que formam um conjunto finito ou enumerável de números, e que resultam
de uma contagem. Assim, essa variável é classificada como variável
quantitativa discreta. Já as variáveis salário e idade apresentam valores
que pertencem a um intervalo de números reais e que resultam de uma
mensuração. Então, essas variáveis são classificadas como variáveis
quantitativas contínuas.
As variáveis Grau de instrução, Estado civil e Região de procedência,
apresentam como possíveis resultados uma qualidade (ou atributo) do
indivíduo pesquisado, logo, estas variáveis são chamadas de variáveis
qualitativas. Para as variáveis estado civil e região de procedência não
existe nenhuma ordenação nos possíveis resultados e, por isso, essas
variáveis são chamadas variáveis qualitativas nominais. Já para a
variável Grau de instrução existe uma ordem natural nos seus resultados e,
por isso, ela é classificada como variável qualitativa ordinal.
Outros exemplos:
• Variável qualitativa:
a) Nominal: sexo (gênero), cor dos olhos, raça.
b) Ordinal: classe social, meses do ano.
• Variável quantitativa:
a) Discreta: número de carros, número de equipamentos defeituosos.
b) Contínua: peso, altura, tempo (de vida)/duração de um
equipamento.
11
Como realizar este estudo (descrição) de forma eficiente? Uma
maneira é construir tabelas e gráficos que permitam uma melhor
visualização do problema em questão, além de subsidiar trabalhos
estatísticos posteriores. Para isso, utiliza-se a distribuição de freqüências.
Pode-se também sintetizar as informações calculando algumas medidas
numéricas como: média, mediana, desvio padrão, entre outras.
É importante salientar que para cada tipo de variável existem técnicas
apropriadas para resumir as informações. No entanto, será visto que
técnicas usadas num caso, podem ser adaptadas para outros casos.
12
• Cabeçalho – local onde deve-se especificar as variáveis em estudo e
suas características (freqüências);
• Corpo – são as colunas e as sub-colunas onde são anotados os
dados apurados, podendo ter entrada: simples, dupla ou múltipla.
• Coluna indicadora – local onde são anotadas as classes da variável
em questão;
• Linha de totais – linha na qual quantificam-se os totais;
• Rodapé – são anotadas todas as informações que venham a
esclarecer a interpretação da tabela; local reservado para se colocar a
fonte dos dados e, quando necessário, a legenda. (Rocha, 2015).
Título
Cabeçalho
Linha de totais
Coluna indicadora
13
Pode-se utilizar a proporção para comparar a variável Grau de
instrução para empregados da seção de orçamentos da companhia MB com
a mesma variável para todos os empregados da Companhia. Considerando
que a empresa tenha 2000 empregados e que sua distribuição de
freqüências está dada na Tabela 4, não se pode comparar diretamente as
colunas das freqüências das Tabelas 3 e 4. Mas, pode-se fazer isso com as
colunas das porcentagens dessas tabelas, pois as freqüências estão
reduzidas a um mesmo total.
0 1 1 2 3
0 1 2 2 3
0 1 2 2 3
0 1 2 2 5
14
Tabela 6: Frequências e porcentagens dos empregados da seção de
orçamentos da Companhia MB, segundo o número de filhos.
15
Tabela 7: Frequências e Porcentagens dos 36 empregados da seção de
orçamentos da Companhia MB por faixa de salário.
16
Obs: Arredondar para cima, utilizando sempre o mesmo número de
casas decimais dos dados.
(LS1 = LI1+c)
2a Classe
LI2 = LS1 e LS2 = LI2 + c
a
3 Classe
LI3 = LS2 e LS3 = LI3 + c, e assim por diante.
17
• Passo 3 – Calcular a amplitude de classe (c);
R
c= =
k
LS1 = LI1+c =
2a Classe
LI2 = LS1= e LS2 = LI2 + c =
a
3 Classe
LI3 = LS2= e LS3 = LI3 + c = ,
e assim por diante.
18
informações sobre classes de amplitudes desiguais veja Morettin & Bussab,
2006.
EXERCÍCIOS:
C2 2 3 10 13 14 15 15 16 16
o
18 18 20 21 22 22 23 24 25 25
n
s26 27 29 29 30 32 36 42 44 45
t
r45 46 48 52 58 59 61 61 61 65
u
66 66 68 75 78 80 89 90 92 97
a
19
3.3 ANÁLISE BIDIMENSIONAL
Interior 3 7 2 12
Outra 5 6 2 13
Total 12 18 6 36
20
Tabela 10: Distribuição conjunta das proporções em relação ao total geral
das duas variáveis em estudo.
3.4 GRÁFICOS
21
• Simplicidade - deve-se optar em fazer o mais simples
possível;
• Clareza - ter o cuidado de não resumir omitindo informações
importantes;
• Veracidade - é extremamente importante retratar a
realidade e traçar o gráfico em uma escala apropriada.
Gráficos de colunas/barras:
Estes gráficos são a representação de uma tabela (ou série) por meio
de retângulos verticais (colunas) ou horizontais (barras), nos quais em
uma das coordenadas são representadas as categorias da variável em
estudo e na outra a freqüência (absoluta, relativa ou percentual) relacionada
a cada classe. Os retângulos devem seguir a um padrão como: distância
entre eles, largura, estética, etc.
Considerando a variável Grau de instrução para os dados da Tabela 1
referente ao exemplo dos 36 empregados da Companhia MB, a Figura 5
apresenta o gráfico de colunas para a referida variável.
22
Tabela 12: Distribuição de freqüência das formas de treinamento dos
empregados, adotados pela indústria brasileira.
Formas 100 fi
Educação básica 20
Empresas clientes ou fornecedoras 19
Consultores/instituições 40
Fora do processo do trabalho 40
“On the job” 78
Não realiza 11
23
Figura 7: Gráfico em colunas para a frequência do número de filhos dos 36
empregados da Companhia MB.
24
Gráficos de setores:
Fundamental
Médio
Superior
25
do círculo (qual tamanho de setor) correspondia a cada local. Isso foi feito
utilizando-se regras de 3.
Regras de 3
100 % ------- 360 o 100 % ------ 360 o 100 % ------ 360 o 100 % ----- 360 o
Figura 10: Gráfico de setor para os locais preferidos pelos alunos da UFSJ
para estagiar
Gráficos de Linhas:
26
Tabela 14: Vendas da Companhia Alfa – 1980 à 1986
27
Gráficos de dispersão:
28
todos os ursos. Você pode tentar as variáveis: idade, altura, comprimento da
cabeça, largura da cabeça, perímetro do pescoço e perímetro do tórax. Na
Figura 15 é mostrada a relação entre peso e altura e entre peso e perímetro
do tórax, respectivamente. (Shimakura, 2016)
Histogramas:
29
Figura 16: Histograma da variável S: salários.
Interpretação de um histograma
30
Figura 17: Diferentes tipos de Histogramas quanto à
simetria/assimetria.
Histograma alisado
31
Tabela 15: Distribuição de freqüências absolutas para a variável
salário, considerando-se classes de amplitude 2.
32
Esse gráfico é apresentado na Figura 18, que permite observar que,
conforme aumenta o salário, a densidade de frequência vai diminuindo.
Polígonos de Frequência
Exemplo:
33
Polígonos de freqüência acumulada (Ogivas de Galton)
34
EXERCÍCIOS PROPOSTOS:
35
Pede-se:
a) Classifique a variável.
b) Construa a distribuição de freqüências.
c) Construa a distribuição de frequências acumuladas e suas respectivas
Ogivas de Galton.
a) b)
Ausências xi c ni fi Ni Ausências xi c ni fi Ni
0 |- 6 39 0 |- 10 22
6 |- 12 41 10 |- 20 40
12 |- 18 38 20 |- 30 71
18 |- 24 40 30 |- 40 44
24 |- 30 42 40 |- 50 23
c) d)
Pesos xi c ni fi Ni Pesos xi c ni fi Ni
36
Tabela: Formas de obtenção de empregos
Firmas de pesquisas 44
a) Seu histograma;
b) Polígono de freqüências;
c) Ogiva de galton.
Classe ni
39,5 |- 44,5 3
44,5 |- 49,5 8
49,5 |- 54,5 16
54,5 |- 59,5 12
59,5 |- 64,5 7
64,5 |- 69,5 3
69,5 |- 74,5 1
Total 50
37
7. Durante o mês de setembro de certo ano, o número de acidentes por
dia em certo trecho de rodovia apresentou a seguinte estatística:
2 0 1 2 3 1 6 1 0 0
1 2 2 1 2 0 1 4 2 3
0 1 0 2 1 2 4 1 1 1
Classe ni fi
Uva 50 0,05
Cereja 40 0,04
Outras 10 0,01
Total 50 1,00
38
Tabela: Porcentagens da verba destinada a cada setor.
Administração 19
Educação 28
Saúde 30
Obras públicas 18
Segurança 5
Total 100,0
,14 ,77 ,16 19,99 ,12 ,25 ,30 ,14 ,14 ,25
,43 ,51 ,16 ,41 ,65 ,23 ,18 ,38 ,22 ,25
,18 ,38 ,25 ,49 ,35 ,25 ,40 ,29 ,27 ,62
,58 ,19 ,72 ,72 ,25 ,11 ,49 ,40 ,31 ,20
,16 ,48 ,64 ,18 ,52 ,60 ,53 ,60 19,95 ,40
39
11. Abaixo encontram-se os dados referentes ao número de dias em que
20 pacientes ficaram hospitalizados. Construa uma distribuição de
freqüências e um histograma de freqüências para esses dados usando
6 classes. Descreva a forma do histograma como simétrico, uniforme,
assimétrico negativo, assimétrico positivo.
6 9 7 14 4 5 6 8 4 11 10 6 8 6 5 7
6 6 3 11
40
CAPÍTULO 4: MEDIDAS RESUMO
4.1.2 Moda
41
4.1.3 Média
4 5 7 3 1
z= .0 + .1 + .2 + .3 + .5 = 1, 65
20 20 20 20 20
n1 x1 + ... + nk xk 1 k
x= = ∑ ni xi
n n i =1
42
k
x = ∑ f i xi
i =1
x n+1 n ímpar
2 ,
md ( X ) = x n + x n
2 2 +1
, n par
2
43
Tabela 16: Distribuição de frequências dos 36 empregados da seção de
orçamentos da Companhia Mb, segundo os salários.
mo( S ) ≈ 10,
10.6 + ... + 1.22
s≈ = 11, 22
36
Quando os dados são agrupados, para calcular a mediana utilizamos
regra de três. Veja:
med ( S ) − 8 12 − 8
=
22, 2% 33,3%
[med ( S ) − 8].33,3 = 4.22, 2
22, 2
med ( S ) = 8 + .4 = 10, 67
33,3
Dessa forma obtem-se uma aproximação para o valor da mediana.
Observe que no cálculo acima foi considerada a distância entre a mediana e
8. Outras regras de três poderão ser feitas e você obterá valores próximos
de 10,67 para a mediana. Por exemplo, pode-se considerar a distância entre
a mediana e 12, entre 4 (início do primeiro intervalo) e a mediana, entre a
mediana e 24 (fim do último intervalo, entre outros.
4.1.6 Separatrizes
44
medida de posição tal que 100p% das observações sejam menores que
q(p), sendo p uma proporção qualquer, 0<p<1. A mediana por exemplo, é
um quantil que deixa 50% das observações à sua esquerda, isto é, med =
q(0,5). Alguns quantis em particular recebem nomes específicos:
q(0,25): 1º Quartil = 25º Percentil
q(0,50): 2º Quartil = 50º Percentil = 5º Decil (Mediana)
q(0,75): 3º Quartil = 75º Percentil
q(0,40): 4º Decil
q(0,95): 95º Percentil.
xP − + xP +
q ( p) =
2
1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
1º Quartil:
• Posição: p.( n + 1) = 0, 25.(10 + 1) = 2, 75
xP − + xP + x +x 2 + 2,1
• Valor: q ( p) = ⇒ q(0, 25) = 2 3 = = 2, 05
2 2 2
2º Quartil(Mediana):
45
3º Quartil:
1º e 2º Percentis:
• Posição:
P1 : p.(n + 1) = 0, 01.(10 + 1) = 0,11
P2 : p.(n + 1) = 0, 02.(10 + 1) = 0, 22
• Valor:
q(0, 01) = x1 = 1,9
q(0, 02) = x1 = 1,9
• Posição:
P50 (mediana) : 5,5
P52 : p.(n + 1) = 0,52.(10 + 1) = 5, 72
• Valor:
x5 + x6 3 + 3,1
q (0,50) = = = 3, 05
2 2
x +x 3 + 3,1
q (0,52) = 5 6 = = 3, 05
2 2
• Posição:
P98 : p.(n + 1) = 0,98.(10 + 1) = 10,78
P99 : p.(n + 1) = 0,99.(10 + 1) = 10,89
• Valor:
q(0,98) = q(0,99) = x10 = 7, 7
46
4.1.7 Encontrando separatrizes para dados agrupados
q (0,50) − 8 12 − 8
=
22% 33%
33 22
[q (0,50) − 8]. = 4.
100 100
22
q (0,50) = 8 + .4 = 10, 67
33
Este valor (10,67) é mais preciso que o valor obtido utilizando-se o
ponto médio da classe (10), conforme feito anteriormente na seção 2.1.5.
Calculou-se também o primeiro quartil, q(0,25). Este valor corresponde
a 25% de área e, portanto, encontra-se na 1ª classe.
q (0, 25) − 4 8 − 4
=
25% 28%
25
q (0, 25) = 4 + .4 = 7,57
28
47
Exercício: calcule o terceiro quartil, q(0,75).
48
q (0,50) − 4 6 − 4
=
16% 25%
16
q (0,50) = 4 + .2 = 5, 28
25
O terceiro quartil, q(0,75), está na quarta classe, portanto,
q (0, 20) − 2 4 − 2
=
6% 20%
6
q (0, 20) = 2 + .2 = 2, 6
20
49
Figura 27: Distribuição simétrica: normal ou gaussiana.
84,7 < 92,4 < 101,8 < 102,3 < 116 < 119,4 < 129,8 < 135,8 < 151,6 < 187,7 <
201,5 < 210,9 < 224,6 < 556,9 < 988,8
50
Calculando-se os quantis, obtém-se(faça os cálculos!):
51
4.2 MEDIDAS DE DISPERSÃO
x = y = z =w=5
52
Figura 25: Representação gráfica dos dados de cada grupo.
A = xmax-xmín.
53
4.2.2 Variância
∑( x − x )
2
(x − x) + ( x2 − x ) + ... + ( xn − x )
i 2 2 2
var( X ) = i =1
= 1
n n
(3 − 5)2 + (4 − 5)2 + (5 − 5) 2 + (6 − 5) 2 + (7 − 5) 2
var( X ) = =2
5
(3 − 5) 2 + (5 − 5)2 + (5 − 5)2 + (7 − 5)2
var( Z ) = =2
4
Candidato Provas
1 2 3 4 5 6
A 7,0 7,5 8,0 8,0 8,5 9,0
B 6,0 7 8,0 8,0 9,0 10,0
C 7,5 8 8,0 8,0 8,0 8,5
∑( x − x )
2
i
s2 = i =1
n −1
Assim, tem-se:
54
• Candidato A:
1
x = (7 + 7,5 + 8 + 8 + 8,5 + 9) = 8
6
1
s 2 = ( 7 − 8 ) + ( 7,5 − 8) + ( 8 − 8 ) + (8 − 8) + (8,5 − 8) + ( 9 − 8) =
2 2 2 2 2 2
5
1 2,5
= ( −1) + ( −0,5) + ( 0 ) + ( 0 ) + ( 0,5) + (1) =
2 2 2 2 2 2
= 0,5
5 5
• Candidato B:
1
x = (6 + 7 + 8 + 8 + 9 + 10) = 8
6
1
s 2 = ( 6 − 8) + ( 7 − 8) + (8 − 8) + (8 − 8) + ( 9 − 8) + (10 − 8) =
2 2 2 2 2 2
5
1
= ( −1) + ( −0,5) + ( 0 ) + ( 0 ) + ( 0,5) + (1) = 2
2 2 2 2 2 2
5
1 n 2
∑ ( xi ) − n ( x )
2
s2 =
n − 1 i =1
1 n 1 n
2
∑ ( i ) ∑ i
2
s2 = x − x
n − 1 i =1 n i =1
∑( x )
2
i = 7 2 + 7,52 + 82 + 82 + 8,52 + 9 2 =
i =1
55
4.2.3 Desvio Padrão
4.( −1, 65)2 + 5.( −0, 65)2 + 7.(0,35)2 + 3.(1, 35) 2 + 1.(3,35)2
var( Z ) = = 1,528
20
dp ( Z ) = var( Z ) = 1,528 = 1, 24
s A2 = 0,5 ⇒ s = s A2 = 0,5 = 0, 71
sB2 = 2, 0 ⇒ s = sB2 = 2, 0 = 1, 41
sC2 = 0,1 ⇒ s = sC2 = 0,1 = 0,32
10.(6 − 11, 22) 2 + 12.(10 − 11, 22)2 + 8.(14 − 11, 22) 2 + 5.(18 − 11, 22) 2 + 1.(22 − 11, 22)2
Var ( S ) =
36
Todos os cálculos feitos anteriormente podem ser feitos mais
Var ( S ) = 19, 40
rapidamente utilizando-se uma calculadora científica com funções
dp ( S ) = 19, 40
estatísticas. = 4,saber
Para 4 como efetuar esses cálculos, por exemplo em
56
calculadoras dos modelos Casio fx82TL, 82MS e Sharp EL-546L3,
consulte
http://www.calculo.iq.unesp.br/PDF/FuncoesEstatiticaCalculadoraCien
tifica.pdf
s
CV = .100%
x
s 5
CVDOC = .100 = .100 = 22, 7%
x 22
s 100
CVMULTA = .100 = .100 = 12,5%
x 800
Perceba então, que estávamos concluindo erroneamente que a multa
é mais variável que o número de documentos falsificados, além de termos
cometido o disparate de comparar numericamente duas variáveis expressas
57
em unidades diferentes. Portanto, o número de documentos falsificados
apresentou maior dispersão do que a multa, já que seu coeficiente de
variação foi maior, mudando, assim, a conclusão anterior.
Tabela 19
Média Desvio padrão Coeficiente de
Variação
Altura 1,143m 0,063m 5,5%
Peso 50Kg 6Kg 12%
Tabela 20
Média Desvio padrão Coeficiente de
Variação
Recém 50 6 12%
Nascidos
Adolescentes 160 16 10%
58
1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
LS = q3 + 1,5d q
LI = q1 − 1,5dq
Os valores do conjunto de dados que se encontram entre os dois
limites são denominados valores adjacentes. Valores fora desses limites,
isto é, valores maiores que LS ou menores que LI, são denominados valores
discrepantes. Eles correspondem a pontos exteriores, observações
destoantes das demais que podem ou não ser o que se chama outliers ou
valores atípicos. Do ponto de vista estatístico um outlier pode ser um produto
de um erro de observação ou de arredondamento.
59
Figura 32: Construção do Box Plot ( Chiann, 2016).
142 145 150 163 163 165 165 165 166 167 168 168 169 169 169 170 170
172 173 173 173 174 174 177 178 179 180 181 181 183 183 184 198 204
205
Construir o diagrama em caixas e analisar os resultados.
Resolução:
60
1) Ordenar os dados: já estão ordenados.
2) Calcular Mediana, Quartis Inferior e Superior
Mediana (Md)
1º Quartil (q1)
3º Quartil: (q3)
Figura 33: Box-Plot para altura de homens adultos (Reis, 2016 (aula
07))
Na Figura 33 pode ser observada uma ligeira assimetria à direita, pois a
distância entre q3 e a mediana é maior que a distância entre q1 e a mediana,
61
a distância entre xn e a mediana (33) é maior que a distância entre x1 e a
mediana (30). Observa-se também a presença de valores discrepantes,
tanto acima quanto abaixo. No que se refere à dispersão, não há um padrão
para comparação.
62
desconsiderá-los e refazer os cálculos sem esses dois dados atípicos.
Nesse caso observa-se que:
• a distância entre q3 (47,5) e a mediana (39,5) é menor que a
distância entre q1 (29,5) e a mediana;
• a distância entre xn (x34 = 61) e a mediana é igual à distância
entre x1 e a mediana;
• a distância (13,5) entre xn e q3 é maior que a distância (11,5)
entre q1 e x1.
4.4TRANSFORMAÇÕES
x p , se p > 0
x( p) = ln( x), se p = 0
− x p , se p < 0
63
Figura 35: Histogramas para os dados Cd – Municípios transformados.
64
EXERCÍCIOS PROPOSTOS:
(Larson e Farber, 2010)
1. Os pontos médios por jogo marcados por cada time durante a temporada
regular de 2006.
65
a) O fabricante do carro A quer anunciar que seu carro teve o melhor
desempenho no teste. Que medida da tendência central – média,
moda ou mediana – deveria ser usada para essa afirmação? Explique.
b) O fabricante do carro B quer anunciar que seu carro teve o melhor
desempenho no teste. Que medida da tendência central – média,
moda ou mediana – deveria ser usada para essa afirmação? Explique.
c) O fabricante do carro C quer anunciar que seu carro teve o melhor
desempenho no teste. Que medida da tendência central – média,
moda ou mediana – deveria ser usada para essa afirmação? Explique.
44 51 11 90 76 36 64 37 43 72 53 62 36
74 51
72 37 28 38 61 47 63 36 41 22 37 51 46
85 13
10. Abaixo são apresentados os Box Plot para dois conjuntos de dados,
ambos com média de 165. Um tem desvio padrão de 16 e o outro de 24.
Qual é qual? Explique seu raciocínio.
66
11. Observe os gráficos a seguir:
(i) (ii)
(iii)
67
(i) (ii)
(iii)
14. A tabela seguinte mostra as alturas (em polegadas) e pesos (em libras)
dos membros de um time de basquete. Encontre o coeficiente de variação
para cada conjunto de dados. O que se pode concluir?
Alturas Pesos
72 180
74 168
68 225
76 201
74 189
69 192
72 197
79 162
70 174
69 171
77 185
73 210
68
15. Uma amostra dos salários anuais (em milhares de dólares) dos
funcionários de uma empresa é listada a seguir.
42 36 48 51 39 39 42 36 48 33 39 42 45
17. Encontre os três quartis e construa o Box Plot para os dados a seguir:
2 7 1 3 1 2 8 9 9 2 5 4 7 3 7 5 4
7 2 3 5 5
9 5 6 3 9 3 4 9 8 8 2 3 9 5
18. Os gols marcados por jogo por um time de futebol representam o primeiro
quartil para todos os times da liga. O que podemos concluir sobre os gols
marcados pelo time por jogo?
69
a) Qual a entrada mínima?
b) Qual a entrada máxima?
c) Identifique o primeiro, o segundo e o terceiro quartil.
d) Calcule a amplitude interquartil, isto é a distância interquartílica.
e) Avalie a distribuição dos dados quanto à simetria. Justifique sua
resposta.
20. O número de horas que uma amostra de 28 pessoas assiste televisão
diariamente e seu Box Plot, encontram-se abaixo.
2 4 1 5 7 2 5 4 4 2 3 6 4 3 5 2 0
3 5 9 4 5 2 1 3 6 7 2
70
b) Qual a porcentagem de pessoas que assistem mais do que 4 horas de
televisão por dia?
c) Se for selecionada uma pessoa aleatoriamente a partir da amostra,
qual é a probabilidade dessa pessoa assistir menos do que 2 horas de
televisão por dia? Escreva sua resposta em porcentagem.
d) Encontre o 4º decil, o 11º percentil e o 85º percentil.
71
REFERÊNCIAS:
72