Вы находитесь на странице: 1из 43

CAPÍTULO 1

ESTATÍSTICA DESCRITIVA

1. Dados históricos
Podemos considerar a Estatística como a ciência que se preocupa com a organização, descrição, análise
e interpretação dos dados experimentais.
Essa conceituação é absolutamente geral e engloba o conceito usual do que seja a Estatística. Esse
conceito usual e popular relaciona a Estatística com tabelas e gráficos nos quais os dados experimentalmente
obtidos são representados. Exemplos: Estatística do movimento da Bolsa de Valores; estatística da loteria
esportiva; estatística da Saúde Púbica: Crescimento do número de infectados pela gripe suína, acidentes de
transito com vítimas nas estradas Estaduais; estatística do crescimento da população nos estados; estatística
do movimento bancário; cheques devolvidos; cheques sem fundo; tabelas do campeonato de futebol; pesquisa
eleitoral, etc.

Essa noção refere-se apenas à parte de organização e descrição dos dados observados. Há ainda um
campo de atuação da ciência Estatística que é a análise e interpretação desses dados.

Desde a antiguidade observa-se a utilização da Estatística para descrever em números as condições


econômicas, na agricultura, na indústria e no comércio. Assim, se lê no livro sagrado de Confúcio (551 a.C. a
479 a.C.) (CHOUKING).
No quarto livro de Moisés, chamado NÚMEROS, Moisés faz o recenseamento de todas as tribos de
Israel, no deserto de Sinai, isso ocorreu após dois anos da saída do Egito (Cap. 1, vs. 1 a 46).
O imperador romano César Augusto ordenou o recenseamento em todo império romano no ano de
nascimento de Jesus. Portanto, podemos dizer que na antiguidade a Estatística preocupava-se com Registro dos
dados, é uma Estatística Administrativa, pois ela se interessava em contar o número de homens aptos para a
guerra e de produtos agropecuários.
A palavra estatística é derivada da palavra latina “STATUS”, com o significado de Estado, Governo,
atribuindo o significado “Ciência das coisas que pertencem ao Estado”.

Como disciplina autônoma ela aparece no século XVII na Alemanha, tendo como objeto a descrição das
coisas notáveis do estado. Para essa autonomia muito contribuiu o alemão Herman Conring (1606-1681)
introduzindo a estatística com disciplina na Universidade de Helmstadt. Na Inglaterra surgem os chamados
Aritméticos políticos, denominação atribuída a William Petty, aos que tinham interesse especial pelas tabelas de
mortalidades em virtude de suas aplicações nos seguros de vida.

Na França desenvolve-se a partir do século XVII, o cálculo de probabilidades como disciplina científica.
Sua origem atribui-se a questões postas a Blaise Pascal (1623-1662) por Cavaleiro de Nére, para alguns autores
1
jogador inveterado, para outros um filósofo e homem de letras. Mas a maior contribuição aparece nas cartas
entre Pascal e Pierre Fermat (1601-1665) em que ambos chegam a uma solução correta do problema dos jogos
de azar.

Foi Jacques Bernoulli (1654-1705) que aperfeiçoou a teoria das probabilidades escrevendo a sua grande
obra “Ars Conjectandi”, publicada oito anos após sua morte. Pode-se dizer que foi devido as contribuições de
Bernoulli que o cálculo de probabilidades adquiriu o estatus de ciência.

São fundamentais as contribuições de Pierre Laplace (1749-1827) com as publicações da “Teoria


Analítica da Probabilidade” e a definição clássica da probabilidade (Quociente entre o número de casos
favoráveis e o número de casos possíveis). Gauss (1777-1855) apresentou em 1809 a “Theoria Combinationis
Observatorium Erroribus Minimis Obnoxia” que mostra uma teoria sobre a análise de observações, que pode ser
aplicável a qualquer ramo da ciência.

Podemos citar outros grandes estatísticos como: Francis Galton (1822-1911) da escola de estatística
inglesa que criou a teoria da regressão linear. Karl Pearson (1857-1936) físico matemático dedicou-se a teoria
da correlação. Ronald Aylmer Fisher, suas contribuições para a moderna estatística são as mais importantes de
todas, sendo a figura de maior destaque de todos os tempos, desenvolveu e estruturou de forma rigorosa a
Teoria da Inferência Estatística. William S. Gosset, com pseudônimo de “Student”, devido ao fato de trabalhar
para uma fábrica de cerveja , desenvolveu em 1908 a Teoria da Amostragem

Assim, podemos dizer que a estatística atual passou a ter um caráter mais científico, deixou de ser uma
simples técnica de coleta de dados e de apresentação de dados, para se tornar um ramo de conhecimento
humano que procura tirar conclusões a partir de fatos numéricos de observação.

São muitas as definições de Estatística, citamos aqui algumas:

 A Estatística é a parte da Matemática Aplicada que se preocupa em obter conclusões a partir de


dados observados”. (Rui Aguiar da Silva Leme).
 A Estatística é o estudo numérico dos fatos sociais”. (Levasser)
 Conjunto de processos que tem por objetivo a observação, a classificação formal e a análise dos
fenômenos coletivos ou de massa e, por fim, a indução das leis a que tais fenômenos obedecem
globalmente”. (Milton da Silva Rodrigues)
 É um ramo da Matemática Aplicada e pode ser considerada como a Matemática Aplicada a
dados observados” (R. A. Fisher)
 A Estatística é a coleta, apresentação, análise e interpretação de dados numéricos”. (Croxton e
Cowden)

2
Assim, podemos concluir que a Estatística é ciência, quando estuda populações e é método, quando
serve de instrumento a uma outra ciência.

Existem três ramos da estatística:

 A estatística descritiva;
 O cálculo das probabilidades e
 Inferência estatística.
É importante enfatizar que a estatística descritiva e as probabilidades são ferramentas para a inferência
estatística. A inferência estatística é interpretada de duas maneiras:
 ou fazendo uma estimação a respeito de uma característica da população cujo o valor se desconhece;
 ou realizando um teste sobre essa característica, da qual se afirma ter um determinado valor.
São três áreas de interesses para a estatística:

a) descrição e resumo de dados,

b) teoria da probabilidade e

c) análise e interpretação de dados.

Essas três áreas da estatística não são separadas ou distintas, ao contrário, elas tendem a se entrelaçar.

2. Ramos da Estatística

2.1. Estatística descritiva


A palavra estatística lembra sempre: taxas mensais de acidentes, índices de mortalidade infantil por
estados, consumo de combustível por quilômetro rodado, etc. Essa parte da estatística que utiliza números para
descrever fatos é chamada estatística descritiva.
Estatística descritiva: compreende a organização de dados, resumo e em geral, a simplificação de
informações que podem ser muito complexas.
2.2. Probabilidade
O conhecimento das probabilidades associadas a uma situação fornece a base para o desenvolvimento
das técnicas de tomada de decisão, explica o funcionamento dessas técnicas e indica de que modo as conclusões
podem ser apresentadas e interpretadas corretamente.

2.3. Inferência estatística


É quando se generaliza para a população, aquilo que se observa na amostra.
A palavra inferência é utilizada em Estatística com dois significados:
 conclusões tiradas a partir de valores ou de evidências;
 processo utilizado para se chegar a essas conclusões.

3. População – Amostra

Se a estatística se preocupa com registro de fatos, então a população tem o significado de conjunto dos
habitantes de uma determinada região. Modernamente população é qualquer coleção de objetos, seres ou entes
que apresentam pelo menos uma característica em comum.
3
Exemplos 1:
 Vazão do rio Tietê de 1940 a 2010;
 Acidentes da Via Dutra de 2000 a 2010;
 Inflação brasileira de 1995 a 2010;
 Notas de Matemática dos alunos do curso de Administração de Empresas.

A população pode ter um número finito de elementos ou ter um número ilimitado, isto é, população
infinita.

Quando se estuda uma população com um número muito grande de elementos, somos obrigados a
examinar uma parte, a amostra.

Entendemos por amostra, parte da população retirada segundo uma regra conveniente, probabilística ou
aleatória. A amostra é sempre finita.
A seguir mostramos um exemplo de fenômeno aleatório. A figura que se segue mostra esferas de mesmo
diâmetro, caindo de um reservatório superior e passando por uma série de obstáculos, que em cada obstáculo a
probabilidade da esfera se desviar para a esquerda ou para a direita é ½ . As esferas são colhidas em reservatório
abaixo e observa-se que elas se acumulam na parte central e tornam-se mais raras nas extremidades.

O gráfico observado tem a forma de um sino, com a boca voltada para baixo. A essa distribuição
denominamos de Distribuição Normal ou de Gauss. (Figura 1)

Figura 1

4
Exemplos de retirada de amostras de uma população, por meio da tabela de números aleatórios.
Exemplo 2:
Um candidato a prefeito de uma Capital contrata uma empresa de pesquisa de dados, para avaliar sua
posição, entre os candidatos, a quinze dias das eleições. Sabemos que a população da Capital é formada por
milhões de eleitores e como o órgão de pesquisa trabalha com tempo e recursos econômicos limitados, ele não
estuda individualmente todos os eleitores do município e sim uma amostra, que deve ser
retirada convenientemente da população e que apresente as mesmas informações da população. Assim, se o
candidato A é o preferido por 40% dos eleitores da amostra, isso equivale a ser também o preferido por 40% da
população. Para essa pesquisa, os eleitores são consultados aleatoriamente por meio de sorteios de bairros,
ruas, casas e classes sociais A, B, C, D e E. Para retirar uma amostra de uma população aleatoriamente, usamos
a tábua de números Aleatórios ou Randômicos, a expressão números Randômicos provém da palavra inglesa
random que significa “casual, aleatório”. A tabela 1 é parte de uma tabela de números aleatórios.
Tabela 1 TABELA DE NÚMEROS ALEATÓRIOS

575 862 053 359 191 045 078 892 944 508 844 129

063 558 334 157 151 189 770 246 377 362 560 634

666 181 029 348 396 735 984 632 383 737 532 259

387 297 267 470 545 549 719 531 099 784 959 438

716 262 928 273 326 161 742 884 879 184 627 953

931 443 459 268 505 364 789 838 178 892 645 618

087 370 911 952 595 863 589 024 276 605 317 913

285 852 975 574 503 355 339 907 655 998 807 058

283 133 568 029 147 973 759 205 690 763 953 361

919 386 487 101 360 500 001 045 364 436 862 234

374 415 513 773 874 046 443 549 905 554 962 432

903 090 386 175 422 490 435 185 447 429 756 170

813 435 050 845 473 381 242 597 581 435 931 122

845 507 797 223 001 740 233 067 235 969 218 915

102 184 165 787 207 250 416 874 144 175 850 230

5
092 829 185 336 538 837 596 690 702 096 328 284

737 467 011 721 389 114 950 528 794 431 632 741

076 069 066 346 180 043 526 035 712 099 962 866

292 571 795 223 885 774 366 679 414 386 928 425

052 614 848 560 449 017 870 690 721 335 499 249

Exemplo 3:
O professor de Educação Física do curso de Administração faz uma pesquisa para estudar as alturas de
seus alunos do sexo masculino, envolvendo 999 alunos e deseja retirar uma amostra de 100 alunos seguindo a
tabela de números aleatórios.
Para construirmos essa amostra, podemos numerar os 999 alunos, atribuindo a cada aluno um número de
três dígitos como os da sequência: 001, 002, 003, ... , 998 e 999. Para a escolha dos 100 elementos dentre os
999 alunos, podemos iniciar a consulta à tabela dos números aleatórios a partir de qualquer número da tabela
randômica, por exemplo: tomamos três a três os números a partir do número 884 que está na quinta linha e na
oitava coluna, e em seguida tomamos a medida da altura dos alunos cujos números são: 879; 184; 627; 953;
931; 443;..., até o encontrarmos o centésimo aluno. Assim, retiramos de uma população de 999 elementos uma
amostra de 100 elementos, de maneira aleatória, por meio da tabela de números randômicos. Se a população é
maior ou menor que 999 elementos, desenvolvemos um novo processo para a retirada da amostra.
Exemplo 4:
Retirar da população da tabela 2 uma amostra de 100 elementos, por meio de amostragem simples ao
acaso, consultando a tabela 1 de números aleatórios. Por exemplo, inicie a retirada dos números começando
pelo número aleatório da tabela, localizado na sexta linha, primeira coluna, número (931) em seguida 443 e
sempre três a três.
Tabela 2
8,8 15,6 15,3 12,7 5,9 3,3 3,5 7,2 16,7 14,7

7,7 13,4 15,5 14,5 7,0 10,8 11,8 2,7 3,8 9,0

11,6 9,5 8,6 7,0 7,5 10,9 7,2 9,5 8,4 12,9

14,9 4,1 13,1 10,6 17,0 4,2 3,8 10,6 4,5 11,8

6,4 8,4 7,3 13,1 16,5 5,5 15,3 13,7 9,7 11,5

11,2 9,6 8,8 11,7 3,1 6,5 1,9 6,9 10,2 8,3

16,0 7,5 8,6 9,0 6,9 12,4 6,4 11,9 3,5 5,1

16,6 6,1 8,7 3,9 11,2 8,5 9,4 5,7 12,4 11,6

9,2 10,9 8,4 3,8 7,6 2,2 10,0 2,7 6,9 8,5

6
12,9 8,1 9,4 7,8 17,0 12,1 9,4 4,7 9,0 11,2

13,8 16,4 14,3 5,9 9,8 9,8 7,7 8,7 6,8 10,7

9,1 5,1 16,7 6,2 14,4 14,0 9,8 10,5 9,3 7,8

12,3 13,2 6,5 4,1 11,8 5,3 14,4 10,9 14,2 7,2

10,0 14,1 8,6 7,9 6,8 14,7 12,2 10,0 2,0 3,5

5,5 13,1 15,1 5,1 10,6 8,3 6,3 12,2 15,1 5,5

14,0 7,6 16,6 2,6 8,4 5,7 9,9 9,9 9,0 13,7

16,6 6,3 3,2 10,8 5,8 3,7 14,0 11,3 16,8 9,7

8,7 6,4 8,1 10,7 8,3 10,2 11,7 7,9 11,8 10,5

11,2 5,9 5,2 15,7 10,2 2,2 10,7 9,0 4,7 10,3

2,8 11,4 11,1 3,0 7,9 12,0 6,9 12,2 14,0 9,8

Resolução:
Os números aleatórios na tabela 1 foram colocados de três em três algarismos para facilitar nossa
visualização. No exemplo 3 a tabela 2 é formada por 200 números. Devemos transformar essa tabela 2 em 1000
números para corresponder aos elementos da tabela de números randômicos. Para isso adotamos que cada
número dado na tabela 2 seja considerado como 5 números iguais. Por exemplo, o primeiro número da tabela é
8,8 deve ser considerado como 8,8 – 8,8 – 8,8 – 8,8 – 8,8. Dessa forma passaremos a ter 1000 números. A
tabela a seguir indica esses números.

De 01-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50

0 8,8 15,6 15,3 12,7 5,9 3,3 3,5 7,2 16,7 14,7

50 7,7 13,4 15,5 14,5 7,0 10,8 11,8 2,7 3,8 9,0

100 11,6 9,5 8,6 7,0 7,5 10,9 7,2 9,5 8,4 12,9

150 14,9 4,1 13,1 10,6 17,0 4,2 3,8 10,6 4,5 11,8

200 6,4 8,4 7,3 13,1 16,5 5,5 15,3 13,7 9,7 11,5

250 11,2 9,6 8,8 11,7 3,1 6,5 1,9 6,9 10,2 8,3

300 16,0 7,5 8,6 9,0 6,9 12,4 6,4 11,9 3,5 5,1

350 16,6 6,1 8,7 3,9 11,2 8,5 9,4 5,7 12,4 11,6

400 9,2 10,9 8,4 3,8 7,6 2,2 10,0 2,7 6,9 8,5

450 12,9 8,1 9,4 7,8 17,0 12,1 9,4 4,7 9,0 11,2

7
500 13,8 16,4 14,3 5,9 9,8 9,8 7,7 8,7 6,8 10,7

550 9,1 5,1 16,7 6,2 14,4 14,0 9,8 10,5 9,3 7,8

600 12,3 13,2 6,5 4,1 11,8 5,3 14,4 10,9 14,2 7,2

650 10,0 14,1 8,6 7,9 6,8 14,7 12,2 10,0 2,0 3,5

700 5,5 13,1 15,1 5,1 10,6 8,3 6,3 12,2 15,1 5,5

750 14,0 7,6 16,6 2,6 8,4 5,7 9,9 9,9 9,0 13,7

800 16,6 6,3 3,2 10,8 5,8 3,7 14,0 11,3 16,8 9,7

850 8,7 6,4 8,1 10,7 8,3 10,2 11,7 7,9 11,8 10,5

900 11,2 5,9 5,2 15,7 10,2 2,2 10,7 9,0 4,7 10,3

950 2,8 11,4 11,1 3,0 7,9 12,0 6,9 12,2 14,0 9,8

Portanto, os 100 números retirados aleatoriamente são os dados brutos.

10,7 6,9 8,1 11,7 13,8 8,7 9,9 11,3 4,2 11,8
14,2 4,1 2,7 9,0 5,2 2,8 6,8 8,1 10,5 5,9
6,5 12,3 9,0 5,2 1,9 8,7 7,9 14,4 13,8 16,6
11,9 5,9 10,0 9,8 6,3 13,4 1,9 7,2 6,2 3,3
12,9 7,9 7,6 6,4 10,0 16,6 2,8 8,6 15,7 5,7
4,7 11,6 6,1 11,2 8,8 16,7 8,7 2,7 3,2 15,3
11,9 8,4 14,3 8,3 14,7 9,0 10,7 11,2 9,1 11,1
10,0 11,2 2,7 11,9 17,0 7,6 4,7 17,0 3,8 8,5
2,2 7,6 10,6 3,2 10,0 14,7 16,8 17,0 9,4 9,7
7,8 9,8 10,0 10,7 7,5 16,8 5,1 13,7 16,5 8,4

4. Tipos de Variáveis
Em Estatística variável é uma atribuição de um número a cada característica da unidade de observação,
ou seja, é uma função matemática definida na população.

As variáveis são classificadas como qualitativas e quantitativas.


4.1 Qualitativa

Quando uma característica ou variável é não numérica, denomina-se variável qualitativa ou atributo.
Exemplo 5: São variáveis qualitativas: sexo, religião, naturalidade, cor dos olhos e faixa etária.

8
4.2 Quantitativa

Quando uma característica ou uma variável é numérica, denomina-se variável quantitativa.


As variáveis quantitativas se classificam em dois grupos:

4.2.1. Variáveis discretas

a) As variáveis quantitativas discretas, cujos possíveis valores formam um conjunto finito ou


enumerável de números que resultam frequentemente de contagem.
Exemplo 6:
a) Quantidade de alunos de uma disciplina.
b) Quantidade de apartamentos de um prédio.
c) O número de crianças em uma família.

4.2.2. Variáveis contínuas


As variáveis cujos valores pertencem a um intervalo de números reais e que resultam frequentemente
de medidas, são denominadas variáveis quantitativas contínuas.
Exemplo 7:
a) Tempo de duração das provas de matemática.
b) Tempo duração de baterias de carros.
c) As alturas dos alunos de uma classe do Curso de Estatística.
Nas Variáveis contínuas quando feitas por medidas, por exemplo, as alturas dos alunos, e dependendo
da unidade de medida podemos obter 1,65 m, ou 165,2cm ou 1652,7mm conforme a precisão da medida.

4.3. Níveis de mensuração e escalas de mensuração


São quatro os níveis de mensuração: Nominal, ordinal, intervalar e de razão.
1) Escala nominal de mensuração envolve simplesmente o ato de nomear ou rotular, não esta explícito nenhum
tipo de classificação.
Exemplo 8:
a) Possui computador: sim ___ não____.
b) Sexo: masculino ____ feminino ____.
c) Religião: católica ____ crente _____.
d) Estado civil: casado ____ solteiro___.
2) Escala ordinal de mensuração ocorre quando se procura ordenar seus elementos ou classificar.
Exemplo 9:
a) Classificação sócio econômica: Classe baixa, classe média e classe alta.
b) Satisfação de um produto: Insatisfeito, satisfeito e muito satisfeito.
c) Classificação docente: Assistente e titular.
3) Escala intervalar consiste numa escala ordenada a qual podemos afirmar se uma medida é igual ou diferente,
maior e quanto maior que outra, mas não tem origem.

9
Exemplo 10:
a) Temperatura de um indivíduo: [36C°, 40C°].
b) Temperatura da cidade de São Paulo: [12C° a 30C°].

4) Escala de razão é uma escala ordenada que envolve medidas nessa escala. Se for medida em cm tem-se o 0
(zero) como origem e a unidade 1 cm. Tem origem fixa.
Exemplo 11:
a) Altura dos alunos em cm.
b) Peso dos alunos em Kg.
c) Idade em anos.
d) Salários dos funcionários da faculdade.

5. Distribuições de frequência na variável discreta

5.1. Dados brutos

Dados brutos são aqueles que ainda não foram numericamente organizados. Um exemplo é o conjunto
das alturas de 100 estudantes do sexo masculino, tirado de uma lista alfabética do registro de alunos de uma
Faculdade.

5.2. Rol

Um rol é um arranjo numérico bruto em ordem crescente ou decrescente de grandeza. A diferença entre
o maior e o menor número do rol chama-se amplitude total dos dados. Por exemplo, se a maior altura dos 100
estudantes do sexo masculino é 188 cm e a menor 152 cm, a amplitude total será de R = 36 cm.

5.3. Distribuição de frequência

Uma vez coletados os dados, é comum ordená-los, dando origem ao rol. A tabulação desses dados junto
com as frequências correspondentes obtém-se a chamada distribuição de frequências.
Exemplo 12: A tabela que segue é um exemplo de distribuição de frequência discreta.

xi fi
18 8
xi :
Idade dos alunos que cursam a disciplina de
19 10
estatística
20 7
21 5
f i : número de alunos com a respectiva idade
22 4

10
5.3. Frequência absoluta
Frequência absoluta de uma variável xi é o numero total de dados que se repete em xi e representamos
por f i .

5.4. Frequência relativa


Frequência relativa é a razão entre cada frequência absoluta f i e o total n das frequências absolutas.
fi
fr  com i  1, 2,3,..., n .
n

5.5. Frequência acumulada


Colocando-se os valores em ordem crescente da variável xi , obtém-se a frequência acumulada
adicionando-se as frequências absolutas dos valores anteriores.
Tomando os valores do quadro anterior, podemos escrever

xi fi fr f ac

18 8 8/34=0,235 8
19 10 10/34=0,294 18
20 7 7/34=0,205 25
21 5 5/34=0,147 30
22 4 4/34=0,117 34

Total 34 1

5.6. Gráfico de frequências


Seguem os gráficos correspondentes aos dados da tabela.
Gráfico da frequência absoluta Gráfico da frequência acumulada

10 f i 35 f
ac
9 30
8
25
7
6 20
5
4 15
3 10
2
1 5
xi xi
0 18 19 20 21 22 0 18 19 20 21 22

11
6. Medidas de tendência central

A média é um valor típico ou representativo de um conjunto de dados. Como esses valores típicos
tendem a se localizar em um ponto central de um conjunto de dados ordenados segundo suas grandezas, as
medidas também são denominadas medidas da tendência central.
Vários tipos de médias podem ser definidos: a média, a média geométrica e a média harmônica, sendo a
mais comum a média aritmética ou, abreviadamente média. Cada uma delas apresenta vantagens e
desvantagens, dependendo dos dados e dos fins desejados.

6.1. Média Aritmética

Situação-problema:
Um professor de matemática aplicou sua prova bimestral a 20 alunos e no momento da entrega das
provas pelos alunos, as corrigia, não comunicando as notas para que não houvesse tumulto. Durante a
correção foi anotando ao lado as notas e na saída da sala disse a todos que a média obtida pela classe era 6.
Levou para casa as provas e as perdeu.
a) Como deve o professor atribuir as notas de cada aluno?
b) O professor recuperou as notas que foram dadas:

6 5 6 4 6 5 7 6 6 7
7 6 5 7 8 4 6 5 8 6
Com as notas recuperadas determine a média aritmética.
Resposta:
a) Se o professor perdeu as provas, mas conhece a média, deve atribuir a média 6 para todos os
alunos, pois, podemos observar que a soma de todas as notas da tabela é igual a soma de 20 notas de valor 6.
Assim

6+5+6+4+6+...+8+6 = 6+6+6+6+6+...+6+6 ou ainda


120
120  20  6  6 
20
b) Para definir média devemos ter o conceito de somatório

Escrevemos uma soma da seguinte maneira:


n
 xi  x1  x2  x3  ...... xn
i =1

Exemplo 13: Sendo x1  1, x2  3, x3  7 , x4  5, x5  10


5
Calcular a)  x i
i=1
5
b)  x i
2
i =1

12
Solução:
5
a)  xi  1  3  7  5  10  26
i=1

5
b)  xi  1  3  7  5  10  1  9  49  25  100  184
2 2 2 2 2 2
i =1

Exercícios de aplicação 01:


1) Verifique se as igualdades são verdadeiras.
3
a)  ( k  7 ) = 42
2
k o

4 i
b)  = 29/6
i 2 i  1

2
c)  ( j  j  1 ) = 6
2
j 1

2) Sejam os valores de x i e f i dados pela tabela

x 1 2 3 4 5 6 7 Determinar:
7
fi 2 3 5 7 4 3 1 7
a) x
i = 1
i b) f
i =1
i

A resolução é mais simples se montamos a tabela na forma indicada e na última linha colocamos a soma
das colunas.
xi fi

1 2
2 3
3 5
4 7
5 4
6 3
7 1
 28 25

7 7
a) x
i = 1
i  b) 
i = 1
fi 

13
Definição de média aritmética

Média Aritmética, ou média, de um conjunto de n números x1 , x2 ,...., xn é representada por x (leia-se “x


n

  ...  x n x
xx x
i
barra”) e é definida por: 1 2
 i 1
n n

Exemplo 14:
Sejam as notas obtidas por um aluno de matemática
x1  4 , x2  6 , x3  5, x4  9 , achar a média x . Então a média é dada por
4

x i
x1  x2  x3  x4 4  6  5  9 24
x  i = 1
   6
n n 4 4
Se x i apresentar elementos repetidos, então a média aritmética dos valores de x é dada por:
n

x f i i
x  i 1
ou por comodidade, deixaremos de colocar os índices do somatório se
n
escrevemos:

x
x i fi
n
Voltando ao item b) do nosso problema, segue a tabela de notas dos alunos

xi fi xi fi
4 2 8
5 4 20
6 8 48
7 4 28
8 2 16
 20 120

x
x i fi
=
120
 6 . Portanto, a média aritmética é 6.
n 20

6.2. Média Aritmética Ponderada

Se os números ocorrem f1, f2, f3, ..., fn vezes, respectivamente, isto é, ocorrem para cada número uma
frequência f1, f2, f3, .......fn , a média aritmética será definida por:

x
x i fi
n
Exemplo 15:
Se o exame final de um curso tem-se peso 3 e as 2 provas mensais peso 1, um estudante que obteve 70 e
90 pontos nas provas e 85 no exame final tem média:
14
1 .  70   1 .  90   3 . 85
x  83 pontos.
11 3

Exercícios de aplicação 02:

Calcular a média aritmética simples ou ponderada.

1) Notas na disciplina de Economia.


3; 5; 7; 6; 4; 2; 5; 2; 4; 5; 7; 6; 4; 6; 2; 3; 7 e 5.

2) Notas na disciplina de estatística.


1; 2; 3; 4; 5; 6; 7 e 8.

3) Medidas de diâmetros de parafusos.


1,2; 1,4; 1,4; 1,4; 1,6; 1,6; 1,6; 1,6; 1,6; 1,8; 1,8; 1,8; 1,8; 2 e 2.

6.3. Mediana - Md(X)


A mediana de um conjunto de números, ordenados em ordem crescente é o valor central.
Exemplo 16:
O conjunto dos números 3,4,4,5,6,8,8,8,10 tem mediana Md(X) = 6, pois, ocupa a 5ª posição.
n 1
Se o número de observações é ímpar, então para localizar a mediana é só aplicar a fórmula ,
2
n 1
portanto Md(X) é o elemento que ocupa a posição .
2
Se o número de observações é par, então a mediana ocupa dois elementos centrais: Md1(X) é o
n n
elemento que ocupa a posição e Md2(X) é o elemento que ocupa a posição  1 . Uma vez obtidos esses
2 2
valores, a mediana é definida como a média aritmética
Md1  Md 2
Md (X)=
2
Exemplo 17: No conjunto dos números 5,5,7,9,11,12,15,18 determinar a mediana.
n 8 n 8
Como n é par procuramos os elementos que ocupam a posição   4º e  1   1  5º . Assim, a
2 2 2 2
mediana é definida por:
9  11
Md(X) =  10
2
6.4. Moda - Mo(X)
A moda é o valor que ocorre com maior frequência na distribuição.
No exemplo 17 acima 5 representa a moda
15
6.5. Separatrizes
Separatriz de um conjunto de dados ordenados em ordem crescente ou (decrescente) é o elemento da
série dos dados que divide em partes.

As principais separatrizes são: A mediana, os quartis, os decis e os percentis.

Os quartis, decis e percentis são as separatrizes que dividem a série respectivamente em quatro, dez e
cem partes iguais.
A mediana é uma separatriz que divide a série em duas partes iguais.
Quartis divide a série em quatro partes iguais e são representados por Q1 , Q2 e Q3 , sendo
denominados, respectivamente, primeiro, segundo e terceiro quartil, sendo o valor Q2 = md(X).
Decis. Semelhantemente, os valores que dividem a série de dados em dez partes iguais denominam-se
decis e são representados por D1 , D2 ,..., D9
Percentis. Da mesma forma como estudamos mediana, quartis e decis, os valores que dividem a série
em 100 partes iguais denominam-se percentis e são representados por P1 , P2 ,..., P99 .

Notação:
Quando escrevemos p(Qi ) indicamos a posição do quartil Qi .
Quando escrevemos p( Di ) indicamos a posição do centil Di .
Quando escrevemos p( Pi ) indicamos a posição do percentil Pi .

Exemplo 18:
Determinar os quartis para a amostra A: 6, 8, 4, 3, 9, 8, 5, 4, 7, 5, 8, 2, 7, 8 e 4.
Colocando os valores da amostra em ordem crescente, tem-se:

2 3 4 4 4 5 5 6 7 7 8 8 8 8 9
1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º 12º 13º 14º 15º

O número de elementos n é ímpar, logo


15  1
Primeiro quartil é o elemento que ocupa a posição p(Q1 )  .1 = 4º elemento, portanto, Q1  4 .
4
15  1
Segundo quartil é o elemento que ocupa a posição p(Q2 )  .2 = 8º elemento, portanto, Q2  6  md ( X ) .
4
15  1
Terceiro quartil é o elemento que ocupa a posição p(Q3 )  .3 = 12º elemento, portanto, Q3  8 .
4

Decis.
Para determinarmos o decil quando n é ímpar devemos utilizar o seguinte procedimento.
O i-ésimo decil ocupa a posição:

(n  1) (n  1)
p( Di ) = . i , assim o 7º decil ocupa a posição p( Di ) = .7
10 10

16
Exemplo 19:
A tabela apresenta uma amostra de 36 elementos. Determinar
a) Mediana. b) Quartis.

c) 4ºDecil.
Mediana: como n =36 (par) temos dois valores centrais
Da tabela escrevemos 18º sendo Md1 ( X )  9,05 e 19º como Md2 ( X )  9,05 ,
xi fi fac logo, a mediana é Md ( X )  9,05 .
5,01 4 4 36
7,03 7 11 Quartil: p(Q1 )  .1  9º e 10º elementos, logo Q1  7,03
4
9,05 11 22 36
p(Q2 )  .2  18º e 19º elementos, logo, Q2  9,05
11,07 8 30 4
13,09 6 36 36
p(Q3 )  .3  27º e 28ºelementos, logo, Q3  11,07
 36 4
36
Decil: p( D4 )  .4  14, 4  14º e 15º elementos, logo,
10
D  9,05
4
Observação: De maneira análoga são obtidas as soluções para os percentis.

7. Medidas de dispersão

Quando propusemos substituir todas as notas perdidas pelo professor pela nota (média) x  6 , os alunos
cujas notas eram superiores à média 6 reclamaram, porém, os de notas inferiores não. Na ótica do professor
atribuir nota 6 a todos os alunos não mostra a performam-se da turma, pois todos recebem a mesma nota, mas
ao atribuir as notas verdadeiras se observa a variabilidade da turma.
Estudemos a variabilidade para as amostras:

Amostra A: 2,3,4,8,9,10 com seis elementos e tem média x  6

Amostra B: 5,5,6,6,7,7 com seis elementos e tem média x  6 .

Adotando a média como o valor mais representativo da distribuição, observamos que os valores da amostra
A estão mais dispersos em relação à média, enquanto a amostra B os valores estão mais próximos da média. As
medidas que avaliam dispersão são denominadas de desvios.

7.1. Desvio médio: dm(X)

Definimos desvio com o resultado da diferença entre o valor de cada observação e o valor da média.
Observações:
1) A soma dos desvios calculados em relação à media é sempre igual a zero, isto é,
 ( xi  x )  0

17
2) Como a soma é sempre nula, tomamos cada parcela da soma em módulo e definimos desvio médio da
amostra em relação à média por:

dm( X ) 
 | xi  x | fi
n

7.2. Variância ou desvio quadrático médio da amostra

Outra maneira para calcular o desvio é elevar ao quadrado, cada uma de suas parcelas, pois, teremos
também soma diferente de zero, dessa maneira definimos desvio quadrático médio ou variância por:

V ar( X ) 
 (x i  x )2 fi
n
7.3. Desvio padrão da amostra

Sendo a variância uma medida de dimensão igual ao quadrado da dimensão dos dados, isso pode causar
problemas de interpretação, portanto, costuma-se usar o desvio padrão que é definido como raiz quadrada da
variância. Costuma-se utilizar dois tipos de desvios padrões:

a) Desvio padrão da amostra: s( X )  V ar( X ) 


 (x i  x )2 fi
n

b) Desvio padrão da amostra: dp(X)= V ar( X ) 


 (x i  x )2 fi
(Essa definição é a mais usada)
n 1
Observação: Para valores de n grandes é indiferente o uso de uma ou outra fórmula.

Exemplo 20: Dar as medidas de tendência central e as de dispersão para as amostras A e B.


Seguem os valores para a tabela A.

xi fi xi fi | xi  x | | x i  x | fi ( xi  x )2 fi

2 1 2 4 4 16
3 1 3 3 3 9
4 1 4 2 2 4
8 1 8 2 2 4
9 1 9 3 3 9
10 1 10 4 4 16

 6 36 18 58

Com o uso das fórmulas dadas calculamos os valores desejados:

18
a) Média: x 
x f i i

36
6
n 6

b) Desvio médio: dm( X ) 


| x  x | f
i i

18
3
n 6

c) Desvio quadrático médio ou variância da amostra

V ar( X ) 
 (x i  x )2 fi

58
 11, 6
n 1 5
d) Desvio padrão da amostra

dp(X)= V ar( X ) 
 (x i  x )2 fi
 11,6  3, 40587
n 1
Para a amostra B, tem-se:
xi fi xi fi | xi  x | | x i  x | fi | x i  x | 2 fi
5 2 10 1 2 2
6 2 12 0 0 0
7 2 14 1 2 2

 6 36 4 4

Como fizemos para a amostra A, calculamos com o uso das fórmulas os valores:

a) Média:

x
x f i i

36
 6 , logo, se vê que a média das duas amostras são iguais.
n 6

b) Desvio médio

dm( X ) 
| x  x | f i i

4
 0, 7 , valor bem menor que da amostra A igual a 3
n 6
c) Desvio quadrático médio ou variância da amostra

var( X ) 
 (x i  x )2 fi

4
 0,8
n 1 5
d)Desvio padrão da amostra

19
S ( X )  V ar( X ) 
 (xi  x )2 fi
 0,8  0,894 .
n 1
Conclusão:
Os valores obtidos pelo desvio padrão são: da amostra A, ( S ( X )  3, 40587 ) e da amostra B,
( S ( X )  0,894 ). Assim concluímos que a amostra A tem maior dispersão que a amostra B, isto é, os
valores da amostra B estão mais próximos da média.

8. Coeficiente de Variação de Pearson

dp( X ) desvio padrão


Mede a dispersão dos dados em relação à média e é dado por: CV  =
x média
A maior utilidade do coeficiente de variação é permitir a comparação da variabilidade de diferentes
distribuições. Se o valor obtido for menor que 20%, dizemos que a distribuição pode ser considerada
homogênea.
Se CV  15% tem-se baixa dispersão

Se 15%  CV  30% tem-se média dispersão

Se CV  30% tem-se elevada dispersão

Exemplo 21:
dp( X ) 3, 40587
Para a amostra A, segue CV  =  0,5676  56%
x 6
dp( X ) 0,894
Para a amostra B, segue CV  =  0,149  15% , o que mostra que B é mais homogênea
x 6
que A.

Exemplos usando a distribuição de frequência na Variável Discreta

Exemplo 22:
Após a coleta de dados de uma amostra obteve-se a tabela, determinar as medidas de tendência central e as de
dispersão.
a) Média
b) Moda
c) Mediana
d) Desvio Médio
e) Variância
f) Desvio Padrão
g) Gráfico de frequência absoluta e gráfico da frequência acumulada
h) Coeficiente de variação

20
5,01 5,01 5,01 5,01 7,03
7,03 7,03 7,03 7,03 7,03
7,03 9,05 9,05 9,05 9,05
9,05 9,05 9,05 9,05 9,05
9,05 9,05 11,07 11,07 11,07
11,07 11,07 11,07 11,07 11,07
13,09 13,09 13,09 13,09 13,09
13,09

Com os valores dados construímos a distribuição de frequência e calculamos as medidas com uso da tabela abaixo.

xi fi xi fi fac | xi  x | | x i  x | fi ( xi  x )2 fi
5,01 4 20,04 4 4,32 17,28 74,6842
7,03 7 49,21 11 2,30 16,11 37,0622
9,05 11 99,55 22 0,28 3,09 0,8686
11,07 8 88,56 30 1,74 13,91 24,1930
13,09 6 78,54 36 3,76 22,55 84,7805
 36 335,90 72,94 221,5885

Usando os valores determinados na tabela temos:

a) Média. (Tomamos a média com uma casa decimal a mais que xi )

x
x f i i

335,9
 9,331
n 36
b) Moda
O elemento de maior frequência na tabela é a moda: mo( X )  9, 05
n
 180..........Md1  9, 05
c) Mediana se n é par, então 2 portanto, Md ( X )  9,05
n
 1  19 .....Md 2  9, 05
0

d) Desvio médio

dm( X ) 
| x  x | f
i i

72,94
 2, 03
n 36
e) Desvio quadrático médio ou variância

21
V ar( X ) 
 (x i  x )2 fi

221,5885
 6,3311
n 1 35
f) Desvio padrão

 ( X )  V ar( X ) 
 (x i  x )2 fi
 6,3311  2,516168
n 1

g) Gráfico da frequência absoluta

11 fi
10
9
8
7
6
5
4
3
2
1 xi
0 5,01 7,03 9,05 11,07 13,09

h) Coeficiente de variação

dp( X ) 2, 480975
CV  = =0,266856  27% (não é homogênea, média dispersão )
x 9,331
Observação:

Se CV  15% tem-se baixa dispersão

Se 15%  CV  30% tem-se média dispersão

Se CV  30% tem-se elevada dispersão

22
Exercícios Aplicativos 03:

Exercício 1: A tabela apresenta as notas de matemática da primeira prova bimestral, determinar as medidas de
tendência central e as de dispersão.

6 7,5 8 8,5 6,5 7,5 8 7,5 9,5 6


7 7 7 9 7 9,5 7 6 7 7
8 8,5 7,5 5,5 7,5 7 5,5 7 7 8
6,5 7,5 9 6,5 8,5 7,5 6,5 9,5 8,5 8

xi fi fac xi fi | xi  x | | x i  x | fi ( xi  x )2 fi

1) Média: x
x i fi

n

2) Moda: mo( X )  Mediana: Md ( X ) 

3) Desvio Médio: dm( X ) 


| x  x | f
i i

4) Desvio quadrático Médio ou variância:

S 2 ( X )   ( xi  x ) f i 
2

n 1

23
5) Desvio Padrão:

dp(X) = S ( X )  Var ( X )   (x
i  x )2 fi
n 1

6) Coeficiente de variação.

7) Construir o gráfico da frequência e representar a média e o desvio padrão.

9) Construir o gráfico da frequência acumulada

24
Exercício 2: Foram coletados os seguintes dados de uma pesquisa, determinar as medidas de tendência central
e as de dispersão.
1,2 – 1,8 – 2,0 – 1,4 – 1,6 – 1,8 – 1,4 – 1,8 – 2,0 – 1,6 –1,6 – 1,2 – 1,6 – 1,8 –1,4 –
1,6 – 1,8 – 1,4 – 2,0 – 1,4 – 1,8 – 1,6 – 1,2 – 1,6 – 2.0 –1,4 – 1,6 – 1,6 –1,4

xi fi fac xi fi | xi  x | | x i  x | fi ( xi  x )2 fi

1) Média: x
x i fi

n

2) Moda: mo( X ) 

3) Mediana: Md ( X ) 

4) Desvio Médio: dm( X ) 


| x  x | f
i i

5) Desvio quadrático Médio ou variância:

(X )  
(x  x ) f 2

S 2 i
 i

n 1
6) Desvio Padrão:

dp(X) = S ( X )  V ar( X ) 
 (x i  x )2 fi
n 1

7) Coeficiente de variação
25
8) Construir o gráfico da frequência e representar a média e o desvio padrão

Exercício 3: Idem. Dada a tabela, determinar as medidas de tendência central e as de dispersão.

22,3 23,0 22,3 21,0 22,3 22,4


23,2 23,0 20,1 23,5 23,0 23,5
21,0 23,2 22,3 23,2 22,3 23,0
22,3 22,4 21,0 22,3 23,5 23,0
22,4 22,3 23,0 23,0 22,4 21,0

xi fi fac xi fi | xi  x | | x i  x | fi ( xi  x )2 fi

26
1) Média: x
x i fi

n

2) Moda: Mo( X ) 

3) Mediana: Md ( X ) 

4) Desvio Médio: dm( X ) 


| x  x | f
i i

5) Desvio quadrático Médio ou variância:

V ar( X ) 
 (x i  x )2 fi
n 1

6)Desvio Padrão:

S ( X )  V ar( X ) 
 (x i  x )2 fi
n 1

7) Coeficiente de variação

8) Construir o gráfico da frequência e representar a média e o desvio padrão

27
9. Distribuições de frequência na variável contínua

A variável contínua é na maioria das vezes obtida por meio de medidas, e os dados têm frequência
absoluta praticamente unitária (os dados são quase todos distintos) e neste caso, a tabela de distribuição se
torna longa, trabalhosa e pouco eficiente, desta maneira se usa a distribuição na variável contínua.

Exemplo 23:
O professor de Educação Física do Colégio Estadual Felipe Augusto, coletou as idades de seus alunos e
as apresentou por meio da tabela abaixo.

15,6 7,8 13,8 5,1 12,4 9,5 12,2 10,3 13,8 5,5

7,7 6,5 6,4 10,0 2,2 9,3 6,4 10,0 8,5 13,1

11,8 12,7 15,5 2,7 6,4 6,8 5,1 11,2 16,6 3,6

8,3 12,4 6,4 7,2 10,5 4,7 14,0 17,0 6,8 15,1

12,2 13,2 4,7 8,4 14,1 10,8 17,0 14,0 13,1 10,7

9,8 6,2 7,7 9,0 17,0 12,2 9,0 12,1 9,8 6,2

8,7 6,5 13,7 11,8 7,7 15,5 5,7 5,1 10,2 7,7

5,9 3,9 3,3 12,2 8,4 9,3 16,6 3,7 9,4 12,2

14,0 6,9 10,8 8,5 6,4 8,6 10,0 10,0 10,9 9,3

17,0 10,9 12,7 14,0 15,6 11,2 15,6 12,4 6,4 9,4

Essa tabela nos diz que seus elementos são quase todos distintos, portanto, trata-se de uma variável
contínua. Neste caso trabalharemos com dados agrupados e seguiremos os seguintes passos para o estudo dessa
distribuição.

9.1 Amplitude da amostra

A amplitude da amostra é dada pela diferença entre as observações de maior valor numérico e a de
menor valor, neste caso.

R  xmax  xmin = 17,0-2,2=14,8

No caso das amostras que estudamos na página 19 segue:


A: 2,3,4,8,9,10 tem amplitude R  xmax  xmin = 8 e

B: 5,5,6,6,7,7 tem amplitude R  xmax  xmin = 2.


Estes valores mostram que a amostra A tem maior dispersão ou variabilidade que a amostra B
28
9.2 Número de classes

Queremos dividir R = 14,8 em classes, todas com mesma amplitude. Não existe regra única para
escolher o número destas classes, é recomendável que se n é o número de elementos da amostra, então o
número de classes K é dado por:

a)Critério da raiz: K  [ n ] , sendo K o maior número inteiro menor ou igual a n ou

b)Critério de Sturges: K  1  3,322log n , sendo K o maior número inteiro menor que 1  3,322log n . Por

simplicidade adotaremos o critério da raiz, logo K  [ n ] = [ 100]  10 classes.

9.3 Amplitude de cada classe

R 14,8
A amplitude de cada classe é dada por: r    1, 48 . Definindo xi como ponto médio da classe
K 10
e fazendo a contagem dos elementos (idades dos alunos) em cada classe, segue a tabela.

classes xi fi xi fi f ac | xi  x | | xi  x | fi (x  x )
i
2
fi

2,20 |— 3,68 2,94 4 11,76 4 6,882 27,528 189,447696

3,68 |— 5,16 4,42 7 30,94 11 5,402 37,814 204,271228

5,16 |— 6,64 5,90 13 76,70 24 3,922 50,986 199,967092

6,64 |— 8,12 7,38 9 66,42 33 2,442 21,978 53,670276

8,12 |— 9,60 8,86 15 132,90 48 0,962 14,430 13,881660

9,60 |— 11,08 10,34 14 144,76 62 0,518 7,252 3,756536

11,08 |— 12,56 11,82 13 153,66 75 1,998 25,974 51,896052

12,56 |— 14,04 13,30 12 159,60 87 3,478 41,736 145,157808

14,04 |— 15,52 14,78 4 59,12 91 4,958 19,832 98,327056

15,52 |—| 17,00 16,26 9 146,34 100 6,438 57,942 373,030596

 100 982,20 305,47 1333,4060

Completada a tabela podemos calcular

a) Média (Tomamos a média com uma casa decimal a mais que xi )

x
x f i i

982, 2
 9,822
n 100

29
c) Moda: mo( X ) .Classe modal é a classe de maior frequência 8,12 |— 9,60.
Utilizamos para a determinação da moda a fórmula de Czuber a qual é obtida por semelhanças de
triângulos.

fi r Fórmula de Czuber: Mo( X )


15 A C
2 Os triângulos AOB e COD são semelhantes, então
14 0
D H AB H AB Mo  lMo 1
1  ou   
h CD H  h AB  CD r 1   2
9 B H: altura do triângulo AOB.
h: altura do triângulo COD.
lmo : limite inferior da classe modal.
Mo classes
6,64 8,12 9,6 11,08 r : amplitude da classe modal.
1 : diferença da frequência superior e da inferior da
classe modal.
 2 : diferença da frequência superior e da posterior da
classe modal.

Substituindo os valores em
Mo  lmo 1 Mo  8,12 6
 , segue  e o valor da moda é Mo( X ) = 8,12 +1,2685 = 9,3885
r 1   2 1, 48 6 1

c) Mediana

O cálculo da mediana para a variável contínua difere do modelo de variável discreta, neste caso a
mediana esta localizada na classe mediana, porém, o valor do elemento da série não é identificável.
Sabemos que a mediana é o valor que ocupa a posição central de uma distribuição ordenada. Se o
n 1
número de elementos for ímpar, então a mediana é o elemento que ocupa a posição . Voltando ao exemplo
2
verificamos que o número de elementos é par, logo
 n 100
 2  2  50º
se n é par, então 
 n  1  100  1  51º
 2 2

0
e, devemos encontrar o elemento que ocupa (50,5) . Tomamos para isso a classe mediana e os elementos da
0
frequência acumulada anterior e posterior do elemento (50,5) . Usando semelhança de triângulos podemos
escrever:

30
Os triângulos ABC e ADE são semelhantes,
fac AC BC
D então  , substituindo, segue:
62 AE DE
Md  9, 6 50,5  48

B 11, 08  9, 6 62  48
50,5
Md  9, 6 2,5

48 A C E 1, 48 14
classes Md  9, 6  (1, 48  2,5) :14  0, 264285714
9,6 Md 11,08 Md ( X )  9,8642857

d) Desvio médio

dm( X ) 
| x  x | f
i i

305, 472
 3, 05472
n 100

e) Desvio quadrático médio ou variância

S(X)= V ar( X ) 
 (x i  x )2 fi

1333, 4059
 13, 468746
n 1 99
f) Desvio padrão

dp(X)= S ( X )  V ar( X ) 
 (x i  x )2 fi
 13, 46874717  3,669979179
n 1

h) Gráficos. O gráfico da frequência é denominado histograma e é representado por barras e ligando os pontos
médio das classes tem-se o polígono de frequência.

fi 

















classe
0 2,20 3,68 5,16 6,64 8,12 9,60 11,08 12,56 14,04 15,52
 17,00 xi
mo
 Histograma
 com
 Moda, Média, e Mediana

31
Exercícios aplicativos 04:
Exercício 1:
A experiência com trabalhadores de uma indústria indica que o tempo requerido em minutos para que
um operário aleatoriamente selecionado realize uma tarefa, esta indicado na tabela. Montar a tabela e
determinar o que se pede:

31 29 20 31 22 22 32 41 21 29 30 25 35 40 31
32 21 36 38 39 32 21 36 38 39 28 36 23 36 31
27 41 29 22 41 25 40 37 24 27 34 37 28 28 31
36 20 30 22 35 24 25 23 33 34 32 27 28 34 30

1)Amplitude da Amostra: R = xmax-xmin =

2) Número de Classes: K =[ n ] =

3) Amplitude da Classe: r = R/K =

classes xi fi fac xi fi | xi  x | | x i  x | fi ( xi  x )2 fi

4)Média: x
x i fi

n

5)Moda: Mo( X ) 

32
6) Mediana: Md ( X ) 

7) Desvio Médio: dm( X ) 


| x  x | f i i

8) Variância :

S 2
(X ) 
 (x  x )
i
2
fi

n 1
9) Desvio Padrão:

dp(X)= S ( X )  V ar( X ) 
 (x i  x )2 fi
n 1

10) Coeficiente de variação

11) Construir o Histograma e o polígono da frequência e representar a média e o desvio padrão.

33
Exercício 2: Foram coletados os dados de uma pesquisa e obteve-se a distribuição na variável contínua.
Determinar o que se pede.
classes xi fi fac xi fi | xi  x | | x i  x | fi ( xi  x )2 fi
2,1 |—— 3,1 3
3,1 |—— 4,1 7
4,1 |—— 5,1 10
5,1 |—— 6,1 6
6,1 |—— 7,1 3

1) Média: x
x i fi

n

2) Moda: Mo( X ) 

3) Mediana: Md ( X ) 

4) Desvio Médio:

dm( X ) 
| x  x | f i i

5)Variância :

S 2
(X ) 
 (x  x ) f 
i
2
i

n 1
6)Desvio Padrão:

dp(X) = S ( X )  V ar( X ) 
 (x i  x )2 fi
n 1

34
7) Coeficiente de variação.

8) Construir o Histograma e o polígono da frequência e representar a média e o desvio padrão.

Exercícios aplicativos 05:


01. A tabela a seguir apresenta as notas xi e as frequências f i obtidas pelos alunos na prova de geografia. A
partir destes dados podemos dizer que

xi fi xi fi
5 2
6 4
7 8
8 4
9 2

(A) A moda corresponde a nota 8. (B) A mediana corresponde a nota 8.


(C) A média é 7. (D) A quantidade de alunos da amostra é 5.
(E) nda.

02. Seja a amostra X: 4,5,5,3,3,5,7,6,6,7,8,8, então sua mediana é dada por

(A) 5
(B) 6
(C) 5,5
(D) 6,5
(E) nda

35
03. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas
frequências. Nestas condições podemos dizer que a mediana é

classes fi
0 |—— 2 3
2 |—— 4 7
4 |—— 6 10
6 |—— 8 6
8 |—— 10 3

(A) 1
(B) 2
(C) 3
(D) 4
(E) 5

04. Sejam as seguintes informações das amostras;


Amostra A tem média 6 e desvio padrão 1 e a amostra B tem média 6,5 e desvio padrão 0,5. Então
podemos afirmar que

(A) A amostra A tem menor dispersão que a amostra B


(B) A amostra A tem maior dispersão que a amostra B
(C) As duas amostras têm a mesma dispersão
(D) Não da para comparar as duas amostras quanto a dispersão
(E) nda

05. Após a análise dos dados de uma amostra, segue a representação gráfica da distribuição na forma de Box
plot, sendo q1 , q2 e q3 os seus quartis

Nestas condições podemos dizer que a distribuição é


(A) Simétrica à direita (B) Simétrica à esquerda
(C) Assimétrica positiva (D) Assimétrica negativa
(E) nda

36
06.A tabela a seguir apresenta o número de acidentes por dia ( xi ) em uma rodovia, durante os primeiros 23
dias do mês de janeiro de 2014.
0 9
1 7
2 5
3 2

A partir destes dados afirmamos que

(A) o primeiro quartil é de 1 acidente por dia.


(B) a moda é de 9 acidentes por dia.
(C) a mediana é de 2 acidentes por dia.
(D) a média é de 1 acidente por dia.
(E) o terceiro quartil é de 3 acidentes por dia.

07. A tabela a seguir representa uma distribuição na variável discreta e seus quartis q1 , q2 e q3 são
respectivamente
xi fi
2 5
5 1
8 7
10 2
12 4

(A) 5, 8 e 10 (B) 1, 7 e 13 (C) 2, 8 e 10 (D) 2, 8 e 12 (E) 2, 5 e 12

08. Após a análise dos dados de uma amostra que tem distribuição na variável discreta, obtiveram-se os
seguintes valores para os quartis: q1  3, q2  8 e q3  10 . Nestas condições a distribuição é

(A) Simétrica.
(B) Assimétrica negativa.
(C) Assimétrica positiva
(D) Assimétrica à direita
(E) Não é Simétrica e nem Assimétrica

37
09. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas
frequências. Nestas condições dizemos que a mediana é

classes fi
2,1 |—— 4,1 5
4,1 |—— 6,1 9
6,1 |—— 8,1 14
8,1 |—— 10,1 9
10,1|—— 12,1 4

(A) 6,1
(B) 7,1
(C) 7,3
(D) 8,1
(E) 10,1

10. Se uma distribuição na variável contínua é perfeitamente simétrica em relação a média, então o
intervalo [ x   , x   ] contém aproximadamente

(A) 95% dos elementos da distribuição. (B) 75% dos elementos da distribuição.
(C) 68% dos elementos da distribuição. (D) 34% dos elementos da distribuição.
(E) 14% dos elementos da distribuição

11. Se uma variável X tem x  10 e S ( X )  2 e uma variável Y tem y  10 e S (Y )  5 , então

(A) X tem maior dispersão que Y.


(B) Y tem maior dispersão que X.
(C) as duas variáveis têm a mesma dispersão.
(D) não é possível comparar as duas variáveis.
(E) X tem dispersão infinita.

38
12.Quando queremos verificar a questão de uma prova que apresentou maior número de erros, utilizamos:

(A) A mediana.
(B) O desvio padrão.
(C) A moda.
(D) A média geométrica.
(E) A variância.

13. O coeficiente de variação é uma medida que expressa a razão entre:


(A) o desvio padrão e a variância.
(B) o desvio padrão e a mediana.
(C) o desvio padrão e a moda.
(D) o desvio padrão e o terceiro quartil.
(E) o desvio padrão e a média.

14. A tabela a seguir apresenta as notas xi e as frequências f i obtidas pelos alunos na prova de matemática.
A partir destes dados podemos dizer que
xi fi
1 6
3 3
5 5
7 10
9 7

(A) A moda corresponde a nota 9.


(B) A mediana corresponde a nota 5.
(C) A média é 5,7
(D) A quantidade de alunos da amostra é 10.
(E) A soma de todas as frequências é 30.

39
Exercícios aplicativos 06:
1. A tabela a seguir é uma distribuição na variável contínua e apresenta as classes e suas respectivas
frequências. Nestas condições, podemos dizer que a média será:

Classes 150 a 200 200 a 250 250 a 300 300 a 350 350 a 400 400 a 450 450 a 500
fi 5 16 21 28 19 8 3

(A) 352 (B) 353 (C) 315 (D) 314 (E) 313

2. A tabela a seguir apresenta as notas atribuídas aos ginastas de uma modalidade esportiva.
xi fi
4,0 6
4,2 5
4,4 9
4,6 6
4,8 4

A partir destes dados afirmamos que


(A) o primeiro quartil é de 3,9. (B) a moda é de 9.
(C) a mediana é de 4,5. (D) a média é 4,38. (E) o terceiro quartil 4,7.

3. Os dados que seguem representam o índice de precipitação pluviométrica em uma cidade no ano de
2013.

Meses janeiro fevereiro março abril

Índices (mm) 68,5 35,1 332,2 92,8

Assim, podemos dizer que os dados estão mais apropriados para o nível de medidas na variável
(A) nominal. (B) ordinal. (C) intervalar. (D) de razão. (E) irracional.

40
4. A experiência com trabalhadores de uma indústria indica o tempo em minutos requerido para que um
operário realize uma tarefa. Segue tabela da distribuição na variável contínua dessa experiência.

classes fi

23 |— 26 6

26 |— 29 7

29 |— 32 11

32 |— 35 8

Nestas condições a moda obtida pela fórmula de Czuber é


(A) 29,85 (B) 30,02 (C) 30,71 (D) 31,24 (E) 31,65

5.Os alunos do terceiro ano do Ensino Médio do Colégio ABC apresentaram os seguintes resultados das
avaliações em:
Geografia: Média 5,0 e desvio padrão 1,6.
Matemática: Média 6,4 e desvio padrão 1,5.
Nessas condições podemos afirmar que
(A) As notas de Geografia e Matemática apresentam baixa dispersão.
(B) Só as notas de Matemática apresentam baixa dispersão.
(C) As notas de Geografia apresentam alta dispersão.
(D) As notas de Geografia apresentam menor dispersão que as de matemática.
(E) Não é possível avaliar as notas usando o conceito de coeficiente de dispersão.

6. A tabela a seguir apresenta as notas xi e as frequências f i obtidas pelos alunos na prova de matemática. A
partir destes dados podemos dizer que
2,5 3
5,0 7
6,5 10
8,0 6
10,0 5

(A) A moda é10 (B) A mediana é 5 (C) A média é 6,63 (D) A quantidade de alunos da amostra é 30 (E) A
soma de todas as frequências é 29.

41
7. A tabela a seguir é uma distribuição na variável contínua e apresenta os dados de uma loja de presentes ao
final da semana, contendo o número de clientes e seus gastos em presentes. Nestas condições podemos
dizer que a moda segundo Czuber é

classes fi
0 |—— 50 7
50 |—— 100 8
100 |—— 150 10
150 |—— 200 6
200 |—— 250 4

(A) 116,6. (B)126,6. (C) 15,6. (D) 117,6. (E) 118,6.

8. A tabela a seguir apresenta as idades dos alunos do primeiro ano de Administração. Nessas condições o 3º
quartil é
classes fi
17|—— 19 4
19|—— 21 12
21|—— 23 16
23|—— 25 8
25|—— 27 3

(A) 23,20. (B) 23,25. (C) 23,45. (D) 23,55. (E) 23,65.

9.A turma A de estatística I formada de 25 alunos tiveram média 7 na prova P1e a turma B formada por 30
alunos tiveram média 6. Então a média combinada dos 55 alunos nas duas provas foi

(A) 6,25. (B) 6,35 (C) 6,45 (D) 6,55. (E) 6,65

42
10. (FGV 2009 02 P2) Analise as afirmativas referentes a uma série na variável discreta ímpar de dados:
I. A Moda sempre é um dos dados da série.
II. A Média sempre é um dos dados da série.
III. A Mediana sempre é um dos dados da série.
Podemos afirmar que:
(A) Somente a afirmativa II está correta.
(B) (B) Nenhuma afirmativa está correta.
(C) Todas as afirmativas estão corretas.
(D) Somente a afirmativa III está correta.
(E) Somente a afirmativa I está correta

11.(FGV 2009 02 P2) Em recente pesquisa perguntou-se ao corpo discente qual o tempo semanal (em horas)
destinado ao estudo extraclasse da disciplina Estatística I. As respostas forneceram um tempo médio de 5,5
horas e uma mediana de 6 horas.
Podemos considerar que essa distribuição dos tempos é do tipo:

(A) Simétrica negativa.


(B) Assimétrica negativa.
(C) Assimétrica positiva.
(D) Desviada à direita.
(E) Simétrica.

12. Melhorar a infraestrutura é essencial para ter competividade e incentivar outros investimentos e
permitir o crescimento do PIB. A tabela a seguir mostra a taxa de crescimento da infraestrutura no setor
de geração de eletricidade (% a.a.).

anos fi
1931—— 1950 4,5
1951—— 1963 9,8
1964—— 1980 9,8
1981—— 1993 4,1
1994—— 2002 3,8

Nestas condições, o ano em que ocorreu a taxa média de crescimento da infraestrutura no setor de
geração de energia foi
(A) 1970. (B) 1972. (C) 1974. (D) 1976. (E) 1978.

43

Вам также может понравиться