Академический Документы
Профессиональный Документы
Культура Документы
Diretoria de Ensino
Gerência de Ensino Superior
Coordenadoria do Curso de Licenciatura em Matemática
ESTATÍSTICA
1.0. INTRODUÇÃO
É comum observarmos em jornais e revistas publicações de pesquisas estatísticas sejam através de tabelas ou
de gráficos. A palavra estatística significa “análise de dados”. Os dados consistem em informações provenientes de
observações, contagens, medidas ou respostas.
Historicamente, o crescimento e o desenvolvimento da estatística moderna estiveram relacionados a três
fenômenos isolados:
A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar o estudo de como se
chegar a uma conclusão sobre uma população, partindo da observação de partes dessa população através do uso
da probabilidade. Esse caráter científico ocorreu já no século XVIII.
c) O advento da informática
Com o desenvolvimento da informática muitas das funções gráficas e métodos de cálculos estatísticos foram
incorporados em planilhas eletrônicas como o Microsoft Excel.
Através do uso da informática, a estatística tem sido fundamental, por exemplo, na avaliação de controles
de poluição na análise de problemas de tráfego, no estudo de efeito de vários remédios, na análise do
comportamento competitivo dos governos, etc.
1.1.DEFINIÇÃO
Estatística é a ciência que compreende um conjunto de técnicas e métodos de pesquisa destinados à coleta,
organização, descrição, análise e interpretação de dados a fim de tomar decisões. Esses conjuntos de dados são
chamados de populações e amostras.
b) Planejamento – como levantar informações? que dados deverão ser obtidos? Quais os custos envolvidos?
Qual o cronograma de atividades?
c) Coleta de dados – registro sistemático de dados, com um objetivo determinado, pode ser desenvolvida de
forma direta (obtida diretamente da fonte) ou indireta (por deduções a partir de elementos da coleta direta, por
analogia, indícios). Os dados aqui coletados podem ser:
- Primários (quando são publicados pela própria pessoa ou organização que os haja colhido, por exemplo, o
censo demográfico do IBGE).
e) Apuração dos dados – resumo dos dados através de sua contagem e agrupamento, também chamada
tabulação, pode ser manual ou eletrônica.
f) Apresentação dos dados – Há duas formas: através de tabelas que obedecem regras práticas fixadas pelo
Conselho Nacional de Estatística ou gráficos, que permitem de forma geométrica uma visão rápida e clara do
fenômeno.
g) Análise e Interpretação dos dados – está ligada essencialmente ao cálculo de medidas e coeficientes, cuja
finalidade é descrever o fenômeno (estatística descritiva) a interpretação dos dados fundamentada na teoria das
probabilidades pertence ao campo da (estatística inferencial).
População é o conjunto de todos os resultados, respostas, medidas ou contagens que possam fornecer dados ao
fenômeno em estudo;
Amostra é um subconjunto de uma população.
Se uma população for muito grande, a exemplo de todos os eleitores de uma cidade, o pesquisador poderá ter
um trabalho astronômico para estudá-la. Fatores como tempo, custo e acessibilidade faz o estatístico recorrer a uma
amostra, que, basicamente constitui uma redução da população a dimensões menores. A amostra deve manter as
características essenciais de toda população.
Exemplo. Num levantamento recente feito com apenas 50 alunos do curso Tecnólogo em Meio Ambiente do IFS-
Campus Aracaju perguntou-se: Você acessa a internet como fonte de estudo pelo menos uma vez por semana?
42 alunos responderam que “sim”. Identifique a população e a amostra e descreva o conjunto de dados.
Solução. A população consiste nas respostas de todos os alunos matriculados no curso Tecnólogo em Meio Ambiente
e a amostra consiste nas respostas dos 50 alunos do levantamento. A amostra é um subconjunto das respostas de
todos os alunos do curso. O conjunto de dados consiste em 42 respostas ‘sim’ e 8 respostas ‘não’.
Exemplo. Considere a afirmação: O Departamento de Energia dos EUA conduz levantamentos semanais em 800
postos de gasolina para determinar o preço médio por galão da gasolina comum. Em 14 de maio de 2001, o preço
médio era de US$ 1,713 por galão.
a) Identifique a população
b) Identifique a amostra
Exemplo. Identifique a amostra e a população. Determine, também, se é provável também que a amostra seja
representativa da população.
a) Um repórter da Veja se coloca em uma esquina e pergunta a 10 adultos se acham que o atual presidente está
fazendo um bom trabalho.
Exemplo. Em uma pesquisa sobre os 50 sabores de sorvete produzidos por uma sorveteria, para verificar a
qualidade dos sabores vendidos, foram testados 10 sabores. Nessa pesquisa, que porcentagem da população
representa a amostra pesquisada?
Estatística descritiva é a parte da estatística que se preocupa somente com a coleta, descrição, apresentação e
análise sem tirar conclusões mais genéricas.
Inferência estatística ou estatística indutiva é a parte da estatística que, baseando-se em resultados obtidos de
uma amostra, procura inferir ou tirar conclusões a respeito do comportamento da população, dando a precisão dos
resultados e com que probabilidade se pode confiar neles.
1.4.1. DEFINIÇÕES:
Exemplo. Em um estudo de todos os 2223 passageiros a bordo do Titanic, verificou-se que 706 sobreviveram
quando ele afundou. O dado 706 é um parâmetro, obtido de toda população do navio.
Estatística ou Estimador estatístico é uma descrição numérica de uma característica da amostra;
Exemplo. Um recente levantamento numa amostra salarial de 50 técnicos recém egressos do IFS revelou que o salário
médio inicial no primeiro emprego é de R$ 1200,00. Esse salário médio é uma estatística.
Exemplo. Com base em uma amostra de 877 executivos pesquisados, achou-se que 45% deles não contratariam
alguém que cometesse um erro tipográfico em uma solicitação de emprego. Esse número de 45% é uma estatística.
Estimação é o processo que usa resultados extraídos da amostra para produzir inferências sobre a população da
qual foi extraída.
1.5. VARIÁVEL
Qualitativa Nominal – ocorre quando os números são utilizados para nomear e/ou categorizar dados sobre as
unidades observacionais. Os dados nominais não gozam das propriedades dos números com que lidamos na aritmética
usual. Por exemplo, se registramos o estado civil como 1, 2, 3 ou 4 , não podemos escrever que 3 > 1 ou 2 < 4. Outros
exemplos:
a) marca de veículos, ou seja: VW, Fiat, GM, Toyota.
b) sexo dos integrantes de uma amostra, ou seja: masculino, feminino.
c) cor dos olhos, ou seja: castanhos, azuis , verdes.
Qualitativa Ordinal – ocorre quando os números são utilizados para, além de identificar e/ou categorizar, ordenar as
unidades observacionais segundo um processo de comparação em relação a determinada variável. Por exemplo, em
economia, costuma-se determinar o nível sócio econômico observando qual ganha mais.
Se uma pessoa ganha mais que outra, recebe um número maior numa escala de 1 a 4, por exemplo. Com estes
números podemos escrever que 4 > 3. Por outro lado, não podemos escrever 4 – 3 = 2 – 1, por exemplo, porque a
diferença de nível entre as classes 4 e 3 é na verdade muito maior do que entre as classes 2 e 1. Quando só pudermos
estabelecer desigualdades, referimo-nos aos dados como dados ordinais. Outros exemplos:
Variável Quantitativa – quando seus dados são de caráter numérico e subdivide-se em:
Quantitativa Discreta – variável que pode assumir um número finito de valores num intervalo finito, ou um número
infinito enumerável de valores, seus valores são expressos geralmente através de números inteiros não-negativos,
resulta normalmente de contagens. Por exemplo:
Quantitativa Contínua – variável que pode assumir, teoricamente, quaisquer valores num certo intervalo finito (
número infinito não-enumerável de valores ); resulta normalmente de uma mensuração e a escala numérica de seus
possíveis valores corresponde ao conjunto dos números reais. Por exemplo:
Exemplo. Ao se cadastrar em um site de comércio eletrônico, o usuário deve preencher um questionário com estas
oito perguntas:
Cada uma das questões anteriores define uma variável. Classifique-as como qualitativas nominais, qualitativas
ordinais, quantitativas discretas ou quantitativas contínuas.
Para coletar dados não tendenciosos, é importante que a amostra seja representativa da população. Vejamos
algumas técnicas de amostragem apropriadas para termos uma boa inferência sobre a população.
É aquela na qual toda amostra possível de mesmo tamanho tem a mesma chance de ser selecionada, ou seja,
os elementos são escolhidos por sorteio. Para obter esta amostra podemos utilizar um meio mecânico (“tabela de
números aleatórios”) ou eletrônico.
Exemplo. Suponha uma população de 300 alunos matriculados no curso de Saneamento Ambiental do IFS. Obtenha
uma amostra de 10% desses alunos para pesquisa dos níveis de colesterol, usando amostragem casual.
Solução:
Quando a população se divide em estratos (subdivisões), convém que o sorteio dos elementos da amostra leve
em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses
estratos.
Exemplo. Obter uma amostra proporcional estratificada, de 10%, dos 170 alunos, matriculados no curso de
Saneamento Ambiental do IFS sabendo-se que estão distribuídos em quatro turmas e de ambos os sexos, conforme a
tabela. Apresente a tabela com os quantitativos da amostra:
TURMA 1º 2º 3º 4º
SEXO PERÍODO PERÍODO PERÍODO PERÍODO
MASCULINO 29 23 21 19
FEMININO 21 20 19 18
TOTAL 50 43 40 37
Solução:
Exemplo. Em uma escola existem 500 alunos matriculados no nível superior sendo 128 do curso Tecnólogo em
Meio Ambiente, 182 em Licenciatura em Matemática, 98 em Engenharia de Produção e 92 em Licenciatura em
Química. Obtenha uma amostra de 20% dos alunos preenchendo o quadro abaixo
Exemplo. Uma população encontra-se dividida em 5 estratos, com tamanhos respectivamente, n1= 40, n2 = 55,
n3 = 34, n4 = 60 e n5 = 41. Sabendo-se que, ao ser realizada uma amostragem proporcional estratificada, o número
total da amostra foi 46 elementos, determine o tamanho de cada estrato.
Prof. Ivonaldo Pacheco Santana 5
Amostragem Sistemática
Quando os elementos da amostra já se acham ordenados, não há necessidade de criar o sistema de referência.
São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Nestes casos, a seleção dos
elementos que contribuirão a amostra pode ser feita por um sistema imposto pelo pesquisador.
Seja N o tamanho da população e n o tamanho da amostra, então, calcula-se o intervalo de amostragem
I = N/n ou o inteiro mais próximo de I. sorteia-se, através de um dispositivo aleatório qualquer, um número “x” entre
1 e I, formando-se a amostra dos elementos correspondentes aos números: x; x + I; x + 2I; ... ; x + (n-1)I. Observa-se
que a sequência dos elementos sorteados forma uma progressão aritmética de razão r = I.
Uma das vantagens da amostra sistemática é a sua facilidade de uso. Entretanto, no caso de ocorrer
regularmente um padrão nos dados, esse tipo de amostragem deve ser evitado.
Exemplo. Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para
uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: Dividimos 900/50 = 18, escolhemos por
sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais
elementos seriam periodicamente considerados de 18 em 18.Assim, suponhamos que o nº sorteado fosse 4, a amostra
seria: 4ª casa, 22ª casa,40ª casa, 58ª casa, 76ª casa, etc.
Exemplo. Um hotel tem um fichário com o registro de 5250 clientes e pretende amostrar 250 fichas. Obtenha, por
meio da amostragem sistemática, os números dos registros das 5 primeiras fichas e o número da última ficha. Sabe-se
que a primeira ficha sorteada foi a de número 17 (x = 17)
1. 7. TABELA ESTATÍSTICA
É uma das formas de apresentação dos dados assumidos por uma ou mais variáveis, deve ter uma forma
objetiva e clara de se demonstrar o comportamento da variável em análise. É estruturada através de traços
horizontais que separam o título, o cabeçalho e o rodapé. Uma tabela compõe-se de:
Título – conjunto de informações localizadas no topo da tabela que respondem às perguntas: O quê? Quando?
Onde?
Exemplo.
Arrecadação de Tributos da União – 1994
(em bilhões de R$)
____________________________________________________
Período IR COFINS IPI IMPORTAÇÃO
____________________________________________________
Trim. 1 5,91 2,64 3,13 0,62
Trim. 2 6,60 2,81 3,14 0,77
Trim. 3 5,40 3,76 3,21 0,83
Trim. 4 6,24 4,26 3,76 0,80
____________________________________________________
De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar:
um traço horizontal () quando o valor é zero, não só quanto à natureza das coisas, como quanto ao
resultado do inquérito;
três pontos (...) quando não temos os dados;
um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor;
zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são
impressos em números decimais, precisamos acrescentar à parte decimal um número correspondente de
zeros (0,0; 0,00; 0,000; ...).
Exemplo.
Os dados que seguem mostram o quanto se paga do vestibular à conclusão do curso em instituições
particulares do RJ e SP. O curso de economia da FGV-RJ com duração de 4 anos tem um custo total estimado em
R$ 52.000,00. O curso de arquitetura na escola de Belas Artes-SP com duração de 5 anos estima-se em R$
59.000,00. O curso de administração na FGV-SP com duração de 4 anos estima-se em R$ 82.000,00. O curso de
medicina na Santa Casa-SP com duração de 6 anos estima-se em R$ 149.000,00. Construa uma tabela estatística que
contemple os dados acima e identifique como fonte a revista veja em abril/2004.
1. 8. SÉRIES ESTATÍSTICAS
Toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do
local ou da espécie.
São constituídas por dados obtidos nas diferentes categorias de uma mesma variável
Rebanhos Brasileiros
1992
Espécies Quantidade
(1000 cabeças)
Bovinos 154.440,8
Suínos 34.532,2
Ovinos 19.995,6
Caprinos 12.159,6
Fonte: IBGE
Séries Conjugadas
Conjugando duas séries em uma única tabela obtemos uma tabela de dupla entrada. Ficam assim criadas
duas ordens de classificação: uma horizontal e uma vertical.
A série conjugada abaixo se classifica como específica – temporal
Uma vez coletados, os dados brutos ainda não se encontram prontos para análise, por não estarem
numericamente organizados. Para determinada variável em estudo, verificamos o número de vezes com que ocorre
cada um de seus valores, esse número chama-se frequência absoluta, normalmente indicada por fi. Definimos a
f
frequência relativa como a razão entre cada valor absoluto assumido pela variável e o nº total de dados: f r i
n
Devemos optar por uma variável discreta na representação de uma série de valores quando o número de
elementos distintos da série for pequeno.
Exemplo. Considere o conjunto de temperaturas (em °C) registradas durante vinte dias num determinado local:
23 24 25 20 20 18 25 23 20 19
19 23 25 20 20 25 24 19 19 25
EXERCÍCIOS
01. A tabela seguinte refere-se aos resultados de uma pesquisa, realizada com 400 adolescentes, a respeito de seu
lazer preferido:
Lazer Frequência Frequência Porcentagem
absoluta relativa (%)
Instrumento Musical a 0,06 b
Internet 92 c d
Esporte e f 9%
Sair à noite 180 g h
Outros i j 1
Total 400 1,00 100%
02. Uma indústria embala peças em caixas com 100 unidades. O controle de qualidade selecionou 48 caixas na linha
de produção a anotou em cada caixa o número de peças defeituosas. Obteve os seguintes dados:
2 0 0 4 3 0 0 1 0 0 1 1 2 1 1 1 1 1 1 0 0 0 3 0 0 0 2 0 0 1
1 2 0 2 0 0 0 0 0 0 0 0 0 0 0 0 1 0
a) Qual é o valor de x?
b) Que porcentagem do total de entrevistados gasta de R$ 20,00 a R$ 25,00 por refeição?
c) Que porcentagem do total de entrevistados gasta menos de R$ 15,00 por refeição?
Devemos optar por uma variável contínua na representação de uma série de valores quando o número de
elementos distintos da série for grande. Isto ocorre quando os valores assumidos pela variável pertencem a um
determinado intervalo real, com pouca coincidência de valores. Neste caso, os dados serão agrupados em classes
ou intervalos, que podem ser do tipo aberto, semiaberto ou fechado.
Convencionaremos que cada intervalo construído será do tipo semiaberto (fechado à esquerda e aberto à
direita):
Exemplo. Considere a série de valores das emissões de óxido de enxofre (em t) emitidas por uma indústria em 30
dias:
5 14 6 9 20 9 8 9 15 11
25 13 5 14 15 15 18 15 16 19
16 10 16 7 21 20 23 25 24 12
5 5 6 7 8 9 9 9 10 11
12 13 14 14 15 15 15 15 16 16
16 18 19 20 20 21 23 24 25 25
b) Amplitude Total (A.T.) – diferença entre o maior e o menor valor da amostra, ou seja:
A.T. = X máx X mín . Temos:
A.T. = 25 – 5 = 20t
c) Nº de classes (k) – embora não exista um critério rígido, podendo o pesquisador adotar o número de
intervalos ou classes de sua preferência, os critérios mais usuais são:
- Critério da raiz: k = n
- Critério de Sturgers: k = 1 + 3,3.log n , onde n representa o total de elementos da amostra;
i Emissões de fi Xi
Oxido de SO2
nº de dias
1 5 ├ 9 5 7
2 9 ├ 13 6 11
3 13 ├ 17 10 15
4 17 ├ 21 4 19
5 21 ├ 25 3 23
6 25 ├ 29 2 27
Total 30
A coluna X i indica o ponto médio da classe, cuja intenção é obter um valor representativo de classe. É obtido
ab
através da média aritmética entre os extremos do intervalo, ou seja, X i . Dessa forma, X1 7 significa que as 5
2
(cinco) emissões do intervalo 5 ├ 9 podem ser consideradas como 7t.
Obtidas a partir da frequência absoluta convém destacar as frequências relativa, acumulada e acumulada
relativa, cujo objetivo é ampliar as formas de interpretação da distribuição:
Frequência Relativa ( f ri ) – representa a razão entre a frequência absoluta da classe e a frequência total, pode
fi
ser expressa no modo percentual como f ri (%); f ri .100 %
n
Frequência Acumulada ( Fi ) – representa a soma ou acumulo da frequência absoluta desde a 1ª classe até
k
uma classe de ordem i , i k ; Fi f
i 1
i
Frequência Acumulada Relativa ( Fri ) - representa a razão entre frequência acumulada da classe a frequência
total
Fi
Fri .100 %
n
Aplicando esses conceitos à tabela das emissões de óxido de enxofre emitidos por uma indústria em 30 dias,
obtemos:
i Emissões de Xi Fi ( Fri %)
fi f ri f ri (%)
Oxido de SO2
nº de dias
1 5 ├ 9 5 7 0,1666 16,67 5 5,00
2 9 ├ 13 6 11 0,2 20 11 36,66
3 13 ├ 17 10 15 0,3333 33,33 21 70,00
4 17 ├ 21 4 19 0,1333 13,33 25 83,33
5 21 ├ 25 3 23 0,1 10 28 93,33
6 25 ├ 29 2 27 0,0666 6,67 30 100,00
Total 30 --- 1,00 100 --- ---
Das 30 emissões de óxido de enxofre emitidas por essa indústria em 30 dias, verificou-se que 4 delas estão no
intervalo de 17 ├ 21 toneladas representando 15% do total das emissões. Também é possível afirmar que 25 das
emissões ou 83,33% foram inferiores a 21 toneladas.
EXERCÍCIOS
04. A tabela a seguir mostra as quantidades (em toneladas) de óxidos de enxofre emitidas por uma indústria em 80
dias:
TONELADAS DE ÓXIDO FREQUÊNCIA
5,0 → 9,0 3
9,0 → 13,0 10
13,0 → 17,0 14
17,0 → 21,0 25
21,0 → 25,0 17
25,0 → 29,0 9
29,0 → 32,0 2
Responda:
a) Em quantos dias foram emitidos óxidos de enxofre com valores maiores ou iguais 21t e menores que 25t ?
b) Que porcentagem de dias representa uma emissão desse óxido abaixo de 25t ?
c) Até que classe de emissão desse óxido estão incluídos 50% dos dias?
d) Que porcentagem de dias representa uma emissão igual ou superior à 13t ?
300 600 750 1100 400 900 405 320 770 800 520 950
1050 390 670 450 430 530 480 800 280 700 312 800
1000 900 290 350 485 315.
Construa uma tabela de distribuição de frequências. Use o critério de Stugers para determinação do nº de classes e
adote classes de amplitudes constantes.
06. Vinte e cinco jovens de até 15 anos foram selecionados para participar de um programa desenvolvido pela
Secretaria e Esportes de uma cidade cujo objetivo consiste na formação de futuros jogadores de vôlei. As alturas dos
jovens (em metro) são dadas a seguir:
1,82 1,77 1,79 1,74 1,73 1,81 1,82 1,69 1,71 1,78 1,78 1,88 1,72 1,65 1,75 1,78 1,73
1,82 1,84 1,74 1,76 1,79 1,83 1,76 1,70
a) A partir da menor altura encontrada, agrupe os dados em classes pelo critério da raiz e faça a tabela de freqüência
correspondente.
b) Em visita ao centro de treinamento, um técnico estrangeiro sugeriu que pelo menos 48% dos jovens deveriam ter
estatura superior ou igual a 1,80 m. Quantos jovens nessas condições devem ser incorporados ao atual grupo, de
acordo com tal sugestão? Use os dados agrupados no item a.
Outra forma de apresentação da organização, resumo e descrição de um conjunto de dados ocorre através dos
gráficos estatísticos. Esses devem contribuir com conclusões sobre a evolução do fenômeno em estudo ou sobre
como se relacionam os valores da série, devem ser autoexplicativos e de fácil compreensão. Estudaremos o gráfico de
barras (verticais ou horizontais), o gráfico de linha, o gráfico de setores, o pictograma, o histograma, o polígono de
frequência e o polígono de frequência acumulada.
Os gráficos de barras (horizontais ou verticais), os gráficos de setores (ou de pizza) e o gráfico de linhas
(poligonal) são os mais utilizados na representação de variáveis categorizadas, dessa forma, as frequências de
observações são mostradas cada nível ou categoria da variável.
Gráfico de barras
Os gráficos de barras verticais apresentam os dados por meio de colunas (retângulos) dispostos em posição
vertical. A altura de cada retângulo é proporcional a frequência (absoluta ou relativa) dos valores observados.
Exemplo. O gráfico abaixo mostra a distribuição da população mundial separada por continente. O continente
americano apresenta-se divido em América do Norte e América Latina/Caribe.
a) Em 2015 a população mundial era de 7349,4 milhões de habitantes, ou seja, aproximadamente 7 bilhões
e 349 milhões de habitantes;
b) A população no continente americano superava a população da Europa, mas não superava a população
da África;
c) A razão entre as populações dos dois continentes mais populosos era aproximadamente 3,7;
Exemplo.
É possível a utilização de barras múltiplas com intuito comparativo das frequências entre duas ou mais
categorias
Exemplo.
a) Em 2009, 48,1% da população da região sudeste, com idade igual ou superior a 10 anos era usuária de internet;
b) Em 2005, os percentuais de usuários de internet, com idade igual ou superior a 10 anos, nas regiões Norte e
Nordeste eram praticamente iguais;
Exemplo.
Exemplo. Analise o gráfico abaixo e classifique as afirmações em verdadeiras (V) ou falsas (F).
b) A máxima diferença entre os percentuais de jovens de até 14 anos e adultos com 60 anos ou mais foi registrada
no Censo de 1960.
c) Se a população brasileira em 2010 era de aproximadamente 190 milhões, então mais de 40 milhões de
habitantes tinham até 14 anos.
d) Se o Censo de 2000 indicava uma população de 14450000 idosos no Brasil, então a população
brasileira ultrapassava a barreira dos 175 milhões de pessoas.
Exemplo. Considere a pesquisa realizada com 88 alunos dos cursos médio, técnico e tecnólogo do CEFET/SE
perguntados sobre suas expectativas em relação a qualidade dessa instituição de ensino em 2004:
Expectativa N° de f ri (%)
alunos f i
Ótima 2 2
Boa 44 50
Ruim 28 32
Péssima 8 9
Não 6 7
respondeu
Total 88 100
Cada valor de frequência aferida aos atributos da variável “Expectativa” fica representada por um setor
circular. O ângulo de cada setor é:
6 2
8
Boa
Ruim
Ótima Péssima
Boa
Ruim Ótima
Péssima
Ñ Respondeu
Não respondeu
44
28
Fonte: Pesquisa realizada pelas alunas do CEFET-SE - Elza Guimarães, Marcela Couto, Mary
Fonte: 3º MB
Exemplo. Numa escola, os alunos devem optar por um, e somente um, dos três idiomas: inglês, espanhol ou
françês. A distribuição da escolha de 180 alunos está indicada pelo gráfico a seguir. Sabendo que o ângulo do setor
representado pelos alunos que escolheram inglês mede 252º e que apenas 18 alunos optaram por estudar francês,
determine:
Gráficos Pictóricos
Consiste num gráfico animado por figuras relacionadas ao assunto em destaque, também utilizado para
quantificar informações. Possuem forte apelo visual, chamando atenção e curiosidade do leitor, por isso, muito
utilizado nos meios de comunicação.
Exemplos.
Histograma
Gráfico usado para representar valores assumidos por uma variável quantitativa quando estes estão
agrupados em classes. Semelhante ao gráfico de barras, porém com retângulos justapostos; o comprimento da base de
cada retângulo coincide com a amplitude da classe e a altura corresponde a frequência da classe representada. Dessa
forma, a área do histograma fica proporcional à soma das frequências da distribuição.
Polígono de Frequência
Gráfico de linha poligonal obtido pela ligação dos pares ordenados xi , f i onde xi representa o ponto
médio da classe e f i a respectiva frequência absoluta. Para visualização do polígono admitimos uma classe anterior
à primeira e outra posterior à última, ambas de frequência nula. È possível traçá-lo conjuntamente ao histograma.
Exemplo. Considere a distribuição da amostra das medidas das alturas (dadas em cm) de 100
Indivíduos:
35
30
25
20
fi
15
10
5
0
151 156 161 166 171 176 181 186 191
Classes
É um gráfico de linha poligonal obtido pela ligação dos pares ordenados bi , Fi onde bi e Fi representam
respectivamente o limite superior e a frequência acumulada da classe i . O gráfico começa no limite inferior da 1ª
classe (frequência acumulada zero) e termina no limite superior da última classe (frequência acumulada igual ao
tamanho da amostra).
100
90
80
70
60
Fi
50
40
30
20
10
0
151 156 161 166 171 176 181 186 191
Classes
Emissões fi Xi
i
de SO nº de dias
1 5 ├ 9 5 7
2 9 ├ 13 6 11
3 13 ├ 17 10 15
4 17 ├ 21 4 19
5 21 ├ 25 3 23
6 25 ├ 29 2 27
Total 30
7. Uma pesquisa feita com 336 adolescentes de um condomínio, sendo 50% de cada sexo, revela alguns problemas de
saúde. A soma dos dados percentuais ultrapassa 100%, pois cada adolescente entrevistado pôde apresentar mais de um
problema.
8. O gráfico seguinte mostra a evolução mensal da balança comercial brasileira de abril de 2014 a abril de 2015. a
balança comercial é a diferença (nesta ordem) entre as exportações e as importações de um país, em um determinado
período
9. (UF-PE) O consumo anual de café em estabelecimentos comerciais no Brasil, de 1999 a 2002, está ilustrado no
gráfico abaixo.
Admitindo esses dados, analise as alternativas a seguir, justificando:
Responda:
12. O gráfico abaixo mostra queda nas operações com cheques e o avanço nas operações com cartões de crédito. Os
valores referem-se às quantidades de transações efetuadas (em milhões).
14. Em uma cidade, o mercado de leite é disputado por quatro marcas: X,Y,Z e W. Os resultados de uma sondagem
a propósito da marca preferida, realizada com 400 consumidores, estão parcialmente apresentados na tabela e no
gráfico seguinte
Marca de Freqüência
preferência absoluta
X 230
Y 120
Z ∆
W ∆
Determine:
a) a diferença entre o número de consumidores que preferem Z a W;
b) a diferença entre os ângulos correspondentes a X e Y.
15. (Unesp-SP). O gráfico, publicado pela revista Veja de 28/7/99, mostra como são divididos os 188 bilhões de
reais do orçamento da União entre os setores de saúde, educação, previdência e outros.
Se os 46 bilhões de reais gastos com a previdência fossem totalmente repassados aos demais setores, de modo que
50% fossem destinados à saúde, 40% à educação e os 10% aos outros, determine o aumento que o setor de saúde
teria:
a) em reais;
17. No pictograma abaixo está representada a queda na área desmatada anualmente em uma floresta de certo país,
devido à maior fiscalização dos órgãos governamentais, no período de 2012 a 2016. Cada árvore do gráfico
representa 25 mil hectares de floresta desmatada.
Sabendo que 1 hectare equivale a 10000 m2 , determine a área, em Km2, correspondente à superfície de floresta
desmatada em 2013 e em 2015.
18. O histograma seguinte mostra as temperaturas máximas diárias registradas em 80 dias durante um verão na
cidade do RJ.
O contorno do polígono de freqüência (linha poligonal) pode tender a uma curva, denominada curva
de freqüência. Para isto empregamos o método do polimento. Assim, enquanto o polígono de freqüência
nos mostra a imagem real do fenômeno estudado, a curva de freqüência nos mostra a imagem
tendencional. Esse procedimento não nos dará certeza absoluta de que a curva obtida – curva polida – seja
tal qual a curva resultante para um grande número de dados ou classes de intervalos, no entanto, ela se
assemelha mais à curva de freqüência do que ao contorno do polígono de freqüência.
A curva polida corresponde a eliminação dos vértices da linha poligonal através da fórmula:
fi 1 2 fi fi 1
f ci
4
Onde:
Emissões fi f ci
i
de SO nº de dias
1 5 ├ 9 5 4
2 9 ├ 13 6 6,8
3 13 ├ 17 10 7,5
4 17 ├ 21 4 5,3
5 21 ├ 25 3 3
6 25 ├ 29 2 1,8
Total 30 ----
As curvas em firma de sino caracterizam-se pelo fato de apresentarem um valor máximo na região
central. Fenômenos pesquisados como peso de adultos, inteligência medida em testes mentais oferecem
distribuições em forma de sino. Essas curvas podem ser simétricas ou assimétricas.
Curva simétrica
Esta curva caracteriza-se por apresentar o valor máximo no ponto central e os pontos
eqüidistantes desse ponto terem a mesma frequência.
Curvas assimétricas
Na prática, não se encontram distribuições perfeitamente simétricas. As distribuições obtidas de medidas
reais são mais ou menos assimétricas, em relação á freqüência máxima. Assim, as curvas correspondentes a tais
distribuições apresentam a cauda de um lado da ordenada máxima mais longa que a do outro. Se a cauda mais longa
fica a direita é chamada assimétrica positiva, se a cauda se alonga à esquerda, chama-se assimétrica negativa.
2.
Número de Número de
peças caixas
defeituosas fi
por caixa
xi
0 28
1 12
2 5
3 2
4 1
Total 48
3. a) x = 18% b) 5% c) 75% 4. a) 17 dias b) 86,25% c) até a 4ª classe ( 17 21) estão incluídos 40 dias d) 83,75%
5.
Tempo (h) fi fri (%) Fi
280 417 10 33,33 10
417 554 6 20 16
554 691 2 6,66 18
691 828 6 20 24
828 965 3 10 27
965 1102 3 10 30
30 100
Altura (%)
(em metros) fi fr fr
1,65 1,70 2 0,08 8
1,70 1,75 7 0,28 28
1,75 1,80 9 0,36 36
1,80 1,85 60 0,24 24
1,85 1,90 1 0,04 4
8. a) Set 2014, Out 2014, Nov 2014, Jan 2015, e Fev 2015. b) 14,666 bilhões de dólares. c) Jun 2014
9. a) V; cresceu 0,4 milhões por ano b) V; foi de 6,06% c) F; de 2000 a 2001: 3,03% e de 2001 a 2002: 2,94%
d) V; 3,03%
e) V; foi de 13,375 milhões de sacas.
11. a) 1992
b) H: 58,5% de 500000 = 292500 e M: 41,5% de 500000 = 207500 Dif. =85000
c) < 20%: 1997 a 2002 > 23%: 1990 a 1993
16. a) Sudeste (153º), Sul (114°), Nordeste (65°), Centro-Oeste (26°), Norte (2°)
b) 2300 c) São Paulo: 56,8%; Santa Catarina: 42,7%
17. 2013: 2500 km2 ; 2015: 625 km2 18. a) 62 dias; b) 48 dias; c) 103,65 litros