Вы находитесь на странице: 1из 25

Aula 2

Distribuio de
freqncias
13 de fevereiro 2009

Curso: Sistemas de Informao


Disciplina: Estatstica e Probabilidade
Professor: Munelar de Assis Falco
Freqncia
A freqncia ou freqncia absoluta determina o nmero de
ocorrncias das possveis realizaes de cada classe de cada varivel em
que se realizou o levantamento de dados. Usaremos a notao ni para
denotar a freqncia de cada classe da varivel.

Exemplo 1: Considere a seguinte distribuio discreta de dados para


a varivel X:
X = {3, 4, 2, 3, 2, 3, 0, 2, 1, 5, 3, 1, 1, 2, 3}
Temos que a observao 3 possui uma freqncia igual a 5, j a
observao 0, possui freqncia igual a 1. Ento:
n3 = 5
n0 = 1
Freqncia relativa
Freqncia relativa ou proporo a razo de cada
representao pelo total de dados. Usaremos a notao fi para indicar
a proporo de cada classe em relao ao total n de dados. Assim:

ni
fi
n

Dessa forma, para o exemplo anterior temos que n = 5, ento a


freqncia relativa para a observao 3
5
f3 0,33333... 0,3333
15

Para o dado 0, temos


1
f0 0,06666... 0,0667
15
Porcentagem
Freqncia relativa em porcentagem, ou simplesmente porcentagem,
uma medida bastante utilizada que serve para comparar resultados de duas
ou mais pesquisas distintas, independente do nmero de dados. Ela dada
por:
ni
f i % 100%
n
Dessa forma, a porcentagem da observao 3 do exemplo 1 :
5
f3 100% 0,3333 100% 33,33%
15
Para a observao 0 temos:

1
f 0 100% 0,0667 100% 6,67%
15
Considere as seguintes pesquisas para a varivel Grau de instruo:

Observe que no podemos


comparar diretamente as
colunas das freqncias, pois
possuem totais diferentes. Mas
as colunas das porcentagens
so comparveis, pois possuem
o mesmo total (100%).

Da, conclumos, por exemplo,


que a proporo de
empregados com nvel superior
maior na seo de oramento
do que na companhia como um
todo.
Organizao de dados em tabelas
Toda tabela composta por um ttulo, pelo corpo, pelo cabealho e
pela coluna indicadora:
o ttulo explica o que a tabela contm;
o cabealho especifica o contedo das colunas;
a coluna indicadora especifica o contedo das linhas;
o corpo formado pelas linhas e colunas de dados;
a casa a diviso que aparece no corpo da tabela.

Exemplo 2:
As tabelas podem conter fonte, notas e chamadas.
A fonte d a indicao da entidade, ou do pesquisador, ou dos
pesquisadores que publicaram ou forneceram os dados. No exemplo 2, a fonte
MS/FIOCRUZ/SINITOX.
As notas devem esclarecer aspectos relevantes do levantamento dos
dados ou da apurao. Exemplo 3:

Observe nesse exemplo que a nota informa que s foram apurados


nascimentos ocorridos no ano de registro.
As chamadas do esclarecimentos sobre os dados.
Simbologia e nmeros
A simbologia empregada em tabelas estatsticas so:

Quanto aos nmeros, deve ser observado o seguinte:


1. Todo nmero inteiro constitudo de mais de trs algarismos deve ser
agrupado de trs em trs, da direita para esquerda, separando cada grupo
por um ponto ou no, como no exemplo 3.
Excees:
a. os algarismos que representam o ano;
b. nmeros de telefone;
c. placas de veculos.
2. A parte decimal de um nmero dever ser separada da parte inteira por
vrgula.
3. A unidade de medida no leva o s do plural e nem o ponto final como
abreviao.
4. Os smbolos de medida aparecem depois do nmero, sem espao entre
eles.
Exerccio 1: Construa uma tabela, a partir da tabela do exemplo 2, que
contenha freqncia acumulada, freqncia relativa, freqncia relativa em
porcentagem, freqncia relativa em porcentagem acumulada e total.
No exemplo responda:

1. Qual a populao e a amostra da estatstica apresentada na tabela?


uma populao finita ou infinita?
2. Qual a varivel estatstica dos dados acima? E quais so seus possveis
valores (dados estatsticos)? Tal varivel qualitativa ou quantitativa?
3. O que a palavra Freqncia est representando no cabealho da tabela?
1. A Populao so todas as pessoas que tiveram algum tipo de
intoxicao registrada no ano de 1993, aqui no Brasil. Perceba que os
casos no registrados no fazem parte deste levantamento de dados.
Neste tipo de estatstica, a Amostra tem o mesmo nmero de elementos
que a Populao, que por sua vez, finita, pois seno tal pesquisa no
teria nenhum sentido.
2. A varivel em questo Casos registrados de intoxicao humano no Brasil
em 1993. Seus possveis valores so exatamente: acidente, abuso, suicdio,
profissional etc. Como os possveis valores para varivel em questo so
palavras, logo se trata de uma varivel qualitativa, que no caso nominal.
3. Veremos no prximo a seguir o motivo pelo qual a palavra Freqncia foi
utilizada.
Dados brutos e Rol
Dados brutos so aqueles que ainda no foram numericamente
ordenados. Como so dados primariamente levantados ou reunidos, possui
uma caracterstica aleatria.
Exemplo 4: Levantamento de dimetros abdominais de 10 indivduos adultos:

Rol um arranjo de dados numricos brutos em ordem crescente ou


decrescente de grandeza. Assim, o rol do exemplo 3 seria:

A diferena entre o maior e o menor nmero do rol chama-se amplitude


total dos dados (A). Ento, para o rol acima, A = 122 65 = 57.
No caso de variveis qualitativas, o procedimento o agrupamento.
Tabelas de distribuio de freqncias
So tabelas que servem para apresentar variveis contnuas, elas
resumem grandes massas de dados brutos. Em tais tabelas, os dados so
freqentemente distribudos em classes ou categorias. Cada classe possui um
nmero de dados, ao qual denominamos freqncia da classe.
Observe a tabela abaixo:
As tabelas de distribuio de freqncias mostram a distribuio da
varivel, mas perdem em exatido. Note que na tabela anterior no sabemos
as 5 alturas dos estudantes da classe de 150 a 158, a no ser que
investiguemos os dados originais. Todos os dados passam a ser
representados pelo ponto mdio da classe a que pertencem. Desta forma, na
tabela anterior temos que 5 estudantes possuem em mdia uma altura de
154cm.
Intervalos e limites de classe
Um smbolo que define uma classe, como o 150 | 158 na tabela
anterior, chama-se intervalo de classe. Os nmeros extremos, 150 e 158
so denominados limites de classe: o nmero menor, 150, o limite inferior
da classe, e o nmero maior, 158, o limite superior da classe.

Com a notao adotada, temos que o intervalo de classe fechado


esquerda, ou seja, o limite inferior pertence classe, aberto direita, ou
seja, o limite superior no pertence classe.

Nem sempre esto definidos o extremo inferior da primeira classe ou


o extremo superior da ltima classe.
Exemplo 5: Observe que o extremo superior da ltima classe no est presente.
Quando isso ocorre dizemos intervalo de classe aberto.
Amplitude do intervalo de classe
A amplitude do intervalo de classe a diferena entre os limites
reais superior e inferior dessa classe.

Se todos os intervalos de classe de uma distribuio de freqncia


tiverem amplitudes iguais, como o caso da Tabela 1, dizemos que as
classes so homogneas. Em tal tabela a amplitude (a), igual a
a = 8cm.

J a Tabela 2 no possui amplitudes iguais para todas as classes.


Ponto mdio de uma classe
o ponto mdio do intervalo de classe e obtido somando-se o limite
inferior ao superior e dividindo-se a soma por 2. Dessa forma, o ponto
mdio do intervalo 150 | 158 154.

Admite-se que todas as observaes relativas a um determinado


intervalo de classe coincidem com seu ponto mdio. Dessa maneira, todas
as alturas do intervalo de classe 150 | 158 cm so consideradas como
sendo 154cm.
Processo de construo de uma tabela de
distribuio de freqncias
Como organizar os dados da tabela abaixo em uma tabela de
distribuio de freqncias? Que concluses podem ser tiradas ao olhar esta
tabela?
Passo 1: Determinar o maior e o menor nmero dos dados brutos e, ento,
calcular a amplitude total do rol.
A = 4,600 - 1,570 = 3,03kg
Passo 2: Decidir o nmero de classes de sua tabela. O nmero conveniente de
intervalos de classe est entre 5 e 20, dependendo dos dados. O importante
que consigamos intervalos de classe homogneos.
Passo 3: Determina a amplitude de classe, dividindo a amplitude total pelo
nmero de classe escolhido e arredonde o resultado para mais, at um nmero
conveniente.
A
a arredondado para mais
nmero de classes
Dessa forma: 3,03 5 = 0,606 arredondado para mais fica 0,7;
3,03 6 = 0,505 arredondado para mais fica 0,6;
3,03 7 = 0,433 arredondado para mais fica 0,5 etc.
Passo 4: Escolher como limite inferior da primeira classe o menor valor
observado ou um valor ligeiramente inferior a ele.
Dessa forma, podemos escolher a observao 1,570kg como ponto de partida
ou arredondamos para 1,500kg, para facilitar nosso problema.
Passo 5: A partir da montamos os intervalos de classe, somando a amplitude
de classe escolhida ao ponto de partida, e assim por diante.
Passo 6: Determina-se o nmero de dados que cabem dentro de cada classe e
depois calcula-se as freqncias relativas, se necessrio.
Assim, escolhendo o 7 como o nmero de intervalos de classe, teremos
amplitudes de classe igual a 0,5kg, e escolhendo como ponto de partida a
observao 1,500kg, obtemos a seguinte tabela de distribuio de freqncias
para os dados brutos em questo:
No existe um nmero ideal de classes para se montar uma tabela
de distribuio de freqncias, mas existem at frmulas para estabelecer
quantas classes devem ser construdas. Uma dessas frmulas a seguinte:

C 1 3,222... log N
onde:
C nmero de classes. O arredonde para o nmero inteiro
prximo;

N nmero de dados.

Exemplo 6: Analisemos a tabela das massa dos recm nascidos vivos mostrada
anteriormente. Naquela tabela temos N = 100, ento utilizando a frmula para o
nmero de classes, obtemos:
C = 1 + 3,222... log 100 = 1 + 6,444... = 7,444... 7 classes,
mas poderamos construir uma tabela contendo 5, 6, 7, 8 ou at 9 classes.
Exerccio 2: Construa uma tabela de distribuio de freqncias para
apresentar os dados da tabela abaixo, no esquecendo de apresentar o ponto
mdio de cada classe:

Вам также может понравиться