Вы находитесь на странице: 1из 34

Probabilidades e Estatística

Regente: Prof. Dr. Cachimo Assane

Licenciaturas: LECT, LEIT, LEF e LEMT

Tema 2: Organização e Apresentação dos dados

ProbEst-Engenharias-ISUTC-2019/Sem II

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 1 / 31


Distribuições de Frequências - Tabelas e gráficos

„ Objectivo principal: Conhecer o comportamento de uma variável, analisando a


ocorrência de suas possíveis realizações.
„ Em geral, os valores da variável são organizados em tabelas de frequências e
gráficos;
„ A construção de tabelas e gráficos depende do tipo de variável em estudo;
„ Em geral, os gráficos contém menos informações que as tabelas, mas são de
fácil leitura;

„ Na elaboração de um gráfico, a simplicidade, clareza e veracidade devem ser


considerados.

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 2 / 31


Tabelas de frequências para Variáveis Qualitativas

Numa tabela de frequência para variável qualitativa:


„ cada linha corresponde a uma categoria (valor) possível da variável;
„ O no de vezes que esse valor ocorre é chamado frequência absoluta (fi );
„ A partir de fi podem ser calculadas frequência relativas (fri );
„ A fri é usualmente apresentada sob a forma de percentagem;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 3 / 31


Tabelas de frequências para Variáveis Qualitativas

Exemplo 1. Frequência e percentagem de docentes do ISUTC segundo o Estado


civil:
Estado Frequência Frequência Percentagem
civil absoluta (fi ) relativa (fri ) 100fri
15
Casado(a) 15 80
= 0, 1875 18,75
Solteiro(a) 35 0,4375 43,75
Divorciado(a) 18 0,2250 22,50
Viúvo(a) 5 0,0625 6,25
Outros 7 0,0875 8,75
Total 80 1,0000 100,00

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 4 / 31


Tabelas de frequências para Variáveis Qualitativas

Exemplo 2. Frequência e percentagem de idosos segundo o Grau de instrução:


Grau de Frequência Frequência Percentagem
instrução absoluta (fi ) relativa (fri ) 100fri
Básico 12 0,3333 33,33
Médio 18 0,5000 50,00
Superior 6 0,1667 16,67
Total 36 1,0000 100,00

OBSERVAÇÃO: Quando a variável é qualitativa ordinal, as linhas da tabela devem


seguir a ordem dos valores (categorias) possíveis da variável.

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 5 / 31


Gráficos para Variáveis Qualitativas
Os gráficos mais comuns para descrever as variáveis qualitativas nominais e
ordinais são: gráficos de barras e circulares (de sectores ou de “pizza”)
i) Gráficos de barras - Características principais
„ As categorias são representadas por barras (rectângulos);
„ As barras são dispostos ao longo de um eixo (em geral, o horizontal);
„ Todas as barras devem ter a mesma largura e separadas entre elas.

Exemplo: Distribuição dos docentes segundo o Estado civil


35
30
25
20
Frequência

15
10
5
0

Casado(a) Solteiro(a) Divorciado(a) Viúvo(a) Outros

Estado civil
Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 6 / 31
Gráficos para Variáveis Qualitativas
Gráficos de barras múltiplas - Dados de importação de frango e peixe de quatro
países-2007
Importação (1000 Toneladas)
País
Frango Peixe
Angola 1570 2800
Portugal 1040 950
Brasil 3500 1540
China 450 850

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 7 / 31


Gráficos para Variáveis Qualitativas

ii) Gráficos circulares - representam a frequência relativa (percentagem) de cada


categoria da variável (nominal e ordinal).
„ É uma opção ao gráfico de barras quando se pretende dar ênfase à
comparação das percentagens de cada categoria;
„ A construção do gráfico de sectores segue uma regra de 3 simples: a
frequência de cada categoria corresponde ao ângulo que se deseja
representar em relação a frequência total que equivale a 360◦ .
Características dos gráficos circulares:

„ A área do gráfico equivale à totalidade de casos (360 = 100%);

„ Cada “fatia” representa a percentagem de cada categoria.

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 8 / 31


Gráficos para Variáveis Qualitativas
Exemplo - O gráfico circular para a distribuição dos docentes segundo o Estado
civil é:

Figura: Percentagem de idosos de acordo com o grau de instrução

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 9 / 31


Observações sobre gráficos de barras e circulares

„ O gráfico circular, por não implicar uma ordenação das categorias, é mais
apropriado para as variáveis qualitativas nominais;

„ O gráfico de barras é apropriado em ambos os casos (variáveis qualitativas


nominais e ordinais);
„ O gráfico circular é aconselhável quando o número de categorias for menor do
6;
„ Na prática, o gráfico circular é menos recomendável, dada a dificuldade em
comparar os sectores do gráfico.

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 10 / 31


Tabelas de frequências para Variáveis Quantitativas

Para variável quantitativa discreta com quantidade pequena de valores possíveis


⇒ tabela de frequências é similar a de variáveis qualitativas.
Exemplo: Número de filhos dos professores da escola XYZ.
Dados brutos - obtidos directamente da pesquisa; ainda não organizados:
5 3 0 2 0 0 3 1 1 2
2 1 2 3 1 2 1 2 0 2

Passos para construção da tabela de frequência:


i) Ordenar os dados (em ordem crescente ou decrescente);
0 0 0 0 1 1 1 1 1 2
2 2 2 2 2 2 3 3 3 5
ii) Primeira coluna: Valores possíveis da variável (ordem crescente);
iii) Segunda coluna: No de ocorrências de cada valor (fi )

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 11 / 31


Tabelas de frequências para Variáveis Quantitativas

Passos para construção da tabela de frequência (Cont.):


iv) Obter frequências relativas (fri ), percentagens, · · ·
Tabela de frequência dos professores segundo o no de filhos:
No de filhos
fi fri 100fri
xi
0 4 0,20 20
1 5 0,25 25
2 7 0,35 35
3 3 0,15 15
5 1 0,05 5
Total 20 1,00 100

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 12 / 31


Tabelas de frequências para Variáveis Quantitativas

„ Para variável quantitativa contínua e variável quantitativa discreta com


grande quantidade de valores possíveis⇒ tabela de frequências com intervalos
de classe.
Exemplo: Salário dos funcionários da empresa ABC.
„ Dados brutos:
4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59
7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80
10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85
14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 21,30

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 13 / 31


Construção da tabela de frequências com intervalos de
classe
Seja X a variável salário dos funcionários da empresa ABC. A construção da tabela
obedece as seguintes etapas:
1) Ordenar os dados brutos (rol). O conjunto de dados da variável X já está
ordenado;
2) Determinar a amplitude total dos dados (AT):
AT = max(X) − min(X)
AT = 21, 30 − 4, 00 = 17, 30
3) Escolher o no de classes (k) de igual amplitude, englobando todos os dados
sem superposição de intervalos:
„ Geralmente, entre 5 e 15 classes;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 14 / 31


Construção da tabela de frequências com intervalos de
classe
Seja X a variável salário dos funcionários da empresa ABC. A construção da tabela
obedece as seguintes etapas:
1) Ordenar os dados brutos (rol). O conjunto de dados da variável X já está
ordenado;
2) Determinar a amplitude total dos dados (AT):
AT = max(X) − min(X)
AT = 21, 30 − 4, 00 = 17, 30
3) Escolher o no de classes (k) de igual amplitude, englobando todos os dados
sem superposição de intervalos:
„ Geralmente, entre 5 e 15 classes;

„ Para amostra de tamanho n:



k = n,
k = 1 + log2 n, (fórmula de Sturges)

k = 36 = 6 ou k = 1 + log2 36 = 6, 17 ⇒ k ≈ 6

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 14 / 31


Construção da tabela de frequências com intervalos de
classe
4) Determinar o tamanho (ou amplitude) do intervalo de cada classe (h):

AT 17, 30
h= ; h= = 2, 88; ⇒ h ≈ 3
k 6

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 15 / 31


Construção da tabela de frequências com intervalos de
classe
4) Determinar o tamanho (ou amplitude) do intervalo de cada classe (h):

AT 17, 30
h= ; h= = 2, 88; ⇒ h ≈ 3
k 6

5) Estabelecer os limites das classes:


„ Limite inferior (limInfi ) - menor valor da classe;

„ Limite superior (limSupi ) - maior valor da classe;


Por exemplo, na primeira classe: 4, 00 ` 7, 00;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 15 / 31


Construção da tabela de frequências com intervalos de
classe
4) Determinar o tamanho (ou amplitude) do intervalo de cada classe (h):

AT 17, 30
h= ; h= = 2, 88; ⇒ h ≈ 3
k 6

5) Estabelecer os limites das classes:


„ Limite inferior (limInfi ) - menor valor da classe;

„ Limite superior (limSupi ) - maior valor da classe;


Por exemplo, na primeira classe: 4, 00 ` 7, 00;
6) Calcular o ponto médio de cada classe (PMi ):

limSupi + limInfi
PMi =
2
7,00+4,00
Por exemplo, na primeira classe: PM1 = 2
= 5, 50

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 15 / 31


Construção da tabela de frequências com intervalos de
classe
7) Contar o no de elementos pertencentes a cada classe (fi):

4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59


7,44 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80
10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85
14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 21,30

Tabela de frequência dos funcionários por faixa de salário:


Classes de
fi
salários
4,00`7,00 7
7,00`10,00 11
10,00`13,00 6
13,00`16,00 6
16,00`19,00 4
19,00`22,00 2
Total 36

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 16 / 31


Construção da tabela de frequências com intervalos de
classe

8) Calcular a frequência relativa de cada classe (fri ):


n
fi X
fri = , mboxonde n = fi = no total de observações
n i=1

Tabela de frequência dos funcionários por faixa de salário:


Classes de
fi fri 100fri
salários
4,00`7,00 7 0,1944 19,44
7,00`10,00 11 0,3056 30,56
10,00`13,00 6 0,1667 16,67
13,00`16,00 6 0,1667 16,67
16,00`19,00 4 0,1111 11,11
19,00`22,00 2 0,0555 5,55
Total 36 1,0000 100,00

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 17 / 31


Frequências acumuladas

„ Serve para variáveis quantitativas e apenas para variável qualitativa ordinal


„ Frequência absoluta acumulada (Fi ) e Frequência relativa acumulada (Fri )
„ Exemplo:
Tabela: Frequência dos funcionários por faixa de salário
Classes de
fi Fi fri Fri 100Fri
salários
4,00`7,00 7 7 0,1944 0,1944 19,44
7,00`10,00 11 18 0,3056 0,5000 50,00
10,00`13,00 6 24 0,1667 0,6667 66,67
13,00`16,00 6 30 0,1667 0,8334 83,34
16,00`19,00 4 34 0,1111 0,9445 94,45
19,00`22,00 2 36 0,0555 1,0000 100,00
Total 36 – 1,0000 100,00

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 18 / 31


Gráficos para Variáveis Quantitativas
„ Para variável quantitativa discreta com quantidade pequena de valores possíveis
⇒ Gráfico de barras;
Exemplo: Número de filhos dos professores da escola XYZ.
No de filhos (xi ) 0 1 2 3 5 Total
7
6
5
4 fi 4 5 7 3 1 20
Frequência

3
2
1
0

0 1 2 3 4 5

Número de filhos

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 19 / 31


Gráficos para Variáveis Quantitativas

Para variável quantitativa contínua, o mais utilizado é o Histograma;


„ O histograma é um gráfico de barras contíguas;
„ eixo horizontal - intervalos de classe (Pontos médios); eixo vertical - frequências
da classe (absolutas ou relativas);
„ A largura das barras é proporcional à amplitude do intervalo;
„ A altura é proporcional à frequência;

„ A barra é centrada no ponto médio de cada classe;


„ Não existe espaço entre as barras;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 20 / 31


Construção do Histograma
Classes de
PMi fi
salários
4,00`7,00 5,5 7
7,00`10,00 8,5 11
10,00`13,00 11,5 6
13,00`16,00 14,5 6
16,00`19,00 17,5 4
19,00`22,00 20,5 2
Total 36 –

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 21 / 31


Polígono de Frequência

„ Um polígono de frequência usa os mesmos eixos que um histograma;

„ É construído ao se colocar um ponto no centro (Ponto médio) de cada intervalo;


„ A altura do ponto é igual à frequência associado ao intervalo;
„ É obtido pela união (linha recta) dos pontos médios dos topos das barras de
um histograma.

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 22 / 31


Construção do polígono de frequência
Classes de
PMi fi
salários
4,00`7,00 5,5 7
7,00`10,00 8,5 11
10,00`13,00 11,5 6
13,00`16,00 14,5 6
16,00`19,00 17,5 4
19,00`22,00 20,5 2
Total 36 –

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 23 / 31


Ogiva de Frequência

„ É um gráfico de linha que representa as frequências acumuladas (polígono de


frequências acumuladas);

„ Os valores de interesse são os extremos das classes e respectivas Fi ’s;


„ Os pontos (limSupi ; Fi ) são conectados por linhas rectas;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 24 / 31


Ogiva de Frequência
Classes de
PMi fi Fi
salários
4,00`7,00 5,5 7 7
7,00`10,00 8,5 11 18
10,00`13,00 11,5 6 24
13,00`16,00 14,5 6 30
16,00`19,00 17,5 4 34
19,00`22,00 20,5 2 36
Total 36 –

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 25 / 31


Diagrama de Ramo-e-folhas

Um gráfico de ramo-folha transmite informações sobre:


„ identificação de um valor típico ou representativo;
„ extensão da dispersão ao redor do valor típico;
„ presença de lacunas nos dados;
„ extensão da simetria na distribuição de valores;

„ presença de valores fora da curva.


Vantagem em relação ao Histograma
„ Contém os valores originais dos dados;
„ fornece uma maneira rápida de obter uma representação visual informativa de
um conjunto de dados.
Em um diagrama de ramo-e-folhas, cada número é separado em um ramo e uma
folha;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 26 / 31


Etapas de construção de diagrama de ramo-e-folhas

Considere um conjunto de dados numéricos x1 , x2 , . . . , xn , para o qual cada x


consiste de, pelo menos, dois dígitos. Para construir um diagrama de ramo-e-
folhas faça:
„ Seleccione um ou mais dígitos de “liderança” para serem o ramo;
„ Os dígitos à direita desse dígito de liderança serão as folhas;
„ Relacione os valores de ramo possíveis em uma coluna vertical;

„ Registe a folha de cada observação ao lado do caule correspondente;


„ Indique a chave (as unidades dos ramos e das folhas) em algum lugar do
diagrama.
Ü Por exemplo: uma observação 83 pode ter como chave: 8|3, ou seja, ramo
8 e folha 3
Ü Para uma observação 32, 6 a chave pode ser 32|6; 0, 8 = 0|8

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 27 / 31


Exemplo:construção de diagrama de ramo-e-folhas

Exemplo: Use um diagrama de ramo-e-folhas para representar os dados. Os dados


representam as idades das 25 pessoas mais ricas do mundo (Fonte: Forbes)
51 76 67 80 56 73 58 71 78 49 62 84 50
49 87 40 59 47 54 84 61 79 59 52 63

Resposta:
Ramo folhas Frequência
4 0799 4 Chave: 4|0=40
5 01246899 8
6 1237 4
7 13689 5
8 0447 4

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 28 / 31


Gráfico de Linha

„ É utilizado para representar observações feitas ao longo do tempo (série


temporal);

„ Facilita a visualização do comportamento dos dados ao longo do tempo;


„ No eixo horizontal, colocam-se as datas em que foram realizadas as
observações;
„ No eixo vertical, colocam-se os valores observados;

„ Os pontos assim obtidos são conectados por linhas retas;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 29 / 31


Construção do Gráfico de Linha
Exemplo:Número de homicídio por 100.000 habitantes
Ano 1996 1997 1998 1999 2000 2001 2002
Homicídios 8.049 7.966 7.569 7.249 7.337 7.337 7.337
Ano 2003 2004 2005 2006 2007 2008 2009
Homicídios 7.840 7.391 7.098 7.122 6.313 5.395 4.198

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 30 / 31


Exercício Proposto: Diagrama Ramo-e-Folhas

„ Apresente as características principais desse tipo de gráfico;

„ Aponte suas vantagens e desvantagens em relação a outros gráficos;


„ Descreva os passos para a construção de um diagrama ramo-e-folha;
„ Usando dados sobre salários de 36 funcionários da empresa ABC:
Ü Construa o diagrama ramo-e-folha;
Ü Comente a informação observada no gráfico;

Regente: Prof. Dr. Cachimo Assane (ISUTC) Probabilidades e Estatística ProbEst-Engenharias-ISUTC-2019/Sem II 31 / 31

Вам также может понравиться