Вы находитесь на странице: 1из 64

Estatística

Um pouco de História...

A História confirma que as primeiras estatísticas foram


realizadas para os governantes das grandes civilizações
antigas tomarem conhecimento dos bens que o estado
possuía e como estavam distribuídos pela população.

Apesar de se saber hoje que três séculos antes do nascimento de


Cristo já se faziam estatísticas, a palavra estatística apareceu pela
primeira vez no século XVIII.
A palavra estatística vem de statu (estado, em latim).

Em 1935, fundou-se o Instituto Nacional de


Estatística (INE) que hoje centraliza toda a
actividade estatística oficial, em Portugal.
Todos os anos, o INE publica numerosos
trabalhos estatísticos.
A Importância da Estatística

Na vida de todos os dias, cada vez mais é reconhecida a importância da


estatística. Através do seu estudo e conhecimento é possível compreender
a sociedade e o seu progresso e também potencializar a capacidade de
cada indivíduo ser mais interveniente nesse próprio progresso.

No intuito de conhecerem melhor a população e as suas necessidades, os


governos de quase todos os países, a partir do século XIX, recorrem à
estatística.

A Estatística tem por objectivo extrair informação dos dados para


obter uma melhor compreensão das situações que representam.
A Estatística é um ramo da Matemática que dispõe de
processos apropriados para recolher, organizar, classificar,
apresentar e interpretar determinados conjuntos de dados.
Alguns Tópicos de
Estatística
 População – é um conjunto de pessoas, objectos ou
acontecimentos com uma característica comum em que
incide um estudo estatístico.

 Amostra – é uma parte significativa da população em que


incide a observação.

Exercício 1:
Numa escola com 800 alunos, seleccionou-se ao acaso um
grupo de 40 alunos para responder a um inquérito sobre o
atendimento da secretaria da escola.

800
População – _______ alunos da escola.

40 alunos que responderam ao inquérito.


Amostra – _____
Um estudo estatístico pode ser um censo (ou recenseamento)
ou uma sondagem.

 Um CENSO (ou RECENSEAMENTO) é um estudo estatístico


sobre pessoas, instituições ou objectos físicos com o propósito de
adquirir conhecimentos, observando todos os seus elementos, e
tirar conclusões, de natureza quantitativa, acerca de
características importantes do universo em estudo.

 Uma SONDAGEM é um estudo estatístico em que se estuda


uma amostra da população, com o objectivo de estudar atitudes e
preferências dessa população relativamente a acontecimentos,
circunstâncias e assuntos de interesse comum.
Exemplo:

população
Quando se faz uma sondagem, não se interroga toda a ________________,
amostra
mas apenas uma pequena parte desta, ou seja, uma ______________.
A maior parte dos estudos estatísticos são sondagens, porque um
censo é difícil de implementar e, por vezes, pressupõe gastos
muito elevados, uma vez que implica o envolvimento de toda a
população em estudo.
Exercício 2:

De entre os 10000 habitantes de uma freguesia foram


seleccionados 500 para se estudar o canal televisivo
preferido.

a) Trata-se de um censo ou de uma sondagem?


Trata-se de uma sondagem.

b) Indica a população e a amostra do estudo.


População – 10000 habitantes.

Amostra – 500 habitantes.


Variáveis Estatísticas
Variável estatística: propriedade ou característica que é observada nos
elementos de uma população.

A cor dos olhos, sexo, o desporto favorito, a comida favorita, … são


variáveis qualitativas, porque não se podem medir.

A altura, o número de alunos, o peso, o número de irmãos, … são variáveis


quantitativas, porque se podem medir.

A altura e o peso são variáveis contínuas (podem tomar valores não


inteiros), enquanto o número de alunos e de irmãos são variáveis
discretas (só podem tomar valores inteiros).
Variáveis Estatísticas

Quantitativas
Qualitativas (quantidades)
(qualidades)

Contínuas Discretas

Resultam de medição: Resultam de


peso, altura, contagem: nº de livros,
velocidade, tempo,… idas ao cinema, nº de
irmãos, …
Exercício 3:

Num estudo feito numa escola, recolheram-se dados referentes às


seguintes variáveis:      

(A) idade (D) número de irmãos (G) local de estudo

(B) ano de escolaridade (E) desporto preferido (H) tempo gasto diariamente no estudo

(C) sexo (F) distância de casa à escola (I) nota na disciplina de Matemática 

C, E, G
Variáveis qualitativas: ____________________________
F, H
Contínuas: ______________________
Variáveis quantitativas
A, B, D, I
Discretas: _______________________
Organização e Tratamento de dados
Relativamente a uma amostra de 20
portugueses, com mais de 18 anos,
obtiveram-se os seguintes dados relativos
ao seu estado civil.

Solteiro Solteiro Casado Solteiro Solteiro

Divorciado Solteiro Viúvo Casado Divorciado

Solteiro Casado Solteiro Solteiro Casado

Casado Solteiro Solteiro Casado Divorciado


Tabela de Frequências
Frequência absoluta de um Frequência relativa de um acontecimento é
acontecimento é o número de vezes o quociente entre a frequência absoluta e o
que esse acontecimento se repete. número total de elementos.

Frequência Relativa
Frequência
Estado Civil
Absoluta Decimal Percentagem (%)
10
10  0,5 0,5  100  50%
Solteiro 20
6 0,3  100  30%
6  0,3
Casado 20
1 0, 05  100  5%
1  0, 05
Viúvo 20
3 0,15  100  15%
Divorciado 3  0,15
20
Total 20 1 100%
Exercício 4:

Fez-se um inquérito a 15 casais sobre o número de filhos que


tinham. As respostas foram as seguintes.

a) Organiza os dados numa tabela de frequências absolutas e relativas.

Frequência relativa
N.º de filhos por casal Frequência absoluta
Decimal Percentagem (%)

TOTAL
Frequência relativa
N.º de filhos por casal Frequência absoluta
Decimal Percentagem (%)
0 3 0,2 20%
1 5 0,33 33%
2 4 0,27 27%
3 2 0,13 13%
4 1 0,07 7%
TOTAL 15 1 100%

b) Quantos casais não têm filhos? 3 casais


Medidas de Localização

Moda, Média e Mediana


Moda

A moda de um conjunto de dados é o elemento mais frequente (ou


seja, que se repete um maior número de vezes).
A moda representa-se por Mo.

Exemplo:

Uma caixa dez pregos com os seguintes comprimentos:


15; 10; 10; 5; 5; 10; 15; 15; 10; 10

Moda = Mo = 10, porque é o valor mais frequente.


Média Aritmética

A média (ou média aritmética) de um conjunto de valores é o quociente


entre a soma de todos os valores e o número total de elementos.
A média representa-se por X .

Exemplo:
Um casal tem quatro filhos com as idades: 11, 13, 15 e 17 anos.

11  13  15  17
Média  X   14
4
Mediana

A mediana é o valor que ocupa a posição central da variável estatística.


~
A mediana representa-se por x .

Para se determinar a mediana deve-se começar por escrever os valores da


variável por ordem crescente (ou decrescente).

Se o número de dados é ímpar, a mediana é o valor do dado que ocupa a


posição central.
Se o número de dados é ímpar, a mediana é o valor do dado que ocupa a
posição central.

Exemplo:
Mediram-se as alturas de 7 soldadinhos de chumbo e obtiveram-se os
resultados que depois de ordenados são:

Como o número total de


dados é ímpar, há um
valor central: 168.

  168
Mediana  X
Se o número de dados é par, a mediana é a média aritmética dos dois
valores centrais.

Exemplo:
Mediram-se as alturas de 6 soldadinhos de chumbo e obtiveram-se os
resultados que depois de ordenados são:

Como o número total de dados


é par, há dois valores centrais:
168 e 170.

~
 168  170
Mediana  X 
x  169
2
Vamos determinar a média, a moda e a mediana quando os dados
têm que ser lidos numa tabela ou num gráfico.

Exemplo:
A família do Sr. Alberto tem 25 casais. A tabela e o gráfico seguintes
foram construídos com base no número de filhos do casais que
constituem a família Sr. Alberto.
N.º de filhos dos 25 casais da família do Sr.
Número de Frequência Alberto
filhos absoluta 12

10

Frequência Absoluta
0 4 8

1 10 6

4
2 7 2

3 3 0
0 1 2 3 4
Número de filhos
4 1
Número Frequência N.º de filhos dos 25 casais da família do
de filhos absoluta Sr. Alberto
12
0 4 10
10

Frequência Absoluta
1 10 8 7
6

2 7 4
4
3
2 1
3 3
0
0 1 2 3 4
4 1 Número de filhos

n.º total de filhos 0  4  1 10  2  7  3  3  4  1 37


 Média  X     1, 48
n.º de casais 25 25
1
 Moda = _____
ímpar
O número de observações é ___________. 13
Então a mediana ocupa o lugar número _____.

0, 0, 0, 0, 1, 1, …, 1, 1, 2, 2, …, 2, 2, 3, 3, 3, 4

4 10 7
1
 Mediana = _____ posição 13
Exercício 4 :

b) Quantos casais não têm filhos? 3 casais

c) Qual é o número de filhos mais frequente? 1 filho

d) Qual é o número médio de filhos por casal?

0  3  1 5  2  4  3  2  4  1 23
Média   1,5
15 15
e) Qual é a percentagem de casais que têm pelo menos dois filhos?
27 + 13 + 7 = 47 %
Tipos de Gráficos
Gráfico de Barras

 O gráfico deve ter um título.


 Num dos eixos coloca-se a variável
estatística. Estado Civil
(Estudo efectuado a 20 portugueses, com mais de
 No outro eixo colocam-se as 18 anos de idade)
frequências absolutas ou relativas. 12

Número de pessoas
 As barras são rectângulos todos com 10

a mesma largura. 8
6
 A distância ente as barras deve ser 4
a mesma. 2

 A altura de cada barra corresponde 0


Solteiro Casado Viúvo Divorciado
à sua frequência.
Estado Civil
 No gráfico de barras, a moda é o
elemento que apresenta a maior O gráfico de barras foi construído com
barra. as frequências absolutas.
Gráfico de barras usando as frequências relativas em percentagem.

Estado Civil
(Estudo efectuado a 20 portugueses, com mais de 18 anos de
idade)
60

50
Percentagem de pessoas

40

30

20

10

0
Solteiro Casado Viúvo Divorciado
Estado Civil
Gráfico de Linhas

 O gráfico deve ter um título. Estado Civil


(Estudo efectuado a 20 portugueses, com mais de
 Num dos eixos coloca-se a variável 18 anos de idade)
estatística.

Percentagem de pessoas
12
10
 No outro eixo colocam-se as
8
frequências absolutas ou relativas.
6
 O gráfico de linhas é um conjunto 4
de pontos conectado por uma única 2
linha. 0
Solteiro Casado Viúvo Divorciado
 Cada ponto corresponde à sua
Estado Civil
frequência.
Gráfico Circular

Vamos determinar a amplitude do sector relativo aos portugueses com o


estado civil “Solteiro”.

0,5  360º  180º


A frequência relativa de “Solteiros” é de 0,5.
Para representarmos 50% num gráfico circular, temos que marcar um
ângulo de 180º.

Procedemos da seguinte forma:

I – Desenhávamos uma circunferência:

II – Marcávamos um raio:

III – A partir desse raio, marcávamos, com o


transferidor , o ângulo de 180º:

IV – Escrever a percentagem respectiva:


Para determinarmos a amplitude dos ângulos dos
restantes Estados Civis efectuamos da mesma forma.

Ângulo = frequência relativa  360º

Nota: O total das amplitudes dos ângulos tem de ser 360º. Se assim
não acontecer, deve-se proceder aos ajustamentos adequados nos
valores dos ângulos.
Gráfico Circular

Estado Civil
 O gráfico deve ter um título. (Estudo efectuado a 20 portugueses,
 Um gráfico circular ou sectograma com mais de 18 anos de idade)
15%
é representado através de um círculo
dividido em sectores. 5%
Solteiro
 A amplitude de cada sector é Casado
proporcional à frequência que 50% Viúvo
representa. Divorciad
30% o
 A legenda pode estar ao lado ou
incluída no gráfico
Pictograma

Muito antes de o homem primitivo inventar a escrita, conseguiu através


de desenhos e símbolos deixar informações importantes.

Também nos nossos dias os desenhos e os símbolos são úteis para


comunicar informações importantes que podem ser compreendidas por
diferentes pessoas, mesmo que não falem a mesma língua.

Exemplos disso são os pictogramas que se utilizam muito em estatística.

Um pictograma é um gráfico em que os valores são


apresentados por figuras, normalmente relacionadas com o tema
em estudo.
Estado Civil
(Estudo efectuado a 20 portugueses, com mais de 18 anos de idade)

Como construir um pictograma? Estado Civil = 2 pessoas


 Começa-se por escolher um
símbolo alusivo ao fenómeno em
estudo e atribuir-lhe um certo valor; Solteiro
 
 Representa-se graficamente a
informação, por repetição desse Casado
símbolo, em linhas ou em colunas
igualmente espaçadas;
 
 Indica-se o significado de cada Viúvo
símbolo junto ao gráfico;
 Dá-se um título ao gráfico. Divorciado
Agrupamento em classes

Para efectuarmos um estudo sobre a altura dos alunos do 3.º ciclo da


escola, escolheu-se uma amostra constituída por 23 alunos.

Os dados obtidos, em centímetros, foram os seguintes:

145 151 147 167 175 174 153 167 173 162 169 171
158 149 170 167 168 175 174 157 149 150 156

Como deveremos organizar este tipo de dados?


Para organizar estes dados vamos agrupá-los em classes. Tendo em conta o
menor e o maior valor da tabela e que .
cada classe tem que ter a mesma
amplitude,
145 151 ou147 seja,167
a diferença
175 174 entre o extremo
153 167 173 superior
162 e 169
o extremo
171
inferior
158 149 da classe.
170 167 168 175 174 157 149 150 156

Tabela de frequências
Classes
(Altura dos alunos) N.º de alunos
[145,151[ 5
Na 1.ª classe estão incluídas as
[151,157[ 3 alturas maiores ou iguais a 145
[157,163[ 3 e menores do que 151.
[163,169[ 4
[169,175[ 8
Total 23
Histograma
Os gráficos das distribuições usando dados contínuos têm um aspecto diferente
dos gráficos de barras das distribuições de dados discretos. Neste caso
chamam-se histogramas.

Histograma é um gráfico de barras formado por um conjunto de rectângulos


adjacentes (colados), tendo cada um deles por base um intervalo de classe e por
altura a respectiva frequência.
Se num histograma unires por segmentos de recta os pontos médios dos lados
superiores de cada rectângulo do histograma, como se fez em baixo, obténs
uma outra forma de apresentar a distribuição, que se chama polígono de
frequências.

Polígono de frequências

Nota: Para obtermos os pontos nos extremos da linha poligonal, devemos imaginar
que existe uma classe com a mesma amplitude das restantes e frequência zero,
determinar o ponto médio desta classe e uni-lo aos restantes.
Nota: A média e a mediana apenas podem ser determinadas em dados
quantitativos, a moda pode ser determinada em dados quantitativos e
qualitativos.

Quando os dados estão agrupados por classes temos que:

 A classe modal corresponde à classe com maior frequência.

 A média de um conjunto de dados agrupados corresponde à média das


marcas das classes (valor médio de cada classe), tendo em conta as
frequências respectivas.

 A classe mediana corresponde à classe que incluiu o valor central.


Diagrama de Caule-e-folhas

Os resultados de 16 testes, numa escala de 0 a 100,


foram os seguintes:

35, 78, 50, 63, 86, 73, 57, 82,


59, 75, 66, 79, 83, 71, 94, 59
35, 78, 50, 63, 86, 73, 57, 82,
59, 75, 66, 79, 83, 71, 94, 59
Pode-se organizar este conjunto de dados utilizando uma representação
gráfica do tipo seguinte:

3 5
5 0 799
6 3 6
7 1 3589
8 2 36
9 4

Esta representação chama-se diagrama de caule-e-folhas.


O caule é a coluna com os números 3, 5, 6, 7, 8 e 9 que representam o
algarismo das dezenas e as folhas que representam o algarismo das
unidades de cada um dos dados.
Isto é:

35, 78, 50, 63, 86, 73, 57, 82,


59, 75, 66, 79, 83, 71, 94, 59

35 3 5
5 0 799
6 3 6
7 1 3589
8 2 36
9 4
78, 73, 75, 79, 71
Ordenando os algarismos das unidades vem:1, 3, 5, 8,9
Diagrama de Caule-e-folhas

 Representa os dados, separando cada


valor em duas partes: o caule (valor à
esquerda do traço vertical) e a folha
(algarismo à direita do traço vertical).
 O valor a colocar no caule são das
dezenas, centenas e milhares. O valor a
colocar na folha são as unidades. Aqui
repetimos as unidades quantas vezes o
número aparece.
 Não é necessário construir previamente
uma tabela de frequências.
Diagrama de Extremos e Quartis

O Diagrama de extremos e quartis é uma representação


gráfica onde se realçam algumas características da
amostra.
Para tal, começa-se por determinar as seguintes
medidas da amostra: os extremos (o mínimo e o
máximo), a mediana e o 1.º e 3.º quartis.
Classificações dos testes de Matemática
Vamos determinar o mínimo e o máximo, a mediana e o 1.º
e 3.º quartis das classificações do António.

65, 70, 75, 75, 80, 85

Mínimo: 65 Máximo: 85

 75  75
Mediana  X   75
2
A mediana divide a distribuição em duas partes iguais.

António:
Os quartis são valores da variável que dividem a
distribuição em 4 partes iguais, cada uma delas
com 25% dos dados totais ordenados.

1.º Quartil 2.º Quartil 3.º Quartil


A mediana divide o conjunto de dados em duas
partes com igual percentagem de elementos, 50%.
Assim, para determinar os quartis, basta calcular a
mediana de cada uma dessas duas partes, obtendo,
desta forma, quatro partes com igual percentagem.
Vamos determinar os quartis para as classificações do
António

65, 70, 75, 75, 80, 85

65, 70, 75 75, 80, 85

1.ºQuartil  Q 1  70 3.ºQuartil  Q 3  80
O primeiro quartil, Q1, separa os primeiro 25% dos dados
ordenados dos restantes 75%.

O segundo quartil, Q2, corresponde ao valor da mediana.

O terceiro quartil, Q3, separa os primeiro 75% dos dados iniciais


dos últimos 25%.
Para construir o diagrama de extremos e quartis referente às classificações
do António, basta proceder do seguinte modo:
1. Traçar uma recta orientada na horizontal (ou vertical) que inclua o
mínimo e o máximo do conjunto de dados.
2. A par da recta orientada, desenhar um rectângulo entre o 1.º e o 3.º
quartil e colocar um traço para assinalar a mediana.
3. Marcar dois segmentos de recta verticais ao lado do rectângulo
correspondentes ao mínimo e máximo.
4. Unir os pontos médios dos segmentos de recta do mínimo e do 1.º
quartil e os pontos médios dos segmentos de recta do máximo e do 3.º
quartil.
Mín: 65
Máx: 85
Med.: 75
Q1: 70
Q3:80
Diagrama de Extremos e Quartis

O Diagrama de Extremos e Quartis pode ser colocado na


horizontal ou vertical. Este diagrama também é conhecido por
diagrama de caixa e bigodes.
Vamos construir o diagrama de extremos e quartis das
classificações da Bárbara.
Exercício da ficha de trabalho:

Vamos ordenar as classificações da Bárbara.

73, 74, 75, 75, 76, 77

Mínimo: 73 Máximo: 77

 75  75
Mediana  X   75
2
Vamos determinar os quartis para as classificações da Bárbara.

73, 74, 75, 75, 76, 77

73, 74, 75 75, 76, 77

1.ºQuartil  Q 1  74 3.ºQuartil  Q 3  76
Diagrama de extremos e quartis das classificações da Bárbara.

Mín: 73
Máx: 77
Med.: 75
Q1: 74
Q3: 75
Amplitude e Amplitude Interquartis

A amplitude e a amplitude interquartis são medidas


indicadas para estudar a dispersão dos dados.

A amplitude é a diferença entre o máximo e o mínimo do


conjunto de dados (os extremos).

A = máximo  mínimo

A amplitude é muito dependente dos valores extremos do


conjunto de dados, pelo que, em determinadas situações, pode
não descrever correctamente a sua dispersão.
A amplitude interquartis é a diferença entre o 3.º quartil e o
1.º quartil.

AIQ = Q3  Q1

A amplitude interquartis fornece informação acerca da amplitude


do intervalo que contém 50% dos dados centrais.
Como é óbvio, quanto mais variados forem os dados, maior será a
amplitude interquartis.
Média
Medidas de
localização central
Mediana

Medidas de
Moda
localização

Quartis

Amplitude
Medidas de
dispersão
Amplitude
interquartis

Вам также может понравиться