Вы находитесь на странице: 1из 61

ESTATÍSTICA I

Departamento de Métodos Quantitativos


Faculdade de Economia do Huambo
Universidade José Eduardo dos Santos (UJES)

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 1 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de tendência central

Moda
Moda é o valor que ocorre com maior frequência nos dados obtidos numa
colecta (esse valor é denominado ”valor modal”).

Nota
A série pode ser classificada em função da quantidade de valores modais.
série amodal: não tem valor modal;
série unimodal: tem um valor modal;
série bimodal: tem dois valores modais;
série trimodal: tem três valores modais;
série polimodal: tem quatro ou mais valores modais.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 2 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de tendência central

Moda

Representação gráfica da moda

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 3 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de tendência central

Moda
Cálculo da moda para dados não agrupados
Numa série estatı́stica em que os dados não são agrupados, o valor modal
corresponde ao valor com maior número de ocorrência.
Cálculo da moda para dados agrupados sem intervalos de classe
Para determinação da moda para séries agrupadas sem intervalos de
classe, devem-se executar os passos a seguir:
1 Localizar a classe modal. Classe modal é a classe que contém o maior
valor de frequência;
2 Verificar o valor da variável contido na classe modal.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 4 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de tendência central

Moda
Cálculo da moda para dados agrupados em intervalos de classe
Na determinação da moda para séries agrupadas em intervalos de classe,
devem-se executar os passos a seguir:
1 Localizar a classe modal;
2 Determinar a moda: sabemos que a moda é um valor contido no
intervalo de classe modal; para o cálculo da moda aplicamos a
fórmula de Czuber, tomando como base os valores da classe modal.
 
d1
Mo = lMo + × hMo
d1 + d2

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 5 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de tendência central

Moda
Sendo:
lMo = limite inferior do intervalo de classe modal; d1 = diferença entre a
frequência da classe modal e a frequência da classe anterior à classe modal;
d2 = diferença entre a frequência da classe modal e a frequência da classe
posterior à classe modal e hMo = amplitude do intervalo de classe modal.

d1 = fMo − fant d2 = fMo − fpost

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 6 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de tendência central

Mediana
A mediana é uma medida de posição, é uma separatriz, pois divide a série
estatı́stica em duas partes iguais. O valor da mediana se encontra no
centro da série estatı́stica, organizada de tal forma que o número de
elementos situados antes desse valor (mediana) é igual ao número de
elementos que se encontram após esse mesmo valor (mediana).
A mediana é conveniente para séries estatı́sticas onde existem valores
extremos, em que valores grandes e pequenos coexistem dentro da mesma
série, ou ainda nos casos em que a série seja aberta nos extremos. Para
esses casos, a mediana caracteriza o promédio mais confiável.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 7 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de tendência central

Mediana
Cálculo da mediana para dados não agrupados
O cálculo da mediana para séries simples pode ser feito de duas maneiras:
1 Para uma série com número ı́mpar de termos: a mediana
corresponde ao valor central, esse valor apresenta o mesmo número
de termos localizados a sua esquerda e a sua direita. A posição do
termo central e dada pela expressão: n+1
2
2 Para uma série com o número par de termos: como não há um
termo central único, a mediana será dada pela média aritmética entre
os dois termos centrais; nesse caso, a mediana é um valor que não
pertence a série e está localizado entre os dois termos centrais. As
posições dos termos centrais são dadas pelas expressões: n2 e n2 + 1
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 8 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de tendência central

Mediana
Cálculo da mediana para dados agrupados sem intervalos de classe
Na determinação da mediana para séries agrupadas sem intervalos de
classe, devem-se executar os passos a seguir:
n
1 Calcular a posição da mediana: P os
med =
2
2 Localizar a classe mediana: estabelecida pela comparação de P os
med
com os valores da F ac. A classe mediana é aquela cujo valor da F ac
é imediatamente superior a P osmed .
3 Verificar o valor da variável contido na classe mediana.
Caso F ac = P osmed , aconselha-se que se faça o cálculo da mediana por

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 9 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de tendência central

Mediana
meio da média aritmética entre o valor da variável correspondente à F ac e
o valor da variável correspondente a uma ordem acima.
Cálculo da mediana para dados agrupados em intervalos de classe
Na determinação da mediana para séries agrupadas em intervalos de
classe, devem-se executar os passos a seguir:
n
1 Calcular a posição da mediana: P os
med =
2
2 Localizar a classe mediana: estabelecida pela comparação de P os
med
com os valores da F ac. A classe mediana é aquela cujo valor da F ac
é imediatamente superior a P osmed .
3 Determinar a mediana: utilizando para o efeito a seguinte fórmula

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 10 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de tendência central

Mediana
n
− Fant

2
Md = lMd + × hMd
fMd
Sendo:
lMd = limite inferior do intervalo de classe mediana; Fant = frequência
acumulada da classe anterior à classe mediana; fMd = frequência simples
da classe mediana e hMd = amplitude do intervalo de classe mediana.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 11 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas separatrizes
São valores que ocupam determinados lugares, abrangendo intervalos
iguais, de um conjunto de valores colectados e organizados. As medidas de
posição separatrizes podem ser classificadas em:
mediana: divide a série em duas partes iguais (Md );
quartis: divide a série em quatro partes iguais (Q1 , Q2 , Q3 );
decis: divide a série em dez partes iguais (D1 , D2 , ..., D9 );
percentis: divide a série em cem partes iguais (P1 , P2 , ..., P99 ).
Os nomes das medidas de posição separatrizes modificam de acordo com a
quantidade de partes que é dividida a série.
Nota
A mediana, além de ser uma medida de posição de tendência central, é
também uma medida separatriz.
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 12 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Quartis
Nos quartis, a série é dividida em quatro partes iguais, com o mesmo
número de elementos, de tal forma que cada intervalo do quartil contenha
25% dos elementos colectados. Os elementos separatrizes da série são
Q1 , Q2 e Q3 . Interpretação dos quartis:
O Q1 separa os primeiros 25% dos elementos da série.
O Q2 separa os primeiros 50% (25% + 25%) dos elementos da série.
Note que: o segundo quartil será sempre igual a mediana da série
(Q2 = Md ).
O Q3 separa os primeiros 75% (25% + 25% + 25%) dos elementos
da série.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 13 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Quartis
Cálculo dos quartis para dados não agrupados
Para o cálculo dos quartis, utilizam-se técnicas semelhantes àquelas do
cálculo da mediana. Deste modo, temos:
Q1 = mediana da primeira metade dos elementos da série.
Q2 = mediana de todos os elementos da série.
Q3 = mediana da segunda metade dos elementos da série.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 14 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas separatrizes

Quartis
Cálculo dos quartis para dados agrupados sem intervalo de classe
Para o cálculo dos quartis para dados agrupados sem intervalo de classe,
utilizam-se técnicas semelhantes àquelas do cálculo da mediana. Isso
significa que a localização da posição do quartil na série é verificada pela
frequência acumulada (F ac).
Def: Qk é o valor da variável que corresponde à classe desse quartil
considerado. Sendo que k indica a posição do quartil (k = 1, 2, 3).
Assim, inicialmente, calcula-se a posição de Qk para estabelecer em que
classe se localiza o quartil considerado
k×n
P osQk =
4
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 15 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Quartis
Cálculo dos quartis para dados agrupados sem intervalo de classe
Obtida a posição de Qk , localiza-se o valor da mesma na frequência
acumulada, para conhecer qual é a classe que corresponde a essa posição,
a qual damos o nome de ”classe do quartil k”. Em seguida, verifica-se o
valor da variável correspondente a classe do quartil k considerado.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 16 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas separatrizes

Quartis
Cálculo dos quartis para dados agrupados com intervalo de classe
Para o cálculo dos quartis para dados agrupados com intervalo de classe,
utilizam-se técnicas semelhantes àquelas do cálculo dos quartis para dados
agrupados sem intervalo de classe.
Inicialmente, calcula-se a posição de Qk para estabelecer em que classe se
localiza o quartil considerado
k×n
P osQk =
4
Obtida a posição de Qk , localiza-se o valor da mesma na frequência
acumulada, para conhecer qual é a classe que corresponde a essa posição,
a qual damos o nome de ”classe do quartil k”.
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 17 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas separatrizes

Quartis
Cálculo dos quartis para dados agrupados com intervalo de classe
Em seguida, determina-se o valor da variável que corresponde ao quartil k,
através da seguinte fórmula:
" #
k×n
4 − F acanterior
Qk = lQk + × hQ k
fQk

onde:
lQk = limite inferior do intervalo de classe do quartil considerado;
F acanterior = frequência acumulada da classe anterior à classe do quartil
considerado; fQk = frequência simples da classe do quartil considerado;
hQk = amplitude do intervalo de classe do quartil considerado.
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 18 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas separatrizes

Decis
Nos decis, a série é dividida em dez partes iguais, com o mesmo número
de elementos, de tal forma que cada intervalo do decil contenha 10% dos
elementos colectados. Os elementos separatrizes da série são:
D1 , D2 , ..., D9 . Interpretação dos decis:
O D1 separa os primeiros 10% dos elementos da série;
O D2 separa os primeiros 20% (10% + 10%) dos elementos da série;
...
O D9 separa os primeiros 90% dos elementos da série.
Def: Dk é o valor da variável que corresponde à classe desse decil
considerado. Sendo que k indica a posição do decil (k = 1, 2, ..., 9).

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 19 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Decis
Cálculo dos decis
O cálculo dos decis é feito de maneira análoga ao cálculo dos quartis, seja
para dados simples ou agrupados com e sem intervalos de classe.
Assim, para dados simples, calcula-se a posição do decil através da
expressão seguinte:
k×n
P osDk =
10
Para dados agrupados sem intervalos de classe, após obter a posição
de Dk , localiza-se o valor da mesma na frequência acumulada, para
conhecer qual é a classe que corresponde a essa posição,

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 20 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Decis
Cálculo dos decis
a qual damos o nome de ”classe do decil k”. Em seguida, verifica-se o
valor da variável correspondente a classe do decil k considerado.
Para dados agrupados com intervalos de classe, após obter a posição
de Dk e localizar a classe do decil k, determina-se o valor da variável que
corresponde ao decil Dk através da fórmula a seguir:
" #
k×n
10 − F acanterior
Dk = lDk + × hDk
fDk

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 21 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Decis
Cálculo dos decis
onde:
lDk = limite inferior do intervalo de classe do decil considerado;
F acanterior = frequência acumulada da classe anterior à classe do decil
considerado; fDk = frequência simples da classe do decil considerado;
hDk = amplitude do intervalo de classe do decil considerado.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 22 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas separatrizes

Percentis
Nos percentis, a série é dividida em cem (100) partes iguais, de tal forma
que cada intervalo do percentil contenha 1% dos elementos colectados. Os
elementos separatrizes da série são: P1 , P2 , ..., P99 . Interpretação dos
percentis:
O P1 separa os primeiros 1% dos elementos da série;
O P2 separa os primeiros 2% (1% + 1%) dos elementos da série;
...
O P99 separa os primeiros 99% dos elementos da série.
Def: Pk é o valor da variável que corresponde à classe desse percentil
considerado. Sendo que k indica a posição do percentil (k = 1, 2, ..., 99).

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 23 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Percentis
Cálculo dos percentis
O cálculo dos percentis é feito de maneira análoga ao cálculo dos decis,
seja para dados simples ou agrupados com e sem intervalos de classe.
Assim, para dados simples, calcula-se a posição do percentil através da
expressão seguinte:
k×n
P osPk =
100
Para dados agrupados sem intervalos de classe, após obter a posição
de Pk , localiza-se o valor da mesma na frequência acumulada, para
conhecer qual é a classe que corresponde a essa posição,

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 24 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Percentis
Cálculo dos percentis
a qual damos o nome de ”classe do percentil k”. Em seguida, verifica-se o
valor da variável correspondente a classe do percentil k considerado.
Para dados agrupados com intervalos de classe, após obter a posição
de Pk e localizar a classe do percentil k, determina-se o valor da variável
que corresponde ao percentil Pk através da fórmula a seguir:
" #
k×n
100 − F acanterior
Pk = lPk + × hPk
fPk

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 25 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas separatrizes

Percentis
Cálculo dos percentis
onde:
lPk = limite inferior do intervalo de classe do percentil considerado;
F acanterior = frequência acumulada da classe anterior à classe do percentil
considerado; fPk = frequência simples da classe do percentil considerado;
hPk = amplitude do intervalo de classe do percentil considerado.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 26 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade


A interpretação de dados estatı́sticos exige que se realize um número
maior de estudos, além das medidas de posição. O estudo das médias,
medianas, moda, quartis, decis e percentis são válidos, mas não suficientes
para estudos comparativos ou conclusões qualitativas. Também é
importante descrever o conjunto de valores do grupo em termos da
variação existente entre seus elementos. Quanto maior a variação dos
dados, menor a representatividade da média. Sendo assim, pode-se dizer
que as medidas de dispersão são úteis para qualificar a média. Quanto
menor a dispersão, maior a homogeneidade na concentração entre os
elementos do conjunto de valores, e mais confiável é a média.
As medidas de dispersão servem para verificar a representatividade das
medidas de posição. Das medidas de dispersão estudaremos:

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 27 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade
Amplitude total;
Variância e desvio-padrão;
Coeficiente de variação.

Amplitude total
Cálculo da amplitude total para série simples: para dados não
agrupados, a amplitude total é a diferença entre o maior e o menor valor
da série de dados colectados.

AT = Xmax − Xmin

Cálculo da amplitude total para dados agrupados numa distribuição


de frequência: levando-se em conta a variável em estudo, a amplitude
total é a diferença
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 28 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Amplitude total
entre o limite superior da classe mais alta e o limite inferior da classe mais
baixa.
AT = Lmax − lmin
A amplitude total é útil em casos como a medida de temperatura de uma
localidade, em que pode-se estabelecer a amplitude da temperatura em
um dia, semana, mês ou ano. Para a programação de um evento, é
importante e significativo conhecer a amplitude da temperatura da região
durante os últimos dias, semanas, meses ou anos.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 29 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


A variância é a medida de dispersão mais empregada, pois leva em
consideração todos os valores colectados para a variável em estudo. É um
indicador de variabilidade mais confiável. O desvio-padrão é a medida mais
usada na comparação de diferenças entre conjunto de dados, por ter
grande precisão. O desvio-padrão determina a dispersão dos valores em
relação à média.
A variância relaciona os desvios em torno da média, ou mais
especificamente é a média aritmética dos quadrados dos desvios.
Valores da série próximos uns dos outros originam um desvio-padrão
menor. Isso significa que, quanto menor for o valor do desvio-padrão,
menor será a dispersão dos valores da série, ou seja, trata-se de uma
série de valores com menor variação (série mais homogénea);
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 30 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Valores da série muito afastados uns dos outros originam um
desvio-padrão maior. Isso significa que, quanto maior for o valor do
desvio-padrão, maior será a dispersão dos valores da série, ou seja,
trata-se de uma série de valores com maior variação (série mais
heterogénea).

Nota
O desvio-padrão é a raiz quadrada da variância, e consequentemente a
variância é o quadrado do desvio-padrão.

V ariancia = (σ)2 Desvio − padrao = σ 2 = σ

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 31 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
definição
O desvio-padrão e a variância de uma série podem ser calculados para
duas situações de colecta dos dados, população e amostra. As fórmulas
são diferentes para cada caso, uma vez que deve haver um ajuste para o
cálculo dessas grandezas quando os dados colectados referem-se a
amostras.
Cálculo da variância de uma população (pela definição): a
variância é a média aritmética dos quadrados dos desvios.

(xi − x̄)2
P P 2
di
σ2 = =
n n
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 32 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
definição
sendo: σ 2 = variância; x̄ = valor da média aritmética; xi = valor da
i-ésima observação da variável em estudo; d2i = desvio da variável em
relação a sua média.
Cálculo da variância de uma amostra (pela definição): conforme
citado anteriormente, o cálculo da variância para uma amostra deve
apresentar uma correção em relação ao mesmo cálculo para a
população. Nestes casos, a variância representa uma descrição da
amostra e não da população (este tipo de ocorrência é mais comum
na estatı́stica), o denominador passa a ser ”n − 1” ao invés de ”n”;
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 33 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
definição
a modificação do denominador constitui um ”factor de ajuste” visando
corrigir o facto de o número de elementos da amostra ser menor que o
número de elementos da população.

(xi − x̄)2
P P 2
2 di
σ = =
n−1 n−1

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 34 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
definição
Cálculo do desvio-padrão de uma amostra (pela definição): da
mesma forma que para a variância, caso o desvio-padrão represente
uma descrição da amostra e não da população, o denominador passa
a ser ”n − 1” ao invés de ”n”; o desvio-padrão é √calculado por meio
da raiz quadrada da variância para amostra: σ = σ 2
rP sP
(xi − x̄)2 d2i
σ= =
n−1 n−1

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 35 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
fórmula alternativa
O valor médio em algumas séries resulta números decimais,
consequentemente, o cálculo da variância e do desvio-padrão pode-se
estender num somatório do quadrado de números decimais. Com o
objectivo de simplificar os cálculos matemáticos, utiliza-se uma fórmula
alternativa para o cálculo da variância e do desvio-padrão.
Cálculo da variância de uma populaçãoP(pela fórmula
alternativa): levando em conta que x̄ = nxi e que
2
P
(xi − x̄)2 = x2i − ( nxi )
P P

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 36 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
fórmula alternativa
Fazemos a substituição desses valores na expressão da variância e obtemos:

2
P 2 (P xi )2
xi − n
P
(x i − x̄)
σ2 = =
n n
X P 2
1 ( xi )
σ2 = x2i −
n n
De forma análoga a anterior, obtemos a seguintes fórmulas:

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 37 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
fórmula alternativa
Cálculo da variância de uma amostra (pela fórmula alternativa):

( xi )2
X P 
2 1 2
σ = xi −
n−1 n

Cálculo do desvio-padrão de uma população (pela fórmula


alternativa): s 
1 X 2 ( xi )2
P 
σ= xi −
n n
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 38 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para séries simples pela
fórmula alternativa
Cálculo do desvio-padrão de uma amostra (pela fórmula
alternativa): s
( xi )2
X P 
1 2
σ= xi −
n−1 n

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 39 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para dados agrupados pela
definição
Cálculo da variância para população (pela definição):

(xi − x̄)2 × fi
P
2
σ =
n
Cálculo da variância para amostra (pela definição):

(xi − x̄)2 × fi
P
2
σ =
n−1

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 40 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para dados agrupados pela
definição
Cálculo do desvio-padrão para população (pela definição):
rP
(xi − x̄)2 × fi
σ=
n
Cálculo do desvio-padrão para amostra (pela definição):
sP
(xi − x̄)2 × fi
σ=
n−1
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 41 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para dados agrupados pela
fórmula alternativa
Cálculo da variância para população (pela fórmula alternativa):

( xi fi )2
 P 
2 1 X 2
σ = xi fi −
n n

Cálculo da variância para amostra (pela fórmula alternativa):

( xi fi )2
X P 
2 1 2
σ = xi fi −
n−1 n

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 42 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Cálculo do desvio-padrão e variância para dados agrupados pela
fórmula alternativa
Cálculo do desvio-padrão para população (pela fórmula
alternativa): s 
( xi fi )2
P 
1 X 2
σ= xi fi −
n n
Cálculo do desvio-padrão para amostra (pela fórmula
alternativa):
s
( xi fi )2
X P 
1 2
σ= x fi −
n − 1ESTATÍSTICAiI
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ)
n May 17, 2019 43 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Variância (σ 2 ) e Desvio-padrão (σ)


Propriedades do desvio-padrão
Adicionando ou subtraindo um mesmo valor de todos os valores de
uma variável, o desvio-padrão não se altera;
Multiplicando ou dividindo todos os valores de uma variável por um
mesmo número (diferente de zero), o desvio-padrão fica multiplicado
ou dividido por esse número.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 44 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Dispersão absoluta e relativa na comparação de duas séries


estatı́sticas
A dispersão relativa é a razão entre a dispersão absoluta e o valor da
média.
dispersão absoluta
dispersão relativa =
média
Dispersão absoluta: é medida pelo desvio-padrão (a série com maior
valor de desvio-padrão terá maior dispersão absoluta).
Dispersão relativa: é medida pelo coeficiente de variação (a série com
maior coeficiente de variação terá maior dispersão relativa).

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 45 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Coeficiente de variação ou coeficiente de variação de Pearson


Como referido anteriormente, o coeficiente de variação ou coeficiente de
variação de Pearson, mede a dispersão relativa da série de dados
colectados. É a razão entre o desvio-padrão e o valor da média.
Utiliza-se na comparação do grau de concentração em torno da média para
duas ou mais séries distintas, sendo que, a série mais homogénea é aquela
que tem menor coeficiente de variação.
O coeficiente pode ser expresso por valor decimal ou por valor percentual.
CV = σx̄ ou CV = σx̄ × 100

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 46 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Curvas simétricas e assimétricas


Uma curva plana é simétrica se for possı́vel dividi-la por uma recta
(chamada eixo de simetria), de forma que as duas metades da curva assim
obtidas possam ser sobrepostas por dobragem. Uma curva assimétrica é
uma curva não simétrica.
Distribuição de frequência representada por uma curva simétrica
Na estatı́stica, ocorrem distribuições de frequências, cuja representação
gráfica é uma curva normal, caso particular de uma curva simétrica.
A curva normal é também conhecida como curva em forma de sino.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 47 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Curvas simétricas e assimétricas


Pico da curva: é o valor modal, que corresponde ao maior valor da
frequência.
O eixo de simetria contém o valor modal. A partir desse eixo de simetria,
observa-se que cada metade da curva prolonga-se indefinidamente tanto
para o lado direito como para o lado esquerdo, porém, sem tocar o eixo
horizontal.
Uma distribuição de frequência representada por uma curva normal é
unimodal (tem apenas um pico).

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 48 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Curvas simétricas e assimétricas


Representação gráfica da Curva Simétrica

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 49 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Curvas simétricas e assimétricas


Nas distribuições de frequência simétricas, a média, mediana e moda são
iguais. Na curva normal, os valores da média, mediana e moda
(x̄ = Md = Mo ) coincidem no mesmo ponto da curva de distribuição de
frequência, que corresponde ao pico da curva.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 50 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Curvas simétricas e assimétricas


Distribuição de frequência representada por curva assimétrica
Tanto nas representações gráficas de distribuição de frequência simétrica
quanto nas assimétricas o pico da curva corresponde ao valor modal.
Observa-se que na curva de distribuição de frequência assimétrica a
distribuição de pontos do lado esquerdo da curva em relação à moda é
diferente da distribuição dos pontos do lado direito da curva.
Uma distribuição de frequência é assimétrica quando a média, a mediana e
a moda não coincidem num mesmo ponto da representação gráfica da
distribuição, apresentando valores diferentes.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 51 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Curvas simétricas e assimétricas


Representação gráfica das Curvas Assimétrica

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 52 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Coeficiente de assimetria de Pearson


O coeficiente de assimetria de Pearson estabelece o grau de assimetria de
uma curva de distribuição de frequências, ou seja, mede o afastamento da
mediana em relação à média aritmética da distribuição.
O coeficiente de assimetria é expresso pela diferença entre a média e a
mediana dividida pelo desvio-padrão do grupo de medidas. O coeficiente
de assimetria de Pearson, permite comparar duas ou mais distribuições
diferentes quanto a sua assimetria. Quanto maior o coeficiente de
assimetria, mais assimétrica é a curva.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 53 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Coeficiente de assimetria de Pearson


3(x̄ − Md )
O coeficiente de assimetria de Pearson: As =
σ
O coeficiente de assimetria pode ser nulo, positivo ou negativo. Se As for:
nulo: indica que a curva é simétrica, ou seja, não há assimetria;
positivo: indica que a assimetria é positiva (deslocamento para a
direita);
negativo: indica que a assimetria é negativa (deslocamento para a
esquerda);

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 54 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Curtose
Curtose é o grau de achatamento (ou afilamento) de uma distribuição em
comparação com uma curva normal de referência. De acordo com o grau
de curtose, classificamos três tipos de curvas de frequência:
Mesocúrtica: é uma curva básica de referência chamada curva
padrão ou curva normal;
Leptocúrtica: é uma curva afilada (menos aberta) que a curva
normal;
Platicúrtica: é uma curva mais achatada (mais aberta) que a curva
normal.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 55 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Curtose
Representação gráfica da curtose

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 56 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Coeficiente percentı́lico de curtose


A medida da curtose pode ser feita pelo coeficiente percentı́lico de curtose:
Q3 − Q1
C=
2(P90 − P10 )

Sendo: C = coeficiente percentı́lico de curtose; Q3 e Q1 são,


respectivamente, o terceiro e o primeiro quartil; P90 e P10 são,
respectivamente, o nonagésimo e o décimo percentil.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 57 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Coeficiente percentı́lico de curtose


Uma curva normal apresenta um coeficiente percentı́lico de curtose de
valor C = 0, 263. Tomando-se esse valor como padrão, podem-se
estabelecer comparações entre as diversas curvas:
C = 0, 263 corresponde à curva mesocúrtica;
C < 0, 263 corresponde à curva leptocúrtica;
C > 0, 263 corresponde à curva platicúrtica.

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 58 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Propriedades da aplicação do desvio-padrão


As aplicações nos permitem entender porque o desvio-padrão é a mais
importante das medidas de dispersão.
Distribuições normais
A curva normal pode ser completamente especificada pelo valor da média
e pelo valor do desvio-padrão. A área limitada pela curva normal, entre
um ponto qualquer e a média, é função do número de desvios-padrão que
aquele ponto dista da média.
Estudos matemáticos estabeleceram as seguintes proporções:
A área total limitada pela curva normal é unitária (área = 1)

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 59 / 61


CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão
Medidas de dispersão ou de variabilidade

Propriedades da aplicação do desvio-padrão


Intervalo de amplitude 2σ (também chamado zona de
normalidade) é definido pelo conjunto de valores em torno da média
aritmética, contidos num intervalo de amplitude 2σ, com centro na
média da distribuição. É o conjunto de valores entre (x̄ − σ) e
(x̄ + σ). Abrange 68% dos elementos da série.
Intervalo de amplitude 4σ (quatro vezes o desvio-padrão) é o
conjunto de valores compreendido entre (x̄ − 2σ) e (x̄ + 2σ) em torno
da média, abrange cerca de 95% dos elementos da série.
Intervalo de amplitude 6σ (seis desvios-padrão) é o conjunto de
valores compreendido entre (x̄ − 3σ) e (x̄ + 3σ) em torno da média,
abrange aproximadamente de 100% da série.
Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 60 / 61
CAP 5. Medidas de Tendência Central, Separatrizes e de
Dispersão

Medidas de dispersão ou de variabilidade

Propriedades da aplicação do desvio-padrão


Representação gráfica da zona de normalidade

Alcides O. Nunda; Osvaldo Mame (UJES/FEC/DMQ) ESTATÍSTICA I May 17, 2019 61 / 61

Вам также может понравиться