Академический Документы
Профессиональный Документы
Культура Документы
1. INTRODUO
ESTATSTICA:
ANTIGUIDADE:
IDADE MDIA:
SEC. XVI:
SEC. XVIII: a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL. As
tabelas ficam mais completas, surgem as primeiras representaes grficas e os clculos
de probabilidades. A estatstica deixa de ser uma simples tabulao de dados numricos
para se tornar "O estudo de como se chegar a concluso sobre uma populao,
partindo da observao de partes dessa populao (amostra)".
MTODO ESTATSTICO
MTODO:
MTODOS CIENTFICOS:
MTODO EXPERIMENTAL:
MTODO ESTATSTICO:
A ESTATSTICA
uma parte da matemtica aplicada que fornece mtodos para coleta, organizao,
descrio, anlise e interpretao de dados e para a utilizao dos mesmos na tomada de
decises.
2 - PLANEJAMENTO :
3 - COLETA DE DADOS:
Dados primrios:
Dados secundrios:
OBS:
Coleta Direta:
descrever
descritiva).
fenmeno
(estatstica
Fenmenos individuais:
Fenmenos de multido:
DADO ESTATSTICO:
POPULAO:
AMOSTRA:
PARMETROS:
ESTIMATIVA:
VARIVEL QUALITATIVA:
AMOSTRAGEM
MTODOS PROBABILSTICOS
Exige que cada elemento da populao possua determinada probabilidade de ser selecionado.
Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da populao, a
probabilidade de cada elemento ser selecionado ser 1/N. Trata-se do mtodo que garante
cientificamente a aplicao das tcnicas estatsticas de inferncias. Somente com base em
amostragens probabilsticas que se podem realizar inferncias ou indues sobre a populao
a partir do conhecimento da amostra.
uma tcnica especial para recolher amostras, que garantem, tanto quanto
possvel, o acaso na escolha.
.
AMOSTRAGEM CASUAL ou ALEATRIA SIMPLES
10 %
5,4
3,6
9,0
AMOSTR
A
5
4
9
MTODOS NO PROBABILSITCOS
AMOSTRAGEM ACIDENTAL
Trata-se de uma amostra formada por aqueles elementos que vo aparecendo, que so
possveis de se obter at completar o nmero de elementos da amostra. Geralmente utilizada
em pesquisas de opinio, em que os entrevistados so acidentalmente escolhidos.
Ex: Pesquisas de opinio em praas pblicas, ruas de grandes cidades;
AMOSTRAGEM INTENCIONAL
SRIES ESTATSTICAS
TABELA:
De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemos colocar :
um trao horizontal ( - ) quando o valor zero;
trs pontos ( ... ) quando no temos os dados;
zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade
utilizada;
SRIE ESTATSTICA:
SRIES HOMGRADAS:
a) Srie Temporal:
UNIDADES VENDIDAS
20000
10000
30000
.
b) Srie Geogrfica:
c) Srie Especfica:
UNIDADES VENDIDAS
13000
17000
30000
UNIDADES VENDIDAS *
18000
12000
30000
SRIES CONJUGADAS:
Janeiro/96
10000
12000
22000
Fevereiro/96
3000
5000
8000
GRFICOS ESTATSTICOSG
So representaes visuais dos dados estatsticos que devem corresponder, mas nunca substituir
as tabelas estatsticas.
Caractersticas:
Grficos de informao:
Grficos de anlise:
Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendo analisados,
chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construo de
escalas.
.
Classificao dos grficos: Diagramas, Estereogramas, Pictogramas e Cartogramas.
.
1 - DIAGRAMAS:
1.1-
1.2-
1.2-
1.4-
1.5-
Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de apresentar
cada barra ou coluna segmentada em partes componentes. Servem para representar
comparativamente dois ou mais atributos.
1.5-
Grficos em setores.
Este grfico construdo com base em um crculo, e empregado sempre que desejamos
ressaltar a participao do dado no total. O total representado pelo crculo, que fica dividido
em tantos setores quantas so as partes. Os setores so tais que suas reas so respectivamente
proporcionais aos dados da srie. O grfico em setores s deve ser empregado quando h, no
mximo, sete dados.
.
2 - ESTEREOGRAMAS:
4- CARTOGRAMAS:
DISTRIBUIO DE FREQNCIA
um tipo de tabela que condensa uma coleo de dados conforme as freqncias (repeties
de seus valores).
Tabela primitiva ou dados brutos:
Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51
ROL:
Freqncia
3
2
1
1
1
2
2
1
1
54
57
58
60
Total
1
1
2
2
20
CLASSE:
LIMITES DE CLASSE:
2 -
3 -
No nosso exmplo: AA = 60 - 41 = 19
I
n de classes
3 |-----| 5
3
6 |-----| 11
4
12 |-----| 22
5
23 |-----| 46
6
47 |-----| 90
7
91 |-----| 181 8
182 |-----| 362 9
n
Obs: Qualquer regra para determinao do n de classes da tabela no nos levam a uma
deciso final; esta vai depender, na realidade de um julgamento pessoal, que deve estar
ligado natureza dos dados.
No nosso exemplo: n = 20 dados, ento ,a princpio, a regra sugere a adoo de 5 classes.
4 -
5 -
.
Histograma:
Freqncias relativas:
.
Polgono de freqncia:
.
Polgono de freqncia acumulada:
...CLASSE..
50 |-------- 54
54 |-------- 58
58 |-------- 62
62 |-------- 66
66 |-------- 70
70 |-------- 74
Total
......fi.....
4
9
11
8
5
3
40
.....xi.....
52
56
60
64
68
72
.....fri.....
0,100
0,225
0,275
0,200
0,125
0,075
1,000
.....Fi.....
4
13
24
32
37
40
......Fri.....
0,100
0,325
0,600
0,800
0,925
1,000
Obs: uma distribuio de freqncia sem intervalos de classe representada graficamente por
um diagrama onde cada valor da varivel representado por um segmento de reta vertical e de
comprimento proporcional respectiva freqncia.
3. MEDIDAS DE POSIO
Introduo
As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda e mediana.
Outros promdios menos usados so as mdias: geomtrica, harmnica, quadrtica, cbica e
biquadrtica.
MDIA ARITMTICA =
igual ao quociente entre a soma dos valores do conjunto e o nmero total dos valores.
......
Ex:
Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de 10, 14, 13,
15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de:
.= (10+14+13+15+16+18+12) / 7 = 14 kilos
No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , d3 = 13 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. .. d7 = 12 - 14 = 2.
.
1 propriedade:
2 propriedade:
Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou
Y=
3 propriedade:
.+ 2 = 14 +2 = 16 kilos
Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou
Y=
.
Dados agrupados:
x 3 = 14 x 3 = 42 kilos
freqncia = fi
2
6
10
12
4
34
..xi.
0
1
2
3
4
total
..fi.
2
6
10
12
4
34
..xi.fi .
0
6
20
36
16
78
freqncia = fi
4
9
11
8
5
3
ponto mdio = xi
52
56
60
64
68
72
..xi.fi.
208
504
660
512
340
216
Total
40
2.440
= 61 cm
ou .
= ( 10 * 60 * 36 0) ^ (1/3) ....R: 60
= (2 * 2 * 2 ^ (1/3) .. .R: 2
= (1 * 4 * 16 * 64 ) ^(1/4) ....R: 8
ou ..
Ex - Calcular a mdia geomtrica dos valores da tabela abaixo:
...xi... ...fi...
1
2
3
4
9
2
27
1
Total 9
= (12 * 34 * 92 * 271) (1/9)........R: 3,8296
.
MDIA HARMNICA -
..
ou
.
Mdia Harmnica Ponderada : (para dados agrupados em tabelas de freqncias)
..
....fi....
2
4
8
4
2
20
....xi....
2
4
6
8
10
........fi/xi........
2/2 = 1,00
4/4 = 1,00
8/6 = 1,33
4/8 = 0,50
2/10 = 0,20
4,03
A mdia harmnica no aceita valores iguais a zero como dados de uma srie.
A igualdade
OBS:
g=
h.=
g=(
.+
h ) /.2
= 10,2600
= 10,2587
= 10,2574
MODA - Mo
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais comum, isto , o
salrio recebido pelo maior nmero de empregados dessa fbrica.
.
A Moda quando os dados no esto agrupados
A moda facilmente reconhecida: basta, de acordo com definio, procurar o valor que mais se
repete.
Ex: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor aparea mais vezes
que outros.
Ex: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
.Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos, ento, que a
srie tem dois ou mais valores modais.
Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A srie
bimodal.
.
A Moda quando os dados esto agrupados
a) Sem intervalos de classe:
Freqncia
3
9
12
6
Freqncia
9
11
8
5
.
Mtodo mais elaborado pela frmula de CZUBER:
Mo = l* + (d1/(d1+d2)) x h*
Mo = 59,6
Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximada de
posio ou quando a medida de posio deva ser o valor mais tpico da distribuio. J a
mdia aritmtica a medida de posio que possui a maior estabilidade.
MEDIANA - Md
.
A mediana em dados no-agrupados
Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }
De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou
decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }
O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9.
.
Mtodo prtico para o clculo da Mediana:
Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de ordem
dado pela frmula :
.( n + 1 ) / 2
n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor
correspondente.
Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }
1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }
n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2
[( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 2
5 termo = 2
6 termo = 3
A mediana ser = (2+3) / 2 ou seja, Md = 2,5 . A mediana no exemplo ser a mdia aritmtica
do 5 e 6 termos da srie.
Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da mediana
com um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, nunca haver coincidncia da
mediana com um dos elementos da srie. A mediana ser sempre a mdia aritmtica dos 2
elementos centrais da srie.
A mediana, depende da posio e no dos valores dos elementos na srie ordenada. Essa
uma da diferenas marcantes entre mediana e mdia ( que se deixa influenciar, e muito,
pelos valores extremos). Vejamos:
Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10
Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10
isto , a mdia do segundo conjunto de valores maior do que a do primeiro, por influncia dos
valores extremos, ao passo que a mediana permanece a mesma.
Freqncia fi
2
6
9
13
5
35
Freqncia acumulada
2
8
17
30
35
Quando o somatrio das freqncias for mpar o valor mediano ser o termo de ordem dado
pela frmula :
Quando o somatrio das freqncias for par o valor mediano ser o termo de ordem dado pela
frmula:
Freqncia fi
1
2
1
2
1
1
8
Freqncia acumulada
1
3
4
6
7
8
1)
2)
Calculamos
3)
M Md = l* + [(
- FAA ) x h*] / f*
freqncia = fi
4
9
11
8
5
3
40
Freqncia acumulada
4
13
24
32
37
40
SEPARATRIZES
Alm das medidas de posio que estudamos, h outras que, consideradas individualmente, no
so medidas de tendncia central, mas esto ligadas mediana relativamente sua
caracterstica de separar a srie em duas partes que apresentam o mesmo nmero de valores.
Essas medidas - os quartis, os decis e os percentis - so, juntamente com a mediana,
conhecidas pelo nome genrico de separatrizes.
.
QUARTIS - Q
Denominamos quartis os valores de uma srie que a dividem em quatro partes iguais.
Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a srie em quatro partes iguais.
Obs: O quartil 2 ( Q2 ) SEMPRE SER IGUAL A MEDIANA DA SRIE.
Assim, temos:
Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*
Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f*
Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f*
freqncia = fi
4
9
11
8
5
3
40
Freqncia acumulada
4
13
24
32
37
40
- O quartil 2 = Md , logo:
= 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62
l* = 58........... FAA = 13........... f* = 11........... h* = 4
Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f*
- Substituindo esses valores na frmula, obtemos:
Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 = Q2
- O quartil 1 : E fi / 4 = 10
Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f*
Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1
.
- O quartil 3 : 3.E fi / 4 = 30
Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f*
Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3
DECIS - D
A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao da
porcentagem de valores que ficam aqum e alm do decil que se pretende calcular. A frmula
bsica ser : k .E fi / 10 onde k o nmero de ordem do decil a ser calculado. Indicamos os
decis : D1, D2, ... , D9. Deste modo precisamos de 9 decis para dividirmos uma srie em 10
partes iguais.
De especial interesse o quinto decil, que divide o conjunto em duas partes iguais. Assim
sendo,o QUINTO DECIL IGUAL AO SEGUNDO QUARTIL, que por sua vez IGUAL
MEDIANA.
Para D5 temos :
5.E fi / 10 = E fi / 2
PERCENTIL ou CENTIL
Denominamos percentis ou centis como sendo os noventa e nove valores que separam uma
srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente que P50 = Md ; P25 = Q1 e
P75 = Q3.
O clculo de um centil segue a mesma tcnica do clculo da mediana, porm a frmula ser
: k .E fi / 100 onde k o nmero de ordem do centil a ser calculado.
Disperso ou Variabilidade:
A mdia - ainda que considerada como um nmero que tem a faculdade de representar uma
srie de valores - no pode, por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compem o conjunto.
Observamos ento que os trs conjuntos apresentam a mesma mdia aritmtica = 350/5
= 70
Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntos Y e Z, j que
todos os valores so iguais mdia. O conjunto Y, por sua vez, mais homogneo que o
conjunto Z, pois h menor diversificao entre cada um de seus valores e a mdia
representativa.
Quando os dados no esto agrupados a amplitude total a diferena entrE o maior e o menor
valor observado:
AT = X mximo - X mnimo.
Ex:
Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: AT = 70 - 40 = 30
Quando os dados esto agrupados sem intervalos de classe ainda temos :
AT = X mximo - X mnimo.
Ex:
xi
0
1
3
4
fi
2
6
5
3
AT = 4 - 0 = 4
* Com intervalos de classe a AMPLITUDE TOTAL a diferena entre o limite superior da ltima
classe e o limite inferior da primeira classe. Ento:
AT = L mximo - l mnimo
Ex:
Classes
4 |------------- 6
6 |------------- 8
8 |------------- 10
fi
6
2
3
AT = 10 - 4 = 6
A amplitude total tem o inconveniente de s levar em conta os dois valores extremos da srie,
descuidando do conjunto de valores intermedirios. Faz-se uso da amplitude total quando se
DESVIO QUARTIL:
Observaes:
1-
O desvio quartil apresenta como vantagem o fato de ser uma medida fcil de calcular e de
interpretar. Alm do mais, no afetado pelos valores extremos, grandes ou pequenos, sendo
recomendado, por conseguinte, quando entre os dados figurem valores extremos que no se
consideram representativos.
O desvio quartil dever ser usado preferencialmente quando a medida de tendncia central for a
mediana.
Trata-se de uma medida insensvel distribuio dos itens menores que Q1, entre Q1 e Q3 e
maiores que Q3.
23-
Q3 = (70+62)/2 = 66
para a Mdia =
Dm = E | Xi -
para a Mediana =
Dm = E | Xi - Md | / n
As barras verticais indicam que so tomados os valores absolutos, prescindindo do sinal dos
desvios.
| /n
Xi (- 4) - (-0,2) = -3,8
(- 3) - (-0,2) = -2,8
(- 2) - (-0,2) = -1,8
3 - (-0,2) = 3,2
5 - (-0,2) = 5,2
| Xi 3,8
2,8
1,8
3,2
5,2
E=
16,8
Xi - Md
| Xi - Md |
(- 4) - (-2) = - 2
(- 3) - (-2) = - 1
(- 2) - (-2) = 0
3 - (-2) = 5
5 - (-2) = 7
2
1
0
5
7
E=
15
Pela Mediana :
Dm = 15 / 5 = 3
DESVIO PADRO - S
- 0,2
- 0,2
- 0,2
- 0,2
- 0,2
- 3,8
- 2,8
- 1,8
3,2
5,2
14,44
7,84
3,24
10,24
27,04
E=
62,8
1 =
Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio
padro no se altera.
2 =
Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante
(diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.
Quando os dados esto agrupados (temos a presena de freqncias) a frmula do desvio padro
ficar :
ou
Ex:
fi
Xi . f i
2
6
12
7
3
0
6
24
21
12
Total 30
63
.fi
2,1
2,1
2,1
2,1
2,1
-2,1
-1,1
-0,1
0,9
1,9
4,41
1,21
0,01
0,81
3,61
8,82
7,26
0,12
5,67
10,83
E=
32,70
a raiz
Obs: Nas tabelas de freqncias com intervalos de classe a frmula a ser utilizada a mesma
do exemplo anterior.
VARINCIA - S2
o desvio padro elevado ao quadrado. A varincia uma medida que tem pouca utilidade
como estatstica descritiva, porm extremamente importante na inferncia estatstica e em
combinaes de amostras.
Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, um desvio
padro de 2 unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio
200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito.
Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais sries de valores, relativamente sua
disperso ou variabilidade, quando expressas em unidades diferentes.
CVP = (S /
) x 100
Ex: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivduos:
Discriminao M D I A
ESTATURAS 175 cm
PESOS
68 kg
DESVIO PADRO
5,0 cm
2,0 kg
( 5 / 175 ) x 100
( 2 / 68 ) x 100
= 2,85 %
= 2,94 %.
Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de disperso que os pesos.
CVT = ( S / Md ) x 100 %
5. MEDIDAS DE ASSIMETRIA
Introduo:
Coeficiente de assimetria:
Escalas de assimetria:
| AS | < 0,15
assimetria pequena
assimetria moderada
| AS | > 1
assimetria elevada
MEDIDAS DE CURTOSE
Introduo:
Quando a distribuio apresenta uma curva de freqncia mais fechada que a normal (ou
mais aguda ou afilada em sua parte superior), ela recebe o nome de leptocrtica.
Quando a distribuio apresenta uma curva de freqncia mais aberta que a normal (ou mais
achatada em sua parte superior), ela recebe o nome de platicrtica.
Coeficiente de curtose
C1 = 0,263
C1 < 0,263
C1 > 0,263
curva mesocrtica
curva leptocrtica
curva platicrtica
FIM