Академический Документы
Профессиональный Документы
Культура Документы
Disciplina: Estatstica
Ano: 2016
1
A anlise dos dados deve ser realizada pelo pesquisador, com a ajuda de um
estatstico, aplicando os recursos estatsticos necessrios para refutar ou no as hipteses
previamente formuladas.
2 AMOSTRAGEM COLETA DE DADOS
A amostragem naturalmente usada na vida diria. Por exemplo, para verificar o tempero de
um alimento em preparao, pode-se provar (observar) uma pequena poro deste alimento. Desta
forma, est se fazendo uma amostragem, ou seja, extraindo do todo (populao) uma parte
(amostra), com o propsito de avaliar (inferir) a qualidade de tempero de todo o alimento.
Nas pesquisas cientficas em que se quer conhecer algumas caractersticas de uma
populao, tambm muito comum se observar apenas uma amostra de seus elementos e, a partir
dos resultados dessa amostra, obter valores aproximados, ou estimativas, para as caractersticas
populacionais de interesse. Este tipo de pesquisa usualmente chamado de levantamento por
amostragem.
Num levantamento por amostragem, a seleo dos elementos que sero observados, deve ser
feita sob uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos
para avaliar caractersticas de toda a populao.
A populao pode ser formada por pessoas da famlia, indivduos de certa espcie,
estabelecimentos industriais, ou qualquer outro tipo de elementos, cujas variveis que se pretende
estudarem sejam passveis de serem mensuradas.
Os elementos de uma populao diferem entre si com respeito a fatores tais como: sexo,
idade, medidas fsicas, cor, susceptibilidade a doena, agressividade, etc. Desta forma o padro de
comportamento no qual o pesquisador esta interessado pode ser muito complicado pela grande
variabilidade existente. Por estas razes, muitos trabalhos tendem a ser de natureza comparativa,
procurando lidar com estas variaes inerentes. Alguns exemplos: pode-se estudar o nmero mdio
de ovos de certa espcie de pssaros sob uma condio ambiental particular, ou a proporo de
sujeitos protegidos por certa vacina imunolgica, etc.
2.1 DEFINIES
POPULAO: qualquer conjunto de elementos que descreve algum fenmeno do nosso
interesse. Pesquisas utilizando todos os elementos da populao denominam-se censo.
AMOSTRA: qualquer subconjunto da populao. Pesquisas utilizando amostras da
populao denominam-se pesquisa por amostragem.
PARMETROS: so certas caractersticas que especificam a populao.
INFERNCIA ESTATSTICA: refere-se ao uso apropriado dos dados da amostra, para se
ter conhecimento sobre os parmetros da populao.
ESTIMATIVA DOS PARMETROS OU ESTATSTICA: qualquer funo de uma
amostra.
ESTIMATIVA: so os valores calculados a partir dos dados da amostra, com o objetivo de
obter parmetros desconhecidos.
UNIDADE DE AMOSTRAGEM: a unidade a ser selecionada para se chegar aos
elementos da populao. Pode ser os prprios elementos da populao, ou outras unidades fceis de
serem selecionadas e que, de alguma forma, estejam associadas aos elementos da populao
5
Sexo
M
M
F
F
M
Escolaridade
Colegial
Mestrado
Universitrio
Universitrio
Colegial
Peso (kg)
78
84
52
65
75
Antigidade
5 anos
7 anos
6 anos
9 anos
12 anos
Salrio (R$)
1200,00
2500,00
2300,00
1800,00
3100,00
Processo de amostragem
Amostra : alguns elementos da
populao
Inferncia Estatstica
Estimativa de parmetros populacionais
Ex:
- tempo mdio .......
- percentagens.......
-etc
08-Minas
09-Metropolitano
10-Fazenda
11-Carioca
12-Luiz XV
13-Lancaster
14-Vermont
15-Promenade
16-Central
17-Holandes
18-Las Vegas
19-Condor
20-Praia Grande
21-Veleiro
22-Inga
23-Guapor
24-Real
25-Granada
26-Serrano
27-Eugenia
28-Atibaia
29-Sol
30-Do Vale
31-Colonia
32-Estrela
Para se utilizar uma tabela de nmeros aleatrios, preciso associar cada elemento da
populao a um nmero. Por simplicidade, ser considerado nmeros inteiros sucessivos, com a
mesma quantidade de algarismos iniciando-se por 01 (um).
Para se extrair uma amostra aleatria simples de tamanho n=5, basta tomar cinco nmeros
aleatrios do conjunto {01, 02,..., 32}. Os Hotis associados aos nmeros selecionados formaro a
amostra. Neste exemplo, suponha que foi sorteada a primeira linha. Desprezando os valores que
estiverem fora do conjunto {01, 02,..., 32} e os valores que se repetirem, tem-se:
Nmeros aleatrios extrados da tabela: 15 03 20 12 17
Amostra da populao de hotis: {Promenade, Aloysio, Praia Grande, Luiz XV, Holands}
Na prtica, interessa observar certas variveis associadas aos elementos da amostra. No
exemplo em questo, poderia se estar interessado na varivel preo da diria de apartamento de
casal. Esta varivel ser denominada de X. Para cada hotel da amostra, tem-se um valor para a
varivel X. O conjunto destes valores, observados na amostra de hotis, chamado de amostra
aleatria simples da varivel X.
Amostra aleatria simples dos hotis:
{Promenade, Aloysio, Praia Grande, Luiz XV, Holands}
Amostra aleatria simples de X: { X1,
X2,
X3,
X4,
X5}
, onde X1
representa o preo da diria do hotel Promenade, X2 representa o preo da diria do hotel Aloysio,
etc.
2.6.2 - AMOSTRAGEM SISTEMTICA
Muitas vezes possvel obter uma amostra de caractersticas parecidas com a amostra
aleatria simples, por um processo bem mais rpido. Por exemplo, tirar uma amostra de 1.000
fichas, dentre uma populao de 5.000 fichas, pode-se tirar, sistematicamente, uma ficha a cada
cinco (5.000/1.000 = 5). Para garantir que cada ficha da populao tenha a mesma probabilidade de
pertencer amostra, a primeira ficha deve ser sorteada, dentre as cinco primeiras.
Numa amostragem sistemtica a relao N/n chamada intervalo de seleo. No exemplo
das fichas o intervalo de seleo 5.000/1.000 = 5.
Exemplo 6 - Considere a populao dos N=32 hotis do Exemplo 5. Realize uma amostragem
sistemtica para obter uma amostra de tamanho n=5. Inicialmente, o intervalo de seleo deve ser
calculado: N/n = 32/5 6.
A seguir, um elemento deve ser sorteado dentre os seis primeiros. Suponha que o nmero
sorteado o 3, ou seja, o primeiro hotel da amostra o Aloysio. Os demais so obtidos pelo
intervalo de seleo 6 (ou seja, de 6 em 6), a partir do hotel Aloysio, resultando na seguinte
amostra:
(03)
(09)
(15)
{Aloysio, Metropolitano, Promenade,
(21)
Veleiro,
(27)
Eugenia}
de um conjunto de hotis, pode-se estratificar esta populao por quantidade de estrelas, pelo tipo
de acomodaes (quarto, apartamento, chal etc), ou pela distncia at o cento da cidade. Deve-se
escolher um critrio de estratificao que fornea estratos bem homogneos, com respeito ao que se
est estudando. Neste contexto, um prvio conhecimento sobre a populao em estudo
fundamental.
Sobre os diversos estratos da populao, so realizadas selees aleatrias, de forma
independente. A amostra completa obtida atravs da agregao das amostras de cada estrato. Ver
figura 2:
Estrato 1
Estrato 2
...
Estrato K
Subgrupo 1 da amostra
selees
aleatrias
Subgrupo 2 da amostra
Amostra
Estratificada
Subgrupo K da amostra
60%
20%
60%
20%
20%
20%
Duas Estrelas
Trs Estrelas
Quatro Estrelas
D1
D11
T1
Q1
D2
D12
T2
Q2
D3
D13
T3
Q3
POPULAO
D4
D5
D6
D14
D15
T4
T5
T6
Q4
Q5
Q6
D7
D8
D9
D10
T7
Q7
T8
T9
T10
Supondo que o preo da diria possa ser relativamente homogneo dentro de cada regio, foi
realizada uma amostragem estratificada, proporcional por categoria, para obter uma amostra global
de tamanho n=10. A tabela seguinte mostra as relaes de proporcionalidade.
Tabela 1. Clculo do tamanho da amostra em cada estrato
ESTRATO
Proporo na populao Tamanho do subgrupo na amostra
Duas Estrelas
15/32= 0,468 (ou 47%) n1 = (0,47).10 =5
Trs Estrelas
10/32= 0,312 (ou 31%) n2 = (0,31).10 = 3
Quatro Estrelas 7/32= 0,218 (ou 22%)
n3 = (0,22).10 = 3
Observao: Note que a soma dos tamanhos dos subgrupos na amostra deve ser igual ou maior ao
tamanho da amostra. Isto , n = n1+n2+n3.
Para selecionar aleatoriamente cinco exemplares de duas estrelas, preciso extrair nmeros
de dois algarismos. Usando a prpria numerao da populao e iniciando pela terceira linha da
tabela, tem-se: {D13, D15, D2, D12, D14}.
Para selecionar aleatoriamente trs exemplares de trs estrelas, foi utilizada a numerao j
existente na populao, substituindo o 10 por 0. Neste caso, pode-se usar a tabela de nmeros
aleatrios, tomando valores com um algarismo. Usando, por exemplo, a primeira linha da tabela de
nmeros aleatrios, os seguintes foram selecionados: {T3, T7, T6}, correspondentes aos dois
primeiros nmeros desta linha.
Para os de quatro estrelas, usando a segunda linha da tabela de nmeros aleatrios, com o
mesmo processo de numerao, tem-se: {Q1, Q3, Q5} (sem repetio).
A amostra { D13, D15, D2, D12, D14, T3, T7, T6, Q1, Q3, Q5, } uma amostra
estratificada proporcional da comunidade de hotis. Cada elemento desta amostra dever ser
pesquisado para se levantar a caracterstica de interesse, ou seja, o preo das dirias.
Desde que no problema em estudo, os estratos formam subgrupos mais homogneos do que
a populao como um todo, uma amostra estratificada proporcional tende a gerar resultados mais
precisos, quando comparada com uma amostra aleatria simples.
2.7 - FONTES DE ERROS NOS LEVANTAMENTOS POR AMOSTRAGEM
O erro amostral, definido como a diferena entre uma estatstica (calculada a partir de uma
amostra de n elementos) e o verdadeiro valor do parmetro (caracterstica de uma populao de N
elementos), parte do princpio de que as n observaes que compem a amostra so obtidas sem
erro. Na prtica, isso geralmente no acontece.
Havendo erros ou desvios nos dados da prpria amostra, a diferena entre a estatstica e o
parmetro pode ser maior que o limite tolervel, que ser usado para o clculo do tamanho da
amostra. Por isso, o planejamento e a execuo da pesquisa devem ser feitos com muita cautela,
para evitar ou reduzir, os erros nos prprios dados da amostra, conhecidos como erros no
amostrais.
Alguns dos erros no amostrais so:
- populao acessvel diferente da populao alvo; - falta de resposta; - erros de mensurao.
POPULAO
AMOSTRA
12
p
=
erro amostral
p= p
Processo de estimao
7597
3568
1336
7802
1367
5378
7270
3254
7887
8954
6798
1541
1353
9275
7499
8615
3419
4771
7898
3318
9303
5807
4656
9064
7650
4489
7685
2115
3612
3514
9243
8850
8463
9864
2797
2000
3347
4688
2515
8964
8475
0296
6778
9822
7000
1217
0190
1731
6783
7832
5066
0949
2144
6815
2006
9422
0917
1939
2792
2962
6350
4455
3487
8042
5542
1984
3076
1980
1126
8505
2783
9885
1246
2931
9755
0504
2674
0919
8598
6208
1217
7129
9046
0394
4944
0211
0525
2114
0886
8321
6775
5033
6828
7241
1478
3732
6971
6254
5897
0755
7025
9722
7151
9979
8057
7437
2959
6104
4844
3851
5534
8387
4944
7052
5257
9248
0329
5702
2170
0727
3467
5334
9657
2085
4568
7508
6031
0439
3552
1093
2059
8724
9622
2025
1367
2035
0822
6492
6077
9717
4727
4450
2872
3025
1076
2333
5539
6059
1443
9226
6830
3824
2981
4832
8005
4731
0472
4418
7518
3348
5753
1070
8179
6816
3065
9859
9729
4362
7253
8040
4702
7155
7711
6389
9023
3232
3284
0450
6059
6812
1415
8703
6876
8911
5772
8109
4462
3869
6548
9975
1856
5671
9441
6664
4415
5130
6097
8455
2302
1847
4493
9548
8960
3914
7677
3084
6945
9966
9627
0189
1644
7599
2309
4051
9621
8218
3282
0166
9509
6712
0273
4457
8482
0484
2467
3703
3269
4710
5517
6984
3202
7510
7059
3518
5969
9501
8771
1696
6694
6186
0236
5073
3076
8886
8680
8889
5423
7825
9289
5778
6871
7458
0866
5263
9560
0264
5108
6535
4103
9345
0098
6573
4011
0624
1530
9478
2546
0251
2571
8557
0019
3989
230
3820
8569
1213
9280
6308
7183
0012
9797
7907
5592
9722
6380
6906
348
1875
9759
5229
3209
5817
6828
0653
2048
3845
9122
1786
8895
6025
4647
3464
8686
2853
7057
8861
6255
9974
7826
5325
0800
3801
9919
1711
4437
7999
7526
1762
8914
0934
7169
1509
8168
2700
0136
8137
4450
6603
9595
2360
9655
5206
1364
5709
6381
3392
1589
8540
4503
9848
7766
5922
4755
4523
3091
5009
5904
6369
4463
3297
9377
4117
2415
1686
0015
1414
7345
9391
3873
9986
9535
2468
9285
1777
0824
1899
7056
7156
9000
1117
6682
1429
9795
7722
8433
7805
0627
9544
3113
1654
8670
8296
9432
5325
9695
5290
1651
4787
4640
4286
4220
0136
2072
8932
0747
3672
3889
2051
0990
3446
0793
7454
9225
9633
1802
3362
9946
2783
3240
0497
7761
1957
5076
9406
4123
13
14
3 - ESTATSTICA DESCRITIVA
Coletados os dados, surgem ento questes do tipo: Como comunicar os dados obtidos?
Como descrever e caracterizar o conjunto de dados como um todo?
Pode-se tentar l-los e adquirir uma idia subjetiva da informao nele contida. Porm em
muitas situaes isto no vivel devido ao grande nmero de dados. Alm disso, uma impresso
subjetiva no s difcil de ser transmitida como tambm pouco convincente. Assim, chegamos
concluso de que so necessrias tcnicas estatsticas que reduzam e descrevam uma grande
quantidade de informao.
Para condensar e comunicar os dados so usados dois esquemas: as tabelas e as
representaes grficas. Estas estratgias se direcionam de forma diferente quando se trata de dados
qualitativos ou quantitativos, conforme veremos em seguida. Alm disso, os dados podem ser
organizados para uma nica varivel de cada vez, ou envolvendo duas ou mais variveis.
Para caracterizar o conjunto de dados como um todo, faz-se a anlise descritiva dos mesmos
atravs das medidas descritivas.
3.1 - RESUMO E APRESENTAO DE DADOS QUALITATIVOS
3.1.1 - TABELAS:
Ao se resumir os dados coletados, em uma tabela, algumas normas devem ser seguidas:
a) Toda tabela deve conter Ttulo e Fonte.
Ttulo: a indicao que precede a tabela e que contm a designao do fato observado, o
local e a poca em que foi registrado.
Fonte: a indicao da entidade responsvel pelo fornecimento dos dados ou pela sua
elaborao.
b) Outros dois elementos primordiais na tabela so: o cabealho e a coluna indicadora. O
primeiro evidencia o contedo das colunas e fica na parte superior da tabela, o segundo mostra o
contedo das linhas.
c) Cada cruzamento entre linha e coluna denominado clula ou casa.
d) Nenhuma clula (casa) deve ficar em branco.
e) Hfen (-), indica que o valor numrico nulo.
f) Reticncia (...) , indica que no se dispe do dado.
g) Interrogao (?) , indica dvida quanto a exatido do valor numrico.
h) Zeros (0; 0,0; 0,00), indica valor muito pequeno em relao a unidade utilizada.
i) A tabela no fechada lateralmente por traos verticais.
j) No h obrigatoriedade de linha vertical entre as colunas, mas deve ser usada quando a
tabela apresenta muita informao (muitas colunas e/ou muitas linhas).
15
UNIDADES VENDIDAS
AItaplan
Lopes
Nosso Teto
Procasa
TOTAL
5186
4273
4992
3426
17877
Corpo da tabela
Total
3.1.3 - TABELAS DE DUPLA ENTRADA OU DE CONTINGNCIA: a
representao, em uma nica tabela, de valores de mais de uma varivel, isto , a conjugao de
duas tabelas simples.
TABELA 2
MIGRAO RURAL, EM MILHES POR DCADA,
EM ALGUNS ESTADOS BRASILEIROS
NOS ANOS 70 E 80
ANOS
ESTADOS
70
80
BA
0,7
1,0
RS
1,4
1,1
PR
2,4
1,5
MG
2,4
1,6
Fonte: revista ISTO , julho/98.
3.2. - SRIES ESTATSTICAS. Sries estatsticas, num sentido mais amplo, um conjunto de
dados estatsticos em funo da poca, do local ou da espcie, que podem ser apresentados em
forma de tabelas.
3.2.1. TIPOS DE SRIES ESTATSTICAS:
TEMPORAL - tambm conhecida como CRONOLGICA, EVOLUTIVA ou
HISTRICA. a srie em que os dados so observados segundo a poca de ocorrncia. Nesta
srie o fator varivel tempo e os fixos so: local e espcie.
16
TABELA 3
POSTOS DE TRABALHO, NOS BANCOS
BRASIL 1992/1997
ANO
NMERO DE POSTOS
(em milhares)
1992
677
1993
664
1994
643
1995
590
1996
524
1997
481
Fonte: revista ISTO , julho/98.
6,90***
8,18**
16,09**
11,08*
17
4. GRFICOS
Os grficos so de grande utilidade na apresentao de dados estatsticos. Os nmeros so
considerados frios e de difcil interpretao, mas ganham vida quando so substitudos por figuras
que mostram, com uma simples olhadela, o significado global de um conjunto de dados. Os grficos
mais usados para dados qualitativos so: Barras ou Colunas, Setor e Linha.
Assim como as tabelas, os grficos tambm devem ter ttulo e fonte.
EXEMPLOS:
Usando as tabelas 3, 4, 3 e 2, temos os grficos abaixo:
4.1 - GRFICO EM BARRAS (OU EM COLUNAS): So empregados para representar
informaes de qualquer tipo de varivel, inclusive o tempo (no caso em que o nmero de datas no
muito grande).
POSTOS DE TRABALHO NOS BANCOS
BRASIL - 1992/1997
N DE POSTOS
700
650
600
550
500
450
400
1992
1993
1994
1995
1996
1997
ANO
18
27%
Paran
Rio Grande do Sul
Santa Catarina
53%
Fonte: Almanaque. Abril 1996.
700
650
600
550
500
450
400
1992
1993
1994
1995
1996
1997
ANO
Fonte: revista ISTO , julho/98.
19
3
2.5
2
ANOS 70
1.5
1
ANOS 80
0.5
0
BA
RS
PR
MG
ESTADOS
Fonte: revista ISTO , julho/98.
5
3
4
4
DADOS BRUTOS (Xi): o conjunto de dados numricos obtidos aps a crtica dos valores
coletados, como acima.
Representao: - x1,...,xn ( se amostrais );
- x1,...,xN (se populacionais ).
20
ROL: o arranjo dos dados brutos em ordem crescente ou decrescente. O rol em geral, por ser
trabalhoso em sua elaborao, pode ser dispensado.
Organizando os dados brutos do exemplo 1 em ROL CRESCENTE obtemos:
ROL: 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6.
FREQNCIA ABSOLUTA (Fi): o nmero de vezes que um valor Xi aparece no conjunto de
dados.
FREQNCIAS ABSOLUTAS ACUMULADAS (Fai): Consiste em acumular o nmero vezes
que um dado Xi aparece no conjunto de dados acrescido da frequncia absoluta dos Xi's anteriores.
No exemplo 1, a distribuio de frequncia ser:
TEMPO, EM SEGUNDOS, ENTRE CARROS QUE PASSAM
POR UM CRUZAMENTO DE MARING - 02/97
TEMPO (Segundos)
Fi
Fai
2
2
2
3
4
6
4
5
11
5
3
14
6
2
16
TOTAL
16
Fonte: Departamento de Trnsito.
OBS: Na tabela acima, a coluna dos Fai's uma coluna complementar da distribuio de frequncia.
Veremos no exemplo a seguir uma distribuio de frequncia completa.
GRFICO EM BARRAS (ou em Colunas): Utilizado quando os dados consistem
em contagens e no de mensuraes em escala contnua. Os valores distintos Xi's so locados no
eixo horizontal, e em cada um deles traa-se um segmento vertical de altura proporcional
respectiva frequncia.
TEMPO, EM SEGUNDOS, ENTRE CARROS QUE PASSAM
POR UM CRUZAMENTO DE MARING - 23/12/97
6
N DE CARROS
TEMPO
21
47
43
49
51
48
51
47
46
48
43
42
50
47
49
43
46
44
45
51
46
49
44
Os dados, como apresentados acima, so chamados brutos, pois no foram ainda submetidos
a nenhum tipo de tratamento.
42
46
49
46
48
46
49
46
49
Pode-se observar agora que das 25 observaes o menor valor 42 e o maior 51.
Amplitude (AT): a diferena entre o maior e o menor valor do conjunto de dados
observados.
Para os dados acima: AT = 51-42 = 9.
Observe que esse exemplo contm um nmero pequeno de observaes (n=25), quando h
um grande nmero de dados observados o processo de ordenao trabalhoso e a listagem final
pouco representar. Nesses casos, pode-se simplificar o processo agrupando os dados em certo
nmero de classes, cujos limites sero denominados limite inferior e limite superior.
A quantidade de classes e a amplitude destas devem ser obtidas observando as seguintes
normas:
i)as classes devem cobrir a amplitude total;
ii)o extremo superior de uma classe o extremo inferior da classe seguinte;
iii)cada valor observado deve enquadrar-se em apenas uma classe;
iv)o nmero total de classes no deve ser inferior a 5 e nem superior a 25;
O nmero de classes (k), pode ser obtido de uma das frmulas seguintes:
i) k = n ;
ii) k = 1 + 3,22 log n
(frmula de Sturges).
Para o conjunto de dados do exemplo: k =
25
= 5 ou
k = 1 +3,22log(25) = 5,61.
AT
9
1,8 2.
k
5
22
AT
em um nmero inteiro.
k
Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes:
i)o limite inferior da primeira classe o menor valor da srie;
ii)os demais limites sero obtidos somando aos limites inferiores o valor de h. Isto ,
42 |----- 42+h = 42 + 2=44
44 |----- 44+h = 46
46 |----- 46+h = 48
48 |----- 48+h = 50
50 |----- 50+h = 52.
Observe que a notao (|-----) significa que se est incluindo os valores iguais ao limite
inferior e excluindo os valores iguais ou superiores ao limite superior.
A partir da listagem ordenada das classes, pode-se construir os chamados quadros (ou
tabelas) de freqncia ou distribuies de freqncia, que permitem uma melhor visualizao dos
dados.
Freqncia: o nmero de valores que aparecem no domnio de uma classe.
5.2.1 CONSTRUO DE DISTRIBUIO DE FREQNCIA CONTNUA
Utilizando os limites de classes obtidos acima para o exemplo, tem-se o quadro abaixo:
Tabela 1 Nmero de funcionrios de empresas txteis - Maring/PR - 31/01/00
Classes
Freqncia (Fi)
42 |----- 44
44 |----- 46
46 |----- 48
48 |----- 50
50 |----- 52
TOTAL
4
3
8
6
4
25
23
fac
0,16
0,28
0,60
0,84
1
---
5.3. GRFICOS
Os principais grficos utilizados na representao de distribuio de freqncias so:
i)
Histograma e polgono de freqncia;
ii)
Ogiva ou polgono de freqncia acumulada.
5.3.1. HISTOGRAMAS: um conjunto de retngulos com bases sobre um eixo dividido de acordo
com os tamanhos de classe, centros nos pontos mdios das classes e reas proporcionais s freqncias.
10
N DE FUNCIONRIOS DE EMPRESAS
TXTEIS - MARING/PR - 31/01/00
N de empresas
8
6
4
2
0
42
44
46
48
N de funcionrios
50
52
5.3.2. POLGONOS DE FREQNCIAS: um grfico que se obtm unindo por uma poligonal os
pontos correspondentes s freqncias das diversas classes, centradas nos respectivos pontos mdios (x i).
Para obter as intersees do polgono com o eixo, cria-se em cada extremo do histograma uma classe com
freqncia nula.
41
43
45
47
49
N de funcionrios
51
53
55
24
OBS: Suavizando a linha poligonal que define o polgono obtm-se uma curva que visualiza
a tendncia de variao dos dados.
5.3.4. POLGONOS DE FREQNCIA ACUMULADA OU OGIVAS: o grfico
representativo de uma distribuio acumulada de freqncias. uma poligonal ascendente. No eixo
horizontal colocam-se as extremidades de classe e no eixo vertical as freqncias acumuladas.
Note que a freqncia acumulada relacionada com o limite inferior da primeira classe
sempre zero.
Ao contrrio do polgono de freqncia, a ogiva de freqncias acumuladas utiliza os pontos
extremos dos intervalos de classe, e no os pontos mdios.
42
44
46
Nde funcionrios
48
50
52
6 - MEDIDAS DESCRITIVAS
EXEMPLO 3: Em uma amostra de 5 supermercados de Maring foi pesquisado o preo de
macarro (pacote com 500 grs.), que um dos produtos da cesta bsica. Os dados foram obtidos de
O Jornal do povo de 06/02/00 e se referem ao produto com o menor preo, independente de marca
ou qualidade.
0,95 0,78 0,75 0,65 0,80
6.1 - MEDIDAS DE TENDNCIA CENTRAL OU DE POSIO: So medidas que
objetivam representar o ponto central de equilbrio de uma distribuio de dados. Essas medidas
representam quantitativamente os dados, sendo as mais utilizadas em anlise:
6.1.1 - Mdia: Representa o ponto de equilbrio de um conjunto de dados. Seja ( x 1,...,xn )
um conjunto de dados. A mdia dada por:
x
n
(dados amostrais)
x i Fi
, para dados agrupados em tabelas de freqncias.
Fi
Propriedades da mdia:
1 - A soma algbrica dos desvios tomados em relao mdia nula. Isto ,
k
di = 0
i1
onde di = xi - x , i = 1, 2, ..., n e
= x.k
yi
xi
x
y .
k
k
26
h.( Fi Fi 1 )
(onde i a ordem da classe de maior
( Fi Fi 1 ) ( Fi Fi 1 )
freqncia).
Pode-se tambm, neste caso, tomar o ponto mdio da classe modal como sendo a moda
Mo li
n 1
2
x p x p 1
2
onde
n
.
2
Percentis (Pi): Denominamos percentis os noventa e nove valores de uma srie que a divide
em cem partes iguais. Indicamos por: P1,... P99.
OBS: A mediana tambm considerada uma media de posio.
Para valores NO-AGRUPADOS:
Quando a srie tem um nmero par de valores, as posies dos quartis devero ser
n2
4
2n 2
p
4
3n 2
p
4
calculadas por :
10. Quartil
20. Quartil
30. Quartil
Quando a srie tem um nmero mpar de valores, as posies dos quartis devero ser
n 1
4
2n 2
p
4
3n 3
p
4
calculadas por :
10. Quartil
20. Quartil
30. Quartil
Quando p for inteiro, ento o elemento quartlico ser Q = xp. Caso p no seja inteiro o
elemento quartlico ser a mdia dos valores mais prximos.
Para valores AGRUPADOS:
As medidas de posio para dados agrupados so calculadas atravs da expresso
h.( p Fa i 1 )
S li
onde:
Fi
S = a separatriz desejada (Md, Q, D, P);
K = a ordem da separatriz: K = 1 para a mediana
K = 1, 2, 3 para os quartis
K = 1, ... , 9 para os decis
K = 1, ... , 99 para os percentis
p = a posio da observao (dado) que a separatriz desejada e calculada
pela expresso:
k
n... ou.... N
K
2... ou...4... ou...10... ou...100
16
x 3 12
4
Q3=5 segundos.
n1
Fi
2
s
2
x Fi
n1
No exemplo1: s2=1,54.
No exemplo2: s2=6,77.
No exemplo3: s2=0,01.
6.2.3 - Desvio-padro. Como a varincia calculada a partir do quadrado dos desvios, sua
unidade quadrada em relao varivel estudada, o que, sob o ponto de vista prtico um
inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretao
prtica, denominada desvio padro, definido como a raiz quadrada da varincia e representada por:
2 .
s s2
29
No exemplo1: s = 1,24.
No exemplo2: s = 2,60.
No exemplo3: s = 0,12.
6.2.4 - Coeficiente de variao. uma medida relativa da disperso ou variabilidade dos
dados:
cv
100
ou
cv
s
100
x
J foi visto que o desvio-padro tem a mesma unidade de medida que os dados, de modo que o
coeficiente de variao adimensional.
Critrios para interpretao. Quanto menor for o coeficiente de variao, mais representativa dos
dados ser mdia. Coeficiente de variao acima de 50%, a mdia no representativa.
30
Mo
ou
As
x Mo
s
Q3 Q1
(coeficiente de curtose)
2 P90 P10
Relativamente curva da distribuio normal, temos:
K > 0,263 (platicrtica)
K = 0,263 (mesocrtica)
K < 0,263 (leptocrtica)
K
31
Lista de Exerccios
Estatstica Descritiva
1.
Durante um certo ms de vero, os dez vendedores de uma firma de aquecimento e ar-condicionado venderam os
seguintes nmeros de unidades de ar-condicionado: 8, 11, 5, 14, 8, 11, 16, 5, 11, 14. Calcular as medidas de posio
e disperso. Interprete os resultados.
3. Os dados abaixo referem-se ao nmero de horas extras de trabalho de uma amostra de 93 funcionrios da
empresa XGRAN, Maring - Pr. , em dezembro/11.
Nmero de
horas extras
10
11
12
13
14
15
16
17
18
19
20
TOTAL
a)
b)
4.
Nmero de
Funcionrios
2
3
6
8
10
16
20
14
8
4
2
93
Uma empresa contou durante uma hora o nmero de chamadas telefnicas que recebe por minuto e obteve os
seguintes dados:
1
2
3
1
2
2
2
3
2
3
0
3
0
1
0
2
2
2
2
2
4
2
0
2
1
2
2
4
3
0
a) Construa a distribuio de freqncia adequada;
b) Faa sua representao grfica;
c) Calcular as medidas de posio e disperso.
d) Interprete os resultados.
5.
1
3
3
3
3
2
1
0
5
2
0
2
3
1
0
1
2
1
2
3
1
3
1
3
2
3
4
3
1
1
O proprietrio de um automvel, a fim de avaliar o rendimento do seu carro, anota a cada 3 dias o consumo mdio
de combustvel, em km/l. Os dados obtidos durante o perodo de 3 meses, foram:
10.9
13.2
10.7
10.9
13.2
10.7
12.5
6.1
10.4
12.5
6.1
10.4
8.1
10.4
11.1
8.1
10.4
11.1
11.2
11.7
12.3
11.2
11.7
12.3
11.8
11.3
8.5
11.8
11.3
8.5
10.3
11.0
10.0
10.3
11.0
10.0
10.5
10.2
11.4
10.5
10.2
11.4
9.3
10.8
10.5
9.3
10.8
10.5
12.7
10.1
10.1
12.7
10.1
10.1
7.3
9.5
9.2
7.3
9.5
9.2
Construa uma tabela de distribuio de freqncia com 8 classes. Faa as colunas complementares. Interprete os
principais resultados.
32
6. Realizou-se uma prova de estatstica para duas turmas. Os resultados foram os seguintes:
Turma A: x 5 e 2,5
Turma B: x 4 e 2
Com esses resultados, podemos afirmar:
( ) A turma B apresentou maior disperso absoluta.
( ) A disperso relativa igual disperso absoluta.
( ) Tanto a disperso absoluta quanto a relativa so maiores para a turma B
( ) A disperso absoluta de A maior do que a de B, mas em termos relativos as duas turmas no diferem quanto ao
grau de disperso das notas
7. Uma pesquisa sobre o preo do bacalhau (em reais), realizada em maro/2011, atravs de uma amostra em
supermercados do Paran, obteve-se os seguintes dados:
45,50
45,49
47,49
45,49
45,50
45,49
47,49
45,49
47,49
47,70
47,70
49,50
45,50
47,50
45,50
49,50
45,50
47,50
45,50
47,50
48,50
48,50
49,50
46,40
47,99
46,40
49,50
46,40
47,99
46,40
47,99
48,49
48,49
46,50
47,30
48,90
47,30
46,50
47,30
48,90
47,30
48,90
49,90
49,90
46,99
48,49
48,50
48,49
46,99
48,49
48,50
48,49
48,50
49,90
49,90
46,90
48,99
48,50
48,99
46,90
48,99
48,50
48,99
48,50
49,70
49,70
50,00
48,99
47,50
48,99
50,00
48,99
47,50
48,99
47,50
48,90
48,90
50,00
49,99
47,49
49,99
50,00
49,99
47,49
49,99
47,49
48,99
48,99
46,50
47,50
47,80
47,50
46,50
47,50
47,80
47,50
47,80
48,80
48,80
Construa uma tabela de distribuio de freqncia que melhor apresente estes dados. Faa as colunas complementares.
Interprete os principais resultados.
8.
O controle de qualidade de uma empresa retira amostra de hora em hora. Cada amostra contm 50 peas e verificase a qualidade de peas defeituosas em cada amostra. Durante 7 dias, foram coletadas 35 amostras e foram obtidos
os seguintes resultados (nmero de peas defeituosas por amostra):
0
0
2
1
1
0
3
2
1
0
3
1
1
0
0
1
1
1
1
0
4
0
2
3
2
5
0
0
0
2
0
0
0
0
3
Monte a tabela de freqncia adequada, construa o grfico para freqncia absoluta, calcule a mdia, a moda, a
mediana, a varincia, o desvio padro e o coeficiente de variao. Podemos concluir que a mdia de peas defeituosas
uma medida bem representativa para os dados?
9. A CIPA da UEM no ano de 2011 registrou o seguinte nmero de acidentes de trabalho (dados fictcios).
1
10. - Durante o ms de setembro de 2011, o nmero de acidentes por dia, no km 287 da rodovia Castelo Branco no
estado de So Paulo, apresentou a seguinte estatstica fornecida pela polcia rodoviria daquele estado (dados
fictcios):
2
2
0
0
1
1
2
4
3
2
1
3
6
0
1
1
0
0
0
2
1
1
2
2
2
4
1
1
1
1
33
II PARTE - TEORIA
1. Assinale a segunda coluna de acordo com a primeira:
(a) Amostra
( ) Coleta de dados de todos os elementos da populao.
(b) Estatstica
( ) Informaes obtidas com base nos elementos da
(c) Censo
populao ou elementos da amostra.
(d) Populao
( ) Medidas populacionais.
(e) Dados
( ) Referem-se aos dados coletados e podem ser
(f) Estatsticas
qualitativas ou quantitativas.
(g) Parmetro
( ) Medidas amostrais.
(h) Variveis
( ) Parte da populao selecionada de acordo com
certas regras.
( ) Mtodo utilizado no manuseio de dados numricos.
( ) Todo conjunto de indivduos ou objetos que possuam
ao menos uma caracterstica comum.
2. Em cada um dos casos indique se a varivel qualitativa (QL), quantitativa discreta (QTD) ou
quantitativa contnua (QTC).
( ) Sexo
( ) Local de nascimento
( ) Nmero de pulsaes por minuto
( ) Aumento de peso em cobaias
( ) Nmero de atendimentos dirio em um Pronto Socorro
( ) Altura
( ) Cor dos olhos
( ) Renda familiar
( ) Temperatura
( ) Profisso
Assinale a resposta correta de cada uma das questes abaixo:
3. O agrupamento dos valores de uma varivel com suas respectivas freqncias denomina-se:
( ) planilha dos dados
( ) tabela de srie especfica
( ) distribuio de freqncias
( ) freqncias absolutas
4. Denomina-se amplitude do intervalo de classe:
( ) a distncia entre os limites da classe
( ) o nmero de valores agrupados na classe
( ) o nmero de classes estabelecidas
( ) o valor representativo da classe
5. A primeira classe de uma distribuio de freqncias deve:
( ) ser representada pelo menor valor do conjunto de dados
( ) iniciar-se com o menor valor do conjunto de dados
( ) incluir o menor valor do conjunto de dados
( )terminar com o menor valor do conjunto de dados
6. Todos os valores includos em uma classe podem ser representados:
( ) pela amplitude da classe
( ) pelo limite inferior da classe
34
35
37
INTRODUO A PROBABILIDADE
A Estatstica teve por funo, nas suas origens, principalmente a organizao e apresentao
de dados coletados empiricamente.
O desenvolvimento da teoria das probabilidades permitiu, entretanto, a criao de
tcnicas mais adequadas de amostragem e formas de relacionar as amostras e as populaes de onde
provieram essas amostras.
O estudo das probabilidades teve origens no sculo XVII, bem posterior Estatstica, por meio do
estudo dos jogos de azar propostos pelo Cavalheiro de Mre aos matemticos franceses Fermat e
Pascal. No entanto, somente no sculo XX que se desenvolveu uma teoria matemtica rigorosa
baseada em axiomas, definies e teoremas. Com o advento da teoria das probabilidades, foi
possvel estabelecer as distribuies de probabilidade, consideradas como a espinha dorsal da
teoria estatstica, pois todos os processos inferenciais so aplicaes de distribuies de
probabilidade.
Assim, o conhecimento dos conceitos advindos da teoria das probabilidades de grande
importncia para uma correta utilizao da tcnica estatstica.
CONCEITOS FUNDAMENTAIS
Experimento Aleatrio:
o processo de coleta de dados relativos a um fenmeno que acusa variabilidade em seus
resultados, ou seja, podemos dizer que so os experimentos cujos resultados podem no ser os
mesmos, ainda que sejam repetidos sob condies idnticas. Por exemplo:
Ex.1: Jogar um dado e observar o nmero mostrado na face superior.
Ex.2: Lanar uma moeda e um dado e observar a sua face superior.
Ex.3: observar o sexo de um recm-nascido.
Espao amostral:
o conjunto de todos os resultados possveis de um experimento. Representaremos espao amostral
por S.
S1: { 1, 2, 3, 4, 5, 6 }
S2: { c1, c2, c3, c4, c5, c6, k1, k2, k3, k4, k5, k6}, onde c representa o nmero de
cara e k o n de coroa.
S3: { M, F}, onde M representa o sexo masculino e F representa o feminino.
Quando um espao amostral consiste em um nmero finito ou infinito numervel de ventos,
chamado de espao amostral discreto; consiste-se em todos os nmeros reais de determinado
intervalo, um espao amostral contnuo.
Evento:
um subconjunto de um espao amostral, assim, o prprio S um evento, chamado evento certo e
o conjunto vazio tambm um evento, chamado evento impossvel.
As mesmas operaes realizadas com conjuntos so vlidas tambm para os eventos.
38
UNIO: A B e i S / e i A ou e i B
INTERSECO: A B e i S / e i A e e i B
COMPLEMENTAR: S A A e i S / e i A
Temos tambm que:
( A B) A B
(A B) A B
d) Se S for finito, ento a soma das probabilidades de todos os resultados possveis igual a 1.
e) P( A B ) P( A B) 1 P( A B)
P( A B ) P( A B) 1 P( A B)
n( A )
n(S)
39
180
9
220 11
A=
B=
C=
D=
CURSO
Eng. Civil
Psicologia
Farm. Bioqumica
Medicina
TOTAL
Sejam os eventos:
SEXO
Masculino (M) Feminino (F)
70
40
10
40
20
20
20
10
120
110
TOTAL
110
50
40
30
230
P(AF)=40/230;
...
40
Probabilidade Condicional
Dois eventos, A e B, so ditos de probabilidades condicionais se, dado que um tenha ocorrido, isto
afeta a probabilidade do outro evento ocorrer. Temos ento que, Se P(B) diferente de zero, a
probabilidade condicional de A relativa B, isto , a probabilidade de A ocorrer dado que B tenha
ocorrido (ou A dado B), :
P A / B
P( A B )
P( B )
ou
P B / A
P ( A B)
P ( A)
Probabilidade independente
Dois eventos, A e B, so ditos independentes se a probabilidade do evento A ocorrer
no afetada pela ocorrncia ou no de B, ou seja:
P A / B P ( A)
Regra da multiplicao
- Se A e B so eventos so condicionais, ento:
P ( A B ) P ( A) P ( B / A)
ou P( A B) P( B ) P( A / B)
P( A B) P( A ) P(B)
Ex-3:
P(B) = m,
Resp. i) m=0,4;
ii) m=0,5;
Ex-4: A probabilidade de que um homem esteja vivo daqui a 30 anos 2/5, a de sua mulher 2/3.
Calcular a probabilidade de que daqui a 30 anos:
a) Ambos estejam vivos (R. 4/15)
b) Somente o homem esteja vivo (R. 2/15)
c) Somente a mulher esteja viva (R. 2/5)
d) Nenhum esteja vivo (R. 1/5)
e) Pelo menos um esteja vivo (R. 4/5)
41
n( A)
n(S)
4. Regra da soma:
Se A e B so mutuamente exclusivos, temos:
P( A B) P( A) P(B)
5. Eventos Complementares:
P( A ) 1 P(A)
P ( A B) P ( A ) P ( A B)
P ( A B) P( A B) 1 P ( A B)
P ( A B) P( A B) 1 P ( A B) A
n( A B )
n(B)
7. Regra do Produto:
Se A e B so eventos condicionais:
P (A B) P ( A) P (B / A )
ou
P(A B) P( B) P (A / B)
Se A e B so eventos independentes:
P(A B) P(A) P(B)
42
VARIVEIS ALEATRIAS
Introduo
Quando realizamos um experimento, no temos obrigatoriamente, que obtermos um valor
numrico. Por exemplo, ao descrevermos uma pea manufaturada, podemos associar duas
categorias: defeituosas e no defeituosas- varivel qualitativa. Por um outro lado, ao
estudarmos a descrio dos dados, vimos que os recursos disponveis para anlise das variveis
quantitativas so mais ricos do que para as variveis qualitativas, portanto, buscaremos uma
maneira de trabalharmos esta situao de uma maneira mais prtica e facilitada associando sempre
um nmero real a qualquer evento de um espao amostral, possibilitando assim, a construo de
modelos probabilsticos para tais variveis.
DEFINIO 1.1 - Varivel Aleatria: Seja E um experimento e S um espao amostral associado a
esse experimento. Uma funo X que associe a cada elemento s S um nmero
real X(s), denomina-se Varivel Aleatria (v.a.).
S
R
S.
X
. X(s)
Exemplo: Seja o experimento E: lanar duas moedas. O espao amostral associado a este
experimento ser:
S= {CC, CK, KC, KK}
Podemos definir uma v.a. como sendo, X: nmero de caras obtidas nas duas moedas.
43
p( x ) 0, i 1, 2, ... , n
i
p( x ) 1
i 1
9
4/36
10
3/36
11
2/36
12
1/36
44
Lembremos que no caso da v.a. discreta definiu-se P(X=xi) como funo de probabilidade, no caso
v.a. contnua, este conceito no poder ser aplicado, pois X assume valores no enumerveis. Para
melhor entendimento, tomemos como exemplo um relgio eltrico, onde os ponteiros dos segundos
movem-se continuamente. Neste caso, o conjunto de possveis valores de X no um conjunto
enumervel de valores, como no caso de um relgio mecnico, pois X pode assumir qualquer valor
do intervalo [0,360] = {x / 0 x 360}. Assumindo que no existe uma regio de preferncia
para o ponteiro parar, e como existem infinitos pontos nos quais o ponteiro pode parar, cada um
com igual probabilidade, cada ponto teria probabilidade de ocorrer igual a zero. Assim, no tem
muito sentido falar na probabilidade de o ngulo X ser igual a um certo valor, pois esta
probabilidade sempre ser igual a zero. Entretanto, podemos determinar a probabilidade de o ngulo
X estar compreendido entre dois valores quaisquer, como por exemplo: P(0 < X < 90) = . Por
menor que seja o intervalo, sempre poderemos achar a probabilidade da v.a. ocorrer. Como j vimos
na construo de histogramas, a rea correspondente ao intervalo [a, b] indica a probabilidade da
v.a. estar entre a e b. Matematicamente, isso expresso atravs da integrao da funo entre a e b.
b
P(a X b) f ( x )dx
a
Pois a integral de uma funo entre dois pontos determina a rea sob a curva compreendida entre
esses dois pontos. A funo que nos permitir calcular a probabilidade para uma v.a. ser definida
como funo densidade de probabilidade.
DEFINIO 3.2 Funo Densidade de Probabilidade: Seja X uma varivel aleatria contnua.
A Funo Densidade de Probabilidade f (f.d.p) uma funo que satisfaz as
seguintes condies:
a ) f(x i ) 0, x i x
b)
f(x)dx 1
OBS: 1) A definio acima mostra que a probabilidade de qualquer valor especificado de X, por
xo
Sendo assim, as probabilidades abaixo sero todas iguais, se X for varivel aleatria
contnua:
P ( a X b ) P (a X b ) P (a X b ) P (a X b )
2) Note-se que f(x), no probabilidade. Somente quando a funo for integrada entre dois
limites ela produzir uma probabilidade, que ser a rea sob a curva da funo entre x o=a e
x1=b; b>a.
DEFINIO 3.3 Funo de Distribuio Acumulada. Seja X uma varivel aleatria discreta ou
contnua. Define-se a funo F como Funo de Distribuio Acumulada da v.a.
(fd) como:
F( x ) P(X x i )
n
xj x
c
f ( x )dx
45
E ( X ) x i p( x i )
i 1
1
1
1
1
1
1
2 3 4 5 6 3,5
6
6
6
6
6
6
Propriedades da esperana:
1) O valor esperado de uma constante a prpria constante.
E (K ) Kp( x i ) K p( x i ) K
i
2) Multiplicando-se uma varivel aleatria X por uma constante, sua mdia fica multiplicada por
essa mesma constante.
E (KX) Kx i p( x i ) K x i p( x i ) KE( X )
i
( x
i
E[X Y]
x p( x
i
E[X Y]
y j )p( x i , y j )
IJ
x p( x
x p( x
IJ
, y j ) y j p( x i , y j )
, y j ) y j p( x i , y j )
i
IJ
) y j p( y j )
4) Somando-se ou subtraindo-se uma constante a uma varivel aleatria, a sua esperana fica
somada ou subtrada da mesma constante.
E[XK] = E[X]E[K] = E[X] K
5) O valor esperado de uma varivel aleatria centrada zero. Diz-se que a v.a. est centrada
quando se calculam todos os desvios (xi - x). Assim:
E[X - x] = E[X] E[x] = x - x = 0
46
6) O valor esperado do produto de duas v.a. independentes o produto dos valores esperados.
E[ XY ]
x
i
E[ XY ]
x
i
E[XY]
y j p( x i , y j )
x p( x ) y p( y
i
E[ XY ] E[ X ] E[ Y ]
2 XE ( X ) E ( X ) 2 ]
V[X] E(X 2 ) 2 E ( X ) E ( X ) E ( X ) 2
V [ X ] E ( X 2 ) 2E ( X ) 2 E ( X ) 2
V [ X ] E( X 2 ) E( X ) 2
PROPRIEDADES DA VARINCIA:
1) A varincia de uma constante zero:
2k E[K k ]2 E[K K ] 2 0
2) Multiplicando-se uma v.a. por uma constante, sua varincia fica multiplicada pelo quadrado da
constante.
47
Distribuio binomial
Consideremos um experimento aleatrio ao qual associa-se a varivel aleatria X. A distribuio
discreta de probabilidade de X ser definida como Distribuio Binomial se atender s seguintes
condies:
i) Em cada tentativa existem dois resultados possveis mutuamente exclusivos. Eles so
chamados de sucesso (se ocorrer o evento em que estamos interessados) e fracasso
(se tal evento no ocorre).
ii) As sries de tentativas (ou observaes) do experimento so constitudas de n
eventos independentes.
iii)A probabilidade de sucesso p e a do fracasso q = 1-p.
Ento, para n repeties independentes, a probabilidade de ocorrer exatamente k sucessos da
varivel aleatria X dado por:
n
.p k .q n - k
k
P(X k)
Notao: X~B(np; npq), significa que a varivel aleatria X tem uma distribuio binomial
com parmetros E(x) = np (mdia) e VAR(x) = npq (varincia).
Exemplo: Uma moeda lanada trs vezes. Qual a probabilidade de se obter duas caras?
E: lanar uma moeda
X: n de caras que ocorrem (sucesso)
n=3
p = (probabilidade de sucesso em um lanamento)
q = 1-p = 1- =
48
P(X 2)
Portanto a probabilidade de ocorrer duas caras em e trs lanamentos de uma moeda 3/8 ou
37,5%
Ex: Uma companhia de seguros vendeu aplices a cinco pessoas, todas da mesma idade e de
apresentando boa sade. De acordo com as tbuas aturias, a probabilidade de que uma pessoa da
idade desses assegurados esteja viva da a 30 anos 2/3. Calcular a probabilidade de que passados
30 anos;
a) Todas as cinco pessoas estejam vivas; (32/243 ou 0,13)
b) Duas pessoas estarem vivas
(40/243 ou 0,16)
c) Duas pessoas no estarem vivas
(80/243 ou 0,33)
d) Pelo menos trs pessoas estejam vivas; (64/81 ou 0,79)
Distribuio de Poisson
um caso particular da distribuio binomial quando o nmero de provas n, tende para
o infinito e a probabilidade p de cada evento p do evento, em uma nica prova, tende a zero,
entretanto E[X] = n permanece finita e no nula.
DEFINIO 4.3 Diz-se que a varivel aleatria X tem distribuio de Poisson com parmetro
=np, se sua funo de probabilidade dada pela frmula:
P[X k ] e
k
k!
49
f (x)
1
2
e[ ( x )
/ 2 2 ]
a
b
c
d
P (a x b)
2
Graficamente apresentar as seguintes caractersticas:
( x ) 2
2 2 dx
Como podemos observar o grfico da funo densidade de uma varivel normal tem a forma de um
sino e simtrica em relao mdia . Fixando-se a mdia, verificamos que o achatamento est
diretamente ligado ao valor de ; um valor maior da varincia significa maior disperso da curva.
Distribuio Normal padro
i
X
tem
j
Demonstrao:
1
1
0
X
E(X) 0
E[ Z] E
1
1
1
X
2
2 V( X) V() 2 V( X) 2 1
V Z V
Logo, Z ~(0, 1)
Teorema da combinao linear:
A combinao linear de variveis com distribuies normais independentes tambm varivel com
distribuio normal.
50
2w a 2 . 2x b 2 . 2y
Respostas:
a)0,8413
b)0,5000
c)0,0301
d)1
e)0
f)0,9750
g)0,1587
h)0,0495
i)0,9798
j)1
k)0
l)0,6826
m)0,8225
n)0,4495
o)0,4750
p)0,9500
q)0,9010
r)1
s)0,5000
t)0,5000
Exemplo-2: Suponha que voc gerente de um banco onde os montantes dirios de depsitos e de
retiradas so dados por variveis aleatrias independentes com distribuies normais. Para os
depsitos, a mdia de R$ 12.000,00 e o desvio padro R$ 4.000,00; para as retiradas, a mdia
de R$ 10.000,00 e o desvio padro R$ 5.000. Calcule a probabilidade de cada um dos eventos
abaixo em um determinado dia:
a) Depsitos inferiores a R$ 11.000,00.
(0,4013)
b) Depsitos superiores a R$ 13.000,00.
(0,4013)
c) Retiradas superiores a R$ 13.000,00.
(0,2743)
d) Retiradas superiores aos depsitos.
(0,3774)
e) Os depsitos excederem as retiradas em no mximo R$ 5.000,00. (0,6803)
51
P ( Z -z )
z<0
-3
-2,9
-2,8
-2,7
-2,6
-2,5
-2,4
-2,3
-2,2
-2,1
-2,0
-1,9
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1,0
-0,9
-0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
-0,0
z<0
0
0,0013
0,0019
0,0026
0,0035
0,0047
0,0062
0,0082
0,0107
0,0139
0,0179
0,0228
0,0287
0,0359
0,0446
0,0548
0,0668
0,0808
0,0968
0,1151
0,1357
0,1587
0,1841
0,2119
0,2420
0,2743
0,3085
0,3446
0,3821
0,4207
0,4602
0,5000
0
1
0,0010
0,0018
0,0025
0,0034
0,0045
0,0060
0,0080
0,0104
0,0136
0,0174
0,0222
0,0281
0,0351
0,0436
0,0537
0,0655
0,0793
0,0951
0,1131
0,1335
0,1562
0,1814
0,2090
0,2389
0,2709
0,3050
0,3409
0,3783
0,4168
0,4562
0,4960
1
2
0,0007
0,0018
0,0024
0,0033
0,0044
0,0059
0,0078
0,0102
0,0132
0,0170
0,0217
0,0274
0,0344
0,0427
0,0526
0,0643
0,0778
0,0934
0,1112
0,1314
0,1539
0,1788
0,2061
0,2358
0,2676
0,3015
0,3372
0,3745
0,4129
0,4522
0,4920
2
3
0,0005
0,0017
0,0023
0,0032
0,0043
0,0057
0,0075
0,0099
0,0129
0,0166
0,0212
0,0268
0,0336
0,0418
0,0516
0,0630
0,0764
0,0918
0,1093
0,1292
0,1515
0,1762
0,2033
0,2327
0,2643
0,2981
0,3336
0,3707
0,4090
0,4483
0,4880
3
4
0,0003
0,0016
0,0023
0,0031
0,0041
0,0055
0,0073
0,0096
0,0125
0,0162
0,0207
0,0262
0,0329
0,0409
0,0505
0,0618
0,0749
0,0901
0,1075
0,1271
0,1492
0,1736
0,2005
0,2296
0,2611
0,2946
0,3300
0,3669
0,4052
0,4443
0,4840
4
5
0,0002
0,0016
0,0022
0,0030
0,0040
0,0054
0,0071
0,0094
0,0122
0,0158
0,0202
0,0256
0,0322
0,0401
0,0495
0,0606
0,0735
0,0885
0,1056
0,1251
0,1469
0,1711
0,1977
0,2266
0,2578
0,2912
0,3264
0,3632
0,4013
0,4404
0,4801
5
6
0,0002
0,0015
0,0021
0,0029
0,0039
0,0052
0,0069
0,0091
0,0119
0,0154
0,0197
0,0250
0,0314
0,0392
0,0485
0,0594
0,0721
0,0869
0,1038
0,1230
0,1446
0,1685
0,1949
0,2236
0,2546
0,2877
0,3228
0,3594
0,3974
0,4364
0,4761
6
7
0,0001
0,0015
0,0021
0,0028
0,0038
0,0051
0,0068
0,0089
0,0116
0,0150
0,0192
0,0244
0,0307
0,0384
0,0475
0,0582
0,0708
0,0853
0,1020
0,1210
0,1423
0,1660
0,1922
0,2206
0,2514
0,2843
0,3192
0,3557
0,3936
0,4325
0,4721
7
8
0,0001
0,0014
0,0020
0,0027
0,0037
0,0049
0,0066
0,0087
0,0113
0,0146
0,0188
0,0239
0,0301
0,0375
0,0465
0,0571
0,0694
0,0838
0,1003
0,1190
0,1401
0,1635
0,1894
0,2177
0,2483
0,2810
0,3156
0,3520
0,3897
0,4286
0,4681
8
9
0,0000
0,0014
0,0019
0,0026
0,0036
0,0048
0,0064
0,0084
0,0110
0,0143
0,0183
0,0233
0,0294
0,0367
0,0455
0,0559
0,0681
0,0823
0,0985
0,1170
0,1379
0,1611
0,1867
0,2148
0,2451
0,2776
0,3121
0,3483
0,3859
0,4247
0,4641
9
1
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,9990
2
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9993
3
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9995
4
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,9997
5
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,9998
6
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9998
7
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9999
8
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,9999
9
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
1,0000
P( Z z)
z>0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
z>0
0
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987
0
47
LISTA DE EXERCCIOS
PROBABILIDADE
1) Um nmero inteiro escolhido aleatoriamente
dentre os nmeros 1 a 50. Qual a probabilidade de:
a) O nmero ser divisvel pr 5? (0,20=20%)
b) Terminar em trs?
(0,10)
c) Ser primo?
(0,30)
d) Ser divisvel por 6 ou 8?
(0,24)
2) Dois dados so lanados simultaneamente. Qual a
probabilidade de:
a) A soma ser menor que 5?
(0,16)
b) A soma ser nove?
(0,11)
c) O 1o resultado ser maior que o 2o? (0,41)
d) Sabendo se que no primeiro dado ocorreu um
n par, qual a probabilidade de que no segundo
ocorra um n impar?
(0,50)
3) Se P(A) = ; P(B) = 1/3 e P(AB ) = .
Calcule:
a) P(AB)
b) P(A/B)
c) P(B/A)
d) P(A B) e) P(A B) f) P(A B)
g) P( A / B) h) P( A / B)
OBS.: P(A B) = P(A) P(A B)
R: a)0,58; b) 0,75; c)0,50; d) 0,75; e) 0,41; f) 0,25;
g) 0,62; h) 0,25;
4) Se P(AB) = 7/8 ; P(AB ) = e P(A) = 5/8 ,
calcule:
a) P(B)
b) P(A B) c) P(A B)
d) P( A B) e) P(A B) f) P(A B)
g) PA/B)
h) P(B/A)
R: a) 0,75; b) 0,12; c) 0,75; d) 0,12; e) 0,50; f) 0,50;
g) 0,33; h) 0,67;
5) Suponha que a tabela represente o nmero de alunos
matriculados nos cursos de Economia, Administrao e
Cincias Contbeis, na UEM em 1996.
CURSO
Economia
Administrao
Contbeis
TOTAL
MASC
350
300
120
770
FEM
250
480
100
830
TOTAL
600
780
220
1600
48
DISTRIBUIO BINOMIAL
1) Um time X tem 2/3 de probabilidade de vitria
sempre que joga. Se jogar cinco partidas, calcule a
probabilidade de:
a) X vencer exatamente 3 partidas; 80/243
b) X vencer ao menos uma partida; 242/243.
c) X vencer mais da metade das partidas. 64/81
2) 20% dos refrigeradores produzidos por uma empresa
so defeituosos. Os aparelhos so vendidos em lotes
com 50 unidades. Um comprador adotou o seguinte
procedimento: de cada lote ele testa 20 aparelhos e se
houver pelo menos 2 defeituosos, o lote rejeitado.
Admitindo-se que o comprador tenha aceitado o lote,
qual a probabilidade de ter observado exatamente um
aparelho defeituoso? (83,33%)
3) Cogita-se transferir um distrito de um certo
municpio para um municpio vizinho. O distrito possui
5300 habitantes, dos quais 40 % so favorveis
transferncia. Em uma amostra de 15 habitantes, qual a
probabilidade de que ao menos cinco serem favorveis
transferncia. 0,78
4) Uma cooperativa agrcola afirma que 95% das
melancias por ela fornecidas esto maduras e prontas
para consumo. Determinar a probabilidade de que, em
um lote de 7 melancias:
a) Todas sejam maduras;
b) Ao menos 4 estejam maduras; (c) no mximo 1
esteja verde; 0,6983 ; 0,9998 ; 0,9556
5) Ao testar certo tipo de caminho em terreno
acidentado, constatou-se que 20% dos caminhes no
conseguem terminar o teste sem ao menos um pneu
furado. Qual a probabilidade de que, dentre os
prximos 10 caminhes a serem testados, de 5 a 8
tenham um pneu furado? (3,3%)
6) A probabilidade de um paciente sobreviver a uma
delicada interveno cirrgica de 0,75.
a) Qual a probabilidade de sobreviverem
exatamente cinco dentre os prximos 10 pacientes
a serem submetidos a tal operao?
b) Qual a probabilidade de que 4 ou mais
sobrevivam? 0,0584; 0,9965.
7) A probabilidade de um atirador acertar o alvo 1/3.
Se ele atirar 6 vezes, qual a probabilidade de:
a) Acertar exatamente 2 tiros?
b) No acerta nenhum tiro? 80/243; 64/729.
8) Se 5% das peas produzidas por uma mquina so
defeituosas, qual a probabilidade de que, em cinco
peas escolhidas aleatoriamente:
a) Haja 0 defeituosas;
b) Menos de trs defeituosas;
c) Calcule a mdia e o desvio padro para o
nmero de defeituosas em um lote de 500 peas.
(77,4%; 99,9%; 25 e 4,9)
49
NORMAL
1) Faa Z uma varivel com distribuio normal
padronizada e encontre:
a) P(0 < Z < 1,44)
b) P(-0,85 < Z < 0)
c) P(-1,48 < Z < 2,05) d) P(0,72 < Z < 1,89)
e) P(Z > 1,08)
f) P(Z > -0,66)
g) P(| Z|< 0,5)
Resposta
a) 0,4251 b) 0,3023 c) 0,9104 d) 0,2064
e) 0,1401 f) 0,7454 g) 0,3830
2) Uma fbrica de pneumticos fez um teste para
medir o desgaste de seus pneus e verificou-se que ele
obedece a uma distribuio normal, de mdia 48000
km e desvio padro 2000 km. Calcular a probabilidade
de um pneu escolhido ao acaso:
a) Durar mais que 46000 km
0,8413
b) Durar entre 45000 e 50000 0,7745
3) A durao de um certo componente eletrnico tem
mdia 850 dias e desvio padro 45 dias. Calcular a
probabilidade desse componente durar:
a) Entre 700 e 1000 dias
1
b) Mais que 800 dias
0,8665
c) Menos que 750 dias
0,0132
d) Exatamente 1000 dias
0
e) Qual deve ser o nmero de dias necessrios
para que tenhamos que repor no mximo 5% dos
componentes? 776 dias
4) As aturas de 10.000 alunos de um colgio tm
distribuio aproximadamente normal, com mdia 170
cm e desvio - padro 5 cm.
a) Qual o nmero esperado de alunos com altura
superior a 165 cm?
b) Qual o nmero esperado de alunos com altura
inferior a 173 cm?
c) Qual o nmero esperado de alunos com altura
entre 168 cm e 175 cm?
d) Qual o intervalo simtrico em torno da mdia,
que conter 75% das alturas dos alunos?
50
51