Академический Документы
Профессиональный Документы
Культура Документы
PROBABILIDADE E ESTATSTICA
APRESENTAO DA DISCIPLINA
Um engenheiro algum que resolve problemas de interesse da sociedade pela aplicao eficiente
dos princpios cientficos. Devido a vrios aspectos da prtica da engenharia envolver o trabalho com os
dados, obviamente, algum conhecimento de estatsticas importante para qualquer engenheiro. Pois, o
campo da estatstica lida com a coleta, apresentao, anlise e utilizao dos dados para tomar decises,
resolver problemas, e produtos e processos de design.
As etapas utilizadas na engenharia para formular e resolver problemas so:
1. Desenvolver uma descrio clara e concisa do problema.
2. Identificar, os fatores importantes que afetam esse problema ou que possam desempenham um papel
na sua soluo.
3. Propor um modelo para o problema, utilizando conhecimentos cientficos ou de engenharia do
fenmeno a ser estudado. Estabelecer limitaes ou suposies do modelo.
4. Realizar experincias apropriadas e coletar dados para testar ou validar o modelo proposto.
5. Limitar o modelo com base nos dados observados.
6. manipular o modelo para auxiliar no desenvolvimento de uma soluo para o problema.
7. Realizar um experimento apropriado para confirmar que a soluo proposta para o problema ao
mesmo tempo eficaz e eficiente.
8. Tirar concluses ou fazer recomendaes com base na soluo do problema.
Consequentemente, os engenheiros devem saber como planejar de forma eficiente experimentos, coletar
dados, analisar e interpretar os dados e entender como os dados observados esto relacionados ao mtodo
que propuseram para o problema em estudo. Especificamente, tcnicas estatsticas podem ser uma
poderosa ajuda na concepo de novos produtos e sistemas, melhorando a projetos existentes e projetar,
desenvolver e melhorar os processos de produo.
Como exemplos da estatstica aplicada engenharia, podemos citar as seguintes aes:
Planejamento de novas estratgias de produo, vendas;
Controle de Processos e Manufatura, analisando distribuies e lotes para padres de qualidade nos
produtos.
Anlise de ensaios tanto destrutivos como no destrutivos, verificando a porcentagem de peas ou
probabilidade de vida de equipamentos ou peas.
Acompanhamento da estabilidade dos processos que analisada por cartas de acompanhamento
conhecidas como cartas de controle estatstico de processo.
UNIDADE I - INTRODUO
As vantagens de amostrar so: Economiza mo-de-obra, tempo e dinheiro. Possibilita rapidez na obteno
dos resultados. Coleta de dados mais precisos. a nica opo quando o estudo resulta em destruio ou
contaminao dos elementos pesquisados.
c) Parmetro: a descrio numrica de uma caracterstica populacional. Exemplo: Mdia (),
varincia (), coeficiente de correlao ().
d) Estimador: tambm denominado Estatstica. a descrio numrica de uma caracterstica
amostral. Exemplo: Mdia amostral ( ), varincia amostral (s), coeficiente de correlao amostral
(r).
e) Estimativa: o valor numrico obtido para o estimador numa certa amostra.
1.4 VARIVEIS
Em Estatstica, varivel cada caracterstica que pode ser observada (ou medida) em cada elemento
da populao, sob as mesmas condies.
Dados estatsticos so observaes da realidade que nos cerca, podem ser fatos ou nmeros. A caracterstica
de interesse de estudo (varivel) pode ser dividida em duas categorias: qualitativas e quantitativas.
1.4.1 Variveis Qualitativas: so aqueles nos quais as caractersticas de um elemento so fornecidas por
um nome ou por um rtulo. So classificadas como:
Qualitativas Nominais: os dados que podem ser separados em categorias no mensurveis.
Ex.: Estado civil, sexo, cor da pele, grupo sanguneo, tipo de transporte.
Qualitativas Ordinais: envolvem dados que podem ser dispostos em alguma ordem. O nvel ordinal d
informao sobre comparaes relativas, mas os graus de diferena no servem para clculos.
Ex.: Grau de instruo (Nvel fundamental, Nvel mdio, Nvel superior).
Aparncia (Pssima, ruim, regular, boa e tima)
Classe social (Baixa, mdia baixa, mdia e alta)
1.4.2 - Variveis Quantitativas: so aquelas nos quais as caractersticas do elemento observado uma
quantidade. So classificadas como:
Quantitativas Discretas: Assumem valores inteiros. Os dados discretos so resultados da contagem de um
nmero de itens.
3
Ex.: idade em anos completos, n de carros que circulam em Vila Velha, n de pessoas atendidas
em um caixa de banco.
Quantitativas Contnuas: Assumem qualquer valor num intervalo de valores. So dados resultantes de
medies. Resultam em um nmero infinito de valores possveis.
Ex.: Temperatura da cidade de Vila Velha, Quantidade de gua gasta por dia na cidade de Vitria,
peso dos alunos da turma de estatstica.
RESUMO DOS TIPOS DE VARIVEIS
b)
A velocidade de cada quinto carro que passa por um medidor de velocidade da polcia.
c)
d)
c) Os salrios iniciais para 667 MBAs graduados na Escola de Negcios da Universidade de Chicago
aumentaram 8,5% em comparao ao ano anterior.
d) Em janeiro de 2007, 44% dos governadores dos 50 estados norte-americanos eram republicanos.
e) Em uma checagem aleatria de uma amostra de logistas, o FDA(Food and Drug Administration)
descobriu que 34% das lojas no estavam estocando peixes na temperatura apropriada.
Os dados podem ser apresentao das seguintes formas: Brutos, Rol, Tabelas e grficos.
DADOS BRUTOS: quando os dados originais (coletados) ainda no se encontram prontos para anlise, por
no estarem numericamente organizados.
Ex.: Foi coletada uma amostra de Idades dos alunos do ltimo perodo do curso de Engenharia Civil da UVV,
no ano de 2013.
24
25
23
27
23
24
27
28
26
25
23
25
28
23
26
26
24
24
23
25
ROL: uma lista em que os valores esto dispostos em uma determinada ordem, crescente ou decrescente.
Ex.: Utilizando os mesmos dados anteriores (idade dos alunos).
23
25
23
25
23
25
23
26
23
26
24
26
24
27
24
27
24
28
25
28
Como pode-se observar a simples organizao dos dados em um Rol, aumenta muito a capacidade
de informao destes. Ela torna possvel visualizar, de forma bem ampla, as variaes dos dados, uma vez
que os valores extremos so percebidos de imediato. Mas a anlise com este tipo de disposio comea a se
complicar quando o nmero de observaes tende a crescer.
Ao estudarmos grandes conjuntos de dados, conveniente organiz-los e resumi-los de forma clara
e objetiva.
Os dados qualitativos ou quantitativos discretos podem ser apresentados ou organizados das seguintes
maneiras:
Tabela de Frequncias
Grfico de Barras/Colunas
Grfico de Setores
Os dados quantitativos contnuos ou amostra grande de dados discretos podem ser apresentados ou
organizados das seguintes maneiras:
Polgono de frequncias
Curvas de frequncias e outros
Frequncia absoluta
Frequncia relativa
Frequncia Percentual
Frequncia acumulada (absoluta, relativa e percentual)
Frequncia Simples Absoluta (fi ou fai): o nmero de repeties de um valor individual ou de uma classe
de valores da varivel.
Frequncia Relativa (fr ou fri): a relao entre a frequncia de uma classe e a frequncia total (soma das
frequncias de todas as classes).
f ri
fi
f
i 1
fi
N
f
i 1
ri
1,00
Frequncia Percentual (fr(%) ou pi): a frequncia relativa de uma classe multiplicada por 100.
Exemplo: Suponha que foi realizado uma pesquisa com os funcionrios da empresa X e verificado o grau de
satisfao em relao ao salrio.
Satisfeito
Satisfeito
Muito Satisfeito
Satisfeito
Muito Satisfeito
Satisfeito
Insatisfeito
Muito Satisfeito
Insatisfeito
Satisfeito
Insatisfeito
Satisfeito
Satisfeito
Satisfeito
Insatisfeito
Muito Satisfeito
Satisfeito
Satisfeito
Satisfeito
Satisfeito
Frequncia
absoluta
4
12
4
20
Frequncia
Percentual (%)
20,0
60,0
20,0
100,0
Frequncia Acumulada: Contabiliza as observaes at o valor considerado. Pode ser calculada apenas para
variveis numricas. Pode ser: frequncia acumulada (Fi), frequncia relativa acumulada (Fri), ou frequncia
acumulada percentual (Pi).
Exemplo: Tabela de distribuio de frequncias utilizando os dados de Idades dos alunos do ltimo perodo
do curso de Engenharia Civil.
23
25
23
25
23
25
23
26
23
26
24
26
24
27
24
27
24
28
25
28
Idade
23
24
25
26
27
28
Total
Frequncia
absoluta
5
4
4
3
2
2
20
Clculo
5
5+4
9+4
13 + 3
16 + 2
18 + 2
-
Frequncia
acumulada
5
9
13
16
18
20
-
Frequncia relativa acumulada (Fri): Fornece a relao entre a frequncia acumulada e o n total de
observaes realizadas.
Idade
Frequncia
absoluta
Frequncia
acumulada
Frequncia
relativa
Clculo
23
24
25
26
27
28
Total
5
4
4
3
2
2
20
5
9
13
16
18
20
-
0,25
0,20
0,20
0,15
0,10
0,10
1,00
5/20
9/20
13/20
16/20
18/20
20/20
-
Frequncia
relativa
acumulada
0,25
0,45
0,65
0,80
0,90
1,00
-
14
12
Frequncia
10
8
6
4
2
0
Insatisfeito
Satisfeito
Muito satisfeito
Grau de satisfao
1.5.3
Exemplo:
20%
20%
60%
Insatisfeito
Satisfeito
Muito satisfeito
1.5.4
constituda da mesma forma que para os dados no agrupados, com a diferena de que agora os valores
da varivel a ser organizados por classes.
Ao agrupar-se os valores das variveis em classes, se ganha em simplicidade, mas se perde em detalhes
(informaes). Neste tipo de tabela se destaca o que h de essencial nos dados.
Normalmente sugere-se o uso de 5 a 15 classes com a mesma amplitude. Menos que cinco classes pode
ocultar detalhes importantes dos dados, e mais que quinze torna a apresentao demasiado detalhada.
9
Exemplo de dados agrupados em classes para os salrios dos 36 empregados da seo de oramento da
Companhia XX por faixa de salrios.
Classe de salrios
4,0 |-- 8,0
8,0 |-- 12,0
12,0 |-- 16,0
16,0 |-- 20,0
20,0 |-- 24,0
Total
Frequncia (fi)
10
12
8
5
1
36
Porcentagem (%)
27,78
33,33
22,22
13,89
2,78
100,00
Os principais estgios na construo de uma distribuio de frequncia para dados agrupados em classes
so:
1. Organizar os dados brutos em um rol de ordem crescente ou decrescente.
2. Determinar a amplitude total dos dados que a diferena entre o maior e menor dos dados.
=
3. Determinar quanto ao nmero de classes a usar (k).
=
= + , ()
4. Determinar a amplitude de cada classe (c).
=
10
6. Relacionar os intervalos e fazer a contagem dos pontos por classe. A contagem total deve ser igual a
n.
7. Construir uma tabela de frequncia ou um grfico de frequncia.
Exemplo: Num determinado processo de fabricao foram feitas 50 observaes de uma caracterstica de
qualidade de um tipo de pea, resultando nas seguintes medidas de dimetro em milmetros.
1.
2.
3.
9,14
OBS.: A amplitude da classe foi arredondada para cima, pois o nmero de classes j havia sido arredondado
para baixo.
Para se formar as classes tomam-se o menor valor do conjunto de dados, 60, e soma ele amplitude, 10,
obtendo assim o limite superior da classe (ls), 70, os outros limites so obtidos sempre somando-se a
amplitude, 10, at formar 7 classes.
A frequncia absoluta (observada) obtida contando-se a quantidade de elementos no intervalo, ou seja, de
60 a 70 (no incluindo esse extremo) existem 5 valores, e assim sucessivamente. As outras frequncias so
obtidas da mesma forma que para dados no agrupados em classes.
Dimetro (mm)
Frequncia
absoluta (fi)
Frequncia
relativa (fr)
Frequncia
absoluta
acumulada (Fi)
Frequncia
relativa
acumulada (Fr)
60 |--- 70
70 |--- 80
80 |--- 90
90 |--- 100
100 |--- 110
110 |--- 120
120 |--- 130
5
6
8
13
10
6
2
50
5/50 = 0,10
6/50 = 0,12
8/50 = 0,16
13/50 = 0,26
10/50 = 0,20
6/50 = 0,12
2/50 = 0,04
1,00
5
11
19
32
42
48
50
-
0,10
0,22
0,38
0,64
0,84
0,96
1,00
-
11
1.5.5
Histograma
14
30,0%
12
25,0%
Frequncias Percentual
Frequncias
26,0%
10
8
6
4
20,0%
20,0%
16,0%
15,0%
12,0%
10,0%
4,0%
5,0%
0,0%
0
4
12
16
20
60
24
70
80
90
100
110
120
130
Dimetro (mm)
N de Salrios
1.5.6
12,0%
10,0%
Polgono de frequncias
Frequncias Percentual
14
Frequncias
12
10
8
6
4
2
0
4
12
16
20
24
25,0%
20,0%
15,0%
10,0%
5,0%
0,0%
N de Salrios
1.5.7
60
70
80
90
100
110
120
130
Dimetro (mm)
Neste grfico as classes so representadas pelos seus limites superiores, utilizando a frequncia acumulada.
12
A Ogiva de Galton formada pela unio, por retas, dos pontos que interceptam os limites superiores de
cada classe da tabela e a frequncia acumulada. O ponto inicial o limite inferior da 1 classe.
Tabela 01 - Informaes sobre sexo, idade (anos), altura (metro e centmetro), peso (kg), estado civil, nmero
de irmos, transporte, procedncia, relao do trabalho com o curso de Estatstica, meio de informao e
nmero de disciplinas reprovadas dos alunos da disciplina Inferncia Estatstica do curso de Estatstica da
UFES - 13/02/2013.
A partir do banco de dados acima construa tabelas e grficos para os seguintes tipos de variveis:
a) Varivel qualitativa (tabela simples e grfico).
b) Varivel discreta (tabela de frequncias e grfico de barras).
c) Varivel contnua (tabela de frequncias agrupada em classes).
13
d) Histograma.
e) Polgono de frequncias.
Apesar de ser apenas um cdigo e no uma operao, a notao Sigma tem algumas propriedades que
podem simplificar operaes. Entre elas destacamos:
i.
14
ii.
iii.
O somatrio do produto de uma constante por uma varivel o produto da constante pelo somatrio da
varivel.
iv.
O somatrio da diviso de uma varivel por uma constante a diviso do somatrio da varivel pela
constante.
Somatrio Duplo
...
...
X11
X12
...
X1j
...
X1s
=1
X21
X22
...
X2j
...
X2s
=1
...
...
Xi1
...
...
Xi2
...
Xij
...
Xis
=1
...
..
Xr1
...
...
...
Xr2
...
Xrj
...
Xrs
=1
1
=1
2
=1
=1
=1
Onde: = 1, 2, 3, , ( ) = 1, 2, 3, , ( ) Xij
=
15
1 +
=1
2 + +
=1
=
=1
=
=1 =1
= . .
=1
=1
Nas aplicaes estatsticas estaremos sempre interessados na soma de todos os valores da srie. Portanto, i
varia sempre de 1 a n e consequentemente no precisaremos indicar na notao sigma a variao de i. Desta
forma, identificaremos:
a) X1+ X2 + X3 + X4 + X5
b) X3 + X4 + X5 + X6
c) (X1 + 2) + (X2 + 2) + (X3 + 2)
d) (X3- 10) + (X4 - 10) + (X5 - 10) + (X6 - 10)
e) (X1 - 3) + (X2 3) + (X3 - 3)
f) ((X1 - 15)f1 + (X2 - 15)f2 + (X3 -15)f3
X1 = 2
X2 = 6
Y1 = 1
Y2 = 4
X3 = 7
Y3 = 5
X4 = 9
Y4 = 11
Calcular:
a)
3i=1(Yi 2)2
16
b)
4i=1(X i 4Yi )
2 = 364
X = 42
i=1
=1
2 = 324
X = 34
i=1
1,3
=1
1,3
17
LISTA DE EXERCCIOS 01
Xi
3
fi
2
a)
X
i 1
b)
f
i 1
c)
X
i 1
fi
2
i
fi
d)
X
i 1
4
e)
(X
i 1
f)
X
i 1
10) 2
i fi
g)
(2 X
i 1
10) 2 f i
18
5
6
10
8
12
7
4
13
4
18
5
3.
17
11
12
(a) Montar uma distribuio de frequncia em uma tabela em classes, com amplitudes de
classes c=4.
(b) Mostre as frequncias relativas, acumuladas e relativas acumuladas.
(c) Que proporo destes produtos enfrentam um tempo de espera de 9 minutos ou mais
no setor?
4. Uma indstria multinacional faz um levantamento das seguintes variveis com seus
gerentes: hobby; quantas vezes praticam esporte por semana; categoria de hotel em que se
hospedam quando em viajem e tempo gasto (por semana) na leitura de jornais e revistas.
a) Identifique e classifique cada uma das variveis consideradas?
b) Os resultados do tempo de leitura, em horas, para 25 funcionrios foi:
1.7 1.3
3.6 1.3 1.5 1.6 1.2 2.0 2.1 2.5 2.3 2.5 2.2
5. Faa uma tabela para mostrar que de um total de 850 homens entrevistados sobre a venda
da Vale do Rio Doce, 51 no tinham opinio, 425 eram favorveis e os demais eram
contrrios. Das 725 mulheres entrevistadas, 87 no tinham opinio, 522 eram favorveis e
as demais eram contrrias.
6. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe.
157
178
148
176
169
154
170
158
164
164
159
175
155
163
171
172
163
157
166
162
157
165
156
166
160
154
163
165
164
177
150
168
166
169
152
164
172
165
162
170
19
7.
10
16
Determine:
a)
b)
c)
d)
e)
f)
8. A tabela abaixo apresenta uma distribuio de frequncia das reas de 400 lotes de terra;
utilize-a para responder as questes.
reas (m)
300 |-- 400
400 |-- 500
500 |-- 600
600 |-- 700
700 |-- 800
800 |-- 900
900 |-- 1000
1000 |-- 1100
1100 |-- 1200
Total
N de lotes
14
46
58
76
68
62
48
22
6
400
j)
fi
1
fri
0,05
0,15
Fi
0,25
0,15
13
4
3
2
18
19
= 20
= 1,00
b)
Classes
0 |-- 2
2 |-- 4
4 |-- 6
|-8 |-- 10
10 |-- 12
|-14|-- 16
xi
1
5
7
13
fi
4
8
27
15
10
=
Fi
fri
0,04
30
0,18
0,27
72
83
0,10
0,07
=
21
Questo 01
a) 21
b) 12
c) 60
d) 334
e) 105
f) 31
g) 136
Questo 02
a) Qualitativa Nominal
b) Quantitativa discreta
c) Quantitativa contnua
d) Qualitativa nominal
e) Qualitativa ordinal
Questo 03
Questo 04
a) Hobby Qualitativa nominal
Vezes que pratica esporte Quantitativa Discreta
Categoria de hotel Qualitativa Ordinal
Tempo gasto - Quantitativa contnua
b)
Questo 05
Questo 06
a) AT = 30
b) c = 5
c)
22
d)
Tempo
Ponto Mdio
(P.M)
150,5
155,5
160,5
165,5
170,5
175,5
e)
Questo 07
a) 20
b) 15
c) 24
d) 20
e) 65,7%
f)
N de motoristas
25
20
15
10
5
0
N de acidentes
Questo 08
a) Amplitude da tabela (AT=1200 300 = 900). Amplitude dos dados no possvel
b) Limite superior = 800
c) Limite inferior = 1000
d) xi = 950. 48 lotes tm reas medindo em torno de 950 metros quadrados.
e) h=500 400 = 100
23
h)
Questo 09
a) fi : 1; 3; 4; 5; 3; 2; 1;1
fri: 0,05; 0,15; 0,2; 0,25; 0,15; 0,1; 0,05; 0,05
Fi: 1; 4; 8; 13; 16; 18; 19; 20
b) Classes: 6 |-- 8; 12 |-- 14
xi : 3; 9; 11; 15
fi : 18; 11; 7
Fi: 4; 12; 57; 100
fri: 0,08; 0,15; 0,11
24
2.1 - MDIA
Definimos a mdia aritmtica simples (ou mdia, apenas) de uma populao de tamanho N como sendo
o quociente da soma de todos os dados da populao pelo tamanho da mesma.
Seja o seguinte conjunto de dados de uma varivel X:
= { , , , , , } = { },
= , , ,
Estes dados podem ser provenientes de uma amostra ou de uma populao (normalmente o tamanho da
amostra simbolizado por n minsculo -, e o tamanho da populao por N maisculo).
Mdia de uma amostra
Exemplo: Sabendo-se que a produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15,
16, 18, 12 litros, temos, para produo mediada semana:
+ + + + + +
=
=
=
Logo,
= 14 litros
25
2.1.2
Quando desejamos conhecer a mdia dos dados agrupados numa distribuio de frequncias,
determinamos a mdia ponderada.
A frmula para calcular a mdia ponderada de uma amostra :
= .
ou
+
2
fi
8
10
4
3
25
fr
0,32
0,40
0,16
0,12
1,00
++ +
= ,
ou
= . = (
)+
)+
( ) + (
= ,
N de funcionrios (fi)
xi
152
156
11
160
164
168
172
Soma
40
--
26
Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe
coincidem com o seu ponto mdio, onde no clculo o xi o ponto mdio.
=
+ + + + +
=
=
Com n impar
Com n par
Para um nmero impar de observaes a mediana ser a mdia aritmtica dos termos de ordem:
+1
2
2
Aps a ordenao dos valores, do menor para o maior, a mediana dividir a srie de observaes em 2 partes
iguais, ou seja, 50% menores valores se encontram abaixo da mediana e 50% maiores valores se encontram
acima da mediana.
Exemplos:
Dadas a srie de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, a mediana ser:
n= 9 (impar)
Valores ordenados: 2, 5, 6, 9, 10, 13, 15, 16, 18
+
( )
( +1)
2
2
2
4 + 5
2
10+12
2
= 11
=11
mediana. Para isso devemos localizar a classe que contm o termo de ordem , ou seja, a classe que
contm a observao () a mesma classe que contm a mediana.
( () ) .
= +
N de Funcionrios (fi)
2
8
16
10
4
40
Fi
2
10
26
36
40
-
Localizada a classe mediana, devemos utilizar a frmula seguinte para o clculo do valor mediano:
( () ) .
( ) .
= +
= +
= + =
28
e)
N de
Funcionrios (fi)
1
2
3
4
5
6
Moda = 2
N de faltas/Servio
(xi)
2
15
3
2
2
3
1
2
3
4
5
6
Moda1 = 2 , Moda2 = 4
N de
Funcionrios (fi)
2
15
3
15
2
3
1
.
1 + 2
29
Onde:
li = limite inferior da classe modal
1 = diferena entre a frequncia da classe modal e a frequncia da classe anterior.
2 = diferena entre a frequncia da classe modal e a frequncia da classe posterior.
c = amplitude ou tamanho da classe modal
EXEMPLO:
Calcular o salrio modal a partir da distribuio de frequncia dos 40 funcionrios de uma empresa.
Salrios (xi)
400 |-- 600
600 |-- 800
800 |-- 1000
1000 | -- 1200
Total
N de Funcionrios (fi)
3
8
20
9
40
O intervalo de salrios de 800 a 1000 reais considerado a classe modal, pois o intervalo que tem a maior
frequncia de funcionrios com estes salrios.
Utilizando a frmula para clculo da moda temos:
= +
1
12
. = 800 +
. 200 = 904,35
1 + 2
12 + 11
= 904,35
2
1
3
3
4
6
5
10
6
13
7
8
8
5
9
3
10
1
Calcule:
a) A nota mdia
b) A nota mediana
c) A nota modal
30
0 |-- 2
2|-- 4
4 |-- 6
6|-- 8
8|--10
Total
11
15
45
Onde:
li = limite inferior da classe que contm o quartil desejado
c = amplitude do intervalo de classe
F(ant) = frequncia acumulada at a classe anterior classe quartlica.
fi = frequncia absoluta simples da classe quartlica.
2.4.1.1 Diagrama de Caixa ou BOX-PLOT
O boxplot (grfico de caixa) um grfico utilizado para avaliar a distribuio emprica do dados. O
boxplot formado pelo primeiro e terceiro quartil e pela mediana. As hastes inferiores e superiores se
estendem, respectivamente, do quartil inferior at o menor valor no inferior ao limite inferior e do quartil
superior at o maior valor no superior ao limite superior.
Para este caso, os pontos fora destes limites so considerados valores discrepantes (outliers) e so denotados
por asterisco (*).
32
A escala de medida da varivel encontra-se na linha horizontal do quadro onde est inserida a
figura.
Observe que 50% da distribuio tm valores dentro da caixa.
As linhas horizontais que saem da caixa terminam nos limites inferior (LI) e superior (LS) da
distribuio. Entre esses limites encontram-se os valores considerados como tpicos da distribuio.
Esses limites so determinados em funo da distncia entre os dois quartis (Q3 e Q1), isto , do
desvio inter-quartlico: DQ = Q3 Q1.
O elemento que definir a ordem do centil ser encontrado pelo emprego da expresso:
.
100
onde:
i = nmero identificador do centil
n = nmero total de observaes
Para dados agrupados em classes, encontraremos os centis de maneira semelhante utilizada para clculo
da mediana, dos quartis.
.
(
() ) .
= +
33
Exemplo: A tabela abaixo refere-se a quantidade de negcios efetuados diariamente por uma instituio
financeira. Calcular o 3 quartil e o 40 centil.
Quantidade de neg/dia
11
12
13
14
15
16
fi
2
5
6
8
3
2
Fi
2
7
13
21
24
26
3 26
=
= 19,5 20
4
4
3 = 326 = 19,5 20 = 14
4
Exemplo: Com base na tabela de distribuio do consumo mdio de eletricidade (kw/hora) entre usurios
em uma cidade X. Encontre o:
a) Terceiro quartil;
b) vigsimo quinto centil;
Consumo (Kwh)
5 |-- 25
25 |-- 45
45 |-- 65
65 |-- 85
85 |-- 105
105 |-- 125
125 |-- 145
145 |-- 165
Resoluo:
a) Q3
Encontrar a posio do terceiro quartil:
380
4
N de usurios (fi)
6
4
14
26
14
7
6
3
Fi
6
10
24
50
64
71
77
80
= 60
34
O Q3 est localizado na 60 posio, logo encontra-se na 5 classe. Com base nesses dados, calcularemos Q3
da seguinte forma:
.
3 80
( () ) .
( 4 50) 20
= +
= +
= + , = ,
Interpretao: 75% dos usurios consomem at 99,29 kwh. De maneira anloga, 25% dos usurios
consomem mais de 99,29 kwh.
b) C25
Encontrar a posio do centil 25:
2580
100
= 20
O C25 est localizado na 20 posio, logo se encontra na 3 classe. Com base nesses dados, calcularemos
C25 da seguinte forma:
.
(
() ) .
(
)
= +
= +
= + , = , .
Interpretao: 25% dos usurios consomem at 59,29 kwh. De maneira anloga, 75% dos usurios
consomem mais de 59,29 kwh.
fi
Fi
10
19
24
28
35
fi
18
31
15
3
1
1
1
= 70
36
LISTA DE EXERCCIOS 02
1- Calcule a mdia aritmtica, mediana e moda para cada uma das distribuies abaixo:
a) Pesos de recm-nascidos (em kg): 2.7; 3.9; 4.1; 4.3; 5.4
b) Taxas sanguneas de uria (mg/dl): 27; 31; 32; 34; 46; 61
c) Estatura de 140 alunos (em cm):
2- Qual o nmero mdio, mediano e o 3 quartil do nmero de atendimentos em servio mdico por
funcionrios de uma empresa, distribudos na tabela abaixo:
N de
atendimentos
N de funcionrios
TOTAL
24
21
50
3- O salrio-hora de cinco funcionrios de uma companhia, so: R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00
e R$88,00. Determine:
a) a mdia dos salrios-hora;
b) o salrio-hora mediano.
4- Calcule a mdia aritmtica, mediana, moda e o C80 das distribuies de frequncia abaixo:
a)
b)
5- Voc fez dois trabalhos num semestre e obteve as notas 8,5 e 5,5. Qual deve ser a nota que voc
deve tirar no 3 trabalho para que a mdia dos trs seja 7?
6- Numa empresa, vinte operrios tm salrio de R$ 4.000,00 mensais; dez operrios tm salrio de R$
3.000,00 mensais e trinta tm salrio de R$ 2.000,00 mensais. Qual o salrio mdio desses
operrios?
7- Qual a percentagem de valores que se localiza entre o ultimo quartil e o C81?
8- Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40 elementos. Se o peso
mdio do grupo A for e 80kg e o grupo B for de 70kg ento verdade que o peso mdio dos dois
grupos considerados em conjunto de 75kg? Justifique.
9- Um concurso realizado simultaneamente nos locais A, B e C, apresentou mdias: 70, 65 e 45, obtidos
por 30, 40 e 30 candidatos, nessa ordem. Qual a mdia geral do concurso?
37
10- Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma mdia de 70
pontos em determinada prova. Sabendo-se que a mdia geral dos candidatos (independente do
sexo) foi de 64 pontos, qual foi a mdia dos candidatos do sexo feminino?
11- Dado o histograma abaixo, calcular a mdia, moda, mediana e o centil 70.
12- O histograma abaixo representa os salrios, em reais (R$) dos 100 empregados de uma empresa:
a)
b)
c)
d)
e)
f)
g)
38
1a)
mdia: 4,08
mediana: 4,1
moda: Amodal
b)
mdia: 28,5
mediana: 33
moda: Amodal
c)
mdia: 164,93
mediana: 164,08
moda: 162,5
2- = 0,68 , = 1 3 = 1
3- a) R$ 96
b) R$ 88
4- a) mdia: 5,3
b) mdia: 172,4
5678-
mediana: 5,28
mediana: 174
moda: 5,2
P80: 7,64
moda: 176,57
P80: 180,22
7
R$ 2833,33
6%
. = 72
9- = 60,5
10- = 55
11 = 6,8
Md = 7
Mo = 8,66 C70=8,66
12a) 64%
b) 76
c) 56
d) = 9,84
e) Md = 10,33
f) C85 = 15,12
g) C14= 3,5
39
A
B
C
5
10
10
10
9
10
7
12
9
15
9
10
14
14
9
12
8
9
4
9
10
7
7
11
10
8
7
Mdia
11 9,5
9 9,5
10 9,5
Verificamos que a mdia dos trs candidatos nos 10 testes 9,5, ou seja, os trs tem o mesmo rendimento.
Por outro lado, vemos que existe significativa diferena nas distribuies das notas. Ento, para decidir qual
o melhor candidato analisamos a disperso ou variabilidade das notas de cada candidato, para verificar qual
apresenta mdia mais confivel.
As medidas de disperso podem ser absolutas ou relativas. A seguir apresentaremos as que so consideradas
mais importantes.
a medida mais simples de disperso. Consiste em identificar os valores extremos do conjunto (mnimo e
mximo), podendo ser expresso:
- pela diferena entre o valor mximo e o mnimo;
41
Exemplo 02: Observe o conjunto abaixo, referente s notas de duas turmas de Estatstica:
X = 4; 6; 4; 6; 5; 5
Y = 9; 1; 5; 5; 1; 9
= 5
= 5
OBS:
42
3.1.4 - Varincia ( ou s)
A varincia uma das medidas de disperso mais importantes, pois proporciona uma mensurao
da disperso dos dados em torno da mdia.
Para calcularmos a varincia devemos considerar os desvios de cada valor em relao mdia. Como
estamos interessados nos tamanhos dos desvios e no no fato deles serem positivos e negativos trabalhamos
com os desvios ao quadrado. Tomamos a mdia aritmtica dos desvios ao quadrado, obtemos a varincia.
Dados
Populao
( )
=
Amostra
(
)
=
Ou
Ou
2
=
2 2
=
1
Simples
( )
(
)
Ou
Ou
Tabelas
2
=
2 =
2 2
1
A unidade de medida da varincia equivale unidade dos dados ao quadrado (e portanto o quadrado da
unidade da mdia) causando dificuldades para avaliar a disperso. Para retornarmos a unidade original dos
dados tiramos a raiz quadrada da varincia obtendo assim o desvio padro.
43
Dados simples:
(
)
=
Tabelas:
(
)
=
A
B
C
5
10
10
10
9
10
7
12
9
15
9
10
14
14
9
12
8
9
4
9
10
7
7
11
10
8
7
Mdia
11 9,5
9 9,5
10 9,5
Candidato A:
=
( )
( , ) + ( , ) + ( , ) + + ( , )
= ,
( )
= =
= , = ,
Candidato B:
=
( )
( , ) + ( , ) + ( , ) + + ( , )
= ,
( )
= =
= , = ,
Candidato C:
=
( )
( , ) + ( , ) + ( , ) + + ( , )
= ,
44
( )
= =
= , = ,
Mdia amostral:
=
( ) + ( ) + + ( )
=
=
=
Varincia:
=
) ( ) + + ( )
(
=
=
= ,
Desvio padro:
= = , = ,
45
Propriedade da Soma
Somando-se ou subtraindo-se uma constante a todos os valores de uma varivel, o desvio padro no se
altera.
= 5
= { 1, 3, 5, 7, 9},
Mdia:
Varincia:
2 =
1 (
1
= 10
2 =
S2 =
+2)]
1 [( +2)(
1
2)]
1 [( +2
1
1 (
1
= 10
Propriedade da Multiplicao
Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante (diferente de zero),
o desvio padro fica multiplicado ou dividido por este valor.
Se multiplicarmos as observaes por 2, teremos:
2 =
Ou seja, a varincia ser multiplicada pelo quadrado da constante que multiplicou os valores da varivel.
Portanto, o desvio ser multiplicado pela prpria constante:
= 22 = 4 10 2 3,2 = 6,4
Mdia
9,5
9,5
9,5
Desvio padro
3,5
2,0
1,0
,
= , %
,
. % =
,
= , %
,
. % =
,
= , %
,
Ou seja,
0 % CV 20% Disperso baixa (mdia boa como medida de resumo).
20% < CV 30% Disperso moderada (mdia razovel como medida de resumo).
CV > 30% Disperso alta (mdia ruim como medida de resumo).
47
Exerccio 1 Um exame fsico examinou 6 indivduos cujos pesos (kg) foram: 68; 70; 86; 55; 75 e 90. No
mesmo exame, foram tambm tomadas medidas de altura (cm), com seguintes valores: 170; 160; 164; 164;
170 e 180. Os indivduos apresentam maior variabilidade no peso ou altura?
Exerccio 2 Na tabela abaixo encontra-se a estrutura do produto interno bruto do Brasil, em bilhes de
reais, segundo as atividades econmicas.
Exerccio 3 - Uma varivel X tem mdia igual a 10 e varincia igual a 16. Calcule a mdia e a varincia da
varivel dada por Y = (3X + 5) / 2.
48
Exerccio 5 - Dado o polgono de frequncias para as profundidades de poos de petrleo (metros), avalie a
disperso dos dados em torno da mdia.
49
LISTA DE EXERCCIOS 03
fi
3,4 |--3,8
3,8 |--4,2
4,2 |--4,6
10
4,6 |--5,0
5,0 |--5,4
Total
25
Pede-se:
a) A linha de produo deve ser paralisada? Por qu?
b) A mdia e uma boa medida de resumo para o conjunto de dados? Explique pela disperso
relativa(CV) dos dados.
c) Estime a menor medida entre as 25% maiores.
a) Encontre a mdia amostral e o desvio padro amostral para o tempo de execuo de cada
mquina.
b) Suponha que voc seja o responsvel de dar o parecer. Qual das duas escolheria? Justifique
(Use CV).
6) Dado o grfico abaixo, pede-se:
a)
b)
c)
d)
e)
f)
Cidade B:
2,0
2,5
2,8
2,8
2,5
2,6
2,6
2,4
2,4
2,0
2,3
2,5
2,6
2,4
2,8
2,8
2,5
1,7
1,9
1,8
1,8
2,2
2,0
2,8
2,5
3,2
2,5
2,1
2,3
2,4
a)
b)
Pede-se:
a) A mdia, a mediana, a moda, o desvio mdio, a varincia, o desvio padro e o coeficiente de
variao.
b) Os dados possuem pequena disperso? Por qu?
c) Somar 100 de cada observao para obter uma amostra com valores transformados e calcule a
mdia, a varincia. (Compare essa varincia com os dados originais).
09) A idade mdia dos candidatos a um determinado curso de aperfeioamento sempre foi baixa, da ordem
de 22 anos. Como esse curso foi planejado para atender a todas as idades, decidiu-se fazer uma campanha
de divulgao. Para se verificar se a campanha foi ou no eficiente, fez-se um levantamento (amostra) da
idade de candidatos ltima promoo, e os resultados esto na tabela a seguir.
Idade
18 |-- 21
21 |-- 24
24 |-- 27
27 |-- 30
30 |-- 33
Total
N de
candidatos
18
12
10
50
a) Baseando-se nesses resultados, voc diria que a campanha produziu algum efeito (isto , aumentou
a mdia)?
b) Um outro pesquisador decidiu usar a seguinte regra: se a diferena x 22 fosse maior que o valor
2 SX /n, ento a campanha teria surtido efeito. Qual a concluso dele, baseado nos dados?
c) O que podemos dizer sobre a qualidade da mdia de idade levando-se em considerao a disperso
dos dados?
d) Acima de que valor de idade esto os 5 candidatos mais velhos?
52
Questo 1)
a) Sim, pois a varincia da amostra maior que a varincia tolerada de 0,15.
= 4,29
2 = 0,207
= 0,455
b) A mdia tem uma boa qualidade, o coeficiente de variao menor que 20%, representadno
baixa disperso.
0,455
= 100 =
100 = 10,6%
4,29
c) P75 = 4,55
O menor valor entre os 25% maiores 4,55.
Questo 2) :
: =
100 =
15
65
100 = 23,1%
15,3
100 =
100 = 21,9%
70
Questo 3)
= 2,41
2 = 0,2865
= 0,535
100 =
0,535
2,41
100 = 22,19%
A mdia de qualidade moderada, pois os dados apresentam moderada disperso. CV > 20%
Questo 4) :
a) A cidade A apresenta preo mdio mais baixo. = 6,9
= 8,7
b) Cidade A.
75 = 9,0
: 75 = 10,43
c) Cidade A
2 = 6,25
2 = 4,96
= 2,5
2,5
100 =
100 = 36,24%
6,9
= 2,23
2,23
100 =
100 = 25,6%
8,7
Questo 5)
a) : = 24,1 2 = 0,277 = 1,66
: = 26
2 = 5,33
= 2,31
b) A mquina W, pois apresenta menor percentual de variao.
:
:
1,66
100 =
100 = 6,9%
24,1
2,31
= 100 =
100 = 8,88%
26
53
Questo 6)
a)
Percentual de
aumento
0|-- 2
2|--4
4|--6
6|--8
8|--10
b)
c)
d)
e)
fi
5
15
33
25
22
100
Fi
5
20
53
78
100
fr
5,0%
15,0%
33,0%
25,0%
22,0%
100,0%
Fr
5,0%
20,0%
53,0%
78,0%
100,0%
f)
= 2,28
100 =
2,28
5,88
Questo 7)
a) Cidade A.
b)
Cidade B. Menor coeficiente de variao.
= 2,39
2 = 0,12
= 0,34
0,34
100 =
100 = 14,34%
2,39
= 2,32
2 = 0,108
= 0,33
0,33
100 =
100 = 14,22%
2,32
Questo 8)
a) A mdia, a mediana, a moda, o desvio mdio, a varincia, o desvio padro, o erro padro, e o
coeficiente de variao.
10,08
= 100,25
2 = 101,64
= 10,06
= 100 =
100 = 10,06%
100,25
Questo 09)
a) Sim, a mdia da amostra 23,34. Superior a 22 anos. = 23,34
b) Se x 22 > 2 SX /n
2 = 30,43
= 5,51
x 22 = 23,34 22 = 1,34
2 SX
n
2 5,51
50
= 1,56
No surtiu efeito.
5,51
23,34
100 = 23,63%
54
UNIDADE IV - PROBABILIDADE
4.0 INTRODUO A PROBABILIDADE
Normalmente impossvel identificar com certeza o resultado de um evento futuro:
Usando a teoria da probabilidade, possvel quantificar a chance de um evento futuro ocorrer com base em
informaes obtidas de eventos passados.
Evento
Um evento pode ser referido a um nico resultado, ou a um subconjunto de resultados, pertencente
um espao amostral;
Exemplo:
Lanamento de um dado:
Podemos determinar o espao amostral do experimento atravs do diagrama de rvore, til para resoluo
de problemas que sero vistos futuramente:
Denio clssica:
Denio frequentista:
4
1
=
=
52
13
57
EXEMPLO 03: Em um estudo para verificar a probabilidade dos indivduos da cidade X apresentarem Rh- ou
+, em seus tipos sanguneos, foram coletadas informaes de 820 indivduos.
83
= 0,1012
820
737
= 0,8988
820
EXEMPLO 04: Os registros de uma companhia de aviao mostram que durante certo tempo 468 dentre 600
de seus jatos da linha Vitria-Rio chegaram no horrio, qual a probabilidade de que um avio daquela linha
chegue no horrio?
N de jatos que chegaram no horrio: 468
N total de jatos: 600
( ) =
=
468
600
= 0,78 = 78%
Lei dos grandes nmeros: Se repete-se um experimento um grande nmero de vezes a probabilidade pela
frequncia relativa de um evento tende para probabilidade terica.
Propriedades da Probabilidade:
P() = 1
( )
Teorema da soma:
( )
Ac
( ) = () + () ( )
Exemplo:
( ) = () + ()
83
= 0,1012
820
() =
737
= 0,8988
820
( ) = 0
( ) = () + () = 0,1012 + 0,8988 = 1
c = B
c = A
EXEMPLO 06: A tabela a seguir apresenta dados relativos distribuio de sexo e alfabetizao em
habitantes de Sergipe com idade entre 20 e 24 anos.
Um jovem entre 20 e 24 anos escolhido ao acaso em Sergipe, calculamos as probabilidades das seguintes
maneiras:
: conjunto de 101.850 jovens de Sergipe, com idade entre 20 e 24 anos.
M: jovem sorteado do sexo masculino;
F: jovem sorteado do sexo feminino;
S: jovem sorteado alfabetizado;
60
Temos,
() =
() =
48.249
101.850
85.881
101.850
= 0,474
= 0,843
() =
() =
= 0,526
15.696
101.850
= 0,157
:
( ) =
53.601
101.850
39577
=
= 0,389
101850
:
( ) =
39577
=
= 0,389
101850
Questo 02: Sendo A e B dois eventos em um mesmo espao amostral traduza para a linguagem da teoria
dos conjuntos, as seguintes situaes:
a) Pelo menos um dos eventos ocorre;
b) O evento A ocorre, mas B no ocorre;
c) Nenhum deles ocorre;
Questo 03: Em uma universidade,2000 estudantes do curso de medicina, em determinado ano, foram
classificados de acordo com o tipo de esporte que praticam. Futebol praticado por 260 estudantes, natao
por 185 estudantes e musculao por 210 estudantes, sendo que alguns praticam mais de um desses
61
esportes. Assim, tem-se 42 estudantes que praticam natao e musculao, 12 futebol e musculao, 18
futebol e natao e 3 praticam as trs modalidades. Se um desses estudantes sorteado ao acaso, qual a
probabilidade de:
Questo 04: Trs cavalos A, B, C esto numa corrida. Sabe-se que A duas vezes mais provvel de ganhar
que B e esse duas vezes mais do que C. Determinar as probabilidades de ganhar dos cavalos A, B e C.
Questo 05: Supor uma classe onde trs alunos so considerados com capacidade de liderana, 16 no tem
essa capacidade e dois so no-classificveis. Escolhendo-se um aluno ao acaso, qual ser a probabilidade de
esse aluno ter capacidade de liderana ou ser no-classificvel.
Questo 06: Suponha que em um lote com 20 animais existem 5 doentes. Escolhem-se 4 animais do lote ao
acaso, isto , uma amostra de 4 elementos, de modo que a ordem dos elementos seja irrelevante.
Considerando o evento E: 2 doentes na amostra, calcular P(E).
Questo 07: O jogo da Megasena consiste em escolher 6 dezenas dentre as 60 dezenas (01, 02,..., 60). Qual
a probabilidade de um jogador ganhar o prmio mximo com um nico jogo de 6 dezenas? E com um nico
jogo de 15 dezenas?
62
Num experimento em que um dado lanado duas vezes, sabe-se que a soma dos dois resultados
vale 9. Qual a probabilidade de que o primeiro resultado tenha sido 6?
a probabilidade de uma pessoa ser hipertensa varia segundo o estado nutricional dela. Os obesos
tm maior probabilidade de hipertenso comparados com os no obesos.
A notao : P(A|B) e se l da seguinte maneira: Probabilidade de ocorrer o evento A dado que ocorreu o
evento B.
Neste caso, a ocorrncia do evento B um fato. No existe incerteza a esse respeito. A incerteza est
restrita ocorrncia do evento A.
( )
()
(|) =
( )
()
Exemplo 07: Os dados abaixo se referem a 200 alunos matriculados em determinado Instituto de
matemtica, de acordo com o sexo e o curso:
Matemtica Pura
Estatstica
Total
Masculino
60
80
140
Feminino
50
10
60
Total
110
90
200
63
( )
(|) =
=
=
()
c) Ser homem?
() =
e)
B
2/5
3/4
2/4
3/5
B
relacionado coma a intercesso de
V ocorrerem os eventos A e B
B
condicional:
V
2/4
( ) = (|). ()
Essa regra de grande utilidade na verificao de dependncia entre eventos envolvidos.
Dois eventos so considerados independentes quando a ocorrncia de um no influencia na ocorrncia ou
no ocorrncia do outro;
Logo, se dois eventos, A e B, so INDEPENDENTES tem-se:
P(A|B) = P(A) e P(B|A) = P(B);
Ou seja, P(AB) = P(A) x P(B)
OBS: os termos mutuamente exclusivos e independentes no so sinnimos; basta lembrar que eventos
mutuamente exclusivos no possuem interseco.
Exemplo 08: Uma urna contm 2 bolas brancas (B) e 3 vermelhas (V). Suponha que sorteamos duas bolas ao
acaso sem reposio.
a segunda retirada ter probabilidades diferentes, de acordo com o que foi selecionado na primeira,
portanto, ter as seguintes probabilidades:
P (B|B) = 1/4 , P (B|V) = 2/ 4 , P (V|B) = 3/4 e P (V|V) = 2/4
65
Exemplo 09: Uma urna contm 2 bolas brancas (B) e 3 vermelhas (V). Suponha que sorteamos duas bolas ao
acaso com reposio. Nesse caso, as retiradas so independentes, ou seja, a primeira retirada no influencia
nas possibilidades de resultados da segunda retirada.
2/5
P(V), Portanto:
3/5
2/5
3/5
66
Exerccio 01: Considere as situaes dadas abaixo. Identifique se os eventos so mutuamente exclusivos ou
independentes.
a) Evento A: O 1 filho de um casal ser menina; Evento B: O 2 filho de um casal ser menina.
b)
c) Considere dois eventos, A e B, dado que P(A)= 0,8, P(B) = 0,5 e P(A B) = 0,4.
Exerccio 02: A tabela a seguir mostra a relao entre dois sintomas que costumam aparecer em pessoas com
uma determinada doena. A amostra est formada por 266 pessoas com a doena.
Exerccio 03: Em um estudo feito com 25 pessoas, foram coletadas informaes sobre o estilo de vida de
cada um (sedentrio ou no) e sobre o peso de cada um (obeso ou no). Foi observado 8 pessoas obesas e
12 sedentrias; dentre as 8 pessoas obesas, 6 foram classificadas como sedentrias. Qual a probabilidade de:
67
Exerccio 04: Sejam A e B eventos com P(A) = , P(A U B) = 1/3 e P(B) = p. Encontre p
nos seguintes casos:
a) Se A e B so mutuamente exclusivos.
b) Se A e B so independentes.
1.
2.
3.
4.
5.
6.
7.
Se num grupo de 10 homens e 6 mulheres sorteamos 3 pessoas para formarem uma comisso, qual a
probabilidade de que essa comisso seja formada por 2 homens e 1 mulher? (R: 27/56)
8. A probabilidade de fechamento de cada rel do circuito apresentado abaixo dada por p. Se todos os
rels funcionarem independentemente qual ser a probabilidade de que haja corrente entre os
terminais L e R? (R: 2p-p4 )
9.
Um restaurante popular apresenta apenas dois tipos de refeies: salada completa ou um prato base
de carne. Considere que 20% dos fregueses do sexo masculino preferem a salada, 30% das mulheres
escolhem carne, 75% dos fregueses so homens e os seguintes eventos:
H: fregus homem
A: fregus prefere salada
M: fregus mulher
a)
b)
c)
10. Em uma fbrica de parafusos, as mquinas A, B e C produzem 25, 35 e 40% do total produzido
respectivamente. Da produo de cada mquina 5, 4 e 2%, so defeituosos, respectivamente. Retira-se
um parafuso ao acaso e verifica-se que defeituoso. Qual o probabilidade que tenha sido produzido por
A? E por B? e por C? (R: 0,36; 0,41; 0,23)
11. As probabilidades de trs motoristas serem capazes de guiar at em casa, independentemente, com
segurana, depois de beber, so: 0,30, 0,25 e 0,20. Se decidirem guiar at em casa, aps beberem numa
festa:
a) Qual a probabilidade de todos os trs motoristas sofrerem acidentes? (R: 0,42)
b) Qual a probabilidade de pelo menos um dos motoristas guiar at em casa a salvo? (R:0,58)
12. A probabilidade de que um atleta A ultrapasse 17,30 m num nico salto triplo de 0,7. O atleta d 4
saltos. Qual a probabilidade de que em pelo menos num dos saltos ultrapasse 17,3m? (R: 0,9919)
13. O Jos est indeciso quanto compra de trs discos. Resolveu fazer o seguinte: para cada um atira
uma moeda ao ar e se sair cara compra o disco. Determine a probabilidade de:
a) no comprar nenhum; (R: 1/8)
b) comprar pelo menos um; (R: 7/8)
c) comprar pelo menos dois. (R: 1/2)
14. O Joo tem 20 pares de meias e o Jos tem 16. Se escolhermos ao acaso um par de meias de cada um,
a probabilidade de ambas serem brancas 0.25. Se o Joo tem 10 pares de meias brancas quantas meias
brancas tem o Jos? (R: 8 meias brancas)
69
15. Dos ouvintes de uma estao radiofnica 37% ouvem o programa X, 53% ouvem o programa Y e 15%
ouvem ambos os programas. Ao escolher aleatoriamente um ouvinte desta estao qual a
probabilidade de que
i) Oua apenas um dos referidos programas; (R: 0,6)
ii) No oua nenhum destes dois programas. (R: 0,25)
16. A tabela a seguir apresenta dados dos 1000 ingressantes de uma universidade, com informaes
sobre rea de estudo e classe scio econmica.
rea\Classe
Exatas
Humanas
Biolgicas
Alta
120
72
169
Mdia
156
85
145
Baixa
68
112
73
d) 0,189
b) 14/33
c) 19/33
18. Duas lmpadas ruins so misturadas com 2 lmpadas boas. As lmpadas so testadas uma a uma, at
que as 2 ruins sejam encontradas. Qual a probabilidade de que a ltima ruim seja encontrada no:
a) Segundo teste;
b) Terceiro teste;
c) Quarto teste.
Resposta: a) 1/6
b) 1/3
c)
19. Uma pessoa joga um dado. Se sair 6, ganha a partida. Se sair 3, 4 ou 5, perde. Se sair 1 ou 2, tem direito
de jogar novamente. Desta vez, se sair 4, ganha, e se sair outro nmero, perde. Qual a probabilidade de
ganhar? (R: 2/9)
Como em muitas situaes experimentais precisamos atribuir um nmero real x a todo elemento do espao
amostral, vamos definir o conceito de varivel aleatria.
Varivel aleatria (v.a) uma varivel que tem um valor numrico nico, para cada resultado de um
experimento.
Sejam E um experimento aleatrio e S o espao amostral associado ao experimento. Uma funo X,
que associe a cada elemento s S um nmero real X(s) denominada varivel aleatria.
S
s
R
X
X(s)
Varivel aleatria
Exemplo 01:
E: lanamento de duas moedas
X: nmero de caras obtidas nas duas moedas
S = {(ca,ca),(ca,co),(co,ca),(co,co)}
X = 0: corresponde ao evento (ca,ca)
X = 1: corresponde ao evento (co,ca), (ca,co)
5.1. VARIVEL ALEATRIA DISCRETA (v.a.d.)
Dizemos que a varivel discreta X aleatria se a cada um de seus possveis valores se associa uma
probabilidade P(x).
5.1.1 Funo de probabilidade da varivel aleatria discreta
71
uma funo que associa a cada valor assumido pela varivel aleatria a probabilidade do evento
correspondente. O conjunto dos valores da varivel e das respectivas probabilidades, isto , o conjunto dos
valores Xi e P(Xi), com i = 1,...,n, uma distribuio de probabilidade de X.
Seja X uma v. a. discreta, a probabilidade da varivel aleatria X assumir um valor particular x, a funo de
probabilidade X que se representa por P(X = x). A funo P(X = x) constitui uma Distribuio de
probabilidades desde que:
1. 0 () 1,
2. 1 ( ) = 1, onde x toma todos os valores possveis.
P(x)
1/8
3/8
3/8
1/8
Distribuio de Probabilidades
72
Pode-se verificar o que est ocorrendo com um conjunto de dados utilizando tabelas, grficos, medidas de
tendncia central e medidas de variao. Combinando esses conceitos com os da Teoria das Probabilidades
podemos definir as Distribuies de Probabilidades, que descrevem o que provavelmente acontecer, em
lugar do que efetivamente aconteceu.
Toda Distribuio de Probabilidade deve ser apresentada por:
Tabelas
Grficos
Modelo (Equao)
,
2
D.P?
6
=1
2
x
,
6
=3
73
Exemplo 04: Considere o experimento que consiste em sortear duas bolas de uma urna que contm 3 bolas
brancas (B) e 2 pretas (P). Montar a distribuio de probabilidade de X para os casos: com reposio e sem
reposio.
Seja X o nmero de bolas pretas na amostra.
Com reposio:
Sem reposio:
5.1.2 Mdia (ou valor esperado) e varincia de uma varivel aleatria discreta
E ( X ) x1 p( x1 ) x2 p( x2 ) ... xn p( xn )
E ( X ) xP( x)
Assim:
1) E(k) = k
k = constante
2) E(kX) = k E(X)
3) E(X + k) = E(X) + k
4) E(X Y) = E(X) E(Y)
Exemplo 05: Considere que o valor de venda de um determinado imvel pode alcanar os valores a seguir,
com as respectivas probabilidades de ocorrncia:
E ( X ) xi P( xi )
i 1
Isso significa que se este imvel fosse vendido um infinito n de vezes, a mdia dos seus valores de venda
seria igual a $232.000,00. Uma outra interpretao seria a de que se um n infinito de imveis desse mesmo
tipo fosse vendido, o valor mdio do preo de venda seria $ 232.000,00.
75
2 = ( )2 ( )
() = [ ()]2 ( )
VAR ( X ) E( X 2 ) [ E( X )]2
O desvio padro ( ou S) da varivel aleatria da v.a. discreta dado por:
2 VAR ( X )
Propriedades da Varincia
1) VAR (k) = 0
k = constante
(se X e Y independentes)
Exemplo 06: Considere que o nmero de reclamaes recebidas diariamente em uma determinada empresa
de telefonia segue a seguinte distribuio de probabilidades:
76
CV ( X )
S(X )
0,942
*100
*100 34,2%
E( X )
2,75
Exemplo 07: Considere que numa grande rede de computadores, em 60% dos dias ocorre alguma falha.
Construir a distribuio de probabilidades e calcular as medidas de posio e disperso para a varivel
aleatria X = nmero de dias com falhas na rede, considerando o perodo de observao de trs dias.
(Suponha independncia.)
Espao amostral: S = {(B,B,B), (B,B,R), (B,R,B), (R,B,B), (B,R,R), (R,B,R), (R,R,B), (R,R,R)}
S ( X ) V X 0,72 0,848
O nmero esperado de dias com falha na rede E(X)= 1.8, ou seja, aproximadamente 2 dias. Apresentando
um desvio padro de 0,848.
1 - Em um lote com 4 peas, das quais 2 so defeituosas retira-se ao acaso duas peas, com reposio.
Considere X o nmero de peas defeituosas nas duas retiradas. Construa a distribuio de probabilidade para
a varivel X e calcule E(X).
a) Ache A.
b) Calcule P(X 4).
c) Calcule P(X 3).
78
3 - O nmero de mensagens enviadas por hora, atravs de uma rede de computadores, tem a seguinte
distribuio:
X=
Nmero
mensagens
f(x)
de
10
11
12
13
14
15
0,08
0,15
0,30
0,20
0,20
0,07
Assim a probabilidade de uma v. a. contnua assumir um determinado valor (probabilidade no ponto [P(X=x)]
) nula, pois a rea embaixo de um ponto igual a zero.
Para identificar uma distribuio contnua, existe a funo densidade de probabilidade, que uma equao
do tipo y = f(x).
79
Exemplo 08: Uma metalrgica produz uma pea cujo comprimento varia aleatoriamente entre 5cm e 7cm.
No possvel neste caso representar toda distribuio de probabilidade em uma tabela, pois h infinitos
valores. Como h infinito valores, mas a soma de todas as probabilidades continua sendo 1, conclui-se que a
probabilidade de um valor definido zero !!
S faz sentido falarmos em probabilidades intervalares.
Por exemplo:
Probabilidade do comprimento estar entre 5,2cm e 5,3cm. P( 5,2<x<5,3 )
Probabilidade do comprimento ser menor que 6,0cm. P( x<6,0 )
Probabilidade do comprimento ser maior que 6,5cm. P( x>6,5 )
Uma funo densidade de probabilidade f(x) pode ser usada para descrever uma distribuio de
probabilidades de uma varivel aleatria contnua X.
Funes de densidade so usadas na engenharia para descrever sistemas fsicos, como por exemplo, a
densidade de uma carga em uma viga longa e delgada.
Definio: Para uma varivel aleatria contnua X, uma funo densidade de probabilidade (fdp) uma
funo tal que:
f ( x)dx 1 ;
c) P (a X b)
80
Obs.:
* 0 P ( a X b) 1
* P( X x) 0
* P ( a X b) P ( a X b) P ( a X b) P ( a X b)
Exemplo 09: Suponha que o erro medido na temperatura de reao (C) em um experimento controlado em
laboratrio seja uma v.a. contnua cuja fdp dada por:
1
x se 1 x 2
f ( x) 3
0, caso contrrio
a) Verifique se f(x) satisfaz a condio para ser uma fdp.
1
x 2 2 (1)
x dx |
0,8889 0,1111 1
1 3
9 1 9
9
Satisfaz, pois
f ( x)dx 1
1
x 1 1 (0)
x
dx
Exemplo 10: Uma varivel X tem distribuio triangular no intervalo [0,1] se sua f.d.p for dada por:
0
() = {
(1 )
0
< 0
0 1/2
1/2 1
> 1
(ii)
f ( x)dx 1
81
1/ 2
1/ 2
C xdx
0
(1 x)dx
1/ 2
1
x
x
C x
2 0
2 1 / 2
1 1 1 C
1
C 1
2 2 8 4
8
1/ 2
C4
1/ 2
1
P( X ) f ( x)dx
2
1/ 2
4 xdx 2
1
1
1 1
P( X ) f ( x)dx 1 P( X ) 1
2 1/ 2
2
2 2
3/ 4
1/ 2
3/ 4
1
3
3
P( X ) f ( x)dx 4 xdx 4(1 x)dx
4
4 1/ 4
4
1/ 4
1/ 2
5.2.2 Mdia (ou valor esperado) e varincia de uma varivel aleatria contnua
A mdia e a varincia de uma v.a. contnua so definidas de modo similar a uma v.a. discreta. A integrao
substitui a soma nas definies.
Definio: Suponha que X seja uma v. a. contnua com uma funo densidade de probabilidade f(x).
E( X )
x f ( x)dx
2
A varincia de X, denotada por ou VAR(X), :
82
2 E X 2 E ( X ) 2
onde
E( X )
2
f ( x)dx
Exemplo 11: Suponha que f(x) = 0,125x para 0 < X < 4. Determine a mdia e a varincia de X.
E ( X ) xf ( x)dx 0,125x dx
0,125x 4 8
|0 3
3
0,125x 4 4
E ( X ) x f ( x)dx 0,125xdx
|0 8
0
4
8
VAR ( X ) E ( X ) E ( X ) 8 ( ) 0,89
3
Exerccios (Resolvidos em sala)
2 x 3 se 0 x 2
0, se x 0 ou x 2
1. Verificar se f ( x)
uma fdp.
1
(2 x 3) se 0 x 2
2. Verificar se f ( x) 10
0, se x 0 ou x 2
uma fdp.
83
3. Seja uma v.a. X a corrente em um fio delgado de cobre, medida em miliampres. Suponha que a faixa de
X seja [0;20] e considere que a funo densidade de probabilidade de X seja f ( x) 0,05 para 0 x 20
. Qual a probabilidade de que uma medida da corrente seja menor 10 miliampres?
4. Suponha que o tamanho de uma partcula de contaminao possa ser modelado como f ( x) 2 x 3 para
1 < X. Determine a mdia de X.
A funo de distribuio acumulada nos d uma maneira de descrever como as probabilidades so associadas
aos valores ou aos intervalos de valores de uma varivel aleatria.
a funo que acumula as probabilidades dos valores inferiores ou iguais a x.
Definio: A funo de distribuio acumulada de uma varivel aleatria X uma funo que a cada
nmero real x associa o valor:
F ( x) P[ X x] P[ X xi ]
xi x
F ( x) P[ X x] P( X x) f (t )dt
OBS:
84
i)
ii)
iii)
()
Exemplo 12: Suponha que uma varivel aleatria discreta X tenha a seguinte distribuio de probabilidade.
Temos, ento:
(1) = ( 1) = ( = 1) = 0,1
(2) = ( 2) = ( = 1) + ( = 2) = 0,3
(3) = ( 3) = ( = 1) + ( = 2) + ( = 3) = 0,1 + 0,2 + 0,4 = 0,7
(4) = ( 4) = ( 3) + ( = 4) = 0,7 + 0,2 = 0,9
(5) = ( 5) = ( 4) + ( = 5) = 0,9 + 0,1 = 1
Funo
Grfico
85
Exemplo 13: Suponha que o erro medido na temperatura de reao (C) em um experimento controlado em
laboratrio seja uma v.a. contnua cuja fdp dada por:
1
x se 1 x 2
f ( x) 3
0, caso contrrio
a) Determine a fda para a v.a.
0
, se x 1
x
1
x
FX ( x) t dt
, se 1 x 2
1 3
9
1
, se x 2
86
a) P(X 2)
b) P(X > - 2)
c) F(2) F(-1)
d) F(0)
e) Construir a funo de distribuio acumulada.
2 - Seja
a) VAR(2X)
Resp: 12
b) E(2X)
Resp: 40
c) E(2X +10)
Resp: 50
c) VAR(5X-10)
Resp: 75
d) VAR(2/5X - 4) Resp: 0,48
3. Uma confeitaria estabeleceu um registro de vendas (tabela abaixo) para certo tipo de bolo. Determine o
nmero esperado de bolos encomendados.
N de bolos/dia
0
1
2
3
4
5
6
7
8
9
87
Freq. Relativa
0,02
0,07
0,09
0,12
0,20
0,20
0,18
0,10
0,01
0,01
5. As probabilidades de que haja 1, 2, 3, 4, ou 5 pessoas em cada carro que v ao litoral num sbado so,
respectivamente: 0,05; 0,20; 0,40; 0,25 e 0,10. Qual o nmero mdio de pessoas por carro? Se chegam no
litoral 4000 carros por hora, qual o nmero esperado de pessoas, em 10 horas de contagem?
Resposta: 3,14 pessoas; 126.000 pessoas.
6. A funo de probabilidade da varivel aleatria X : P(X) = 1/5, para X = 1, 2, 3, 4, 5. Calcular E(X) e E(X),
e usando esses resultados, calcular:
a)
b)
E(X+3)
VAR(3X 2)
Resposta: a) 38
b) 18
a)
b)
c)
b) Quantos televisores deve ter a loja em stock, por ms, para que a probabilidade de satisfazer todas
as encomendas seja superior a 0,95? (Resp. 3 ou mais)
10. Seja X a durao da vida (em horas) de um certo componente eletrnico. Admitindo que X seja contnua
e com fdp:
() = { 3 ,
1500 2500;
0,
a) Determine a constante k.
Resp: k=7031250
b) Calcular (2200 2500). Resp: 0,1639
c) Calcule E(X).
Resp: 1875
89
Existem muitos problemas parecidos, ento poucos modelos solucionam uma grande quantidade de
problemas. Ex.: a jogada de moedas para o ar e n de itens defeituosos numa remessa de peas recaem sobre
o mesmo modelo de probabilidade. A constatao desse fato levou o desenvolvimento de tcnicas
padronizadas para a resoluo de muitos problemas diferentes.
Cada distribuio de probabilidade tem um conjunto de hipteses que devem ser verificadas para se utilizar
o modelo.
O termo binomial designa situaes em que os resultados de uma v.a. podem ser agrupados em duas
categorias (os dados so, pois, nominais). Exemplo: em processos industriais as peas falham ou no falham;
em medicina o paciente sobrevive ou morre; em marketing o consumidor reconhece um produto ou no.
O experimento deve ser repetido, sob as mesmas condies um n finito de vezes (n);
As repeties devem ocorrer de forma independente;
Cada repetio possui dois resultados possveis: sucesso (p) e fracasso (q = 1- p);
As probabilidades devem permanecer constantes para cada repetio.
90
Exemplo 01: Imagine uma mquina de confeccionar parafusos. Dos parafusos fabricados por essa mquina,
2% saem com algum tipo de defeito (esta uma caracterstica da mquina). Suponha que a produo dessa
mquina lanada ininterruptamente em uma esteira, e que dessa esteira so retirados 10 parafusos.
Para variveis com essa distribuio resolvemos problemas do tipo: determinar a probabilidade de
se obter k sucessos em n tentativas.
( = ) = . . (1 ) ;
!
! ( )!
n p (1 p )
Exemplo 02: Acredita-se que 20% dos moradores das proximidades de uma grande indstria siderrgica tem
alergia aos poluentes lanados ao ar. Admitindo que este percentual de alrgicos real (correto), calcule a
probabilidade de que pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso.
Resoluo:
Seja X o nmero de moradores que tm alergia.
p: probabilidade de um indivduo, selecionado ao acaso, ter alergia;
p=0,2.
P( X x) C xn p x (1 p) n x
, x 0, 1, ..., n
91
ou seja, a varivel aleatria X tem distribuio binomial com parmetros n = 13 e p = 0,20, com funo de
probabilidade dada por:
x
13 x
P( X x) C 13
x p q
Assim, a probabilidade de que pelo menos 4 moradores tenham alergia dada por:
Clculos:
Exemplo 03: Uma companhia perfuradora de poos de petrleo faz 5 perfuraes. Sabendo-se que cada
tentativa tem probabilidade 0,3 de encontrar petrleo, qual a probabilidade de se encontrar petrleo em
dois poos?
Y= N de poos com petrleo.
p= 0,3
( = ) = (, ) (, ) = , = , %
Ou seja, em 30,9% das vezes que 5 perfuraes forem feitas, ser encontrado petrleo em 2 poos.
92
1. Considere que uma auditoria em uma empresa de vendas a crdito levantou que 30% dos clientes estavam
com suas prestaes atrasadas. Determine a probabilidade de que, em 10 clientes escolhidos
aleatoriamente, 4 estejam com suas prestaes em atraso. E calcule a mdia e o desvio padro.
2. Cada amostra de ar tem 10% de chance de conter uma certa molcula rara. Considere que as amostras
sejam independentes com relao presena da molcula rara. Encontre a probabilidade de que nas
prximas 18 amostras, pelo menos 2 contenham a molcula rara.
3. A chance de que um bit transmitido atravs de um canal digital de transmisso seja recebido com erro
de 0,1. Suponha tambm que as tentativas de transmisso sejam independentes. Faa X = nmero de bits
com erro nos prximos quatro bits transmitidos. Determine P(X = 2).
frequentemente usada para estimar o nmero de ocorrncias sobre um intervalo de tempo ou espao.
Exemplo: Nmero de defeitos por centmetro quadrado, clientes atendidos por hora, chegada de navios
por dia no porto de Vitria.
Ex.01 - Suponha que em uma agncia bancria entrem, em mdia, 60 clientes por hora. Qual a probabilidade
de, em 10 minutos, entrarem 4 clientes?
Observe que o sucesso entrada do cliente. A probabilidade desejada a de 4 sucessos, isto , 4 entradas
de clientes, dentro de um perodo de tempo de 10 minutos.
Ex.02 - Suponha que uma vistoria em uma estrada constatou que, em mdia, existem 10 imperfeies no seu
leito a cada 1000 metros. Qual a probabilidade de, em 100 metros, serem encontradas 2 imperfeies?
Nesse caso, o sucesso encontrar uma imperfeio no leito da estrada, e o perodo ao longo do qual se
deseja calcular a probabilidade, o espao de 100 metros.
93
Ento:
P( X x)
x e
x!
Onde: t
e = 2,71828
No exemplo n 1:
= 60 clientes/hora = 60 clientes/60 minutos
t = 10 minutos.
Ento:
P ( X 4)
60
10 10
60
10 4 e 10
0,0189
4!
No exemplo n 2:
= 10 imperfeies/1000 metros
t = 100 metros.
Ento: =
P( X 2)
10
100 1
1000
12 e 1
0,1839
2!
94
Exemplo 03: Em um processo produtivo txtil, o nmero mdio de defeitos por m2 de tecido 0,4, variando
segundo uma distribuio de Poisson. Qual a probabilidade de que, em 2 m2 de tecido fabricado:
a)
b)
No haja defeito?
Haja no mximo 1 defeito?
Resoluo:
X = N de defeitos por m
= 0,4 defeitos/ 1 m
t=2
= t = 0,4 * 2
X ~ Poi(0,8)
.
( = ) =
!
a) ( = 0) =
0,80 . 0,8
0!
0,8 . 0,8
( = ) =
!
= 0,449
b) ( 1) = ( = 0) + ( = 1) =
0,80 . 0,8
0!
0,81 . 0,8
1!
1. Estima-se que, em todo mundo, os tubares matem dez pessoas por ano. Determine a probabilidade:
a) De que trs pessoas sejam mortas por tubares este ano.
b) De que duas ou trs pessoas sejam mortas por tubares este ano.
95
3. O nmero de chamadas telefnicas que chegam a uma central freqentemente modelado como uma
varivel aleatria de Poisson. Considere que, em mdia, h 10 chamadas por hora.
a) Qual a probabilidade de que haja exatamente 5 chamadas em uma hora?
b) Qual a probabilidade de que haja 3 ou menos chamadas em uma hora?
c) Qual a probabilidade de que haja exatamente 15 chamadas em duas hora?
d) Qual a probabilidade de que haja exatamente 5 chamadas em 30 minutos?
Considere uma populao com N objetos nos quais M so classificados como do tipo A e N-M so
classificados como do tipo B. Por exemplo, em um lote de 50 (N) peas temos 10 (n) peas defeituosas e 40 (NM) peas conformes. Tomamos uma amostra ao acaso, sem reposio e no ordenada de n objetos. Seja X a
varivel aleatria que conta o nmero de objetos classificados como do tipo A na amostra. Ento a
distribuio de probabilidade de X dada por:
Diremos que uma varivel aleatria X tem distribuio hipergeomtrica de parmetros M, N e n se sua funo
de probabilidade for dada da maneira acima. Denotamos X~Hiper(M, N, n).
Notas:
1. A experincia aleatria referida pode ser vista como uma sequencia de n realizaes dependentes
de uma prova de bernoulli mas com probabilidade de sucesso constante igual a p=M/N;
2. [] = e [] = 1 ;
3. Se N + com p =
M
N
( ). (
)
() ( )
( )
Exemplo 01: De um baralho com 52 cartas, retiram-se 8 cartas ao acaso, sem reposio. Qual a probabilidade
de que 4 sejam figuras?
Resoluo:
96
( ). (
)
( = ) =
( )
N = 52
M = 12
n=8
(
( = ) =
). ( )
= ,
( )
Exemplo 02: Uma firma compra lmpadas por centenas. Examina sempre uma amostra de 15 lmpadas
para verificar se esto boas. Se uma centena inclui 12 lmpadas queimadas, qual a probabilidade de se
escolher uma amostra com pelo menos uma lmpada queimada?
Resoluo:
X: nmero de lmpadas queimadas na amostra.
X~ Hiper(12, 100, 15).
(
M = 12
( = ) =
). (
)
(
)
n = 15
(
( 1) = 1 ( < 1) = 1 ( = 0) = 1
12
88
). ( )
0
15 = 0,8747
100
(
)
15
1 . Suponha que 4 moedas comemorativas foram colocadas por engano em um cofrinho no qual j haviam
algumas moedas comuns, o qual ficou contendo um total de 14 moedas. Suponha que, devido a dificuldade
de tirar as moedas do cofrinho sem quebr-lo, vamos retirar ao acaso um total de 4 moedas, qual a
probabilidade de retirarmos no mnimo 2 moeda comemorativa?
2 . Uma empresa fabrica um tipo de tomada que so embalados em lote de 25 unidades. Para aceitar o lote
enviado por essa fbrica, o controle de qualidade da empresa tomou o seguinte procedimento: sorteia-se
97
um lote e desse lote selecionam-se 8 tomadas para teste, sem reposio. Se for constatado, no mximo, duas
tomadas defeituosas, aceita-se o lote fornecido pela fbrica. Se o lote sorteada tiver 6 peas defeituosas,
qual a probabilidade de se aceitar o lote?
Seja X uma v.a.c., dizemos que X tem distribuio normal se possuir a seguinte f.d.p.:
() =
Notao: X~N(;)
()
Representao grfica:
98
A v.a. de distr. normal pode assumir todo e qualquer valor real, definida de a .
A Distribuio Normal uma distribuio simtrica. Assim sendo, a mdia, a mediana e a moda
assumem o mesmo valor.
O ponto mais elevado da curva corresponde ao seu valor mdio.
Cada distribuio normal fica especificada por sua mdia e seu desvio padro.
A rea total sob a curva 1 e a probabilidade de ocorrer um valor maior que a mdia igual a
probabilidade de ocorrer um valor menor do que a mdia.
tambm conhecida como distribuio de Gauss, Laplace ou Laplace-Gauss
um grfico em forma de sino. O seu posicionamento em relao ao eixo das ordenadas e seu achatamento
vai ser determinado pelos parmetros e , respectivamente. Fixando a mdia, verifica-se que o
achatamento est diretamente ligado ao valor do desvio padro.
Acima temos, curvas normais com mesma mdia , mas com varincias diferentes (s22 > s12 ).
Clculo de probabilidades:
99
Quando temos em mos uma varivel aleatria com distribuio normal, nosso principal interesse obter a
probabilidade de essa varivel aleatria assumir um valor em um determinado intervalo.
O clculo de reas sob a curva normal consideravelmente complexo. Por isso, conveniente trabalhar com
valores padronizados.
A Tabela da Distribuio Normal Padro (vide a tabela Distribuio normal padro) fornece a
probabilidade do valor da varivel aleatria cair dentro de um intervalo entre a mdia e o
determinado valor de Z.
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
Probabilidade para
Z entre 0 e 1,14
.
.
.
1,0
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2
.
.
.
2,0
2,1
.
.
.
Leia, no cruzamento
a Probabilidade
Exemplo 01: O tempo gasto no exame vestibular de uma universidade tem distribuio Normal, com mdia
120 min e desvio padro 15 min.
a) Sorteando um aluno ao acaso, qual a probabilidade que ele termine o exame entre 120 e 140 minutos?
Z=
X X 120
=
15
( < < 140) = (
= ( , ) = ,
b) Sorteando um aluno ao acaso, qual a probabilidade que ele termine o exame antes de 100 minutos?
Z=
X X 120
=
15
101
( < ) = (
) = ( , )
= , ( , )
= , , = ,
c) Qual o intervalo central de tempo, tal que 90% dos estudantes gastam para completar o exame?
Z=
X X 120
=
15
z=?
1 120
= 1,64
15
2 120
= 1,64
15
, (, < < , ) = ,
X 10
8
12 10
6 10
P(6 X 12) P
Z
8
8
P(0,5 Z 0,25)
= P(0 < Z< 0,25) + P(0 < Z < 0,5)
= 0,0987+ 0,19146 = 0,2901
1. Um estudo realizado sobre o valor das compras feitas em uma determinada loja de um dos shoppings da
cidade nos finais de semana revelou que essa varivel aleatria normalmente distribuda com uma mdia
de $ 98,00 e um desvio padro de $ 20,00. Qual a probabilidade de um cliente fazer uma compra cujo valor
seja:
a) Entre $ 98,00 e $ 110,00?
b) Maior do que $ 109,00?
2. Suponha que medidas da corrente em um pedao de fio sigam a distribuio normal, com uma mdia de
10 miliampres e uma varincia de 4 (miliampres)2. Qual a probabilidade da medida exceder 13
miliampres?
3. Calcule:
a)
b)
c)
d)
P(Z <1,82)
P(Z -2,03)
P(-2,55 Z 1,20)
P(Z 1,93)
4. Se X ~ N(100,25), calcule:
103
aplicada para o clculo da probabilidade de intervalos de tempo ou de espao fsico entre dois
eventos governados por um processo de Poisson.
Uma varivel aleatria contnua X tem distribuio exponencial com parmetro , se sua funo de densidade
se probabilidade (fdp) dado por:
1 x
f ( x) e , x 0
0,
c.c
Notao: X~Exp().
1 e , x 0
F ( x)
0
c.c
P( x x 0 ) 1 e
P( x x 0 ) e
x0
, para valores de x xo
x0
, para valores de x xo
104
E( X )
Var ( X )
Exemplo 01: Um banco est implementando um servio de atendimento a clientes especiais aps o trmino
do expediente. O gerente da agncia fez um estudo a respeito da demanda por esses servios e constatou
que, em mdia, a agncia era procurada por cerca de seis clientes por hora.
a) Qual a probabilidade de um cliente chegar pelo menos 10 minutos aps o anterior ter chegado?
Neste caso, o perodo de tempo entre os dois eventos consecutivos de 10 minutos: 6 clientes em 1 hora
ou 10 minutos entre dois clientes consecutivos.
A probabilidade que se deseja calcular a de P(t 10 minutos)
Aplicando-se a frmula apropriada, teremos:
P( x x0 ) e
P(t 10) e
x0
10
10
0,3679
P(t 10 )
10
b) Qual a probabilidade um cliente chegar, no mximo, 8 minutos aps a chegada do cliente anterior?
A probabilidade que se deseja calcular, neste caso, P (t 8 minutos). Tem-se ento que:
P( x x0 ) 1 e
P(t 8) 1 e
8
10
x0
0,5507
105
P(t 8 )
c) Qual a probabilidade do perodo de tempo entre duas chegadas consecutivas de cliente ficar entre 5
minutos e 9 minutos?
Nesse caso, a probabilidade que se deseja p ( 5 t .
p (5 t 9) p (t 9) p (t 5)
p(5 t 9) (1 e
9
10
) (1 e
5
10
) 0,20
P(5 t 9)
Exemplo 02: Certo tipo de fusvel tem durao de vida que segue uma distribuio exponencial com tempo
mdio de vida de 100 horas. Cada pea tem um custo de 10,0 unidades monetrias (u.m) e se durar menos
de 200 horas, existe um custo adicional de 8,0 u.m.
a) Qual a probabilidade de uma durar mais de 150 horas?
b) Determinar o custo esperado.
Soluo:
Se X: tempo de durao de uma pea, do enunciado tem-se que: E(X)=100 horas
X ~ Exp(100). Ou seja,
106
1 e 100 , x 0
F ( x)
c.c
0
a) P( X 150) 1 P( X 150) 1 (1 e
150
100
) e 1,5 0,223
se x 200
10,
C
10 8, se x 200
2. Uma fbrica de tubos de TV determinou que a vida mdia dos tubos de sua fabricao de 800 horas
de uso e segue uma distribuio exponencial. Qual a probabilidade de que a fbrica tenha que
substituir um tubo gratuitamente, se oferecer uma garantia de 300 horas de uso?
107
11. A varivel aleatria Y tem densidade Poisson com parmetro =2. Obtenha:
a) P(Y<2) Resp: 0,406
b) P(2Y<4) Resp: 0,4511
c) P(Y>0)
Resp: 0,8647
12. Considere X uma varivel aleatria Normal com mdia 11,15 e desvio-padro 2,238. Qual a
probabilidade de X ser menor que 8,7? Resp: 0,1379
13. A durao de um certo tipo de pneu, em quilmetros rodados, uma varivel normal com durao
mdia 60000Km e desvio padro 10000Km.
a) Qual a probabilidade de um pneu aleatoriamente escolhido durar mais de 75000Km? Resp: 0,0666
b) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 50000km e 70000km? Resp:
0,6826
c) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 63000km e 70000km?
14. Um teste de inteligncia foi aplicado a um grupo de 50 adolescentes do 2 grau. Supondo que obtevese uma distribuio normal com mdia 70 e desvio padro de 6, pede-se:
a)
b)
15. Uma empresa observa que na fabricao de determinado tipo de vela h pequena variao nas
dimenses e no peso entre elas. O dimetro mdio das velas segue distribuio normal com mdia de 4,45
cm e desvio padro de 0,35 cm. Para saber em quais candelabros as velas podero ser colocadas,
interessante conhecer a probabilidade de as velas terem dimetros:
a. maior que 4,75 cm;
Resp:0,1949
b. menor que 4,25 cm;
Resp: 0,2843
c. entre 4,25 e 4,75 cm.
Resp: 0,5208
16. Uma enchedora automtica de refrigerantes est regulada para que o volume mdio de lquido em
cada garrafa seja de 1000 cm3 e desvio padro de 10 cm3. Admita que o volume siga uma distribuio
normal.
a. Qual a porcentagem de garrafas em que o volume de lquido menor que 990 cm3? Resp: 0,159
b. Qual a porcentagem de garrafas em que o volume de lquido no se desvia da mdia em mais do que
dois desvios padres? Resp: 0,9544
17. Os salrios dos funcionrios de um hotel fazenda tm distribuio normal em torno da mdia de R$
1500,00, com desvio padro de R$ 200,00. Qual a probabilidade de um funcionrio:
a. ganhar entre R$ 1400,00 e R$ 1600,00 ?
Resp: 0,383
b. ganhar acima de R$ 1500,00 ?
Resp: 0,5
c. ganhar acima de R$ 1400,00 ?
Resp: 0,6915
d. ganhar abaixo de R$ 1400,00 ?
Resp: 0,3085
e. ganhar acima de R$ 1650,00 ?
Resp: 0,2266
109
18. A durao de certos tipos de amortecedores, em km rodados normalmente distribuda, possui durao
mdia de 5000 km e desvio-padro de 1000 km.
a) Qual a probabilidade de um amortecedor escolhido ao acaso durar entre 4500 e 6350 km?R: 0,60295
b) Se o fabricante desejasse fixar uma garantia de quilometragem, de tal forma que se a durao do
amortecedor fosse inferior a garantia, o amortecedor seria trocado, de quanto deveria ser esta garantia
para que somente 1% dos amortecedores fossem trocados? R: 2670 km
19. A altura dos alunos de uma escola (em Cm) tem distribuio normal com mdia 169cm e varincia de
81cm. Pergunta-se:
a) Qual a proporo de alunos com altura que diferem da mdia em mais de um desvio padro? (R.
0,3174
b) Se a escola tiver 5000 alunos, quantos esperamos com alturas abaixo de 160 cm ou acima de 178 cm?
(Resp. 1587)
c) Qual a maior altura entre os 1,25%, menores? ( Resp. 148,84)
d) Qual a probabilidade (proporo) de um aluno escolhido aleatoriamente ter altura entre 151 cm e 160
cm. ( Resp. 0,1359)
20. Suponha que as notas de uma prova sejam normalmente distribudas com mdia 73 e desvio padro 15.
Quinze por cento dos alunos mais adiantados recebem a nota A e 12% dos mais atrasados recebem nota F.
Encontrar o mnimo para receber A e o mnimo para passar, no receber F. (Resp. 55,3 e 88,6)
21. O salrio semanal dos operrios industriais distribudo normalmente em torno de uma mdia de R$
180,00 com desvio padro de R$ 25,00. Pede-se:
a) Encontrar a probabilidade de um operrio ter salrio semanal situado entre R$ 150,00 e R$ 178,00.
(Resp. 0,353)
b) Dentro de que desvio, de ambos os lados da mdia, cairo 96% dos salrios? (R. 2,06 desvios)
(X1= 128,75 e x2=231,25)
22. Em uma distribuio normal, 28% dos elementos so superiores a 34 e 12% inferiores a 19. Encontrar a
mdia e a varincia. (Resp. =29,03; =73,4)
23. Seja X uma varivel aleatria e tenha uma distribuio exponencial com parmetro . Calcule a
probabilidade de que X ultrapasse seu valor esperado.
Resp: 0,3679
24. A durao de uma lmpada uma varivel aleatria T, com fdp dada por:
1000 ,
() = { 1000
0,
Calcular a probabilidade de uma lmpada:
a) Se queimar antes de 1000 horas; Resp: 0,632
b) Durar entre 800 e 1200 horas. Resp: 0,1481
0 ( );
> 0.
25. A vida mdia de um satlite 4 anos, seguindo o modelo exponencial. Seja T a varivel definida como o
tempo de vida do satlite. Calcule:
a) P(T > 4) Resp: 0,3678
b) P(5 T 6) Resp: 0,0633
110
111
Para o estudo do comportamento conjunto de duas variveis podem ser utilizados: Diagrama de
Disperso e o Coeficiente de correlao de Pearson.
112
Quando a correlao em estudo tem como imagem uma reta descendente, dizemos existir uma correlao
linear negativa.
O Diagrama de disperso indica que h uma tendncia inversamente proporcional. Ou seja, quando uma das
variveis cresce, a outra, em mdia, decresce.
Quando a correlao em estudo tem como imagem uma reta ascendente, dizemos existir uma correlao
linear positiva.
O Diagrama de disperso indica que h uma tendncia diretamente proporcional. Ou seja, quando uma das
variveis cresce, a outra, em mdia, tambm cresce.
Ausncia de Correlao
Se os pontos estiverem dispersos, sem definio de direo, dizemos que a correlao muito baixa, ou
mesmo nula, as variveis nesse caso so ditas no correlacionadas.
113
O diagrama de disperso indica que no h tendncia, o que tambm ser indicado por uma medida
estatstica.
Correlao No-Linear
Quando a correlao em estudo tem forma de curva, dizemos existir uma correlao no-linear.
EXEMPLO 1: Sejam os dados da tabela abaixo que apresentam as notas obtidas por alunos nas disciplinas de
Qumica e Biologia.
razovel considerarmos que as notas em biologia dependam das notas em qumica, ou seja:
Notas em Biologia: Varivel Dependente.
Notas em Qumica: Varivel independente.
10
10
Diagrama de Disperso
114
( ) ( )
[ 2 ( )2 ][ 2 ( )2 ]
Propriedades:
1. Pode ser positivo ou negativo, o que depender do sinal do termo no numerador da equao, que
mede a covariao amostral das duas variveis;
2. Se situa nos limites de -1 e +1, isto , -1 r 1.
3. Sua natureza simtrica, isto , o coeficiente de correlao entre X e Y (rxy) o mesmo que Y e X (ryx).
4. Se X e Y so estatisticamente independentes, o coeficiente de correlao entre elas zero, mas se r
= 0, isso no significa que sejam independentes.
5. uma medida de associao linear ou de dependncia linear, no significativa para descrever
relaes no lineares.
Classificao para o coeficiente de correlao:
Padres de Correlao
115
EXEMPLO 2: Calcular o grau de associao entre as notas de biologia e qumica do exemplo 01.
Logo teremos:
=
(. . ) ( ). ( )
. ( 2 ) ( )2 . . ( 2 ) ( )2
116
= ,
Resultado que indica uma forte correlao linear positiva entre as variveis. Quanto maior a nota em
qumica maior a nota em biologia.
EXEMPLO 3: Na tabela abaixo temos o salrio-hora mdio(Y) segundo nvel de escolaridade (X).
Anos de estudo Salrio - hora
(X)
mdio (Y)
XY
4,46
36
19,89
26,76
5,77
49
33,29
40,39
5,98
64
35,76
47,84
7,33
81
53,73
65,97
10
7,32
100
53,58
73,20
11
6,58
121
43,30
72,38
12
7,82
144
61,15
93,84
13
7,84
169
61,47
101,92
14
11,02
196
121,44
154,28
15
10,67
225
113,85
160,05
16
10,84
256
117,51
173,44
17
13,62
289
185,50
231,54
18
13,53
324
183,06
243,54
156
112,78
2054
1083,53 1485,15
X = 156
Y = 112,78
117
2 = 2054
2 = 1083,53
= 1485,15
( ) ( )
[ 2 ( )2 ][ 2 ( )2 ]
1713,27
2366 1366,56
= 0,9528
= 0,9528
O coeficiente de correlao de 0,95 est bem prximo de 1, ento podemos concluir que o grau de
escolaridade e o salrio-hora mdio so fortemente correlacionados, apresentando uma relao positiva.
Podemos verificar essa relao atravs do diagrama de disperso.
1 - Os dados abaixo so referentes aos salrios e tempo de servio dos 10 operrios de uma firma, construa
a tabela de distribuio conjunta, verifique graficamente se existe relao entre salrio e tempo de servio,
quantifique essa relao usando a medida estatstica apropriada.
118
Y = salrio em $
X = tempo de servio em anos
Na regresso linear simples ser deduzida e analisada a reta que melhor explica essa relao, tendo
previamente definido a varivel independente e a varivel dependente. Estuda-se apenas duas variveis e o
modelo determinado um polinmio de primeiro grau.
119
OBS: Uma anlise de regresso torna-se mais interessante quando as variveis envolvidas apresentam
associao de moderada a forte.
7.2.1 - Modelo do Ajuste de uma Reta de Regresso
O ajuste de uma reta de regresso um modelo linear que relaciona a varivel dependente Y e a
varivel independente X por meio da equao de reta do tipo:
= +
A equao = + deve ser obtida de forma a minimizar os erros de estimao, e, como pode
ser visto no ponto (x1; y1). O erro de estimao e a distncia entre o ponto e a reta . Para tanto empregase o mtodo dos mnimos quadrados como veremos a seguir.
Uma vez que tenha sido formulada a equao de regresso, pode-se utiliz-la para estimar o valor da varivel
dependente, dado o valor da varivel independente. Contudo, tal estimao deve ser feita apenas dentro do
intervalo de variao dos valores da varivel independente originalmente amostrados, j que no existe base
estatstica para supor que a linha de regresso apropriada fora destes limites.
120
Essa equao deve ser obtida de forma que o erro de estimao seja mnimo. Pelo mtodo dos mnimos
quadrados, estes erros so mnimos para:
( ) ( )
[ ( ) ]
Neste caso, o parmetro a indica a altura em que a reta corta o eixo Y e o parmetro b indica a inclinao da
reta, isto , a mudana que Y sofre para cada unidade de variao de X.
EXEMPLO 4: O objetivo do diretor de vendas de uma rede de varejo analisar a relao entre o investimento
realizado em propaganda e as vendas das lojas da rede, para realizar projees de vendas de futuros
investimentos em propaganda. A tabela seguinte registra uma amostra representativa extrada dos registros
histricos das lojas de tamanho equivalente, com os valores de Propaganda e Vendas em milhes.
Analisar a possibilidade de definir um modelo que represente a relao entre as duas variveis ou amostras.
SOLUO
Para analisar a relao entre as duas variveis foi construdo o grfico de disperso das vendas anuais
em funo do investimento anual em propaganda. Nesse grfico pode-se ver que, nos ltimos dez
anos, o aumento de investimento em propaganda gerou aumento das vendas, e vice-versa.
121
( ) ( )
[ ( ) ]
122
y 117,07 9,74 x
Concluso: A cada 1 milho investido em propaganda o valor mdio de vendas aumenta em 9,74 milhes.
1 - Os dados abaixo so referentes aos salrios e tempo de servio dos 10 operrios de uma firma, verificouse que existe relao entre salrio e tempo de servio, obtenha a equao da reta de regresso que estima
o salrio segundo tempo de servio.
Y = salrio em $
X = tempo de servio em anos
123
7 lista de exerccios
Questo 1 - Abaixo voc encontra uma lista de situaes de pesquisa. Para cada uma delas indique se o
apropriado proceder uma anlise de regresso ou uma de correlao. Justifique sua indicao.
a) O rendimento escolar na Universidade favorece o xito profissional?
b) O tempo de treinamento influi no desempenho profissional?
c) O objetivo estimar o tempo necessrio a consecuo de certa tarefa usando, para tanto, o tempo
de treinamento do executor.
d) O objetivo utilizar o preo da carne de gado para estimar a quantidade de procura desse bem.
e) A quantidade procurada de carne de gado depende do preo da carne de porco?
Questo 2 - A Revista Nacional do Consumidor apresenta as seguintes correlaes:
(i) A correlao entre peso de carro e a confiabilidade -0,30;
(ii) A correlao entre peso do carro e dos custos anuais de manuteno 0,20.
Qual a interpretao do coeficiente de correlao em cada um dos casos, ou seja, como pode-se descrever a
relao entre as variveis?
Questo 3 - Certa empresa, estudando a variao da demanda de seu produto em relao variao de
preo de venda, obteve a tabela:
Preo
(X)
Demanda
(Y)
38
350
42
325
50
297
56
270
59
256
63
246
70
238
80
223
95
215
110
208
Questo 4 - Uma cadeia de supermercados financiou um estudo dos gastos realizados por famlia de quatro
pessoas com renda mensal lquida entre oito e vinte salrios mnimos. A pesquisa levou a equao de
regresso Y = -1,2 + 0,4 X, onde Y representa a despesa mensal estimada ( atravs do modelo) e X a renda
mensal lquida expressa em nmero de salrios mnimos.
a) Estime a despesa mensal de uma famlia com renda lquida mensal de 15 salrios mnimos.
b) A equao em questo serve para estimar a despesa mensal de uma famlia de 5 pessoas com renda
lquida de 12 salrios mnimos? Justifique.
Questo 5 - Para estudar a poluio de um rio, um cientista mediu a concentrao de um determinado
composto orgnico (Y) e a precipitao pluviomtrica na semana anterior (X):
X
0,91
1,33
4,19
2,68
1,86
1,17
0,1
1,1
3,4
2,1
2,6
a) Existe alguma relao entre o nvel de poluio e a precipitao pluviomtrica? Responda analisando
o grfico de disperso.
b) Calcule e interprete o coeficiente de correlao linear de Pearson.
c) Determine a equao de regresso linear.
Questo 6 - Para cada caso abaixo, estime a correspondente equao de reta de regresso:
a)
b)
GABARITO
Questo 1)
a) Correlao, pois o objetivo da pesquisa observar se o xito profissional depende do rendimento escolar.
b) Correlao, pois o objetivo da pesquisa observar se o desempenho profissional depende do tempo de
treinamento.
c) Anlise de regresso, pois o objetivo da pesquisa estimar o tempo de consecuo de certa tarefa utilizando
a informao do tempo de treinamento do executor.
d) Anlise de regresso, pois o objetivo da pesquisa estimar a quantidade de procura da carne do gado atravs
do preo da carne.
e) Correlao, pois o objetivo da pesquisa verificar se existe relao de dependncia entre o preo da carne de
porco e a procura de carne de boi.
Questo 2)
125
(i)
Existe correlao negativa fraca entre as variveis, ou seja, quanto maior o peso do carro, menor ser
sua confiabilidade.
Existe correlao positiva fraca entre as variveis, ou seja, quanto maior o peso do carro, maior ser os
custos anuais de manuteno.
(ii)
Questo 3)
a) Fazer o grfico
b) r = - 0,90 ( Existe relao inversamente proporcional entre preo e demanda do produto, a medida
que o preo aumenta a demanda diminui)
= , ,
c)
A cada aumento de uma unidade no preo, a demanda diminui em 1,87.
d) 265,23
Questo 4)
a) A despesa mensal de 4,8 salrios mnimos.
b) No, pois a equao de regresso dada referente a famlias de 4 pessoas, no podendo ser utilizada para
uma famlia de 5 pessoas.
Questo 5)
Existe relao positiva entre o nvel de poluio e a precipitao pluviomtrica
a)
4
3,5
3
2,5
2
1,5
1
0,5
0
0
X
b)
c) = +
A equao estimada : = 0,038 + 0,867
Questo 6)
a)
b)
206200200300
203600200
= 2
3631007,237
366207,2
= 4,99
300 2200
20
= 5
37 4,997,2
36
= 0,029
= +
= , + ,
126