Вы находитесь на странице: 1из 126

MATERIAL DE ESTUDO

PROBABILIDADE E ESTATSTICA

Professora: Flvia Ferreira Batista

VILA VELHA/ 2016

APRESENTAO DA DISCIPLINA

O Engenheiro e o Pensamento Estatstico

Um engenheiro algum que resolve problemas de interesse da sociedade pela aplicao eficiente
dos princpios cientficos. Devido a vrios aspectos da prtica da engenharia envolver o trabalho com os
dados, obviamente, algum conhecimento de estatsticas importante para qualquer engenheiro. Pois, o
campo da estatstica lida com a coleta, apresentao, anlise e utilizao dos dados para tomar decises,
resolver problemas, e produtos e processos de design.
As etapas utilizadas na engenharia para formular e resolver problemas so:
1. Desenvolver uma descrio clara e concisa do problema.
2. Identificar, os fatores importantes que afetam esse problema ou que possam desempenham um papel
na sua soluo.
3. Propor um modelo para o problema, utilizando conhecimentos cientficos ou de engenharia do
fenmeno a ser estudado. Estabelecer limitaes ou suposies do modelo.
4. Realizar experincias apropriadas e coletar dados para testar ou validar o modelo proposto.
5. Limitar o modelo com base nos dados observados.
6. manipular o modelo para auxiliar no desenvolvimento de uma soluo para o problema.
7. Realizar um experimento apropriado para confirmar que a soluo proposta para o problema ao
mesmo tempo eficaz e eficiente.
8. Tirar concluses ou fazer recomendaes com base na soluo do problema.
Consequentemente, os engenheiros devem saber como planejar de forma eficiente experimentos, coletar
dados, analisar e interpretar os dados e entender como os dados observados esto relacionados ao mtodo
que propuseram para o problema em estudo. Especificamente, tcnicas estatsticas podem ser uma
poderosa ajuda na concepo de novos produtos e sistemas, melhorando a projetos existentes e projetar,
desenvolver e melhorar os processos de produo.
Como exemplos da estatstica aplicada engenharia, podemos citar as seguintes aes:
Planejamento de novas estratgias de produo, vendas;
Controle de Processos e Manufatura, analisando distribuies e lotes para padres de qualidade nos
produtos.
Anlise de ensaios tanto destrutivos como no destrutivos, verificando a porcentagem de peas ou
probabilidade de vida de equipamentos ou peas.
Acompanhamento da estabilidade dos processos que analisada por cartas de acompanhamento
conhecidas como cartas de controle estatstico de processo.

UNIDADE I - INTRODUO

1.1 O QUE ESTATSTICA?


uma parte da Matemtica Aplicada que fornece mtodos para a coleta, organizao, descrio,
anlise e interpretao de dados e para utilizao dos mesmos na tomada de decises.
Os mtodos estatsticos so usados para nos ajudar a descrever e compreender a variabilidade. Por
variabilidade, queremos dizer que as observaes sucessivas de um sistema ou fenmeno no produzem
exatamente o mesmo resultado. Todos ns encontrar variabilidade na nossa vida quotidiana, e pensamento
estatstico, podem d-nos uma maneira til para incorporar essa variabilidade em nossos processos de
tomada de deciso.

1.2 DIVISO DA ESTATSTICA


No sentido de melhor esclarecer o significado da anlise e interpretao dos dados, deve-se
estabelecer uma distino entre: Estatstica Descritiva, teoria da probabilidade e Estatstica Inferencial.
Estatstica Descritiva: o ramo da estatstica que envolve a organizao, o resumo e a representao dos
dados, em geral, a simplificao de informaes.
Estatstica Inferencial: o ramo da estatstica que envolve a anlise e interpretao de dados amostrais. A
idia bsica efetuar determinada mensurao sobre uma parcela pequena, mas tpica, de determinada
populao e utilizar essa informao para chegar a concluses sobre a populao toda.
Ex: No preciso comer um bolo inteiro para saber se bom.

1.3 CONCEITOS IMPORTANTES


a) Populao: o conjunto formado por indivduos ou objetos que tm, pelo menos, uma varivel
(caracterstica) comum e observvel.
Ex: Populao dos alunos do primeiro perodo de uma faculdade;
Populao de peas fabricadas numa linha de produo.
b) Amostra: uma parcela representativa da populao que examinada com o propsito de
tirarmos concluses sobre ela.

As vantagens de amostrar so: Economiza mo-de-obra, tempo e dinheiro. Possibilita rapidez na obteno
dos resultados. Coleta de dados mais precisos. a nica opo quando o estudo resulta em destruio ou
contaminao dos elementos pesquisados.
c) Parmetro: a descrio numrica de uma caracterstica populacional. Exemplo: Mdia (),
varincia (), coeficiente de correlao ().
d) Estimador: tambm denominado Estatstica. a descrio numrica de uma caracterstica
amostral. Exemplo: Mdia amostral ( ), varincia amostral (s), coeficiente de correlao amostral
(r).
e) Estimativa: o valor numrico obtido para o estimador numa certa amostra.

1.4 VARIVEIS
Em Estatstica, varivel cada caracterstica que pode ser observada (ou medida) em cada elemento
da populao, sob as mesmas condies.
Dados estatsticos so observaes da realidade que nos cerca, podem ser fatos ou nmeros. A caracterstica
de interesse de estudo (varivel) pode ser dividida em duas categorias: qualitativas e quantitativas.

1.4.1 Variveis Qualitativas: so aqueles nos quais as caractersticas de um elemento so fornecidas por
um nome ou por um rtulo. So classificadas como:
Qualitativas Nominais: os dados que podem ser separados em categorias no mensurveis.
Ex.: Estado civil, sexo, cor da pele, grupo sanguneo, tipo de transporte.
Qualitativas Ordinais: envolvem dados que podem ser dispostos em alguma ordem. O nvel ordinal d
informao sobre comparaes relativas, mas os graus de diferena no servem para clculos.
Ex.: Grau de instruo (Nvel fundamental, Nvel mdio, Nvel superior).
Aparncia (Pssima, ruim, regular, boa e tima)
Classe social (Baixa, mdia baixa, mdia e alta)
1.4.2 - Variveis Quantitativas: so aquelas nos quais as caractersticas do elemento observado uma
quantidade. So classificadas como:
Quantitativas Discretas: Assumem valores inteiros. Os dados discretos so resultados da contagem de um
nmero de itens.
3

Ex.: idade em anos completos, n de carros que circulam em Vila Velha, n de pessoas atendidas
em um caixa de banco.
Quantitativas Contnuas: Assumem qualquer valor num intervalo de valores. So dados resultantes de
medies. Resultam em um nmero infinito de valores possveis.
Ex.: Temperatura da cidade de Vila Velha, Quantidade de gua gasta por dia na cidade de Vitria,
peso dos alunos da turma de estatstica.
RESUMO DOS TIPOS DE VARIVEIS

EXERCCIOS (resolvidos na aula)

1. Determine se o conjunto de dados uma populao ou uma amostra. Explique.


a)

A idade de cada governador de Estado.

b)

A velocidade de cada quinto carro que passa por um medidor de velocidade da polcia.

c)

Um levantamento de 500 estudantes e uma universidade que tenha 2000 estudantes.

d)

Os salrios anuais de cada advogado em um escritrio.

2. Determine se o valor numrico descreve um parmetro populacional ou uma estatstica amostral.


Explique.
a) Uma pesquisa com 1.000 adultos nos Estados Unidos descobriu que 12% preferem tirar frias nos
meses de inverno.
b) Uma pesquisa recente de uma amostra de MBAs reportou que o salrio mdio para um MBA mais
do que $82.000.
4

c) Os salrios iniciais para 667 MBAs graduados na Escola de Negcios da Universidade de Chicago
aumentaram 8,5% em comparao ao ano anterior.
d) Em janeiro de 2007, 44% dos governadores dos 50 estados norte-americanos eram republicanos.
e) Em uma checagem aleatria de uma amostra de logistas, o FDA(Food and Drug Administration)
descobriu que 34% das lojas no estavam estocando peixes na temperatura apropriada.

3. Classifique o tipo de varivel para os itens abaixo.

a) Grau de satisfao com um produto alimentcio;


b) Marca de antitrmico preferida;
c) Peso de gros exportados;
d) Grau de escolaridade;
e) Nmero de computadores em um laboratrio de informtica;
f) O nmero de ptalas de uma rosa;
g) A velocidade em km/h de um avio jato;

4. Para as situaes descritas a seguir, identifique a populao e a amostra correspondente.


a) Para avaliar a eficcia de uma campanha de vacinao no Estado do Espirito Santo, mes de recmnascidos durante o primeiro semestre de 2005, foram perguntadas a respeito da ltima vez que
vacinaram seus filhos;
Populao:
Amostra:

b) Para verificar a audincia de um programa de TV no Brasil, indivduos foram entrevistados com


relao ao canal em que estavam sintonizados;
Populao:
Amostra:
c) A fim de avaliar a inteno de voto para presidente do Brasil, pessoas foram entrevistadas em cidades
brasileiras.
Populao:
Amostra:
5

1.5 - FORMAS DE ORGANIZAO E APRESENTAO DE DADOS: TABELAS E GRFICOS

Os requisitos de uma boa apresentao de dados so:

Clareza (at os leigos compreendem o que est sendo apresentado)

Objetividade (atinge o fim que se quer atingir)

Conciso ( resumido, mas tambm preciso, exato)

Os dados podem ser apresentao das seguintes formas: Brutos, Rol, Tabelas e grficos.

DADOS BRUTOS: quando os dados originais (coletados) ainda no se encontram prontos para anlise, por
no estarem numericamente organizados.
Ex.: Foi coletada uma amostra de Idades dos alunos do ltimo perodo do curso de Engenharia Civil da UVV,
no ano de 2013.
24
25

23
27

23
24

27
28

26
25

23
25

28
23

26
26

24
24

23
25

ROL: uma lista em que os valores esto dispostos em uma determinada ordem, crescente ou decrescente.
Ex.: Utilizando os mesmos dados anteriores (idade dos alunos).
23
25

23
25

23
25

23
26

23
26

24
26

24
27

24
27

24
28

25
28

Como pode-se observar a simples organizao dos dados em um Rol, aumenta muito a capacidade
de informao destes. Ela torna possvel visualizar, de forma bem ampla, as variaes dos dados, uma vez
que os valores extremos so percebidos de imediato. Mas a anlise com este tipo de disposio comea a se
complicar quando o nmero de observaes tende a crescer.
Ao estudarmos grandes conjuntos de dados, conveniente organiz-los e resumi-los de forma clara
e objetiva.
Os dados qualitativos ou quantitativos discretos podem ser apresentados ou organizados das seguintes
maneiras:

Tabela de Frequncias
Grfico de Barras/Colunas
Grfico de Setores

Os dados quantitativos contnuos ou amostra grande de dados discretos podem ser apresentados ou
organizados das seguintes maneiras:

Tabela de Frequncias em classes (agrupada)


Histogramas
6

Polgono de frequncias
Curvas de frequncias e outros

1.5.1 - Tabela de Frequncias (Distribuio de frequncias)


So representaes nas quais os valores se apresentam em correspondncia com suas repeties, evitandose, assim, que eles apaream mais de uma vez na tabela, como ocorre com o rol.
Este tipo de tabela no aconselhvel quando estamos trabalhando com amostragens grandes, pois pode
ficar muito extensa, dificultando, alm de sua elaborao, as anlises e concluses dos dados pesquisados.
Contudo, neste tipo de tabela no h perda de informao.
Uma tabela de frequncias pode representar e caracterizar um dos seguintes tipos de frequncias:

Frequncia absoluta
Frequncia relativa
Frequncia Percentual
Frequncia acumulada (absoluta, relativa e percentual)

Frequncia Simples Absoluta (fi ou fai): o nmero de repeties de um valor individual ou de uma classe
de valores da varivel.
Frequncia Relativa (fr ou fri): a relao entre a frequncia de uma classe e a frequncia total (soma das
frequncias de todas as classes).

f ri

fi

f
i 1

fi
N

f
i 1

ri

1,00

Frequncia Percentual (fr(%) ou pi): a frequncia relativa de uma classe multiplicada por 100.

Exemplo: Suponha que foi realizado uma pesquisa com os funcionrios da empresa X e verificado o grau de
satisfao em relao ao salrio.
Satisfeito
Satisfeito
Muito Satisfeito
Satisfeito

Muito Satisfeito
Satisfeito
Insatisfeito
Muito Satisfeito

Insatisfeito
Satisfeito
Insatisfeito
Satisfeito

Satisfeito
Satisfeito
Insatisfeito
Muito Satisfeito

Satisfeito
Satisfeito
Satisfeito
Satisfeito

A tabela de distribuio de frequncias ficar assim:


Grau de
satisfao
Insatisfeito
Satisfeito
Muito satisfeito
Total

Frequncia
absoluta
4
12
4
20

Frequncia
Percentual (%)
20,0
60,0
20,0
100,0

Frequncia Acumulada: Contabiliza as observaes at o valor considerado. Pode ser calculada apenas para
variveis numricas. Pode ser: frequncia acumulada (Fi), frequncia relativa acumulada (Fri), ou frequncia
acumulada percentual (Pi).
Exemplo: Tabela de distribuio de frequncias utilizando os dados de Idades dos alunos do ltimo perodo
do curso de Engenharia Civil.
23
25

23
25

23
25

23
26

23
26

24
26

24
27

24
27

24
28

25
28

No caso as frequncias acumuladas so as seguintes:

Idade
23
24
25
26
27
28
Total

Frequncia
absoluta
5
4
4
3
2
2
20

Clculo
5
5+4
9+4
13 + 3
16 + 2
18 + 2
-

Frequncia
acumulada
5
9
13
16
18
20
-

Frequncia relativa acumulada (Fri): Fornece a relao entre a frequncia acumulada e o n total de
observaes realizadas.
Idade

Frequncia
absoluta

Frequncia
acumulada

Frequncia
relativa

Clculo

23
24
25
26
27
28
Total

5
4
4
3
2
2
20

5
9
13
16
18
20
-

0,25
0,20
0,20
0,15
0,10
0,10
1,00

5/20
9/20
13/20
16/20
18/20
20/20
-

Frequncia
relativa
acumulada
0,25
0,45
0,65
0,80
0,90
1,00
-

1.5.2 Grfico de Colunas/Barras

No eixo horizontal deve ser colocada a varivel sob estudo


No eixo vertical a frequncia (absoluta, acumulada ou relativa)
traada, para cada valor (atributo) da varivel, uma barra com comprimento proporcional frequncia.
O eixo vertical e horizontal pode ser invertido, ou seja, a varivel pode ser colocada no eixo vertical e a
frequncia no eixo horizontal (grfico de barras).
8

14
12

Frequncia

10
8
6
4
2
0

Insatisfeito

Satisfeito

Muito satisfeito

Grau de satisfao

Figura 1 . Ttulo da figura

1.5.3

Grfico de Setores (Pizza)

Consta de um crculo dividido em setores, cada setor relacionado a um valor da varivel a


ser representada.
A abertura angular de cada setor proporcional frequncia observada para cada valor.

Exemplo:

20%

20%

60%

Insatisfeito
Satisfeito
Muito satisfeito

Figura 2. Ttulo da figura

1.5.4

Tabela de Frequncias para dados agrupados em classes

constituda da mesma forma que para os dados no agrupados, com a diferena de que agora os valores
da varivel a ser organizados por classes.
Ao agrupar-se os valores das variveis em classes, se ganha em simplicidade, mas se perde em detalhes
(informaes). Neste tipo de tabela se destaca o que h de essencial nos dados.
Normalmente sugere-se o uso de 5 a 15 classes com a mesma amplitude. Menos que cinco classes pode
ocultar detalhes importantes dos dados, e mais que quinze torna a apresentao demasiado detalhada.
9

Exemplo de dados agrupados em classes para os salrios dos 36 empregados da seo de oramento da
Companhia XX por faixa de salrios.
Classe de salrios
4,0 |-- 8,0
8,0 |-- 12,0
12,0 |-- 16,0
16,0 |-- 20,0
20,0 |-- 24,0
Total

Frequncia (fi)
10
12
8
5
1
36

Porcentagem (%)
27,78
33,33
22,22
13,89
2,78
100,00

Dada a sequncia: 1, 2, 3, 4, 5, 6. Podem-se representar intervalos das seguintes formas:

Intervalo aberto: 1 --- 6 => 2, 3, 4, 5

Intervalo fechado: 1|---|6 => 1, 2, 3, 4, 5, 6

Intervalo fechado esquerda: 1|--- 6 => 1, 2, 3, 4, 5

Intervalo fechado direita: 1 ---|6 => 2, 3, 4, 5, 6

Os principais estgios na construo de uma distribuio de frequncia para dados agrupados em classes
so:
1. Organizar os dados brutos em um rol de ordem crescente ou decrescente.
2. Determinar a amplitude total dos dados que a diferena entre o maior e menor dos dados.
=
3. Determinar quanto ao nmero de classes a usar (k).
=

= + , ()
4. Determinar a amplitude de cada classe (c).
=

Em que: c amplitude de classe; AT a amplitude total; k o nmero de classes.


OBS: Se necessrio o valor encontrado deve ser aproximado para cima com o mesmo nmero ou mais
casas decimais que os valores das variveis.
5. Estabelecer os intervalos das classes comeando com um inteiro logo abaixo do menor valor
observado ou com o menor valor observado e somando a amplitude das classes. Os intervalos de
classe devem ser escritos, de acordo com a Resoluo 866/66 do IBGE em termos de desta
quantidade at menos aquela, empregando, para isso, o smbolo |-- (incluso por limite inferior e
excluso do limite superior).

10

6. Relacionar os intervalos e fazer a contagem dos pontos por classe. A contagem total deve ser igual a
n.
7. Construir uma tabela de frequncia ou um grfico de frequncia.

Exemplo: Num determinado processo de fabricao foram feitas 50 observaes de uma caracterstica de
qualidade de um tipo de pea, resultando nas seguintes medidas de dimetro em milmetros.

1.

Determinar a amplitude total: = = =

2.

Determinar o nmero de classes: = = = ,

3.

Determinar a amplitude de cada classe:

9,14

OBS.: A amplitude da classe foi arredondada para cima, pois o nmero de classes j havia sido arredondado
para baixo.

Para se formar as classes tomam-se o menor valor do conjunto de dados, 60, e soma ele amplitude, 10,
obtendo assim o limite superior da classe (ls), 70, os outros limites so obtidos sempre somando-se a
amplitude, 10, at formar 7 classes.
A frequncia absoluta (observada) obtida contando-se a quantidade de elementos no intervalo, ou seja, de
60 a 70 (no incluindo esse extremo) existem 5 valores, e assim sucessivamente. As outras frequncias so
obtidas da mesma forma que para dados no agrupados em classes.

Dimetro (mm)

Frequncia
absoluta (fi)

Frequncia
relativa (fr)

Frequncia
absoluta
acumulada (Fi)

Frequncia
relativa
acumulada (Fr)

60 |--- 70
70 |--- 80
80 |--- 90
90 |--- 100
100 |--- 110
110 |--- 120
120 |--- 130

5
6
8
13
10
6
2
50

5/50 = 0,10
6/50 = 0,12
8/50 = 0,16
13/50 = 0,26
10/50 = 0,20
6/50 = 0,12
2/50 = 0,04
1,00

5
11
19
32
42
48
50
-

0,10
0,22
0,38
0,64
0,84
0,96
1,00
-

11

1.5.5

Histograma

Cada classe representada por um retngulo.


A base do retngulo o intervalo de classe.
A altura do retngulo proporcional frequncia da classe.
A rea do histograma proporcional soma das frequncias, se usarmos a frequncia relativa a
rea sob a curva vale 1.
Exemplos de histogramas:

14

30,0%

12

25,0%

Frequncias Percentual

Frequncias

26,0%

10
8
6
4

20,0%

20,0%
16,0%

15,0%

12,0%

10,0%

4,0%

5,0%
0,0%

0
4

12

16

20

60

24

70

80

90

100

110

120

130

Dimetro (mm)

N de Salrios

1.5.6

12,0%

10,0%

Polgono de frequncias

Neste grfico as classes so representadas pelos seus pontos mdios.


O Polgono formado pela unio, por retas, dos pontos mdios das partes superiores de cada
retngulo do histograma.
As figuras abaixo mostram exemplos de polgonos de frequncias.
30,0%

Frequncias Percentual

14

Frequncias

12

10
8
6
4
2
0
4

12

16

20

24

25,0%
20,0%
15,0%
10,0%
5,0%
0,0%

N de Salrios

1.5.7

60

70

80

90

100

110

120

130

Dimetro (mm)

Ogiva de Galton ou Polgono de frequncias Acumuladas

Neste grfico as classes so representadas pelos seus limites superiores, utilizando a frequncia acumulada.
12

A Ogiva de Galton formada pela unio, por retas, dos pontos que interceptam os limites superiores de
cada classe da tabela e a frequncia acumulada. O ponto inicial o limite inferior da 1 classe.

EXERCCIOS (resolvidos na aula)

Tabela 01 - Informaes sobre sexo, idade (anos), altura (metro e centmetro), peso (kg), estado civil, nmero
de irmos, transporte, procedncia, relao do trabalho com o curso de Estatstica, meio de informao e
nmero de disciplinas reprovadas dos alunos da disciplina Inferncia Estatstica do curso de Estatstica da
UFES - 13/02/2013.

A partir do banco de dados acima construa tabelas e grficos para os seguintes tipos de variveis:
a) Varivel qualitativa (tabela simples e grfico).
b) Varivel discreta (tabela de frequncias e grfico de barras).
c) Varivel contnua (tabela de frequncias agrupada em classes).
13

d) Histograma.
e) Polgono de frequncias.

1.6 - NOES DE SOMATRIO


No clculo de vrias medidas estatsticas, vamos utilizar somas de um grande nmero de parcelas. Para
facilitar a representao destas somas, introduziremos o conceito de somatrio.
Para simplificar a representao da operao de adio nas expresses algbricos, utiliza-se a notao ,
letra grega sigma maisculo.

As Principais representaes so:

Apesar de ser apenas um cdigo e no uma operao, a notao Sigma tem algumas propriedades que
podem simplificar operaes. Entre elas destacamos:
i.

O somatrio de uma soma a soma dos somatrios.

14

ii.

O somatrio de uma diferena a diferena dos somatrios.

iii.

O somatrio do produto de uma constante por uma varivel o produto da constante pelo somatrio da
varivel.

iv.

O somatrio da diviso de uma varivel por uma constante a diviso do somatrio da varivel pela
constante.

Somatrio Duplo

...

...

X11

X12

...

X1j

...

X1s
=1

X21

X22

...

X2j

...

X2s
=1

...

...

Xi1

...

...

Xi2

...

Xij

...

Xis
=1

...

..

Xr1

...

...

...

Xr2

...

Xrj

...

Xrs
=1

1
=1

2
=1

=1

=1

Onde: = 1, 2, 3, , ( ) = 1, 2, 3, , ( ) Xij
=
15

1 +
=1

2 + +
=1

=
=1

=
=1 =1

= . .
=1
=1

Nas aplicaes estatsticas estaremos sempre interessados na soma de todos os valores da srie. Portanto, i
varia sempre de 1 a n e consequentemente no precisaremos indicar na notao sigma a variao de i. Desta
forma, identificaremos:

EXERCCIOS (resolvidos na aula)

1) Escreva na notao Sigma, as somas:

a) X1+ X2 + X3 + X4 + X5
b) X3 + X4 + X5 + X6
c) (X1 + 2) + (X2 + 2) + (X3 + 2)
d) (X3- 10) + (X4 - 10) + (X5 - 10) + (X6 - 10)
e) (X1 - 3) + (X2 3) + (X3 - 3)
f) ((X1 - 15)f1 + (X2 - 15)f2 + (X3 -15)f3

2) Considerando os seguintes valores:

X1 = 2

X2 = 6

Y1 = 1

Y2 = 4

X3 = 7
Y3 = 5

X4 = 9
Y4 = 11

Calcular:
a)

3i=1(Yi 2)2
16

b)

4i=1(X i 4Yi )

3) Calcule X1 e X3, dado que:


6

2 = 364

X = 42
i=1

=1

2 = 324

X = 34
i=1
1,3

=1
1,3

4) Utilizando a tabela abaixo, calcule:

17

LISTA DE EXERCCIOS 01

1. Calcule para a tabela abaixo, o valor numrico das somas indicadas:


i
1

Xi
3

fi
2

a)

X
i 1

b)

f
i 1

c)

X
i 1

fi

2
i

fi

d)

X
i 1
4

e)

(X
i 1

f)

X
i 1

10) 2
i fi

g)

(2 X
i 1

10) 2 f i

2. Classifique as seguintes variveis em: Quantitativas (Discretas ou Contnuas) ou


Qualitativas (Nominais ou Ordinais).
a) A cor da pele de pessoas (ex.: branca, negra, amarela).
Varivel do tipo _______________________
b) O nmero de acessos dirios em um blog.
Varivel do tipo _______________________
c) Nmero de horas de estudo para uma prova de estatstica.
Varivel do tipo _______________________
d) O tipo de droga que os participantes de certo estudo tomaram, registrados como:
Droga A, Droga B e placebo.
Varivel do tipo _______________________

18

e) Nveis de calorias consumidos diariamente, registrados como: Alto, moderado e


baixo.
Varivel do tipo _______________________
3. O corpo administrativo de uma indstria estudou o tempo de espera dos produtos que
chegavam no setor de despache com uma solicitao de emergncia. Os seguintes dados
foram coletados no perodo de um ms (os tempos de espera esto em minutos):
2
21

5
6

10
8

12
7

4
13

4
18

5
3.

17

11

12

(a) Montar uma distribuio de frequncia em uma tabela em classes, com amplitudes de
classes c=4.
(b) Mostre as frequncias relativas, acumuladas e relativas acumuladas.
(c) Que proporo destes produtos enfrentam um tempo de espera de 9 minutos ou mais
no setor?
4. Uma indstria multinacional faz um levantamento das seguintes variveis com seus
gerentes: hobby; quantas vezes praticam esporte por semana; categoria de hotel em que se
hospedam quando em viajem e tempo gasto (por semana) na leitura de jornais e revistas.
a) Identifique e classifique cada uma das variveis consideradas?
b) Os resultados do tempo de leitura, em horas, para 25 funcionrios foi:

1.7 1.3

3.6 1.3 1.5 1.6 1.2 2.0 2.1 2.5 2.3 2.5 2.2

2.9 11.2 1.3

4.3 5.5 4.7 4.8 4.8 4.5 5.7 10.7 3.6

i) Organize os dados em rol.


ii) Construa uma tabela de frequncia com k = 5 classes.
iii) Construa um histograma.

5. Faa uma tabela para mostrar que de um total de 850 homens entrevistados sobre a venda
da Vale do Rio Doce, 51 no tinham opinio, 425 eram favorveis e os demais eram
contrrios. Das 725 mulheres entrevistadas, 87 no tinham opinio, 522 eram favorveis e
as demais eram contrrias.
6. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe.
157

178

148

176

169

154

170

158

164

164

159

175

155

163

171

172

163

157

166

162

157

165

156

166

160

154

163

165

164

177

150

168

166

169

152

164

172

165

162

170
19

a) Calcular a amplitude total.


b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe?
c) Construir uma tabela de frequncias simples absoluta e relativa das alturas dos alunos
admitindo que o limite inferior da 1a classe seja 148 cm.
d) Determinar os pontos mdios das classes.
e) Construir um polgono de frequncias.

7.

A distribuio abaixo indica o nmero de acidentes ocorridos com 70 motoristas de uma


empresa de nibus:
N de
0
acidentes
N de
20
motoristas

10

16

Determine:
a)
b)
c)
d)
e)
f)

O nmero de motoristas que no sofreram nenhum acidente.


O nmero de motoristas que sofreram pelo menos 4 acidentes.
O nmero de motoristas que sofreram pelo menos 3 acidentes.
O nmero de motoristas que sofreram no mnimo 3 e no mximo 5 acidentes.
A porcentagem dos motoristas que sofreram no mximo 2 acidentes.
Construa um grfico de colunas.

8. A tabela abaixo apresenta uma distribuio de frequncia das reas de 400 lotes de terra;
utilize-a para responder as questes.
reas (m)
300 |-- 400
400 |-- 500
500 |-- 600
600 |-- 700
700 |-- 800
800 |-- 900
900 |-- 1000
1000 |-- 1100
1100 |-- 1200
Total

N de lotes
14
46
58
76
68
62
48
22
6
400

Com referncia essa tabela, determine:


a) A amplitude total dos dados
b) O limite superior da quinta classe
c) O limite inferior da oitava classe
d) O ponto mdio da stima classe. Como voc interpreta este valor?
e) A amplitude do intervalo da segunda classe
f)

Monte uma tabela com todas as frequncias.


20

g) A frequncia relativa simples da quarta classe


h) A frequncia absoluta simples da oitava classe. Como voc interpreta este valor?
i)

A frequncia absoluta acumulada da quinta classe. Como voc interpreta este


valor?

j)

O nmero de lotes cuja rea no atinge 700m

k) O nmero de lotes com rea igual ou superior a 800m


l)

A percentagem de lotes cuja rea no atinge 600m

m) A percentagem de lotes cuja rea seja maior ou igual a 900m


n) A percentagem dos lotes cuja rea de 500m, no mnimo, mas inferior a 1000m
o) A classe do 72 lote.
p) At que classe esto includos 60% dos lotes?

9. Complete os dados que faltam na distribuio de frequncias:


a)
xi
0
1
2
3
4
5
6
7

fi
1

fri
0,05
0,15

Fi

0,25
0,15

13

4
3
2

18
19

= 20

= 1,00

b)
Classes
0 |-- 2
2 |-- 4
4 |-- 6
|-8 |-- 10
10 |-- 12
|-14|-- 16

xi
1
5
7

13

fi
4
8
27
15
10
=

Fi

fri
0,04

30

0,18
0,27

72
83
0,10
0,07
=

21

GABARITO 1 LISTA DE EXERCCIOS

Questo 01
a) 21
b) 12
c) 60
d) 334
e) 105
f) 31
g) 136
Questo 02
a) Qualitativa Nominal
b) Quantitativa discreta
c) Quantitativa contnua
d) Qualitativa nominal
e) Qualitativa ordinal

Questo 03

Questo 04
a) Hobby Qualitativa nominal
Vezes que pratica esporte Quantitativa Discreta
Categoria de hotel Qualitativa Ordinal
Tempo gasto - Quantitativa contnua
b)

Questo 05

Questo 06
a) AT = 30
b) c = 5
c)

22

d)
Tempo

Ponto Mdio
(P.M)
150,5
155,5
160,5
165,5
170,5
175,5

148 |-- 153


153 |-- 158
158 |-- 163
163 |-- 168
168 |-- 173
173 |-- 178

e)

Questo 07
a) 20
b) 15
c) 24
d) 20
e) 65,7%
f)

N de motoristas

25
20
15
10
5
0

N de acidentes

Questo 08
a) Amplitude da tabela (AT=1200 300 = 900). Amplitude dos dados no possvel
b) Limite superior = 800
c) Limite inferior = 1000
d) xi = 950. 48 lotes tm reas medindo em torno de 950 metros quadrados.
e) h=500 400 = 100

23

f) fr=76/400 = 0,19 ou 19,0%.


g) f8=22. Em 22 lotes as reas esto entre 1000 m (inclusive) e 1100 m (exclusive).

h)

i) f5=262. Em 262 lotes as reas so inferiores a 800 m2.


j) 194
k) 138
l) 29,5%
m) 19,0%
n) 78,0%
o) 500 |-- 600 3 classe
p) 700 |--800 5 classe

Questo 09

a) fi : 1; 3; 4; 5; 3; 2; 1;1
fri: 0,05; 0,15; 0,2; 0,25; 0,15; 0,1; 0,05; 0,05
Fi: 1; 4; 8; 13; 16; 18; 19; 20
b) Classes: 6 |-- 8; 12 |-- 14
xi : 3; 9; 11; 15
fi : 18; 11; 7
Fi: 4; 12; 57; 100
fri: 0,08; 0,15; 0,11

24

UNIDADE II MEDIDAS DE POSIO

Na anlise descritiva de dados as medidas estatsticas so instrumentos de avaliao e tomada de


decises.
Entre essas medidas esto as Medidas de Resumo, tambm conhecidas como Medidas de Posio.
O objetivo dessas medidas de resumir um conjunto de dados ou uma distribuio de frequncia
atravs de uma medida central, em torno da qual os dados tendem a se concentrar; por isso, tambm so
conhecidas como Medidas de Tendncia Central.
As medidas de tendncia central so: Mdia, mediana, moda.

2.1 - MDIA
Definimos a mdia aritmtica simples (ou mdia, apenas) de uma populao de tamanho N como sendo
o quociente da soma de todos os dados da populao pelo tamanho da mesma.
Seja o seguinte conjunto de dados de uma varivel X:
= { , , , , , } = { },

= , , ,

Estes dados podem ser provenientes de uma amostra ou de uma populao (normalmente o tamanho da
amostra simbolizado por n minsculo -, e o tamanho da populao por N maisculo).
Mdia de uma amostra

Mdia de uma populao

2.1.1 Mdia para dados no agrupados (Mdia Simples)


Quando desejamos conhecer a mdia dos dados no agrupados, determinamos a mdia aritmtica
= .
simples. Calculada por

Exemplo: Sabendo-se que a produo leiteira diria da vaca A, durante uma semana, foi de 10, 14, 13, 15,
16, 18, 12 litros, temos, para produo mediada semana:


+ + + + + +

=
=
=

Logo,
= 14 litros

25

2.1.2

Mdia para dados agrupados (Mdia Ponderada)

Quando desejamos conhecer a mdia dos dados agrupados numa distribuio de frequncias,
determinamos a mdia ponderada.
A frmula para calcular a mdia ponderada de uma amostra :

= .
ou

Quando os dados estiverem em uma distribuio de frequncia em classes, as observaes so estimadas


pelos pontos mdios xi, obtidos da seguinte maneira:
=

+
2

Onde: Liminf o limite inferior do intervalo


Limsup o limite superior do intervalo
Exemplo (sem intervalo de classe)
Considere a varivel X como o nmero de faltas de 25 funcionrios de uma empresa computadas em um
perodo qualquer e apresentada na distribuio de frequncia abaixo:
N de faltas (xi)
0
1
2
3
Total

fi
8
10
4
3
25

fr
0,32
0,40
0,16
0,12
1,00

O nmero mdio de faltas por funcionrios pode ser obtido por


= . =

++ +

= ,

ou
= . = (

)+

)+

( ) + (

= ,

Exemplo (com intervalo de classe)


Consideremos a tabela de distribuio da estatura(cm) de uma amostra de funcionrios, a mdia de
estatura calculada da seguinte maneira:
Estatura (cm)

N de funcionrios (fi)

xi

150 |-- 154

152

154 |-- 158

156

158 |-- 162

11

160

162 |-- 166

164

166 |-- 170

168

170 |-- 158

172

Soma

40

--

26

Neste caso, convencionamos que todos os valores includos em um determinado intervalo de classe
coincidem com o seu ponto mdio, onde no clculo o xi o ponto mdio.
=


+ + + + +
=
=

A altura mdia dos funcionrios de 161cm.

2.2 - MEDIANA (Md)


uma medida de posio definida como o nmero que se encontra no centro de uma srie de
nmeros, estando estes dispostos seguindo uma ordem. o valor situado de tal forma no conjunto que o
separa em dois subconjuntos de mesmo nmero de elementos.
frequentemente usada para a renda anual e para dados de valores de bens, porque algumas rendas
ou valores de bens extremamente elevados podem inflacionar a mdia, nesses casos a mediana melhor
medida de posio.
2.2.1 - Mediana para dados no agrupados

Com n impar

Para um nmero impar de observaes a mediana ser o termo de ordem:


+1
2

Com n par

Para um nmero impar de observaes a mediana ser a mdia aritmtica dos termos de ordem:

+1
2
2
Aps a ordenao dos valores, do menor para o maior, a mediana dividir a srie de observaes em 2 partes
iguais, ou seja, 50% menores valores se encontram abaixo da mediana e 50% maiores valores se encontram
acima da mediana.
Exemplos:
Dadas a srie de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, a mediana ser:
n= 9 (impar)
Valores ordenados: 2, 5, 6, 9, 10, 13, 15, 16, 18

= (+1) = (10) = 5 = 10,


2

Concluso: 50% menores valores se encontram abaixo de 10.


Dadas a srie de valores: 12, 18, 7, 10, 2, 13, 6, 21
n= 8 (par)
Valores ordenados: 2, 6, 7, 10, 12, 13, 18, 21.
27

+
( )
( +1)
2
2
2

4 + 5
2

10+12
2

= 11

=11

Concluso: 50% menores valores se encontram abaixo de 11.

2.2.2 - Mediana para dados agrupados em intervalos de classe


Para calcularmos a mediana numa distribuio de dados agrupados devemos seguir alguns passos
at chegarmos ao valor que representa a mediana.
Passo 1- Na distribuio de frequncia, devemos localizar a classe que contm o valor estimado da

mediana. Para isso devemos localizar a classe que contm o termo de ordem , ou seja, a classe que
contm a observao () a mesma classe que contm a mediana.

Passo 2 Localizada a classe da mediana, utiliza-se a formula:

( () ) .
= +

Onde: li = limite inferior da classe


F(ant.) = frequncia acumulada anterior a da classe mediana
c = amplitude da classe da mediana
fi = frequncia absoluta simples da classe mediana
EXEMPLO:
Calcular o salrio mediano a partir da distribuio de frequncia dos 40 funcionrios de uma empresa.
Salrios (xi)
400 |-- 600
600 |-- 800
800 |-- 1000
1000 | -- 1200
1200 |-- 1400
Total

N de Funcionrios (fi)
2
8
16
10
4
40

Fi
2
10
26
36
40
-

= 20 , a classe de Md a classe que contm x20, est na 3 classe (800 |- -1000).

Localizada a classe mediana, devemos utilizar a frmula seguinte para o clculo do valor mediano:

( () ) .
( ) .

= +
= +
= + =

O que significa que 50% dos funcionrios recebem at 925,00.

28

Emprego da mdia e da mediana:


De uma maneira geral, prefere-se empregar a mdia aritmtica quando a distribuio dos dados simtrica,
ou nos casos em que se faz necessrio o clculo de outras estatsticas. Por outro lado, a mediana preferida
quando se deseja o ponto que divide a distribuio em duas partes iguais ou nos casos em que na distribuio
dos dados existam valores muito distanciados dos demais, comumente chamados de valores extremos.

2.3 - MODA (Mo)


Denominamos moda (Mo) ao valor que mais se repete num conjunto de dados simples ou isolado,
ou o valor de maior frequncia num conjunto de dados agrupados numa tabela de frequncia.
Quanto ao valor que se destaca num conjunto de dados podemos ter vrias definies.
Distribuio Unimodal: Quando somente um valor se destaca no conjunto de dados
Distribuio Bimodal: Quando dois valores se destacam no conjunto de dados
Distribuio Trimodal: Quando trs valores se destacam no conjunto de dados
Distribuio Multimodal: Quando mais trs valores se destacam no conjunto de dados
Distribuio Amodal: Quando nenhum valor se destaca no conjunto de dados
2.3.1 - Moda para dados brutos ou no agrupados em classes
Quando lidamos com dados brutos ou agrupados a moda o valor de maior frequncia (maior
nmero de repeties).
EXEMPLO: Indique a moda para cada conjunto de dados.
a) 8; 10;13; 17; 25; 10 -> Moda = 10
b) 1; 3; 6; 7; 20; 12; 5 -> Amodal
c) 2; 1; 9; 7; 15; 2; 9; 4 -> Moda = 2 e 9
d)
N de faltas/Servio
(xi)

e)

N de
Funcionrios (fi)

1
2
3
4
5
6
Moda = 2

N de faltas/Servio
(xi)

2
15
3
2
2
3

1
2
3
4
5
6
Moda1 = 2 , Moda2 = 4

N de
Funcionrios (fi)

2
15
3
15
2
3

2.3.2 - Moda para dados agrupados em intervalos de classe


Para o clculo da moda nas distribuies de frequncia com intervalo de classe, precisamos primeiro
identificar a classe modal (classe com maior frequncia) para depois calcular o valor da moda.
Frmula para clculo da moda:
= +

1
.
1 + 2
29

Onde:
li = limite inferior da classe modal
1 = diferena entre a frequncia da classe modal e a frequncia da classe anterior.
2 = diferena entre a frequncia da classe modal e a frequncia da classe posterior.
c = amplitude ou tamanho da classe modal

EXEMPLO:
Calcular o salrio modal a partir da distribuio de frequncia dos 40 funcionrios de uma empresa.
Salrios (xi)
400 |-- 600
600 |-- 800
800 |-- 1000
1000 | -- 1200
Total

N de Funcionrios (fi)
3
8
20
9
40

O intervalo de salrios de 800 a 1000 reais considerado a classe modal, pois o intervalo que tem a maior
frequncia de funcionrios com estes salrios.
Utilizando a frmula para clculo da moda temos:
= +

1
12
. = 800 +
. 200 = 904,35
1 + 2
12 + 11

= 904,35

O salrio que mais se repete entre os funcionrios de R$904,35.

Exerccios (Resolvidos em sala)

1 - Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuio:


Notas
N de alunos

2
1

3
3

4
6

5
10

6
13

7
8

8
5

9
3

10
1

Calcule:
a) A nota mdia
b) A nota mediana
c) A nota modal

30

- Dada a seguinte distribuio de frequncia calcule a mdia aritmtica, mediana e moda.


Notas
N de alunos

0 |-- 2

2|-- 4

4 |-- 6

6|-- 8

8|--10

Total

11

15

45

- Num determinado processo de fabricao foram feitas 50 observaes de uma caracterstica de


qualidade de um tipo de pea, resultando nas seguintes medidas de dimetro em milmetros.

Calcule o dimetro mdio e o mediano das peas.

2.4 Medidas Separatrizes


As medidas de separatrizes tm o objetivo de auxiliar na interpretao dos dados tornando possvel
a interpretao de uma distribuio de frequncia de forma fracionada.
So as medidas que separam o rol ou a distribuio de frequncias em partes iguais. Vimos que a mediana
divide a distribuio em duas partes iguais quanto ao nmero de elementos de cada parte.
Agora vamos estudar outras medidas que dividem a distribuio em partes iguais, de forma fracionada, que
sero as chamadas separatrizes. So elas:
31

2.4.1 Quartis (Qi)


Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

Q1: 1 quartil. Deixa 25% dos elementos antes do seu valor


Q2: 2 quartil. Deixa 50% dos elementos antes do seu valor. Coincide com a mediana
Q3: 3 quartil. Deixa 75% dos elementos antes do seu valor.
Genericamente, para determinar a ordem ou posio do quartil a ser calculado, usaremos a seguinte
expresso:
.
4
onde: i = nmero do quartil a ser calculado
n = nmero de observaes.
Para dados agrupados em classes, encontraremos os quartis de maneira semelhante usada para o clculo
da mediana:
.
(
() ) .
= +

Onde:
li = limite inferior da classe que contm o quartil desejado
c = amplitude do intervalo de classe
F(ant) = frequncia acumulada at a classe anterior classe quartlica.
fi = frequncia absoluta simples da classe quartlica.
2.4.1.1 Diagrama de Caixa ou BOX-PLOT

O boxplot (grfico de caixa) um grfico utilizado para avaliar a distribuio emprica do dados. O
boxplot formado pelo primeiro e terceiro quartil e pela mediana. As hastes inferiores e superiores se
estendem, respectivamente, do quartil inferior at o menor valor no inferior ao limite inferior e do quartil
superior at o maior valor no superior ao limite superior.
Para este caso, os pontos fora destes limites so considerados valores discrepantes (outliers) e so denotados
por asterisco (*).

32

A escala de medida da varivel encontra-se na linha horizontal do quadro onde est inserida a
figura.
Observe que 50% da distribuio tm valores dentro da caixa.
As linhas horizontais que saem da caixa terminam nos limites inferior (LI) e superior (LS) da
distribuio. Entre esses limites encontram-se os valores considerados como tpicos da distribuio.
Esses limites so determinados em funo da distncia entre os dois quartis (Q3 e Q1), isto , do
desvio inter-quartlico: DQ = Q3 Q1.

2.4.2 Centil ou Percentil(Ci):


So as medidas que dividem a amostra em 100 partes iguais. Assim:

O elemento que definir a ordem do centil ser encontrado pelo emprego da expresso:
.
100
onde:
i = nmero identificador do centil
n = nmero total de observaes
Para dados agrupados em classes, encontraremos os centis de maneira semelhante utilizada para clculo
da mediana, dos quartis.
.
(
() ) .

= +

Onde: li = limite inferior da classe que contm o centil desejado


c = amplitude do intervalo de classe
F(ant) = frequncia acumulada at a classe anterior classe centlica.
fi = frequncia absoluta simples da classe centlica.

33

Exemplo: A tabela abaixo refere-se a quantidade de negcios efetuados diariamente por uma instituio
financeira. Calcular o 3 quartil e o 40 centil.
Quantidade de neg/dia
11
12
13
14
15
16

fi
2
5
6
8
3
2

Fi
2
7
13
21
24
26

Calculando o terceiro quartil do exemplo acima:


Passo 1) Identificar a posio do terceiro quartil

3 26
=
= 19,5 20
4
4

Portanto, a posio do quartil de ordem 3 = 20.


Passo 2) Encontrando o valor do quartil

3 = 326 = 19,5 20 = 14
4

O valor 14 est na posio 20 da tabela de distribuio de frequncia.


Interpretao: 75% das quantidades negociadas so menores ou igual a 14.

Exemplo: Com base na tabela de distribuio do consumo mdio de eletricidade (kw/hora) entre usurios
em uma cidade X. Encontre o:
a) Terceiro quartil;
b) vigsimo quinto centil;
Consumo (Kwh)
5 |-- 25
25 |-- 45
45 |-- 65
65 |-- 85
85 |-- 105
105 |-- 125
125 |-- 145
145 |-- 165
Resoluo:
a) Q3
Encontrar a posio do terceiro quartil:

380
4

N de usurios (fi)
6
4
14
26
14
7
6
3

Fi
6
10
24
50
64
71
77
80

= 60

34

O Q3 est localizado na 60 posio, logo encontra-se na 5 classe. Com base nesses dados, calcularemos Q3
da seguinte forma:
.
3 80
( () ) .
( 4 50) 20
= +
= +
= + , = ,

Interpretao: 75% dos usurios consomem at 99,29 kwh. De maneira anloga, 25% dos usurios
consomem mais de 99,29 kwh.

b) C25
Encontrar a posio do centil 25:

2580
100

= 20

O C25 est localizado na 20 posio, logo se encontra na 3 classe. Com base nesses dados, calcularemos
C25 da seguinte forma:

.

(
() ) .
(
)

= +
= +
= + , = , .

Interpretao: 25% dos usurios consomem at 59,29 kwh. De maneira anloga, 75% dos usurios
consomem mais de 59,29 kwh.

EXERCCIOS (Resolvidos em sala)

1 - Calcular os valores do Q1, Q2 e Q3 da tabela seguinte:


Tabela Nmeros de acidentes /ms no Cruzamento X em Vila Velha - ES
N de acidentes / ms

fi

Fi

10

19

24

28

Fonte: Dados Hipotticos

35

2 - Dada as seguinte distribuio de frequncia calcule Q1, Q3 , C93.


Salrios (R$)
500 700
700 900
900 1.100
1.100 1.300
1.300 1.500
1.500 1.700
1.700 1.900
Total

fi
18
31
15
3
1
1
1
= 70

36

LISTA DE EXERCCIOS 02

1- Calcule a mdia aritmtica, mediana e moda para cada uma das distribuies abaixo:
a) Pesos de recm-nascidos (em kg): 2.7; 3.9; 4.1; 4.3; 5.4
b) Taxas sanguneas de uria (mg/dl): 27; 31; 32; 34; 46; 61
c) Estatura de 140 alunos (em cm):

2- Qual o nmero mdio, mediano e o 3 quartil do nmero de atendimentos em servio mdico por
funcionrios de uma empresa, distribudos na tabela abaixo:
N de
atendimentos
N de funcionrios

TOTAL

24

21

50

3- O salrio-hora de cinco funcionrios de uma companhia, so: R$ 75,00; R$ 90,00; R$ 83,00; R$ 142,00
e R$88,00. Determine:
a) a mdia dos salrios-hora;
b) o salrio-hora mediano.
4- Calcule a mdia aritmtica, mediana, moda e o C80 das distribuies de frequncia abaixo:
a)
b)

5- Voc fez dois trabalhos num semestre e obteve as notas 8,5 e 5,5. Qual deve ser a nota que voc
deve tirar no 3 trabalho para que a mdia dos trs seja 7?
6- Numa empresa, vinte operrios tm salrio de R$ 4.000,00 mensais; dez operrios tm salrio de R$
3.000,00 mensais e trinta tm salrio de R$ 2.000,00 mensais. Qual o salrio mdio desses
operrios?
7- Qual a percentagem de valores que se localiza entre o ultimo quartil e o C81?
8- Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40 elementos. Se o peso
mdio do grupo A for e 80kg e o grupo B for de 70kg ento verdade que o peso mdio dos dois
grupos considerados em conjunto de 75kg? Justifique.
9- Um concurso realizado simultaneamente nos locais A, B e C, apresentou mdias: 70, 65 e 45, obtidos
por 30, 40 e 30 candidatos, nessa ordem. Qual a mdia geral do concurso?
37

10- Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma mdia de 70
pontos em determinada prova. Sabendo-se que a mdia geral dos candidatos (independente do
sexo) foi de 64 pontos, qual foi a mdia dos candidatos do sexo feminino?
11- Dado o histograma abaixo, calcular a mdia, moda, mediana e o centil 70.

12- O histograma abaixo representa os salrios, em reais (R$) dos 100 empregados de uma empresa:

a)
b)
c)
d)
e)
f)
g)

Que percentual de empregados recebem 8 salrios ou mais?


Quantos empregados recebem de 4 a 16 salrios?
Quantos empregados recebem menos que 4 salrios ou mais que 12 salrios?
Qual o salrio mdio dos empregados?
Qual o valor da mediana, e como voc interpreta esse valor?
Acima de que valor esto os 15 salrios mais altos?
Qual o maior salrio entre os 14% mais baixos?

38

GABARITO - Lista de Exerccios 02

1a)

mdia: 4,08

mediana: 4,1

moda: Amodal

b)

mdia: 28,5

mediana: 33

moda: Amodal

c)

mdia: 164,93

mediana: 164,08

moda: 162,5

2- = 0,68 , = 1 3 = 1
3- a) R$ 96

b) R$ 88

4- a) mdia: 5,3
b) mdia: 172,4

5678-

mediana: 5,28
mediana: 174

moda: 5,2
P80: 7,64
moda: 176,57
P80: 180,22

7
R$ 2833,33
6%

. = 72
9- = 60,5

10- = 55
11 = 6,8

Md = 7

Mo = 8,66 C70=8,66

12a) 64%
b) 76
c) 56
d) = 9,84

e) Md = 10,33
f) C85 = 15,12
g) C14= 3,5

39

UNIDADE III - MEDIDAS DE DISPERSO

3.0 - Medidas de Disperso


Podemos definir disperso (variabilidade) de um conjunto de dados como sendo a maior ou menor
diversificao em torno de uma medida de tendncia central. O objetivo das medidas de disperso medir
quo prximos uns dos outros esto os valores de um grupo (e algumas mensuram a disperso dos dados
em torno de uma medida de posio).
Exemplo 01:
Em um processo seletivo, trs candidatos esto concorrendo a uma vaga. Os candidatos realizaram vrios
testes e as notas obtidas foram registradas, o candidato escolhido ser o que apresentar melhor desempenho
no geral (notas mais homogneas). Os resultados obtidos em cada um deles foram os seguintes:

A
B
C

5
10
10

10
9
10

7
12
9

15
9
10

14
14
9

12
8
9

4
9
10

7
7
11

10
8
7

Mdia
11 9,5
9 9,5
10 9,5

Qual informao necessria para decidir qual o melhor candidato?

Verificamos que a mdia dos trs candidatos nos 10 testes 9,5, ou seja, os trs tem o mesmo rendimento.
Por outro lado, vemos que existe significativa diferena nas distribuies das notas. Ento, para decidir qual
o melhor candidato analisamos a disperso ou variabilidade das notas de cada candidato, para verificar qual
apresenta mdia mais confivel.
As medidas de disperso podem ser absolutas ou relativas. A seguir apresentaremos as que so consideradas
mais importantes.

3.1 - MEDIDAS DE DISPERSO ABSOLUTA


3.1.1 - Amplitude Total (intervalo)

a medida mais simples de disperso. Consiste em identificar os valores extremos do conjunto (mnimo e
mximo), podendo ser expresso:
- pela diferena entre o valor mximo e o mnimo;

- pela simples identificao dos valores. [ ; ]

41

Exemplo 02: Observe o conjunto abaixo, referente s notas de duas turmas de Estatstica:

Diagrama de Pontos das notas das turmas

Desvantagem do uso do intervalo:


Apesar de sua simplicidade o intervalo no d ideia de como os dados esto agrupados entre os extremos.
No caso acima ambos os grupos tm o mesmo intervalo (4, [4,8]), mas no primeiro grupo os dados esto bem
dispersos, enquanto no primeiro esto prximos do valor mnimo.

3.1.2 - Desvio (di)


Diferena entre o valor observado xi e a mdia (x) das observaes.
Exemplo 03: Dados os conjuntos:

X = 4; 6; 4; 6; 5; 5
Y = 9; 1; 5; 5; 1; 9

Mdia dos conjuntos

= 5

= 5

Desvios em relao a mdia so:


= = { -1, 1, -1, 1, 0, 0}
= = { 4, -4, 0, 0, -4, 4}
Se os desvios tem valores relativamente pequenos (conjunto X), os dados tem pouca disperso. Se, ao
contrrio, os desvios tm valores relativamente grandes como no caso do conjunto Y, a disperso maior.
O conjunto com menor mdia dos desvios ter menos disperso.

OBS:
42

3.1.3 - Desvio Mdio (Dm)


a mdia dos desvios em seus valores absolutos.

Exemplo 04: Desvios mdios dos conjuntos X e Y.


di = xi - x = { -1, 1, -1, 1, 0, 0}
di = yi - y = { 4, -4, 0, 0, -4, 4}

O desvio mdio do conjunto X menor que o desvio mdio do conjunto Y.

3.1.4 - Varincia ( ou s)
A varincia uma das medidas de disperso mais importantes, pois proporciona uma mensurao
da disperso dos dados em torno da mdia.
Para calcularmos a varincia devemos considerar os desvios de cada valor em relao mdia. Como
estamos interessados nos tamanhos dos desvios e no no fato deles serem positivos e negativos trabalhamos
com os desvios ao quadrado. Tomamos a mdia aritmtica dos desvios ao quadrado, obtemos a varincia.

Dados

Populao
( )
=

Amostra
(
)
=

Ou

Ou

2
=

2 2
=
1

Simples

( )

(
)

Ou

Ou

Tabelas
2
=

2 =

2 2
1

A unidade de medida da varincia equivale unidade dos dados ao quadrado (e portanto o quadrado da
unidade da mdia) causando dificuldades para avaliar a disperso. Para retornarmos a unidade original dos
dados tiramos a raiz quadrada da varincia obtendo assim o desvio padro.
43

3.1.5 - Desvio Padro (s ou )


a raiz quadrada positiva da varincia, apresentando a mesma unidade dos dados e da mdia,
permitindo avaliar melhor a disperso.

Dados simples:
(
)
=

Tabelas:
(
)
=

OBS: se os dados referem-se a uma POPULAO usa-se N no denominador da expresso e o smbolo .


- Quanto maior o desvio padro, maior a disperso dos dados em torno da mdia.

Exemplo 06: A tabela abaixo refere-se s notas dos candidatos do exemplo 1.

A
B
C

5
10
10

10
9
10

7
12
9

15
9
10

14
14
9

12
8
9

4
9
10

7
7
11

10
8
7

Mdia
11 9,5
9 9,5
10 9,5

Candidato A:
=

( )

( , ) + ( , ) + ( , ) + + ( , )
= ,

( )
= =

= , = ,

Candidato B:
=

( )

( , ) + ( , ) + ( , ) + + ( , )
= ,

( )
= =

= , = ,

Candidato C:
=

( )

( , ) + ( , ) + ( , ) + + ( , )
= ,

44

( )
= =

= , = ,

Quanto maior a disperso dos dados maior o valor do desvio padro:


- O candidato C o que tem as notas mais homogneas, pois apresenta o menor desvio padro, 1,0.
- O candidato A, apesar de apresentar notas altas, tem o maior desvio padro (3,5), assim apresenta
apresenta maior disperso.

Exemplo 07: Amostra da estatura de 40 funcionrios em uma empresa (em cm)

Mdia amostral:
=


( ) + ( ) + + ( )

=
=
=

Varincia:
=

) ( ) + + ( )
(

=
=
= ,

Desvio padro:

= = , = ,

PROPRIEDADES DO DESVIO PADRO

1. O desvio-padro sempre no negativo


2. Quanto maior for o desvio-padro maior ser a disperso dos dados em relao
mdia.
3. Se o desvio-padro igual a zero porque no existe variabilidade, isto , os
dados so todos iguais.

45

Propriedade da Soma

Somando-se ou subtraindo-se uma constante a todos os valores de uma varivel, o desvio padro no se
altera.
= 5

= { 1, 3, 5, 7, 9},

Mdia:

Varincia:

2 =

1 (
1

(15)2 +(35)2 +(55)2 +(75)2 +(95)


4

= 10

Desvio Padro: = = 10 3,2


Se somarmos a constante 2 a cada observao, teremos:

2 =
S2 =

+2)]

1 [( +2)(
1

2)]

1 [( +2
1

(15)2 +(35)2 +(55)2 +(75)2 +(95)


4

1 (
1

= 10

Ou seja, a varincia no se altera. Portanto, o desvio padro permanece o mesmo.

Propriedade da Multiplicao

Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante (diferente de zero),
o desvio padro fica multiplicado ou dividido por este valor.
Se multiplicarmos as observaes por 2, teremos:

2 =

[(2 2)] 2[( )] 2 [( )]


=
=
= 22 10 = 40
1
1
1

Ou seja, a varincia ser multiplicada pelo quadrado da constante que multiplicou os valores da varivel.
Portanto, o desvio ser multiplicado pela prpria constante:
= 22 = 4 10 2 3,2 = 6,4

3.2 - MEDIDA DE DISPERSO RELATIVA

3.2.1 - Coeficiente de Variao Percentual (c.v. %)


O coeficiente de variao percentual uma medida de disperso relativa, pois permite comparar a
disperso de diferentes distribuies (com diferentes mdias e desvios padres).
46

Onde a mdia e s o desvio padro do conjunto de dados.


Quanto menor o valor do C.V.% mais os dados esto concentrados em torno da mdia (conjunto mais
homogneo).
Exemplo 07: Usando os dados dos candidatos do exemplo 1, temos:
Candidato
A
B
C

Mdia
9,5
9,5
9,5

Desvio padro
3,5
2,0
1,0

Qual o mais homogneo em termos de notas.


. % =

,
= , %
,

. % =

,
= , %
,

. % =

,
= , %
,

Classificao do Coeficiente de Variao:

Ou seja,
0 % CV 20% Disperso baixa (mdia boa como medida de resumo).
20% < CV 30% Disperso moderada (mdia razovel como medida de resumo).
CV > 30% Disperso alta (mdia ruim como medida de resumo).

47

EXERCCIOS (Resolvidos em sala)

Exerccio 1 Um exame fsico examinou 6 indivduos cujos pesos (kg) foram: 68; 70; 86; 55; 75 e 90. No
mesmo exame, foram tambm tomadas medidas de altura (cm), com seguintes valores: 170; 160; 164; 164;
170 e 180. Os indivduos apresentam maior variabilidade no peso ou altura?

Exerccio 2 Na tabela abaixo encontra-se a estrutura do produto interno bruto do Brasil, em bilhes de
reais, segundo as atividades econmicas.

Em qual dos setores ocorre a maior variabilidade?

Exerccio 3 - Uma varivel X tem mdia igual a 10 e varincia igual a 16. Calcule a mdia e a varincia da
varivel dada por Y = (3X + 5) / 2.

48

Exerccio 5 - Dado o polgono de frequncias para as profundidades de poos de petrleo (metros), avalie a
disperso dos dados em torno da mdia.

49

LISTA DE EXERCCIOS 03

1) Um departamento de produo usa um procedimento de amostragem para testar a qualidade de itens


recm-produzidos. O departamento emprega a seguinte regra de deciso em uma estao de inspeo: se
uma amostra de 25 itens tem uma varincia de mais que 0,15, a linha de produo precisa ser paralisada
para reparos. Suponha que os seguintes dados tenham sido coletados:
Dados

fi

3,4 |--3,8

3,8 |--4,2

4,2 |--4,6

10

4,6 |--5,0

5,0 |--5,4

Total

25

Pede-se:
a) A linha de produo deve ser paralisada? Por qu?
b) A mdia e uma boa medida de resumo para o conjunto de dados? Explique pela disperso
relativa(CV) dos dados.
c) Estime a menor medida entre as 25% maiores.

2) Duas turmas A e B com nA = 50 e nB = 80 apresentaram mdias = 65 e = 70e varincias 2 =


225 e 2 = 235. Qual a turma mais homognea?
3) O tempo de ignio fria de um motor de carro est sendo investigado por um fabricante de gasolina.
Os seguintes tempo (em segundos) foram obtidos em um veculo de teste: 1,75; 1,92; 2,62; 2,35; 3,09; 3,15;
2,52 e 1,90. O que podemos dizer sobre a qualidade da mdia levando-se em considerao a disperso dos
dados (utilize CV)?
4) Dados os histogramas de duas amostras de preos de um produto em regies distintas, pede-se:

a) Calcular e comparar os preos mdios do produto.


b) Qual regio apresenta menor centil 75 (C75).
50

c) Qual regio mais heterognea em relao aos preos do produto?


5) Uma indstria deseja comprar uma mquina para melhorar o desempenho de sua produo. Como opo,
o engenheiro responsvel deve avaliar duas marcas e decidir qual das duas comprar. As mquinas foram
ento testadas e os tempos de execuo so dados abaixo.
Mquina Z: 25 24 25 22 23 24 23 27 22 26
Mquina W: 29 23 28 27 26 24 24 28 23 28

a) Encontre a mdia amostral e o desvio padro amostral para o tempo de execuo de cada
mquina.
b) Suponha que voc seja o responsvel de dar o parecer. Qual das duas escolheria? Justifique
(Use CV).
6) Dado o grfico abaixo, pede-se:

a)
b)
c)
d)
e)
f)

Construir uma tabela de distribuio de frequncias?


Podemos dizer que 50% dos aumentos esto abaixo de que percentual?
Qual a classe de variao com maior frequncia?
Qual o aumento mdio durante estes dois anos?
Qual a proporo de aumentos entre 4% e 8,0%?
Avalie a disperso dos percentuais de aumento do dlar.

7) Os conjuntos de dados abaixo referem-se a observaes dos preos de um produto em todos os


estabelecimentos de seu comrcio, em duas grandes cidades:
Cidade A:

Cidade B:

2,0

2,5

2,8

2,8

2,5

2,6

2,6

2,4

2,4

2,0

2,3

2,5

2,6

2,4

2,8

2,8

2,5

1,7

1,9

1,8

1,8

2,2

2,0

2,8

2,5

3,2

2,5

2,1

2,3

2,4

a)
b)

Em mdia, qual cidade apresenta maior preo do produto?


Qual cidade apresenta preos mais homogneos? Utilize o C.V.

8) Considere os seguintes dados amostrais (conjunto de peas, em gramas):


105 110 102 103 107 105 90 80
51

Pede-se:
a) A mdia, a mediana, a moda, o desvio mdio, a varincia, o desvio padro e o coeficiente de
variao.
b) Os dados possuem pequena disperso? Por qu?
c) Somar 100 de cada observao para obter uma amostra com valores transformados e calcule a
mdia, a varincia. (Compare essa varincia com os dados originais).

09) A idade mdia dos candidatos a um determinado curso de aperfeioamento sempre foi baixa, da ordem
de 22 anos. Como esse curso foi planejado para atender a todas as idades, decidiu-se fazer uma campanha
de divulgao. Para se verificar se a campanha foi ou no eficiente, fez-se um levantamento (amostra) da
idade de candidatos ltima promoo, e os resultados esto na tabela a seguir.

Idade

18 |-- 21

21 |-- 24

24 |-- 27

27 |-- 30

30 |-- 33

Total

N de
candidatos

18

12

10

50

a) Baseando-se nesses resultados, voc diria que a campanha produziu algum efeito (isto , aumentou
a mdia)?
b) Um outro pesquisador decidiu usar a seguinte regra: se a diferena x 22 fosse maior que o valor
2 SX /n, ento a campanha teria surtido efeito. Qual a concluso dele, baseado nos dados?
c) O que podemos dizer sobre a qualidade da mdia de idade levando-se em considerao a disperso
dos dados?
d) Acima de que valor de idade esto os 5 candidatos mais velhos?

52

GABARITO - Lista de Exerccios 03


(Medidas de disperso)

Questo 1)
a) Sim, pois a varincia da amostra maior que a varincia tolerada de 0,15.
= 4,29

2 = 0,207

= 0,455

b) A mdia tem uma boa qualidade, o coeficiente de variao menor que 20%, representadno
baixa disperso.

0,455
= 100 =
100 = 10,6%
4,29

c) P75 = 4,55
O menor valor entre os 25% maiores 4,55.

Questo 2) :

: =

100 =

15
65

100 = 23,1%

15,3
100 =
100 = 21,9%
70

Turma B mais homognea, apresentou menos percentual de variao.

Questo 3)
= 2,41

2 = 0,2865

= 0,535

100 =

0,535
2,41

100 = 22,19%

A mdia de qualidade moderada, pois os dados apresentam moderada disperso. CV > 20%

Questo 4) :
a) A cidade A apresenta preo mdio mais baixo. = 6,9

= 8,7

b) Cidade A.
75 = 9,0

: 75 = 10,43

c) Cidade A
2 = 6,25
2 = 4,96

= 2,5

2,5
100 =
100 = 36,24%
6,9

= 2,23

2,23
100 =
100 = 25,6%
8,7

Questo 5)
a) : = 24,1 2 = 0,277 = 1,66
: = 26
2 = 5,33
= 2,31
b) A mquina W, pois apresenta menor percentual de variao.
:
:

1,66
100 =
100 = 6,9%

24,1

2,31
= 100 =
100 = 8,88%

26

53

Questo 6)
a)
Percentual de
aumento
0|-- 2
2|--4
4|--6
6|--8
8|--10

b)
c)
d)
e)

fi
5
15
33
25
22
100

Fi
5
20
53
78
100

fr
5,0%
15,0%
33,0%
25,0%
22,0%
100,0%

Fr
5,0%
20,0%
53,0%
78,0%
100,0%

Acima de 5,82. P50 = 5,82


3 classe. (4|--6)
= 5,88
33 +25 = 58%
2 = 5,2

f)

= 2,28

100 =

2,28
5,88

100 = 38,77% Alta disperso

Questo 7)
a) Cidade A.
b)
Cidade B. Menor coeficiente de variao.

= 2,39

2 = 0,12

= 0,34

0,34
100 =
100 = 14,34%
2,39

= 2,32

2 = 0,108

= 0,33

0,33
100 =
100 = 14,22%

2,32

Questo 8)
a) A mdia, a mediana, a moda, o desvio mdio, a varincia, o desvio padro, o erro padro, e o
coeficiente de variao.

10,08
= 100,25
2 = 101,64
= 10,06
= 100 =
100 = 10,06%
100,25

b) Sim, pois o CV 20% representa baixa disperso.


10,08
c) Aps somar 100: = 200,25
2 = 101,64
= 10,08 =
100 = 5%
200,25

A mdia alterada e a varincia permanece a mesma.

Questo 09)
a) Sim, a mdia da amostra 23,34. Superior a 22 anos. = 23,34
b) Se x 22 > 2 SX /n
2 = 30,43

= 5,51

x 22 = 23,34 22 = 1,34
2 SX
n

2 5,51

1,34 < 1,56

50

= 1,56

No surtiu efeito.

c) O que podemos dize =

5,51
23,34

100 = 23,63%

d) Acima de 28,25 anos. (P90=28,25)

54

UNIDADE IV - PROBABILIDADE
4.0 INTRODUO A PROBABILIDADE
Normalmente impossvel identificar com certeza o resultado de um evento futuro:

De qual sexo ser o primeiro filho de determinado casal;

Qual lado da moeda vai sair;

Com quantos anos determinada pessoa vai morrer;

Quais os nmeros que sero sorteados na loteria;

Usando a teoria da probabilidade, possvel quantificar a chance de um evento futuro ocorrer com base em
informaes obtidas de eventos passados.

4.1 - CONCEITOS IMPORTANTES


Experimentos Aleatrios
Experimentos que quando repetidos, nas mesmas condies, produzem diferentes resultados (Jogar um
dado numa superfcie plana; Retirar uma carta de baralho; Lanar uma moeda).
Espao Amostral
O conjunto de resultados possveis, relacionado a um experimento, denominado espao amostral.
E representamos pela letra grega .
Exemplos:

Lanamento de um dado (existem 6 resultados possveis)


= {1, 2, 3, 4, 5, 6}

Retirar uma carta de um baralho (existem 52 resultados possveis)


= {s de copas, s de ouros,..., Reis de paus, Rei de espada}

Evento
Um evento pode ser referido a um nico resultado, ou a um subconjunto de resultados, pertencente
um espao amostral;
Exemplo:

Lanamento de um dado:

E1= sair face 5


E2= sair um valor menor do que 3.

Retirar uma carta de um baralho:

E1= sair um 5 de paus.


55

E2= sair uma carta de espadas;


EXEMPLO 01: Lanam-se dois dados e observa-se as faces superiores.
Vamos imaginar como seria o espao amostral neste caso. Ao lanar dois dados, temos ento os seguintes
resultados que podem ocorrer como resultados deste lanamento:

Podemos determinar o espao amostral do experimento atravs do diagrama de rvore, til para resoluo
de problemas que sero vistos futuramente:

Podemos observar os seguintes eventos:


A: Sada de faces iguais;
A = { (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}.

B: Sada de faces cuja soma seja igual a 10;


B = { (4, 6), (5, 5), (6, 4)}.
56

C: Sada de faces cuja soma seja menor que 2;


C=
Isto quer dizer que temos um evento chamado Evento Vazio ou Evento impossvel.
D: Sada de faces cuja soma seja menor que 13;
D=
E: Sada de faces onde uma face o dobro da outra.
E = { (1, 2), (2, 1), (2, 4), (3, 6), (4, 2), (6, 3)}.

4.2 - DEFINIES DE PROBABILIDADE

Denio clssica:

A probabilidade de um evento a diviso do nmero de resultados favorveis pelo nmero de


resultados possveis.
() =

Denio frequentista:

Se repetir um experimento um grande nmero de vezes a probabilidade pela frequncia relativa de


um evento tende para probabilidade, est dada por:
() =

onde m o nmero de vezes que observado A e n o nmero de repeties do experimento.


Quando temos um espao amostral finito em que todos os pontos amostrais tm a mesma probabilidade
1/n, no necessrio explicitar completamente e A. Nesse caso, so usado os mtodos clssicos de
contagem da anlise combinatria. Um princpio fundamental de contagem diz que, se uma tarefa pode ser
executada em duas etapas, a primeira podendo ser realizada de p maneiras e a segunda de q maneiras, ento,
a tarefa completa pode ser executada de p.q maneiras. Esse o princpio multiplicativo.

EXEMPLO 02: E: Retirar uma carta de um baralho de 52 cartas


B: Extrair um s
Bem misturado significa que qualquer carta tem a mesma chance de ser extrada. Como h s = 4 ases entre
as n = 52 cartas, a probabilidade dada por:
() =

4
1
=
=

52
13
57

EXEMPLO 03: Em um estudo para verificar a probabilidade dos indivduos da cidade X apresentarem Rh- ou
+, em seus tipos sanguneos, foram coletadas informaes de 820 indivduos.

Os resultados foram: Rh negativo 83 indivduos


Rh positivo 737 indivduos

Evento A = o indivduo apresentar Rh em seu tipo sanguneo;


() =

83
= 0,1012
820

Evento B = o indivduo apresentar Rh + em seu tipo sanguneo;


() =

737
= 0,8988
820

EXEMPLO 04: Os registros de uma companhia de aviao mostram que durante certo tempo 468 dentre 600
de seus jatos da linha Vitria-Rio chegaram no horrio, qual a probabilidade de que um avio daquela linha
chegue no horrio?
N de jatos que chegaram no horrio: 468
N total de jatos: 600
( ) =
=

468
600

= 0,78 = 78%

Lei dos grandes nmeros: Se repete-se um experimento um grande nmero de vezes a probabilidade pela
frequncia relativa de um evento tende para probabilidade terica.

Propriedades da Probabilidade:

0 P(A) 1 para qualquer evento A.

P() = 1

Se o complemento do evento A, ento () = 1 ()

Dois eventos A e B, so mutuamente exclusivos se possuem interseo vazia, a probabilidade deles


ocorrerem simultaneamente nula. Isto =

Teorema da soma: Se A e B so dois eventos quaisquer, ento:


( ) = () + () ( )

Operaes com Eventos

A UNIO de dois eventos denotadas por: ( )

A INTERSECO entre dois eventos denotadas por: ( )


58

O COMPLEMENTAR do evento A, denotado por Ac ou , o evento que ocorre quando A no ocorre;

ILUSTRAO DAS PROPRIEDADES

( )

Teorema da soma:

( )

Ac

( ) = () + () ( )

Eventos Mutuamente Exclusivos


Eventos mutuamente exclusivos so aqueles que jamais podem ocorrer ao mesmo tempo.

Exemplo:

Lanamento de um dado: A = sair 2; B= sair um valor maior do que 4.

Representao (Eventos Mutuamente Exclusivos)


59

( ) = () + ()

EXEMPLO 05 Tipo sanguneo


Usando os dados do exemplo 03, os eventos A e B so mutuamente exclusivos, j que um indivduo no pode
apresentar Rh- e Rh+, em seu tipo sanguneo, ao mesmo tempo;
() =

83
= 0,1012
820

() =

737
= 0,8988
820

( ) = 0
( ) = () + () = 0,1012 + 0,8988 = 1
c = B
c = A

EXEMPLO 06: A tabela a seguir apresenta dados relativos distribuio de sexo e alfabetizao em
habitantes de Sergipe com idade entre 20 e 24 anos.

Um jovem entre 20 e 24 anos escolhido ao acaso em Sergipe, calculamos as probabilidades das seguintes
maneiras:
: conjunto de 101.850 jovens de Sergipe, com idade entre 20 e 24 anos.
M: jovem sorteado do sexo masculino;
F: jovem sorteado do sexo feminino;
S: jovem sorteado alfabetizado;
60

N: jovem sorteado no alfabetizado.

Temos,
() =

() =

48.249
101.850
85.881
101.850

= 0,474

= 0,843

() =

() =

= 0,526

15.696
101.850

= 0,157

:
( ) =

53.601
101.850


39577
=
= 0,389

101850

:
( ) =


39577
=
= 0,389

101850

85881 + 48249 39577


= 0,928
101850

EXERCCIOS (Resolvidos em sala)


Questo 01: Considere a experincia que consiste em pesquisar famlias com trs crianas, relao ao sexo
das mesmas, segundo ordem de nascimento. Determinar o espao amostral e enumerar os seguintes
eventos:
a) A ocorrncia de dois filhos do sexo masculino;
b) A ocorrncia de pelo menos um filho do sexo masculino;
c) A ocorrncia de no mximo duas crianas do sexo masculino.

Questo 02: Sendo A e B dois eventos em um mesmo espao amostral traduza para a linguagem da teoria
dos conjuntos, as seguintes situaes:
a) Pelo menos um dos eventos ocorre;
b) O evento A ocorre, mas B no ocorre;
c) Nenhum deles ocorre;
Questo 03: Em uma universidade,2000 estudantes do curso de medicina, em determinado ano, foram
classificados de acordo com o tipo de esporte que praticam. Futebol praticado por 260 estudantes, natao
por 185 estudantes e musculao por 210 estudantes, sendo que alguns praticam mais de um desses
61

esportes. Assim, tem-se 42 estudantes que praticam natao e musculao, 12 futebol e musculao, 18
futebol e natao e 3 praticam as trs modalidades. Se um desses estudantes sorteado ao acaso, qual a
probabilidade de:

a) Praticar somente musculao;

b) Praticar pelo menos um destes esportes;

c) Praticar pelo menos dois destes esportes;

d) No praticar nenhum destes esportes.

Questo 04: Trs cavalos A, B, C esto numa corrida. Sabe-se que A duas vezes mais provvel de ganhar
que B e esse duas vezes mais do que C. Determinar as probabilidades de ganhar dos cavalos A, B e C.

Questo 05: Supor uma classe onde trs alunos so considerados com capacidade de liderana, 16 no tem
essa capacidade e dois so no-classificveis. Escolhendo-se um aluno ao acaso, qual ser a probabilidade de
esse aluno ter capacidade de liderana ou ser no-classificvel.

Questo 06: Suponha que em um lote com 20 animais existem 5 doentes. Escolhem-se 4 animais do lote ao
acaso, isto , uma amostra de 4 elementos, de modo que a ordem dos elementos seja irrelevante.
Considerando o evento E: 2 doentes na amostra, calcular P(E).

Questo 07: O jogo da Megasena consiste em escolher 6 dezenas dentre as 60 dezenas (01, 02,..., 60). Qual
a probabilidade de um jogador ganhar o prmio mximo com um nico jogo de 6 dezenas? E com um nico
jogo de 15 dezenas?

62

4.3 - PROBABILIDADE CONDICIONAL


a probabilidade de ocorrncia de um evento submetida a ocorrncia de um outro evento.
Muitas vezes existe o interesse em determinar a probabilidade de um evento B, dado que j se conhece o
resultado de um evento A;
Exemplo:

Num experimento em que um dado lanado duas vezes, sabe-se que a soma dos dois resultados
vale 9. Qual a probabilidade de que o primeiro resultado tenha sido 6?

a probabilidade de uma pessoa ser hipertensa varia segundo o estado nutricional dela. Os obesos
tm maior probabilidade de hipertenso comparados com os no obesos.

A notao : P(A|B) e se l da seguinte maneira: Probabilidade de ocorrer o evento A dado que ocorreu o
evento B.
Neste caso, a ocorrncia do evento B um fato. No existe incerteza a esse respeito. A incerteza est
restrita ocorrncia do evento A.

Expresso formal da probabilidade condicional:


(|) =

( )
()

(|) =

( )
()

Exemplo 07: Os dados abaixo se referem a 200 alunos matriculados em determinado Instituto de
matemtica, de acordo com o sexo e o curso:
Matemtica Pura
Estatstica
Total

Masculino
60
80
140

Feminino
50
10
60

Total
110
90
200

63

Sejam os eventos: A = {aluno faz matemtica pura}


E = {aluno faz estatstica}
M = {aluno do sexo masculino}
F = {aluno do sexo feminino}

Qual seria a probabilidade de uma pessoa aleatoriamente escolhida:


a) Estar matriculada em matemtica pura?
() =

b) Estar matriculada em matemtica pura, dado ser homem?

( )

(|) =
=
=

()

c) Ser homem?
() =

d) Ser homem dado que est matriculado em estatstica?


( )
(|) =
=
()

e)

Estar matriculada em matemtica pura, sabendo-se que mulher?


( )
(|) =
=
()

OBSERVAO: No caso de probabilidade condicionada, vrios postulados da probabilidade so satisfeitos,


isto :
1) (|)
2) (|) = 1
3) [( |) = ( |) + ( |) ( |)
OU
[( |) = ( |) + ( |) , se =
64

4.4 - REGRA DO PRODUTO E INDEPENDNCIA ENTRE EVENTOS


1/4

O produto de probabilidades est


eventos. a probabilidade de
simultaneamente.
Sai diretamente da probabilidade
( ) = (|). ()

B
2/5

3/4

2/4
3/5

B
relacionado coma a intercesso de
V ocorrerem os eventos A e B
B

condicional:

V
2/4

( ) = (|). ()
Essa regra de grande utilidade na verificao de dependncia entre eventos envolvidos.
Dois eventos so considerados independentes quando a ocorrncia de um no influencia na ocorrncia ou
no ocorrncia do outro;
Logo, se dois eventos, A e B, so INDEPENDENTES tem-se:
P(A|B) = P(A) e P(B|A) = P(B);
Ou seja, P(AB) = P(A) x P(B)
OBS: os termos mutuamente exclusivos e independentes no so sinnimos; basta lembrar que eventos
mutuamente exclusivos no possuem interseco.

Exemplo 08: Uma urna contm 2 bolas brancas (B) e 3 vermelhas (V). Suponha que sorteamos duas bolas ao
acaso sem reposio.

a primeira retirada tem as seguintes probabilidades:


P (B) = 2/5 e P (V) = 3/5

a segunda retirada ter probabilidades diferentes, de acordo com o que foi selecionado na primeira,
portanto, ter as seguintes probabilidades:
P (B|B) = 1/4 , P (B|V) = 2/ 4 , P (V|B) = 3/4 e P (V|V) = 2/4

Essas probabilidades so representadas no diagrama a seguir.


Diagrama em rvore para a extrao de duas bolas de
uma urna, sem reposio.

65

As probabilidades conjuntas da primeira e segunda retirada:


P(B, B) = P (B).P (B|B) = 2/5 1/4 = 2/20
P(B, V) = P (B).P (V|B) = 2/5 3/4 = 6/20
P(V, B) = P (V).P (B|V) = 3/5 2/4 = 6/20
P(V, V) = P (V).P (V|V) = 3/5 2/4 = 6/20

Exemplo 09: Uma urna contm 2 bolas brancas (B) e 3 vermelhas (V). Suponha que sorteamos duas bolas ao
acaso com reposio. Nesse caso, as retiradas so independentes, ou seja, a primeira retirada no influencia
nas possibilidades de resultados da segunda retirada.

a primeira retirada tem as seguintes probabilidades:


P (B) = 2/5 e P (V) = 3/5

a primeira retirada tem as seguintes probabilidades:


P (B|B) = 2/5 , P (B|V) = 2/5 , P (V|B) = 3/5 e P (V|V) = 3/5

Essas probabilidades so representadas no diagrama abaixo.


Diagrama em rvore para a extrao de duas bolas de
uma urna, com reposio.

2/5

Note que P(B|) = P(B) e P(V|) =


2/5

P(B, V) = P(B) P(V|B) = P(B) P(V) =

P(V, V) = P(V) P(V|V) = P(V) P(V) =

P(V), Portanto:
3/5

P(B, B) = P(B) P(B|B) = P(B) P(B) =

P(V, B) = P(V) P(B|V) = P(V) P(B) =

2/5
3/5

2/5 2/5 = 4/25

2/5 3/5 = 6/25

3/5 2/5 = 6/25


3/5

3/5 3/5 = 9/25

66

EXERCCIOS (Resolvidos em sala)

Exerccio 01: Considere as situaes dadas abaixo. Identifique se os eventos so mutuamente exclusivos ou
independentes.
a) Evento A: O 1 filho de um casal ser menina; Evento B: O 2 filho de um casal ser menina.
b)

Evento A: Um indivduo, de determinada populao, ter o tipo sanguneo A; Evento B: Um indivduo,


de determinada populao ter o tipo sanguneo O.

c) Considere dois eventos, A e B, dado que P(A)= 0,8, P(B) = 0,5 e P(A B) = 0,4.

Exerccio 02: A tabela a seguir mostra a relao entre dois sintomas que costumam aparecer em pessoas com
uma determinada doena. A amostra est formada por 266 pessoas com a doena.

a) Qual a probabilidade de um paciente ter o sintoma A?

b) Qual a probabilidade de um paciente, que tem o sintoma B, ter o sintoma A?

Exerccio 03: Em um estudo feito com 25 pessoas, foram coletadas informaes sobre o estilo de vida de
cada um (sedentrio ou no) e sobre o peso de cada um (obeso ou no). Foi observado 8 pessoas obesas e
12 sedentrias; dentre as 8 pessoas obesas, 6 foram classificadas como sedentrias. Qual a probabilidade de:

a) Um indivduo ser obeso ou sedentrio;

b) Um indivduo ser sedentrio e obeso;

c) Um indivduo ser sedentrio dado que ele obeso;

d) Um indivduo ser obeso dado que ele sedentrio;

67

Exerccio 04: Sejam A e B eventos com P(A) = , P(A U B) = 1/3 e P(B) = p. Encontre p
nos seguintes casos:
a) Se A e B so mutuamente exclusivos.

b) Se A e B so independentes.

4 Lista de Exerccios - Probabilidade

1.

Em uma escola, as turmas A, B e C tm 40, 50 e 10 % do total de alunos de determinada srie,


respectivamente. Dos alunos de cada turma, 3, 5 e 2%, respectivamente, so reprovados. Escolhido ao
acaso um aluno dessa srie, pede-se:
a) Qual a probabilidade de o aluno ser reprovado? (R: 0,039)
b) Seleciona-se ao acaso um aluno dessa escola, sabendo-se que o aluno foi reprovado, qual a
probabilidade de que ele seja da turma B? (R: 0,641)

2.

Suponha duas estaes metereolgicas A e B, em certa regio. As observaes mostraram que a


probabilidade de chuva em A 0,55 e em B 0,4. A probabilidade de ocorrncia de chuva simultnea
nas duas regies 0,25. A partir destas informaes, determine a probabilidade de:
(a) No ocorrer chuva em A; (R: 0,45)
(b) Ocorrer chuva em pelo menos uma das duas regies A ou B. (R: 0,70)

3.

4.

Sejam P(A)=0,50, P(B)=0,40 e P(A B)=0,70.


a) A e B so eventos mutuamente exclusivos? Por qu?
b) A e B so eventos independentes? Por qu?
c) Calcule P(A|B) e P(B|A). (R: 0,50 e 0,40)
A probabilidade de um aluno A resolver uma questo de prova de 0,8, enquanto que a do outro B
resolv-la 0,6. Qual a probabilidade da questo ser resolvida se ambos tentam resolv-la
independentemente. (R: 0,92)

5.

A firma X apresentou proposta para um projeto de construo. Se o principal concorrente apresentar


proposta, h 25% de probabilidade da firma X ganhar a concorrncia. Se a concorrente no apresentar
proposta, h 2/3 de chances da firma X ganhar. A chance de a concorrente apresentar proposta de
60%.
a) Qual a probabilidade da firma X ganhar a concorrncia? (R: 0,4167)
b) Se a firma X ganhou, qual a probabilidade de a concorrente ter apresentado proposta? (R: 0,36)

6.

De sua turma de 30 alunos, escolhida uma comisso de 3 representantes. Qual a probabilidade de


voc fazer parte da comisso? (R: 1/10)
68

7.

Se num grupo de 10 homens e 6 mulheres sorteamos 3 pessoas para formarem uma comisso, qual a
probabilidade de que essa comisso seja formada por 2 homens e 1 mulher? (R: 27/56)

8. A probabilidade de fechamento de cada rel do circuito apresentado abaixo dada por p. Se todos os
rels funcionarem independentemente qual ser a probabilidade de que haja corrente entre os
terminais L e R? (R: 2p-p4 )

9.

Um restaurante popular apresenta apenas dois tipos de refeies: salada completa ou um prato base
de carne. Considere que 20% dos fregueses do sexo masculino preferem a salada, 30% das mulheres
escolhem carne, 75% dos fregueses so homens e os seguintes eventos:
H: fregus homem
A: fregus prefere salada
M: fregus mulher

B: fregus prefere carne.

Para um fregus sorteado ao acaso desse restaurante, calcule:

a)
b)
c)

P(H), P(A|H), P(B|M); R. 0,75 ; 0,20; 0,30


P(A H ) R. 0,15;
P(M|A) R. 0,538

10. Em uma fbrica de parafusos, as mquinas A, B e C produzem 25, 35 e 40% do total produzido
respectivamente. Da produo de cada mquina 5, 4 e 2%, so defeituosos, respectivamente. Retira-se
um parafuso ao acaso e verifica-se que defeituoso. Qual o probabilidade que tenha sido produzido por
A? E por B? e por C? (R: 0,36; 0,41; 0,23)
11. As probabilidades de trs motoristas serem capazes de guiar at em casa, independentemente, com
segurana, depois de beber, so: 0,30, 0,25 e 0,20. Se decidirem guiar at em casa, aps beberem numa
festa:
a) Qual a probabilidade de todos os trs motoristas sofrerem acidentes? (R: 0,42)
b) Qual a probabilidade de pelo menos um dos motoristas guiar at em casa a salvo? (R:0,58)
12. A probabilidade de que um atleta A ultrapasse 17,30 m num nico salto triplo de 0,7. O atleta d 4
saltos. Qual a probabilidade de que em pelo menos num dos saltos ultrapasse 17,3m? (R: 0,9919)
13. O Jos est indeciso quanto compra de trs discos. Resolveu fazer o seguinte: para cada um atira
uma moeda ao ar e se sair cara compra o disco. Determine a probabilidade de:
a) no comprar nenhum; (R: 1/8)
b) comprar pelo menos um; (R: 7/8)
c) comprar pelo menos dois. (R: 1/2)
14. O Joo tem 20 pares de meias e o Jos tem 16. Se escolhermos ao acaso um par de meias de cada um,
a probabilidade de ambas serem brancas 0.25. Se o Joo tem 10 pares de meias brancas quantas meias
brancas tem o Jos? (R: 8 meias brancas)
69

15. Dos ouvintes de uma estao radiofnica 37% ouvem o programa X, 53% ouvem o programa Y e 15%
ouvem ambos os programas. Ao escolher aleatoriamente um ouvinte desta estao qual a
probabilidade de que
i) Oua apenas um dos referidos programas; (R: 0,6)
ii) No oua nenhum destes dois programas. (R: 0,25)
16. A tabela a seguir apresenta dados dos 1000 ingressantes de uma universidade, com informaes
sobre rea de estudo e classe scio econmica.
rea\Classe
Exatas
Humanas
Biolgicas

Alta
120
72
169

Mdia
156
85
145

Baixa
68
112
73

Se um aluno ingressante escolhido ao acaso, determine a probabilidade de:


a)
b)
c)
d)

Ser da classe econmica mais alta.


Estudar na rea de exatas.
Estudar na rea de exatas e ser da classe mdia.
Ser da classe baixa, dado que estuda na rea de biolgicas.
Resp. a) 0,361 b) 0,344 c) 0,156

d) 0,189

17. - Em um lote de 12 peas, 4 so defeituosas. Sendo retirada aleatoriamente 2 peas, calcule:


a) A probabilidade de ambas serem defeituosas.
b) A probabilidade de ambas no serem defeituosas.
c) A probabilidade de ao menos uma ser defeituosa.
Resp. a) 1/11

b) 14/33

c) 19/33

18. Duas lmpadas ruins so misturadas com 2 lmpadas boas. As lmpadas so testadas uma a uma, at
que as 2 ruins sejam encontradas. Qual a probabilidade de que a ltima ruim seja encontrada no:
a) Segundo teste;
b) Terceiro teste;
c) Quarto teste.

Resposta: a) 1/6

b) 1/3

c)

19. Uma pessoa joga um dado. Se sair 6, ganha a partida. Se sair 3, 4 ou 5, perde. Se sair 1 ou 2, tem direito
de jogar novamente. Desta vez, se sair 4, ganha, e se sair outro nmero, perde. Qual a probabilidade de
ganhar? (R: 2/9)

UNIDADE V - Varivel aleatria

O conjunto de todos os possveis resultados de um experimento aleatrio o espao amostral. Os


elementos desse conjunto podem ser numricos ou no.
Por exemplo, se o experimento for escolher um aluno de uma turma e registrar sua altura, teremos um
conjunto numrico, porm se indagarmos o time de futebol preferido do aluno, teremos um conjunto no
numrico.
70

Considere o espao amostral do lanamento de um dado e observao da face superior: S = {1, 2, 3,


4, 5, 6}. O espao constitudo por nmeros reais.
Considere o espao amostral do lanamento de uma moeda e observao da face superior: S = {c, k}.
Neste caso o espao amostral no constitudo por nmeros reais.
Considere o espao amostral de todas as possveis alturas de pessoas, o intervalo real [1,50, 1,90].
Neste caso o espao amostral contm pontos amostrais que formam uma continuidade.

Como em muitas situaes experimentais precisamos atribuir um nmero real x a todo elemento do espao
amostral, vamos definir o conceito de varivel aleatria.

Varivel aleatria (v.a) uma varivel que tem um valor numrico nico, para cada resultado de um
experimento.
Sejam E um experimento aleatrio e S o espao amostral associado ao experimento. Uma funo X,
que associe a cada elemento s S um nmero real X(s) denominada varivel aleatria.

S
s

R
X

X(s)

Varivel aleatria
Exemplo 01:
E: lanamento de duas moedas
X: nmero de caras obtidas nas duas moedas
S = {(ca,ca),(ca,co),(co,ca),(co,co)}
X = 0: corresponde ao evento (ca,ca)
X = 1: corresponde ao evento (co,ca), (ca,co)
5.1. VARIVEL ALEATRIA DISCRETA (v.a.d.)

Dizemos que a varivel discreta X aleatria se a cada um de seus possveis valores se associa uma
probabilidade P(x).
5.1.1 Funo de probabilidade da varivel aleatria discreta

71

uma funo que associa a cada valor assumido pela varivel aleatria a probabilidade do evento
correspondente. O conjunto dos valores da varivel e das respectivas probabilidades, isto , o conjunto dos
valores Xi e P(Xi), com i = 1,...,n, uma distribuio de probabilidade de X.
Seja X uma v. a. discreta, a probabilidade da varivel aleatria X assumir um valor particular x, a funo de
probabilidade X que se representa por P(X = x). A funo P(X = x) constitui uma Distribuio de
probabilidades desde que:
1. 0 () 1,
2. 1 ( ) = 1, onde x toma todos os valores possveis.

Exemplo 02: E: Lanamento de trs moedas.


X: N de caras obtidas em trs lanamentos.
S = {(C,C,C), (C,C,K), (C,K,C), (K,C,C), (C,K,K), (K,C,K), (K,K,C), (K,K,K)}

A distribuio de probabilidade da v. a. X dada por:


X

P(x)

1/8

3/8

3/8

1/8

Distribuio de Probabilidades
72

Pode-se verificar o que est ocorrendo com um conjunto de dados utilizando tabelas, grficos, medidas de
tendncia central e medidas de variao. Combinando esses conceitos com os da Teoria das Probabilidades
podemos definir as Distribuies de Probabilidades, que descrevem o que provavelmente acontecer, em
lugar do que efetivamente aconteceu.
Toda Distribuio de Probabilidade deve ser apresentada por:
Tabelas

Grficos

Modelo (Equao)

Exemplo 03: Seja ( = ) =

,
2

= 0, 1, 2 3. Qual o valor da constante K para que P(X = x) seja uma

D.P?

Dado que 1 ( ) = 1, temos:


( = 0) + ( = 1) + ( = 2) + ( = 3) = 1
0
1
2
3
+
+
+
=1
2 2 2 2

6
=1
2

Logo, a equao P(X = x) =

x
,
6

=3

para x = 0, 1, 2 e 3 uma distribuio de probabilidade.

73

Exemplo 04: Considere o experimento que consiste em sortear duas bolas de uma urna que contm 3 bolas
brancas (B) e 2 pretas (P). Montar a distribuio de probabilidade de X para os casos: com reposio e sem
reposio.
Seja X o nmero de bolas pretas na amostra.

Com reposio:

Sem reposio:

5.1.2 Mdia (ou valor esperado) e varincia de uma varivel aleatria discreta

Valor esperado E(X) uma medida de tendncia da varivel aleatria X.


A mdia de uma varivel aleatria discreta o resultado mdio de um nmero infinito de provas. Podemos
encarar essa mdia como o valor esperado no sentido de que o valor mdio que esperaramos obter se as
provas se prolongassem indefinidamente.

A sua expresso matemtica a seguinte:


74

E ( X ) x1 p( x1 ) x2 p( x2 ) ... xn p( xn )
E ( X ) xP( x)

Assim:

tambm chamada de esperana matemtica ou mdia.

ALGUMAS PROPRIEDADES DA ESPERANA MATEMTICA

1) E(k) = k

k = constante

2) E(kX) = k E(X)
3) E(X + k) = E(X) + k
4) E(X Y) = E(X) E(Y)

Exemplo 05: Considere que o valor de venda de um determinado imvel pode alcanar os valores a seguir,
com as respectivas probabilidades de ocorrncia:

Qual o valor esperado do preo de venda deste imvel?


O valor esperado ser, ento, igual a:
n

E ( X ) xi P( xi )
i 1

(180.000 * 0,15) (215.000 * 0,30) (250.000 * 0,45) (280.000 * 0,10)


232.000,00

Isso significa que se este imvel fosse vendido um infinito n de vezes, a mdia dos seus valores de venda
seria igual a $232.000,00. Uma outra interpretao seria a de que se um n infinito de imveis desse mesmo
tipo fosse vendido, o valor mdio do preo de venda seria $ 232.000,00.

75

5.1.3 - Varincia de uma Varivel Aleatria Discreta

A varincia para uma distribuio de probabilidades dada por:

2 = ( )2 ( )

() = [ ()]2 ( )

Podendo ser reescrita como:

VAR ( X ) E( X 2 ) [ E( X )]2
O desvio padro ( ou S) da varivel aleatria da v.a. discreta dado por:

2 VAR ( X )

Propriedades da Varincia
1) VAR (k) = 0

k = constante

2) VAR (kX) = k2 . VAR (X)


3) VAR (X Y) = VAR (X) + VAR(Y)

(se X e Y independentes)

4) VAR (aX b) = a2 VAR (X)

No caso do Desvio padro:

S ( X Y ) VAR ( X ) VAR (Y ) (o desvio padro da soma das variveis X e Y no a soma dos


1)
desvio da varivel X mais o desvio da varivel Y)
2) S(X + k) = S(X)
3) S(kX) = k . S(X)
Clculo da Varincia de X a partir do seu Valor Esperado

Exemplo 06: Considere que o nmero de reclamaes recebidas diariamente em uma determinada empresa
de telefonia segue a seguinte distribuio de probabilidades:

76

Determine a varincia do n de reclamaes dirias.


O valor esperado do n de reclamaes dirias ser igual a:

E X xi . p( xi ) 1 0,10 2 0,30 3 0,35 4 0,25 2,75

O valor esperado do quadrado do n de reclamaes dirias ser igual a:

E X 2 x 2 p( xi ) 1 0,10 22 0,30 32 0,35 42 0,25 8,45

A varincia do n de reclamaes dirias ser igual a:

VAR ( X ) E ( X ) E ( X ) 8,45 2,75 0,8875


2

Tambm podemos calcular o desvio e o coeficiente de variao:

S ( X ) VAR ( X ) 0,8875 0,942

CV ( X )

S(X )
0,942
*100
*100 34,2%
E( X )
2,75

Exemplo 07: Considere que numa grande rede de computadores, em 60% dos dias ocorre alguma falha.
Construir a distribuio de probabilidades e calcular as medidas de posio e disperso para a varivel
aleatria X = nmero de dias com falhas na rede, considerando o perodo de observao de trs dias.
(Suponha independncia.)
Espao amostral: S = {(B,B,B), (B,B,R), (B,R,B), (R,B,B), (B,R,R), (R,B,R), (R,R,B), (R,R,R)}

Obtendo a distribuio de probabilidade de X:

Tabela e grfico de distribuio de probabilidade de X:


77

E X xi p( xi ) 0 * (0,064) + 1* (0,288) + 2 * (0,432) + 3 * (0,216) = 1,8

V X xi p( xi ) (0 - 1,8)(0,064) + (1 - 1,8)(0,288) + (2 - 1,8)(0,432) + (3 - 1,8)(0,216) 0,72


2

S ( X ) V X 0,72 0,848

O nmero esperado de dias com falha na rede E(X)= 1.8, ou seja, aproximadamente 2 dias. Apresentando
um desvio padro de 0,848.

EXERCCIOS (Resolvidos em sala)

1 - Em um lote com 4 peas, das quais 2 so defeituosas retira-se ao acaso duas peas, com reposio.
Considere X o nmero de peas defeituosas nas duas retiradas. Construa a distribuio de probabilidade para
a varivel X e calcule E(X).

2 - Dada a seguinte distribuio de probabilidades:

a) Ache A.
b) Calcule P(X 4).
c) Calcule P(X 3).

78

3 - O nmero de mensagens enviadas por hora, atravs de uma rede de computadores, tem a seguinte
distribuio:
X=
Nmero
mensagens
f(x)

de

10

11

12

13

14

15

0,08

0,15

0,30

0,20

0,20

0,07

Determine a mdia e o desvio padro do nmero de mensagens enviadas por hora.

6.2. VARIVEL ALEATRIA CONTNUA (v.a.c.)

O estudo de uma varivel aleatria contnua anlogo ao das variveis discretas.


Uma varivel aleatria contnua X pode assumir infinitos valores ou qualquer valor no intervalo de sua
definio.
Dessa forma, a probabilidade estimada para um intervalo de valores e no pontualmente P(X=x) como no
caso discreto. Assim, as probabilidades calculadas sero do tipo P(x1 < X < x2), e interpretadas como a rea
entre x1 e x2 de uma curva de probabilidades para os possveis infinitos valores da varivel.

Assim a probabilidade de uma v. a. contnua assumir um determinado valor (probabilidade no ponto [P(X=x)]
) nula, pois a rea embaixo de um ponto igual a zero.
Para identificar uma distribuio contnua, existe a funo densidade de probabilidade, que uma equao
do tipo y = f(x).

79

Exemplo 08: Uma metalrgica produz uma pea cujo comprimento varia aleatoriamente entre 5cm e 7cm.
No possvel neste caso representar toda distribuio de probabilidade em uma tabela, pois h infinitos
valores. Como h infinito valores, mas a soma de todas as probabilidades continua sendo 1, conclui-se que a
probabilidade de um valor definido zero !!
S faz sentido falarmos em probabilidades intervalares.

Por exemplo:
Probabilidade do comprimento estar entre 5,2cm e 5,3cm. P( 5,2<x<5,3 )
Probabilidade do comprimento ser menor que 6,0cm. P( x<6,0 )
Probabilidade do comprimento ser maior que 6,5cm. P( x>6,5 )

6.2. 1 Funo de Densidade de Probabilidade (fdp)

Uma funo densidade de probabilidade f(x) pode ser usada para descrever uma distribuio de
probabilidades de uma varivel aleatria contnua X.
Funes de densidade so usadas na engenharia para descrever sistemas fsicos, como por exemplo, a
densidade de uma carga em uma viga longa e delgada.

Definio: Para uma varivel aleatria contnua X, uma funo densidade de probabilidade (fdp) uma
funo tal que:

a) f ( x) 0 para todo x ]-, [;


b) A rea definida por f(x) igual a 1;

f ( x)dx 1 ;

c) P (a X b)

f ( x)dx = a rea sob f(x) para quaisquer a, b, com a b .


a

80

Obs.:
* 0 P ( a X b) 1
* P( X x) 0
* P ( a X b) P ( a X b) P ( a X b) P ( a X b)

Exemplo 09: Suponha que o erro medido na temperatura de reao (C) em um experimento controlado em
laboratrio seja uma v.a. contnua cuja fdp dada por:

1
x se 1 x 2
f ( x) 3
0, caso contrrio
a) Verifique se f(x) satisfaz a condio para ser uma fdp.

1
x 2 2 (1)
x dx |
0,8889 0,1111 1
1 3
9 1 9
9

Satisfaz, pois

f ( x)dx 1

b) Calcule P[0 < X 1].

1
x 1 1 (0)
x

dx

| 9 9 0,1111 0 0,1111 ou 11,11%


0 3
9 0
1

Exemplo 10: Uma varivel X tem distribuio triangular no intervalo [0,1] se sua f.d.p for dada por:
0

() = {
(1 )
0

< 0
0 1/2
1/2 1
> 1

a) Qual valor deve ter a constante C?

Devemos escolher C de modo que f(x) satisfaa:


(i)
f(x) 0 para todo x

(ii)

f ( x)dx 1

81

1/ 2

1/ 2

f ( x)dx 0dx Cxdx C (1 x)dx 0dx


1/ 2

C xdx
0

(1 x)dx

1/ 2

1
x
x

C x
2 0
2 1 / 2

1 1 1 C
1
C 1
2 2 8 4
8
1/ 2

C4

b) Determine P( X 1/2), P(X > 1/2) e P(1/4 X < 3/4).

1/ 2

1
P( X ) f ( x)dx
2

1/ 2

4 xdx 2

1
1
1 1
P( X ) f ( x)dx 1 P( X ) 1
2 1/ 2
2
2 2

3/ 4

1/ 2

3/ 4

1
3
3
P( X ) f ( x)dx 4 xdx 4(1 x)dx
4
4 1/ 4
4
1/ 4
1/ 2

5.2.2 Mdia (ou valor esperado) e varincia de uma varivel aleatria contnua

A mdia e a varincia de uma v.a. contnua so definidas de modo similar a uma v.a. discreta. A integrao
substitui a soma nas definies.

Definio: Suponha que X seja uma v. a. contnua com uma funo densidade de probabilidade f(x).

A mdia ou o valor esperado de X, denotado por ou E(X)

E( X )

x f ( x)dx

2
A varincia de X, denotada por ou VAR(X), :

82

2 E X 2 E ( X ) 2

onde

E( X )
2

f ( x)dx

Exemplo 11: Suponha que f(x) = 0,125x para 0 < X < 4. Determine a mdia e a varincia de X.

f ( x)dx 0,125xdx 0,125x / 2| 1

E ( X ) xf ( x)dx 0,125x dx

0,125x 4 8
|0 3
3

0,125x 4 4
E ( X ) x f ( x)dx 0,125xdx
|0 8

0
4

8
VAR ( X ) E ( X ) E ( X ) 8 ( ) 0,89
3
Exerccios (Resolvidos em sala)

2 x 3 se 0 x 2
0, se x 0 ou x 2

1. Verificar se f ( x)

uma fdp.

1
(2 x 3) se 0 x 2
2. Verificar se f ( x) 10
0, se x 0 ou x 2

uma fdp.

83

3. Seja uma v.a. X a corrente em um fio delgado de cobre, medida em miliampres. Suponha que a faixa de
X seja [0;20] e considere que a funo densidade de probabilidade de X seja f ( x) 0,05 para 0 x 20
. Qual a probabilidade de que uma medida da corrente seja menor 10 miliampres?

4. Suponha que o tamanho de uma partcula de contaminao possa ser modelado como f ( x) 2 x 3 para
1 < X. Determine a mdia de X.

6.3 - Funo de Distribuio acumulada

A funo de distribuio acumulada nos d uma maneira de descrever como as probabilidades so associadas
aos valores ou aos intervalos de valores de uma varivel aleatria.
a funo que acumula as probabilidades dos valores inferiores ou iguais a x.

Definio: A funo de distribuio acumulada de uma varivel aleatria X uma funo que a cada
nmero real x associa o valor:

F(x) para varivel aleatria discreta:

F ( x) P[ X x] P[ X xi ]
xi x

F(x) para varivel aleatria contnua:


x

F ( x) P[ X x] P( X x) f (t )dt

Para cada x, FX (.) corresponde rea debaixo da curva de fX (.) esquerda de x.

OBS:
84

i)
ii)

FX(.) pode ser obtida a partir de fX(.) e vice-versa.


A derivada da funo de distribuio acumulada de uma varivel contnua e a funo de
densidade, ou seja, () =

iii)

()

P(a < X b) = P(X b) P(X a) = F(b) F(a)

Exemplo 12: Suponha que uma varivel aleatria discreta X tenha a seguinte distribuio de probabilidade.

Temos, ento:
(1) = ( 1) = ( = 1) = 0,1
(2) = ( 2) = ( = 1) + ( = 2) = 0,3
(3) = ( 3) = ( = 1) + ( = 2) + ( = 3) = 0,1 + 0,2 + 0,4 = 0,7
(4) = ( 4) = ( 3) + ( = 4) = 0,7 + 0,2 = 0,9
(5) = ( 5) = ( 4) + ( = 5) = 0,9 + 0,1 = 1

Podemos calcular tambm:

(1,34) = ( 1,34) = ( 1) = (1) = 0,1


(3,98) = ( 3,98) = ( 3) = (3) = 0,7
(7) = ( 7) = ( 5) = (5) = 1
(3) = ( 3) = 0
Com esses resultados podemos representar das seguintes formas:

Funo

Grfico

85

Exemplo 13: Suponha que o erro medido na temperatura de reao (C) em um experimento controlado em
laboratrio seja uma v.a. contnua cuja fdp dada por:

1
x se 1 x 2
f ( x) 3
0, caso contrrio
a) Determine a fda para a v.a.

X = erro na medida da temperatura de reao

0
, se x 1
x
1
x

FX ( x) t dt
, se 1 x 2
1 3
9

1
, se x 2

b) Usando F(x), calcule P[0 < X 1]

P[0 x 1] P[ x 1] P[ x 0] FX (1) FX (0) 0,1111 0 0,1111


1
0,1111
9
0
FX (0) 0
9
FX (1)

Exerccios (Resolvidos em sala)

1 - Verifique se as seguintes funes so funes de probabilidade e determine as probabilidades


requeridas:

86

a) P(X 2)
b) P(X > - 2)
c) F(2) F(-1)
d) F(0)
e) Construir a funo de distribuio acumulada.

2 - Seja

uma varivel contnua com f.d.p. dada por:

a) Construa a funo de distribuio acumulada.


b) Obtenha F(0,5), P(0,5 < X < 0,8)
5 Lista de Exerccios Variveis Aleatrias

1. Uma turma de Estatstica compreende 3 canhotos e 24 destros. Selecionam-se aleatoriamente dois


estudantes diferentes para um projeto de coleta de dados, representando-se por X o nmero de estudantes
canhotos escolhidos. Obtenha a distribuio de probabilidades de X, calcule a mdia, a e o desvio padro da
varivel aleatria X.
Resp: E(X) = 6/27
S(X) = 4/9

2. Se uma v.a. X apresenta E(X) = 20 e VAR(X)=3, calcule:

a) VAR(2X)
Resp: 12
b) E(2X)
Resp: 40
c) E(2X +10)
Resp: 50
c) VAR(5X-10)
Resp: 75
d) VAR(2/5X - 4) Resp: 0,48

3. Uma confeitaria estabeleceu um registro de vendas (tabela abaixo) para certo tipo de bolo. Determine o
nmero esperado de bolos encomendados.
N de bolos/dia
0
1
2
3
4
5
6
7
8
9
87

Freq. Relativa

0,02

0,07

0,09

0,12

0,20

0,20

0,18

0,10

0,01

0,01

Resp: E(X) = 4,36

4. Um jogador lana um dado. Se aparecerem os nmeros 1, 2 ou 3, recebe R$ 10,00. Se, no entanto,


aparecer 4 ou 5, recebe R$ 5,00. Se aparecer 6, ganha R$ 20,00. Qual o ganho mdio do jogador?
Resposta: R$ 10,00

5. As probabilidades de que haja 1, 2, 3, 4, ou 5 pessoas em cada carro que v ao litoral num sbado so,
respectivamente: 0,05; 0,20; 0,40; 0,25 e 0,10. Qual o nmero mdio de pessoas por carro? Se chegam no
litoral 4000 carros por hora, qual o nmero esperado de pessoas, em 10 horas de contagem?
Resposta: 3,14 pessoas; 126.000 pessoas.
6. A funo de probabilidade da varivel aleatria X : P(X) = 1/5, para X = 1, 2, 3, 4, 5. Calcular E(X) e E(X),
e usando esses resultados, calcular:
a)
b)

E(X+3)
VAR(3X 2)
Resposta: a) 38

b) 18

7. Seja X uma varivel aleatria discreta com a seguinte distribuio de probabilidades:

a)
b)
c)

Calcule E(X) e VAR(X)


Determine a funo de distribuio acumulada de X.
Calcule P(X 0 | X<2). ( Resp. 0,3)

8. Considere a varivel aleatria discreta X com a seguinte funo de probabilidade:


,
= 1, 2, 3
( = ) = {
0,

Sendo a uma constante real. Calcule a e defina a funo de distribuio de X.
(a=1/6)
9. O nmero de televisores encomendados mensalmente em determinada loja bem descrito por uma
varivel aleatria X com a seguinte funo de distribuio acumulada:

a) Determine a funo distribuio de probabilidades da varivel aleatria X.


88

b) Quantos televisores deve ter a loja em stock, por ms, para que a probabilidade de satisfazer todas
as encomendas seja superior a 0,95? (Resp. 3 ou mais)

10. Seja X a durao da vida (em horas) de um certo componente eletrnico. Admitindo que X seja contnua
e com fdp:

() = { 3 ,

1500 2500;
0,

a) Determine a constante k.
Resp: k=7031250
b) Calcular (2200 2500). Resp: 0,1639
c) Calcule E(X).
Resp: 1875

89

UNIDADE VI - Distribuio de probabilidades


Na prtica as distribuies de probabilidades so usadas para resolver problemas. Os tipos de distribuies
podem ser considerados modelos para descrever situaes que envolvem resultados gerados pela chance.

Existem muitos problemas parecidos, ento poucos modelos solucionam uma grande quantidade de
problemas. Ex.: a jogada de moedas para o ar e n de itens defeituosos numa remessa de peas recaem sobre
o mesmo modelo de probabilidade. A constatao desse fato levou o desenvolvimento de tcnicas
padronizadas para a resoluo de muitos problemas diferentes.

Cada distribuio de probabilidade tem um conjunto de hipteses que devem ser verificadas para se utilizar
o modelo.

O uso da distribuio de probabilidade consiste em comparar as hipteses do tipo da distribuio com as


caractersticas do problema real.

Verificada a correspondncia, o problema enquadrado em uma classe de distribuio de probabilidade e


resolvido sempre da mesma maneira.

6.1. Distribuies Discretas de Probabilidades


As distribuies discretas envolvem variveis aleatrias relativas a dados que resultam de contagem, como
o n de ocorrncias por amostra, n de ocorrncias por intervalo de tempo, de rea, ou distncia.

6.1.1 Distribuio Binomial

O termo binomial designa situaes em que os resultados de uma v.a. podem ser agrupados em duas
categorias (os dados so, pois, nominais). Exemplo: em processos industriais as peas falham ou no falham;
em medicina o paciente sobrevive ou morre; em marketing o consumidor reconhece um produto ou no.

Definio: um experimento binomial satisfaz as seguintes condies:

O experimento deve ser repetido, sob as mesmas condies um n finito de vezes (n);
As repeties devem ocorrer de forma independente;
Cada repetio possui dois resultados possveis: sucesso (p) e fracasso (q = 1- p);
As probabilidades devem permanecer constantes para cada repetio.

90

Exemplo 01: Imagine uma mquina de confeccionar parafusos. Dos parafusos fabricados por essa mquina,
2% saem com algum tipo de defeito (esta uma caracterstica da mquina). Suponha que a produo dessa
mquina lanada ininterruptamente em uma esteira, e que dessa esteira so retirados 10 parafusos.

Para variveis com essa distribuio resolvemos problemas do tipo: determinar a probabilidade de
se obter k sucessos em n tentativas.

Seja X nmero de sucessos em n tentativas. A funo de probabilidade da varivel X dada por:

( = ) = . . (1 ) ;

!
! ( )!

Notao: X: B (n, p).

p: probabilidade de sucesso em uma das repeties;


(1-p): probabilidade de fracasso em uma das n repeties;
n: nmero de repeties;
k: n de sucessos em n repeties, pode ser qualquer inteiro entre 0 e n, inclusive;
P (X = k): a probabilidade de obter k sucessos em n repeties.

Mdia e desvio padro de uma varivel binomial:


Mdia = n.p
Desvio padro =

n p (1 p )

Exemplo 02: Acredita-se que 20% dos moradores das proximidades de uma grande indstria siderrgica tem
alergia aos poluentes lanados ao ar. Admitindo que este percentual de alrgicos real (correto), calcule a
probabilidade de que pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso.
Resoluo:
Seja X o nmero de moradores que tm alergia.
p: probabilidade de um indivduo, selecionado ao acaso, ter alergia;
p=0,2.

X ~bin (13; 0,20)

P( X x) C xn p x (1 p) n x

, x 0, 1, ..., n

91

ou seja, a varivel aleatria X tem distribuio binomial com parmetros n = 13 e p = 0,20, com funo de
probabilidade dada por:
x
13 x
P( X x) C 13
x p q

Assim, a probabilidade de que pelo menos 4 moradores tenham alergia dada por:

P(X 4) = P(X=4) + P(X=5) + + P(X=13)


Ou
P(X 4) = 1 - P(X3)

Clculos:

P(X 4) = P(X=4) + P(X=5) + + P(X=13) = 0,1535 + 0,0690 + + 0,0000 = 0,2529


Ou
P(X 4) = 1 - P(X 3) = 1 [P(X=0) + P(X=1) + P(X=2) + P(X=3)]=1 (0,7471) = 0,2529

Exemplo 03: Uma companhia perfuradora de poos de petrleo faz 5 perfuraes. Sabendo-se que cada
tentativa tem probabilidade 0,3 de encontrar petrleo, qual a probabilidade de se encontrar petrleo em
dois poos?
Y= N de poos com petrleo.
p= 0,3

P(Y y ) C x5 0,3 y 0,7 5 y

( = ) = (, ) (, ) = , = , %
Ou seja, em 30,9% das vezes que 5 perfuraes forem feitas, ser encontrado petrleo em 2 poos.
92

Exerccios (Resolvidos em sala)

1. Considere que uma auditoria em uma empresa de vendas a crdito levantou que 30% dos clientes estavam
com suas prestaes atrasadas. Determine a probabilidade de que, em 10 clientes escolhidos
aleatoriamente, 4 estejam com suas prestaes em atraso. E calcule a mdia e o desvio padro.

2. Cada amostra de ar tem 10% de chance de conter uma certa molcula rara. Considere que as amostras
sejam independentes com relao presena da molcula rara. Encontre a probabilidade de que nas
prximas 18 amostras, pelo menos 2 contenham a molcula rara.

3. A chance de que um bit transmitido atravs de um canal digital de transmisso seja recebido com erro
de 0,1. Suponha tambm que as tentativas de transmisso sejam independentes. Faa X = nmero de bits
com erro nos prximos quatro bits transmitidos. Determine P(X = 2).

6.1.2. Distribuio de Poisson

frequentemente usada para estimar o nmero de ocorrncias sobre um intervalo de tempo ou espao.
Exemplo: Nmero de defeitos por centmetro quadrado, clientes atendidos por hora, chegada de navios
por dia no porto de Vitria.

Propriedades do experimento de Poisson:


A probabilidade de ocorrncia a mesma para quaisquer dois intervalos de igual comprimento.
O nmero de ocorrncias em qualquer intervalo independente do nmero de ocorrncias em
outros intervalos.

Ex.01 - Suponha que em uma agncia bancria entrem, em mdia, 60 clientes por hora. Qual a probabilidade
de, em 10 minutos, entrarem 4 clientes?

Observe que o sucesso entrada do cliente. A probabilidade desejada a de 4 sucessos, isto , 4 entradas
de clientes, dentro de um perodo de tempo de 10 minutos.

Ex.02 - Suponha que uma vistoria em uma estrada constatou que, em mdia, existem 10 imperfeies no seu
leito a cada 1000 metros. Qual a probabilidade de, em 100 metros, serem encontradas 2 imperfeies?

Nesse caso, o sucesso encontrar uma imperfeio no leito da estrada, e o perodo ao longo do qual se
deseja calcular a probabilidade, o espao de 100 metros.
93

Como calcular a Probabilidade:


Seja: = N mdio de sucessos no intervalo pretendido
x = N de sucessos pretendido.

Ento:

P( X x)

x e
x!

Onde: t
e = 2,71828

a razo de ocorrncia do sucesso e o t o perodo ao longo do qual se deseja calcular a


probabilidade.
Notao: X ~ Poi()

No exemplo n 1:
= 60 clientes/hora = 60 clientes/60 minutos
t = 10 minutos.

Ento:

P ( X 4)

60
10 10
60

10 4 e 10
0,0189
4!

No exemplo n 2:
= 10 imperfeies/1000 metros
t = 100 metros.

Ento: =

P( X 2)

10
100 1
1000

12 e 1
0,1839
2!

94

Parmetros da distribuio de Poisson:


Mdia =
Desvio padro =

Exemplo 03: Em um processo produtivo txtil, o nmero mdio de defeitos por m2 de tecido 0,4, variando
segundo uma distribuio de Poisson. Qual a probabilidade de que, em 2 m2 de tecido fabricado:

a)
b)

No haja defeito?
Haja no mximo 1 defeito?

Resoluo:
X = N de defeitos por m

= 0,4 defeitos/ 1 m
t=2
= t = 0,4 * 2
X ~ Poi(0,8)
.
( = ) =
!

a) ( = 0) =

0,80 . 0,8
0!

0,8 . 0,8
( = ) =
!

= 0,449

b) ( 1) = ( = 0) + ( = 1) =

0,80 . 0,8
0!

0,81 . 0,8
1!

= 0,449 + 0,359 = 0,808

Exerccios (Resolvidos em sala)

1. Estima-se que, em todo mundo, os tubares matem dez pessoas por ano. Determine a probabilidade:
a) De que trs pessoas sejam mortas por tubares este ano.
b) De que duas ou trs pessoas sejam mortas por tubares este ano.

2. Contaminao um problema na fabricao de discos pticos de armazenagem. O nmero de partculas


de contaminao que ocorrem em um disco tem distribuio de Poisson e o nmero mdio de partculas por
centmetro quadrado de superfcie mdia 0,1. A rea do disco sob estudo 100 centmetros quadrados.
Encontre a probabilidade de que 12 partculas ocorram na rea de um disco sob estudo.

95

3. O nmero de chamadas telefnicas que chegam a uma central freqentemente modelado como uma
varivel aleatria de Poisson. Considere que, em mdia, h 10 chamadas por hora.
a) Qual a probabilidade de que haja exatamente 5 chamadas em uma hora?
b) Qual a probabilidade de que haja 3 ou menos chamadas em uma hora?
c) Qual a probabilidade de que haja exatamente 15 chamadas em duas hora?
d) Qual a probabilidade de que haja exatamente 5 chamadas em 30 minutos?

6.1.3. Distribuio Hipergeomtrica

Considere uma populao com N objetos nos quais M so classificados como do tipo A e N-M so
classificados como do tipo B. Por exemplo, em um lote de 50 (N) peas temos 10 (n) peas defeituosas e 40 (NM) peas conformes. Tomamos uma amostra ao acaso, sem reposio e no ordenada de n objetos. Seja X a
varivel aleatria que conta o nmero de objetos classificados como do tipo A na amostra. Ento a
distribuio de probabilidade de X dada por:

Diremos que uma varivel aleatria X tem distribuio hipergeomtrica de parmetros M, N e n se sua funo
de probabilidade for dada da maneira acima. Denotamos X~Hiper(M, N, n).

Notas:
1. A experincia aleatria referida pode ser vista como uma sequencia de n realizaes dependentes
de uma prova de bernoulli mas com probabilidade de sucesso constante igual a p=M/N;


2. [] = e [] = 1 ;
3. Se N + com p =

M
N

fixo ento E[X] = np, Var[X] np(1 p)e ainda

( ). (
)

() ( )

( )

Exemplo 01: De um baralho com 52 cartas, retiram-se 8 cartas ao acaso, sem reposio. Qual a probabilidade
de que 4 sejam figuras?

Resoluo:
96

X: nmero de figuras em 8 cartas.


X~Hiper(12, 52, 8).

( ). (
)

( = ) =

( )

N = 52
M = 12
n=8

(
( = ) =

). ( )

= ,

( )

Exemplo 02: Uma firma compra lmpadas por centenas. Examina sempre uma amostra de 15 lmpadas
para verificar se esto boas. Se uma centena inclui 12 lmpadas queimadas, qual a probabilidade de se
escolher uma amostra com pelo menos uma lmpada queimada?

Resoluo:
X: nmero de lmpadas queimadas na amostra.
X~ Hiper(12, 100, 15).
(

M = 12

( = ) =


). (
)

(
)

n = 15
(
( 1) = 1 ( < 1) = 1 ( = 0) = 1

12
88
). ( )
0
15 = 0,8747
100
(
)
15

Exerccios (Resolvidos em sala)

1 . Suponha que 4 moedas comemorativas foram colocadas por engano em um cofrinho no qual j haviam
algumas moedas comuns, o qual ficou contendo um total de 14 moedas. Suponha que, devido a dificuldade
de tirar as moedas do cofrinho sem quebr-lo, vamos retirar ao acaso um total de 4 moedas, qual a
probabilidade de retirarmos no mnimo 2 moeda comemorativa?

2 . Uma empresa fabrica um tipo de tomada que so embalados em lote de 25 unidades. Para aceitar o lote
enviado por essa fbrica, o controle de qualidade da empresa tomou o seguinte procedimento: sorteia-se
97

um lote e desse lote selecionam-se 8 tomadas para teste, sem reposio. Se for constatado, no mximo, duas
tomadas defeituosas, aceita-se o lote fornecido pela fbrica. Se o lote sorteada tiver 6 peas defeituosas,
qual a probabilidade de se aceitar o lote?

7.2. Distribuies Contnuas de Probabilidades


Sero estudadas as seguintes Distribuies Contnuas de Probabilidades:
- Distribuio Normal
- Distribuio Exponencial

7.2.1 Distribuio Normal

A Distribuio Normal uma das mais importantes distribuies, se no a mais importante, da


Estatstica.
Ela aplicada a um grande nmero de processos aleatrios relacionados com o ser humano.
Ela tambm intensamente utilizada ao longo da Estatstica Inferencial.

Funo Densidade de Probabilidade

Seja X uma v.a.c., dizemos que X tem distribuio normal se possuir a seguinte f.d.p.:

() =
Notao: X~N(;)

()

-> X tem distribuio normal com mdia e varincia .

Representao grfica:

98

Caractersticas da Distribuio Normal

A v.a. de distr. normal pode assumir todo e qualquer valor real, definida de a .
A Distribuio Normal uma distribuio simtrica. Assim sendo, a mdia, a mediana e a moda
assumem o mesmo valor.
O ponto mais elevado da curva corresponde ao seu valor mdio.
Cada distribuio normal fica especificada por sua mdia e seu desvio padro.
A rea total sob a curva 1 e a probabilidade de ocorrer um valor maior que a mdia igual a
probabilidade de ocorrer um valor menor do que a mdia.
tambm conhecida como distribuio de Gauss, Laplace ou Laplace-Gauss

um grfico em forma de sino. O seu posicionamento em relao ao eixo das ordenadas e seu achatamento
vai ser determinado pelos parmetros e , respectivamente. Fixando a mdia, verifica-se que o
achatamento est diretamente ligado ao valor do desvio padro.

Acima temos, curvas normais com mesma mdia , mas com varincias diferentes (s22 > s12 ).

Em uma Distribuio Normal observa-se que:


68% das observaes so localizadas dentro de 1 desvio padro em torno da mdia;
95% das observaes so localizadas dentro de 2 desvios padro em torno da mdia;
99,7% das observaes so localizadas dentro de 3 desvios padro em torno da mdia.

Clculo de probabilidades:

99

Quando temos em mos uma varivel aleatria com distribuio normal, nosso principal interesse obter a
probabilidade de essa varivel aleatria assumir um valor em um determinado intervalo.

O clculo de reas sob a curva normal consideravelmente complexo. Por isso, conveniente trabalhar com
valores padronizados.

Distribuio Normal Padro

A soluo foi definir uma Distribuio Normal Padro.


Uma Distribuio Normal Padro uma distribuio normal cuja mdia igual a zero e o desvio
padro igual a 1.
A Distribuio Normal Padro , ento, tabelada.
A operao para se calcular uma probabilidade normal passa a ser a converso da normal qualquer,
da qual desejamos calcular a probabilidade, em uma normal padro, seguida de uma consulta
tabela da normal padro.
A transformao de uma normal qualquer de mdia e desvio padro realizada com o auxlio
de uma varivel aleatria auxiliar Z, assim calculada:

Com o valor de Z assim calculado, entra-se na tabela da distribuio normal padro.

A Tabela da Distribuio Normal Padro (vide a tabela Distribuio normal padro) fornece a
probabilidade do valor da varivel aleatria cair dentro de um intervalo entre a mdia e o
determinado valor de Z.

A Tabela possui dois argumentos de entrada:


Na margem vertical esquerda, entra-se com a parte inteira e o 1 decimal de Z;
Na margem horizontal superior entra-se com o 2 decimal de Z. No cruzamento, l-se a
probabilidade.
100

Uso da Tabela da Normal Padro

Entre com o inteiro e 1


decimal do valor de Z
Z
0,0
0,1
0,2

0,00

0,01

Entre com o 2 decimal


do valor de Z

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

Probabilidade para
Z entre 0 e 1,14

.
.
.

1,0
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2
.
.
.

2,0
2,1
.
.
.

Leia, no cruzamento
a Probabilidade

Exemplo 01: O tempo gasto no exame vestibular de uma universidade tem distribuio Normal, com mdia
120 min e desvio padro 15 min.

a) Sorteando um aluno ao acaso, qual a probabilidade que ele termine o exame entre 120 e 140 minutos?

X: tempo gasto no exame vestibular X ~ N(120; 152)

Z=

X X 120
=

15



( < < 140) = (

= ( , ) = ,

b) Sorteando um aluno ao acaso, qual a probabilidade que ele termine o exame antes de 100 minutos?
Z=

X X 120
=

15

101

( < ) = (


) = ( , )

= , ( , )
= , , = ,

c) Qual o intervalo central de tempo, tal que 90% dos estudantes gastam para completar o exame?
Z=

X X 120
=

15

z=?

P(0 < Z< z) = 0,45

Pela tabela, z = 1,64

1 120
= 1,64
15

2 120
= 1,64
15

1 = 120 1,64 15 1 = 95,4

2 = 120 + 1,64 15 1 = 144,5

, (, < < , ) = ,

Exemplo 02: Seja X ~ N(10 ; 64) ( m = 10, s = 64 e s = 8 ), Calcular P(6 X 12).


102

X 10
8

12 10
6 10
P(6 X 12) P
Z

8
8
P(0,5 Z 0,25)
= P(0 < Z< 0,25) + P(0 < Z < 0,5)
= 0,0987+ 0,19146 = 0,2901

Exerccios (Resolvidos em sala)

1. Um estudo realizado sobre o valor das compras feitas em uma determinada loja de um dos shoppings da
cidade nos finais de semana revelou que essa varivel aleatria normalmente distribuda com uma mdia
de $ 98,00 e um desvio padro de $ 20,00. Qual a probabilidade de um cliente fazer uma compra cujo valor
seja:
a) Entre $ 98,00 e $ 110,00?
b) Maior do que $ 109,00?

2. Suponha que medidas da corrente em um pedao de fio sigam a distribuio normal, com uma mdia de
10 miliampres e uma varincia de 4 (miliampres)2. Qual a probabilidade da medida exceder 13
miliampres?
3. Calcule:
a)
b)
c)
d)

P(Z <1,82)
P(Z -2,03)
P(-2,55 Z 1,20)
P(Z 1,93)

4. Se X ~ N(100,25), calcule:

a) P(X > 110)


b) P(95 X 105)
c) Encontre x tal que P(X x) = 0,3446

103

7.2.2 Distribuio Exponencial

aplicada para o clculo da probabilidade de intervalos de tempo ou de espao fsico entre dois
eventos governados por um processo de Poisson.

Na distribuio de Poisson, a varivel aleatria definida como o nmero de ocorrncias em


determinado perodo. Na distribuio Exponencial a varivel aleatria definida como o tempo ou
espaos entre duas ocorrncias consecutivas.

Funo Densidade de Probabilidade igual a:

Uma varivel aleatria contnua X tem distribuio exponencial com parmetro , se sua funo de densidade
se probabilidade (fdp) dado por:

1 x

f ( x) e , x 0
0,
c.c

onde = tempo (ou espao) mdio

Notao: X~Exp().

A funo de distribuio acumulada dado por:

1 e , x 0
F ( x)
0
c.c

O clculo de uma probabilidade exponencial feito da seguinte forma :

P( x x 0 ) 1 e

P( x x 0 ) e

x0

, para valores de x xo

x0

, para valores de x xo

104

A mdia e o desvio padro da distribuio exponencial so calculados usando:

E( X )

Var ( X )

Exemplo 01: Um banco est implementando um servio de atendimento a clientes especiais aps o trmino
do expediente. O gerente da agncia fez um estudo a respeito da demanda por esses servios e constatou
que, em mdia, a agncia era procurada por cerca de seis clientes por hora.

a) Qual a probabilidade de um cliente chegar pelo menos 10 minutos aps o anterior ter chegado?

Neste caso, o perodo de tempo entre os dois eventos consecutivos de 10 minutos: 6 clientes em 1 hora
ou 10 minutos entre dois clientes consecutivos.
A probabilidade que se deseja calcular a de P(t 10 minutos)
Aplicando-se a frmula apropriada, teremos:

P( x x0 ) e

P(t 10) e

x0

10
10

0,3679

Veja no grfico abaixo a rea correspondente probabilidade calculada.

P(t 10 )

10

b) Qual a probabilidade um cliente chegar, no mximo, 8 minutos aps a chegada do cliente anterior?
A probabilidade que se deseja calcular, neste caso, P (t 8 minutos). Tem-se ento que:

P( x x0 ) 1 e

P(t 8) 1 e

8
10

x0

0,5507
105

Veja no grfico abaixo a rea correspondente probabilidade calculada:

P(t 8 )

c) Qual a probabilidade do perodo de tempo entre duas chegadas consecutivas de cliente ficar entre 5
minutos e 9 minutos?
Nesse caso, a probabilidade que se deseja p ( 5 t .

p (5 t 9) p (t 9) p (t 5)

p(5 t 9) (1 e

9
10

) (1 e

5
10

) 0,20

P(5 t 9)

Exemplo 02: Certo tipo de fusvel tem durao de vida que segue uma distribuio exponencial com tempo
mdio de vida de 100 horas. Cada pea tem um custo de 10,0 unidades monetrias (u.m) e se durar menos
de 200 horas, existe um custo adicional de 8,0 u.m.
a) Qual a probabilidade de uma durar mais de 150 horas?
b) Determinar o custo esperado.

Soluo:
Se X: tempo de durao de uma pea, do enunciado tem-se que: E(X)=100 horas

X ~ Exp(100). Ou seja,

106

1 e 100 , x 0
F ( x)

c.c
0

a) P( X 150) 1 P( X 150) 1 (1 e

150
100

) e 1,5 0,223

b) Seja C o custo total de uma pea.

se x 200
10,
C
10 8, se x 200

O custo total esperado : E(C)= 10*P(C=10) + 18 *P(C=18)

P(C 10) P( X 200) 1 P( X 200) 1 F (200) e2

P(C 18) P( X 200) F (200) 1 e2


E (C ) 10 e 2 18 (1 e 2 ) 16,918 u.m

Exerccios (Resolvidos em sala)

1. O tempo de vida, em meses, de um componente tem distribuio exponencial de parmetro = 0,5.

a) Qual a probabilidade de que um componente novo dure pelo menos 2 meses?


b) Dado que um componente usado j tem 1 ms de vida, qual a probabilidade de que ele dure pelo
menos mais dois meses?

2. Uma fbrica de tubos de TV determinou que a vida mdia dos tubos de sua fabricao de 800 horas
de uso e segue uma distribuio exponencial. Qual a probabilidade de que a fbrica tenha que
substituir um tubo gratuitamente, se oferecer uma garantia de 300 horas de uso?

107

7 Lista de Exerccios Distribuies de Probabilidades

1. Um lote de aparelhos de TV recebido por uma empresa. 20 aparelhos so inspecionados. O lote


rejeitado se pelo menos 4 forem defeituosos. Sabendo-se que 1% dos aparelhos defeituoso, determinar a
probabilidade de a empresa rejeitar todo o lote. Resp: 0,00004
2. Durante o perodo de tempo em que reservas por telefone, para o vero, esto sendo feitas nos hotis
da cidade de Vitria, as chamadas chegam a uma razo de uma a cada dois minutos. Qual a probabilidade de
ocorrer 3 chamadas em 5 minutos? Resp: 0,2137
3. Considere que uma auditoria em uma empresa de vendas a crdito levantou que 30% dos clientes
estavam com suas prestaes atrasadas. Determine a probabilidade de que, em 10 clientes escolhidos
aleatoriamente, 4 estejam com suas prestaes em atraso. E calcule a mdia e o desvio padro. Resp: 0,2001
4. Pequenos motores so guardados em caixas de 50 unidades. Um inspetor de qualidade examina cada
caixa, antes da posterior remessa, testando 5 motores. Se nenhum motor for defeituoso, a caixa aceita. Se
pelo menos um motor for defeituoso, todos os 50 motores so testados. H 6 motores defeituosos numa
caixa. Qual a probabilidade de que seja necessrio examinar todos os motores dessa caixa? (Resp. 0,4874)
5. Um fabricante de peas de automveis garante que uma caixa de suas peas conter, no mximo, duas
defeituosas. Se a caixa contm 30 peas, e a experincia tem mostrado que esse processo de fabricao
produz 10% de peas defeituosas, qual a probabilidade de que uma caixa satisfaa a garantia? Resp: 0,4114
6. Bob o jogador de basquete da faculdade. Ele um lanador de arremessos livres 70%. Isso
significa que sua probabilidade de acertar um arremesso livre 0,70. Durante uma partida, qual a
probabilidade que Bob acerte pelo menos um arremesso livre em cinco arremessos? Resp: 0,998
7. Numa central telefnica, o nmero de chamadas chega com uma mdia de 6 por minuto. Determinar a
probabilidade de que em um minuto se tenha:
a) no mnimo 4 chamadas; Resp: 0,848
b) no mximo cinco chamadas; Resp: 0,445
c) Mais de cinco e menos de oito chamadas. Resp: 0,298
8. Suponha que X, o n de partculas emitidas em t horas por uma fonte radioativa, tenha uma distribuio
de Poisson com parmetro 20t. Qual ser a probabilidade de que exatamente 5 partculas sejam emitidas
durante um perodo de 15 min? Resp. 0.1754
9. Num certo tipo de fabricao de fita magntica, ocorrem cortes a uma taxa de dois por 2000 ps. Qual a
probabilidade de que um rolo com 2000 ps de fita magntica tenha:
a) pelo menos dois cortes. Resp: 0, 596
b) no mximo dois cortes; Resp: 0,6767
c) nenhum corte; Resp: 0,1353
10.O dono de uma festa encomendou a um buffet 100 empadinhas de frango e 50 de camaro. Um
convidado guloso sequestra a bandeja do garom, que contm 20 empadinhas. O convidado , alm
de guloso, alrgico a camaro, e se comer mais de 2 empadas de camaro corre o risco de passar o resto
da festa no hospital. Qual a probabilidade disto acontecer? (Resp. ~ 100%)
108

11. A varivel aleatria Y tem densidade Poisson com parmetro =2. Obtenha:
a) P(Y<2) Resp: 0,406
b) P(2Y<4) Resp: 0,4511
c) P(Y>0)
Resp: 0,8647
12. Considere X uma varivel aleatria Normal com mdia 11,15 e desvio-padro 2,238. Qual a
probabilidade de X ser menor que 8,7? Resp: 0,1379
13. A durao de um certo tipo de pneu, em quilmetros rodados, uma varivel normal com durao
mdia 60000Km e desvio padro 10000Km.
a) Qual a probabilidade de um pneu aleatoriamente escolhido durar mais de 75000Km? Resp: 0,0666
b) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 50000km e 70000km? Resp:
0,6826
c) Qual a probabilidade de um pneu aleatoriamente escolhido durar entre 63000km e 70000km?
14. Um teste de inteligncia foi aplicado a um grupo de 50 adolescentes do 2 grau. Supondo que obtevese uma distribuio normal com mdia 70 e desvio padro de 6, pede-se:
a)
b)

A porcentagem dos alunos com nota superior a 80; Resp: 0,0475


O nmero de alunos com notas entre 45 e 65. Resp: 10

15. Uma empresa observa que na fabricao de determinado tipo de vela h pequena variao nas
dimenses e no peso entre elas. O dimetro mdio das velas segue distribuio normal com mdia de 4,45
cm e desvio padro de 0,35 cm. Para saber em quais candelabros as velas podero ser colocadas,
interessante conhecer a probabilidade de as velas terem dimetros:
a. maior que 4,75 cm;
Resp:0,1949
b. menor que 4,25 cm;
Resp: 0,2843
c. entre 4,25 e 4,75 cm.
Resp: 0,5208

16. Uma enchedora automtica de refrigerantes est regulada para que o volume mdio de lquido em
cada garrafa seja de 1000 cm3 e desvio padro de 10 cm3. Admita que o volume siga uma distribuio
normal.
a. Qual a porcentagem de garrafas em que o volume de lquido menor que 990 cm3? Resp: 0,159
b. Qual a porcentagem de garrafas em que o volume de lquido no se desvia da mdia em mais do que
dois desvios padres? Resp: 0,9544
17. Os salrios dos funcionrios de um hotel fazenda tm distribuio normal em torno da mdia de R$
1500,00, com desvio padro de R$ 200,00. Qual a probabilidade de um funcionrio:
a. ganhar entre R$ 1400,00 e R$ 1600,00 ?
Resp: 0,383
b. ganhar acima de R$ 1500,00 ?
Resp: 0,5
c. ganhar acima de R$ 1400,00 ?
Resp: 0,6915
d. ganhar abaixo de R$ 1400,00 ?
Resp: 0,3085
e. ganhar acima de R$ 1650,00 ?
Resp: 0,2266

109

18. A durao de certos tipos de amortecedores, em km rodados normalmente distribuda, possui durao
mdia de 5000 km e desvio-padro de 1000 km.
a) Qual a probabilidade de um amortecedor escolhido ao acaso durar entre 4500 e 6350 km?R: 0,60295
b) Se o fabricante desejasse fixar uma garantia de quilometragem, de tal forma que se a durao do
amortecedor fosse inferior a garantia, o amortecedor seria trocado, de quanto deveria ser esta garantia
para que somente 1% dos amortecedores fossem trocados? R: 2670 km
19. A altura dos alunos de uma escola (em Cm) tem distribuio normal com mdia 169cm e varincia de
81cm. Pergunta-se:
a) Qual a proporo de alunos com altura que diferem da mdia em mais de um desvio padro? (R.
0,3174
b) Se a escola tiver 5000 alunos, quantos esperamos com alturas abaixo de 160 cm ou acima de 178 cm?
(Resp. 1587)
c) Qual a maior altura entre os 1,25%, menores? ( Resp. 148,84)
d) Qual a probabilidade (proporo) de um aluno escolhido aleatoriamente ter altura entre 151 cm e 160
cm. ( Resp. 0,1359)
20. Suponha que as notas de uma prova sejam normalmente distribudas com mdia 73 e desvio padro 15.
Quinze por cento dos alunos mais adiantados recebem a nota A e 12% dos mais atrasados recebem nota F.
Encontrar o mnimo para receber A e o mnimo para passar, no receber F. (Resp. 55,3 e 88,6)
21. O salrio semanal dos operrios industriais distribudo normalmente em torno de uma mdia de R$
180,00 com desvio padro de R$ 25,00. Pede-se:
a) Encontrar a probabilidade de um operrio ter salrio semanal situado entre R$ 150,00 e R$ 178,00.
(Resp. 0,353)
b) Dentro de que desvio, de ambos os lados da mdia, cairo 96% dos salrios? (R. 2,06 desvios)
(X1= 128,75 e x2=231,25)
22. Em uma distribuio normal, 28% dos elementos so superiores a 34 e 12% inferiores a 19. Encontrar a
mdia e a varincia. (Resp. =29,03; =73,4)
23. Seja X uma varivel aleatria e tenha uma distribuio exponencial com parmetro . Calcule a
probabilidade de que X ultrapasse seu valor esperado.
Resp: 0,3679
24. A durao de uma lmpada uma varivel aleatria T, com fdp dada por:

1000 ,
() = { 1000
0,
Calcular a probabilidade de uma lmpada:
a) Se queimar antes de 1000 horas; Resp: 0,632
b) Durar entre 800 e 1200 horas. Resp: 0,1481

0 ( );
> 0.

25. A vida mdia de um satlite 4 anos, seguindo o modelo exponencial. Seja T a varivel definida como o
tempo de vida do satlite. Calcule:
a) P(T > 4) Resp: 0,3678
b) P(5 T 6) Resp: 0,0633
110

111

UNIDADE VII - CORRELAO E REGRESSO LINEAR SIMPLES


7.1 - Anlise de Correlao

Os principais objetivos de uma anlise de correlao consiste em identificar quais variveis so


potencialmente importantes na anlise de um dado processo e medir a fora ou o grau de relao linear
entre duas variveis.
Por exemplo, podemos estar interessados em determinar o grau de relao entre: fumar e cncer de
pulmo; entre notas obtidas nas provas de estatstica e de matemtica; entre as notas obtidas no ensino
mdio e na faculdade e assim por diante.
OBS: No h, nesse caso, preocupao em apresentar forma funcional entre as variveis, se houver. Trata-se
qualquer (duas) variveis simetricamente, no h distino entre as variveis dependentes e explanatrias.
O grau de relao mensurado por uma medida estatstica chamada de coeficiente de correlao, os
smbolos usados so:

Podemos levantar, a ttulo de exemplo, algumas questes:


1. A idade (independente) de uma pessoa e sua resistncia (dependente) fsica esto correlacionadas?
2. Pessoas de maior renda (independente) tendem a apresentar melhor escolaridade (dependente)?
3. A temperatura (independente) pode influenciar na taxa de criminalidade (dependente)?
4. O sucesso (dependente) num emprego pode ser predito com base no resultado de testes
(independente)?

Para o estudo do comportamento conjunto de duas variveis podem ser utilizados: Diagrama de
Disperso e o Coeficiente de correlao de Pearson.

7.1.1 - Diagrama de Disperso


interessante, sempre que possvel, fazer um grfico dos pares observados para as variveis em
estudo, afim de perceber algum tipo de tendncia dos dados, o que indica uma possvel relao entre as
variveis. O diagrama de disperso a representao grfica do conjunto de dados. Nada mais do que a
representao dos pares de valores num sistema cartesiano.
Em sntese quatro situaes marcantes poderiam acontecer:

112

Correlao Linear Negativa

Quando a correlao em estudo tem como imagem uma reta descendente, dizemos existir uma correlao
linear negativa.

O Diagrama de disperso indica que h uma tendncia inversamente proporcional. Ou seja, quando uma das
variveis cresce, a outra, em mdia, decresce.

Correlao linear positiva

Quando a correlao em estudo tem como imagem uma reta ascendente, dizemos existir uma correlao
linear positiva.

O Diagrama de disperso indica que h uma tendncia diretamente proporcional. Ou seja, quando uma das
variveis cresce, a outra, em mdia, tambm cresce.

Ausncia de Correlao

Se os pontos estiverem dispersos, sem definio de direo, dizemos que a correlao muito baixa, ou
mesmo nula, as variveis nesse caso so ditas no correlacionadas.

113

O diagrama de disperso indica que no h tendncia, o que tambm ser indicado por uma medida
estatstica.
Correlao No-Linear
Quando a correlao em estudo tem forma de curva, dizemos existir uma correlao no-linear.

EXEMPLO 1: Sejam os dados da tabela abaixo que apresentam as notas obtidas por alunos nas disciplinas de
Qumica e Biologia.
razovel considerarmos que as notas em biologia dependam das notas em qumica, ou seja:
Notas em Biologia: Varivel Dependente.
Notas em Qumica: Varivel independente.

Notas de Biologia (Y)

10

Notas de Qumica (X)

10

Diagrama de Disperso

114

7.1.2 - Coeficiente de correlao de Pearson

um valor numrico, uma medida do grau de associao entre duas variveis.


Se for observada uma associao entre as variveis quantitativas (a partir de um diagrama de
disperso, por exemplo), muito til quantificar essa associabilidade.
O coeficiente de correlao amostral calculado por:

( ) ( )
[ 2 ( )2 ][ 2 ( )2 ]

Propriedades:
1. Pode ser positivo ou negativo, o que depender do sinal do termo no numerador da equao, que
mede a covariao amostral das duas variveis;
2. Se situa nos limites de -1 e +1, isto , -1 r 1.
3. Sua natureza simtrica, isto , o coeficiente de correlao entre X e Y (rxy) o mesmo que Y e X (ryx).
4. Se X e Y so estatisticamente independentes, o coeficiente de correlao entre elas zero, mas se r
= 0, isso no significa que sejam independentes.
5. uma medida de associao linear ou de dependncia linear, no significativa para descrever
relaes no lineares.
Classificao para o coeficiente de correlao:

Relao Fraca: Se -0,3 r 0,3


Relao moderada: Se -0,7 < r < -0,3 ou 0,3 < r < 0,7
Relao Forte: Se -1 r - 0,7 ou 0,7 r 1,0

Padres de Correlao

115

EXEMPLO 2: Calcular o grau de associao entre as notas de biologia e qumica do exemplo 01.

Logo teremos:
=

(. . ) ( ). ( )
. ( 2 ) ( )2 . . ( 2 ) ( )2

116

(10 473) (65 65)

(10 481) 652 . (10 475) 65


4730 4225

(4810 652 ) (4750 652 )

= ,

Resultado que indica uma forte correlao linear positiva entre as variveis. Quanto maior a nota em
qumica maior a nota em biologia.

EXEMPLO 3: Na tabela abaixo temos o salrio-hora mdio(Y) segundo nvel de escolaridade (X).
Anos de estudo Salrio - hora
(X)
mdio (Y)

XY

4,46

36

19,89

26,76

5,77

49

33,29

40,39

5,98

64

35,76

47,84

7,33

81

53,73

65,97

10

7,32

100

53,58

73,20

11

6,58

121

43,30

72,38

12

7,82

144

61,15

93,84

13

7,84

169

61,47

101,92

14

11,02

196

121,44

154,28

15

10,67

225

113,85

160,05

16

10,84

256

117,51

173,44

17

13,62

289

185,50

231,54

18

13,53

324

183,06

243,54

156

112,78

2054

1083,53 1485,15

Existe uma relao entre o grau de escolaridade e o salrio-hora mdio?


n = 13

X = 156

Y = 112,78

117

2 = 2054

2 = 1083,53

= 1485,15

( ) ( )

[ 2 ( )2 ][ 2 ( )2 ]

13 1485,15 (156 112,78)


[(13 2054) (156)2 ] [(13 1083,53) (112,78)2 ]

1713,27
2366 1366,56

= 0,9528

= 0,9528

O coeficiente de correlao de 0,95 est bem prximo de 1, ento podemos concluir que o grau de
escolaridade e o salrio-hora mdio so fortemente correlacionados, apresentando uma relao positiva.
Podemos verificar essa relao atravs do diagrama de disperso.

EXERCCIO (Resolvidos em sala)

1 - Os dados abaixo so referentes aos salrios e tempo de servio dos 10 operrios de uma firma, construa
a tabela de distribuio conjunta, verifique graficamente se existe relao entre salrio e tempo de servio,
quantifique essa relao usando a medida estatstica apropriada.
118

Y = salrio em $
X = tempo de servio em anos

7.2 - REGRESSO LINEAR SIMPLES

A anlise de regresso consiste em determinar um modelo matemtico que expresse da melhor


maneira possvel o comportamento da varivel dependente (Y) em funo da varivel independente (X).

Todos os dias, a mdia se encarrega de informar resultados de anlises e pesquisas do tipo:

O valor da empresa depende do lucro futuro,


A taxa de juros depende da inflao.
O salrio depende da escolaridade do trabalhador etc.

Na regresso linear simples ser deduzida e analisada a reta que melhor explica essa relao, tendo
previamente definido a varivel independente e a varivel dependente. Estuda-se apenas duas variveis e o
modelo determinado um polinmio de primeiro grau.

119

OBS: Uma anlise de regresso torna-se mais interessante quando as variveis envolvidas apresentam
associao de moderada a forte.
7.2.1 - Modelo do Ajuste de uma Reta de Regresso

O ajuste de uma reta de regresso um modelo linear que relaciona a varivel dependente Y e a
varivel independente X por meio da equao de reta do tipo:

= +
A equao = + deve ser obtida de forma a minimizar os erros de estimao, e, como pode
ser visto no ponto (x1; y1). O erro de estimao e a distncia entre o ponto e a reta . Para tanto empregase o mtodo dos mnimos quadrados como veremos a seguir.

Uma vez que tenha sido formulada a equao de regresso, pode-se utiliz-la para estimar o valor da varivel
dependente, dado o valor da varivel independente. Contudo, tal estimao deve ser feita apenas dentro do
intervalo de variao dos valores da varivel independente originalmente amostrados, j que no existe base
estatstica para supor que a linha de regresso apropriada fora destes limites.

120

Estimao dos coeficientes

A forma geral da equao de regresso linear para os dados de uma amostra :


= +

Essa equao deve ser obtida de forma que o erro de estimao seja mnimo. Pelo mtodo dos mnimos
quadrados, estes erros so mnimos para:

( ) ( )

[ ( ) ]

Neste caso, o parmetro a indica a altura em que a reta corta o eixo Y e o parmetro b indica a inclinao da
reta, isto , a mudana que Y sofre para cada unidade de variao de X.

EXEMPLO 4: O objetivo do diretor de vendas de uma rede de varejo analisar a relao entre o investimento
realizado em propaganda e as vendas das lojas da rede, para realizar projees de vendas de futuros
investimentos em propaganda. A tabela seguinte registra uma amostra representativa extrada dos registros
histricos das lojas de tamanho equivalente, com os valores de Propaganda e Vendas em milhes.
Analisar a possibilidade de definir um modelo que represente a relao entre as duas variveis ou amostras.

SOLUO
Para analisar a relao entre as duas variveis foi construdo o grfico de disperso das vendas anuais
em funo do investimento anual em propaganda. Nesse grfico pode-se ver que, nos ltimos dez
anos, o aumento de investimento em propaganda gerou aumento das vendas, e vice-versa.

121

O grfico de disperso mostra que as vendas e o investimento em propaganda esto correlacionados


de forma positiva, com um coeficiente de correlao prximo de +1.
Uma reta como a linha tracejada no grfico de disperso acima poder ser utilizada para realizar
projees das vendas futuras em funo do investimento em propaganda.
A linha tracejada foi ajustada tentando equilibrar os pontos acima da reta com os pontos
abaixo dela.
Essa reta uma das muitas possveis retas que poderiam ser ajustadas.

Estimao da equao de regresso:


Y = Vendas
X = Investimento em propaganda

( ) ( )

[ ( ) ]
122

10 112.455 270 3.800


9,7381
10 8.302 2702

3.800 9,7381 270


117,07
10

Portanto, a equao da reta de regresso procurada :

y 117,07 9,74 x
Concluso: A cada 1 milho investido em propaganda o valor mdio de vendas aumenta em 9,74 milhes.

EXERCCIO (Resolvidos em sala)

1 - Os dados abaixo so referentes aos salrios e tempo de servio dos 10 operrios de uma firma, verificouse que existe relao entre salrio e tempo de servio, obtenha a equao da reta de regresso que estima
o salrio segundo tempo de servio.

Y = salrio em $
X = tempo de servio em anos

123

7 lista de exerccios

Questo 1 - Abaixo voc encontra uma lista de situaes de pesquisa. Para cada uma delas indique se o
apropriado proceder uma anlise de regresso ou uma de correlao. Justifique sua indicao.
a) O rendimento escolar na Universidade favorece o xito profissional?
b) O tempo de treinamento influi no desempenho profissional?
c) O objetivo estimar o tempo necessrio a consecuo de certa tarefa usando, para tanto, o tempo
de treinamento do executor.
d) O objetivo utilizar o preo da carne de gado para estimar a quantidade de procura desse bem.
e) A quantidade procurada de carne de gado depende do preo da carne de porco?
Questo 2 - A Revista Nacional do Consumidor apresenta as seguintes correlaes:
(i) A correlao entre peso de carro e a confiabilidade -0,30;
(ii) A correlao entre peso do carro e dos custos anuais de manuteno 0,20.
Qual a interpretao do coeficiente de correlao em cada um dos casos, ou seja, como pode-se descrever a
relao entre as variveis?

Questo 3 - Certa empresa, estudando a variao da demanda de seu produto em relao variao de
preo de venda, obteve a tabela:

Preo
(X)

Demanda
(Y)

38

350

42

325

50

297

56

270

59

256

63

246

70

238

80

223

95

215

110

208

a) Construa o diagrama de disperso (grfico).


b) Verifique o grau de relao entre Preo e demanda do produto.
124

c) Obtenha a funo de regresso estimada, e conclua algo;


d) Qual a estimativa da demanda quando o preo 65?

Questo 4 - Uma cadeia de supermercados financiou um estudo dos gastos realizados por famlia de quatro
pessoas com renda mensal lquida entre oito e vinte salrios mnimos. A pesquisa levou a equao de

regresso Y = -1,2 + 0,4 X, onde Y representa a despesa mensal estimada ( atravs do modelo) e X a renda
mensal lquida expressa em nmero de salrios mnimos.
a) Estime a despesa mensal de uma famlia com renda lquida mensal de 15 salrios mnimos.
b) A equao em questo serve para estimar a despesa mensal de uma famlia de 5 pessoas com renda
lquida de 12 salrios mnimos? Justifique.
Questo 5 - Para estudar a poluio de um rio, um cientista mediu a concentrao de um determinado
composto orgnico (Y) e a precipitao pluviomtrica na semana anterior (X):
X

0,91

1,33

4,19

2,68

1,86

1,17

0,1

1,1

3,4

2,1

2,6

a) Existe alguma relao entre o nvel de poluio e a precipitao pluviomtrica? Responda analisando
o grfico de disperso.
b) Calcule e interprete o coeficiente de correlao linear de Pearson.
c) Determine a equao de regresso linear.

Questo 6 - Para cada caso abaixo, estime a correspondente equao de reta de regresso:
a)

n 20, X 200, Y 300, XY 6200, X 2 3600.

b)

n 36, X 7,2, Y 37, XY 3100, X 2 620.

GABARITO
Questo 1)
a) Correlao, pois o objetivo da pesquisa observar se o xito profissional depende do rendimento escolar.
b) Correlao, pois o objetivo da pesquisa observar se o desempenho profissional depende do tempo de
treinamento.
c) Anlise de regresso, pois o objetivo da pesquisa estimar o tempo de consecuo de certa tarefa utilizando
a informao do tempo de treinamento do executor.
d) Anlise de regresso, pois o objetivo da pesquisa estimar a quantidade de procura da carne do gado atravs
do preo da carne.
e) Correlao, pois o objetivo da pesquisa verificar se existe relao de dependncia entre o preo da carne de
porco e a procura de carne de boi.
Questo 2)

125

(i)

Existe correlao negativa fraca entre as variveis, ou seja, quanto maior o peso do carro, menor ser
sua confiabilidade.
Existe correlao positiva fraca entre as variveis, ou seja, quanto maior o peso do carro, maior ser os
custos anuais de manuteno.

(ii)

Questo 3)

a) Fazer o grfico
b) r = - 0,90 ( Existe relao inversamente proporcional entre preo e demanda do produto, a medida
que o preo aumenta a demanda diminui)

= , ,
c)
A cada aumento de uma unidade no preo, a demanda diminui em 1,87.
d) 265,23

Questo 4)
a) A despesa mensal de 4,8 salrios mnimos.
b) No, pois a equao de regresso dada referente a famlias de 4 pessoas, no podendo ser utilizada para
uma famlia de 5 pessoas.
Questo 5)
Existe relao positiva entre o nvel de poluio e a precipitao pluviomtrica

a)

4
3,5
3
2,5
2
1,5
1
0,5
0
0

X
b)

= 0,887 Existe forte relao positiva entre poluio e precipitao pluviomtrica.

c) = +
A equao estimada : = 0,038 + 0,867

Questo 6)
a)

b)

206200200300
203600200

= 2

3631007,237
366207,2

= 4,99

300 2200

20

= 5

37 4,997,2
36

= 0,029

= +

= , + ,

126

Вам также может понравиться