Вы находитесь на странице: 1из 75

Sumrio

1 Introduo 1

1.1 O que Estatstica? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Algumas denies sobre Estatstica . . . . . . . . . . . . . . . . . . . . . 1

1.1.2 Conceitos Atuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.3 As fases do mtodo estatstico . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.1.4 Subdivises da Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Populao e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1 Censo X Amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Alguns Exemplos de Aplicao da Estatstica . . . . . . . . . . . . . . . . . . . . 6

1.4 Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.1 Denio de Varivel: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4.2 Classicao das Variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5 Parmetro X Estimador X Estimativa . . . . . . . . . . . . . . . . . . . . . . . . 8

1.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Estatstica Descritiva 11

2.1 Representao Tabular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.1.1 Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.1.2 Sries Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2 Distribuio de Frequncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.1 Tipos de freqncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.2.2 Distribuio de Freqncia para Variveis Quantitativas Contnuas . . . . 16

2.3 Representao Grca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.3.1 Grcos para as Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . 18

2.3.2 Gracos para Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . 20

2.4 Medidas de Posio ou Tendncia Central . . . . . . . . . . . . . . . . . . . . . . 23

2.4.1 A Mdia Aritmtica Simples . . . . . . . . . . . . . . . . . . . . . . . . . . 23

i
2.4.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.4.3 Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.5 Medidas de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.5.1 Motivao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.5.2 Amplitude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.5.3 Varincia e Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.5.4 Propriedades das medidas de disperso . . . . . . . . . . . . . . . . . . . . 34

2.5.5 Coeciente de Variao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3 Variveis Aleatrias 39

3.1 Varivel Aleatria Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.1.1 Funo de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.1.2 Funo de Distribuio Acumulada . . . . . . . . . . . . . . . . . . . . . 42

3.1.3 Esperana Matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3.1.4 Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.1.5 Desvio Padro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.2 Varivel Aleatria Contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.2.1 Funo densidade de Probabilidade (f.d.p) . . . . . . . . . . . . . . . . . 47

3.2.2 Funo de distribuio acumulada . . . . . . . . . . . . . . . . . . . . . . 48

3.2.3 Esperana e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4 Alguns Modelos Probabilsticos Discretos e Continuos 50

4.1 Modelos Probabilisticos Discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.1.1 Distribuio de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.1.2 Distribuio Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1.3 Distribuio Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.1.4 Distribuio Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.2 Modelos Probabilsticos Contnuos . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.2.1 Distribuio Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.2.2 Esperana e Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2.3 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.2.4 Distribuio Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.2.5 A Distribuio Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.2.6 Distribuio normal padro . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.2.7 Padronizao de uma varivel . . . . . . . . . . . . . . . . . . . . . . . . . 65

ii
Bibliograa 70

iii
Lista de Tabelas

2.1 Produo de Petrleo Bruto no Brasil de 1976 a 1980 . . . . . . . . . . . . . . . . 13

2.2 Necessidades mdias de energia em alguns pases, em 1973. . . . . . . . . . . . . . 13

2.3 Populao Urbana e Rural do Brasil em 1980 (x 1000). . . . . . . . . . . . . . . . 13

2.4 N
o de acidentes dirios num estacionamento, durante 50 dias. . . . . . . . . . . . 18

2.5 Freqncias e Porcentagens dos 36 empregados da seo de oramentos da

Companhia MB segundo o grau de instruo. . . . . . . . . . . . . . . . . . . . . 19

2.6 Fonte: Bussab e Morettin (2012) . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.7 Freqncias e Porcentagens dos empregados da seo de oramentos da

Companhia MB, segundo o nmero de lhos. . . . . . . . . . . . . . . . . . . . . 20

2.8 Freqncias e Porcentagens dos 36 empregados da seo de oramentos da

Companhia MB, por faixas de salrio . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.9 Defeitos em elementos estruturais da porta . . . . . . . . . . . . . . . . . . . . . . 35

iv
Lista de Figuras

1.1 Levantamento por amostragem para avaliar a preferncia do consumidor . . . . . 5

2.1 Taxa de atividade feminina urbana, em percentual, em trs regies do Brasil,

1981,90 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 Consumo per capita anual de alguns tipos de alimentos, em algumas regies

metropolitanas do Brasil, no ano de 1988 . . . . . . . . . . . . . . . . . . . . . . . 14

2.3 Taxa de mortalidade (em percentual) de menores de um ano no Brasil, segundo as trs

principais causas, no perodo de 1984 a 1987 . . . . . . . . . . . . . . . . . . . . . . . 14

2.4 Nmero de vtimas em acidentes, segundo as grandes regies do Brasil, nos anos

de 1991 e 1992 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.5 Grco em Barras para a Varivel Grau de Instruo . . . . . . . . . . . . . . . . 19

2.6 Grco em Setores para a Varivel Grau de Instruo . . . . . . . . . . . . . . . . 19

2.7 Produo de avies em 2000. (Fonte: Boeing Commercial Airplane Company) . . 20

2.8 Grco de Barras para a varivel Nmero de Filhos . . . . . . . . . . . . . . . . . 21

2.9 Histograma da Varivel Salrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.10 Poligono de Frequncia da Varivel Salrio . . . . . . . . . . . . . . . . . . . . . . 22

4.1 Densidade uniforme no intervalo [a, b] . . . . . . . . . . . . . . . . . . . . . . . . . 55

v
Captulo 1

Introduo

Estatstica uma cincia muito til nos dias atuais, porm ela precisa ser entendida de forma

correta. Por exemplo, muitas pessoas acham que Estatstica composta apenas de grcos e

tabelas, e assumem este conceito errado de forma to concreta que so incapazes de aceitar

algo contrrio. Isto se d em virtude de vrios fatores, por exemplo, o modo como uma noticia

dada na mdia, em muitas ocasies o meio de comunicao desconhece a estatstica e fazem

armaes sem fundamento a respeito do assunto.

1.1 O que Estatstica?


A palavra Estatstica vem de Status (Estado, em Latim). Ento ela signica estudo do estado.

1.1.1 Algumas denies sobre Estatstica

A Estatstica est interessada nos mtodos cientcos para a coleta, organizao, resumo,

apresentao e anlise de dados, bem como na obteno de concluses vlidas e na tomada

de decises razoveis, baseadas em tais anlises. (SPIEGEL, 1994, p. 1).

Entendemos a Estatstica como um conjunto de tcnicas que permite, de forma sistemtica,

organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos,

realizados em qualquer rea de conhecimento. (MAGALHES, 2002, p.1).

1.1.2 Conceitos Atuais

A estatstica o ramo da matemtica interessado nos mtodos cientcos para

coleta,organizao, resumo, apresentao e anlise de dados, bem como na obteno de

concluses vlidas e na tomada de decises razoveis baseadas em tais anlises.

1
Portanto, a estatstica uma cincia que se preocupa com o planejamento de uma pesquisa,

envolvendo desde a forma de coleta das observaes obtidas em experimentos ou levantamentos,

at a maneira como ser feita a organizao, a descrio, o resumo dos dados e a avaliao e

armao sobre caractersticas de interesse do pesquisador. Tudo isso corresponde s fases do

mtodo estatstico.

1.1.3 As fases do mtodo estatstico

As vrias fases do mtodo estatstico esto delineadas a seguir. As etapas descritas nas sees

de planejamento, coleta, crtica, apurao e exposio constituem a Estatstica Descritiva,

enquanto a seo de anlise constitui a Estatstica Indutiva ou Inferencial.

a) Denio do Problema - Consiste na:

 formulao correta do problema;

 examinar outros levantamentos realizados no mesmo campo (reviso da literatura);

saber exatamente o que se pretende pesquisar denindo o problema corretamente

(variveis, populao, hipteses, etc.)

 Por exemplo: A nota mdia no ENEM dos alunos do estado do Par menor do que

as dos alunos dos outros estados?

b) Planejamento - Determinar o procedimento necessrio para resolver o problema:

 Como levantar informaes;

 Tipos de levantamentos: por censo (completo) ou por amostragem (parcial).

 Cronograma, custos, etc.

c) Coleta ou Levantamento dos Dados - Consiste na obteno dos dados referentes ao

trabalho que desejamos fazer. A coleta pode ser Direta ou Indireta.

 A coleta direta de dados quando os dados so obtidos pelo prprio pesquisador

atravs de levantamento de registros (nascimentos, bitos, notas scal, impostos,etc.)

ou coletados diretamente atravs de inquritos, questionrios, etc. A coleta direta

pode ser classicado quanto ao fator tempo como:

- contnua: quando feita de forma continuada, como registro de nascimentos e

bitos, frequncia de alunos s aulas, etc.

2
- peridica: quanto feita em intervalos constantes de tempo, como censos (10

em 10 anos), avaliaes mensais dos alunos, etc

- ocasional: quanto feitas em determinada situao para atender a um objetivo,

como pesquisa de mortalidade de um rebanho, pesquisa eleitoral, pesquisa de um

produto no mercado, etc.

 A coleta indireta inferida de elementos conhecidos, atravs de uma coleta direta,

ou do conhecimento de fenmenos relacionados ao fenmeno estudado. Por exemplo,

pesquisa sobre mortalidade infantil que feita sobre a coleta direta de dados de

nascimentos e bitos

d) Apurao dos Dados ou Sumarizao - Consiste em resumir os dados, atravs de uma

contagem e agrupamento. um trabalho de coordenao e de tabulao.

e) Apresentao dos Dados - Os dados sempre devem ser apresentados de forma adequada,

seja atravs de tabelas ou grcos, seguindo os critrios determinados no planejamento e

utilizados no processamento dos dados. A exposio dos dados tem o objetivo de facilitar

a anlise daquilo que objeto do estudo estatstico.

f) Anlise e Interpretao dos Dados - A ltima etapa do processo estatstico consiste

em tirar concluses sobre os dados levantados e processados, inferindo concluses sobre o

todo (populao) a partir de dados coletados de uma parte representativa da populao

(amostra)

1.1.4 Subdivises da Estatstica

A estatstica pode ser dividida em trs grandes reas:

Estatstica Descritiva ou Anlise Exploratria dos Dados

Probabilidade

Estatstica Indutiva ou Inferncia Estatstica

Estatstica Descritiva: , em geral, utilizada na etapa inicial da anlise, quando tomamos

contato com os dados pela primeira vez. Pode ser denida como um conjunto de tcnicas

destinadas a descrever e resumir os dados, a m de que possamos tirar informaes e concluses

a respeito de caractersticas de interesse.

A Estatstica Descritiva pode ser resumida da seguinte forma:

3
Tabelas
Coleta de Crtica Apresentao Anlise
dados de dados dos Dados
Grcos

Probabilidade: a base matemtica sob a qual a Estatstica construda. Fornece

mtodos para quanticar a incerteza existente em determinada situao, usando ora um

nmero ora uma funo matemtica. Foi desenvolvida a partir de problemas apresentados por

jogadores, nobres franceses, a grandes matemticos da poca, como Blaise Pascal.

A Inferncia Estatstica: a parte da estatstica que trata das condies sob as quais

faz-se inferncias (ou pressuposies ou generalizaes) sobre uma populao. Se uma amostra

representativa de uma populao, possui as mesmas caractersticas bsicas da mesma, e

concluses importantes sobre a populao podem ser inferidas de sua anlise, assim, com a

inferncia estatstica fazemos inferncias alm dos dados conhecidos. A inferncia estatstica

envolve questes de dois tipos: a estimao de parmetros populacionais e os testes de hipteses.

1.2 Populao e Amostra


a) Populao (N): o conjunto de todos os elementos que nos interessa estudar. Deve ser

notado que na terminologia estatstica, populao refere-se no somente a uma coleo de

indivduos, mas ao alvo no qual reside nosso interesse. Exemplos: todos os clientes de um

banco, todos os alunos de uma faculdade, todos os automveis da Ford, todo o sangue no

corpo de uma pessoa, etc. e ainda pode ser nita ou innita.

 Finita - apresenta um nmero limitado de observaes, que passvel de contagem.

 Innita - apresenta um nmero ilimitado de observaes que impossvel de contar

e geralmente esta associada a processos.

b) Amostra (n): um subconjunto da populao e dever ser considerada nita, a amostra

deve ser selecionada seguindo certas regras e deve ser representativa da populao, de

modo que ela represente todas as caractersticas da populao.

4
Figura 1.1: Levantamento por amostragem para avaliar a preferncia do consumidor

1.2.1 Censo X Amostragem

Amostragem o estudo das relaes existentes entre a amostra e a populao de onde esta

foi extrada. A amostragem usualmente realizada com o objetivo de estimar parmetros

da populao, como por exemplo, a mdia (?), a varincia (?) ou a proporo (p) de uma

determinada caracterstica.

Enquanto que um censo envolve um exame a todos os elementos de um dado grupo, a

amostragem envolve um estudo de apenas uma parte dos elementos. A amostragem consiste em

selecionar parte de uma populao e observ-la com vista a estimar uma ou mais caractersticas

para a totalidade da populao.

Por exemplo: Para se saber se o bolo de chocolate est bom, basta comer uma fatia."

Alguns exemplos da utilizao da amostragem so:

Pesquisas de opinio pblica;

Inspeo de mercado utilizada com o intuito de descobrir as preferncias das pessoas em

relao a certos produtos;

Para estimar a prevalncia de uma doena rara, a amostra pode ser constituda por algumas

instituies mdicas, cada uma das quais tem registro dos pacientes.

O Censo apresenta diculdades que tornam a amostragem um pouco mais atraente. Entre

5
as diculdades que o censo apresenta, podem ser apresentadas as seguintes:

i) A populao pode ser innita, neste caso o censo seria impossvel;

ii) A amostra pode ser atualizada mais facilmente que o censo;

iii) O custo do censo pode torn-lo invivel;

iv) Fatores de tempo e custo podem apontar pela preferncia entre uma amostra e um censo.

Porm h ocasies em que o levantamento do censo pode ser vantajoso:

i) Quando a populao pequena e o custo entre o censo e a amostra forem praticamente

iguais;

ii) Se o tamanho da amostra necessria tiver que ser muito grande em relao populao

examinada;

iii) Nas ocasies em que se exige preciso completa;

Em geral, o uso de amostragem leva reduo de custos e tempo. Mas a amostragemn

precisa ser feita com critrios, pois pretendemos ter amostras que permitam, a apartir de uma

anlise estatstica apropriada, obter concluses satisfatrias sobre toda a populao.

1.3 Alguns Exemplos de Aplicao da Estatstica


1. Teoria da resposta ao item Uma Universidade pretende estudar a procincia dos

estudantes submetidos ao processo seletivo e os parmetros dos itens (questes) da prova.

Populao Conjunto de todos os estudantes submetidos ao exame.

Amostra Conjunto de alguns estudantes submetidos ao exame, que foram

selecionados.

Problema Estudar a procincia dos estudantes e os parmetros dos itens (questes)

pelo mtodo da Mxima verossimilhana marginal.

2. Medicina - Pretende-se estudar o efeito de um novo medicamento para curar determinada

doena. selecionado um grupo de 20 doentes, administrando-se o medicamento a 10

desses doentes escolhidos ao acaso, e o medicamento habitual aos restantes.

Populao Conjunto de todos os doentes com a doena especica.

6
Amostra Conjunto dos 20 doentes selecionados.

Problema Pretende-se, a partir dos resultados obtidos, realizar um teste de hipteses

para tomar uma deciso sobre qual dos medicamentos melhor.

3. Controle de qualidade - O administrador de uma fbrica de parafusos pretende assegurar-

se de que a percentagem de peas defeituosas, no excede um determinado valor, a partir

do qual determinada encomenda poderia ser rejeitada.

Populao Conjunto de todos os parafusos fabricados pela fbrica.

Amostra Conjunto de alguns parafusos, escolhidos ao acaso, de entre o lote de

produzidos.

Problema A partir da percentagem de parafusos defeituosos presentes na amostra,

estimar a percentagem de defeituosos em toda a produo.

4. Pedagogia Um conjunto de pedagogos desenvolveu uma tcnica nova para a aprendizagem

da leitura na escola primria, a qual, segundo dizem diminuem o tempo de aprendizagem

relativamente ao mtodo habitual.

Populao Conjunto dos alunos que entram para a escola primria sem saber ler.

Amostra Conjunto de alunos de algumas escolas, selecionadas para o estudo. Os

alunos foram separados em dois grupos para se aplicarem as duas tcnicas em

confronto.

Problema A partir dos tempos de aprendizagem obtidos vericar se existe evidncia

signicativa para armar que os tempos com a nova tcnica so menores.

1.4 Variveis
1.4.1 Denio de Varivel:

Varivel aquilo que se deseja observar para se tirar algum tipo de concluso.

Qualquer caracterstica associada a uma populao chamada de varivel.

Porque o nome varivel: Por que ela varia"de alguma forma.

Exemplo: Idade: pode variar de 0,1,2,... anos

Sexo: pode ser masculino ou feminino

Estado Civil: pode ser solteiro, casado, divorciado, etc.

7
1.4.2 Classicao das Variveis

Qualitativas (ou atributos ou categricos): So caractersticas que no podem ser medidas,

ou seja, so no-numricas.Elas podem ser:

 Nominal : variveis em que no possvel estabelecer uma ordem natural entre seus

valores. Ex.: cor da or, que pode ser rosa, branca ou vermelha; Sexo (feminino ou

masculino).

 Ordinal ou por postos: variveis que tm uma ordenao natural, indicando

intensidades crescentes de realizao. Ex.: Tamanho (pequeno, mdio ou grande),

Classe Social (baixa, mdia ou alta).

Quantitativas: So caractersticas que podem ser contadas ou medidas, sendo classicadas

em discretas e contnuas.

 Discretas: so aquelas variveis que podem assumir somente valores inteiros num

conjunto de valores. gerada pelo processo de contagem. Ex.: nmero de folhas por

planta; nmero de carrapatos por animal; etc.

 Contnuas: so aquelas variveis que podem assumir um valor dentro de um intervalo

de valores. gerada pelo processo de medio ou mensurao. Ex.: volume de gua

em um reservatrio; peso de raiz; dimetro do caule; produo; produtividade; etc.

1.5 Parmetro X Estimador X Estimativa


a) Parmetro: uma medida numrica que descreve alguma caracterstica da populao.

o resumo da varivel observada na populao. Por exemplo, mdia, varincia e desvio

padro.

Cada parmetro representado por um smbolo ou letra. No exemplo tem-se que para a

mdia, a varincia e o desvio padro as letras gregas , 2 e .

No possvel fazer inferncias baseada em parmetro, uma vez que toda a populao foi

investigada.

b) Estimador (tambm chamado de Estatstica): uma medida numrica que descreve

alguma caracterstica de uma amostra, ou seja, o estimador obtido a partir do resumo

da varivel observada na amostra. Neste caso, possvel utilizarmos as teorias inferncias

para que, com base na amostra, possamos obter concluses sobre a populao.

8
Cada estimador tambm representado por um smbolo ou letra. Para a mdia, a varincia

e o desvio padro as letras gregas


b ou X , b2
ou S2 e
b ou S.

c) O valor numrico de um estimador chamado de estimativa de seu respectivo parmetro.

1.6 Exerccios
1. Identique a populao e a amostra.

a) Uma pesquisa com 1906 residncias nos Estados Unidos descobriu que 13% tem

televiso de alta denio.

b) Em uma pesquisa recente, foi perguntado a 1.708 adultos americanos se eles

consideram o aquecimento global um problema que exige uma ao imediata do

governo. Novecentos e trinta e nove deles responderam que sim.

c) O departamento de energia dos Estados Unidos conduz pesquisas semanais em

aproximandamente 800 postos de gasolina para determinar o preo mdio por galo

de gasolina comum. Em 12 de fevereiro de 2007, o preo mdio era $2, 24 por galo.

2. Decida se o valor numrico descreve um parmetro populacional ou uma estatstica .

a) Uma pesquisa recente de uma amostra de MBAs reportou que o salrio mdio para

uma MBA mais do que $82.000.

b) Em uma pesquisa recente com 1.503 adultos nos Estados Unidos, 53% disseram que

usam tanto uma linha xa quanto o telefone celular.

c) Num ano recente, a nota mdia de Estatstica para todos os granduandos na UFPI

era 21,1.

3. Classique cada uma das variveis abaixo em qualitativa (nominal / ordinal) ou

quantitativa (discreta / contnua).

a) Ocorrncia de hipertenso pr-natal em grvidas com mais de 35 anos (sim ou no

so possveis respostas para essa varivel)

b) Inteno de voto para presidente (possveis respostas so os nomes dos candidatos,

alm de no sei).

c) Perda de peso de maratonistas na Corrida de So Silvestre, em quilos.

d) Intensidade da perda de peso de maratonistas na Corrida de So Silvestre

(leve,moderada, forte)

9
e) Cor dos cabelos dos alunos de uma escola

f ) Raa dos alunos de uma certa escola.

g) Nmero de lhos de casais residentes em Vila Velha.

h) Dimetro externo de peas produzidas por certa maquina.

i) Nmero de peas produzidas por hora por certa mquina.

j) Pontos obtidos em cada jogada de um dado.

k) Sexo dos lhos dos casais residentes em Viana.

10
Captulo 2

Estatstica Descritiva

A Estatstica Descritiva a fase na qual os dados de um experimento ou pesquisa, so

organizados, resumidos, descritos, apresentados e interpretados. Esta fase de grande

importncia para uma pesquisa, pois nela, podemos perceber as tendncias do nosso conjunto

de dados. Aps a coleta dos dados experimentais, devemos organiz-los e apresent-los; esta

apresentao, pode ser feita atravs de tabelas e grcos.

2.1 Representao Tabular


2.1.1 Tabelas

A nalidade das tabelas apresentar os dados de modo ordenado, simples e de fcil interpretao,

fornecendo o mximo de informao num mnimo de espao.

A construo de uma tabela, entretanto, deve obedecer a uma srie de normas tcnicas. Estas

normas podem ser encontradas na publicao do IBGE intitulada Normas de Apresentao

Tabular".

Elementos da Tabela

11
Ttulo: a indicao que precede a tabela contendo a designao do fato observado, o

local e a poca em que foi estudado.

Corpo: o conjunto de lihas e colunas onde esto inseridos os dados.

Cabealho: a parte superior da tabela que indica o contedo das colunas.

Coluna indicadora: a parte da tabela que indica o contedo das linhas.

Os elementos complementares so:

Fonte: entidade que fornece os dados ou elabora a tabela.

Notas: informaes de natureza geral, destinadas a esclarecer o contedo das tabelas.

chamadas: informaes especcas destinadas a esclarecer ou conceituar dados numa parte

da tabela.

Os elementos complementares devem situar-se no rodap da tabela, na mesma ordem em

que foram descritos.

2.1.2 Sries Estatsticas

As sries estatsticas resumem um conjunto ordenado de observaes atravs de trs fatores

fundamentais:

tempo: refere-se a data ou a poca em que o fenmeno foi investigado;

espao: refere-se ao local ou regio onde o fato ocorreu;

espcie: refere-se ao fato ou fenmeno que est sendo investigado e cujos valores numricos

esto sendo apresentados.

As sries estatsticas so classicadas de acordo com o fator que estiver variando, podendo

ser simples ou mistas.

1. Sries simples

Srie Cronolgica (temporal, histrica ou evolutiva): onde varia o tempo

permanecendo xos o espao e a espcie do fenmeno estudado.

12
Tabela 2.1: Produo de Petrleo Bruto no Brasil de 1976 a 1980
Anos Produo
1976 9.702
1977 9.332
1978 9.304
1979 9.608
1980 10.562
1
Fonte: Conjuntura Econmica (Fev 1983)

Srie Geogrca (Espacial, ou Territorial, ou de Localizao): onde varia o espao

permanecendo xos o tempo e a espcie do fenmeno estudado.

Tabela 2.2: Necessidades mdias de energia em alguns pases, em 1973.


Pais kcal/per capita/dia
Brasil 2.174
Estados Unidos 2.397
Etipia 2.120
Japo 1.125
Mxico 2.114
2
Fonte: Necessidades Humanas de Energia - IBGE

Srie especicativa (qualitativa ou categrica: onde varia a espcie permanecendo

xos o tempo e o espao do fenmeno estudado.

Tabela 2.3: Populao Urbana e Rural do Brasil em 1980 (x 1000).


Localizao Populao
Urbana 80.408
Rural 38.566
Total 118.974
3
Fonte: Anurio Estatstico (1984)

13
2. Sries mistas: so aquelas em que mais de um fator varia ou um fator varia mais de uma

vez.

Srie histrica geogrca (ou geogrca histrica)

Figura 2.1: Taxa de atividade feminina urbana, em percentual, em trs regies do Brasil, 1981,90

Srie especicativa geogrca (ou geogrca especicativa)

Figura 2.2: Consumo per capita anual de alguns tipos de alimentos, em algumas regies
metropolitanas do Brasil, no ano de 1988

Srie especicativa histrica (ou histrica especicativa)

Figura 2.3: Taxa de mortalidade (em percentual) de menores de um ano no Brasil, segundo as trs
principais causas, no perodo de 1984 a 1987

14
Srie especicativa histrica geogrca

Figura 2.4: Nmero de vtimas em acidentes, segundo as grandes regies do Brasil, nos anos de
1991 e 1992

3. Srie Distribuio de frequncias: ocorre quando nenhum dos fatores varia. Nesta serie os

dados so agrupados em classes segundo suas respecitvas frequncias. Segundo a natureza

dos dados as distribuies de frequncias podem ser de dois tipos:

Para dados de enumerao

Para dados de mensurao

15
2.2 Distribuio de Frequncia
Uma das formas de organizar e resumir a informao contida em dados observados por meio

de tabela de freqncias e grcos.

2.2.1 Tipos de freqncias

Freqncia simples ou absoluta (F): So os valores que realmente representam o nmero

de dados de cada classe.

Freqncia relativa (fr): So os valores das razes entre as freqncias simples e a

freqncia total.

Freqncia acumulada (Fa): o total das freqncias de todos os valores inferiores ao

limite superior do intervalo de uma dada classe.

Freqncia acumulada relativa (Fr): o total das freqncias relativas de todos os valores

inferiores ao limite superior do intervalo de uma dada classe.

2.2.2 Distribuio de Freqncia para Variveis Quantitativas Contnuas

Os principais estgios na construo de uma distribuio de freqncia para dados contnuos

so:

Organizar os dados brutos em um rol de ordem crescente ou decrescente.

16
Determinar Amplitude total ou range"R: a diferena entre o maior e o menor valor

observado.

R = xmax xmin

determinar o nmero de classes da tabela. De modo geral, este valor no dever ser inferior

a 5 e nem superior a 15. Existem algumas regras objetivas de determinao, como, por

exemplo:


k = 1 + 3, 32logn (Frmula de Sturges) ou k
= n (2.1)

onde:

k: nmero de classes

n: nmero de observaes

log : log de base 10

Determinar a amplitude do intervalo (h):

h
=Rk

Construir os intervalos de classe. Os intervalos de classe devem ser escritos, de acordo

com a Resoluo 866/66 do IBGE em termos de desta quantidade at menos aquela",

empregando, para isso, o smbolo | (incluso por limite inferior e excluso do limite

superior).

li+ls
Ponto mdio das classes: pm = 2 onde:

li : limite inferior da classe

ls : limite superior da classe

Exemplo:

A amostra a seguir constituda de 25 valores da varivel dimetro de peas produzidas por

uma mquina", dados em milmetros:

21,2 21,4 21,8 21,5 21,6 21,7 21,6 21,4 21,2 21,7
21,3 21,5 21,7 21,4 21,4 21,5 21,9 21,6 21,3 21,5
21,4 21,5 21,6 21,9 21,5

Determinar a distribuio de frequncia.

Soluo:

17
21,2 21,2 21,3 21,3 21,4 21,4 21,4 21,4 21,4 21,5
21,5 21,5 21,5 21,5 21,5 21,6 21,6 21,6 21,6 21,7
21,7 21,7 21,8 21,9 21,9

Rol dos dados:

Amplitude total: R = xmax xmin = 21, 9 21, 2 = 0, 7



Nmero de Classes: k
= 25 = 5

Amplitude de Classe: h
= R k = 0, 7 5 = 0, 14

Portanto:

Tabela 2.4: N
o de acidentes dirios num estacionamento, durante 50 dias.

Dimetro das peas F Fa xi (ponto mdio) f r%


21, 2 |21, 34 4 4 21,27 16%
21, 34 |21, 48 5 9 21,41 20%
21, 48 |21, 62 10 19 21,55 40%
21, 62 |21, 76 3 22 21,69 12%
21, 76 || 21, 9 3 25 21,83 12%
Total 25 100%

2.3 Representao Grca


2.3.1 Grcos para as Variveis Qualitativas

A representao grca da distribuio de uma varivel tem a vantagem de, rpida e

concisamente, informar sobre sua variabilidade. Existem vrios tipos de grcos para as variveis

Qualitativas. Aqui sero ilustrados trs deles: Grcos em Barras, o de Composio em Setores

(Pizza") e o Grco de Pareto.

Grco em Barras

O grco em Barras consiste em construir retngulos ou barras, em que uma das dimenses

proporcional magnitude a ser representada (n), sendo a outra arbitrria, porm igual para

todas as barras. Essas barras so dispostas paralelamente uma s outras, horizontalmente ou

verticalmente. No exemplo a seguir temos o grco em barras (verticais) para a varivel Grau

de Instruo.

18
Tabela 2.5: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da
Companhia MB segundo o grau de instruo.
Grau de Instruo Frequncia Proporo Porcentagem
Fundamental 12 0,3333 33,33%
Mdio 18 0,5 50,00%
Superior 6 0,1667 16,67%
Total n=36 1,00 100,00%

Tabela 2.6: Fonte: Bussab e Morettin (2012)

Figura 2.5: Grco em Barras para a Varivel Grau de Instruo

Grco de Setores ou Pizza"

O grco de composio em setores (pizza), destina-se a representar a composio, usualmente

em porcentagem, de partes de um todo. Consiste num crculo de raio arbitrrio, representando o

todo, dividido em setores, que correspondem s partes de maneira proporcional. Para o exemplo

anterior temos o seguinte grco:

Figura 2.6: Grco em Setores para a Varivel Grau de Instruo

19
Grco de Pareto

O grco de Pareto um grco de barras representando a freqncia absoluta com um grco de

linha, representando a porcentagem acumulada. Ele exibe a freqncia absoluta e a porcentagem

acumulada no eixo vertical e as categorias da classicao no eixo horizontal (Ver Figura a

seguir). Organizamos sempre as categorias em ordem decrescente da freqncia de ocorrncia,

isto , a de maior freqncia absoluta ca esquerda, seguida pela segunda de maior freqncia,

e assim por diante.

Figura 2.7: Produo de avies em 2000. (Fonte: Boeing Commercial Airplane Company)

2.3.2 Gracos para Variveis Quantitativas


Grco em Barras

O grco em Barras para as variveis quantitativas construdo da mesma forma ao das variveis

qualitativas. Como ilustrao, considere a varivel Nmero de Filhos"dos empregados casados

da seo de oramentos da Companhia MB. A abaixo apresenta os dados.

Tabela 2.7: Freqncias e Porcentagens dos empregados da seo de oramentos da Companhia


MB, segundo o nmero de lhos.
Nm. de Filhos xi Freq. Abs. Fi Freq. relativa fi %
0 4 20
1 5 25
2 7 35
3 3 15
4 0 0
5 1 5
Total n = 20 100

20
Figura 2.8: Grco de Barras para a varivel Nmero de Filhos

Histograma

O histograma um grco de barras contguas, com bases proporcionais aos intervalos de classes

e a rea de cada retngulo proporcional respectiva freqncia relativa. Indicaremos a amplitude

do i -simo intervalo por a i . Para que a rea do retngulo respectivo seja proporcional a fi ,

a sua altura deve ser proporcional a di = fi /hi , que chamada de densidade de freqncia da

i-sima classe. Com essa conveno, a rea total do histograma ser 1 (um).

Exemplo: Considerando a varivel Salrio dos empregados da seo de oramentos da

Companhia MB, temos os seguintes dados:

Tabela 2.8: Freqncias e Porcentagens dos 36 empregados da seo de oramentos da


Companhia MB, por faixas de salrio

Classe de Salrio Fi fi 100 fi Dens. de Freq di = fi /hi


04 |08 10 0,2778 27, 78% 0,0695

08 |12 12 0,3333 33, 33% 0,0833

12 |16 8 0,2222 22, 22% 0,0556

16 |20 5 0,1389 13, 89% 0,0347

20 |24 1 0,0278 2, 78% 0,0070

Total n = 36 1,00 100%

21
Figura 2.9: Histograma da Varivel Salrio

Polgono de Frequncias

um grco em linha, sendo as freqncias marcadas sobre perpendiculares ao eixo horizontal,

levantada pelos pontos mdios dos intervalos de classe.

Figura 2.10: Poligono de Frequncia da Varivel Salrio

Grco em Linhas (ou Grco Temporal)

O grco em linhas utilizado para representar observaes feitas ao longo do tempo, em

intervalos iguais ou no. Tais conjuntos de dados constituem as chamadas sries histricas, ou

sries temporais. Traduzem o comportamento de um fenmeno em certo intervalo de tempo.

22
2.4 Medidas de Posio ou Tendncia Central
Para resumir a quantidade de informao contida em um conjunto de dados, os estatsticos

denem medidas que descreve, atravs de um s nmero, caractersticas dos dados. Algumas

dessas medidas descrevem a tendncia central, isto , a tendncia que os dados tem de se agrupar

em torno de certos valores. Dentre as medidas de tendncia central, destacamos:

Mdia Aritmtica Simples

Mediana

Moda

2.4.1 A Mdia Aritmtica Simples

denida como a soma dos valores do grupo de dados dividida pelo nmero de valores.

PN
xi
Mdia Populacional: = i=1
N
Pn
xi
Mdia Amostral: X= i=1
n

Exemplo: Suponha o conjunto de tempo de servio de cinco funcinrios: 3,7,8,10 e 11.

Determinar a mdia aritmtica simples deste conjunto de dados.

Soluo: Consirando tempo de servio em anos, temos


Pn
i=1 xi 3 + 7 + 8 + 10 + 11
X= = = 7, 8 (2.2)
n 5

Portanto, em mdia, o tempo de servio deste grupo de funionrios de 7,8 anos.

23
Mdia Arimtica para dados agrupados
PN Pn
i=1 xi Fi i=1 xi Fi
= e X=
N n

Observao: Para dados agrupados em intervalo de classe: xi : ponto mdio de cada classe.

Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos

matriculados em uma determinada disciplina:

ESCORES ALUNOS
35 |45 5
45 |55 12
55 |65 18
65 |75 14
75 |85 6
85 |95 3
TOTAL 58

Determinar o desempenho mdio deste grupo de alunos.

Soluo:

ESCORES ALUNOS xi xi Fi
35 |45 5 40 200
45 |55 12 50 600
55 |65 18 60 1080
65 |75 14 70 980
75 |85 6 80 480
85 |95 3 90 270
TOTAL 58 3610

Pn
xi Fi 3610
Assim: X= i=1
n = 58 = 62, 24

Interpretao: o desempenho mdio deste grupo de alunos foi de 62, 24pts.

Caractersticas da Mdia Aritmtica Simples

1. A Mdia Aritmtica Simples dever estar entre o menor e o maior valor observado;

2. A soma algbrica dos desvios calculados entre os valores observados e a mdia aritmtica

igual a zero;

3. Somando-se ou subtraindo-se todos os valores (Xi) da srie por uma constante k (k 6= 0), a
nova mdia aritmtica ser igual a mdia original somada ou subtrada por esta constante

k.

24
4. Multiplicando-se ou dividindo-se todos os valores (Xi) da srie por uma constante k (k 6=
0), a nova mdia aritmtica ser igual a mdia original multiplicada ou dividida por esta

constante k.

Vantagens do emprego da mdia

1. Como faz uso de todos os dados para seu clculo, pode ser determinada com preciso

mtemtica;

2. Pode ser determinada quando somente o valor total e o nmero de elementos forem

conhecidos.

Desvantagens do emprego da mdia

1. No pode ser empregada para dados qualitativos;

2. inuenciada por valores extremos, podendo, em alguns casos, no representar a srie.

2.4.2 Mediana

Construindo o ROL, o valor da mediana o elemento que ocupa a posio central, ou seja, o

elemento que divide a distribuio em 50% de cada lado.

Sejam os elementos x1 , x2 , ..., xn uma amostra, portanto n valores da varivel X . A mediana

da varivel aleatria de X denida por:

n n
Se n for par, ento o valor mediana ser a mdia entre os elementos de ordem
2 e 2 + 1;

x(n/2) + x( n2 +1)
Md = (2.3)
2

n+1
Se n for impar, ento o valor mediana ser o valor localizado na posio
2

M d = x( n+1 )
2

Exemplo : Suponha o conjunto de tempo de servio de cinco funcinrios: 3,7,8,10 e 11.

Determinar a mediana deste conjunto de dados.

Soluo: Temos n=5 impar, logo M d = x( n+1 ) = x3 = 8.


2

Portanto: 50% dos funcionrios possuem at 8 anos de tempo de servio.

25
Exemplo : Suponha o conjunto de tempo de servio de seis funcinrios: 3,7,8,10,11 e 13.

Determinar a mediana deste conjunto de dados.

x(n/2) +x( n +1) x3 +x4 8+10


Soluo: Temos n=6 par, logo Md = 2
2
= 2 = 2 = 9.

Portanto: 50% dos funcionrios possuem at 9 anos de tempo de servio, ou, 50% possuem

no minimo 9 anos de tempo de servio..

Mediana para dados agrupados em uma distribuio de frequncia por valores


simples

Quando os dados estiverem agrupados numa distribuio de frequncia identicamos a mediana

dos valores x1 , x2 , ..., xn pela posio da mediana POS(Md)= n2 atravs da fequncia absoluta Fac

Exemplo 6: Em um determinado dia foi registrado o nmero de veculos negociados por

uma amostra de 10 vendedores de uma agncia de automveis obtendo a seguinte tabela:

veculos negociados xi nmero de vendedores Fi Fa


1 1 1
2 3 4
3 5 9
4 1 10
Total 10

Determinar o valor da mediana.

Soluo:

10
Posio da Mediana: P OS(M d) = 2 = 5, ou seja, quinta posio.

Pela Fa o elementos que se encontra na quinta posio igual a 3, ou seja, M d = 3.

Portanto, 50% dos vendedores comercializam no mximo 3 veculos.

Mediana para dados agrupados em uma distribuio de frequncia por classes

Procedimento

n
Calcula-se a posio da mediana: POS(Md)=
2;

Pela Fac identica-se a classe que contm o valor da mediana;

26
Utiliza-se a frmula:
n P 
2 f
M d = li + h
FM d

Onde:

li = limite inferior da classe mediana;

P
f= soma das frequncias anteriores a classe da mediana;

h= amplitude da classe da mediana;

FM d = frequncia absoluta da classe da mediana.

Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos

matriculados em uma determinada disciplina:

ESCORES ALUNOS Fi Fa
35 |45 5 5
45 |55 12 17
55 |65 18 35
65 |75 14 49
75 |85 6 55
85 |95 3 58
TOTAL 58

Determinar o valor da Mediana.

Soluo:

n 58
Pposio da mediana: POS(Md)=
2 = 2 = 29;

Pela Fac identica-se a classe que contm o valor da mediana a terceira classe;

Utiliza-se a frmula:

n P 
2 f (29 17)
M d = li + h = 55 + 10 = 55 + 6, 67 = 61, 67 (2.4)
FM d 18

Portanto, 50% dos alunos obtiveram escore mximo de 61, 67pts.

2.4.3 Moda

Dentre as principais medidas de posio, destaca-se a moda. o valor mais frequente da

distribuio

27
Sejam os elementos x1 , x2 , ..., xn uma amostra, o valor da moda para este tipo de conjunto

de dados simplesmente o valor com maior frequncia.

Exemplo: Suponha o conjunto de tempo de servio de cinco funcinrios: 3,7,8,8 e 11.

Determinar a moda deste conjunto de dados.

Mo = 8 Distribuio unimodal ou modal.

O tempo de servio com maior frequncia de 8 anos.

Exemplo: Suponha o conjunto de tempo de servio de seis funcinrios: 3,3,7,8,8 e 11.

Determinar a moda deste conjunto de dados.

Mo = 3 e 8 Distribuio bimodal.

O tempo de servio com maior frequncia foram 3 e 8 anos.

Exemplo: Suponha o conjunto de tempo de servio de cinco funcinrios: 3,7,8,10 e 11.

Determinar a moda deste conjunto de dados.

Mo no existe Distribuio amodal.

No existe tempo de servio com maior frequncia.

Moda para dados agrupados em uma distribuio de frequncia por valores simples

Para este tipo de distribuio, a identicao da moda facilitada pela simples observao do

elemento que apresenta maior frequncia. Assim, para a distribuio.

Exemplo Em um determinado dia foi registrado o nmero de veculos negociados por uma

amostra de 10 vendedores de uma agncia de automveis obtendo a seguinte tabela:

veculos negociados nmero de vendedores


1 1
2 3
3 5
4 1
Total 10

Assim, se a maior frequncia Fi = 5, logo M o = 3, ou seja, a quantidade de veculos

comercializados no dia com maior frequncia foi de trs veculos.

28
Moda para dados agrupados em uma distribuio de frequncia por classes

Para dados agrupados em classes, temos diversas frmulas para o calculo da moda. A utilizada

ser:

Frmula de Czuber

Procedimento

Pela Fi identica-se a classe modal (aquela que possui maior frequncia);

Utiliza-se a frmula:
1
M o = li + h
1 + 2

Onde:

li = limite inferior da classe mediana;

1 = Fi Fi,ant ;

2 = Fi Fi,post

h= amplitude da classe modal;

Frmula de Pearson

Mo = 3M d 2X

Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos

matriculados em uma determinada disciplina:

ESCORES ALUNOS Fi Fa
35 |45 5 5
45 |55 12 17
55 |65 18 35
65 |75 14 49
75 |85 6 55
85 |95 3 58
TOTAL 58

Determinar o valor da moda.

Soluo:

29
Pela Fi a classe modal a teceira classe, pois Fi = 18

Utiliza-se a frmula:

1 (18 12)
M o = li + h = 55 + 10 = 55 + 6 = 61 (2.5)
1 + 2 (18 12) + (18 14)

Portanto, o escore com maior frequncia entre o grupo de 58 alunos foi de 61pts.

2.5 Medidas de Disperso


As medidas de disperso indicam se os valores esto relativamente prximos um dos outros,

ou separados em torno de uma medida de posio: a mdia. Consideraremos 3 medidas de

disperso: Amplitude, Varincia, Desvio Padro e Coeciente de Variao.

2.5.1 Motivao

Para preencher uma nica vaga existente em uma empresa, 50 candidatos foram submetidos

a 6 provas sobre conhecimentos especcos de interesse da empresa. Trs destes candidatos

destacaram-se com as notas descritas na tabela abaixo:

Que candidato escolher? Um critrio inicial poderia ser o de escolher o que tem a maior

mdia, mas:

Candidatos A B C
Mdia

De modo anlogo, nem adianta pensar em moda ou mediana, pois:

Candidatos A B C
Moda
Mediana

Soluo: Um segundo critrio de escolha pode ser escolher o candidato que apresentou

notas mais homogneas, isto , aquele que apresentou menor disperso das notas.

2.5.2 Amplitude

A amplitude denida pelo intervalo entre o valor mximo e o valor mnimo da srie de dados,

ou seja,

Amplitude = Mximo Mnimo

Exemplo: Para os trs candidatos temos:

30
Candidatos A B C
Amplitude

2.5.3 Varincia e Desvio Padro

A varincia de um conjunto de dados a mdia dos quadrados dos desvios dos valores a contar

da mdia. A frmula da varincia poder ser calculada de duas formas:

Populacional: representada pela letra grega

(x1 )2
P
2
= (2.6)
N

Amostral: representada por


(x1 X)2
P
S2 = (2.7)
n1
.

Para o calculo do desvio-padro utiliza-se a raiz quadrada da varincia.

Exemplo: Vamos calcular a varincia e o desvio padro para os trs candidatos:

Notas
Candidato A 7,0 7,5 8,0 8,0 8,5 9,0

Soluo:

Mdia: X = 8, 0

Varincia:

2 (7 8)2 + (7, 5 8)2 + (8 8)2 + (8 8)2 + (8, 5 8)2 + (9 8)2 2, 5


SA = = = 0, 5
61 5
(2.8)

Assim: SA = 0, 5
= 0, 7

Notas
Candidato B 6,0 7,0 8,0 8,0 9,0 10

Soluo:

Mdia: X = 8, 0

31
Varincia:

2 (6 8)2 + (7 8)2 + (8 8)2 + (8 8)2 + (9 8)2 + (10 8)2


SB = = = (2.9)
61 5
Assim: SB =

Notas
Candidato C 7,5 8,0 8,0 8,0 8,0 8,5

Soluo:

Mdia: X = 8, 0

Varincia:

(7, 5 8)2 + (8 8)2 + (8 8)2 + (8 8)2 + (8 8)2 + (8, 5 8)2


SC2 = = =
61 5
(2.10)

Assim: SC =

Resumindo

Candidatos Mdia Moda Mediana Amplitude Varincia Desvio Padro


A 8,0 8,0 8,0
B 8,0 8,0 8,0
C 8,0 8,0 8,0

Varincia e Desvio padro para dados agrupados em uma distribuio de frequncia

Quando os dados estiverem agrupados numa distribuio de frequencia usaremos a varincia

dos valores x1 , x2 , ..., xn ponderados pelas respectivas frequncias absolutas. Assim:

(x1 )2 Fi (x1 X)2 Fi


P P
2 2
= ou S =
N n1

Observao: Para uma distribuio de frequncia por classe, xi representa o ponto mdio

de cada classe.

Exemplo Em um determinado dia foi registrado o nmero de veculos negociados por uma

amostra de 10 vendedores de uma agncia de automveis obtendo a seguinte tabela:

Determinar o calculo do desvio-padro

32
veculos negociados nmero de vendedores
1 1
2 3
3 5
4 1
Total 10

Soluo:
2 2
veculos negociados nmero de vendedores xi Fi xi X xi X Fi
1 1 1 2,56 2,56
2 3 6 0,36 1,08
3 5 15 0,16 0,80
4 1 4 1,96 1,96
Total 10 26 5,04 6,40

Como X = 2, 6, ento S 2 = 0, 71veculos2 S = 0, 84veculos. Portanto, o desvio padro

do exemplo foi de 0,84 veculos. Ou seja, se calcularmos um intervalo utilizando um desvio

padro em torno da mdia, encontramos a concentrao da maioria dos veculos negociados por

vendedor.

Exemplo: A tabela abaixo representa os escores obtidos por um grupo de 58 alunos

matriculados em uma determinada disciplina:

ESCORES ALUNOS
35 |45 5
45 |55 12
55 |65 18
65 |75 14
75 |85 6
85 |95 3
TOTAL 58

Determinar o desvio-padro.

Soluo:
2 2
ESCORES ALUNOS xi xi Fi xi X xi X Fi
35 |45 5 40 200 494,62 2.473
45 |55 12 50 600 149,82 1.797,84
55 |65 18 60 1.080 5,02 90,36
65 |75 14 70 980 60,22 843,08
75 |85 6 80 480 315,42 1.892,52
85 |95 3 90 270 770,62 2.312,86
TOTAL 58 3.610 9.409,66

33
Como X = 62, 24, ento S 2 = 165, 1pontos2 S = 12, 85pontos. Portanto, o desvio padro

do exemplo foi de 12,85 pontos. Ou seja, se calcularmos um intervalo utilizando um desvio

padro em torno do escore mdio de 62,24, encontraremos a concentrao da maioria dos alunos

dentro deste intervalo de pontuao.

2.5.4 Propriedades das medidas de disperso

1. Todas as medidas de dispersao sao nao negativas!

2. Somando-se uma mesma constante a todas as observaes, as medidas de dispersao nao

se alteram.

3. Ao multiplicarmos todos os dados por uma constante k no nula, temos que:

y2 = k 2 x2

y = |k| x

2.5.5 Coeciente de Variao

Considere a seguinte situao:

Uma fbrica de ervilhas comercializa seu produto em embalagens de 300 gramas e em

embalagens de um quilo ou 1000 gramas. Para efeitos de controle do processo de enchimento das

embalagens, sorteia-se uma amostra de 10 embalagens de cada uma das mquinas, obtendo-se

os seguintes resultados:


x = 295g
300g (2.11)
= 5g


x = 995g
1000g (2.12)
= 5g

Na primeira mquina, as embalagens deveriam est fornecendo peso de 300g mas, devido a

erros de ajuste da mquina de enchimento, o peso mdio das 10 embalagens de apenas 295g .
O desvio padro de 5g signca que, em mdia, os pesos das embalagens esto 5 gramas abaixo

ou acima do peso mdio das 10 latas. Uma interpretao anloga vale para a segunda mquina.

Em qual das duas situaes a variabilidade parece ser maior? Ou seja, em qual das duas

mquinas parece haver um problema mais srio? Note que, em ambos os casos, h uma disperso

de 5g em torno da mdia, mas 5g em 1000g menos preocupante que 5g em 300g .

34
Surge assim, a necessidade de uma medida de disperso relativa, que permita comparar, por

exemplo, esses dois conjuntos. Umas dessas medidas o Coeciente de Variao.


Denio: Dado um conjunto de observaes x1 , x2 , . . . , xn o coeciente de variao (CV)

denido como a razo entre o desvio padro dos dados e sua mdia, ou seja:

S
CVpopulacional = 100 ou CVamostral = 100
X
No exemplo das latas de ervilha, os coecientes de variao para as embalagens oriundas das

2 mquinas so:

5
300g CV = 100 = 1, 67%
300
5
1000g CV = 100 = 0, 5%
1000

o que conrma a nossa observao anterior: a variabilidade na mquina de 300g

relativamente maior.

2.6 Exerccios
1. Faa o grco de barras, o de composio em setores e o de Pareto para os dados fornecidos

na Tabela abaixo.

Tabela 2.9: Defeitos em elementos estruturais da porta


Tipo de Defeito Frequncia absoluta
Partes Salientes 5
Fora do Contorno 30
Partes mal aparadas 25
Total 60

2. Observe a sua conta de luz de 2015 e construa um grco temporal e um grco de

barras,colocando no eixo x, os meses (janeiro, ..., dezembro) e no eixo y, consumo de

energia (em kWh).

3. Foram coletados aleatoriamente 5 empregados de 3 empresas (A, B e C) e perguntado

para cada um deles o seu salrio (em salrios mnimos). Se estas 3 empresas estivessem

oferecendo emprego, em qual delas voc trabalharia sendo que o resultado da pesquisa

com os 15 funcionrios entrevistados foi:

35
Empresa A Empresa B Empresa C
5,5 4 5
6 5 6
6 6 6
6 6 6
6,5 9 7

Obs: Obtenha a Amplitude, Varincia e Desvio Padro de cada empresa para tomar sua

deciso.

o
4. A distribuio abaixo indica o N de acidentes ocorridos com 70 motoristas de uma

empresa de nibus: Determine:

N
o ACIDENTES 0 1 2 3 4 5 6 7
o
N MOTORISTAS 20 10 16 9 6 5 3 1

a) O nmero de motoristas que no sofreram nenhum acidente.

b) O nmero de motoristas que sofreram pelo menos 4 acidentes.

c) O nmero de motoristas que sofreram menos de 3 acidentes.

d) O nmero de motoristas que sofreram no mnimo 3 e no mximo 5 acidentes.

d) A percentagem dos motoristas que sofreram no mximo 2 acidentes.

5. A tabela abaixo apresenta uma distribuio de freqncia das reas de 400 lotes:

reas (m )
2 nmero de lotes
300| 400 14
400| 500 46
500| 600 58
600| 700 76
700| 800 68
800| 900 62
900| 1.000 48
1.000| 1.100 22
1.100| 1.200 6

Com referencia a essa tabela determine:

a) A amplitude total.

b) A amplitude de cada classe.

c) A freqncia da quarta classe.

d) A freqncia relativa da sexta classe.

36
e) A freqncia acumulada da quinta classe.

f) O N
o de lotes cuja rea no atinja 700m2 .

g) O N
o de lotes cuja rea atinja e ultrapasse 800m2 .

h) A percentagem dos lotes cuja rea no atinja 600m2 .

i) A percentagem dos lotes cuja rea seja maior ou igual a 900m2 .

j) A percentagem dos lotes cuja rea de 500m2 no mnimo, mas inferior a 1000m2 .

6. Uma pesquisa com usurios de transporte coletivo na cidade de So Paulo indagou sobre os

diferentes tipos usados nas suas locaes dirias. Dentre nibus, metr e trem, o nmero

de diferentes meios de transporte utilizados foi o seguinte:

a) Organize uma tabela de freqncia e complete com a frequncia relativa e acumulada.

b) Faa uma representao grca.

c) Admitindo que essa amostra represente bem o comportamento do usurio paulistano,

voc acha que a porcentagem dos usurios que utilizam mais de um tipo de transporte

grande?

d) Determine a mdia, moda e mediana.

e) Determine o desvio-padro.

7. o tempo de ignio fria"de um motor de carro est sendo investigado por um fabricante

de gasolina. Os seguintes tempos(em segundos) foram obtidos em um veculo de teste:

1, 75; 1, 92; 2, 62; 2, 35; 3, 09; 3, 15; 2, 53; e 1, 91.

Calcule a mdia e o desvio padro da amostra.

8. O Departamento pessoal de uma certa rma fez um levantamento dos salrios dos 120

funcionrios do setor administrativo, obtendo os resultados (em salrios mnimos) da

tabela abaixo.

a) Esboce o histograma correspondente.

b) Calcule a mdia, mediana, varincia e o desvio padro

37
c) Se for concedido um aumento de 100% para todos os 120 funcionrios, haver

alterao na mdia? E na varincia? Justique sua resposta.

d) Se for concedido um abono de dois salrios minimos para todos os 120 funcionrios,

haver alterao na mdia? E na varincia? E na mediana? Justique sua resposta.

Faixa salarial Frequncia relativa


0| 2 0,25
2| 4 0,40
4| 6 0,20
6| 8 0,15

9. Faa uma anlise comparativa do desempenho dos alunos e alunas de uma turma de

Estatstica, segundo as notas dadas a seguir. Para isso, calcule a mdia, o desvio padrao

e o coeciente devariaocomentando os resultados.

Homens 4,5 6,1 3,2 6,9 7,1 8,2 3,3 2,5 5,6 7,2 3,4
Mulheres 6,3 6,8 5,9 6,0 4,9 6,1 6,3 7,5 7,7 6,5

38
Captulo 3

Variveis Aleatrias

Denio: Considere o espao amostral associado ao experimento aleatrio . Dene-se a

varivel aleatria X como uma funo que associa um nmero real X(w) a cada elemento do

espao amostral, w .

X:R

Representamos as variveis aleatrias por letras maisculas e suas ocorrncias por letras

minsculas.

As variveis aleatrias podem ser discretas e continuas.

Discretas: Se o nmero de valores possveis de X (isto seu contradomnio), for nito ou

innito enumervel, isto , existe um conjunto nito ou enumervel {x1 , x2 , . . . , } R tal que

X(w) {x1 , x2 , . . . , }w

Contnuas: X uma varivel aleatria contnua, se o contradominio de X for um intervalo

ou uma coleo de intervalos.

3.1 Varivel Aleatria Discreta


Exemplos:

1. Lana-se uma moeda 10 vezes e anota-se o nmero de caras. Este nmero pode ser

0, 1, 2, . . . , 10.

2. Em uma pesquisa de mercado feita com 200 pessoas, perguntam-se estes compram um

determinado produto. O nmero de pessoas que compram o produto varia de 0 a 200.

39
3. Conta-se o n
o de acidentes que ocorrem em uma rodovia num feriado prolongado. O

nmero de acidentes em questo pode ser: 0, 1, 2, . . . Como no temos um valor que limite
esse nmero, supomos que o nmero de acidentes qualquer inteiro no negativo.

4. Nmero de chamadas telefnicas que chegam a uma central em um intervalo de tempo.

Muitos experimentos produzem resultados no-numricos. Antes de analis-los,

conveniente transformar seus resultados em nmeros. Isto feito atravs da varivel aleatria

que uma funo que associa um valor numrico a cada ponto do espao amostral. Para

entender melhor o conceito, considere o seguinte exemplo.

Representamos as variveis aleatrias por letras maisculas e suas ocorrncias por letras

minsculas.

Exemplo 1: Suponha o experimento: lanar trs moedas. Seja X: nmero de ocorrncias

da face cara. O espao amostral do experimento :

= {(ccc), (cck), (ckc), (ckk), (kcc), (kck), (kkc), (kkk)}.

Se X o nmero de caras, X assume os valores 0, 1, 2, 3. Podemos associar a esses nmeros

eventos que correspondem a nenhuma, uma, duas ou trs caras respectivamente, como segue:

X Evento correspondente
0 A1 = {(kkk)}
1 A2 = {(ckk), (kck), (kkc)}
2 A3 = {(cck), (ckc), (kcc)}
3 A4 = {(ccc)}

Denio: Uma v.a Discreta se o nmero de valores possveis de X (isto seu

contradomnio), for nito ou innito enumervel.

3.1.1 Funo de Probabilidade

Seja X uma varivel aleatria discreta. Deni-se Funo de Probabilidade a funo que associa

a cada valor assumido pela varivel aleatria X a probabilidade do evento correspondente, isto

p(xi ) = P (X = xi ) = P (Ai ), i = 1, 2, . . . .

Os nmeros p(xi ) devem satisfazer as seguintes condies:

40
0 p(xi ) 1;
P
i=1 p(xi ) = 1.

Ao conjunto {(xi , p(xi )), i = 1, 2, . . .}, denominado distribuio de probabilidade de

X.

Exemplo 2: Para o exemplo 1, determinar a distribuio de probabilidade de X.

Distribuio de Probabilidade de X

X p(x) = P (X = x)
0 1/8
1 3/8
2 3/8
3 1/8

Grco:

Exemplo 3: Considere o experimento  : Lanar dois dados. Seja X a soma das faces,

determinar a distribuio de probabilidade de X.

Considere o espao amostral:

2 = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6)
(2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6)
(3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6)
(4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)
(5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6)
(6, 1), (6, 2), (6, 3), (6, 4), (6, 5), 6, 6)}

A distribuio de Probabilidade de X :

41
X Evento p(x) = P (X = x)
2 {(1, 1)} 1/36
3 {(1, 2), (2, 1)} 2/36
4 {(1, 3), (2, 2), (3, 1)} 3/36
5 {(1, 4), (2, 3), (3, 2), (4, 1)} 4/36
6 {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} 5/36
7 {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)} 6/36
8 {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)} 5/36
9 {(3, 6), (4, 5), (5, 4), (6, 3)} 4/36
10 {(4, 6), (5, 5), (6, 4)} 3/36
11 {(5, 6), (6, 5)} 2/36
12 {(6, 6)} 4/36

Gracamente:

3.1.2 Funo de Distribuio Acumulada

Denio: A funo de distribuio ou funo de distribuio acumulada de X, representada

por FX ou simplesmente por F, denida por:

FX (x) = P (X x)x R

Propriedades

0 FX (x) 1;

FX () = 0 e FX () = 1;

42
P (a < X b) = FX (b) FX (a);

A funo FX (x) no-decrescente, isto , x1 x2 temos FX (x1 ) FX (x2 )

Tendo em mente que FX (x) = P (X x), podemos observar que:

1. P (X > a) = 1 P (X a) = 1 FX (a)

2. P (a < X b) = FX (b) FX (a)

3. P (X = a) = P (X a) P (X < a) = FX (a) FX (a ). Ou seja, P (X = a) o tamanho

do salto da funo de distribuio em x = a. Se a funo for contnua no ponto x=a


ento P (X = a) = 0

4. P (a < X < b) = FX (b ) FX (a)

5. P (a X < b) = FX (b ) FX (a )

6. P (a X b) = FX (b) FX (a )

Teorema 1: Se X for uma varivel aleatria discreta,

X
FX (x) = p(xi ),
i

onde o somatrio estendido a todos os ndices i que satisfaam condio xi x.

Exemplo 4: Considerando o exemplo 3. Calcule a funo de distribuio acumulada de X.

3.1.3 Esperana Matemtica

Assim como denimos a mdia de uma distribuio de freqncias como a soma dos produtos dos

diversos valores observados pelas respectivas freqncias relativas, natural denirmos agora

a mdia de uma v.a., ou de sua distribuio de probabilidade, como a soma dos produtos dos

diversos valores de xi da v.a. pelas respectivas probabilidades p(xi ).

Denio: Dada uma varivel aleatria discreta X, assumindo os valores x1 , . . . , xn ,


chamamos valor mdio ou Esperana matemtica de X ao valor:

43
n
X n
X
E(X) = xi p(xi ) = xi P (X = xi ).
i=1 i=1

uma mdia ponderada dos xi , em que os pesos so as probabilidades associadas.

Exemplo 5: Um lojista mantm extensos registros das vendas dirias de certo aparelho.

O quadro a seguir d o nmero xi de aparelhos vendidos em uma semana e a respectiva

probabilidade:

Nmero xi 0 1 2 3 4 5
Probabilidade p(xi ) 0,1 0,1 0,2 0,3 0,2 0,1

Se for de R$20, 00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma

semana?

Soluo: Calculemos inicialmente E(X), que o nmero esperado de aparelhos vendidos

em uma semana:

E(X) = (0)(0, 1) + (1)(0, 1) + (2)(0, 2) + (3)(0, 3) + (4)(0, 2) + (5)(0, 1) = 2, 70.

Para x unidades vendidas o lucro 20x. Logo, o lucro esperado de R$54, 00.

Exemplo: Suponhamos que um nmero seja sorteado de 1 a 10, inteiros positivos. Seja X
o nmero de divisores do nmero sorteado. Calcular o nmero mdio de divisores do nmero

sorteado.

Soluo: X: nmero de divisores, logo:

Nmero 1 2 3 4 5 6 7 8 9 10
Num. de divisores 1 2 2 3 2 4 2 4 3 4

Assim:

X p(x) = P (X = x) X p(x)
1 1/10 1/10
2 4/10 8/10
3 2/10 6/10
4 3/10 12/10
Total 1 2,7

Portanto: E(X) = 2, 7 Nmero mdio de divisores do nmero sorteado

Algumas Propriedades da Esperana

Sejam a, b 6= 0 constantes reais quaisquer.

44
E(a) = a

E(X a) = E(X) a;

E(bX) = bE(X);

E(a + bX) = a + bE(X);

Se X1 , . . . , Xn so n variveis aleatrias tais que E(Xi ) existe (i = 1, . . . , n), ento

E(X1 + . . . + Xn ) = E(X1 ) + . . . + E(Xn )

3.1.4 Varincia

Denio: Suponha que X uma varivel aleatria com mdia = E(X). A varincia de X,
representada por V ar(X) denida por:

V ar(X) = E[(x )2 ], onde = E(X)

Denio: Dada uma varivel aleatria discreta X, cuja funo de distribuio p(x).
Ento, a varincia de X denida por:

X
V ar(X) = (x )2 p(x).
x

Algumas Propriedades da Varincia

Sejam a, b 6= 0 constantes reais quaisquer.

V ar(a) = 0;

V ar(X a) = V ar(X);

V ar(bX) = b2 V ar(X);

V ar(a + bX) = b2 V ar(X);

Se X1 , . . . , Xn so n variveis aleatrias independentes, ento

V ar(X1 . . . Xn ) = V ar(X1 ) + . . . + V ar(Xn )

45
3.1.5 Desvio Padro

A unidade de medida da varincia o quadrado da unidade de medida da varivel em estudo,

sendo assim, uma unidade sem signicado fsico. Para se ter uma medida de disperso na mesma

unidade dos dados, dene-se o desvio padro como a raiz quadrada da varincia.

p
DP (X) = V ar(X)

3.2 Varivel Aleatria Contnua


Exemplos:

1. Mede-se a altura de uma mulher em uma cidade. O valor encontrado um nmero

real. Aqui tambm sabemos que esse nmero no passa de 3 metros, mas conveniente

considerar qualquer n
o real positivo.

2. Em um exame fsico para selecionar um jogador de futebol medido o peso de cada

candidato; aqui tambm consideramos que o resultado pode ser qualquer nmero real

positivo.

3. Em campanhas preventivas de hipertenso arterial comum de tempos em tempos medir-

se o nvel de colesterol. O valor de cada medida pode ser um nmero real no negativo.

4. Para pacientes que se apresentam num hospital a primeira atitude medir-se a

temperatura; o valor da temperatura um nmero real que

5. Retira-se uma lmpada da linha de produo e coloca-se a mesma em um soquete

acendendo-a;

observa-se a mesma at que se queime. O tempo de durao da lmpada um n


o real no

negativo. Nos exemplos de 1 a 5, o nmero observado no experimento aleatrio um nmero

real e resulta em geral de uma medio:

altura das mulheres;

nvel de colesterol;

temperatura;

tempo de durao da lmpada.

46
Denio: Seja X uma varivel aleatria. Suponha que os possveis valores de X seja um

intervalo que possui innitos valores, ento diremos que X uma varivel aleatria contnua.

3.2.1 Funo densidade de Probabilidade (f.d.p)

Seja X uma varivel aleatria contnua. A funo densidade de probabilidade fX (x)


indicada por f.d.p uma funo que satisfaz as seguintes condies:

fX (x) 0;
R
fX (x)dx =1

Alm disso, denimos, para qualquer c (em RX )

Z b
P (a < x < b) = fX (x)dx,
a

observao:

P (a < x < b) representa a rea sob a curva da f.d.p, entre x=c e x = d;

Constitue uma consequncia da descrio probabilstica de X que, para qualquer valor


R x0
especicado de X, digamos x0 , teremos P (X = x0 ) = x0 fX (x)dx = 0.

Exemplo 5: Suponhamos que a varivel aleatria X seja contnua. Seja a funo fX (x)
denida por: 
2x, se 0<x<1
fX (x) = (3.1)
0, caso contrrio .
Verique se fX (x) uma funo densidade de probabilidade.

R1
Soluo: fX (x) f.d.p de X se
0 fX (x)dx = 1.

47
R1
Mas:
0 2xdx = x2 |10 = 1 0 = 1, logo fX (x) f.d.p de X.

Exemplo 6: Suponhamos que a varivel aleatria X seja contnua. Seja a funo fX (x)
denida por:
cx2 ,

se 0<x<2
fX (x) = (3.2)
0, caso contrrio .
Qual o valor da contante c para que fX (x) seja uma funo densidade de probabilidade?

R2
Soluo: fX (x) f.d.p de X se
0 fX (x)dx = 1

Mas:
2
x3 2
Z
8c 3
cx2 dx = 1 c |0 = 1 =1c= (3.3)
0 3 3 8

Exemplo 7 : Um fabricante de televiso a cores oferece uma garantia de 1 ano para

substituio gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de

anos), x, como uma varivel aleatria contnua com a seguinte fdp

1 x/4

fX (x) = 4e , se x>0
(3.4)
0, caso contrrio .

Qual a probabilidade de voc comprar a televiso e necessitar de uma substituio gratuita?

R0 1 x/4
Soluo: P (X 1) = 1 4e dx = 0, 2

3.2.2 Funo de distribuio acumulada

Teorema 2 Se X for uma varivel aleatria contnua com f.d.p fX (x),


Z x
FX (x) = fX (s)ds.

Exemplo 8: Considerando o exemplo 5. Calcule a funo de distribuio acumulada de X.

3.2.3 Esperana e Varincia

Denio: Seja X uma v.a contnua. O valor mdio ou esperana matemtica de X denido

por: Z
E(X) = xfX (x)dx

Denio: Dada uma varivel aleatria contnua X , cuja funo densidade de probabilidade

fX (x). Ento, a varincia de X denida por:

48
Z Z
2
V ar(X) = (x ) fX (x)dx = x2 fX (x)dx 2 .

Exemplo 9: Seja 
kx, se 0<x1
fX (x) = (3.5)
0, caso contrrio .
Determinar:

a) k a m de que f (x) seja f.d.p.


R  
x2
R1
Soluo:
fX (x)dx = 1 0 kxdx = 1 k 2 |10 = 1 Portanto k = 2.

b) P (0 X 1/2).
R 1/2 1/2
Soluo: P (0 X 1/2) = 0 2xdx = x2 |0 = 41 .

c) E(X) e V ar(X)
R  
x3
R1 R1 2
Soluo: E(X) = xfX (x)dx = 0 x2xdx = 0 2x2 dx = 2 3 |10 = 3

R  
x4
R1 R1 1
E(X 2 ) = 2
x fX (x)dx = 0 x2 2xdx = 0 2x3 dx = 2 4 |10 = 2

1 1
Portanto: V ar(X) = E(X 2 ) [E(X)]2 = 2 49 = 18

Exemplo 10: Seja X o tempo durante o qual um equipamento eltrico usado em carga

mxima, num certo perodo de tempo, em minutos. A funo densidade de probabilidade de X


dada por:

1

5002
x, se0 x < 1.500
fX (x) = 1 (3.6)
5002
(3.000 x), se 1.500 x 3.000

Calcular E(X), ou seja, o tempo mdio em que o equipamento ser utilizado em carga

mxima.

49
Captulo 4

Alguns Modelos Probabilsticos


Discretos e Continuos

4.1 Modelos Probabilisticos Discretos


4.1.1 Distribuio de Bernoulli

Muitos experimentos so tais que os resultados apresentam ou no uma determinada

caracterstica. Por exemplo:

1. uma moeda lanada: o resultado ou cara, ou no (ocorrendo, ento, coroa);

2. um dado lanado: ou ocorre face 5 ou no (ocorrendo, ento, umas das faces 1,2,3,4 ou

6);

3. uma pea escolhida ao acaso de um lote contendo 500 peas: essa pea defeituosa ou

no;

4. uma pessoa escolhida ao acaso entre os moradores de uma cidade e verica-se se ela

favorvel ou no a um projeto social.

Um experimento de Bernoulli um experimento aleatrio com apenas dois resultados

possveis; por conveno, um deles chamado sucesso e o outro fracasso.

Consideremos uma unica tentativa de um experimento aleatrio, cujo resultado pode ser

sucesso ou fracasso nessa tentativa.

50
Seja X: nmero de sucessos em uma nica tentativa do experimento.

0, fracasso, com P (X = 0) = q = 1 p
X= (4.1)
1, sucesso, com P (X = 1) = p.

Denio A v.a X que assume apenas os valores 0 e 1 com funo de probabilidade p(x),
tal que: p(0) = P (X = 0) = 1 p = q e p(1) = P (X = 1) = p, chamada varivel aleatria de

Bernoulli, e sua funo de distribuio dada por:

P (X = x) = px q 1x , x = 0, 1.

Notao: X Bernoulli(p)
1 x 1 1x
 
Exemplo: Se X Bernoulli(1/2) p(x) = 2 2

Caractersticas

E(X) = p;

V ar(X) = p(1 p);

Exemplo: Uma urna contm 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna.

Seja a v.a X: nmero de bolas verdes. Determinar a funo de probabilidade de X, p(x), E(X)
e V ar(X).

4.1.2 Distribuio Binomial

Este modelo fundamenta-se nas seguintes hiptes:

1. n provas independentes e do mesmo tipo so realizadas, ou seja, n ensaios de Bernoulli;

2. cada prova admite apenas dois resultados: sucesso ou fracasso.

3. a probabilidade de sucesso em cada prova p e de fracasso 1 p.

Considere agora as seguintes situaes, obtidas de (1) a (4) da seo anterior:

1. uma moeda landa trs vezes: qual a probabilidade de se obter duas caras?

2. um dado lanado cinco vezes: qual a probabilidade de se obter face 5 no mximo trs

vezes?

51
3. dez peas so extradas, ao acaso, com reposio, de um lote contendo 500 peas; qual a

probabilidade de que todas sejam defeituosas, sabendo-se que 10% das peas do lote so

defeituosas?

4. sabe-se que 90% das pessoas de uma cidade so favorveis a um projeto municipal.

Escolhendo-se 100 pessoas ao acaso entre os moradores, qual a probabilidade de que

pelo menos 80 sejam favorveis ao projeto?

Seja X: nmero de sucessos em n tentativas de um experimento. Logo X pode assumir os

valores: 0, 1, . . . , n. A funo de distribuio de probabilidade da v.a X denida por:

   
n x nx n n!
P (X = x) = p q , x = 0, 1, . . . , n e = (4.2)
x x (n x)!x!

Notao: X Binomial(n, p)
 
4 1 x
 1 4x

Exemplo: Se X Binomial(4, 1/2) p(x) = 2 2 ,x = 0, 1, 2, 4
x

Caractersticas

E(X) = np;

V ar(X) = npq .

Exemplo: Uma moeda no viciada lanada 20 vezes. Qual a probabilidade de sairem 8

caras?

Exemplo: As linhas telefnicas em um sistema de reservas de uma companhia area esto

ocupadas 40% do tempo. Suponha que os eventos em que as linhas estejam ocupadas em

sucessivas chamadas sejam independentes. Considere que 10 chamadas aconteam.

a) Qual a probabilidade de que, para exatamente trs chamadas, as linhas estejam

ocupadas?

b) Qual a probabilidade de que, para no mnimo uma chamada, as linhas estejam ocupadas?

c) Qual o nmero esperado de chamadas em que todas as linhas estejam ocupadas?

4.1.3 Distribuio Geomtrica

Considere as seguintes situaes:

52
1. uma moeda com probabilidade p de cara lanada at que aparea cara pela primeira vez;

2. Considere uma populao muito grande onde p% das pessoas sofrem de uma doena

desconhecida. Precisa-se encontrar uma pessoa portadora da doena para que os mdicos

possam estud-la. Quantas pessoas teremos que examinar at encontrar uma portadora?

Em ambas as situaes, cada repetio do experimento (lanamento da moeda ou exame

de uma pessoa) tem dois resultados possveis (cara ou coroa e Portadora ou no portadora da

doena), ou seja, temos experimentos de Bernoulli.

Consideremos repeties independentes de um experimento de Bernoulli com parmetro p.


Cada tentativa admite sucesso com probabilidade p e fracasso com probabilidade q , p + q = 1.

Seja X: nmero de tentativas necessrias ao aparecimento do primeiro sucesso. Logo a

varivel assim denida tem distribuio geomtrica com:

P (X = x) = q x1 p, x = 1, 2, 3, .....

E(X) = 1/p;

V ar(X) = q/p2 .

As caractersticas denidoras desse modelo so: (i) repeties de um mesmo experimento de

Bernoulli, o que signica que em todas elas a probabilidade de sucesso (e, portanto, de fracasso)

a mesma e (ii) as repeties so independentes.

Exemplo: Joga-se um dado equilibrado. Qual a probabilidade de serem necessrios 10

lanamentos at a primeira ocorrncia de um seis?

Exemplo: Um atirador acerta na mosca do alvo, 20% dos tiros. Qual a probabilidade de ele

acertar na mosca pela primeira vez no 10o tiro?

4.1.4 Distribuio Poisson

Consideremos a probabilidade de ocorrncia de sucesso em um determinado intervalo.

Este modelo descreve processos aleatrios, tais como, o nmero de chamadas telefnicas, que

chegam a uma central, por minuto; o nmero de acidentes de comboio, num certo intervalo de

tempo; o nmero de participaes feitas a uma companhia de seguros, por unidade de tempo;

53
o nmero de defeitos por 1000 metros de cabo elctrico e o nmero de defeitos por linha de

montagem.

Sempre que a probabilidade de ocorrncia de um acontecimento grande, mas a

probabilidade dessa ocorrncia num dado intervalo de tempo (pequeno) relativamente pequena,

usamos o modelo de Poisson.

A mdia desta distribuio dada por

A probabilidade do evento ocorrer x vezes em um intervalo dada a seguir:

Seja X: o nmero de sucessos no intervalo, ento:

A varivel aleatria discreta X tem distribuio de Poisson com parmetro , se sua funo

de distribuio de probabilidade dada por

x
P (X = x) = e , x = 0, 1, 2, . . .
x!

E(X) = V (X) = ;

Exemplo Numa central telefnica chegam 300 telefonemas por hora. Qual a probabilidade

de que:

a) num minuto no haja nenhum chamado?

b) em 2 minutos haja 2 chamadas?

c) em t minutos no haja chamadas?

4.2 Modelos Probabilsticos Contnuos


4.2.1 Distribuio Uniforme

Uma varivel aleatria contnua X tem distribuio uniforme no intervalo [a, b] (nito) se sua

funo de densidade constante nesse intervalo, ou seja, temos que ter

f (x) = k, x [a, b]

Ento, o grco da f.d.p. de X como o ilustrado na Figura abaixo:

54
Figura 4.1: Densidade uniforme no intervalo [a, b]

Logo, a funo de densidade de uma v.a. uniforme no intervalo [a, b] dada por:

1

ba se axb
fX (x) = (4.3)
0 caso contrrio

Os valores a e b so chamados parmetros da distribuio uniforme; note que ambos tm que


ser nitos para que a integral seja igual a 1. Quando a=0 e b=1 temos a uniforme padro,

denotada por U (0, 1).

Funo de distribuio acumulada

Por denio, temos que FX (x) = P (X x) e essa probabilidade dada pela rea sob a curva

de densidade esquerda de x. Logo:


0 x<a
se
xa
FX (x) = se a x b (4.4)
ba
1 se x b

O grco dessa f.d.a. dado na Figura abaixo:

4.2.2 Esperana e Varincia


a+b
E(X) = 2 ;

(ba)2
V (X) = 12 .

55
4.2.3 Exemplo

Um ponto escolhido ao acaso no segmento de reta [1, 4]. Calcular:

a) probabilidade de que o ponto escolhido esteja entre 2 e 3;

b) entre 0,5 e 2,5;

c) seja exatamente o 2;

d) a mdia dessa distribuio;

e) a varincia dessa distribuio.

4.2.4 Distribuio Exponencial

A distribuio exponencial um modelo para um tempo de vida com taxa de falha constante.

Uma varivel aleatria X tem distribuio exponencial com parmetro se sua densidade

de probabilidade da forma:

ex

se x0
fX (x) = (4.5)
0 caso contrrio

onde o parmetro uma constante real positiva. A gura mostra um grco da densidade

exponencial.

Como a f.d.p. exponencial depende apenas do valor de , esse o parmetro da densidade

exponencial. Ento, usaremos a notao X exp() para indicar o fato de que a v.a. X tem

distribuio exponencial com parmetro .

56
Funo de distribuio acumulada

Por denio, temos que:

1 ex

se x>0
FX (x) == P (X x) (4.6)
0 se x0

O grco dessa f.d.a. dado na Figura abaixo:

Mdia e Varincia da Distribuio Exponencial

1
E(X) =

1
V (X) = 2

Exemplos

1. Uma v.a contnua X tem fdp dada por:

k/2ex

se x0
fX (x) = (4.7)
0 se x<0

a) Calcular o valor de k;

b) Determinar F (x);

c) Determinar a mediana da distribuio.

2. Seja X exp(4). Calcule:

a) Calcula P (X > 1);

b) Calculer P (1 X 2);

57
4.2.5 A Distribuio Normal
A distribuio Normal a distribuio de probabilidade mais usada na Estatstica, pois

serve de modelo para um grande nmero de variveis contnuas e tambm como modelo

aproximado para outras distribuies de probabilidade (Binomial, Poisson, etc).

Uma varivel aleatria contnua X, denida para todos os valores da reta real, tem

densidade normal com parmetros e 2, onde < < e 0 < 2 < , se sua

funo de densidade de probabilidade dada por:

"  2 #
1 1 x
fX (x) = exp <x< (4.8)
2 2 2

onde: > 0, e = 2, 718282, = 3, 14159...

Ser usada a seguinte notao para indicar que uma v.a. X tem distribuio normal com

parmetros 2
e : X N (, 2 ).

Propriedades da Distribuio Normal

A distribuio normal tem vrias propriedades importantes.

(a) fX (x) 0, para todo x;


R
(b)
fX (x) = 1;

(c) E(X) = ;
(d) V (X) = 2 ;
(e) limx+ = limx = 0;
(f ) f ( + x) = f ( x). A densidade simtrica em torno de ;
(g) O valor mximo de f ocorre em x = ;
(h) Os pontos de inexo de f esto em x = .

58
Efeito da mdia e do desvio-padro na curva normal

A mdia determina o valor do centro da curva normal, enquanto que o desvio-padro


determina a largura da curva normal. Quanto menor o valor do desvio-padro , menor

ser a variabilidade dos dados, conseqentemente menor ser a largura da curva.

Algumas Caractersticas da Distribuio Normal

(a) A mdia, mediana e moda so iguais. Ou seja, = M d = mo;

(b) A curva normal, alm de ter uma rea total igual a 1, simtrica em torno da mdia

, sendo assim, P (X < b) = P (X > + b);

59
(c) P (X [a; b]) = P (a X b) = rea da curva no intervalo [a; b]:

(d) A incluso ou excluso dos extremos no altera o valor da probabilidade. Portanto,

P (a X b) = P (a < X < b) = P (a X < b) = P (a < X b);

(e) Quaisquer que sejam os valores da mdia e do desvio-padro de uma distribuio

normal, os seguintes resultados so vlidos:

P ( 1 X + 1) = 0, 6827 - Cerca de 68, 3% dos valores esto a um

desvio-padro distante da mdia;

P ( 2 X + 2) = 0, 9545 - Cerca de 95, 5% dos valores esto a 2

desvios-padres distante da mdia;

P ( 3 X + 3) = 0, 9973 - Cerca de 99, 7% dos valores esto a 3

desvios-padres distante da mdia;

Se as notas em matemtica dos candidatos em um vestibular forem normalmente

Distribudas com mdia de = 65 pontos e desvio-padro de = 12 pontos, ento

aproximadamente 95% desses candidatos iro obter notas de 41 a 89 pontos, pois

41 = 65 2 12(= 2)

60
89 = 65 + 2 12(= + 2)

4.2.6 Distribuio normal padro

A distribuio normal padro um acaso especial da distribuio normal onde a mdia

zero ( = 0) e desvio-padro um ( = 1). As reas dessa distribuio so obtidas com o

auxilio de tabelas (em anexo) e serve de referncia para calcular probabilidades das outras

distribuies normais.

Por que usamos tabela na distribuio normal?

Como foi dito anteriormente, as probabilidades so obtidas resolvendo a integral da funo

densidade no intervalo de interesse. O grande problema que integrar algebricamente

uma curva normal no possvel e a soluo encontrada foi usar mtodos numricos para

calcular de forma aproximada as reas de interesse. Essas reas so calculadas apenas

para a distribuio normal padro.

A tabela d as probabilidades sob uma cursa normal padro, que mada mais so do que

as correspondentes reas sob a curva. A Figura abaixo ilustra a probabilidade fornecida.

P (0 Z Zc ), onde Z N (0, 1)

Exemplos:

a) P (0 < Z < 1, 22) = 0, 3838

61
b) P (1 < Z < 2)

Logo:

P (1 < Z < 2) = P (0 < Z < 2) P (0 < Z < 1) = 0, 4772 03413 = 0, 1359 (4.9)

c) P (Z 1)

62
63
Logo: P (Z 1) = P (Z 0) P (0 Z 1) = 0, 5 0, 3413 = 0, 1587
d) Determine o valor de k tal que P (Z k) = 0, 90.
Soluo: Queremos encontrar a abcissa k da normal padro com 0, 90 de rea

(probabilidade) esquerda dela. Como 0, 9 a rea esquerda de k, resulta que

k tem que ser maior que zero, isto , temos que ter k > 0. Veja a Figura abaixo

esquerda de k temos rea 0, 90 e esquerda de 0 temos rea 0,5. Logo, entre 0 e 0, 90


temos que ter rea 0,40.

Escrevendo essas observaes em termos de probabilidade, temos:

P (Z k) = 0, 90
P (Z 0) + P (0 < Z k) = 0, 90
0, 5 + P (0 < Z k) = 0, 90
P (0 < Z k) = 0, 40
tab(k) = 0, 40

Esta ltima igualdade nos diz que k a abcissa correspondente ao valor 0, 40 na

Tabela. Para identicar k; temos que buscar no corpo dessa tabela, o valor mais

prximo de 0, 40. Na linha correspondente ao valor 1,2 encontramos as entradas

0, 39973 e 0, 40147. Como a primeira est mais prxima de 0,40, olhamos qual a

abcissa correspondente: a linha 1, 2 e a coluna 8, o que nos d a abcissa de 1,28,

ou seja, k = 1, 28 e P (Z 1, 28) = 0, 90, completando a soluo.

e) P (2, 1 Z 1, 4)
Soluo: Note que este exemplo trata da rea (probabilidade) entre duas abcissas,

uma negativa e outra positiva. A Figura 1 abaixo ilustra-se a rea (probabilidade)

64
desejada. Essa rea a soma das reas representadas nas Figuras 2 e 3. Por simetria,

essa ltima rea igual rea sombreada na Figura 4, o que nos leva cocnluso de

que

P (2, 1 Z 1, 4) = P (0 Z 1, 4) + P (2, 1 Z 0)
= P (0 Z 1, 4) + P (0 Z 2, 1)
= tab(1, 4) + tab(2, 1)
= 0, 4821 + 0, 4192 = 0, 9013

4.2.7 Padronizao de uma varivel


At agora s trabalhamos com a distribuio normal padro. E como devemos trabalhar

com as outras distribuies de probabilidades? Qualquer varivel X tendo distribuio

normal com mdia e desvio-padro pode ser transformada"em uma distribuio

normal padro, basta, para isto, padronizar a varivel X.

Se X N (,2 ), entao, a variavel aleatoria denida por

X
Z=

ter uma distribuio N (0, 1). Essa transformao ilustrada pela gura abaixo:

65
Exemplos

(a) Se X N (2, 5). Calcular a P (1 X 7).


Soluo:
 
12 X 2 72
P (1 X 7) = P
5 5 5
= P (0, 45 Z 2, 24)
= P (0, 45 Z < 0) + P (0 Z 2, 24)
= P (0 Z 0, 45) + P (0 Z 2, 24)
= tab(0, 45) + tab(2, 24)
= 0, 4875 + 0, 1700 = 0, 6575

(b) Se X N (5, 1). Calcular a P (X 7).


Soluo:
 
X 5 75
P (X 2) = P
1 1
= P (Z 2, 0) = P (Z 0) P (0 Z 2)
= 0, 5 tab(2, 0)
= 0, 5 0, 47725 = 0, 02275

(c) Se X N (, 2 ). Calcular a P ( k X + k) , para k = 1, 2, 3.


Soluo Note que essa probabilidade corresponde probabilidade de X estar a uma

distncia de k desvios-padro da mdia.

 
k X + k
P ( k X + k) = P

66
= P (k Z k)

Chegamos a uma probabilidade que nao depende de ou , ou seja, esse resultado

vale qualquer que seja a distribuicao normal.

k=1

P ( X + ) = P (1 Z 1) = 2 tab(1, 0) = 2 0, 3414 = 0, 6828

k=2

P (2 X +2) = P (2 Z 2) = 2tab(2, 0) = 20, 4772 = 0, 9544

k=3

P (3 X +3) = P (3 Z 3) = 2tab(3, 0) = 20, 4987 = 0, 9974

Essas probabilidades nos dizem que, para qualquer distribuio normal, 68, 28% dos

valores esto a um desvio-padro da mdia, 95, 44% esto a dois desvios-padro e

99, 73% dos valores esto a trs desvios-padro da mdia. Veja a Figura abaixo para

uma ilustrao desses resultados.

(d) Se N (3; 4). Determine o valor de k tal que P (X k) = 0, 90.


Soluo: Com a probabilidade esquerda de k maior que 0, 5, resulta que k tem

de ser maior que a mdia. O primeiro passo na soluo escrever a probabilidade

dada em termos da normal padro.

P (X k) = 0, 90
   
X 3 k3 k3
P = 0, 90 Z = 0, 90
2 2 2

67
 
k3
P (Z 0) + P 0 Z = 0, 90
2
 
k3
0, 5 + P 0 Z = 0, 90
2
 
k3
P 0Z = 0, 40
2
 
k3
tab = 0, 40
2
k3
= 1, 28 k = 5, 56
2

(e) O consumo mensal em minutos por conta de celular em uma regio uma varivel

aleatria normal com mdia 36 e desvio padro 12.

a) Qual a probabilidade de uma pessoa desta regio usar o telefone celular por

menos de 48 minutos?

b) Qual a probabilidade de uma pessoa desta regio usar o telefone celular por

mais de 30 minutos?

c) Qual o tempo mnimo que algum deve gastar ao telefone no ms para estar entre

os 5% que MAIS usam o celular?

Soluo: X= consumo em minutos; X N (36; 122 )

i.
 
X 36 48 36
P (X < 48) = P <
12 12
= P (Z < 1, 0) = P (Z < 0) + P (0 < Z < 1)
= 0, 5 + tab(1, 0)
= 0, 5 + 0, 34134 = 0, 84134

ii.
 
X 36 30 36
P (X > 30) = P >
12 12
= P (Z > 0, 5) = P (Z > 0) + P (0, 5 < Z < 0)
= P (Z > 0) + P (0 < Z < 0, 5)
= 0, 5 + tab(0, 5)
= 0, 5 + 0, 19146 = 0, 69146

iii. Seja m o tempo mnimo.

m) = 0, 05 P X36 m36 m36


 
P(X
12 12 = 0, 05 P Z 12 = 0, 05
tab m36 = 0, 05 m36

12 12 = 1, 64 m = 55, 68

68
A pessoa tem que falar pelo menos 55,68 minutos para estar entre os 5% que mais

usam o celular.

69
Referncias Bibliogrcas

[1] Triola, M. F. Introduo a Estatstica. Ed. Ltc., 2009.

[2] FONSECA, J. S. da; MARTINS, G de A. Curso de Estatstica. 6o Edio, So

Paulo.

[3] MEYER, P. L. Probabilidade: Aplicaes Estatstica. 2 ed. Rio de Janeiro:

LTC, 1983. (ISBN 85-216-0294-4)

[4] COSTA NETO, Pedro de oliveira. Estatstica. Editora Edgard Blucher, Ltda. 1997.

[5] BUSSAB, W. O. MORETTIN, G de A.Estatstica Bsica. Ed Saraiva. 6 Edio.

[6] Farias, Ana Maria Lima de. Mtodos Estatsticos I. v. nico/Ana Maria Lima.

[7] Farias, Ana Maria Lima de. Mtodos Estatsticos II. v. 2 / Ana Maria Lima de

Farias. 3.ed.Rio de Janeiro: Fundao CECIERJ, 2010.

70