Вы находитесь на странице: 1из 150

Conselho editorial

Autor do original
Projeto editorial
Coordenao de produo
Projeto grfico
Diagramao
Reviso lingustica
Imagem de capa

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida
por quaisquer meios (eletrnico ou mecnico, incluindo fotocpia e gravao) ou arquivada em
qualquer sistema ou banco de dados sem permisso escrita da Editora. Copyright

Diretoria de Ensino Fbrica de Conhecimento


Rua do Bispo,

, bloco , Campus Joo Ucha

Rio Comprido Rio de Janeiro

Sumrio
Prefcio

1. Conceitos Introdutrios e Tcnicas


de Amostragem

Breve histrico

Definio de Estatstica

Amostragem
Exemplo Prtico Envolvendo Tcnicas de Amostragem Probabilstica

2. Distribuio de Frequncias e
Medidas de Posio Central

12
16

27

Distribuio de Frequncias

29

Medidas de posio

34

3. Medidas de Ordenamento e Forma,


Medidas de Disperso e Grficos
Medidas de ordenamento
Medidas de Disperso
Grficos

51
53
63
79

4. Distribuies Amostrais e Estimao

99

Conceitos Bsicos

100

Estimador de uma Mdia Populacional

102

Estimador de uma Proporo Populacional

104

Propriedades da Distribuio Normal

106

Distribuies Amostrais

107

Erro Padro de um Estimador

109

Intervalos de Confiana para a Mdia Populacional

112

Intervalos de Confiana para a Proporo Populacional

114

5. Distribuio Normal e Teste de Hiptese

121

Varivel Aleatria

122

Funo Densidade de Probabilidade


Modelo Probabilstico para Variveis Aleatrias Contnuas
Teste de Hiptese

123
123
130

Prefcio
Prezados(as) alun os (as)
Estatstica um a palavra de origem latina, que sign ificou por m uito tem po
cincia dos negcios do Estado. Ela pode ser vista com o um a Matemtica Aplicada,
um a disciplin a da rea das cincias exatas que tem aplicao em praticam ente
todas as reas de estudo. Esse fato serve para desm istificar o tem or vivido pelos
alun os com relao ao ensin o da m atem tica em si (aquela que n s apren dem os
at o en sino m dio). As dificuldades enfren tadas e a falta de con exo com a prtica so talvez os fatores que m ais con tribuem para que este tem or ocorra.
No en tanto, o en sin o da Estatstica, m esm o provocan do sen tim en tos sem elh an tes aos estudantes, proporcion a a esses um a viso prtica do con tedo que
est sen do abordado. Mais que isso, ele possibilita, a quem o est aplican do, a
obten o de im portan tes in form aes do fato que est sen do estudado. O con hecim ento m nim o em Estatstica se torn ou pr-requisito para ler um jorn al
ou um a revista con ceituada, pois m uitas in form aes se en con tram resum idas
em tabelas ou grficos que gran de parte da populao n o tem con dies de in terpretar e por isso ign oram (ou n o en ten dem ) reportagen s im portan tes para a
form ao de um a pessoa esclarecida social, econ m ica e politicam en te.
Procuram os, aqui, apresen tar a Estatstica de form a clara e prtica. No
com o intuito de form ar especialistas n essa rea, m as sim de proporcion ar a
voc, futuro gestor, um a com preen so dos elem en tos bsicos que com pem
essa cincia, visan do a aplicao n a sua rea de atuao. No tivem os a in ten o de esgotar o assun to, m as sim de apresen tar os elem en tos n ecessrios para
que voc realize um a leitura satisfatria da realidade que o cerca e das in form aes que tm a sua volta.
Muitos dos exem plos aqui apresen tados so h ipotticos. So exem plos de
situaes que ocorrem de form a sem elh an te n a realidade, m as os dados apresen tados no so reais, foram criados apen as para ilustrar a aplicao do con tedo apresen tado.

Conceitos
Introdutrios
e Tcnicas de
Amostragem

1 Conceitos Introdutrios e Tcnicas de


Amostragem
Nesse prim eiro captulo, apresen tarem os con ceitos bsicos da Estatstica e as
prin cipais tcn icas de am ostragen s probabilsticas e n o probabilsticas.
Em qualquer estudo e/ou pesquisa que en volve a coleta e an lise de dados,
im prescindvel o con hecim en to dos con ceitos que sero abordados n este captulo, para que os resultados obtidos n a an lise sejam um in strum en to con fivel
para tom adas de deciso.

OBJETIVOS
Identificar os diferentes tipos de variveis que podem estar presentes em uma pesquisa,
compreender a que se destina cada uma das reas da Estatstica e entender as caractersticas dos vrios tipos de amostragens utilizados para coleta de dados.

REFLEXO
Voc se lembra de j ter visto nos meios de comunicao informaes de pesquisas, por
exemplo, eleitorais ou de avaliao de um governo, obtidas atravs de amostras? Neste captulo, apresentaremos o conceito de populao e amostra e estudaremos como (e por que),
na maioria das vezes, fazemos levantamento de dados atravs de amostras.

1.1 Breve histrico


O in teresse por levantam ento de dados n o algo que surgiu som en te n os dias
atuais. H indcios de que 3000 an os a.C. j se faziam cen sos n a Babiln ia, Ch ina e Egito. Havia in teresse dos govern an tes das gran des civilizaes an tigas
por in form aes sobre suas populaes e riquezas. Usualm en te estas in form aes eram utilizadas para taxao de im postos e alistam en to m ilitar.
A palavra Estatstica surgiu, pela prim eira vez, n o sc. XVIII. Algun s autores
atribuem esta origem ao alem o Gottfried Achem m el (1719-1772), que teria utilizado pela prim eira vez o vocbulo Estatstica, em 1746.

10 capt ul o 1

Na sua origem , a Estatstica estava ligada ao Estado. Na atualidade, a Estatstica n o se lim ita apenas ao estudo de dados dem ogrficos e econ m icos.
Ela em pregada em praticam en te todas as reas do con hecim en to, sem pre
que estiverem envolvidas coleta e an lise de dados.

CONEXO
Para saber um pouco sobre a evoluo histrica da Estatstica, assista o vdeo Histria da
Estatstica produzido pela Fundao Universidade de Tocantins, disponvel em:< http:/ / www.
youtube.com/ watch?v= jCzMPL7Ub2k&feature= related> .

1.2 Definio de Estatstica


A Estatstica um a cin cia que trata de m todos cien tficos para a coleta, organ izao, descrio, an lise e in terpretao (con cluso) de um con jun to de
dados, visan do a tom ada de decises.
Podem os dividir a aplicao da Estatstica basicam en te em trs etapas, que
so descritas resum idam en te a seguir:
1. Refere-se coleta de dados, n a qual devem os utilizar tcn icas estatsticas que garan tiro um a am ostra represen tativa da populao.
2.

Depois dos dados coletados, devem os resum i-los em tabelas de frequn cias e/ou grficos e, posteriorm en te, en con trar as m edidas de posio e variabilidade (quan tidades). Esta etapa tam bm con h ecida
com o Esta tstica Descritiva ou Dedutiva.

3.

Esta etapa envolve a escolh a de um possvel m odelo que explique o


com portam ento dos dados para posteriorm en te se fazer a in fern cia
dos dados para a populao de in teresse. Esta etapa tam bm ch am ada de Estatstica Inferencial ou Indutiva. Nesta etapa, se faz n ecessrio
um con hecim en to m ais aprofun dado, prin cipalm en te n o que se refere
aos tpicos de probabilidades. A probabilidade forn ece m todos para
quan tificar a in certeza existen te em determ in ada situao, usan do ora
um n m ero ora um a fun o m atem tica.

capt ul o 1

11

Podem os citar inm eros exem plos da Estatstica em vrias reas do con h ecim en to, m as s para con ven c-lo da im portn cia das tcn icas estatsticas, vam os en um erar alguns deles:
1. Se estam os in teressados em abrir um superm ercado em um determ inado
local precisam os saber se fatores com o sexo, grau de escolaridade, idade,
estado civil, renda fam iliar, entre outros, in terferem n a abertura deste superm ercado e os tipos de produtos que devem ser priorizados n esse estabelecim ento, alm de defin ir as estratgias de marketing m ais eficien tes.
2.

Um a em presa, quan do est in teressada em lan ar um n ovo produto n o


m ercado, precisa saber as prefern cias dos con sum idores. Para isso,
necessrio realizar um a pesquisa de m ercado.

3.

O gestor precisa saber escolher um a am ostra represen tativa de um a populao de in teresse para n o perder m uito tem po e, con sequen tem en -

4.

te, din h eiro da em presa em que trabalha.


Para se lan ar um novo m edicam en to n o m ercado farm acutico, n ecessrio a realizao de vrias experin cias. O m edicam en to deve ser
testado estatisticam en te quan to sua eficin cia n o tratam en to a que

5.

se destin a e quan to aos efeitos colaterais que pode causar, an tes de ser
lan ado n o m ercado.
Para um a em presa, m uito im portan te fazer previses de dem an da de
seus produtos. Para isto existem vrias tcn icas estatsticas com o re-

gresso lin ear, regresso logstica, an lise de sries tem porais, etc.
6. Con troles estatsticos de qualidade (ou con troles estatsticos do processo) so indispen sveis em todos os tipos de em presas. Eles so realizados
atravs de um conjunto de tcnicas estatsticas, geralm ente aplicadas
por engenheiros de produo e adm inistradores, para garan tir o n vel de
qualidade exigido para a produo (ou servio) den tro de um a indstria.
So in m eras e diversificadas as aplicaes de tcn icas estatsticas que um
gestor pode utilizar. No conseguirem os falar sobre todas elas, m as apresen tarem os os principais con ceitos e tcn icas que quan do utilizados podem auxiliar
na tom ada de decises.
Com earem os por apresen tar algun s con ceitos elem en tares bastan te utilizados no processo estatstico.

12 capt ul o 1

Unidade experim en tal ou de observao um objeto (isto , pessoa, objeto,


tran sao ou even to) a partir do qual coletam os os dados. Vam os an alisar os
exem plos a seguir para en ten der o con ceito dos possveis tipos de objeto:
Os eleitores da cidade de So Paulo so pessoas;
Os carros produzidos em determ inado ano por um a m ontadora so objetos;
As ven das realizadas duran te um m s n um a loja de departam en to so
tran saes;
Os acidentes ocorridos em determ in ada exten so de um a rodovia duran te um feriado so even tos.
Populao o conjunto total de unidades experim entais que tm determ inada caracterstica que se deseja estudar. Um a populao pode ser finita ou in finita.
Populaes finitas perm item que seus elem en tos sejam con tados. Por
exem plo: todas as lojas existen tes em determ in ado shopping, todos os alun os
m atriculados em determ in ada un iversidade, todos os veculos licen ciados pelo
departam en to de trn sito em um an o. In dicam os o tam an h o de um a populao fin ita por N.
Na prtica, um a populao que est sen do estudada usualm ente con siderada infin ita se ela en volve um processo contnuo que torna im possvel a listagem
ou con tagem de cada elem en to n a populao. Por exem plo: quantidades de pores que se pode extrair da gua do m ar para anlise.
Vale ressaltar que, em algun s estudos, a populao de interesse to gran de
que s pode ser estudada por m eio de am ostras. Por exem plo: quan tos peixes
existem n o m ar? Esse nm ero m atem aticam ente finito, m as to gran de que
pode ser considerado infinito para qualquer finalidade prtica.
Am ostra um a parte da populao de in teresse que se tem acesso para desen volver o estudo estatstico. Se a am ostra n o for forn ecida n o estudo, devem os retir-la da populao atravs de tcn icas de am ostragem adequadas, para
que os resultados forn ecidos sejam con fiveis.
Estatstica Descritiva a parte da estatstica q ue trata da organ izao e do
resum o do con jun to de dados por m eio de grficos, tab elas e m ed idas d escritivas (quan tidades).
Estatstica Indutiva a parte que se destin a a en con trar m todos para tirar
con cluses (ou tom ar decises) sobre a populao de in teresse, geralm en te, baseado em inform aes retiradas de um a am ostra desta populao.

capt ul o 1

13

Varivel um a caracterstica da un idade experim en tal. Vam os estudar dois


tipos de variveis: quan titativas e qualitativas.
Variveis quantitativas so aquelas cujas respostas da varivel so expressas
por n m eros (quan tidades). Podem os distin guir dois tipos de variveis quan titativas: quantitativa con tn ua e discreta.
Variveis quantitativas contnuas so aquelas que podem assum ir, teoricam en te, in finitos valores en tre dois lim ites (n um in tervalo), ou seja, podem assum ir valores n o in teiros. Por exem plo: altura (em m etros) de alun os de um a
determ in ada faixa etria, peso (em kg), salrio, etc.
Variveis quantitativas discretas so aquelas que s podem assum ir valores
in teiros. Por exem plo: n m ero de filh os por casal, n m ero de livros em um a
biblioteca, nm ero de carros ven didos, etc.
Variveis qualitativas so as variveis cujas respostas so expressas por um atributo. Podem os distinguir dois tipos de variveis qualitativas: n om inal e ordin al.
Variveis qualitativas nom inais defin em -se com o aquelas em que as respostas so expressas por um atributo (n om e) e esse atributo n o pode ser ordenado.
Por exem plo: tipo san gun eo, religio, estado civil, etc.
Variveis qualitativas ordinais tm suas respostas expressas por um atributo (n om e) e esse atributo pode ser orden ado. Por exem plo: grau de in struo,
classe social, etc.

1.3 Amostragem
Em qualquer estudo que en volva coleta de dados, sabem os que dificilm en te podem os estudar a populao de in teresse com o um todo. Para isso, utilizam os
tcn icas de am ostragem para selecion ar am ostras que sejam represen tativas
da populao de in teresse. No prxim o item estudarem os algum as tcn icas de
am ostragem m uito utilizadas em estudos e/ou pesquisas.
1.3.1 Tcnicas de Amostragem
Quan do selecion am os um a am ostra devem os garan tir que esta am ostra seja
represen tativa da populao, ou seja, n o processo de am ostragem , a am ostra
selecion ada dever possuir as m esm as caractersticas bsicas da populao.
Tem os dois tipos de am ostragem , a que ch am am os de probabilstica (ou aleatria ) e a no probabilstica (ou no aleatria ).

14 capt ul o 1

A am ostragem ser probabilstica se todos os elem en tos da populao tiverem probabilidade con hecida, e diferen te de zero, de perten cer am ostra. Caso
con trrio, a am ostragem ser n o probabilstica.
Indenpen den te do tipo de am ostragem , podem os trabalhar com am ostragem com reposio ou sem reposio. Na am ostragem com reposio perm itido
que um a unidade experim en tal seja sorteada m ais de um a vez, e n a am ostragem
sem reposio, a un idade experim en tal sorteada rem ovida da populao. Quan do pen sam os n a quan tidade de in form ao con tida n a am ostra, am ostrar sem
reposio m ais adequado. Mas, am ostragem com reposio im plica que tenham os independncia entre as un idades experim entais selecion adas, o que facilita
o desen volvim ento de propriedades de estim adores que sero abordados m ais
adiante. Na prtica, com um considerarm os a selao das un idades experim en tais com o independentes quan do pequen as am ostras so retiradas de grandes
populaes. De acordo com (TRIOLA, 2008), um a diretriz com um a ser seguida :
Se o tam an ho da am ostra n o m aior que 5% d o tam an h o da popu lao,
tratam os a seleo das un idades experim en tais com o sen d o independentes
(m esm o que as selees sejam feitas sem reposio, p ois tecn icam en te elas
so depen den tes).
Agora, vam os estudar algun s tipos de tcn icas de am ostragen s probabilsticas e n o probabilsticas.
1.3.1.1 Defin ies das Tcn icas d e Am ostragem Probab ilstica (ou Aleatria)
Sem pre que possvel, devem os escolher trabalhar com am ostragem probabilstica. Este tipo de am ostragem nos garan te, com alto grau de confian a, a represen tatividade da am ostra com relao populao que se tem in teresse em estudar.
Usarem os N para den otar o tam an h o da populao e n in dican do o tam an ho da am ostra.
1.3.1.1.1 Am ostragem Aleatria Sim ples

utilizada quan do todos os elem en tos da populao tm a m esm a ch an ce (ou


probabilidade igual) de perten cer am ostra.
Para trabalh ar com a am ostragem casual sim ples devem os con seguir listar
a populao de 1 a N. Os elem en tos da populao que iro perten cer a am ostra
sero sorteados de form a aleatria. Sortearem os n n m eros dessa sequn cia,
os quais correspondero aos elem en tos sorteados para a am ostra.

capt ul o 1

15

Exem plo 1.1: Se desejam os, por exem plo, selecion ar 50 elem en tos de um a
populao de 500 elem en tos, ento n um eram os a populao de 1 a 500 e sorteam os, dessa form a, cada um dos 50 que iro com por a am ostra.
1.3.1.1.2 Am ostragem Sistem tica

Utilizam os am ostragem sistem tica quan do os elem en tos da populao se


apresen tam orden ados (ou em filas) e a retirada dos elem en tos da am ostra
feita periodicam ente.

ATENO
Cuidado com ciclos de variao. s vezes, podem ocorrer ciclos de variao e os elementos
sorteados para a amostra tero sempre a mesma caracterstica. Se isto for detectado, o salto
poder ser diversificado, podendo ento selecionar, por exemplo, o 3, o 5 e o 9 elementos,
depois novamente conto 3, 5 e 9 e assim por diante at obter a amostra desejada.

Exem plo 1.2: Usan do o exem plo an terior, on de a populao com posta de
500 elem en tos orden ados, poderam os utilizar a am ostragem sistem tica prim eiram en te determ inan do qual o sa lto que dever ser dado. Para isto, fazem os a diviso do tam anh o da populao pelo tam an ho da am ostra desejada:

N 500
=
= 10
n
50
Em seguida, podem os in iciar a am ostragem com qualquer in divduo escolh ido (de form a aleatria) en tre os 10 prim eiros. A partir desse elem en to, selecionam os os dem ais sem pre saltan do de 10 em 10.
1.3.1.1.3 Am ostragem por Con glom erad os (Clusters)
Em algum as vezes a populao se apresen ta n um a subdiviso em pequen os
grupos, cham ados conglomerados. Neste caso possvel, e at con ven ien te, fazerm os um a am ostragem por m eio desses con glom erados. Este tipo de am ostragem con siste em sortear um n m ero suficien te de con glom erados, cujos
elem en tos con stituiro a am ostra. Quan do um con glom erado sorteado, todos
os elem en tos den tro dele so selecion ados para a am ostra. Este tipo de am ostragem m uitas vezes utilizado por m otivos de ordem prtica e econ m ica.

16 capt ul o 1

Exem plo 1.3: Supon ham os que desejam os estudar algum a caracterstica
dos in divduos que m oram n um determ in ado bairro de sua cidade. A populao de in teresse con stituda, portan to, por todos os in divduos que m oram
n esse bairro e cada residn cia con stitui um con glom erado. Podem os sortear
algun s con glom erados (residn cias) e cada m orador da un idade sorteada far
parte da n ossa am ostra.
1.3.1.1.4 Am ostragem Estratificada
Esta tcnica m uito utilizada quan do a populao h eterogn ea ou quan do se
con segue dividi-la em subpopulaes ou estratos. A am ostragem estratificada
con siste em especificar quan tos elem en tos da am ostra sero retirados em cada
estrato. O n m ero de elem en tos sorteados em cada estrato deve ser proporcion al ao n m ero de elem en tos existen te n o estrato.
Exem plo 1.4: Vam os supor que um a pesquisa tem com o objetivo estudar
um a determ in ada caracterstica do povo brasileiro, com o por exem plo, a ren da
fam iliar. Nesse caso, a populao de in teresse con stituda por todo cidado
que m ora n o Brasil. Podem os con siderar cada estrato com o sen do cada um dos
estados brasileiros. Em cada um deles ser selecion ado um n m ero x de elem en tos, proporcional populao de cada estado.
1.3.1.2 Tcn icas de Am ostragem No Probab ilstica (ou No Aleatria)
Som ente recom en dam os o uso de m todos de am ostragem no probabilstica nos
casos em que impossvel ou invivel a utilizao de m todos probabilsticos.
1.3.1.2.1 Am ostragem a Esm o ou Sem Norm a
a am ostragem em que o pesquisador, para sim plificar o processo, procura ser
aleatrio sem , n o en tan to, usar algum dispositivo aleatrio con fivel.
Exem plo 1.5: Supon ha que desejam os retirar um a am ostra de 50 parafusos de um a caixa conten do 5.000. Nesse caso, poderam os, ao in vs de sortear
os parafusos, escolh er a esm o aqueles que fariam parte da am ostra. No um
procedim en to totalm en te aleatrio porque, m esm o sem perceberm os, poderam os estar privilegian do algum a parte da caixa, n o dan do, dessa form a, a
m esm a ch an ce de participao a qualquer um dos parafusos.

capt ul o 1

17

1.3.1.2.2 Am ostragem In ten cion al


Neste caso, o am ostrador escolhe deliberadam en te os elem en tos que iro com por a am ostra, m uitas vezes, por julgar tais elem en tos bem represen tativos
da populao.
Exem plo 1.6: Um diretor de um a in stituio de en sin o deseja avaliar o quan to determ in ada disciplin a est sen do bem m in istrada por seu professor. Para
isso, selecion a, para um a en trevista, algun s dos alun os com m elh or desem penh o n essa disciplina.

1.4 Exemplo Prtico Envolvendo Tcnicas de Amostragem


Probabilstica
Exem plo 1.7: O quadro 1.1 lista a idade e a opin io de 50 profission ais de
em presas pblicas e privadas que esto sen do en trevistados para respon der se
so contra ou a favor da in cluso de deficien tes visuais e auditivos em suas
em presas e em que tipo de em presa trabalh a: pblica ou privada.

PROFISSIONAIS

IDADE

OPINIO

TIPODE
EMPRESA

52

contra

Pblica

22

a favor

pblica

36

a favor

privada

35

a favor

privada

35

a favor

privada

50

contra

pblica

44

contra

pblica

42

contra

pblica

40

contra

pblica

10

45

contra

pblica

18 capt ul o 1

PROFISSIONAIS

IDADE

OPINIO

TIPODE
EMPRESA

11

36

a favor

privada

12

34

a favor

privada

13

23

contra

pblica

14

26

a favor

pblica

15

28

a favor

pblica

16

28

a favor

pblica

17

29

a favor

privada

18

30

a favor

privada

19

30

a favor

privada

20

34

a favor

privada

21

38

a favor

privada

22

41

contra

pblica

23

42

contra

pblica

24

50

contra

pblica

25

49

contra

pblica

26

38

contra

privada

27

26

a favor

privada

28

29

a favor

privada

29

26

a favor

privada

30

36

a favor

privada

31

27

a favor

privada

capt ul o 1

19

PROFISSIONAIS

IDADE

OPINIO

TIPODE
EMPRESA

32

32

a favor

privada

33

31

a favor

privada

34

33

a favor

privada

35

33

a favor

privada

36

36

contra

pblica

37

34

a favor

pblica

38

46

contra

privada

39

44

contra

pblica

40

65

contra

pblica

41

56

contra

pblica

42

52

contra

pblica

43

35

a favor

pblica

44

24

a favor

privada

45

23

a favor

privada

46

28

a favor

privada

47

30

a favor

privada

48

34

a favor

privada

49

46

contra

pblica

50

26

a favor

privada

Quadro 1.1 Idade e a opinio de profissionais de empresas pblicas e privadas com relao a
incluso de deficientes visuais e auditivos

20 capt ul o 1

a) Utilizan do o quadro acim a, retire um a am ostra sistem tica de 10 profission ais, in ician do pelo 3 profission al, e liste o n do profission al sorteado, a idade, a opin io e o tipo de em presa que ele trabalh a.
Resoluo:
Dividin do 50 por 10, tem os grupos com 5 elem en tos cada. Se sortearm os o
terceiro elem en to do prim eiro grupo, por exem plo, os participan tes da am ostra
sero os listados abaixo:

PROFISSIONAIS

IDADE

OPINIO

TIPODE
EMPRESA

36

a favor

privada

42

contra

pblica

13

23

contra

pblica

18

30

a favor

privada

23

42

contra

pblica

28

29

a favor

privada

33

31

a favor

privada

38

46

contra

privada

43

35

a favor

pblica

48

34

a favor

privada

b) Com a am ostra selecion ada n o item a), calcule:

a idade m dia dos profission ais;

Resoluo:

x=

348
= 34, 8 anos
10

capt ul o 1

21

a porcentagem de profission ais con tra a in cluso;

Resoluo:

n o de profissionais contra a incluso na amostra


4
=
= 0, 4
n o total de profissionais na amostra
10
ou seja, 40% dos profission ais so con tra a in cluso de deficien tes visuais ou
auditivos nas em presas em que trabalh am .

a porcentagem de profission ais que so da rede pblica.

Resoluo:

n o de profissionais de empresas na amostra


4
=
= 0, 4
n o total de profissionais na amostra
10
ou seja, 40% dos profissionais trabalh am em em presas pblicas.
c) possvel retirar um a am ostra estratificada dos profission ais con sideran do a varivel tipo de em presa? Diga, em poucas palavras, com o voc
procederia n este caso?
Resoluo:
Sim , pois possvel iden tificar dois estratos: em presa pblica e privada. O
procedim en to deve ser: retirar um a am ostra proporcion al de profission ais de
em presas pblicas e privadas e depois fazer as an lises devidas.

ATIVIDADE
1. Classifique as variveis abaixo em quantitativas (discretas ou contnuas) ou qualitativas
(nominal ou ordinal).
a) cor dos olhos
b) nmero de peas produzidas por hora
c) dimetro externo
d) nmero de pontos em uma partida de futebol

22 capt ul o 1

e) produo de algodo
f) salrios dos executivos de uma empresa
g) nmero de aes negociadas na bolsa de valores
h) sexo dos filhos
i)

tamanho de pregos produzidos por uma mquina

j)

quantidade de gua consumida por uma famlia em um ms

k) grau de escolaridade
l)

nvel social

m) tipo sanguneo
n) estado civil
2. A guerra das Colas o termo popular para a intensa competio entre Coca-Cola e
Pepsi mostrada em suas campanhas de marketing. As campanhas tm estrelas de
cinema e televiso, vdeos de rock, apoio de atletas e afirmaes das preferncias dos
consumidores com base em testes de sabor. Como uma parte de uma campanha de
marketing da Pepsi, suponha que 1 000 consumidores de refrigerante sabor cola submetam-se a um teste cego de sabor (isto , as marcas esto encobertas). Cada consumidor questionado quanto sua preferncia em relao marca A ou B.
a) Descreva a populao.
b) Descreva a varivel de interesse.
c) Descreva a amostra
d) Descreva a inferncia.
3. Suponha que voc tenha determinado conjunto de dados e classifique cada unidade da
amostra em quatro categorias: A, B, C ou D. Voc planeja criar um banco de dados no
computador com esses dados e decide codific-los como A = 1, B = 2, C = 3 e D = 4.
Os dados A, B, C e D so qualitativos ou quantitativos? Depois de introduzidos no banco de
dados como 1, 2, 3 e 4, os dados so qualitativos ou quantitativos? Explique sua resposta.
4. Os institutos de pesquisa de opinio regularmente fazem pesquisas para determinar o
ndice de popularidade do presidente em exerccio. Suponha que uma pesquisa ser
conduzida com 2.500 indivduos, que sero questionados se o presidente est fazendo
um bom ou um mau governo. Os 2.500 indivduos sero selecionados por nmeros de
telefone aleatrios e sero entrevistados por telefone.
a) Qual a populao relevante?
b) Qual a varivel de interesse? qualitativa ou quantitativa?

capt ul o 1

23

c) Qual a amostra?
d) Qual o interesse da inferncia para o pesquisador?
e) Qual o mtodo de coleta de dados que foi empregado?
f) A amostra em estudo representativa?
5. Uma populao se encontra dividida em quatro estratos. O tamanho de cada estrato ,
N1 = 80, N2 = 120, N3 = 60 e N4 = 60 Sabe-se que uma amostragem proporcional
foi realizada e dezoito elementos da amostra foram retirados do segundo estrato. Qual
o nmero total de elementos da amostra?
6. Uma pesquisa precisa ser realizada em uma determinada cidade. A amostragem proposta para este problema a seguinte: dividir a cidade em bairros (pelo prprio mapa da
cidade): em cada bairro, sorteia-se certo nmero de quarteires proporcional rea do
bairro; de cada quarteiro, so sorteadas quatro residncias, destas quatro residncias,
todos os moradores so entrevistados.
a) Essa amostra ser representativa da populao ou poder apresentar algum vcio
(no confivel)?
b) Quais tipos de amostragem foram utilizados no procedimento?
7. Uma empresa de seguros mostra que, entre 4000 sinistros reportados empresa durante um ms, 2700 so sinistros pequenos (inferiores a R$400,00), enquanto os outros
1300 so sinistros grandes (R$400,00 ou mais). Foi extrada uma amostra proporcional de 1% para estimar o valor mdio desses sinistros, Os dados esto a seguir,
separados por tipo de sinistro.

SINISTROSPEQUENOS
84

330 126 156 90 296

390 132
340

36

73 55 178

82 184 206 44 276

98 124 176 226 58 144

SINISTROSGRANDES
492 710 1744 1298 506
676 982 1720 1510 976 1004
2600 2420

58 166 228

a) Determine a mdia de cada uma das amostras (sinistros pequenos e sinistros grandes),
b) Determine sua mdia ponderada, tomando como pesos os dois tamanhos de estratos
N1 = 2700 e N2 = 1300.

24 capt ul o 1

8. Consideremos um estudo realizado em empresas de pequeno e mdio porte de uma determinada regio composto por 1000 empresas, distribudas, quanto ao nmero de funcionrios, como mostra a tabela abaixo, e que nesta regio sejam amostrados 50 empresas.
Distribuio do n de empresas de uma regio qualquer,
quanto ao n de funcionrios.

N DE
FUNCIONRIOS

N DE
PROPRIEDADES

0 20

500

20 50

320

50 100

100

100 200

50

200 400

30

Total

1000

AMOSTRAESTRATIFICADA
(N= 50)
UNIFORME

PROPORCIONAL

50

50

a) Qual dever ser o tamanho da amostra dentro de cada estrato no caso uniforme e
no proporcional?
b) Determine a mdia amostral obtida para a amostragem estratificada uniforme e para
a amostragem estratificada proporcional. Comente os resultados.
Observao: Amostragem estratificada uniforme quando retiramos o mesmo nmero de
elementos de cada estrato, independente do tamanho do estrato.

REFLEXO
Estamos encerrando nosso primeiro captulo. Vimos, aqui, alguns conceitos que sero fundamentais na compreenso dos outros contedos abordados no livro. J deve ter dado para
perceber que, mesmo estando no incio da disciplina, as aplicaes prticas que voc poder
fazer na sua rea de atuao sero muitas. A compreenso e interpretao das mais variadas
informaes, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do conhecimento de certos elementos estatsticos.

capt ul o 1

25

Estamos apenas no comeo. Muitas tcnicas (muito interessantes!) ainda sero abordadas.
E lembre-se que o conhecimento e o domnio da Estatstica certamente levaro voc, futuro
gestor, s decises mais acertadas.

LEITURA
Sugerimos que voc oua os udios que esto no seguinte endereo: < http:/ / m3.ime.unicamp.
br/ recursos/ 1252> . No primeiro mdulo voc conhecer um pouco da histria da Estatstica
e, no segundo mdulo, a histria da Probabilidade.

REFERNCIASBIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro: LTC, 2003.
FONSECA, Jairo Simon; MARTINS, Gilberto de Andrade; TOLEDO, Geraldo Luciano.
Estatstica Aplicada. So Paulo: Atlas, 1985.
LEVIN, Jack; FOX, James Alan. Estatstica para cincias humanas. So Paulo: Prentice Hall, 2004.
LEVINE, David M.; BERENSON, Mark L.; STEPHAN David. Estatstica: teoria e aplicaes.
Rio de Janeiro: LTC, 2000.
MARTINS, Gilberto de Andrade. Estatstica geral e aplicada. So Paulo: Atlas, 2002.

26 capt ul o 1

McClave, James T.; BENSON P. George.; SINCICH, Terry. Estatstica para adminstrao e
economia. So Paulo: Pearson Prentice Hall, 2009.
MEMRIA, Jos M. P. Breve Histria da Estatstica. Disponvel em: < http:/ / www.im.ufrj.
br/ ~ lpbraga/ prob1/ historia_estatistica.pdf> . Acesso em: 25 setembro 2014.
MILONE, Giuseppe. Estatstica geral e aplicada. So Paulo: Pioneira Thomson Learning,
2004.
TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.
VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003. Disponvel em: < http:/ /
www.ufrgs.br/ mat/ graduacao/ estatistica/ historia-da-estatistica> . Acesso em: 25 set. 2014

NOPRXIMOCAPTULO
Agora que j sabemos como coletar dados, aprenderemos no prximo captulo como organizar, resumir e apresentar os dados coletados em distribuies de frequncias. Estudaremos,
tambm, como resumir informaes de conjuntos de dados numricos em alguns valores que
sejam representativos de todo o conjunto.

capt ul o 1

27

Distribuio de
Frequncias e
Medidas de Posio
Central

2 Distribuio de Frequncias e Medidas de


Posio Central
Nesse captulo, estudarem os com o organ izar os dados n um a distribuio de
frequn cias e apren derem os a resum ir con jun tos de dados n um ricos em algun s valores represen tativos de todo con jun to.
Quan do realizam os um a coleta de dados, geralm en te estam os lidan do com
um a quan tidade m uito gran de de in form aes. Portan to, torn a-se im prescin dvel a utilizao de certas tcn icas visan do sim plificar a leitura de tais in form aes. Para que se ten ha um a viso do todo (sobre o fen m en o que est sen do
estudado) precisam os, por exem plo, dispor as in form aes em tabelas ou apresen t-las em grficos. o que estarem os abordan do n um prim eiro m om en to.
Logicam en te, h m ais tcn icas que podem ser aplicadas, m as elas sero vistas
nos prxim os captulos.

OBJETIVOS
Organizar, resumir e apresentar, atravs de distribuio de frequncias, as informaes contidas em grandes conjuntos de dados. Calcular e interpretar as medidas de posio central.

REFLEXO
Voc se lembra de j ter visto tabelas em jornais, livros ou revistas, em que eram utilizados percentuais para indicar as frequncias de ocorrncias de respostas em uma pesquisa? Ou com
os percentuais referentes avaliao de um governo? E informaes como mdia salarial de
determinada categoria de profissionais, ou ainda, idade mdia dos estudantes do primeiro ciclo
de determinada universidade? Neste captulo, veremos como (e para qu) construimos tabelas
dessa natureza e como calculamos medidas descritivas como a mdia aritmtica.

30 capt ul o 2

2.1 Distribuio de Frequncias


Para en tenderm os a ideia de distribuio de frequn cias, vam os an alisar a seguin te situao: quando um pesquisador term in a de coletar os dados para sua
pesquisa, geralm en te fica com m uitos question rios em m os (respon didos
pelas pessoas que foram sorteadas para perten cer a sua am ostra) ou com os
dados digitados em algum a plan ilh a eletrn ica. O fato que os dados brutos
(sem tratam en to) no trazem as in form aes de form a clara, por isso devem os
tabular esses dados. Quan do tabulam os os dados estam os resum in do as in form aes para m elhor com preen so da varivel em estudo. A esta tabulao dam os o nom e de distribui o de frequncias (ou tabela de frequncia s).
Distribuio de frequn cias um a tabela em que se resum em gran des
quan tidades de dados, determ in an do o n m ero de vezes que cada dado ocorre
(frequn cia) e a porcen tagem com que aparece (frequn cia relativa).
Para facilitar a con tagem do n m ero de vezes que cada dado ocorre, podem os orden ar os dados. A um a sequn cia orden ada (crescen te ou decrescen te)
de dados brutos dam os o nom e de Rol.
Os tipos de frequn cias com os quais irem os trabalh ar so:
Frequncia a bsoluta ou simplesmente frequncia (f): o n de vezes que cada
dado aparece n a pesquisa.
Frequncia relativa ou percentual (fr ): o quocien te da frequn cia absoluta
pelo nm ero total de dados. Esta frequn cia pode ser expressa em porcen tagem . O valor de (fr x100) defin ido com o fr (%).
Frequncia acumulada (fa ): a som a de cada frequn cia com as que lh e so
an teriores n a distribuio.
Frequncia rela tiva acumula da (fra ): o quocien te da frequn cia acum ulada
pelo n m ero total de dados. Esta frequn cia tam bm pode ser expressa em
porcen tagem . O valor de (fra x100) defin ido com o fra (%).
Exem plo 2.1: Com as in form aes forn ecidas n a tabela 2.1, vam os in dicar
e classificar a varivel em estudo. Depois, com pletarem os a distribuio de frequn cias encon tran do a frequn cia relativa (%).

capt ul o 2

31

FAIXADERENDA
(EMSALRIOS
MNIMOS)

NMERODE
OPERRIOS(f )

fr (%)

02

43

39,09

24

39

35,45

46

16

14,55

68

7,27

8 10

3,64

Total

110

100

Tabela 2.1 Distribuio de renda de operrios de uma determinada empresa.

Resoluo:
A varivel em estudo a renda dos operrios de um a determ in ada em presa. Esta varivel classificada com o quan titativa con tn ua, pois pode assum ir
qualquer valor den tro de um in tervalo n um rico.

ATENO
Em todos os nossos exemplos, na distribuio de frequncias construda com intervalos de classes, vamos considerar que o intervalo de classe fechado esquerda e aberto direita. Por
exemplo, no caso dessa tabela, considerando a terceira classe de frequncia, podemos dizer que
os 16 operrios que esto nesta classe recebem de 4 a menos que 6 salrios mnimos por ms.

As frequn cias absolutas (f) so fon ecidas n o problem a. As frequn cias relativas (fr (%)) so en contradas dividin do cada frequn cia absoluta (de cada classe
de frequn cia) pelo total de operrios (110) e m ultiplican do por 100.
Um a distribuio de frequn cias apresen ta, basicam en te, as 3 colun as
apresen tadas na tabela 2.1. Desta m an eira, con seguim os organ izar de form a
resum ida um con jun to de dados.

32 capt ul o 2

Em alguns estudos podem os ter in teresse em outras quantidades relacion adas tabela, com o, por exem plo, a frequncia acum ulada ou a frequn cia acum ulada (%). Verem os m ais adiante que a frequn cia acum ulada utilizada na
con struo de um grfico denom in ado Ogiva. Atabela 2.2 apresen ta a frequn cia
acum ulada e a frequncia relativa acum ulada (%).

FAIXADE
RENDA(EM
SALRIOS
MNIMOS)

NMERODE
OPERRIOS
(f )

02

fr (%)

FREQUNCIA
ACUMULADA
(fa)

fra (%)

43

39,09

43

39,09

24

39

35,45

82

75,55

46

16

14,55

98

89,09

68

7,27

106

96,36

8 10

3,64

110

100,00

Total

110

100

Tabela 2.2 Distribuio das frequncias acumuladas da varivel faixa de renda.

A colun a frequn cia acum ulada (fa ) decada classe obtida som an do a frequn cia da respectiva classe com as que lh e so an teriores e a fra (%) obtida
dividin do a fa pelo n m ero total de dados e m ultiplican do por 100.
Para organ izar dados de variveis qualitativas ou quan titativas discretas
(cujos valores n o esto agrupados em classes) seguim os o m esm o procedim en to que foi utilizado n a con struo da tabela 2.1.
Exem plo 2.2: Um a determ in ada em presa resolveu traar o perfil socioecon m ico de seus em pregados. Um a das variveis estudadas foi o n m ero de filh os, com idade inferior a 18 an os, de cada um dos em pregados. A tabela 2.3
forn ece a frequn cia e a frequn cia relativa (%) para cada valor obtido.

capt ul o 2

33

NMERODE
FILHOS

NMERODE
OPERRIOS(f )

fr (%)

13,33

24,44

28,89

15,56

11,11

2,22

4,44

Total

45

100,00

Tabela 2.3 Distribuio de frequncias dos empregrados, segundo o nmero de filhos.

Para en contrarm os a fa e a fra (%) seguim os o m esm o procedim en to que foi


utilizado n a tabela 2.2.
2.1.1 Agrupamento em Classes
Com o vim os n o exem plo 2.1, para represen tar a varivel con tn ua ren da, organ izam os os dados em classes. Portan to, podem os dizer que a varivel ren da
foi dividida em 5 classes de frequn cias.
Quan do agrupam os em classes de frequn cias perdem os in form aes, pois
no sabem os exatam en te quais so os valores que esto con tidos em cada um a
das classes (a n o ser que seja possvel pesquisar esta in form ao n o con jun to
de dados brutos). Na an lise das distribuies de frequn cias com in tervalos de
classes podem os iden tificar os seguin tes valores:

Lim ite inferior (Li): o m enor valor que a varivel pode assum ir em um a
classe de frequn cia;
Lim ite superior (Ls): serve de lim ite para estabelecer qual o m aior valor que a
varivel pode assum ir em um a classe de frequn cia, m as, geralm ente, os valores
iguais ao lim ite superior n o so com putados naquela classe e sim n a seguin te;

34 capt ul o 2

Pon to m dio (Pm ): a m dia aritm tica en tre o Li e o Ls d a m esm a classe,


ou seja, Pm =

Li + Ls
2

Am plitude (h): a diferen a en tre o Ls e o Li da classe, ou seja, h = Ls Li;


Am plitude total (h t ): a diferen a en tre o Ls da ltim a classe de frequn cia e
o Li da prim eira classe, ou seja: h t = Ls Li.
Na construo de um a distribuio de frequn cias com in tervalos de classes devem os determ inar o n m ero de classes que um a tabela deve ter e qual o
tam an h o (ou a am plitude) destas classes. Podem os usar o bom sen so e escolher
arbitrariam en te quantas classes e qual a am plitude que estas classes devem ter.
Quan do no tiverm os n en hum a refern cia sobre qual deve ser o n m ero de
classes a se trabalh ar, podem os utilizar o critrio que sugerido por vrios autores. Cham a-se regra da ra iz e ser apresen tado a seguir.
Con sidere:

k@ n

h=

k
k'

(2.1)

onde k o n m ero de classes que vam os con struir n a distribuio de frequn cias; n o tam an ho da am ostra que estam os trabalhan do; h a am plitude de
cada um a das classes e R a am plitude total dos dados.
Os valores de k e h devem ser arredondados sempre para o maior valor. Por exemplo, para uma amostra de tamanho n = 50 cujo menor valor 4 e o maior valor 445
temos que R = 441 (maior valor menor valor). O nmero de classes seria dado por
k n=

50 = 7, 07106... 8 (maior inteiro depois de 7) e a amplitude (tamanho) de

R 441
=
= 55,125 56 (maior inteiro
k
8
depois de 55). Ou seja, deveramos, para este exemplo, montar uma tabela com 8 classes

cada uma das 8 classes acima dever ser h =

e de amplitude 56. A tabela pode ser iniciada pelo menor valor do conjunto de dados.

Resum indo, para m ontar um a distribuio de frequn cias com in tervalos


de classes devem os:

capt ul o 2

35

Achar o m n im o e o m xim o dos dados.

Determ in ar as classes de frequn cias que n a verdade n ada m ais do que


escolh er intervalos de m esm o com prim en to que cubra a am plitude en tre
o m nim o e o m xim o. Para determ in ar o n m ero de classes, usarem os

k @ n e para determ in ar o tam an h o das classes usarem os h =

k
k'

Contar o nm ero de observaes que perten cem a cada in tervalo de classe.


Esses nm eros so as frequncias observadas da classe.

Calcular as frequncias relativas e acum uladas de cada classe.

De m odo geral, a quan tidade de classes n o deve ser in ferior a 5 e n em


superior a 25.

Agora, apren derem os com o caracterizar um con jun to de dados atravs de


m edidas num ricas que sejam represen tatativas de todo o con jun to.

2.2 Medidas de posio


As medidas de posio, tam bm ch am adas de medida s de tendncia centra l, tm
o objetivo de apresen tar um pon to cen tral em torn o do qual os dados se distribuem . As m ais conh ecidas so: a m dia, a m edian a e a m oda. Vam os estudar
cada um a dessas m edidas de posio (estatsticas).
Prim eiram en te, vam os fazer um estudo para os dados n o tabulados, ou seja,
quan do os dados no estiverem na form a de distribuio de frequn cia. Em seguida, as m esm as m edidas sero calculadas com base em dados tabulados.
2.2.1 Mdia aritmtica
A m dia aritm tica (x) a m ais com um e m ais sim ples de ser calculada den tre
todas as m edidas de posio m encion adas.
Para calcul-la, basta fazer a diviso da som a de todos os valores (x1, x2, ..., xn)
da varivel pelo n m ero total de elem en tos do con jun to de dados (n):

36 capt ul o 2

x=

xi
i =1

onde:

x = a m dia aritm tica;


xi = os valores da varivel;
n = o n m ero de valores no con jun to de dados.
2.2.2 Mediana
A media na outra m edida de posio, dita m ais robusta que a m dia, pois, da
form a com o ela determ in ada, n o perm ite que algun s valores m uito altos ou
m uito baixos in terfiram de m an eira sign ificativa em seu valor. Desta form a, se
o con junto de dados apresen tar algun s poucos valores discrepan tes em relao
m aioria dos valores do conjun to de dados, em geral, acon selh vel usar a
m edian a ao invs da m dia.

ATENO
A mediana a medida de posio mais frequentemente usada quando a varivel em estudo
for renda (R$), pois algumas rendas extremamente elevadas podem inflacionar a mdia.
Neste caso, a mediana uma melhor medida de posio central.

A m edian a en con trada ordenando os dados do m en or para o m aior valor e


em seguida iden tifican do o valor cen tral destes dados orden ados. um a m edida que divide o con jun to de dados ao m eio, deixan do a m esm a quan tidade de
valores abaixo dela e acim a.
A determ in ao da m edian a difere n o caso do tam an h o (n) do con jun to de
dados ser par ou m par. Vejam os a seguir.

capt ul o 2

37

Se o n m ero de elem entos do con jun to de dados for m par, en to a m edian a


ser exatam ente o valor do m eio, ou seja:

Md = x

n +1
2

(2.3)
Se o n m ero de elem entos do con jun to de dados for par, en to a m edian a
ser exatam ente a m dia dos dois valores do m eio, isto :

x
Md =

onde

n
2

,x

n +1
2

ex

n
2

+x

n
+1
2

2
(2.4)

n
+1 indicam as posies on de os dados se encon tram .
2

2.2.3 Moda
A m oda de um con jun to de dados o valor (ou valores) que ocorre com m aior
frequn cia. A m oda, diferentem en te das outras m edidas de posio, tam bm
pode ser en con trada quando a varivel em estudo for qualitativa. Existem con jun tos de dados em que n enh um valor aparece m ais vezes que os outros. Neste
caso, dizem os que o con jun to de dados n o apresen ta m oda.
Em outros casos, podem aparecer dois ou m ais valores de m aior frequn cia n o
con jun to de dados. Nestes casos, dizem os que o con jun to de dados bim odal e
m ultim odal, respectivam en te.
Por con ta das defin ies diferen tes, a m dia , a m edian a e a m oda forn ecem ,
m uitas vezes, inform aes diferen tes sobre o cen tro de um con jun to de dados,
em bora sejam todas m edidas de ten dn cia central.
No exem plo 2.3 apresen tarem os os clculos das m edidas de posio para
dados no tabelados (dados brutos).
Exem plo 2.3: Um geren te de ban co deseja estudar a m ovim en tao de pessoas em sua agn cia n a segun da sem an a de um m s qualquer. Ele con stata que
no prim eiro dia entraram 1.348 pessoas, n o segun do dia, 1.260 pessoas, n o terceiro, 1.095, n o quarto, 832 e n o ltim o dia do levan tam en to, 850 pessoas. En con tre a m dia aritm tica, a m edian a e a m oda para este con jun to de dados e
in terprete os resultados.

38 capt ul o 2

Resoluo:
A mdia a ritmtica dada por:
n

xi
x=

i =1

1.348 + 1.260 + 1.095 + 832 + 850 5.385


=
= 1.077
5
5

O n m ero m dio de pessoas que en tram n a agn cia ban cria n a segun da
sem an a do m s de 1.077 pessoas. Isto quer dizer que, algun s dias en tram m en os que 1.077 e outros dias entram m ais, ou seja, 1.077 um valor em torn o do
qual o n m ero de pessoas que en tram n a agn cia, duran te a segun da sem an a
de cada m s, se concen tra.
Para en con trar a mediana , devem os, prim eiram en te, orden ar os dados em
ordem crescente (pode ser decrescen te tam bm ):
832, 850, 1095, 1.260, 1.348
Com o a quan tidade de dados (n) um n m ero m par, a m edian a exatam en te o valor que se en con tra n o m eio do con jun to de dados:

Md = x

n +1
2

= x6 = x3 = 1.095 pessoas
2

Isto sign ifica que tem os o m esm o n m ero de observaes m en ores ou iguais
ao valor da m edian a e o m esm o n m ero de observaes m aiores ou iguais ao
valor da m edian a.
Este con jun to de dados n o possui m oda , pois n o existe n en h um valor que
aparece com m ais frequn cia que os outros.
Agora, vam os fazer um estudo para os dados tabulados , ou seja, quan do os dados estiverem n a form a de um a distribuio de frequn cias.
Neste caso, a m aneira de se calcular a m dia aritm tica m uda um pouco.
Com o as frequn cias so n m eros que in dicam quan tas vezes aparece determ in ado valor ou quan tos valores tm em cada classe de frequn cia, elas fun cio-

capt ul o 2

39

naro com o fatores de pon derao. Estas situaes sero apresen tadas n os
exem plos 2.4 e 2.5, respectivam en te.

Mdia Aritm tica


No caso de dados tabulados, o clculo da m dia aritm tica :
k

x=

xi fi
i =1

i =1

fi
(2.5)

onde:
xi o valor da varivel (ou o pon to m dio de um a classe de frequn cia);
fi a frequn cia referen te a cada valor (ou classe);
k

i =1

fi a som a dos valores das frequn cias (n).

A expresso (2.5) apresen tada acim a tam bm con h ecida com o frm ula da
m dia pon derada.
No caso de distribuies de frequn cias que n o apresen tam in tervalos de
classes, a media na e a moda so en con tradas utilizan do os con ceitos apresen tados n os iten s 2.2.2 e 2.2.3, respectivam en te.
Exem plo 2.4: Em um determ in ado m s, foi com putado o n m ero de faltas
ao trabalh o, por m otivos de sade, que cada fun cion rio de um a determ in ada
em presa teve. Os dados esto apresen tados n a tabela a seguir.

40 capt ul o 2

NMERODE
FALTAS

31

20

Total

63

Tabela 2.4 Nmero de faltas ao trabalho, por motivos de sade.

En con tre a m dia aritm tica, a m edian a e a m oda para este con jun to de dados e in terprete os resultados.
Resoluo:

Mdia Aritm tica


k

xi fi ( 0 31) + (1 20 ) + ( 2 8) + ( 3 2 ) + ( 4 0 ) + ( 5 1) + ( 6 1) 53
x = i =1
=
=
0,84
k

fi

63

63

i =1

ou seja, n esta em presa ocorreram , em m dia, 0,84 faltas por fun cion rio,
por m otivo de sade.

Median a
Com o os dados esto tabelados, eles j se en con tram orden ados. Para ficar
m ais fcil encon trar o valor da m edian a, vam os in cluir n a distribuio de frequn cias um a colun a com as frequn cias acum uladas.

capt ul o 2

41

ATENO
Quando os dados estiverem dispostos numa distribuio de frequncias, o clculo da mdia
aritmtica pode ser feito acrescentando uma coluna na distribuio de frequncias. Esta
coluna denominada xi x f i e obtida multiplicando cada valor da varivel (xi ) pela sua respectiva frequncia (f i ). A mdia aritmtica obtida dividindo a soma dos valores desta coluna
pela soma dos valores da coluna da frequncia.

NMERODE
FALTAS

fa

31

31

20

51

59

61

61

62

63

Total

63

Para en con trar o valor da m edian a, seguim os os seguin tes passos:


1 Passo: iden tificarem os a frequn cia acum ulada im ediatam en te superior
m etade do som atrio das frequn cias absolutas:
2 Passo: a m edian a ser o valor da varivel associado frequn cia acum u lada im ediatam en te superior ao valor en con trado n o 1 Passo. En to, a frequn cia acum ulada im ediatam ente superior a 31,5 fa = 51. . Portan to, o valor da
m edian a o valor da varivel associado fa = 51, ou seja,
Md = 1 falta
Neste con jun to de dados, pelo m en os 50% das observaes so m aiores ou
iguais a 1 falta.

42 capt ul o 2

No caso do valor i =1

fi
ser exatamente igual a uma das frequncias acumu

ladas f a, o clculo da mediana ser a mdia aritmtica entre dois valores da varivel:
xi e xi + 1.
O valor da varivel xi ser aquele cujo

i =1

fi
= fa

e o valor da varivel xi + 1

ser aquele que est imediatamente aps xi na distribuio de frequncia.

Moda
A resposta que aparece com m aior frequ n cia n este con jun to de dad os o
0 (com frequn cia 31), ou seja, m ais frequen te en con trar fun cion rios q ue
n o faltam .

ATENO
As medidas resumo calculadas quando os dados estiverem agrupados em intervalos de classes so apenas aproximaes dos verdadeiros valores, pois substitumos os valores das observaes pelo ponto do mdio do intervalo de classe.

No caso do exem plo 2.5 verem os que os dados esto agrupados em in tervalos de classes. Quando o conjun to de dados for apresen tado sob a form a agrupada perdem os a inform ao dos valores das observaes. Neste caso, vam os
supor que todos os valores den tro de um a classe ten ham seus valores iguais ao
pon to m dio desta classe.
Os clculos da m dia, da m oda e da m edian a para distribuio de frequn cias agrupadas em classes esto apresen tados a seguir.
Vale ressaltar que, sem pre que possvel, as m edidas de posio e disperso
devem ser calculadas antes dos dados serem agrupados.
Exem plo 2.5: A tabela abaixo apresen ta a distribuio de frequn cias do tem po de vida de 60 com ponentes eletrnicos (m edido em dias) subm etidos experim entao num laboratrio especializado. Calcular as m edidas de posio.

capt ul o 2

43

TEMPODEVIDA
(DIAS)

PONTOMDIO
(xi )

3 18

10,5

18 33

25,5

33 48

40,5

48 63

55,5

63 78

10

70,5

78 93

28

85,5

93 108

100,5

108 123

115,5

Total

60

Tabela 2.5 Tempo de vida de componentes eletrnicos.

Resoluo:
Neste tipo de tabela, com o tem os classes de frequn cias, devem os en con trar um valor que represente cada classe, para que possam os efetuar os clcu los. Por exem plo, con sideran do a prim eira classe de frequn cia,

TEMPODEVIDA
(DIAS)

PONTOMDIO
(xi )

3 18

10,5

sabem os que 3 com ponentes eletrn icos tiveram tem po de vida en tre 3 e 18
dias, porm , n o sabem os exatam en te qual foi o tem po de vida de cada um . Se
con siderarm os o lim ite inferior da classe (3) para efetuarm os os clculos estarem os subestim an do as estim ativas. Por outro lado, se con siderarm os o lim ite
superior da classe (18) estarem os superestim an do as estim ativas. Portan to, vam os utilizar o pon to m dio de cada classe para poderm os fazer os clculos sem
gran des prejuzos. A terceira colun a da tabela acim a con tm os pon tos m dios
calculados para cada in tervalo de classe. O valor do pon to m dio passa a ser o
nosso valor xi a ser utilizado n os clculos. Vam os apren der com o se faz:

44 capt ul o 2

Mdia Aritm tica


k

x=

xi fi
i =1

i =1

=
=

fi

(10, 5 3)+ (25, 5 4)+ (40, 5 4)+ (55, 58)+ (70, 510)+ (85, 5 28)+ (100, 5 2)+ (115, 51)
60
4155
= 69, 25
60

Podem os dizer, atravs da m dia aritm tica, que os com pon en tes eletrn icos tm um a durao m dia de 69 dias e 6 horas (69,25 dias).

Median a
Com o os dados esto tabelados em classes de frequn cias, calculam os a
m edian a atravs da seguin te frm ula:

M e = Xe +

h (X m - Fiaa )
F

onde
Xe o lim ite in ferior da classe que con tm a m edian a;
Xm: m etade do valor da frequn cia total;
(2.6)
Fiaa : frequncia acum ulada da classe an terior classe que con tm a m ediana;
Fi: n m ero de observaes n a classe que con tm a m edian a;
h: am plitude da classe que con tm a m edian a.
No clculo da m ediana para os dados da tabela 2.5 tem os que prim eiram en te en contrar a classe que con tm a m edian a. Esta classe correspon de classe

i.
associada frequn cia acum ulada im ediatam en te superior
fi 60
2
Com o
=
= 30 , tem os que a classe que con tm a m edian a de

78 93 (pois fa = 57).

capt ul o 2

45

P. M
xi

fa

10,5

1833

25,5

3348

40,5

11

4863

55,5

19

6378

10

70,5

29

7893

28

85,5

57

93108

100,5

59

108123

115,5

60

Total

60

Classeque
contm
amediana

Tempo
devida

318

N de
observaes da
classequecontm
amediana
fadaclasse
anterior aclasse
quecontm
aMd.

fi

Alm disso, tem os:


Xe 78;
Xm: 30;
Fia a : 29;
Fi: 28;
h: 15
Agora, basta substituirm os todos os valores en con trados n a frm ula 2.6 e
en con tram os o valor da m edian a:

M e = 78 +

15 (30 - 29)
= 28 + 0.54 @ 78.5
28

Atravs da m edian a podem os dizer que pelo m en os 50% dos com pon en tes
eletrn icos avaliados tm durao igual ou in ferior a 78 dias e 12 horas.
Para calcularm os a m oda para distribuies de frequn cias com in tervalos
de classes, utilizarem os a seguin te frm ula:

46 capt ul o 2

Mo = X o +

h (Fm - Fa )

2Fm - Fa + Fp

)
(2.7)

onde
Xo o lim ite in ferior da classe que con tm a m oda;
Fm: frequncia m xim a;
Fa : frequncia anterior frequn cia m xim a;
Fp: frequn cia posterior frequn cia m xim a;
h: am plitude da classe que con tm a m oda.

No clculo da m oda para os dados da Tabela 2.5 tem os que prim eiram en te
en con trar a classe que con tm a m oda. Esta classe correspon de classe que
possui a frequn cia m xim a. En to, a classe que con tm a m oda de 7893
(pois f = 28).
Alm disso, tem os:
Xo 78;
Fm: 28;
Fa : 10;
Fp: 2;
h: 15.
Agora, basta substituirm os todos os valores en con trados n a frm ula 2.7 e
en con tram os o valor da m oda:

Mo = 78 +

15(28 - 10)
2 (28)- (10 + 2)

= 78 +

270
@ 84,1
44

Portanto, com um en con trar com pon en tes eletrn icos que durem , aproxim adam en te, 84 dias e 2 h oras.

capt ul o 2

47

CONEXO
Sugerimos os vdeos: Novo Telecurso E. Fundamental Matemtica Aula 34 (parte
1) e Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 2) disponveis,
respectimante em < http:/ / www.youtube.com/ watch?v= SyWbYOtAIYc&NR= 1> e < http:/ /
www.youtube.com/ watch?v= ejMyWfuSO5k> . que apresenta de modo bem prtico a
utilizao das medidas de posio.

ATIVIDADE
1. Abaixo temos as idades dos funcionrios de uma determinada empresa. Construir uma
distribuio de frequncias, agrupando os dados em classes.
OBS.: A tabela de distribuio de frequncias deve ser completa com f, fr e fa.
Idades (dados brutos)

48

28

37

26

29

59

27

28

30

40

42

35

23

22

31

21

51

19

27

28

36

25

40

36

49

28

26

27

41

29

Baseado na distribuio de frequncias construda, responda:


a) Quantos so os funcionrios com idade inferior a 33 anos?
b) Que porcentagem de funcionrios tem idade igual ou superior a 47 anos?
c) Quantos so os funcionrios com idade maior ou igual a 26 anos e no tenham mais
que 40 anos?
d) Qual a porcentagem de funcionrios com idade abaixo de 40 anos?
e) Qual a porcentagem de funcionrios que tm no mnimo 40 anos?
2. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em
um determinado supermercado no primeiro sbado aps receberem seus pagamentos
(salrios). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e
18h, e anotou os valores gastos por cada um deles. Estes valores esto listados abaixo:

48 capt ul o 2

4,89

11,00

5,60

73,85

24,83

98,00

186,00

234,87

58,00

198,65

223,86

341,42

94,76

445,76

82,80

35,00

455,00

371,00

398,60

234,00

64,90

54,98

48,80

68,90

120,32

126,98

76,43

6,35

9,98

12,68

243,00

18,65

134,90

11,10

321,09

290,76

74,00

48,80

74,52

138,65

26,00

210,13

15,78

197,45

75,00

76,55

32,78

166,09

105,34

99,10

Analisando o conjunto de dados, responda os seguintes itens:


a) Qual a varivel em estudo? Classifique-a.
b) Construa uma tabela de frequncias a partir do conjunto de dados brutos.
3.

Os dados abaixo referem-se ao nmero de horas extras de trabalho que uma amostra de
64 funcionrios de uma determinada empresa localizada na capital paulista.
10

10

12

14

14

14

15

16

18

18

18

18

18

19

20

20

20

20

20

21

22

22

22

22

22

22

22

22

22

22

22

22

23

23

24

24

24

24

24

24

24

25

25

25

25

26

26

26

26

26

26

27

27

27

28

28

29

30

30

32

35

36

40

41

Pede-se:
a) Calcule e interprete as seguintes medidas descritivas calculadas para os dados brutos (dados no tabulados): mdia aritmtica; mediana; moda.
b) Construir uma distribuio de frequncias completa (com freq. absoluta, freq. relativa,
freq. acumulada e ponto mdio).
c) Com a tabela construda no item b), encontre as seguintes medidas: mdia aritmtica,
mediana, moda. Interprete os resultados.

capt ul o 2

49

4. Os dados abaixo representam as vendas mensais (em milhes de reais) de vendedores de


gnero alimentcios de uma determinada empresa.

VENDASMENSAIS
(EMMILHESDEREAIS)

NMERODEVENDEDORES

0 | 1

1 | 2

12

2 | 3

20

3 | 4

48

4 | 5

14

5 | 6

10

Total

110

a) Qual a varivel em estudo? Que tipo de varivel esta?


b) Encontre a mdia, mediana e moda e interprete os resultados.
c) Qual a porcentagem de vendedores com vendas mensais inferior a 2 milhes de reais?
d) Qual a porcentagem de vendedores com vendas mensais superior a 4 milhes de reais?
e) Qual a porcentagem de vendedores com vendas mensais entre 3 (inclusive) e 5 (exclusive) milhes de reais?
f) Qual a porcentagem de vendedores que vendem, pelo menos, 3 milhes de reais
mensais?
5. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com
relao ao nmero de filhos por famlia:

NMERODEFILHOS

FREQUNCIADE
FAMLIAS

19

22

28

16

Calcule e interprete os resultados da:


a) mdia aritmtica
b) mediana
c) moda

50 capt ul o 2

6. Define-se a mdia aritmtica de n nmeros dados como o resultado da diviso por n da


soma dos n nmeros dados. Sabe-se que 4,2 a mdia aritmtica de 2.7; 3.6; 6.2; e x.
Determine o valor de x.

LEITURA
Recomendamos a leitura do texto Como analisar de forma simples um grande nmero de dados?, disponvel no endereo: < http:/ / www.klick.com.br/ conteudo/ pagina/ 0,6313,POR-1453--1453,00.html> , que aborda de maneira clara alguns procedimentos
que podem ser utilizados quando nos deparamos com situaes em que precisamos resumir
as informaes de grandes conjuntos de dados.

REFERNCIASBIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo estatstica. Rio de Janeiro: LTC, 2003.
TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.
VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003.

capt ul o 2

51

NOPRXIMOCAPTULO
Se at agora vimos como organizar os dados (informaes) em distribuies de frequncias
e como resumir as informaes numricas em medidas de posio central, iremos incrementar esse processo atravs da insero de medidas de ordenamento e disperso. As medidas
de ordenamento nos fornecem uma ideia sobre a distribuio dos dados ordenados e apresentam a vantagem de no serem afetadas pela forma da distribuio dos dados ou por valores discrepantes. Para que tenhamos informaes mais completas do conjunto de dados,
necessrio estudar a sua variabilidade. As estatsticas que tm essa funo so denominadas medidas de variabilidade ou de disperso. Finalizaremos o captulo apresentando vrios
tipos de grficos que representam de maneira adequada as informaes contidas em um
conjunto de dados.

52 capt ul o 2

Medidas de
Ordenamento e
Forma, Medidas de
Disperso e
Grficos

3 Medidas de Ordenamento e Forma,


Medidas de Disperso e Grficos
Nesse terceiro captulo estudarem os, prim eiram en te, as m edidas de ordenam en to, que so usadas para com parao de valores dentro do conjun to de dados. Estas
m edidas apresentam a vantagem de no serem afetadas pela presen a de valores
extrem os no conjunto de dados. Estudarem os, tam bm , as m edidas de disperso,
que servem para indicar o quanto os dados se apresentam dispersos em torno da
regio central. Fornecem , portanto, o grau de variao existente no conjunto de dados. Dois ou m ais conjuntos de dados podem , por exem plo, ter a m esm a m dia,
porm , os valores podero estar m uito m ais dispersos num con junto do que no
outro. Ou seja, podem ter m aior ou m en or grau de hom ogeneidade.
E, para fin alizar, apresen tarem os os prin cipais tipos de grficos utilizados para
represen tar a distribuio de um a varivel.

OBJETIVOS
Calcular e interpretar as medidas de ordenamento e de disperso;
Saber escolher representaes grficas mais apropriadas para variveis qualitativas e
quantitativas.

REFLEXO
Voc se lembra de, aps ter feito uma prova bimestral, algum professor ter informado que o desempenho mdio da turma ficou em torno de 7,2? Para efeito de comparao, ele tambm pode
ter calculado a mdia de outra turma, e verificado que o desempenho mdio tambm ficou em
torno de 7,2. Surgem os seguintes questionamentos:
ser que as notas das duas turmas foram iguais?
ser que as notas das turmas esto prximas da mdia ou dispersas?
Utilizaremos os conceitos deste captulo para responder a estas perguntas.

54 capt ul o 3

3.1 Medidas de ordenamento


Os quartis, decis e percentis so m uito sim ilares m edian a, um a vez que tam bm subdividem a distribuio de dados de acordo com a proporo das frequn cias observadas.
J vim os que a m ediana divide a distribuio em duas partes iguais, en to, os
quartis (Q1, Q2 e Q3), com o o prprio n om e sugere, divide a distribuio dos dados
orden ados em quatro partes, sen do, Q1 o quartil que separa os 25% valores inferiores dos 75% superiores, Q2 o que divide o conjunto ao m eio ( igual m edian a)
e Q3 o que separa os 75% valores in feriores dos 25% superiores. No h um con senso universal sobre um procedim ento n ico para o clculo dos quartis, e diferentes program as de com putador m uitas vezes produzem resultados diferentes.

ATENO
Perceba que o 2 quartil, o 5 decil e o 50 percentil representam a prpria mediana, ou seja,
todas estas medidas separatrizes (Q 2, D5, e P50), dividem a distribuio dos dados ao meio,
deixando aproximadamente 50% dos dados abaixo delas e 50% acima.

Os decis, por sua vez, dividem a distribuio dos dados em 10 partes (Di, i =
1, 2, ..., 9) e os percen tis dividem a distribuio em 100 partes (Pi = 1, 2, ..., 99).
As m edidas separatrizes, geralm en te, s so calculadas para gran des quan tidades de dados.
No Excel, por exem plo, tem os a opo de pedir o clculo de tais m edidas.
Com os clculos dos quartis, jun tam en te com os valores m n im o e m xim o do conjunto de dados, podem os con struir um grfico ch am ado desenho
esquem tico ou boxplot. A an lise deste grfico bastan te til n o sen tido de
in form ar, en tre outras coisas, a variabilidade e a sim etria dos dados.

CONEXO
Para se entender quais so os procedimentos utilizados na construo de um boxplot, bem
como sua interpretao, leia o texto: Diagramas de Caixa (Boxplots) em: TRIOLA, Mario F.
Introduo estatstica. 10.ed. Rio de Janeiro: LTC, 2008. pp. 98 a 102.

capt ul o 3

55

3.1.1 Clculo dos quartis, decis e percentis para dados no agrupados em classes

3.1.1.1 Qu artis
Com o os quartis so m edidas separatrizes precisam os, prim eiram en te, ordenar o con jun to de dados.
Podem os obter os quartis utilizan do a seguin te frm ula:

Qnq = xnqn

1
+

4
2

On de
Q: quartil que se deseja obter;
nq: n m ero do quartil que se deseja obter (1, 2 ou 3);
x: elem en to do con jun to de dados orden ados;
n: tam an ho da am ostra.
Exem plo 3.1: Um escritrio que presta con sultoria em adm in istrao levan tou os tem pos de espera de pacien tes que chegam a um a cln ica de ortopedia
para aten dim ento de em ergn cia. Foram coletados os seguin tes tem pos, em
m inutos, duran te um a sem ana. En con tre os quartis.
2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7

Resoluo:
Para en con trarm os os quartis, precisam os orden ar o con jun to de dados.
En to:
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

56 capt ul o 3

Prim eiro quartil (Q1)

Q1 = x118

1
+

2
4

Q1 = x5
Portanto, o prim eiro quartil o elem en to que est n a quin ta posio, no
con jun to de dados ordenados. En to:
Q1 = 3
Pelo m enos, 25% das observaes so m en ores ou iguais a 3 m in utos.

Segun do quartil (Q2)

Q2 = x218

1
+

2
4

Q2 = x9,5
Portanto, o segundo quartil est en tre os elem en tos que ocupam a n on a e
a dcim a posio do con jun to de dados oren ados. Para en con tr-lo, fazem os a
m dia entre os valores que esto n estas posies, ou seja:

6 + 7
Q2 =
= 6, 5
2
Pelo m enos, 50% das observaes so m en ores ou iguais a 6,5 m in utos.

Terceiro quartil (Q3)

Q3 = x318

1
+

2
4

Q3 = x14

capt ul o 3

57

Portan to, o terceiro quartil o elem en to que ocupa a dcim a quarta posio
do con jun to de dados ordenados. En to:
Q3 = 8
Pelo m enos, 25% das observaes so m aiores ou iguais a 8 m in utos.
3.1.1.2 Decis
Os decis dividem o conjunto de dados orden ados em 10 partes. Eles podem ser
obtidos atravs da seguin te frm ula:

Dnq = xndn

1
+

2
10

On de
D: decil que se deseja obter;
nd: n m ero do decil que se deseja obter (1, 2 ou 3);
x: elem en to do con jun to de dados orden ados;
n: tam an ho da am ostra.
Exem plo 3.2: Vam os utilizar os dados do Exem plo 3.1 para en con trar o oitavo decil:
2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7
Resoluo:
Para encontrarm os os decis, precisam os ordenar o con jun to de dados. En to:
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

Oitavo decil (D8)

D8 = x8 18

1
+

2
10

D8 = x14,9

58 capt ul o 3

Portanto, o oitavo decil correspon de ao elem en to 14,9 n o con jun to de dados


orden ados, situados en tre as posies 14 e 15. Com o o oitavo decil n o est
exatam en te n o m eio de dois elem en tos (x14,9), obtem os este elem en to seguin do
o seguin te raciocnio:

x-8 2
=
0, 9
1
Usando a propriedade fun dam en tal da proporo (m ultiplicao em
cruz), obtem os:

x - 8 = 1, 8
x=1, 8 + 8
x = 9, 8
Aproxim adam en te 20% das observaes so m aiores ou iguais a 9,8 m in utos.

ATENO
A proporo montada neste exemplo foi obtida atravs do seguinte raciocnio: a diferena
entre o elemento x que queremos encontrar e o elemento que est na dcima quarta posio
(8) est para a diferena entre as posies 14,9 e 14 (14,9 14) assim como a diferena
entre os elementos 10 e 8 est para a diferena entre as posies 15 e 14 (15-14).

3.1.1.3 Percen tis


Os percen tis dividem o conjun to de dados orden ados em 100 partes. Eles
so obtidos de m an eira sim iliar aos quartis e decis, ou seja:

Pnq = xnp n

1
+

2
100

On de
P: percen til que se deseja obter;
np: nm ero do percentil que se deseja obter (1, 2, ..., 99);
x: elem en to do con junto de dados orden ados;
n: tam an ho da am ostra.
capt ul o 3

59

Exem plo 3.3: Vam os utilizar os dados do Exem plo 3.1 para en con trar o trigsim o quinto percen til:
2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7
Resoluo:
Para en con trarm os os percen tis, precisam os orden ar o con jun to de dados.
En to:
2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

Trigsim o quin to percen til (P35)

P35 = x3518

1
+

2
10

P35 = x6,8
Portan to, o trigsim o quin to percen til correspon de ao elem en to 6,8 n o con jun to de dados ordenados, situados en tre as posies 6 e 7. A sexta e a stim a
posio so ocupadas pela observao 4, portan to:
P35 = 4
En to, aproxim adam ente 35% das observaes so m en ores ou iguais a 4
m inutos.
3.1.2 Clculo dos quartis e percentis para dados agrupados em classes
Podem os en contrar os quartis e decis para dados agrupados em classes, utilizan do a frm ula dos percen tis para dados agrupados:

Pnx

60 capt ul o 3

nx x
100 - Faant
= Li +
Fi

onde
n: n m ero de elem entos da am ostra.
nx: 1, 2, ..., 99;
Li: lim ite in ferior da classe en con trada;
h: am plitude do in tervalo;
Fa a nt : frequn cia acum ulada an terior classe Pi.
Fi: frequncia absoluta da classe en con trada Pi.

CONEXO
Podemos utilizar esta frmula geral, pois Q1= P25, Q2= P50 e Q3 = P75, D1 = P10, D2 = P20, ..., D9 = P90

Exem plo 3.4: Vam os utilizar os dados do Exem plo 2.5 para en con trar o terceiro quartil, o quinto decil e o dcim o quin to percen til.

TEMPODEVIDA(DIAS)

P. M. x1

fa

3 18

10,5

18 33

25,5

33 48

40,5

11

48 63

55,5

19

63 78

10

70,5

29

78 93

28

85,5

57

93 108

100,5

59

108 123

115,5

60

Total

60

capt ul o 3

61

Resoluo

Terceiro Quartil

Prim eiram en te, tem os que en con trar a classe que con tm o terceiro quartil.
Esta classe correspon de classe associada frequn cia acum ulada im ediatam en te superior

Com o

75 fi .
100

75 fi
100

75 60
= 45, tem os que a classe que con tm o pri100

m eiro quartil de 7893 (pois fa = 57).


Alm disso, tem os:
60: n m ero de elem entos da am ostra.
nx: 75;
Li: 78;
h: 15;
Fa a nt : 29.
Fi: 28.
Agora, basta substituirm os todos os valores en con trados n a frm ula 3.4 e
en con trar o valor do terceiro quartil:

nx n

100 - Faant
Pnx = Li +
h
F
i

7560

100 - 29
P75 = 78 +
15
28

45 - 29
P75 = 78 +
15= 78 + 8,57 @ 86,6
28
De acordo com o resultado obtido podem os esperar que aproxim adam en te
25% dos dados so m aiores ou iguais a 86,6, ou seja, aproxim adam en te 25% dos
com pon en tes eletrn icos tm durao superior a 86 dias e 14 h oras.

62 capt ul o 3

Quin to decil

Prim eiram en te, tem os que en con trar a classe que con tm o quin to decil.
Esta classe correspon de classe associada frequn cia acum ulada im ediatam en te superior

Com o

50 fi
100

50 fi 50 x 60
=
= 30 , tem os que a classe que con tm o quin to
100
100

decil de 7893 (pois fa = 57).


Alm disso, tem os:
60: n m ero de elem en tos da am ostra.
nx: 50;
Li: 78;
h: 15;
Fa a nt : 29.
Fi: 28.

Agora, basta substituirm os todos os valores en con trados n a frm ula 3.4 e
en con trar o valor do quin to percen til:

nx n

100 - Faant
Pnx = Li +
h
F
i

5060

100 - 29
P50 = 78 +
15
28

30 - 29
P50 = 78 +
15= 78 + 0,54 @ 78,5
28
De acordo com o resultado obtido podem os esperar que aproxim adam en te
50% dos dados so m en ores ou iguais a 78,5, ou seja, aproxim adam en te 50%
dos com pon en tes eletrnicos tm durao in ferior a 78 dias e 12 h oras.
Vale ressaltar que o P50 = Md e este clculo j h avia sido feito n o exem plo 2.5.
capt ul o 3

63

Dcim o quin to percen til

Prim eiram en te, tem os que en con trar a classe que con tm o dcim o quin to
percen til. Esta classe correspon de classe associada frequn cia acum ulada
im ediatam en te superior

Com o 50

15 fi
100

fi 15x 60 , tem os que a classe que con tm o quin to


=
=9
100
100

decil de 33 48 (pois fa = 11).


Alm disso, tem os:
60: n m ero de elem entos da am ostra.
nx: 15;
Li: 33;
h: 15;
Fa a nt : 7.
Fi: 4.
Agora, basta substituirm os todos os valores en con trados n a frm ula 3.4 e
en con trar o valor do dcim o quin to percen til:

nx n

100 - Faant
Pnx = Li +
h
F
i

1560

100 - 7
P15 = 33 +
15
4

9 - 7
P15 = 33 +
15= 33 + 7,5 @ 40,5
4

64 capt ul o 3

De acordo com o resultado obtido podem os esperar que aproxim adam en te


15% dos dados so m en ores ou iguais a 40,5, ou seja, aproxim adam en te 15%
dos com pon en tes eletrnicos tm durao in ferior a 40 dias e 12 h oras.

3.2 Medidas de Disperso


Para term os um a ideia da im portn cia de se con hecer as m edidas de disperso
para a tom ada de decises, vam os an alisar o exem plo a seguir.
Exem plo 3.5: Im agin e que estam os in teressados em fazer um a viagem para
Hon olulu (Hava) ou Houston (Texas) e para arrum ar as m alas n ecessitam os saber se a localidade a ser visitada faz calor, faz frio ou am bos. Se tivssem os apen as a in form ao de que a tem peratura m dia diria (m edida duran te um an o)
das duas localizaes fosse igual a 25 C, poderam os colocar n a m ala apen as
roupas de vero? A resposta n o. Por exem plo, se estivssem os in teressados
em viajar para o Hava (em Hon olulu), poderam os levar apen as roupas de vero, pois a tem peratura m n im a observada duran te um an o foi de 21 C e a m xim a foi de 29 C. Porm , se resolverm os ir ao Texas (Houston ), devem os tom ar
cuidado com a poca, pois as tem peraturas, duran te um an o, variaram de 4 C
(m n im a) a 38 C (m xim a). Com estas in form aes con clum os que as tem peraturas em Hon olulu variam pouco em torn o da m dia diria, ou seja, podem os
levar um a m ala apen as com roupas leves. Porm , em Houston , as tem peraturas
variam m uito, com perodos de m uito frio ou m uito calor. Portan to, para ir
Houston sem perigo de sofrer com a tem peratura, devem os an alisar o perodo
do an o para saber se a tem peratura estar alta ou baixa.
Percebem os, atravs deste exem plo bem sim ples, que um a sim ples m edida
de disperso (a am plitude, por exem plo) j ajudaria m uito a tom ar certos cuidados com a arrum ao das bagagen s.
Verem os, n os prxim os iten s, com o calcular e in terpretar as seguin tes medidas de disperso: am plitude, am plitude in terquartil, desvio-padro, varin cia
e coeficien te de variao.
Prim eiram en te, vam os apresen tar os clculos das m edidas de disperso
para dados no-tabulados , ou seja, quan do os dados no estiverem n a form a de
distribuio de frequn cias.

capt ul o 3

65

ATENO
As medidas de disperso indicam o grau de variabilidade das observaes. Estas medidas possibilitam que faamos distino entre conjuntos de observaes quanto sua homogeneidade.
Quanto menor as medidas de disperso, mais homogneo o conjunto de dados.

3.2.1 Amplitude Total


A am plitude total a diferena en tre o m aior e o m en or valor observado n o con jun to de dados, ou seja:
R = x(m xim o) x(m n im o)
A am plitude no um a m edida m uito utilizada, pois s leva em con ta dois
valores de todo o conjunto de dados e m uito in fluen ciada por valores extrem os. No prxim o item estudarem os um a m edida de disperso m ais resisten te
a valores extrem os.
3.2.2 Amplitude Interquartil
A am plitude in terquartil, ou distn cia in terquartil, um a m edida de variabilidade que n o facilm en te in fluen ciada por valores discrepan tes n o con jun to
de dados. Ela en globa 50% das observaes cen trais do con jun to de dados e seu
clculo defin ido com o:
Amplitude do interquartil = Q3 Q1
Agora, vam os estudar um a m edida de disperso m uito utilizada e que leva
em con ta todos os valores do con jun to de dados: o desvio-padro.

66 capt ul o 3

3.2.3 Desvio-Padro
Prim eiram en te, vam os en tender qual a defin io da palavra desvio em estatstica. Desvio nada m ais do que a distn cia en tre qualquer valor do con jun to de
dados em relao m dia aritm tica deste m esm o con jun to de dados.
Existem vrias m ed idas d e disp erso qu e en volvem os desvios. So elas: o
desvio-pad ro (m ais utilizada), a varin cia e o coeficien te de variao.
O desvio-padro a m edida m ais utilizada n a com parao de diferen as
en tre grupos, por ser m ais precisa e estar n a m esm a m edida do con jun to de
dados. Matem aticam en te, sua frm ula dada pela raiz quadrada da m dia aritm tica aproxim ada dos quadrados dos desvios, ou seja:
n

( xi - x )2
i =1

s=

n -1

( x1 - x ) 2 + ( x2 - x ) 2 +
n -1

+ ( xn - x ) 2

onde xi cada um a das observaes do con jun to de dados, x a m dia do


con jun to de dados e n o n m ero total de observaes do con jun to de dados.
Desen volven do a frm ula (3.7) ch egam os a frm ula (3.8) que, para algun s casos, tornam os clculos m ais sim ples e rpidos.
2

s=

( xi )
x2 i

n -1

onde:

xi2 a som a de cada valor da varivel ao quadrado;


2

( xi )

o quadrado da som a de todos os valores da varivel;

n o n m ero total de valores do con jun to de dados.

capt ul o 3

67

Com o o desvio-padro um a m edida de disperso e m ede a variabilidade


en tre os valores tem os que valores m uito prxim os resultaro em desvios-padres pequen os, enquan to que valores m ais espalh ados resultaro em desvios
-padres m aiores.

ATENO
O valor do desvio-padro nunca negativo. zero apenas quando todos os valores do conjunto
de dados so os mesmos. A unidade do desvio-padro a mesma unidade dos dados originais.

3.2.3.1 Um a Regra Prtica para In terpretar o Desvio-Pad ro


Depois que calculam os o desvio-padro surge um a pergunta: com o interpret-lo?
Para conjuntos de dados que ten h am distribuio em form a de sin o, valem
as seguin tes con sideraes:

Cerca de 68% das observaes do con jun to de dados ficam a 1 desvio-padro da m dia, ou seja, (x - s) e (x + s)

Cerca de 95% das observaes do con jun to de dados ficam a 2 desvios-padres da m dia, ou seja, (x - 2s) e (x + 2s)
Cerca de 99,7% das observaes do con jun to de dados ficam a 3 desvios
-padres da m dia, ou seja, (x - 3s)e (x + 3s)

3.2.3.2 Propriedades do d esvio-p adro


1. Som an do-se (ou subtrain do-se) um a con stan te c de todos os valores de
um a varivel, o desvio padro n o se altera:

yi = xi c Sy = Sx
2.

Multiplican do-se (ou dividin do-se) todos os valores de um a varivel por


um a constante (diferen te de zero), o desvio padro fica m ultiplicado
(ou dividido) por essa con stan te:

yi = xi c Sy = c Sx

68 capt ul o 3

ou

yi =

xi
S
Sy = x
c
c

3.2.4 Varincia (s2)


A varin cia de um con jun to de dados n ada m ais do que o valor do desvio-padro elevado ao quadrado, ou seja,
n

s2 =

( xi - x )2
i =1

n -1
ou
2

s2

( xi )
x2 i

n -1

A varin cia n o um a m edida m uito utilizada para m ostrar a disperso de


um conjunto de dados, pois, expressa o seu resultado n um a m edida ao quadrado, n o sendo possvel in terpretar o seu valor. Portan to, n a an lise descritiva
dos dados, n o vam os trabalh ar com esta m edida con stan tem en te. Se um determ in ado problem a forn ecer a varin cia do con jun to de dados, basta calcularm os a raiz quadrada deste valor (varin cia) e obterem os o desvio-padro, que
facilm ente in terpretado por estar n a m esm a m edida do con jun to de dados.
3.2.5 Coeficiente de Variao (cv)
O coeficien te de variao (cv) defin ido com o o quocien te en tre o desvio-padro e a m dia, e frequen tem en te expresso em porcen tagem . Ele m ede o grau
de varia bilida de do conjun to de dados. Quan do calculam os o desvio-padro,
obtem os um valor que pode ser gran de ou pequen o, depen den do da varivel
em estudo. O fato de ele ser um valor con siderado alto relativo, pois depen den do da varivel que est sen do estudada e da m dia, esta variao dos dados
pode ser relativam en te pequen a. En to, o coeficien te de variao serve para cal-

capt ul o 3

69

cular o grau de variao dos dados em relao m dia aritm tica. E obtido
atravs do seguin te clculo:

cv =

s
100
x

onde s o desvio-padro e x a m dia aritm tica.


Algun s autores con sideram a seguin te regra em prica para a in terpretao
do coeficiente de variao:

Baixa disperso: C. V. 15%

Mdia: C. V. 15% 30%

Alta: C. V. 30%

Em geral, o coeficien te de variao um a estatstica til para com parar a


variao para valores origin ados de diferen tes variveis (por exem plo: peso, em
Kg e altura, em cm ), pois ele adim en sion al.
3.2.6 Exemplo de Aplicao das Medidas de Disperso para Dados no Tabulados
Vam os exem plificar o clculo da am plitude, da am plitude in terquartil, do desvio-padro, da varin cia e do coeficien te de variao utilizan do o exem plo 2.3,
que apresenta o con junto de dados brutos.
Exem plo 3.6: Um geren te de ban co deseja estudar a m ovim en tao de pessoas em sua agn cia n a segun da sem an a de um m s qualquer. Ele con stata que
no prim eiro dia en traram 1348 pessoas, n o segun do dia, 1260 pessoas, n o terceiro, 1095, no quarto, 832 e n o ltim o dia do levan tam en to, 850 pessoas. En con tre a am plitude, o desvio-padro, a varin cia e o coeficien te de variao para
este con jun to de dados e in terprete os resultados.

70 capt ul o 3

Resoluo:
A am plitude dada por:
R = x(m ximo) x(mnimo) = 1348 832 = 516 pessoas
A diferen a, n o n m ero de pessoas que en tram n a agn cia, en tre o dia de
m aior m ovim en to e o dia de m en or m ovim en to de 516 pessoas.
Para en con trarm os a am plitude in terquartil precisam os calcu lar o prim eiro e o terceiro quartil. Para isto, vam os segu ir os procedim en tos descritos n o
item 3.1.1.1.

Prim eiro quartil (Q1)

Q1 = x15

1
+
4 2

Q1 = x1,75
Portanto, o prim eiro quartil est en tre os elem en tos que ocupam a prim eira
e a segun da posio do con jun to de dados orden ados. En to:

x - 832 850 - 832


=
0,75
1
x - 832 = 13, 5
x = 832 + 13, 5 = 845, 5

Terceiro quartil (Q3)

Q3 = x35

1
+
4 2

Q3 = x4,25

capt ul o 3

71

Portan to, o terceiro quartil est en tre os elem en tos que ocupam a quarta e a
quin ta posio do con jun to de dados orden ados. En to:

x - 1260 1348 - 1260


=
0,25
1
x - 1260 = 22
x = 1260 + 22 = 1282
Amplitude inter quartil = Q3 - Q1
= 1282 - 845, 5
= 436, 5 pessoas
En to, a am plitude do in tervalo que con tm 50% das observaes cen trais
436,5 pessoas.
O desvio-padro obtido atravs das frm ulas (3.7) ou (3.8). Com o a m dia
aritm tica um n m ero in teiro e existem poucos dados, a frm ula (3.7) m ais
rpida de ser calculada. Porm , fica a critrio de cada um a utilizao de um a ou
de outra. Lem bran do que a m dia aritm tica en con trada an teriorm en te igual
a 1077 e utilizando a frm ula (3.7), tem os:
n

s=
=
=

( xi - x )2
i =1

n -1

(1348 -1077)2 + (1260 -1077)2 + (1095 -1077)2 + (832 -1077)2 + (850 -1077)2
5 -1

(271)2 + (183)2 + (18)2 + (-245)2 + (-2227)2


4

(73441)+ (33489)+ (324)+ (60025)+ (51529) =

218808
= 54702 @ 233, 88 pessoas
4

Neste exem plo, en tram n a agn cia, em m dia, 1077 pessoas por dia. O n m ero de pessoas que en tram na agn cia varia, m as, tipicam en te, a diferen a
em relao m dia foi de aproxim adam en te 234 pessoas.

72 capt ul o 3

A varin cia, com o vim os, obtida atravs das frm ulas (3.9) ou (3.10), ou
sim plestem en te, com o j tem os o desvio-padro, a varin cia o valor que est
den tro da raiz quadrada, ou seja:
s2 = 54.702 pessoas 2
No h com o in terpretar a expresso pessoa s2. Por esse m otivo, utilizam os o
desvio-padro n o lugar da varin cia.
O coeficien te de variao, dado pela frm ula (3.11), m uito fcil de ser obtido desde que j con h eam os os valores da m dia aritm tica e do desvio-padro.
Pela frm ula podem os observar que basta fazerm os um a sim ples diviso. Para
este exem plo tem os que:

cv =

s 233, 88
=
@ 0, 2172 ou 21, 72%
x
1077

Utilizando a regra em prica, podem os dizer que o con jun to de dados apresen ta um a m dia disperso.
Agora, vam os apren der a calcular as m ed idas de disperso atravs d e d ados tabu lados.
Quan do os dados estiverem n a form a tabulada, h aver um a pequen a diferen a n o clculo das m edidas de disperso, pois agora ser n ecessrio con siderar as frequn cias, que funcion aro com o fatores de pon derao, referen tes
a cada valor da varivel.
3.2.7 Desvio-Padro para Dados Tabulados
Se os dados estiverem tabulados, o desvio-padro pode ser en con trado da seguin te form a:
k

s=

( xi - x )2 fi
i =1

n -1

capt ul o 3

73

Desen volven do a frm ula (3.12) ch egam os a frm ula (3.13) que tam bm
utilizada para o clculo do desvio-padro:
2

xi2 fi

s=

( xi fi )
n

n -1

onde, para am bas as frm ulas (3.12) e (3.13), xi represen ta cada um a das
observaes do con jun to de dados ou, se os dados estiverem agrupados em
classes de frequn cias, xi represen ta o pon to m dio da classe, x a m dia do
con jun to de dados, fi a frequn cia associada a cada observao (ou classe de
observaes) do con jun to de dados e n o n m ero de total de observaes n o
con jun to de dados.
3.2.8 Varincia para Dados Tabulados
A varin cia de um conjunto de dados agrupados dada por:
k

s2 =

( xi - x )2 fi
i =1

n -1
ou
2

s2 =

xi2 fi

( xi fi )
n

n -1

A am plitude, a am plitude interquartil e o coeficiente de variao no sofrem


m odificaes significativas. A am plitude contin ua sen do a diferen a en tre o
m aior e o m enor valor (se os dados estiverem em classes de frequn cias, R ser a
diferena entre o lim ite superior da ltim a classe e o lim ite inferior da prim eira
classe). A am plitude interquartil continua sendo a diferena entre o terceiro e o

74 capt ul o 3

prim eiro quartil e o clculo do coeficien te de variao feito utilizan do a frm ula
(3.11), porm , se os dados estiverem em classes de frequncias, o desvio-padro e
a m dia aritm tica so obtidos utilizan do xi com o o ponto m dio da classe.
3.2.9 Exemplos de Aplicaes das Medidas de Disperso para Dados Tabulados
Para dem on strao dos clculos para dados tabelados, vam os con tin uar utilizan do os exem plos desenvolvidos n o item 2.2 (Exem plos 2.4 e 2.5).

NMERODEFALTA

31

20

Total

63

Exem plo 3.7: Em um determ in ado m s, foi com putado o n m ero x de faltas
ao trabalho, por m otivos de sade, que cada fun cion rio de um a determ in ada
em presa teve. Os dados esto apresen tados n a tabela abaixo:
En con tre a am plitude, o desvio-padro, a varin cia e o coeficien te de variao para este conjun to de dados e in terprete os resultados.

capt ul o 3

75

Resoluo:
A am plitude para este con jun to de dados dada por:
R = x(m ximo) x(mnimo) = 6 0 = 6 pessoas
A m aior diferen a en tre os n m eros de faltas ao trabalh o, por m otivo de
sade, que fun cion rios de um a determ in ada em presa tiveram n o perodo de
um m s, 6 faltas.
O desvio-padro obtido atravs das frm ulas (3.12) ou (3.13). Para exem plificar, vam os trabalhar com a frm ula (3.13). Para facilitar, vam os m on tar um
quadro com os resultados que nos in teressa para aplicar tal expresso.

NMERODE
FALTAS(xi )

xi fi

x2i fi

31

20

20

20

16

32

18

25

36

63

53

131

Total

76 capt ul o 3

( )

Substituin do os valores en con trados n o quadro acim a n a frm ula 3.13, obtem os:

s=

xi2 fi

( xi fi )
n

n -1

2
53)
(
131 -

63
63 -1

2809
63 @ 131 - 44, 59 @
62
62

131 -

@ 1, 3938 @ 1,18 faltas


Podem os dizer que, em m dia, ocorre aproxim adam en te 1 falta por fun cion rio, por m s. Na verdade, sabem os que esse n m ero de faltas por fun cion rio
varia em torno da m dia, m as, tipicam en te, a diferen a em relao m dia
de, aproxim adam en te, 1 falta.
A varin cia obtida atravs das frm ulas (3.14) ou (3.15), porm , com o j
tem os o desvio-padro, a varin cia o valor que est den tro da raiz quadrada.
Portan to, tem os:
s2 = 1,3938 faltas 2

ATENO
O valor da mdia, calculado anteriormente para este conjunto de dados, igual a 0,84 falta.
Se arredondarmos esse valor para um valor inteiro, podemos dizer que a mdia aproximadamente igual a 1 falta.

Com o 1,3938 faltas 2 n o tem in terpretao, utilizam os o desvio-padro para


in terpretar o com portam en to dos dados.
O coeficien te de variao para este exem plo dado por:

cv =

s 1,18
=
@ 1, 4048 ou 140.48%
x 0, 84

capt ul o 3

77

O coeficien te de variao n os diz que este con jun to de dados apresen ta um a


alta disperso.
Para fin alizarm os, vam os fazer os clculos para os dados agrupados em
classes de frequn cias. Para isto vam os utilizar o exem plo 2.5 que se en con tra
no item 2.2.
Exem plo 3.8: A tabela abaixo apresen ta a distribuio de frequn cias do
tem po de vida de 60 com pon en tes eletrn icos (m edido em dias) subm etidos
experim en tao n um laboratrio especializado.

TEMPODE
VIDA(DIAS)

PONTO
MDIO(xi )

3 18

10,5

18 33

25,5

33 48

40,5

48 63

55,5

63 78

10

70,5

78 93

28

85,5

93 108

100,5

108 123

115,5

Total

60

Calcule a am plitude, o desvio-padro, a varin cia e o coeficien te de variao


para este con jun to de dados e in terprete os resultados.

78 capt ul o 3

Resoluo:
A am plitude para este con jun to de dados dada por:
R = x(m ximo) x(mnimo) = 123 3 = 120 dias
A m aior diferen a en tre os tem pos de vida (em dias) dos com pon en tes eletrn icos foi de 120 dias, ou seja, o com pon en te com m aior sobrevivn cia durou
120 dias a m ais do que o com pon en te que durou m en os tem po.
Para o clculo do desvio-padro, podem os utilizar as frm ulas (3.12) ou
(3.13), on de o term o xi o pon to m dio de cada classe de frequn -cia. Com o a
m dia aritm tica en volve valores decim ais, m ais sim ples efetuar os clculos
atravs da frm ula (3.13). Com o n o exem plo an terior, vam os con struir um quadro acrescen tan do as colun as que forn ecero os valores que precisam os para
substituir na frm ula 3.13.

CLASSESDE
FREQUNCIAS

PONTO
MDIO(xi )

xi fi

x2i fi

3 18

10,5

31,5

330,75

18 33

25,5

102

2601

33 48

40,5

162

6561

48 63

55,5

444

24642

63 78

10

70,5

705

49702,5

78 93

28

85,5

2394

204687

93 108

100,5

201

20200,5

108 123

115,5

115,5

13340,25

Total

60

4155

322065

capt ul o 3

79

Com os valores obtidos, tem os:


2

s=

xi2 fi

xi f i )
(

n- 1

2
4155)
(
322065 -

60

60 -1

172640
025
322065 - 287733, 75
60
@
@
59
59

322065 =

@ 581, 89 @ 24,12 dias


Em m dia, os com pon en tes eletrn icos tm durao de 69 dias e 6 h oras
com um a variao de, aproxim adam en te, 24 dias e 3 horas para m ais ou para
m en os com relao m dia.
A varin cia, com o j sabem os, o desvio-padro ao quadrado. Assim , tem os:
s2 = 581,89 dias 2
Com o 581,89 dias 2 no tem interpretao, utilizam os o desvio-padro para
in terpretar o com portam en to dos dados.
O coeficiente de variao para este exem plo :

cv =

s 24,12
=
@ 0, 3483 ou 34, 83%
x 69, 25

o que in dica um a variabilidade alta n o con jun to de dados.

3.3 Grficos
O objetivo da utilizao de grficos em an lise de dados o de facilitar a com preen so do fenm en o estatstico por m eio do efeito visual im ediato que os
grficos proporcion am .

80 capt ul o 3

CONEXO
Vamos refletir um pouco sobre a necessidade de abordagens pedaggicas para o ensino e a
aprendizagem de grficos acessando o endereo < http:/ / www.ufrrj.br/ emanped/ paginas/
conteudo_producoes/ docs_22/ carlos.pdf> .

3.3.1 Tipos de Grficos


Existem vrios tipos de grficos. Os m ais usados so: grfico em lin h as, diagram as de rea (com o por exem plo: grfico em colun as, grfico em barras e grfico
em setores) e grficos para represen tar as distribuies de frequn cias con strudas com in tervalos de classes (com o por exem plo: polgon o de frequn cias,
h istogram a e ogiva).
Segun do VIEIRA(2013, p. 17):
Cada tipo de grfico tem indicao especfica, mas, de acordo com as normas brasileiras:
Todo grfico deve apresentar ttulo e escala;
O ttulo deve ser colocado abaixo da ilustrao.
As escalas devem crescer da esquerda para a direita e de baixo para cima.
As legendas explicativas devem ser colocadas, de preferncia, direita da figura.
Os grficos devem ser numerados, na ordem em que so citados no texto.

Vam os saber um pouco quando usar e com o construir cada um destes grficos.
3.3.1.1 Grfico em Lin h as
Sem pre que os dados estiverem distribudos segun do um a varivel n o tem po
(m eses, anos, etc.), assim com o sucede com os dados do exem plo 3.9 figura 1,
os dados podem , tam bm , ser descritos atravs de um grfico em lin h as. Esse
tipo de grfico retrata as m udan as n as quan tidades com respeito ao tem po
atravs de um a srie de segm en tos de reta. m uito eficien te para m ostrar possveis ten dn cias no conjunto de dados.

capt ul o 3

81

Exem plo 3.9: A tabela 3.1 forn ece um a lista do n m ero de assin an tes de
telefon es celulares, em m ilhes, de 1997 a 2007, do pas X. Con strua um grfico
para resum ir os dados da tabela abaixo.

ANO

ASSINANTES(EMMILHES)

1997

1,1

1998

1,3

1999

1,5

2000

1,9

2001

2,4

2002

2,6

2003

3,1

2004

7,4

2005

18,6

2006

21,5

2007

29

Tabela 3.1 Assinantes de telefones celulares, em milhes, de 1997 a 2007.

O grfico que m elh or represen ta este con jun to de dados o grfico em linh as, j que os dados se reportam a um a srie n o tem po (srie temporal). O grfico est ilustrado n a figura 1..

82 capt ul o 3

35

Assinantes (emmilhes)

30

29

25
21,5
20

18,6

15
10
5
0
1996

7,4
1,1

1,3

1,5

1998

1,9
2000

2,4

2,6 3,1
2002
Anos

2004

2006

2008

Figura 1 Grfico em linha para os dados de assinantes de telefones celulares.

3.3.1.2 Grfico (ou Diagram a) em Barras (ou Colun as)


Os diagram as em barras (ou colunas) so bastante utilizados quando trabalham os
com variveis qualitativas (dados categricos). No eixo horizontal especificam os os
nom es das categorias e no eixo vertical construm os um a escala com a frequncia
ou a frequncia relativa. As barras tero bases de m esm a largura e alturas iguais
frequncia ou frequncia relativa. O grfico em barras, quando as barras esto
dispostas no sentido vertical, tam bm cham ado de gr co em colunas.

ATENO
Quando construmos o grfico de barras para variveis qualitativas e as barras so arranjadas em ordem descendente de altura, a partir da esquerda para a direita, com o atributo que
ocorre com maior frequncia aparecendo em primeiro lugar, denominamos este grfico de
barras de Diagrama de Pareto.

Exem plo 3.10: Um a gran de in dstria de m ateriais de con struo, com diversas lojas espalhadas pelo pas, fez um levan tam en to das prin cipais causas
de perda de ativos durante o an o de 2007 e as in form aes esto dispostas na
tabela seguin te.

capt ul o 3

83

CAUSAS

VALORPERDIDO
(MILHESDEREAIS)

M administrao

5,2

Roubos de funcionrios

3,9

Fraudes nas vendas

5,5

Assaltos s lojas

1,8

Perda do estoque

1,6

Atendimento ruim

0,8

Tabela 3.2: Causas de perda de ativos durante o ano de 2007.

Graficam en te, podem os represen tar este con jun to de dados de trs form as
diferen tes: grfico em colun as, grfico em barras e o grfico em setores (ou piz-

6
4

Atendimentoruim

Perdadoestoque

Assaltosslojas

Fraudesnas vendas

Roubosdefuncionrios

Madministrao

Valor perdido (milhes de reais)

za ou circular), que ser apresen tado n o prxim o item .

Causas

Figura 2a Grfico em colunas para a varivel causas de perdas de ativos.

84 capt ul o 3

Atendimentoruim
Perdadoestoque

Causas

Assaltosslojas
Fraudesnas vendas
Roubosdefuncionrios
Madministrao
0

Valor perdido (milhes de reais)

Figura 2b Grfico em barras para a varivel causas de perdas de ativos.

3.3.1.3 Grfico (ou Diagram a) em Setores


O diagram a em setores, tam bm con h ecido com o grfico de pizza, um dos
grficos m ais utilizados para represen tar variveis qualitativas (ou categricas)
e bastan te apropriado quan do se deseja visualizar a proporo que cada categoria represen ta do total.
Vam os utilizar os dados do exem plo 3.10 para m ostrar um grfico em setores.
Valor Perdido(milhesdereais)

Perdadoestoque
8%

Atendimentoruim
4%

Madministrao
28%

Assaltos
slojas
10%

Fraudesnasvendas
29%

Roubos defuncionrios
21%

Figura 3 Grfico em setores para a varivel causas de perdas de ativos.

capt ul o 3

85

Os grficos que sero apresentados a seguir so grficos con strudos segun do um a distribuio de frequn cias com in tervalos de classes. So eles: o h istogram a, o polgon o de frequncias e a ogiva.
3.3.1.4 Histogram a
Um h istogram a sem elhan te ao diagram a de barras, porm refere-se a um a
distribuio de frequncias para dados quan titativos con tn uos. Por isso, apresen ta um a diferen a: n o h espaos en tre as barras. Os in tervalos de classes
so colocados n o eixo h orizon tal en quan to as frequn cias so colocadas n o
eixo vertical. As frequn cias podem ser absolutas ou relativas.
Exem plo 3.11: A tabela abaixo apresen ta o salrio de fun cion rios de um a
em presa no interior de Min as Gerais.

SALRIO(R$)

FREQ. ABSOLUTA(f )

FREQ. ACUMULADA(fa)

400,00 800,00

38

38

800,00 1200,00

18

56

1200,00 1600,00

12

68

1600,00 2000,00

76

2000,00 2400,00

84

2400,00 2800,00

89

2800,00 3200,00

92

3200,00 3600,00

92

3600,00 4000,00

94

4000,00 4400,00

94

4400,00 4800,00

95

Total

95

86 capt ul o 3

Tabela 3.3 Distribuio de frequncias dos salrios dos funcionrios de uma empresa no
interior de Minas Gerais.

Com o os dados da tabela 3.3 esto apresen tados em in tervalos de classes


podem os represen t-los graficam en te atravs de um h istogram a ou do polgo-

4400,004800,00

4000,004400,00

3600,004000,00

3200,003600,00

2800,003200,00

2400,002800,00

2000,002400,00

1600,002000,00

1200,001600,00

800,001200,00

40
35
30
25
20
15
10
5
0
400,00800,00

Frequncia

n o de frequncias, com o m ostram as figuras 4 e 5, respectivam en te.

Salrio (R$)

Figura 4 Histograma dos salrios dos funcionrios de uma empresa no interior de Minas
Gerais.

3.3.1.5 Polgon o de Frequn cias


Podem os dizer que o polgono de frequn cias um grfico de lin ha de um a
distribuio de frequn cias. No eixo horizon tal so colocados os pon tos m dios de cada in tervalo de classe e n o eixo vertical so colocadas as frequn cias
absolutas ou relativas (com o n o h istogram a). Para se obter as in terseces do
polgon o com o eixo das abscissas, devem os en con trar o pon to m dio da classe
an terior prim eira e o pon to m dio da classe posterior ultim a.
O histogram a e o polgon o de frequn cias so grficos altern ativos e con tm a m esm a in form ao. Fica a critrio de quem est con duzin do o estudo a
escolha de qual deles utilizar.

capt ul o 3

87

Con sideran do os dados do Exem plo 3.11, tem os o polgon o de frequn cias
represen tado pela Figura 5.
40
38
35
30

Frequncia

25
20
18
15
12

10

8
5

2
1
0
0
0
0
200 600 1000 1400 1800 2200 2600 3000 3400 3800 4200 4600 5000
Ponto mdio das faixas salariais (R$)

Figura 5 Polgono de frequncias dos salrios dos funcionrios de uma empresa no interior
de Minas Gerais.

3.3.1.6 Ogiva
Um a ogiva um grfico para um a distribuio de frequn -cias acum uladas.
Utilizan do o Exem plo 3.11, a terceira colun a traz a frequn cia acum ulada dos
dados e a ogiva fica represen tada pela Figura 6.

ATENO
Para construir um grfico de ogiva, devemos usar o limite superior de cada intervalo no eixo
horizontal e a frequncia acumulada no eixo vertical. A frequncia acumulada relacionada
com o limite inferior da primeira classe sempre zero.

88 capt ul o 3

100
90
80

Frequncia Acumulada

70
60
50
40
30
20
10
0
400

800 1200 1600 2000 2400 2800 3200 3600 4000 4400 4800
Salrio (R$)

Figura 6 Ogiva dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

3.3.1.7 Diagram a de Disperso


O diagram a de disperso um grfico m uito utilizado quan do tem os in teresse em iden tificar a associao en tre duas variveis quan titativas (X e Y). Para
con stru-lo, cada para ordenado colocado em suas determ in adas coorden adas (x,y). Vam os construir um diagram a de disperso utilizan do os dados do
exem plo a seguir.
Exem plo 3.12: Um a concession ria de veculos quer verificar a eficcia de
seus an n cios em determ inado jorn al n a ven da de carros n ovos. A tabela, a
seguir, m ostra o nmero de anncios publicados, por m s, e o correspon den te
nmero de carros vendidos n os ltim os seis m eses.

NMERODEANNCIOSPUBLICADOS(X)

NMERODECARROSVENDIDOS(Y)

28

140

20

110

22

100

14

75

10

60

52

Tabela 3.4 Nmero de anncios publicados e nmero de carros vendidos

capt ul o 3

89

Para verificarm os, visualm ente, se h relao entre o nm ero de anncios publicados e o nm ero de carros vendidos, construm os o diagram a de disperso.

160
Nmero de carros vendidos

140
120
100
80
60
40
20
0

10

15

20

25

30

Nmero de annciospublicados

Figura 7 Diagrama de disperso do nmero de anncios publicados e nmero de carros


vendidos.

Pela anlise grfica observam os que m edida que o n m ero de an n cios


publicados aum en ta, ocorre um aum en to n o n m ero de carros ven didos.

ATENO
Um tipo de grfico muito utilizado em jornais e revistas o grfico pictrico. Estes grficos
so construdos a partir de figuras ou conjunto de figuras que so representativas do fenmeno em estudo. Como so representados por figuras, despertam a ateno do leitor.

Com o vim os n os iten s an teriores, os grficos n os auxiliam n o estudo do


com portam en to da varivel em estudo n o con jun to de dados. Apesar de ser
um a ferram en ta eficaz, precisam os tom ar cuidado n a con struo dos grficos
para n o obterm os concluses en gan osas. Os prin cipais erros n a elaborao de
um grfico so:
1. Grfico sucata: n este tipo de grfico, h um uso excessivo de figuras que
2.

podem ocultar a in form ao que se deseja tran sm itir.


Ausn cia de base relativa: quan do utilizam os in form aes de m ais de
um con jun to de dados de tam an h os diferen tes em um m esm o grfico,
com o objetivo de fazer com paraes, devem os utilizar a frequn cia re-

90 capt ul o 3

lativa ao in vs da frequn cia absoluta.


3.

Eixo vertical com prim ido: as escalas em pregadas devem ser coeren tes
com o tam an ho da figura exibida. Se o eixo vertical estiver com prim ido,
as diferen as reais en tre as categorias de respostas da varivel podem
ficar distorcidas.

4.

Ausncia do pon to zero: a ausn cia do pon to zero n o eixo vertical ten de a produzir um a im presso en gan osa do com portam en to dos dados,
exageran do ou reduzin do even tuais variaes.

ATIVIDADE
1. Uma agncia de turismo est interessada em saber o perfil dos seus clientes com relao varivel estado civil. Para isso, o gerente desta agncia pediu ao funcionrio do
setor de vendas para fazer um grfico que resuma estas informaes. Construa o grfico
e interprete-o.

ESTADOCIVIL

NMERODECLIENTES

Solteiro

2600

Casado

900

Vivo

345

Separado

1200

Outros

1020

Total

6065

2. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em


um determinado supermercado no primeiro sbado aps receberem seus pagamentos
(salrios). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e
18h, e anotou os valores gastos por cada um deles. Estes valores esto listados abaixo:
4,89

11,00

5,60

73,85

24,83

98,00

186,00

234,87

58,00

198,65

223,86

341,42

94,76

445,76

82,80

35,00

455,00

371,00

398,60

234,00

64,90

54,98

48,80

68,90

120,32

126,98

76,43

6,35

9,98

12,68

capt ul o 3

91

243,00

18,65

134,90

11,10

321,09

290,76

74,00

48,80

74,52

138,65

26,00

210,13

15,78

197,45

75,00

76,55

32,78

166,09

105,34

99,10

Analisando o conjunto de dados, responda os seguintes itens:


a) Construa uma distribuio de frequncias a partir do conjunto de dados brutos.
b) Construa um histograma e um polgono de frequncias para a tabela construda no
item b).

45

17
4

1400| 1700

1700| 2100

2100| 2400

2400| 2700

1100| 1400

12

800| 1100

50
45
40
35
30
25
20
15
10
5
0

500| 800

Frequncia

3. Analise o grfico abaixo e responda:

Salrio (R$)

a) Qual a varivel em estudo? Classifique-a.


b) Quantos funcionrios ganham entre R$800,00 (inclusive) e R$1100,00 (exclusive)?
c) Qual o nmero de funcionrios total desta empresa?
d) Qual a porcentagem de funcionrios que ganham R$1700,00 ou mais?
e) Qual a porcentagem de funcionrios que ganham entre R$500,00 (inclusive) e no
mais que R$1100,00?
f) A partir do histograma, monte uma tabela de distribuio de frequncias.

92 capt ul o 3

4. Os dados abaixo referem-se ao nmero de horas extras de trabalho que uma amostra de
64 funcionrios de uma determinada empresa localizada na capital paulista.
10

10

12

14

14

14

15

16

18

18

18

18

18

19

20

20

20

20

20

21

22

22

22

22

22

22

22

22

22

22

22

22

23

23

24

24

24

24

24

24

24

25

25

25

25

26

26

26

26

26

26

27

27

27

28

28

29

30

30

32

35

36

40

41

Pede-se:
a) Calcule e interprete as seguintes medidas de disperso, calculadas para os dados
brutos (dados no tabulados): amplitude, desvio-padro, varincia e coeficiente de
variao e interprete os resultados.
b) Construir uma distribuio de frequncias completa (com freq. absoluta, freq. relativa, freq. acumulada e ponto mdio).
c) Atravs da distribuio de frequncias construda no item b), encontre a amplitude,
o desvio-padro, a varincia e o coeficiente de variao e interprete os resultados.
d) Com a tabela construda no item b), encontre as seguintes medidas: 1 quartil, 7
decil e 99 Percentil. Interprete os resultados.
e) Construa o histograma para este conjunto de dados.
5. Os dados a seguir representam as notas de 5 disciplinas de um determinado candidato
em um concurso pblico. So elas:
2, 5, 8, 8, 9
Calcule a amplitude, o desvio-padro, a varincia e o coeficiente de variao. Interprete
os resultados.

capt ul o 3

93

6. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com


relao ao nmero de filhos por famlia:

NMERODEFILHOS

FREQUNCIADE
FAMLIAS

19

22

28

16

Calcule e interprete os resultados da:


a) amplitude
b) desvio-padro
c) coeficiente de variao
7. O histograma abaixo representa a distribuio das idades dos funcionrios de uma agncia bancria. Com base no histograma abaixo, responda:

frequncias

Histograma
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0

2025 2530 3035 3540 4045 4550


Idade

Qual a amplitude, o desvio-padro, a varincia e o coeficiente de variao para as idades


dos funcionrios? Interprete os resultados.

94 capt ul o 3

8. Um fabricante de caixas de cartolina fabrica trs tipos de caixa. Testa-se a resistncia


de cada caixa, tomando-se uma amostra de 100 caixas e determinando-se a presso
necessria para romper cada caixa. So os seguintes os resultados dos testes:

TIPOSDECAIXAS

Presso mdia de ruptura (bria)

15

20

30

Desvio-padro das presses (bria)

a) Que tipo de caixa apresenta a menor variao absoluta na presso de ruptura?


b) Que tipo de caixa apresenta a maior variao relativa na presso de ruptura?

REFLEXO
Vimos, nesse captulo, que to importante quanto conhecer a mdia de um conjunto de dados, por exemplo, determinar o seu grau de variabilidade (ou disperso). Na maioria dos
estudos que realizamos, nos deparamos com conjuntos que podem apresentar maior ou
menor grau de homogeneidade.
Conjuntos com caractersticas de maior homogeneidade tendem a nos fornecer informaes mais precisas e confiveis. Imagine, por exemplo, um estabelecimento que diariamente
presta atendimento aos seus clientes. Se a quantidade desses clientes varia muito de um dia
para outro, fica mais difcil voc determinar quantos funcionrios disponibilizar para realizar
o atendimento. No entanto, se esse nmero varia pouco (apresenta-se mais homogneo) de
um dia para o outro, fica muito mais fcil montar uma estrutura adequada de atendimento.

LEITURA
Sugerimos a leitura do artigo E se todos fossem ao cinema ao mesmo tempo? do professor
Luiz Barco, disponvel em:< http:/ / super.abril.com.br/ ciencia/ lei-regularidade-estatistica-se-todos-fossem-ao-mesmo-cinema-ao-mesmo-tempo-439499.shtml> . Ele retrata, de forma bem
interessante, a questo da regularidade dos fenmenos relacionados ao comportamento social.

capt ul o 3

95

REFERNCIASBIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BRUNI, Adriano L. Estatstica Aplicada Gesto Empresarial. 2.ed. So Paulo: Atlas, 2010.
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003
COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.
DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo estatstica. Rio de Janeiro: LTC, 2003.
TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.
VIEIRA, Sonia. Estatstica Bsica. So Paulo: Cengage Learning, 2013.

NOPRXIMOCAPTULO
No prximo captulo estudaremos uma das tcnicas mais utilizadas da Inferncia Estatstica: Estimao Pontual e Estimao Intervalar. Veremos como estimar a mdia populacional a partir da
mdia de uma amostra retirada dessa populao. Nesse tipo de estudo, surgem definies conhecidas como: margem de erro, nvel de confiana da pesquisa, etc. Alm da estimao das
mdias, tambm estudaremos a estimao de propores populacionais. Na construo do intervalo de confiana precisamos de conhecimentos sobre a distribuio Normal, cujo conceito tambm ser introduzido no prximo captulo.

96 capt ul o 3

Distribuies
Amostrais e
Estimao

4 Distribuies Amostrais e Estimao


A Infern cia Estatstica um conjun to de tcn icas m uito utilizadas em problem as prticos do dia a dia. Com estas tcnicas podem os tirar con cluses acerca de
um a populao de interesse utilizan do in form aes de um a am ostra aleatria.
A gran de van tagem em se utilizar a In fern cia Estatstica econ om izar tem po
e din h eiro que seriam gastos para an alisar um a populao in teira, ressaltan do
que, algum as vezes, im possvel trabalh ar com toda a populao de in teresse.
Um a das tcn icas m ais im portan te e utilizada da In fern cia Estatstica a Estim ao.
Verem os neste captulo com o estim ar um a caracterstica de in teresse n a populao atravs da estima o pontual e por intervalo.
Algun s con ceitos bsicos necessrios para o desen volvim en to terico das tcn icas de In fern cia Estatstica tam bm sero apresen tados.

OBJETIVOS
Saber estimar tanto a mdia como a proporo populacional (referentes a uma varivel presente na populao) a partir de dados coletados em uma amostra aleatria retirada dessa populao.

REFLEXO
Voc se lembra de j ter ouvido notcias sobre divulgao de resultados de pesquisas em que
foram citados termos como margem de erro e nvel de confiana da pesquisa? Sempre que as
pesquisas so realizadas em amostras, esses conceitos passam a fazer parte dos resultados que
sero obtidos. Vamos compreender melhor o que eles significam e como so determinados.

4.1 Conceitos Bsicos


Parm etro um a quan tidade n um rica, em geral descon hecida, que descreve
um a caracterstica da populao. Norm alm en te represen tado por letras gregas com o , e , en tre outras.
Estim ador um a fun o dos valores da am ostra que utilizam os para estim ar um parm etro populacion al. Os estim adores, em geral, so represen tados

98 capt ul o 4

por letras gregas com acento circun flexo: q, m e s etc.


Estim ativa o valor num rico obtido atravs do estim ador.
Erro am ostral a diferen a en tre o resultado am ostral e o verdadeiro resultado da populao; tais erros resultam de flutuaes am ostrais devidas ao acaso.
Erro n o am ostral ocorre quan do os dados am ostrais so coletados, registrados ou analisados in corretam en te. Por exem plo: os dados so selecion ados
atravs de um a am ostra ten den ciosa, uso de um in strum en to de m edida defeituoso ou o registro incorreto dos dados.
Am ostra Aleatria Sim ples (AAS) de tam an ho n de um a v.a. X, com determ in ada distribuio, o con jun to de n v.a. s in depen den tes X1, X2, ..., Xn cada um a
com a m esm a distribuio de X.
Populao
Amostra

Parmetro

Estatstica
Interferncia Estatstica

Figura 8 Esquema de inferncia sobre um parmetro


Fon te: (MARTINS, 2006).

Com o o estim ador um a fun o de valores da am ostra aleatria, ou seja, q


= f (X1, X2, ..., Xn), para diferen tes am ostras vam os obter valores diferen tes para
o estim ador q . Portan to, q tam bm um a varivel aleatria. Com o um a estim ativa para o parm etro populacion al pode ser obtida utilizan do m ais de um
estim ador, precisam os estudar algum as propriedades dos estim adores para
decidir qual utilizar. Vam os estudar agora duas propriedades dos estim adores:
vcio e consistncia.
Vcio: um estim ador q n o viciado para se E( q ) = , ou seja, o valor esperado do estim ador igual ao valor do parm etro.

capt ul o 4

99

Con sistn cia: um estim ador q con sisten te se:


^

limE(q) = q
n

limVar(q) = 0
n

Podem os observar que um estim ador con sistente se, quando aum entam os
o tam an ho da am ostra, o valor esperado do estim ador igual ao valor do parm etro, portanto, no viciado, e a varincia do estim ador con vergir para zero.
Dois parm etros populacion ais m uito im portan tes e de gran de in teresse
em se estim ar so a mdia e a propor o. Portan to, vam os escolh er agora os estim adores utilizados para estim ar estes dois parm etros de m an eira que eles
satisfaam as propriedades de vcio e con sistn cia.

4.2 Estimador de uma Mdia Populacional


O m elh or estim ador da m dia populacion al a m dia am ostral:

1
X = ( X1 + X 2 + ... + X n )
n
Para m ostrar que X um estim ador no viciado e consisten te da m dia populacion al precisam os encontrar E(X) e Var(X) .
Seja X1, X2, ..., Xn um a am ostra aleatria retirada de um a populao,
iden tificada pela varivel X, com m dia e varin cia 2 Da defin io de
AAS tem os que cada Xi, i = 1, 2, ..., n tem a m esm a distribuio de X, ou seja,

E(Xi )= m e Var(X i )= s 2 .

100 capt ul o 4

Pelas propriedades da esperan a e da varin cia tem os:

X + X 2 + ... + X n 1
E( X ) = E 1
= n
E( X1) + E( X 2 ) + ... + E( X n )

1
nm
= [ m + m + ... + m] =
=m
n
n
e

X + X 2 + ... + X n 1
Var ( X ) = Var 1
= n2
Var ( X1) + Var ( X 2 ) + ... + Var ( X n )

1 2
ns2 s2
2
2
= 2 [ s + s + ... + s ] = 2 =
n
n
n
O prim eiro resultado m ostra que a m dia am ostral um estim ador n o
viciado da m dia populacional. O segun do resultado m ostra que, con form e n
cresce, a varincia da m dia am ostral ten de a zero, portan to X um estim ador
con sisten te para .
Exem plo 4.1: Um a am ostra aleatria de 20 fam lias de determ in ado bairro
foi selecion ada e observou-se o n m ero de pessoas em cada fam lia com n vel
superior com pleto. Os dados obtidos foram :
1, 2, 2, 0, 3, 1, 1, 3, 0, 1, 2, 2, 1, 3, 1, 0, 2, 1, 1, 2
En con tre a estim ativa para a m dia de pessoas com n vel superior com pleto
n este bairro.

capt ul o 4

101

Resoluo:
Pelo que vim os na teoria, o estim ador utilizado para se estim ar a m dia populacion al a m dia am ostral, ou seja:

1
(1+ 2 + 2 + 0 + ... + 2)
20
29
=
@ 0, 97
30

X=

En to, podem os con cluir que, n este bairro, aproxim adam en te 1 pessoa
possui n vel superior com pleto.

4.3 Estimador de uma Proporo Populacional


O m elh or estim ador da proporo populacion al p a proporo am ostral:

p=

nmero de indivduos na amostra com determinada caracterrstica


n

Se defin irm os um a varivel aleatria Xi com o:

1 , se o indivduo apresenta a caracterstica


Xi =
0 , se o indivduo no apresenta a caracterstica
podem os reescrever frm ula da proporo am ostral com o:
n X
X1 + X 2 + ... + X n
p=
= i = X
n
i =1 n

Portan to, o estim ador da proporo populacion al um a m dia de variveis


aleatrias con ven ien tem en te defin idas.

102 capt ul o 4

ATENO
A distribuio de Bernoulli uma distribuio de probabilidade discreta com as seguintes
caractersticas: o experimento realizado somente uma vez e a v.a. X assume apenas dois
valores, P(sucesso) = P(X = 1) = p e P (fracasso) = P(X = 0) = 1 p, com E(X) = p e VAR(X)
= 1 p.

Seja X1, X2, ..., Xn um a sequn cia de variveis aleatrias in depen den tes com
distribuio de Bern oulli. Pelas propriedades da esperan a e da varin cia tem os:

X + X 2 + ... + X n 1
E p = E 1
= n
E( X1) + E( X 2 ) + ... + E( X n )

1
np
= [ p + p + ... + p] =
=p
n
n

()

X + X 2 + ... + X n 1
Var p = Var 1
= n2
Var ( X1) + Var ( X 2 ) + ... + E( X n )

1
np(1- p) p(1- p)
= 2 [ p(1- p) + p(1- p) + ... + p(1- p)] =
=
n
n2
n

()

Com o n o caso do estim ador X vem os que p um estim ador n o viciado


pois E( p ) = p e con sisten te pois, a m edida que n aum en ta, a varin cia da proporo am ostral tende a zero.
Exem plo 4.2: Um a determ in ada academ ia, in teressada em abrir um a filial
em certo bairro, selecion ou um a am ostra aleatria de 30 adultos e pergun tou
se a pessoa fazia atividades fsicas pelo m en os 3 vezes por sem an a. As respostas
foram classificadas da seguin te m an eira: foi atribudo o valor 1 se a pessoa respon deu sim e 0 se a pessoa respon deu n o. Os resultados so:
0 1 0 0 1 1 1 1 1 0 1 1 0 0 0
1 0 0 1 1 0 1 0 0 1 0 1 1 1 0

capt ul o 4

103

Obten h a (estim e) a proporo de pessoas, n este bairro, que fazem atividades fsicas pelo m en os trs vezes por sem an a.
Para estim arm os esta proporo utilizam os a proporo am ostral dada por:

p=

0 +1+ 0 + 0 + 1+ ... + 0 16
=
= 0, 5333
30
30

Portan to, baseado nesta am ostra, aproxim adam en te 53,33% das pessoas
deste bairro fazem atividade fsica pelo m en os trs vezes por sem an a.
An tes de passarm os para o con ceito de distribuies am ostrais e estim ao
in tervalar vam os estudar as caractersticas de um a varivel aleatria cuja distribuio Norm al. Precisarem os do con ceito da distribuio Norm al para con struir in tervalos de con fian a.

4.4 Propriedades da Distribuio Normal


A distribuio n orm al um a distribuio con tn ua de probabilidade de um a
varivel aleatria X. Seu grfico ch am ado de curva n orm al.
Segun do LARSON (2004, p. 160), a distribuio n orm al tem as seguin tes
propriedades:
1. A m dia, a m ediana e a m oda so iguais.
2.
3.
4.

A curva n orm al tem form ato de sin o e sim trica em torn o da m dia.
A rea total sob a curva n orm al igual a 1.
A curva n orm al aproxim a-se m ais do eixo x m edida que se afasta da
m dia em am bos os lados, m as n un ca toca o eixo.

Dois parm etros, e , determ in am com pletam en te o aspecto de um a curva n orm al. A m dia () inform a a localizao do eixo de sim etria e o desvio padro () descreve quanto os dados se espalh am em torn o da m dia.

104 capt ul o 4

0,9
0,8

= 0, 2 = 0,2
= 0, 2 = 1,0

0,7
0,6

= 0, 2 = 5,0

= 2, 2 = 0,5

0,5

0,4
0,3
0,2

0,1
0
5

Figura 9 Distribuies Normais, N (, 2)


Fon te:<h ttp://www.cultura.ufpa.br/dicas/biom e/bion or.htm >.

As curvas n orm ais a, b e c apresen tam m dias iguais (por isto esto localizadas n a m esm a posio no eixo x), m as apresen tam desvios padro diferen tes
(por isto a curva c, que apresen ta m aior desvio padro, m ais ach atada e a curva
a , que apresen ta m en or desvio padro, m ais fech ada em torn o da m dia).
A curva d apresen ta m dia diferen te das outras curvas, por isto est localizada n um a posio diferen te n o eixo x.

4.5 Distribuies Amostrais


Estudam os com o determ in ar os estim adores da m dia e da proporo populacion al. En con tram os o valor esperado e a varin cia de cada estim ador sem
especificar a sua distribuio.
Agora vam os obter in form ao sobre a form a da distribuio dos estim adores da m dia e da proporo.
A distribuio am ostral de um estim ador a distribuio de todos os valores do estim ador quando todas as am ostras possveis de m esm o tam an h o n
so extradas da m esm a populao. A distribuio am ostral de um estim ador
represen tada, frequentem en te, atravs de um a tabela ou de um histogram a.

capt ul o 4

105

4.5.1 Distribuio Amostral da Mdia


Para en con trar a distribuio am ostral da m dia utilizarem os um resultado
fun dam en tal na teoria da Inferncia Estatstica, con h ecido com o Teorema do
Limite Central.

Teorem a do Lim ite Central (TLC)


Para am ostras aleatrias sim ples (X1, X2, ..., Xn), selecion adas de um a populao com m dia e varin cia 2 fin ita, a distribuio am ostral da m dia X
pode ser aproxim ada, para n gran de, pela distribuio n orm al, com m dia e
varin cia 2/n (desvio padro, 2/

n ).

Observao: para am ostras com 30 elem en tos ou m ais a aproxim ao con siderada boa.
Se a populao n orm al N(, 2), a distribuio am ostral da m dia tem
distribuio exata n orm al com m dia e varin cia 2/n para qualquer tam an ho
de am ostra.

Na aplicao do teorema do limite central, o resultado

supe que a popu-

lao seja infinitamente grande. Quando trabalhamos com amostragem com reposio,
a populao infinitamente grande. Agora, em populaes finitas, cuja amostragem
feita sem reposio, precisamos fazer um ajuste no resultado

. Vamos

utilizar a seguinte regra emprica:


Quando a amostragem for sem reposio e o tamanho amostral n for maior que 5% do
tamanho finito N da populao, ou seja, n > 0,05 N, devemos ajustar o desvio padro
das mdias amostrais

106 capt ul o 4

multiplicando-o pelo fator de correo para populao finita:

4.5.2 Distribuio amostral da proporo


No item 4.3 vim os que o estim ador da proporo populacion al um a m dia de
v.a s, ou seja,

p=

X1 + X 2 + ... + X n
=X
n

Portanto, para n gran de podem os con siderar a distribuio am ostral de p


com o aproxim adam ente norm al:

p(1- p)
p ~ N p,

4.6 Erro Padro de um Estimador


Seja q um estim ador do parm etro . O erro padro de q a quan tidade:

EP(q)= Var (q)


Em palavras, o erro padro avalia a preciso do clculo do estim ador populacion al.
No caso da m dia am ostral, que estim ador da m dia populacion al, tem os:

EP(X) =

s2
s
=
n
n

Com o , em geral, descon h ecido podem os obter o erro padro estim ado
de X , ou seja:

s2
EP(X) =
=
n

s
n

capt ul o 4

107

onde s2 a varin cia am ostral.


No caso da proporo am ostral, que o estim ador da proporo populacional, tem os:

EP( p ) =

p (1 - p)
n

Quan do n o con hecem os p obtem os o erro padro estim ado de p substituin do p por p :

EP( p ) =

p 1- p

Os estim adores vistos at agora so pontuais, ou seja, produzem um n ico


valor com o estim ativa do parm etro. Se quiserm os m edir a preciso da estim ativa obtida podem os con struir interva los de con a na que so baseados n a distribuio am ostral do estim ador pon tual.
A um in tervalo de con fian a est associado um n vel de con fian a 1 que
forn ece a probabilidade de que o in tervalo in cluir o verdadeiro parm etro populacion al em vrias am ostras repetidas.
Devem os tom ar bastan te cuidado n a in terpretao do in tervalo de con fian a. Um a interpretao con ven ien te a seguin te: se selecion arm os vrias
am ostras de m esm o tam an ho e calcularm os, para cada um a delas, os correspon den tes intervalos de con fiana com n vel de con fian a 1 , esperam os que
a proporo de in tervalos que con ten h am o valor do parm etro populacion al
seja igual a 1 . Por exem plo, se selecion arm os 100 am ostras de m esm o tam anh o e construirm os seus respectivos in tervalos de con fian a, 95 in tervalos iro
con ter o verdadeiro valor do parm etro populacion al.

108 capt ul o 4

Valor do parmetro da populao desconhecido

Figura 10 intervalos de confiana para o parmetro populacional

As escolh as m ais com un s para o n vel de con fian a e, con sequen tem en te,
os respectivos valores crticos obtidos da distribuio n orm al so:

NVEL DE
CONFIANA

VALORCRTICOZ/2

90%

0,10

1,645

95%

0,05

1,96

99%

0,01

2,575

A escolha de 95% a m ais com um porque resulta em um bom equilbrio en tre preciso (que refletido na largura do in tevalo de con fian a) e con fiabilidade (con form e expresso pelo nvel de con fian a). Depen den do da n ecessidade,
o nvel de con fian a pode superar 99%. No en tan to, quan to m aior esse n vel,

capt ul o 4

109

m aior tam bm ser a m argem de erro, que sign ifica perda n a preciso dos resultados. Portan to, n ecessrio dosar n vel de con fian a e m argem de erro,
para se ch egar aos resultados m ais apropriados.

ATENO
De acordo com TRIOLA (2008, p. 255) , um valor crtico um nmero na fronteira que
separa estatsticas amostrais que tm chance de ocorrer daquelas que no tem. O nmero
Z/ 2 um valor crtico que um escore z com a propriedade de separar uma rea de / 2 na
cauda direita da distribuio normal padronizada.

4.7 Intervalos de Confiana para a Mdia Populacional


Podem os con struir in tervalos de con fian a para a m dia populacion al con sideran do 2 casos: con hecido ou descon h ecido. Estudarem os cada um dos
casos a seguir.
1 CASO Com conh ecido
Para con struirm os um intervalo de con fian a para a m dia populacion al
com con hecido tem os que verificar os seguin tes requisitos:
1.
2.
3.

A am ostra em estudo um a am ostra aleatria sim ples.


O valor do desvio padro populacion al, , con h ecido.
Um a ou am bas as con dies so satisfeitas: a populao n orm alm en te
distribuda ou n > 30.

Um in tervalo de con fian a para a m dia populacion al, verificado os requisitos acim a, dado por:

x za / 2

s
n

onde 1 o n vel de con fian a e za / 2 o valor tabelado da distribuio


norm al padron izada.
s
O valor obtido de za / 2
cham ado m argem de erro ou erro m xim o
n
da estim ativa.

110 capt ul o 4

2 CASO Com desconh ecido


Para con struirm os um in tervalo de con fian a para a m dia populacion al
com desconhecido tem os que verificar os seguin tes requisitos:
1.

A am ostra em estudo um a am ostra aleatria sim ples.

ATENO
Quando coletamos um conjunto de dados amostrais para estimar um parmetro populacional,
o valor obtido pelo estimador deste parmetro tipicamente diferente do valor do parmetro. A
diferena entre estes dois valores chamada margem de erro ou erro mximo de estimativa, ou
seja, a diferena mxima provvel entre a estimativa obtida atravs do estimador e o verdadeiro
valor do parmetro populacional.

2.

Um a ou am bas as con dies so satisfeitas: a populao n orm alm en te


distribuda ou n > 30.

Um in tervalo de con fian a para a m dia populacion al, verificado os requisitos acim a, dado por:

x ta / 2

s
n

onde 1 o n vel de confian a, ta / 2 o valor tabelado da distribuio t de


Studen t com n 1 graus de liberdade e s o desvio-padro am ostral.
s
O valor obtido de ta / 2
cham ado m argem de erro ou erro m xim o da

estim ativa.
A form a da distribuio t de Student parecida com a da distribuio n orm al: tem m dia t = 0, com o a distribuio n orm al padron izada, com m dia z =
0; sim trica m as apresenta caudas m ais alon gadas, ou seja, m aior variabilidade do que a n orm al. Quan do aum en tam os o tam an ho da am ostra, a distribuio t de Student ten de para a distribuio n orm al.
O quadro a seguir resum e os Casos 1 e 2.

capt ul o 4

111

DISTRIBUIO

CONDIES
conhecido e populao normalmente

Use a distribuio normal (z)

distribuda ou conhecido e n

>

30

desconhecido e populao normalmen-

>

Use a distribuio t

te distribuda ou desconhecido e n
30

Use um mtodo no paramtrico ou

Populao no normalmente distribuda

bootstrap

en

30

Notas: 1. Critrios para decidir se a populao ou no normalmente distribuda: A


populao no precisa ser exatamente normal, mas deve parecer simtrica de alguma forma, com uma nica moda e sem outliers.
2. Tamanho amostral n > 30: Essa uma diretriz comumentemente usada, mas tamanhos amostrais de 15 a 30 so adequados se a populao parecer ter uma distribuio
que no se afasta muito da normal e se no h outliers. Para algumas distribuies
populacionais que se afastam extremamente da normal, o tamanho amostral pode precisar ser maior do que 50, ou mesmo 100.

Quadro 4.1 Escolha entre z e t


Fon te: (TRIOLA, 2008, p. 280).

4.8 Intervalos de Confiana para a Proporo Populacional


Vim os n a distribuio am ostral do estim ador p que, para n gran de,

p(1- p)
p ~ N p,

112 capt ul o 4

Verificados os requisitos, tem os que um in tervalo de con fian a para a proporo dado por:

p za/2

p(1- p)
n

onde 1 o n vel de con fian a e za /2 o valor tabelado da distribuio


n orm al padron izada.
O valor obtido de za /2
xim o da estim ativa.

p(1- p)
ch am ado m argem de erro ou erro m n

CONEXO
Os requisitos necessrios para a costruo de intervalos de confiana para a proporo populacionam exigem conhecimento da distribuio de probabilidade Binomial. Para isto, leia a
Seo 7.2 Estimao da Proporo Populacional, em (TRIOLA, 2008, p. 252).

Exem plo 4.3: De um a am ostra de 40 observaes de um a populao n orm al


com m dia desconh ecida e desvio-padro =5, obtem os um a m dia am ostral

x = 25.
Con struir um in tervalo de 95% de con fian a para a m dia populacion al.
Resoluo:
Neste exem plo vam os usar a frm ula do in tervalo de con fian a descrito n o
1 CASO. Os dados que o exerccio forn ece so:

x = 25; n = 40; s = 5; 1- a = 0, 95;


a = 0, 05; a /2 = 0,025; za / 2 = 1, 96

capt ul o 4

113

Substituin do n a frm ula tem os:

s
s

; x + za / 2
x - za / 2
n
n

5
5

25
1
,
96

;
25
+
1
,
96

40
40

9, 8
9, 8

;
+
2
5
25

6, 3246
6, 3246

[25 -1, 5495 ; 25 +1, 5495]

[23, 4505 ;

26, 5495]

Podem os in terpretar este in tervalo da seguin te m an eira: estam os 95% con fian tes que o in tervalo de 23,4505 a 26,5495 realm en te con ten h a o verdadeiro
valor de . Ou ainda, se selecion ssem os m uitas am ostras diferen tes de tam anh o 40 e con strussem os os intervalos de con fian a com o fizem os aqui, 95%
deles con teriam realm en te o valor da m dia populacion al .
Exem plo 4.4: Um a am ostra de tam an h o 15, extrada de um a populao n orm al, forn ece um a m dia am ostral x = 23 e s = 0,5. Con struir um in tervalo de
90% de con fian a para a m dia populacion al.
Resoluo:
Vam os usar o intervalo de con fian a descrito n o 2 CASO, pois tem os um a
populao n orm al com descon hecido. Os dados so:

x = 23, 5; n = 15; S = 0, 5; 1- a = 0, 9; a = 0,1;


a /2 = 0,05; ta / 2 = 1, 761; n -1 = 14

114 capt ul o 4

Usando a frm ula:

S
S

; x + ta / 2
x - ta / 2
n
n

0, 5
0, 5

; 23, 5 +1, 761


23, 5 -1, 761

15
15

0, 8805
0, 8805

23, 5 - 3, 8730 ; 23, 5 + 3, 8730

[23, 5 - 0, 2273 ; 23, 5 + 0, 2273]

[23, 2727 ;

23, 7273]

Exem plo 4.5: Em um a cidade foram entrevistadas 2.000 pessoas e constatou-se


que 1.200 esto satisfeitas com o atual prefeito. Construir um intervalo de 95% de
confiana para a proporo populacional que est satisfeita com o atual prefeito.
Resoluo:
Os dados so:

1.200
= 0, 6; 1 - p = 0, 4; n = 2.000; 1- a = 0, 95;
2.000
a = 0, 05; a /2 = 0,025; za / 2 = 1, 96

p=

Um intervalo de 95% de con fian a para a proporo populacion al dado por:

S
S

p
z

;
p
+
z

a/2
a/2

n
n

0, 6 0, 4
0, 6 0, 4
0
,
6
1
,
96

;
0
,
6
+
1
,
96

2.000
2.000

[0, 6 -1, 96 0, 01095 ; 0, 6 +1, 96 0, 01095]

[0, 6 - 0, 021462 ; 0, 6 + 0, 021462]


[0, 57854 ; 0, 62146]
Se quiserm os um in tervalo de 95% de con fian a para a porcen tagem populacion al podem os expressar este resultado com o [57,85% ; 62,15%].
capt ul o 4

115

ATENO
Podemos interpretar este intervalo da seguinte maneira: entre os moradores desta cidade, a porcentagem dos que esto satisfeitos com o atual prefeito estimada em 60%, com uma margem
de erro de 2,15%.

ATIVIDADE
1. Uma agncia de publicidade est interessada em estimar a idade mdia em que os adolescentes comeam a fumar. Uma amostra aleatria de 25 fumantes, extrada de uma populao normal, forneceu uma mdia amostral de 15 anos e um desvio-padro amostral de
1,7 ano. Construir um intervalo de 99% de confiana para estimar a idade mdia em que
a populao adolescente comea a fumar. Determine a margem de erro e o erro padro
estimado da mdia.
2. 02. A fim de averiguar a popularidade da gesto da nova reitoria de determinada universidade, uma amostra aleatria de 400 estudantes foi selecionada e constatou-se que 45%
estavam satisfeitos com a nova gesto.
a) Obtenha o erro padro estimado da proporo;
b) Determine o intervalo de 95% de confiana para a proporo populacional.
3. Os dados abaixo referem-se ao nmero de horas semanais que os estudantes do primeiro
semestre de administrao passaram se preparando para o exame de Estatstica.
1

1
6

1
6

2
6

2
7

2
7

3
7

3
7

4
7

4
7 7

4
7

4
8

4
8

5
8

5
8

5
8

6
8

Determine:
a) o erro padro estimado da mdia;
b) o intervalo de 96% de confiana para a mdia populacional.
4.

Dos 1.600 funcionrios entrevistados numa empresa, 880 esto de acordo com a nova
poltica salarial. Construir um intervalo de 98% de confiana para a proporo populacional
dos funcionrios desta empresa favorveis nova poltica salarial.

116 capt ul o 4

5. Para se avaliar a popularidade de certo candidato prxima eleio para prefeito de determinada cidade, extraiu-se uma amostra aleatria de 1.000 eleitores e constatou-se que
400 votariam no candidato. Estimar a proporo de eleitores em toda a cidade que tm a
inteno de votar no candidato. Encontre o erro padro estimado da proporo.

REFLEXO
Vimos que possvel encontrar a melhor estimativa pontual da mdia e da proporo, mas
no temos indicao de quo boa esta nossa melhor estimativa. Para contornar isto, utilizamos a estimativa intervalar, ou intervalo de confiana, que consiste em uma faixa de valores
em vez de apenas um nico valor. Como dissemos anteriormente, precisamos ser cuidadosos para interpretar corretamente os intervalos de confiana. Na interpretao correta, o nvel
de confiana se refere taxa de sucesso do processo em uso para se estimar o parmetro
populacional e no a chance de que o verdadeiro valor do parmetro esteja entre os limites
do intervalo de confiana. Por exemplo, um nvel de confiana de 95% nos diz que o processo
em uso resultar, a longo prazo, em limites de intervalo de confiana que contenham o verdadeiro valor do parmetro populacional 95% das vezes.

LEITURA
Sugerimos que voc oua os udios que esto no seguinte endereo: < http:/ / m3.ime.unicamp.br/ recursos/ 1288> . Nestes udios voc aprender o significado da expresso margem de erro no contexto da Matemtica.

REFERNCIASBIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo estatstica. Rio de Janeiro,: LTC, 2003.

capt ul o 4

117

LARSON, R; FARBER, Betsy. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.
SMAILES, Joanne; McGRANE, Angela. Estatstica aplicada administrao com Excel. So Paulo: Atlas, 2002.
SPIEGEL, Murray R.. Estatstica. So Paulo: Makron Books, 1993.
TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 2008.

NOPRXIMOCAPTULO
Neste captulo estudamos a tcnica de Estimao, uma das mais importantes da inferncia
estatstica. Usando dados amostrais, aprendemos a obter estimativas pontuais e intervalares
para parmetros populacionais importantes: mdia e proporo. Para a construo de intervalos de confianas vimos que precisamos encontrar valores crticos da distribuio normal
padro ou da distribuio t-student.
No prximo captulo estudaremos outra tcnica da inferncia estatstica: teste de hiptese.
E, nos aprofundaremos no estudo da distribuio normal.

118 capt ul o 4

Distribuio Normal
e Teste de Hiptese

5 Distribuio Normal e Teste de Hiptese


Neste captulo estudarem os a distribuio de probabilidade m ais im portan te
em Estatstica: a distribuio normal. As distribuies n orm ais podem ser usadas para m odelar m uitos con jun tos de m edidas n a n atureza, n a in dstria e n o
com rcio. Por exem plo, a altura de um a determ in ada populao ou a durao
de aparelh os de televiso segue, em geral, um a distribuio n orm al.
Ao fin alizarm os o conceito da distribuilao n orm al apren derem os outra tcn ica da in fern cia estatstica, alm da estim ao, m uito utilizada: teste de h iptese. Verem os as caractersticas dos testes param tricos e n o param tricos, bem
com o os procedim en tos n ecessrios para a con struo de um teste de h iptese.

OBJETIVOS
Identificar situaes nas quais podemos aplicar o modelo de probabilidade normal, bem
como calcular probabilidades associadas a tal modelo.
Compreender quais so as etapas necessrias para a realizao de um teste de hiptese.

REFLEXO
Voc se lembra de ter ouvido de alguma companhia de transporte que, em mdia, o
intervalo entre sucessivos nibus de 20 minutos? Aprenderemos neste captulo como
podemos testar a afimartiva da companhia utilizando o conceito de teste de hiptese.
Antes de iniciarmos o estudo da distribuio normal, importante a compreenso do
conceito de varivel aleatria.

5.1 Varivel Aleatria


Um a varivel aleatria (v.a.) um a varivel que associa um valor n um rico a
cada pon to do espao am ostral. Ela den om in ada discreta quan do pode assum ir apenas um n m ero fin ito ou in fin ito en um ervel de valores e dita con tnua quan do assum e valores n um in tervalo da reta real.
com um utilizarm os letras latin as para representarm os variveis aleatrias.

120 capt ul o 5

Quan do trabalham os com um a v.a. que pode assum ir valores n um in tervalo


de n m eros reais, com o m ensurao de peso, altura e tem peratura, estam os
lidan do com um a distribuio con tn ua de probabilidade. Em distribuies
deste tipo podem os con struir um a curva con tn ua que a represen tao grfica
da fun o den sidade de probabilidade, usualm en te design ada por f(x).

5.2 Funo Densidade de Probabilidade

Um a fun o f(x) um a funo den sidade de probabilidade (f.d.p.) para um a


v.a. con tn ua X se satisfaz as con dies:

0 para todo x (- , );

f(x)

a rea defin ida por f(x) igual a 1;

P(X = x0) = 0, ou seja, a probabilidade da v.a. assum ir um valor pon tual zero.
O valor esperado e a varincia de um a v.a. con tn ua so defin idos, respectivam ente, por:

E (X )= x f (x)dx
-

e
2

Var (X )= E (X 2 )-
E (X )

onde E (X )= x f (x )dx . Essa expresso um a in tegral que um con -

ceito m atem tico cuja com preen so n o n ada elem en tar. Mas n o se preocupe, pois n o terem os que saber com o calcul-la.

5.3 Modelo Probabilstico para Variveis Aleatrias Contnuas


Estudarem os aqui a distribuio de probabilidade m ais im portante: A Distribuio Norm al. Esta distribuio desem penha papel fun dam en tal na Infern cia
Estatstica. A curva da fun o densidade de probabilidade desta distribuio
con hecida por m uitos com o a curva em form a de sino.

capt ul o 5

121

5.3.1 Distribuio Normal


A Distribuio Norm al tem fun o den sidade de probabilidade dada por

f (x)=

2
1
2
exp-(x - m ) / 2s ,
s 2p

- < x <

em que e 2 so os parm etros da distribuio.


A Figura 11 ilustra um a curva n orm al tpica:

Figura 11 f.d.p. de uma v.a. Normal com mdia e desvio-padro .

Representarem os v.a. s com distribuio n orm al por X ~ N (, 2).


As prin cipais caractersticas da distribuio n orm al so:
o pon to de m xim o de f(x) o pon to x = ;

os pon tos de inflexo so: x = + e x = ;


a curva sim trica com relao a ;
f(x) 0 quan do x .

Para se obter o clculo de probabilidades de um a v.a. X ~ N (, 2) devem os


resolver a in tegral da fun o den sidade de probabilidade n o in tervalo de in teresse, isto ,
b

P (a X b)= f (x)dx
a

122 capt ul o 5

onde a in tegral in dica a rea sob a curva da den sidade en tre os pon tos a e b.

a b

Figura 12 rea sob a curva normal, no intervalo de a a b

Esta integral s pode ser resolvida, aproxim adam en te, por m eio de in tegrao n um rica. Para contorn ar esta dificuldade, as probabilidades para a distribuio n orm al so calculadas com o auxlio de tabelas. Para isto, utilizam os
um a tran sform ao da v.a. X em um a v.a. Z defin ida por:

Z=

X -m
s

onde = m dia e = desvio padro.


Esta nova varivel den om in ada de varivel n orm al padron izada com m dia 0 e varin cia 1, ou seja, Z ~N (0, 1)

Figura 13 f.d.p. de uma v.a. Z ~ N(0,1)

capt ul o 5

123

A tabela forn ecida n o fin al do livro, utilizada n os clculos das probabilidades, nos d a P(0 Z zc) = P, isto ,

Figura 14 rea correspondente P(0 Z zc) fornecida pela tabela

ATENO
A caracterstica de simetria da distribuio normal implica que a probabilidade de estar acima
(ou abaixo) de zero 0,5, ou seja, P(Z 0) = 0,5 = P( Z 0).

Exem plo 5.1: As vendas m ensais de determ inado produto tm distribuio


aproxim adamente norm al, com m dia 500 unidades e desvio-padro 50 unidades.
Determ ine as probabilidades de que, em um m s, as vendas do produto sejam:
a) n o m xim o 530 un idades;
b) n o m nim o 460 un idades;
c) en tre 450 e 550 un idades;
d) n o m nim o 530 un idades.

ATENO
O enunciado desse exemplo forneceu o valor do desvio-padro que, por definio, a raiz
quadrada da varincia. Portanto, 2 = 50 2 = 2.500 unidades.

124 capt ul o 5

Resoluo:
Vam os defin ir a v.a. com o sen do X: venda s mensais de determinado produto.
Portan to, X ~ N(500,2500).
a) P(X 530)
Para calcularm os esta probabilidade, vam os tran sform ar a v.a. X n a v.a. Z
para poderm os usar a tabela.

Z=

X - m 530 - 500 30
=
= = 0, 6
s
50
50

0,6

Portanto,
P(X 530) = P(Z 0,6) =0,5 + P(0 Z 0,6) = 0,5 + 0,2257= 0,7257
O valor 0,5 vem do fato que P(Z 0) = 0,5.
b) P(X 460)
Usando a tran sform ao:

Z=

X - m 460 - 500
=
= 40 / 50 =- 0, 8
s
50

capt ul o 5

125

-0,8

Portan to,
P(X 460) = P(Z 0,8) = P(0,8 Z 0) + 0,5 = 0,2881 + 0,5 = 0,7881
Observao.: Devido sim etria da distribuio norm al tem os que
P(0,8 Z 0) = P(0 Z 0,8) e, com o no item anterior, o valor 0,5 vem do fato
que P(Z 0) =0,5.
c) P(450 X 550)
Transform ando:

X - m 450- 500 50
=
= =-1
s
50
50
X - m 550- 500 50
Z2 =
=
= =1
s
50
50
Z1 =

+1

P(450 X 550) = P(1 Z 1) = P(1 Z 0) + P(0 Z 1) =


0,3413 + 0,3413 = 0,3826
Observao: Devido sim etria P(1 Z 0) + P(0 Z 1).

126 capt ul o 5

d) P(X 530)

Para calcularm os esta probabilidade, vam os tran sform ar a


v.a. X n a v.a. Z para poderm os usar a tabela.
Z=

X - m 530 - 500 30
=
= = 0, 6
s
50
50

Portanto,
P(X 530) = P(Z 0,6) =0,5 P(0 Z 0,6) = 0,5 0,2257= 0,2743
O valor 0,5 vem do fato que P(Z 0) =0,5
Exem plo 5.2: O tem po de vida m dio de certo aparelho de dez an os, com
desvio-padro de 1,5 ano. O fabrican te substitui os aparelh os que acusam defeito den tro do prazo de garan tia. Qual deve ser o prazo de garan tia para que a
porcen tagem de aparelh os substitudos seja n o m xim o 5%?
Resoluo
X: tem po de vida do aparelh o
X ~N (10, 2,25)
Neste exerccio querem os en con trar Xc: prazo de ga rantia para que no mximo 5% dos aparelhos produzidos sejam substitudos dentro desse prazo. Observe
que o exerccio j forn eceu a probabilidade e querem os en con trar qual o valor
correspon den te a esta probabilidade, isto ,
P(X Xc) =0,05
Transform an do n a v.a. Z tem os P(Z Zc) =0,5 e procuran do n o corpo da tabela 0,45 (0,5-0,05) en con tram os Zc = 1,645.

capt ul o 5

127

0,05
z = 1,645

Portan to:

Xc - m
s
X -m
-1, 645 = c
1, 5
X c - 10 =- 2, 4675
Zc =

X c =- 2, 4675 + 10
X c = 7, 5325
En to, o prazo de garantia deve ser de 7,5 an os.

5.4 Teste de Hiptese


A in fern cia estatstica utiliza os dados am ostrais prin cipalm en te para: estim ar um parm etro populacion al (com o vim os n o Captulo 4) e para testar um a
hiptese ou um a afirm ativa sobre um parm etro populacion al (que verem os
neste captulo).
Um teste de hiptese usa estatsticas am ostrais para testar um a afirm ativa
sobre um a propriedade da populao. Por exem plo, pesquisadores da rea m dica e da poltica utilizam testes de h ipteses para a tom ada de decises sobre
novos m edicam en tos ou resultados de um a eleio.
Os testes de h iptese podem ser param tricos ou n o param tricos.
Testes param tricos tm requisitos sobre a n atureza ou a form a das populaes en volvidas. So baseados em parm etros da distribuio.

128 capt ul o 5

Testes n o param tricos n o exigem que as am ostras sejam proven ien tes
de populaes norm ais ou qualquer outra distribuio especfica. Com isso,
em geral, so cham ados testes livres de distribuio.
5.4.1 Passos para a construo de um teste de hiptese
1.

Dada um a afirm ativa, iden tificar a h iptese n ula e a h iptese altern ativa
e expressar am bas em form a sim blica;

2.

Atravs de um a afirm ativa e dos dados am ostrais, calcular o valor da estatstica de teste.

3.

Fixar e iden tificar o(s) valor(es) crtico(s).

4.

Con cluir o teste com base n a estatstica de teste e n a regio crtica.

5.4.2 Hiptese nula e hiptese alternativa

A hiptese n ula (represen tada por H 0) um a afirm ativa de que o valor de


um parm etro populacion al igual a algum valor especificado.

A hiptese alternativa (representada por H 1 ou H a) a afirm ativa de que o


parm etro tem um valor que, de algum a form a, difere da hiptese nula. Representam os a hiptese alternativa usan do um destes sm bolos: <, > ou .

Por exem plo, se um a afirm ativa para a m dia populacion al


que ela assum e o valor k, algun s pares possveis de h iptese n ula
e altern ativa so:
H 0 : m = k

H1 : m > k

H 0 : m = k

H1 : m < k

H 0 : m = k

H1 : m k

Segun do (TRIOLA, 2008, p. 309), se voc est fazen do um estudo e deseja


usar um teste de hiptese para apoiar sua afirm ativa, esta deve ser escrita de
m odo a se tornar a h iptese altern ativa. (e deve ser expressa usan do apen as os
sm bolos <, > ou . Voc n o pode usar um teste de h iptese para apoiar um a
afirm ativa de que um parm etro seja igual a algum valor especfico.

capt ul o 5

129

ATENO
Alguns livros texto usam os smbolos ou na hiptese nula H0, mas seguiremos a notao
da maioria dos peridicos profissionais que usam apenas o smbolo de igualdade.

Exem plo 5.3: Identifique as hipteses n ulas e altern ativa e iden tifique qual
represen ta a afirm ao em cada um dos iten s abaixo.
a) Um a universidade alega que a proporo de seus alun os que so do sexo
m asculino de 46%. O departam en to de ma rketing da un iversidade deseja testar esta afirm ao.
b) Os am ortecedores de autom veis que circulam em cidades duram , em
m dia, 35.000 quilm etros, segun do inform ao de algum as oficinas especializadas. Um proprietrio de autom vel deseja testar essa afirm ao.
c) Um veterin rio con seguiu gan ho m dio dirio de 2,5 litros de leite por
vaca com um a n ova com posio de rao. Um pecuarista acredita que o
gan h o n o to gran de assim .
Resoluo:
a ) H0 : p = 0,46 afirm ao
H1 : p 0,46
b) H 0 : = 35.000 afirm ao
H1 : 35.000
c) H 0 : = 2,5 afirm ao
H1 : < 2,5
5.4.3 Estatstica de teste paramtrico para a mdia
Segun do (TRIOLA, 2008, p. 310)
A estatstica de teste um valor usado para se tomar a deciso sobre a hiptese nula
e encontrada pela converso da estatstica amostral (como a proporo amostral p
ou a mdia amostral x ou o desvio padro s) em um escore (como z, t ou 2) com a
suposio de que a hiptese nula seja verdadeira.

130 capt ul o 5

Estudarem os, n este captulo, a seguin te estatstica de teste para a m dia:

Z=

x -m
s
n

ou

t=

x -m
s
n

Podem os observar que esta estatstica de teste pode se basear n a distribuio n orm al ou na distribuio t de Student, depen den do das con dies que sejam satisfeitas. Utilizarem os, aqui, os m esm os requisitos descritos n o item 4.7
(ver quadro 4.1).
5.4.4 Regio crtica, nvel de significncia e valor crtico
A regio crtica com posta por todos os valores da estatstica de teste que n os
fazem rejeitar a hiptese nula.
O nvel de sign ificn cia () a probabilidade da estatstica de teste cair n a
regio crtica quando a h iptese n ula for realm en te verdadeira. Portan to,
a probabilidade de com eterm os o erro de rejeitar a hiptese n ula quan do ela
verdadeira. Esse erro con h ecido com o Erro do tipo I. Este n vel de sign ificncia o m esm o que aquele foi defin ido para a con struo do in tervalo de
con fian a n o Captulo 4, cujas escolh as com un s para so 0,05; 0,01 e 0,10.
5.4.5 Teste bilateral, unilateral esquerda e unilateral direita
Um teste de h iptese pode ser bilateral, un ilateral esquerda ou un ilateral
direita. O tipo de teste depen de da regio da distribuio am ostral que favorece
um a rejeio de H 0
Tem os que:
Se a hiptese altern ativa H 1 con tiver o sm bolo <, o teste de h iptese ser

um teste un ilateral esquerda, ou seja, a regio crtica est n a cauda esquerda sob a curva;
Se a hiptese altern ativa H 1 con tiver o sm bolo >, o teste de h iptese ser
um teste un ilateral direita, ou seja, a regio crtica est n a cauda direita
sob a curva;
Se a hiptese altern ativa H 1 contiver o sm bolo , o teste de hiptese ser
um teste bilateral, ou seja, a regio crtica est n as duas caudas sob a curva;

capt ul o 5

131

Nos testes bilaterais, o n vel de sign ificn cia dividido igualm en te en tre
as duas caudas que con stituem a regio crtica. Em testes un ilaterais esquerda ou direita, a rea da regio crtica n a cauda respectiva .
5.4.6 Concluso do teste de hiptese
O objetivo de um teste de h iptese testar a h iptese n ula, de m odo que n ossa
con cluso ser um a das seguin tes:
1.

Rejeitar a hiptese n ula.

2.

Deixar de rejeitar a hiptese n ula.

CONEXO
O uso do mtodo do valor P est sendo utilizado com bastante frequncia, pois tal valor aparece
nos resultados de pacotes estatsticos. Para a compreenso de tal mtodo, leia o Procedimento para a Determinao de Valores P, que se encontra em (TRIOLA, 2008, p. 314).

A deciso de rejeitar ou deixar de rejeitar um a h iptese n ula pode ser feita


utilizan do o m todo tradicion al (m todo clssico), o m todo do valor P, ou basean do-se em in tervalos de confian a.
Utilizarem os o m todo clssico para con cluir um teste de hiptese.
Quan do con clum os um teste de h iptese e a estatstica de teste n o cair
na regio crtica, vam os usar a term in ologia deixar de rejeitar a hiptese n ula.
Algun s textos escrevem a ceitar a hiptese nula. Mas, no esta mos provando a hiptese nula. Apen as estam os n os basean do em evidn cias am ostrais que n o
garan tiram a rejeio da hiptese n ula e, por isso, o term o deixa r de rejeitar parece o m ais correto.
Exem plo 5.4: Um a gran de revista de n egcios brasileira afirm ou que o faturam en to m dio das in dstrias de um a determ in ada regio do sul do pas seria
igual a R$ 820.000,00. Sabe-se que o desvio padro do faturam en to de todas as
em presas da regio igual a R$ 120.000,00? Um pesquisador in depen den te
an alisou os dados de um a am ostra form ada por 35 em presas, en con tran do um
faturam ento m dio igual a R$ 780.000,00. Assum in do n vel de sign ificn cia
igual a 8%, seria possvel con cordar com a alegao?

132 capt ul o 5

Resoluo:
1.

Identificar a hiptese n ula e altern ativa:


H0 : = 820.000
H1 : 820.000

2.

Atravs de um a afirm ativa e dos dados am ostrais, calcular o valor da estatstica de teste.

Com o o desvio padro con h ecido e n > 30, utilizarem os a seguin te estatstica de teste:

x -m
s
n
780.000 - 820.000
40.00
Z=
=
=-1, 97
120.000
20283, 702
35
Z=

3.

Fixar e iden tificar o(s) valor(es) crtico(s).

Do en un ciado, tem os = 0,08. Com o o teste bilateral, o n vel de sign ificn cia = 0,08 dividido igualm en te en tre as dus caudas que con stituem a regio
crtica. Portan to:
Z/2 = 1,755
4.

Z/2 = 1,755

Con cluir o teste com base n a estatstica de teste e n a regio crtica.

Tem os que a estatstica de teste caiu n a regio de rejeio, do lado esquerdo


da cauda, pois 1,97 < 1,755. Portan to, rejeitam os a h iptese n ula.
H evidn cia suficien te para garan tir a rejeio da afirm ativa de que o faturam en to m dio das indstrias de um a determ in ada regio do sul do pas de
R$ 820.000,00.

capt ul o 5

133

Exem plo 5.5: Um a gran de con strutora n acion al afirm a que seus fun cion rios recebem um salrio m dio igual a, n o m n im o, R$ 1.450,00, com desvio
padro igual a R$ 700,00 e a distribuio supostam en te n orm al. Um a am ostra
com 500 funcion rios apresen tou um a m dia de R$ 1 000,00. A alegao da
em presa poderia ser aceita? Justifique. Con sidere = 2%.
Resoluo:
1.

Iden tificar a hiptese n ula e altern ativa:


H0 : = 1.450
H1 : < 1.450

2.

Atravs de um a afirm ativa e dos dados am ostrais, calcular o valor da estatstica de teste.

Com o a distribuio supostam en te n orm al e o desvio padro con hecido,


utilizarem os a seguin te estatstica de teste:

x -m
s
n
1.000 -1.450
450
Z=
=
=-14, 37
700
31, 204952
500
Z=

3.

Fixar e iden tificar o(s) valor(es) crtico(s).

Do en un ciado, tem os = 0,02. Com o o teste un ilateral esquerda, a rea


da regio crtica na cauda respectiva :

Z = 2,055

134 capt ul o 5

4.

Con cluir o teste com base n a estatstica de teste e n a regio crtica.

Temos que a estatstica de teste caiu na regio de rejeio, pois 14,37 < 2,055.
Portanto, rejeitam os a hiptese n ula.
H evidn cia suficien te para garan tir a rejeio da afirm ativa de que salrio
m dio dos funcion rios da con strutora seja de, n o m n im o, R$ 1.450,00.
5.4.7 Testes no paramtricos
Com o vim os no item 5.4, os testes param tricos tm requisitos sobre a n atureza ou a form a das populaes en volvidas. So baseados em parm etros da
distribuio. Quando n o for possvel supor ou assum ir caractersticas sobre
parm etros da populao de on de os dados foram extrados, torn a-se n ecessrio aplicar testes n o param tricos de h iptese.
Listarem os os prin cipais testes n a param tricos e em que situao devem
ser utilizados.
De acordo com (BRUNI, 2010, p. 256), den tre os prin cipais m odelos de testes n o parm tricos, podem ser destacados os relacion ados a seguir:
a) Teste do qui-quadrado: em pregado n a an lise de frequn cias, quan do
um a caracterstica da am ostra an alisada;
b) Teste do qui-quadrado para in depen dn cia ou associao: tam bm em pregado n a an lise de frequn cias, porm quan do duas caractersticas
da am ostra so an alisadas;
c) Teste dos sinais: em pregado n o estudo de dados em parelh ados, quan do
um m esm o elem ento subm etido a duas m edidas;
d) Teste de Wilcoxon: tam bm an alisa dados em parelh ados, perm itin do,
porm , um a con siderao das m agn itudes en con tradas;
e) Teste de Man n -Whitn ey: an alisa se dois grupos origin am -se de populaes com m dias diferen tes;
f) Teste da m ediana: analisa se dois grupos origin am -se de populaes
com m edian as diferen tes;
g) Teste de Kruskal-Wallis: an alisa se m ais de dois grupos origin am -se de
populaes com m dias diferen tes.
Os testes n o param tricos n o so to eficien tes quan to os testes param tricos. En to, precisam os, em geral, de evidn cia m ais forte (am ostra m aior ou
diferen as m aiores) para rejeitar a h iptese n ula.
capt ul o 5

135

ATIVIDADE
1. A durabilidade de um tipo de pneu de determinada marca descrita por uma v.a.Normal
de mdia 70.000 km e desvio-padro de 9.000 km.
a) Se o fabricante desta marca garante os pneus pelos primeiros 50.000 km,qual a proporo de pneus que devero ser trocados pela garantia?
b) Qual deve ser a garantia (em km) para assegurar que o fabricante troque sob garantia
no mximo 2% dos pneus?
2. As vendas de determinado produto tm distribuio aproximadamente normal, com mdia 700 unidades e desvio-padro 80 unidades. Se a empresa decide fabricar 800
unidades no ms em estudo, qual a probabilidade de que no possa atender a todos
os pedidos desse ms, por estar com a produo esgotada?
3. As velocidades dos carros numa rodovia tm distribuio normal, com mdia de 90km/ h.
Determinar:
a) o desvio-padro das velocidades, se 5% dos carros ultrapassar 100 km/ h;
b) a porcentagem dos carros que trafegam a menos de 80 km/ h.
4. Uma fbrica de embalagens de papelo afirma que suas caixas modelo padro tm uma
resistncia mdia no inferior a 14 kg. Uma amostra de cinco caixas revelou uma resistncia mdia igual a 12,6 kg. Assumindo um nvel de significncia igual a 2%, possvel
confiar na palavra da fbrica? Sabe-se que o desvio padro populacional das resistncias das caixas igual a 2 kg e que esta varivel encontra-se normalmente distribuda.
5. 05. A campanha WZA fabrica um determinado analgsico que alega ter durao no
inferior a quatro horas. Uma anlise de 30 medicamentos escolhidos aleatoriamente
acusou uma mdia de 3,8 horas de durao. Teste a alegao da campanhia, contra a
alternativa de que a durao seja inferior a quatro horas ao nvel de 0,05, se o desvio
populacional for de 0,5 hora.

136 capt ul o 5

REFLEXO
Agora, acreditamos que voc poder interpretar de maneira mais profunda muitas das informaes que recebe. O conhecimento dos conceitos abordados neste livro de fundamental
importncia nas anlises que qualquer profissional necessita fazer em seu cotidiano.
Comprovadamente, o uso da Estatstica em qualquer rea leva a tomada de decises com
maiores chances de acerto. Agora, aplicar ou no o que voc aprendeu, depende exclusivamente de voc. Boa sorte e muito sucesso!

LEITURA
Sugerimos que voc assista ao vdeo que est no seguinte endereo: < http:/ / m3.ime.unicamp.
br/ recursos/ 1098> . Voc aprender algumas tcnicas de planejamento de experimento, bem
como verificar a importncia da formulao correta de uma hiptese na anlise estatstica.

REFERNCIASBIBLIOGRFICAS
ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada
administrao e economia. So Paulo: Pioneira Thomson Learning, 2003.
BRUNI, Adriano L. Estatstica Aplicada Gesto Empresarial. 2.ed. So Paulo: Atlas, 2010.
BUSSAB, Wilton de O.; MORETTIN, Pedro A.. Estatstica bsica. So Paulo: Saraiva, 2003.
FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo
estatstica. Rio de Janeiro,: LTC, 2003.
LARSON, R; FARBER, Betsy. Estatstica aplicada. So Paulo: Pearson Prentice Hall, 2004.
MAGALHES, Marcos Nascimento; LIMA, Antnio Carlos Pedroso de. Noes de probabilidade e estatstica. So Paulo: Editora da Universidade de So Paulo, 2004.
TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC,.

capt ul o 5

137

EXERCCIORESOLVIDO
Captulo 1
1. Resposta
a) qualitativa nominal
b) quantitativa discreta
c) quantitativa contnua
d) quantitativa discreta
e) quantitativa contnua
f) quantitativa contnua
g) quantitativa discreta
h) qualitativa nominal
i)

quantitativa contnua

j)

quantitativa contnua

k) qualitativa ordinal
l)

qualitativa ordinal

m) qualitativa nominal
n) qualitativa nominal

2. Resposta
a) Como estamos interessados nas respostas dos consumidores de refrigerantes sabor cola
no teste de sabor, um consumidor desse tipo de refrigerante uma unidade experimental.
Assim, a populao de interesse a coleo ou conjunto de todos esses consumidores.
b) A caracterstica que a Pepsi deseja medir a preferncia do consumidor de refrigerante sabor cola revelada sob a aplicabilidade de um teste cego, logo, a preferncia
pelo tipo de refrigerante a varivel de interesse.
c) A amostra de 1.000 consumidores de refrigerante sabor cola selecionados da populao de todos os consumidores desse tipo de refrigerante.
d) A inferncia de interesse a generalizao da preferncia de refrigerantes sabor
cola dos 1.000 consumidores da amostra para a populao de todos os consumidores desse tipo de refrigerante. Em particular, as preferncias dos consumidores
da amostra podem ser usadas para estimar o percentual de todos os consumidores
que preferem cada marca.

138 capt ul o 5

3. Qualitativos.
Qualitativos, pois as categorias foram simplesmente codificadas. Mas, isto no torna a varivel quantitativa. No h sentido, por exemplo, calcular a mdia para estes dados codificados.

4. Resposta
a) Todos os cidados brasileiros.
b) Avaliao do trabalho do presidente (bom ou mau); qualitativa.
c) 2.500 indivduos sorteados.
d) Estimar a proporo de todos os cidados que acreditam que o presidente est fazendo um bom trabalho.
e) Pesquisa.
f) A amostra em estudo no representativa, pois foram entrevistadas somente pessoas que possuem telefone.

5. Aproximadamente 48.

6. Resposta
a) Sim, ser representativa.
b) Foram utilizados pelo menos 3 tipos de tcnicas de amostragem: Amostragem Estratificada no primeiro momento, Amostragem casual simples no segundo momento e
Amostragem por meio de conglomerados para finalizar.

7. Resposta
a)

x p = 161.33; x g= 1279, 85

b) x ponderada = 524, 85

capt ul o 5

139

8. Resposta
a)

N DE
FUNCIONRIOS

N DE
PROPRIEDADES

0 20

AMOSTRAESTRATIFICADA
(N= 50)
UNIFORME

PROPORCIONAL

500

10

25

20 50

320

10

15

50 100

100

10

100 200

50

10

200 400

30

10

Total

1.000

50

50

b)

x u = 114; x p= 42, 5 A mdia obtida atravs da amostragem estratificada uniforme


no mostra a realidade das empresas com relao ao nmero de funcionrios, j que
a grande maioria tem no mximo 50 funcionrios (como mostra a mdia obtida atravs da amostragem estratificada proporcional).

Captulo 2

Antes das respostas gostaramos de deixar claro que as interpretaes das questes ficam a cargo do estudante. Se ocorrer dvidas, entrar em contato com o tutor.
1. k 6 classes e amplitude da classe h 7

IDADES

fr

fa

19 26

0,1667

26 33

13

0,4333

18

33 40

0,1333

22

40 47

0,1333

26

47 54

0,1000

29

54 61

0,0333

30

Total

30

Tabela 1: Distribuio de frequncias das idades dos funcionrios.

140 capt ul o 5

a) 18
b) 13,33%
c) 17
d) 73,33%
e) 26,67%

2. Resposta
a) Valores gastos com supermercado. Varivel quantitativa contnua.
b)

CLASSES(GASTOSEMR$)

fr

fa

4,89 61,89

17

0,34

17

61,89 118,89

13

0,26

30

118,89 175,89

0,10

35

175,89 232,89

0,10

40

232,89 289,89

0,06

43

289,89 346,89

0,06

46

346,89 403,89

0,04

48

403,89 460,89

0,04

50

Total

30

Tabela 1: Distribuio de frequncias para a varivel Valores gastos com supermercado.

capt ul o 5

141

3. Resposta
a) x = 23,1, Md= 22, 5, Mo = 22
b)

c)

CLASSES

fr

fa

Pm

10 14

0,0469

12

14 18

0,0781

16

18 22

12

0,1875

20

20

22 26

25

0,3906

45

24

26 30

12

0,1875

57

28

30 34

0,0469

60

32

34 38

0,0313

62

36

38 42

0,0313

64

40

Total

64

1,0000

x = 24, 06, Md= 23, 92, Mo = 24

4. Resposta
a) Vendas mensais. Varivel quantitativa contnua.
b)

x @ 3, 2, Md = 3, 4, Mo = 3, 5

c) 16,36%
d) 21,82%
e) 56,36%
f) 65,45%

5.

x @ 1, 7, Md = 2, Mo = 2

6. 4,3

142 capt ul o 5

Captulo 3
1. Resposta

Outros
16,82%
Solteiro
42,87%
Separado
19,79%

Casado
14,84%

Vivo
5,69%

Atravs do grfico, podemos dizer que aproximadamente 43% dos clientes desta agncia
de turismo so solteiros, 20% so separados, 17% tm outro tipo de estado civil, 15% so
casados e apenas 5% so vivos. Esta informao importante na hora de lanar pacotes
de viagens. A agncia deve se lembrar que grande parte de seus clientes so solteiros. Tambm pode criar estratgias para trazer mais clientes casados ou vivos, que provavelmente
devem ter outro tipo de perfil.

2. Resposta
a)

IDADES

fr

fa

4,89 61,89

17

0,34

17

61,89 118,89

13

0,26

30

118,89 175,89

0,10

35

175,89 232,89

0,10

40

232,89 289,89

0,06

43

289,89 346,89

0,06

46

346,89 403,89

0,04

48

403,89 460,89

0,04

50

Total

50

capt ul o 5

143

b)

346,89403,89

403,89460,89

289,89346,89

232,89289,89

175,89232,89

118,89175,89

61,89118,89

18
16
14
12
10
8
6
4
2
0

4,8961,89

Frequncia

Histograma

Gastos (R$)

Polgono de Frequncias
18

17

16
14

13

Frequncia

12
10
8
6

2
0

0
0

33,39

0
90,38 147,39 204,39 261,39 318,39 375,39 432,39 489,39
Ponto mdio das classes Gastos (R$)

3. Resposta
a) Salrio de funcionrios de uma empresa. Esta varivel classificada como quantitativa contnua.
b) 45 funcionrios
c) 86 funcionrios
d) 9,30%
e) 72,09%
f) Tabela 1: Distribuio de frequncias dos salrios dos funcionrios de uma empresa.

144 capt ul o 5

IDADES

fr

fa

500,00 800,00

17

19,77

17

800,00 1100,00

45

52,33

62

1100,00 1400,00

12

13,95

74

1400,00 1700,00

4,65

78

1700,00 2100,00

3,49

81

2100,00 2400,00

3,49

84

2400,00 2700,00

2,33

86

Total

86

100

4. Resposta
a)

R = 31, s @ 6,1, s2 @ 37, 2, cv @ 0, 2633 ou 26, 33%

b)

c)
d)

CLASSES

fr

fa

Pm

10 14

0,0469

12

14 18

0,0781

16

18 22

12

0,1875

20

20

22 26

25

0,3906

45

24

26 30

12

0,1875

57

28

30 34

0,0469

60

32

34 38

0,0313

62

36

38 42

0,0313

64

40

Total

64

1,0000

R = 32, s @ 5, 8, s2 @ 33, 6, cv @ 0, 2358 ou 23, 58%


Q1 @ 20, 7, D7 @ 26, P99 = 40, 7

e)

capt ul o 5

145

30

Frequncia

25
20
15
10

3842

3438

3034

2630

2226

1822

1418

1014

Nmero de horas

5.

R = 7, s @ 2, 88, s2 @ 8, 29, cv @ 0, 45 ou 45%

6.

R = 5, s @ 1, 29, s2 @ 8, 29, cv @ 0, 7588 ou 75, 88%

7.

R = 30, s @ 6, 9, s2 @ 47, 6, cv @ 0, 2233 ou 22, 33%

8. Resposta
a) Caixa A (menor variao absoluta (s))
b) Caixa A (maior variao relativa (cv))

Captulo 4
1.

[14,04902 ; 15,95098] Margem de erro: 0,95098

2. a) EP( p ) =

3. a) EP(X) =

p(1- p)
= 0, 02487
n

S
= 0, 3863
n

146 capt ul o 5

EP(X) =

b) [0,40125 ; 0,49875]

b) [4,3749 ; 6,0251]

S
= 0, 34
n

4. [0,52110 ; 0,57890]

5. a) p = 0.4

b) EP( p ) =

p(1- p)
= 0, 01549
n

Captulo 5
6. a) 0,0132

7.

b) 51.496 km

0,1056

8. a) = 6.08

9.

b) 5,05%

z = 2,055 e z = 1,5652 (estatstica de teste)


No h evidncia suficiente para garantir a rejeio da afirmativa de que as caixas modelo
padro da fbrica de embalagens tm resistncia mdia no inferior a 14 kg.

10.

z = 1.645 e z = 2.1909 (estatstica de teste)


H evidncia suficiente para garantir a rejeio da afirmativa de que a durao do efeito do
analgsico fabricado por esta companhia no seja inferior a 4 horas.

Curva Norm al (p = rea en tre 0 z)

SEGUNDACASADECIMAL
z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.1

0.0000

0.0040

0.0080

0.0120

0.0160

0.0199

0.0239

0.0279

0.0319

0.0359

0.2

0.0398

0.0438

0.0478

0.0517

0.0557

0.0596

0.0636

0.0675

0.0714

0.0753

0.3

0.0793

0.0832

0.0871

0.0910

0.0948

0.0987

0.1026

0.1064

0.1103

0.1141

0.4

0.1179

0.1217

0.1255

0.1293

0.1331

0.1368

0.1406

0.1443

0.1480

0.1517

0.5

0.1554

0.1591

0.1628

0.1664

0.1700

0.1736

0.1772

0.1808

0.1844

0.1879

capt ul o 5

147

0.6

0.1915

0.1950

0.1985

0.2019

0.2054

0.2088

0.2123

0.2157

0.2190

0.2224

0.7

0.2257

0.2291

0.2324

0.2357

0.2389

0.2422

0.2454

0.2486

0.2517

0.2549

0.8

0.2580

0.2611

0.2642

0.2673

0.2704

0.2734

2764

0.2794

0.2823

0.2852

0.9

0.2881

0.2910

0.2939

0.2967

0.2995

0.3023

0.3051

0.3078

0.3106

0.3133

1.0

0.3159

0.3186

0.3212

0.3238

0.3264

0.3289

0.3315

0.3340

0.3365

0.3389

1.1

0.3413

0.3438

0.3461

0.3485

0.3508

0.3531

0.3554

0.3577

0.3599

0.3621

1.2

0.3643

0.3665

0.3686

0.3708

0.3729

0.3749

0.3770

0.3790

0.3810

0.3830

1.3

0.3849

0.3869

0.3888

0.3907

0.3925

0.3944

0.3962

0.3980

0.3997

0.4015

1.4

0.4032

0.4049

0.4066

0.4082

0.4099

0.1415

0.4131

0.4147

0.4162

0.4177

1.5

0.4192

0.4207

0.4222

0.4236

0.4251

0.4265

0.4279

0.4292

0.4306

0.4319

1.6

0.4332

0.4345

0.4357

0.4370

0.4382

0.4394

0.4406

0.4418

0.4429

0.4441

1.7

0.4452

0.4463

0.4474

0.4484

0.4495

0.4505

0.4515

0.4525

0.4535

0.2545

1.8

0.4641

0.4649

0.4656

0.4664

0.4671

0.4678

0.4686

0.4693

0.4699

0.4706

1.9

0.4713

0.4719

0.4726

04732

0.4738

0.4744

0.4750

0.4756

0.4761

0.4767

2.0

0.4772

0.4778

0.4783

0.4788

0.4793

0.4798

0.4803

0.4808

0.4812

0.4817

2.1

0.4821

0.4826

0.4830

0.4834

0.4838

0.4842

0.4846

0.4850

0.4854

0.4857

2.2

0.4861

0.4864

0.4868

0.4871

0.4875

0.4878

0.4881

0.4884

0.4887

0.4890

2.3

0.4893

0.4896

0.4898

0.4901

0.4904

0.4906

0.4909

0.4911

0.4913

04916

2.4

0.4918

0.4920

0.4922

0.4925

0.4927

0.4929

0.4931

0.4932

0.4934

0.4936

2.5

0.4938

0.4940

0.4941

0.4943

0.4945

0.4946

0.4948

0.4949

0.4951

0.4952

2.6

0.4953

0.4955

0.4956

0.4957

0.4959

0.4960

0.4961

0.4962

0.4963

0.4964

2.7

0.4965

0.4966

0.4967

0.4968

0.4969

0.4970

0.4971

0.4972

0.4973

0.4974

2.8

0.4974

0.4975

0.4976

0.4977

0.4977

0.4978

0.4979

0.4979

0.4980

0.4981

2.9

0.4981

0.4982

0.4982

0.4983

0.4984

0.4984

0.4985

0.4985

0.4986

0.4986

3.0

0.4987

0.4987

0.4987

0.4988

0.4988

0.4989

0.4989

0.4989

0.4990

0.4990

Tabela Valores crticos da distribuio t de Student

P(|TDESTUDENT| VALORTABELADO) = VALORESBILATERAIS


G. L.

0.50

0.20

0.10

0.05

0.04

0.02

0.01

0.005

0.001

1.000

3.078

6.314

12.706

15.894

31.821

63.656

127.321

636.578

0.816

1.886

2.920

4.303

4.849

6.965

9.925

14.089

31.600

0.765

1.638

2.353

3.182

3.482

4.541

5.841

7.453

12.924

148 capt ul o 5

P(|TDESTUDENT| VALORTABELADO) = VALORESBILATERAIS


4

0.741

1.533

2.132

2.776

2.999

3.747

4.604

5.598

8.610

0.727

1.476

2.015

2.571

2.757

3.365

4.032

4.773

6.869

0.718

1.440

1.943

2.447

2.612

3.143

3.707

4.317

5.959

0.711

1.415

1.895

2.365

2.517

2.998

3.499

4.029

5.408

0.706

1.397

1.860

2.306

2.449

2.896

3.355

3.833

5.041

0.703

1.383

1.833

2.262

2.398

2.821

3.250

3.690

4.781

10

0.700

1.372

1.812

2.228

2.359

2.764

3.169

3.581

4.587

11

0.697

1.363

1.796

2.201

2.328

2.718

3.106

3.497

4.437

12

0.695

1.356

1.782

2.179

2.303

2.681

3.055

3.428

4.318

13

0.694

1.350

1.771

2.160

2.282

2.650

3.012

3.372

4.221

14

0.692

1.345

1.761

2.145

2.264

2.624

2.977

3.326

4.140

15

0.691

1.341

1.753

2.131

2.249

2.602

2.947

3.286

4.073

16

0.690

1.337

1.746

2.120

2.235

2.583

2.921

3.252

4.015

17

0.689

1.333

1.740

2.110

2.224

2.567

2.898

3.222

3.965

18

0.688

1.330

1.734

2.101

2.214

2.552

2.878

3.197

3.922

19

0.688

1.328

1.729

2.093

2.205

2.539

2.861

3.174

3.883

20

0.687

1.325

1.725

2.086

2.197

2.528

2.845

3.153

3.850

21

0.686

1.323

1.721

2.080

2.189

2.518

2.831

3.135

3.819

22

0.686

1.321

1.717

2.074

2.183

2.508

2.819

3.119

3.792

23

0.685

1.319

1.714

2.069

2.177

2.500

2.807

3.104

3.768

24

0.685

1.318

1.711

2.064

2.172

2.492

2.797

3.091

3.745

25

0.684

1.316

1.708

2.060

2.167

2.485

2.787

3.078

3.725

26

0.684

1.315

1.706

2.056

2.162

2.479

2.779

3.067

3.707

27

0.684

1.314

1.703

2.052

2.158

2.473

2.771

3.057

3.689

28

0.683

1.313

1.701

2.048

2.154

2.467

2.763

3.047

3.674

29

0.683

1.311

1.699

2.045

2.150

2.462

2.756

3.038

3.660

30

0.683

1.310

1.697

2.042

2.147

2.457

2.750

3.030

3.646

31

0.682

1.309

1.696

2.040

2.144

2.453

2.744

3.022

3.633

capt ul o 5

149

P(|TDESTUDENT| VALORTABELADO) = VALORESBILATERAIS


32

0.682

1.309

1.694

2.037

2.141

2.449

2.738

3.015

3.622

33

0.682

1.308

1.692

2.035

2.138

2.445

2.733

3.008

3.611

34

0.682

1.307

1.691

2.032

2.136

2.441

2.728

3.002

3.601

35

0.682

1.306

1.690

2.030

2.133

2.438

2.724

2.996

3.591

36

0.681

1.306

1.688

2.028

2.131

2.434

2.719

2.990

3.582

37

0.681

1.305

1.687

2.026

2.129

2.431

2.715

2.985

3.574

38

0.681

1.304

1.686

2.024

2.127

2.429

2.712

2.980

3.566

39

0.681

1.304

1.685

2.023

2.125

2.426

2.708

2.976

3.558

40

0.681

1.303

1.684

2.021

2.123

2.423

2.704

2.971

3.551

41

0.681

1.303

1.683

2.020

2.121

2.421

2.701

2.967

3.544

42

0.680

1.302

1.682

2.018

2.120

2.418

2.698

2.963

3.538

43

0.680

1.302

1.681

2.017

2.118

2.416

2.695

2.959

3.532

44

0.680

1.301

1.680

2.015

2.116

2.414

2.692

2.956

3.526

45

0.680

1.301

1.679

2.014

2.115

2.412

2.690

2.952

3.520

46

0.680

1.300

1.679

2.013

2.114

2.410

2.687

2.949

3.515

47

0.680

1.300

1.678

2.012

2.112

2.408

2.685

2.946

3.510

48

0.680

1.299

1.677

2.011

2.111

2.407

2.682

2.943

3.505

49

0.680

1.299

1.677

2.010

2.110

2.405

2.680

2.940

3.500

50

0.679

1.299

1.676

2.009

2.109

2.403

2.678

2.937

3.496

60

0.679

1.296

1.671

2.000

2.099

2.390

2.660

2.915

3.460

70

0.678

1.294

1.667

1.994

2.093

2.381

2.648

2.899

3.435

80

0.678

1.292

1.664

1.990

2.088

2.374

2.639

2.887

3.416

90

0.677

1.291

1.662

1.987

2.084

2.368

2.632

2.878

3.402

100

0.677

1.290

1.660

1.984

2.081

2.364

2.626

2.871

3.390

110

0.677

1.289

1.659

1.982

2.078

2.361

2.621

2.865

3.381

120

0.677

1.289

1.658

1.980

2.076

2.358

2.617

2.860

3.373

0.674

1.282

1.645

1.960

2.054

2.326

2.576

2.807

3.290

0,25

0,10

0,05

0,025

0,02

0,01

0,005

0,0025

0,0005

150 capt ul o 5