Вы находитесь на странице: 1из 190

Estatstica Aplicada

Simone Echeveste

Estatstica Aplicada
Introduo

O grande avano tecnolgico das ltimas dcadas gerou a necessida-


de de formao de profissionais capazes de acompanhar esse de-
senvolvimento com habilidades para gerar e analisar dados, produzindo
informao til a ser utilizada na resoluo de problema. Neste contexto,
as ferramentas estatsticas so imprescindveis, e o conhecimento das mes-
mas torna-se necessrio para qualquer profissional.

A Estatstica hoje se configura como uma das cincias que mais vem
crescendo em termos de utilizao e importncia na Administrao: pes-
quisas de marketing, comportamento do consumidor, estudos de qualida-
de, confiabilidade, desenvolvimentos de novos produtos, avaliao de sa-
tisfao dos clientes etc. Estes so alguns exemplos da ampla utilizao das
ferramentas estatsticas para resoluo de problemas e tomada de decises
nessa rea.

A disciplina de Estatstica Aplicada tem por objetivos: propiciar ao alu-


no o estudo da estatstica com vistas anlise de dados experimentais,
clculo e interpretao das medidas descritivas, utilizao de testes estats-
ticos como ferramenta de anlise de comparao e relao de dados no
contexto das pesquisas realizadas na rea de Administrao.

Os contedos sero apresentados em 10 captulos, contendo a ex-


plicao terica dos mesmos, bem como a apresentao de exemplos e
aplicaes em problemas na rea da Administrao. Em cada captulo ser
destacado o objetivo de cada ferramenta estatstica, bem como a interpre-
tao dos resultados obtidos.
Sumrio

Introduo.................................................................................... iii
1 Conceitos Bsicos de Estatstica..............................................1
2 Apresentao de Dados.......................................................13
2.1 Tabelas de Frequncia .....................................................014
2.2 Grficos Estatsticos..........................................................018
3 Medidas de Tendncia Central.............................................33
4 Medidas de Variabilidade.....................................................47
5 Distribuio de Probabilidade Normal..................................61
6 Amostragem........................................................................85
7 Estimao..........................................................................101
8 Testes de Hipteses............................................................117
9 Anlise de Correlao.......................................................149
10 Anlise de Regresso.........................................................169
Simone Echeveste

Captulo 1

Conceitos Bsicos
de Estatstica

N
este captulo, ser apresentado o contexto da pesqui-
sa em que a estatstica est inserida, bem como sero
destacados os principais conceitos bsicos de estatstica.
O objetivo aqui que o aluno compreenda o vocabulrio
pertinente anlise estatstica e que compreenda os ele-
mentos importantes no contexto dessa anlise.
Ao final deste captulo, espera-se que o aluno, dada
uma situao problema, identifique corretamente a popu-
lao e a amostra de estudo bem como as variveis en-
volvidas classificando-as de acordo com a sua natureza.
2Estatstica Aplicada

O papel da estatstica na cincia

A necessidade de analisar um conjunto de dados estatistica-


mente est sempre inserida no contexto de uma pesquisa, ou
seja, temos inicialmente uma situao problema a ser resol-
vida, ou ainda uma hiptese a ser testada e, para isso, uma
pesquisa deve ser realizada.

Com isso, em uma pesquisa, destaca-se a importncia da


utilizao da estatstica de acordo com os seguintes fatores:

a) Em uma pesquisa, muitas vezes so realizados estudos


experimentais ou observacionais que culminam em uma
coleo de dados numricos que devem ser organizados e
resumidos.
b) O padro de variao nos dados faz com que a resposta
no seja bvia, ou seja, somente tratando os dados ade-
quadamente que poderemos verificar o comportamento
das variveis de estudo.
c) Uma anlise estatstica composta por mtodos para co-
leta e descrio dos dados, viabilizando a verificao da
fora da evidncia nos dados pr ou contra as hipteses
de pesquisa. A presena de uma variao no previsvel
nos dados faz disso, muitas vezes, uma tarefa pouco trivial.

Em toda a pesquisa realizada, almeja-se a resposta a um


problema ou ainda uma situao-problema que est vinculada
a uma tomada de deciso a ser realizada. Podemos considerar
que nossa deciso pode ser tomada por meio de dois tipos de
solues: a primeira, que pode ser considerada uma soluo
emprica que se fundamenta na observao e na experincia,
Captulo 1 Conceitos Bsicos de Estatstica3

livre de um mtodo cientfico, uma forma de soluo muitas


vezes subjetiva que pode levar a tomada de deciso errada.

Figura 1 O papel da Estatstica na pesquisa.

O outro tipo de soluo seria por meio de mtodo cient-


fico, luz de dados provenientes de uma pesquisa que segue
uma metodologia predeterminada para garantir a imparcia-
lidade das informaes obtidas. Nesse caso, as ferramentas
estatsticas so indispensveis para a viabilizao de uma to-
mada de deciso com menores riscos e incertezas.

Definies importantes na estatstica

Sempre que falamos em Estatstica estamos inseridos no con-


texto de uma pesquisa. As pesquisas podem ser classificadas
4Estatstica Aplicada

em duas grandes abordagens conforme demonstra a figura


a seguir:

Figura 2 Tipos de Pesquisa.

Uma pesquisa quantitativa composta por quatro etapas


distintas. Dessas etapas, nas trs ltimas (planejamento, exe-
cuo e comunicao dos resultados), a estatstica surge como
uma importante ferramenta de suporte para o pesquisador (Fi-
gura 3).

Na etapa Planejamento da pesquisa, a estatstica tem im-


portante participao na determinao do tamanho da amos-
tra a ser estudada, na escolha do procedimento/processo de
amostragem que deve ser utilizado para a coleta de dados,
bem como na elaborao do instrumento de coleta e no esta-
belecimento do tipo de variveis a serem pesquisadas.
Captulo 1 Conceitos Bsicos de Estatstica5

Figura 3 Contribuio da Estatstica para a pesquisa.

No momento da Execuo da pesquisa, a estatstica im-


prescindvel, pois fornece as ferramentas necessrias para a
anlise dos dados e para a obteno de concluses sobre o
objeto de estudo.

Na Comunicao dos resultados, a estatstica auxilia a


construo de tabelas e grficos, facilitando a apresentao
dos principais resultados obtidos.

A realizao de todas essas etapas importante, e elas


fazem parte da elaborao de uma pesquisa cientfica que
procure ser o mais fidedigna possvel. O conhecimento dessas
etapas tambm importante para o julgamento da adequa-
cidade de pesquisas realizadas por terceiros, ou seja, quando
nos apresentado oralmente ou por meio de artigos resultan-
tes de uma pesquisa, precisamos ter um conhecimento mnimo
do processo cientfico para que sejamos capazes de criticar e
entender os resultados obtidos.
6Estatstica Aplicada

Na literatura, encontramos vrios conceitos e definies


para a Estatstica, alguns autores a definem como um ramo
da matemtica, j outros defendem a ideia de que a Estatstica
representa por si s uma rea nica da cincia, desconside-
rando ser esta uma subdiviso da matemtica.

Rao (1999) define estatstica como:

A estatstica uma cincia que estuda e pesquisa sobre:


o levantamento de dados com a mxima quantidade de
informao possvel para um dado custo; o processamento
de dados para a quantificao da quantidade de incerteza
existente na resposta para um determinado problema; a to-
mada de decises sob condies de incerteza, sob o menor
risco possvel. Finalmente, a estatstica tem sido utilizada na
pesquisa cientfica, para a otimizao de recursos econ-
micos, para o aumento da qualidade e produtividade, na
otimizao em anlise de decises.

Esse conceito apresenta de forma clara e concisa todos


os aspectos que envolvem as diversas formas de utilizao da
Estatstica: levantamento de dados, processamento, anlise e
auxlio na tomada de decises.

Ao iniciar uma anlise estatstica, deve-se tambm considerar


alguns elementos relacionados metodologia do estudo reali-
zado, como as definies de Populao e Amostra da pesquisa:

Uma populao (N) conjunto de elementos de interesse em


um determinado estudo, que podem ser pessoas ou resultados
experimentais, com uma ou mais caractersticas comuns, que se
pretende estudar.
Captulo 1 Conceitos Bsicos de Estatstica7

Uma amostra (n) um subconjunto da populao usado para


obter informao acerca do todo. Obtemos uma amostra para
fazer inferncias de uma populao. Nossas inferncias so v-
lidas somente se a amostra representativa da populao.

Para ilustrar esses conceitos por meio de um exemplo, con-


sidere a seguinte situao de pesquisa:

Situao de pesquisa

Uma empresa operadora de TV a cabo deseja realizar uma


pesquisa com seus clientes da cidade de Porto Alegre referente
ao grau de satisfao dos mesmos com o servio prestado. Ao
todo, essa operadora possui, nessa cidade, 217.193 assinan-
tes dos quais foram selecionados 620 para participar dessa
pesquisa.

Populao: 217.193 assinantes da operadora de TV a


cabo de Porto Alegre.

Amostra: 620 assinantes da operadora de TV a cabo de


Porto Alegre que participaram da pesquisa.

Outro conceito muito importante o da Varivel, que vem


a ser a matria prima de qualquer pesquisa, ou seja, quando
se termina uma coleta de dados, em um primeiro momento,
dispomos de um conjunto de valores ou ainda respostas perti-
nentes s nossas variveis de pesquisa.
8Estatstica Aplicada

Uma varivel (x) uma caracterstica dos elementos investiga-


dos que difere de um elemento para outro e do qual temos inte-
resse em estudar. Cada unidade (elemento) da populao que
escolhido como parte de uma amostra fornece uma medida de
uma ou mais variveis, tambm chamadas observaes.

As variveis podem ser classificadas em:

Variveis Quantitativas: so as caractersticas que


podem ser medidas em uma escala quantitativa, ou seja,
apresentam valores numricos/quantidades. Podem ser
contnuas ou discretas.

Discretas: caractersticas mensurveis que podem as-


sumir apenas um nmero finito ou infinito contvel de
valores e, assim, somente fazem sentido valores intei-
ros. Exemplos: nmeros de carros vendidos, nmero de
filhos, nmero de reclamaes recebidas por dia etc.

Contnuas: caractersticas mensurveis que assumem


valores em uma escala para as quais valores fracionais
fazem sentido. Exemplos: renda mensal, tempo de en-
trega da mercadoria, tamanho do imvel em m2 etc.

Variveis Qualitativas: so as caractersticas que


no possuem valores quantitativos, mas, ao contrrio,
so definidas por vrias categorias, ou seja, represen-
tam uma classificao dos elementos. Podem ser nomi-
nais ou ordinais.
Nominais: no existe ordenao dentre as catego-
rias. Exemplos: marca do carro, tipo de fornecedor,
profisso etc.
Captulo 1 Conceitos Bsicos de Estatstica9

Ordinais: existe uma ordenao entre as catego-


rias. Exemplos: escolaridade (Fundamental, Mdio
ou Superior), grau de importncia (nenhuma, pouca,
razovel, muito) etc.

Figura 4 Classificao das variveis.

A Estatstica pode ser dividida em duas reas: Descritiva


e Inferencial. A rea descritiva mais simples, contem-
plando ferramentas de organizao de dados e sntese de
informao. A rea Inferencial, por sua vez, permite ao
pesquisador projetar resultados amostrais para populaes,
bem como testar hipteses concernentes a parmetros popu-
lacionais. Inferncia estatstica o processo pelo qual
estatsticos tiram concluses acerca da populao usando
informao de uma amostra. A Estatstica Inferencial est
baseada em dois pilares fundamentais: a Amostragem e a
Probabilidade.
10Estatstica Aplicada

Recapitulando

As ferramentas estatsticas so indispensveis no trata-


mento de dados provenientes de uma pesquisa. pela anlise
e tratamento de dados que o pesquisador obtm todas as in-
formaes pertinentes ao objeto de estudo, propiciando uma
tomada de deciso com menores riscos e incertezas.

Algumas definies importantes:


Populao (N): o conjunto de elementos de interes-
se em um determinado estudo.
Amostra (n): parte da populao selecionada a
quantidade de elementos investigada.
Varivel (x): a caracterstica da amostra a ser inves-
tigada, ou seja, o que desejamos saber com a pergunta
realizada.

A Estatstica pode ser dividida em duas reas: Descritiva,


que se refere organizao e sntese da informao, e Infe-
rencial, destinada projeo de resultados amostrais para
toda a populao.

Atividades: Conceitos bsicos de estatstica

Considere a seguinte situao de pesquisa:


Uma pesquisa foi realizada com um grupo aleatoriamente se-
lecionado de 400 clientes de um restaurante japons. O objeti-
vo dessa pesquisa era identificar o perfil do cliente em relao
s caractersticas Bairro em que reside, Tempo que frequenta
o restaurante, Gasto mdio na refeio realizada e grau de
Captulo 1 Conceitos Bsicos de Estatstica11

satisfao com o servio oferecido pelo restaurante (muito sa-


tisfeito, satisfeito etc.).

Questo 1. A populao dessa pesquisa pode ser considerada como:


a) 400 clientes desse restaurante japons.
b) Todos os clientes desse restaurante japons.
c) Perfil do cliente.
d) Caractersticas do cliente, como bairro, tempo que fre-
quenta, gasto e grau de satisfao.
e) Todos os restaurantes japoneses.

Questo 2. A amostra dessa pesquisa pode ser considerada como:


a) Perfil do cliente.
b) Caractersticas do cliente, como bairro, tempo que fre-
quenta, gasto e grau de satisfao.
c) 400 clientes desse restaurante japons.
d) Todos os clientes desse restaurante japons.
e) Os restaurantes japoneses.

Questo 3. As variveis dessa pesquisa so:


a) Identificao do Perfil do cliente.
b) Os 400 clientes desse restaurante japons.
c) Todos os clientes desse restaurante japons.
d) Bairro em que reside, tempo que frequenta o restaurante,
gasto mdio e grau de satisfao com o servio.
e) Os diferentes restaurantes japoneses existentes.

Questo 4. As variveis quantitativas dessa pesquisa so:


a) Bairro em que reside e grau de satisfao com o servio.
b) Bairro em que reside, gasto mdio e grau de satisfao
com o servio.
12Estatstica Aplicada

c) Tempo que frequenta o restaurante, gasto mdio e grau de


satisfao com o servio.
d) Tempo que frequenta o restaurante e gasto mdio.
e) Todas as variveis so quantitativas.

Questo 5. Marque V para verdadeiro e F para falso nas seguintes


afirmativas:
a) ( ) Em uma pesquisa, o padro de variao nos dados
faz com que os resultados no sejam bvios, por esse mo-
tivo, os resultados obtidos devem receber um tratamento
estatstico que permitir a verificao do comportamento
das variveis de estudo.
b) ( ) As variveis quantitativas so caractersticas que no pos-
suem valores, mas, ao contrrio, so definidas por catego-
rias, ou seja, representam uma classificao dos elementos.
c) ( ) A necessidade da utilizao da Estatstica na anlise
de dados ocorre em pesquisas do tipo Quantitativas.
d) ( ) A Estatstica dividi-se em duas partes: Estatstica Des-
critiva e Estatstica Qualitativa.

Gabarito das atividades propostas


Questo 1. b) Todos os clientes desse restaurante japons.

Questo 2. c) 400 clientes desse restaurante japons.

Questo 3. d) Bairro em que reside, tempo que frequenta o restau-


rante, gasto mdio e grau de satisfao com o servio.

Questo 4. d) Tempo que frequenta o restaurante e gasto mdio.

Questo 5. a) V, b) F, c) V, d) F
Simone Echeveste

Captulo 2

Apresentao
de Dados
14Estatstica Aplicada

Tabelas de frequncia

O primeiro contato do pesquisador com os seus dados feito


por meio da construo das tabelas de frequncia. Podemos
dizer que, neste momento, os dados recebem o seu primeiro
tratamento. Nessa etapa de anlise, o pesquisador identificar
as possveis respostas a uma determinada varivel e o compor-
tamento das mesmas no que se refere a sua frequncia.

A tabela de frequncia tem por objetivo apresentar os resul-


tados de cada varivel de uma forma organizada e resumida.
Nessa tabela, encontramos o nmero de repeties de cada
categoria de resposta de uma varivel, bem como o seu per-
centual no grupo investigado.

De acordo com as normas da ABNT (Associao Brasileira


de Normas Tcnicas) e do IBGE (Instituto Brasileiro de Geo-
grafia e Estatstica), as tabelas de frequncia devem considerar
os seguintes elementos:

a) Ttulo: deve conter as informaes necessrias para que


se compreenda o que est sendo apresentado na tabela,
onde os dados foram obtidos e quando esses dados
foram coletados.
b) Cabealho: indica a natureza do contedo de cada co-
luna da tabela.
c) Corpo da Tabela: a parte composta por linhas e colu-
nas com as informaes observadas.
d) Rodap: espao logo abaixo da tabela que pode ser uti-
lizado para a apresentao de notas ou observaes de
natureza informativa.
Captulo 2 Apresentao de Dados15

e) Fonte: refere-se entidade que organizou ou forneceu os


dados apresentados na tabela.

Exemplo de construo de uma tabela de


frequncia:

Considere uma pesquisa realizada com uma amostra de 20


clientes que compraram em um site de compras na Internet
com o objetivo de investigar o tempo de atraso na entrega (em
dias) das mercadorias adquiridas nesse site. Os dados obser-
vados foram:
0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0

Para esses dados, podemos destacar as seguintes informaes:

a) Varivel de pesquisa: tempo de atraso na entrega das


mercadorias.
b) Amostra investigada: 20 clientes.

Para a construo da tabela, precisamos das seguintes infor-


maes:

c) Valores da varivel que surgiram: correspondem


aos tempos de atraso observados. Neste caso, encontra-
mos 0, 1, 2, 3 e 4 dias.
d) Frequncia (f) de cada valor da varivel: corres-
ponde ao nmero de vezes que cada valor se repetiu.
16Estatstica Aplicada

Para o exemplo, podemos observar que 0 dias de atraso se


repetiu em 7 clientes:

0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0

Na sequncia, 1 dia de atraso se repetiu em 5 clientes:

0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0

J 2 dias de atraso se repetiu em 3 clientes:

0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0

Para 3 dias de atraso, observamos uma ocorrncia em 3 clien-


tes:

0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0

Por fim, para 4 dias de atraso, observamos uma ocorrncia em


2 clientes:

0 1 0 2 3 3 2 1 0 4
3 1 0 0 4 2 1 0 1 0

Agora, organizamos essa informao por meio da estrutu-


ra de uma tabela de frequncia, considerando todos os seus
elementos:
Captulo 2 Apresentao de Dados17

Tempo de atraso na entrega das mercadorias


Tempo de atraso Frequncia %

0 7 35

1 5 25

2 3 15

3 3 15

4 2 10

Total 20 100
Fonte: Pesquisa Interna

Como calculamos a porcentagem da tabela de fre-


quncia?

Clculo da Porcentagem:
18Estatstica Aplicada

IMPORTANTE!!!

De acordo com as normas, as tabelas de frequncia no podem ser


fechadas dos lados, nem ter linhas dividindo as categorias da varivel.
As nicas linhas permitidas so as que delimitam o cabealho e as que
delimitam o total; no centro da tabela, opcional colocar ou no o
trao divisrio das colunas.

Grficos estatsticos

A utilizao de grficos como forma de apresentao de da-


dos pode ser justificada por um ditado popular de que uma
imagem vale mais que 1000 palavras

Tcnicas grficas so geralmente utilizadas, em vez de ta-


belas, para descrever um conjunto de dados por meio de um
desenho. Um grfico estatstico uma forma de apresen-
tao dos dados estatsticos, cujo objetivo o de reproduzir,
no investigador ou no pblico em geral, uma impresso mais
rpida e viva do fenmeno em estudo. (Crespo, 1996)

A representao grfica deve ser utilizada levando-se em


conta algumas qualidades essenciais bsicas para a constru-
o destes conforme nos mostra a figura 2.

De acordo com Levin (1987), enquanto algumas pessoas


parecem desligar-se ao serem expostas a informaes esta-
tsticas em forma de tabelas, elas podem prestar bastante aten-
o s mesmas informaes apresentadas em forma grfica.
Esse fato justifica a grande utilizao por parte dos pesquisa-
dores e da mdia escrita e impressa dos grficos em substitui-
o das tabelas.
Captulo 2 Apresentao de Dados19

Figura 5 Qualidade de um bom grfico.

Grfico de setores

O grfico de setores, tambm conhecido como grfico pizza,


torta, queijo ou bolacha, um dos mais simples recursos grfi-
cos, sua construo baseada no fato de que o crculo possui
360, sendo que esse crculo dividido em fatias de acordo
com o percentual em cada categoria. um grfico til para
representar variveis nominais ou apresentadas em categorias
de respostas.
20Estatstica Aplicada

Figura 6 Exemplo de grfico de setores.

Grfico de colunas

O grfico de colunas um dos grficos mais utilizados para


representar um conjunto de dados, sendo a representao de
uma srie de dados por meio de retngulos dispostos verti-
calmente. A altura desses retngulos proporcional a suas
respectivas frequncias (ou porcentagens). Esse grfico pode
Captulo 2 Apresentao de Dados21

ser utilizado para representar qualquer tipo de varivel em


qualquer nvel de mensurao; por esse fato, um recurso
extremamente utilizado em pesquisas.

Figura 7 Exemplo de grfico de colunas.

Grfico de barras

O grfico de barras uma representao de uma srie de


dados por meio de retngulos dispostos horizontalmente. Os
22Estatstica Aplicada

comprimentos desses retngulos so proporcionais a suas res-


pectivas frequncias. Esse grfico semelhante ao grfico de
colunas, contudo, a posio da escala e da frequncia troca-
da, ou seja, na linha horizontal temos a frequncia (ou percen-
tual) de casos observados e na linha vertical temos os valores
(ou as categorias) da varivel de estudo.

Figura 8 Exemplo de grfico de barras.


Captulo 2 Apresentao de Dados23

Grfico de linhas

Esse grfico se utiliza de uma linha para representar uma srie


estatstica. Seu principal objetivo evidenciar a tendncia ou
a forma como o fenmeno est crescendo ou decrescendo em
um perodo de tempo. Seu traado deve ser realizado conside-
rando o eixo x (horizontal), a escala de tempo, e o eixo y
(vertical), frequncia observada dos valores.

Figura 9 Exemplo de grfico de linhas.


24Estatstica Aplicada

Como fazer grficos no excel

Fazer grficos no Excel muito fcil e simples!


Para isso, precisamos inicialmente fazer as tabelas de
frequncias e calcular as porcentagens. Na confeco dos
grficos, devemos considerar que a informao percentual
sempre mais interessante de ser apresentada (essa regra s no
se aplica no caso do grfico de linhas, pois, nesse caso, muitas
vezes desejamos acompanhar a evoluo de uma determinada
varivel que no necessariamente analisada em percentual).

Vamos considerar um exemplo de construo de um grfi-


co de barras apresentando os resultados para a varivel Profis-
so. Na planilha do Excel, precisamos colocar apenas duas
informaes: as categorias da varivel que apareceram (no
caso do exemplo apresentado abaixo, as profisses) e as suas
respectivas porcentagens.
Captulo 2 Apresentao de Dados25

Marque com o mouse essas duas colunas na planilha e


escolha a opo na barra de ferramentas Inserir Grfico
Barras.

Escolha o grfico de barras dentre as opes fornecidas


pelo Excel. Uma dica importante que a primeira opo apre-
sentada sempre mais interessante e mais simples.
26Estatstica Aplicada
Captulo 2 Apresentao de Dados27

Aps o grfico pronto, voc poder formatar as cores, es-


tilos, acrescentar ttulo etc. utilizando a barras de ferramentas
de Grfico.

No item Design, voc pode modificar as cores do grfico.

No item Layout, voc pode modificar os eixos do grfico,


acrescentar ttulos, legendas e valores.

No item Formatar, voc pode modificar os preenchimentos


(cores) e os contornos do grfico.
28Estatstica Aplicada

Recapitulando

Varivel (x): a caracterstica da amostra a ser inves-


tigada, ou seja, o que desejamos saber com a pergunta
realizada.
Categorias: representam as possveis respostas para a
varivel investigada.
Frequncia (f): o nmero de vezes que cada cate-
goria da varivel se repetiu, ou ainda, quantos elemen-
tos investigados optaram por determinada resposta da
questo.

As tabelas de frequncia correspondem a uma forma


de apresentao de dados, seus elementos so: Ttulo, Ca-
bealho, Corpo, Rodap e Fonte. Sua estrutura composta
por linhas e colunas. As colunas so determinadas de forma
que a varivel a ser apresentada e suas respectivas catego-
rias localizam-se na primeira coluna; j na segunda coluna,
apresentada a frequncia (nmero de repeties) de cada ca-
tegoria; e, por fim, a terceira coluna representa a porcentagem
de cada categoria de resposta.

Os grficos estatsticos so formas de apresentao


dos dados cujo objetivo o de reproduzir, no investigador ou
no pblico em geral, uma impresso mais rpida e viva do
fenmeno em estudo, levando-se em conta a simplicidade,
clareza e veracidade das informaes apresentadas.
Captulo 2 Apresentao de Dados29

Atividades: Apresentao de dados

Os dados a seguir referem-se ao tempo de espera na fila de


uma casa lotrica, em minutos, considerando um grupo de 15
clientes. Os resultados obtidos foram:

6 5 6 7 8
8 8 8 5 7
8 7 6 8 6

Questo 1. A varivel de pesquisa para esse exemplo :


a) 15 clientes de uma casa lotrica.
b) Clientes da casa lotrica.
c) Tempo de espera na fila (em minutos).
d) Contas pagas na fila da casa lotrica.
e) Nenhuma das respostas anteriores.

Questo 2. A amostra de pesquisa para esse exemplo :


a) 15 clientes de uma casa lotrica.
b) Clientes da casa lotrica.
c) Tempo de espera na fila (em minutos).
d) Contas pagas na fila da casa lotrica.
e) Nenhuma das respostas anteriores.

Questo 3. Construa uma tabela de frequncia para repre-


sentar esses dados.
30Estatstica Aplicada

Questo 4. Construa uma tabela para representar os dados


abaixo que se referem ao nmero de viagens realizadas por 20
famlias nos ltimos 5 anos:

0 1 2 5 2 3 4 2 2 4
4 0 0 2 3 2 1 5 2 1

Questo 5. O desempenho do setor de Cartes de Crdito


tem sido bastante satisfatrio e tem crescido na medida em que
a compensao de cheques vem diminuindo. Existe o incentivo
por parte dos bancos para que seja impulsionado o uso de car-
tes, tudo porque a transao com cheque custa 455% a mais
que a eletrnica. Por parte dos estabelecimentos comerciais,
o incentivo acontece por ser mais seguro e por reduzir as des-
pesas financeiras. Atualmente, o potencial de crescimento de
demanda para o dobro de cartes que esto em circulao,
hoje, pouco mais de 40 milhes. Nos ltimos 8 anos, o uso do
carto de crdito aumentou 327%, enquanto que a utilizao
do carto de dbito, 562,5%. Fonte: www.investnews.com.br

Os dados abaixo correspondem aos resultados de uma


pesquisa realizada com 20 lojas de um shopping com o ob-
jetivo de verificar o valor mensal de suas vendas (mil
reais) pagas com carto de dbito:

12 15 10 5 10 10 5 12 2 2
10 15 10 15 10 5 10 10 10 10

Construa uma tabela de frequncia para representar esses


dados.
Captulo 2 Apresentao de Dados31

Gabarito das atividades propostas

Questo 1. c) Tempo de espera na fila (em minutos).


Questo 2. a) 15 clientes de uma casa lotrica.
Questo 3.

Tempo de espera na fila (em minutos)


Tempo Frequncia %

5 2 13,3

6 4 26,7

7 3 20,0

8 6 40,0

Total 15 100
Fonte: Pesquisa

Questo 4.
Nmero de viagens realizadas nos ltimos 5 anos
N viagens Frequncia %

0 3 15,0

1 3 15,0

2 7 35,0

3 2 10,0

4 3 15,0

5 2 10,0

Total 20 100
Fonte: Pesquisa
32Estatstica Aplicada

Questo 5.

Valor mensal de suas vendas (mil reais) pagas com carto de dbito:
Valor (mil reais) Frequncia %

2 2 10,0

5 3 15,0

10 10 50,0

12 2 10,0

15 3 15,0

Total 20 100
Fonte: Pesquisa
Simone Echeveste

Captulo 3

Medidas de
Tendncia Central

N
este captulo, iremos abordar as Medidas de Tendn-
cia Central, que so medidas que tm por objetivo
representar todos os valores de uma varivel por meio
de um nico valor. As medidas de tendncia central so:
Mdia, Mediana e Moda.
34Estatstica Aplicada

Nosso objetivo aqui a apresentao de cada uma dessas


medidas no que se refere aplicabilidade, ao clculo e in-
terpretao dos resultados obtidos. O aluno, ao final deste
captulo, dever ser capaz de calcular e interpretar as medidas
estatsticas apresentadas.

Podemos ainda aprofundar um pouco mais a nossa anlise


estatstica para o caso em que as variveis analisadas sejam
QUANTITATIVAS por meio das medidas estatsticas de ten-
dncia central.

Essas medidas tm por objetivo encontrar a tendncia


central de um conjunto de dados, ou seja, encontrar o valor
do meio ou ainda os valores tpicos de uma distribuio. So
medidas teis para caracterizar e representar um conjunto de
dados por meio de um nico valor utilizando critrios distintos
para isso. As medidas de tendncia central so: mdia, me-
diana e moda.

Figura 10 Medidas de Tendncia Central.


Captulo 3 Medidas de Tendncia Central35

Mdia

A mdia a medida de tendncia central mais conhecida e


mais utilizada de todas. Existem vrios tipos de mdias, a que
utilizamos em pesquisas a Mdia aritmtica, obtida pela
soma de todos os valores da varivel investigada (valores de
x) dividida pelo nmero total de valores no conjunto de dados
(total da amostra n). representada pelos smbolos na
amostra e por na populao.

Notao:
mdia populacional
mdia amostral

Frmula:

Onde:
S = somatrio
x varivel (valores obtidos para a varivel investigada)
n tamanho da amostra

Exemplo
Os dados abaixo representam o tempo de relacionamento (em
anos) de uma amostra de 7 clientes com a sua operadora de
telefonia celular.

15 18 18 20 17 18 16
36Estatstica Aplicada

Elementos importantes:
Amostra (n): 7 clientes.
Varivel (x): tempo de relacionamento com a operadora de
telefonia celular.

Mdia:

= 17,4 anos

Interpretao: Em mdia, o tempo de relacionamento


dos clientes com sua operadora de telefonia celular de 17,4
anos.

Mdia para dados agrupados em tabelas


de frequncia

Quando os dados esto organizados na forma de uma tabe-


la de frequncias, devemos multiplicar os diferentes valores
x pelas respectivas frequncias f. A frmula utilizada deve-
r ser nesse caso:
Captulo 3 Medidas de Tendncia Central37

Onde:

S = somatrio
x varivel
f frequncia de cada valor da varivel
n tamanho da amostra

Exemplo

Considere a seguinte tabela referente ao Nmero de faltas no


perodo de um ano em uma amostra de 62 funcionrios de
uma empresa:

Nmero de faltas em um ano


N de faltas (x) Frequncia (f) % x.f
0 5 8,0 0x5=0

2 25 40,3 2 x 25= 50

4 30 48,4 4 x 30= 120

6 2 3,2 6 x 2= 12

Total 62 (n) 100 182

= 2,9 faltas
38Estatstica Aplicada

Interpretao: Em mdia, os funcionrios tiveram 2,9 faltas


em um ano.

Mediana

Ordenados os elementos da amostra em ordem crescente, a


mediana o valor considerado o ponto do meio, que a divide
ao meio, isto , metade dos elementos da amostra menor ou
igual mediana, e a outra metade maior ou igual mediana.

Notao:

Md ou Me

Como obter a Mediana:


1) todos os valores do conjunto de dados devem ser colocados
em ordem crescente, se houver algum valor que se repita
mais de uma vez, deve ser repetido na ordenao tambm.
2) devemos encontrar a posio da mediana considerando
a seguinte regra: se o tamanho da amostra (n) mpar, a
mediana o valor central; se o tamanho da amostra (n) for
par, a mediana ser a mdia dos dois valores centrais.

EXEMPLO 1: Quando o tamanho da amostra n for mpar.

Uma pesquisa foi realizada com o objetivo de verificar a


renda, em salrios mnimos, de uma amostra de 5 clientes de
uma loja.

8,0 9,1 8,5 9,7 9,2


Captulo 3 Medidas de Tendncia Central39

Amostra (n): 5 clientes de uma loja.

Varivel (x): renda em salrios mnimos.

Mediana (Md)
1) Colocar os valores em ordem crescente.

8,0 8,5 9,1 9,2 9,7

2) Encontrar o valor central no conjunto de dados.

8,0 8,5 9,1 9,2 9,7

Mediana

Interpretao: Metade dos clientes dessa loja possuem


renda de 9,1 salrios mnimos ou menos, e metade dos clientes
possui renda de 9,1 salrios mnimos ou mais.

EXEMPLO 2: Quando o tamanho da amostra n for par.

Uma pesquisa foi realizada com o objetivo de verificar a


renda, em salrios mnimos, de uma amostra de 6 clientes
de uma loja.

8,0 8,8 8,5 9,7 9,5 9,2

Amostra (n): 6 clientes de uma loja.

Varivel (x): renda em salrios mnimos.


40Estatstica Aplicada

1) Colocar os valores em ordem crescente.

8,0 8,5 8,8 9,2 9,5 9,7

2) Encontrar os dois valores centrais no conjunto de dados.

8,0 8,5 8,8 9,2 9,5 9,7

Mediana

3) Calcular o ponto mdio entre esses dois valores centrais


(somando os dois valores e dividindo por dois).

Md = 9,0 salrios mnimos

Interpretao: Metade dos clientes dessa loja possuem


renda de 9 salrios mnimos ou menos, e metade dos clientes
possui renda de 9 salrios mnimos ou mais.

Moda
A moda de um conjunto de dados simplesmente o valor do
conjunto de dados que ocorreu com maior frequncia, ou seja,
que mais se repetiu.

Notao:
Mo
Captulo 3 Medidas de Tendncia Central41

Exemplo
Os dados apresentados a seguir referem-se aos valores da
diria (em reais) para um casal em uma amostra de 8 Hotis
na cidade de Porto Alegre:

200 210 200 210


210 250 230 210

Amostra (n): 8 Hotis em Porto Alegre.

Varivel (x): valor da diria para um casal (em reais).

Mo = 210 reais (este valor se repete quatro vezes na amos-


tra, foi o valor de diria que mais se repetiu).

200 210 220 210


210 250 230 210

Interpretao: O valor da diria para um casal que


ocorreu com maior frequncia foi de 210 reais.

ATENO!!!

- Um conjunto de dados pode no ter moda, ou seja, nenhum valor se repetir.


Exemplo: Idade de 5 clientes:
34, 56, 23, 42, 38
Nenhum valor se repete no tem moda!

- Um conjunto de dados pode ter mais que uma moda, ou seja, poderemos
ter mais que um valor da varivel se repetindo com frequncias iguais.
Exemplo: Idade de 8 clientes:
35, 23, 35, 40, 51, 40, 32, 55
Duas modas: 35 e 40 peas!
42Estatstica Aplicada

Recapitulando

As Medidas de Tendncia Central tm por objetivo representar


todos os valores de uma varivel por meio de um nico va-
lor. As medidas de tendncia central so: Mdia, Mediana e
Moda.

A Mdia representa a soma de todos os valores de uma


varivel dividida pela quantidade de valores existente; j a me-
diana representa o valor central de um conjunto de dados de
forma que metade dos valores observados igual ou menor a
ela, e metade igual ou superior a ela. A moda corresponde ao
valor da varivel que ocorreu com maior frequncia, ou ainda,
o que mais se repetiu.

Atividades: Medidas de tendncia central

Questo 1. Uma pesquisa foi realizada com 12 empresas do


ramo alimentcio, com o objetivo de verificar o nmero de fun-
cionrios que estas possuem, os dados obtidos esto abaixo:

32 35 45 50 30 22 15 25 10 15 30 21

Calcule e interprete:
a) Mdia.
b) Mediana.
c) Moda.
Captulo 3 Medidas de Tendncia Central43

Questo 2. A tabela abaixo representa os salrios pagos a


100 operrios da empresa GLT & Cia:

Salrios GLT & Cia


N de salrios mnimos N de operrios %

0 40 40,0

2 30 30,0

4 10 10,0

6 15 15,0

8 5 5,0

Total 100 100,0


Fonte: Pesquisa

a) Quem a varivel de estudo?


b) Qual foi a amostra pesquisada?
c) Qual a mdia de salrio dos operrios da empresa GLT &
Cia?

Questo 3. Uma pesquisa levantou os dados sobre o mer-


cado imobilirio de determinado centro urbano, do ano 2005
a 2012, e os valores obtidos sobre o nmero de lanamentos
(em mil unidades) e o total em vendas (em milhes de Reais)
esto dispostos abaixo:

Ano 2005 2006 2007 2008 2009 2010 2011 2012


Vendas 5,1 4,0 4,5 10,1 12,6 9,7 10,2 11,7
Fonte: Pesquisa
44Estatstica Aplicada

a) Quem a varivel desse estudo?


b) Quem a amostra estudada?
c) Calcule e interprete a mdia.
d) Calcule e interprete a mediana.
e) Calcule e interprete a moda.

Questo 4. A tabela abaixo apresenta os valores das dirias


pagas por 40 turistas nos hotis do balnerio Beach Star:

Dirias pagas em Beach Star


Diria (em R$) N de turistas %

80 18 45,0

96 10 25,0

145 5 12,5

210 7 17,5

Total 40 100
Fonte: Rede hoteleira

a) Calcule e interprete a mdia para esses dados.

Questo 5. Segundo dados divulgados pelo DIEESE (Depar-


tamento Intersindical de Estatsticas e Estudos Socioeconmi-
cos), os valores da cesta bsica em Dezembro de 2009, em 10
capitais brasileiras pesquisadas, esto na tabela abaixo:
Captulo 3 Medidas de Tendncia Central45

Valor da Cesta Bsica em 10 capitais brasileiras em Dezembro de 2009


Capital Valor da cesta bsica (R$)

Braslia 222,22

RJ 213,36

SP 228,19

Curitiba 211,85

Porto Alegre 237,58

Belm 204,32

Fortaleza 176,96

Manaus 215,94

Recife 171,31

Salvador 183,15
Fonte: DIEESE

Com base nos dados apresentados na tabela acima:

a) Calcule e interprete o preo mdio da Cesta Bsica para


as capitais pesquisadas.
b) Calcule e interprete o preo mediano da Cesta Bsica
para as capitais pesquisadas.

Gabarito das atividades propostas

Questo 1.

a) Em mdia, essas empresas possuem 27,5 funcionrios.


46Estatstica Aplicada

b) Metade das empresas possui menos que 27,5 funcion-


rios, e metade mais que 27,5 funcionrios.
c) Os nmeros de funcionrios que ocorrem com maior fre-
quncia so 15 e 30 funcionrios.

Questo 2.

a) Varivel: salrios GLT&Cia.


b) Amostra: 100 operrios.
c) 2,3 salrios mnimos.

Questo 3.

a) Varivel: total de vendas.


b) Amostra: 8 anos.
c) Em mdia, foram vendidos 8,5 milhes em reais nesse
perodo por ano.
d) Metade do perodo foi vendida por menos que 9,9 mi-
lhes de reais, e metade por mais que 9,9 milhes de
reais.
e) No h moda, pois nenhum valor se repete.

Questo 4.

O valor mdio das dirias de 114,9 reais.

Questo 5.

a) O preo mdio da cesta bsica nessas capitais de 206,5


reais.
b) Em metade das capitais, o preo da cesta bsica inferior
a 212,6 reais, e em metade superior a 212,6 reais.
Simone Echeveste

Captulo 4

Medidas de
Variabilidade

N
este captulo, iremos abordar as Medidas de Variabi-
lidade, que so medidas que tm por objetivo mensu-
rar variao de um conjunto de dados em torno da mdia.
48Estatstica Aplicada

Nosso objetivo aqui a apresentao de cada uma dessas


medidas no que se refere aplicabilidade, ao clculo e inter-
pretao dos resultados obtidos. O aluno, ao final deste captu-
lo, dever ser capaz de calcular e interpretar as medidas de va-
riabilidade: varincia, desvio-padro e coeficiente de variao.

A mdia extremamente til como uma medida que obje-


tiva representar/resumir um conjunto de dados, mas tambm
imprescindvel ao pesquisador ter conhecimento da variao
que ocorre em torno dessa mdia. Para isso, o clculo das
medidas de variabilidade contribui para uma melhor interpre-
tao do comportamento de uma varivel quantitativa (sua
mdia e sua variao).

To importante quanto representarmos todos os valores de


um conjunto de dados por meio das medidas de tendncia
central ter o conhecimento da variao que ocorre em torno
dessa medida. As medidas de variabilidade so extremamente
teis no tratamento de dados, pois estas indicam a variao
existente em torno da mdia. As medidas de variabilidade que
veremos em nossa disciplina so: Varincia, Desvio-padro e
Coeficiente de variao.

Figura 11 Medidas de Variabilidade.


Captulo 4 Medidas de Variabilidade49

Varincia

A varincia de uma amostra corresponde mdia dos qua-


drados dos desvios dos valores em relao mdia, Quanto
maior for a variao dos valores do conjunto de dados, maior
ser a varincia.

Notao:
2 varincia populacional
s2 varincia amostral

Frmula:

Onde:
x valores da varivel investigada
mdia da amostra
n tamanho da amostra
somatrio

Propriedades da Varincia
1. Somando-se (ou subtraindo-se) a cada elemento de um con-
junto de valores uma constante, a varincia no se altera;
2. Multiplicando-se (ou dividindo-se) cada elemento de um con-
junto de valores por um valor constante, a varincia fica mul-
tiplicada (ou dividida) pelo quadrado da constante.
50Estatstica Aplicada

Exemplo

Os dados apresentados abaixo correspondem ao nmero


de reclamaes (em mil reclamaes) dirias recebidas pelo
PROCON referentes s operadoras de TV a cabo no perodo
de 5 dias:

17 18 16 20 22

Elementos importantes:
Varivel (x): nmero de reclamaes (em mil reclamaes)
dirias recebidas pelo PROCON referentes s operadoras de
TV a cabo.

Amostra (n): 7 dias.

Mdia:

Varincia:
Captulo 4 Medidas de Variabilidade51

s2 = 5,8 reclamaes/dia2

No clculo da varincia, pode-se observar que a unidade


da varivel estudada elevada ao quadrado, dificultando, as-
sim, a interpretao de seu resultado final. A soluo para esse
problema extrair a raiz quadrada da varincia, permitindo,
dessa forma, que se volte unidade original da varivel. Essa
nova medida (a raiz quadrada da varincia) chamada de
desvio-padro.

Desvio-padro

O desvio-padro corresponde raiz quadrada da varincia.


Essa medida expressa a variao mdia do conjunto de dados
em torno da mdia, para mais ou para menos na mesma uni-
dade de medida da mdia.

Notao:
desvio-padro populacional

s desvio-padro amostral

Frmula:
52Estatstica Aplicada

Propriedades do Desvio-padro

1. Somando-se (ou subtraindo-se) a cada elemento de um conjun-


to de valores uma constante, o desvio-padro no se altera;
2. Multiplicando-se (ou dividindo-se) cada elemento de um con-
junto de valores por um valor constante, o desvio-padro fica
multiplicado (ou dividido) pela constante.

O desvio-padro de uma amostra pode ser calculado con-


siderando as seguintes etapas:

Figura 12 Etapas para o clculo do Desvio-padro.

Para o exemplo apresentado teremos:


Captulo 4 Medidas de Variabilidade53

Varincia:
s2 = 5,8 reclamaes/dia2

Desvio-padro:

s = 2,4 reclamaes/dia

Interpretao:
Em mdia, o PROCON recebe diariamente 18,6 reclamaes
com uma variao em torno dessa mdia de 2,4 reclamaes.

Coeficiente de variao

Neste momento, poderemos questionar: quando um desvio-


-padro grande e quando ele pequeno? Na verdade, um
desvio padro pode ser considerado grande ou pequeno de-
pendendo da ordem de grandeza da varivel.

Por esse motivo, quando desejamos comparar a variabili-


dade entre mtodos, ou ainda entre grupos de valores, indi-
cada a utilizao do Coeficiente de Variao que representa
o desvio-padro expresso como uma porcentagem da mdia.

Notao:
C.V. Coeficiente de variao.
54Estatstica Aplicada

Frmula:
Onde:
mdia da amostra

s desvio-padro

Para o exemplo...

Interpretao:
Existe uma variao em torno da mdia de 12,9%.

Figura 13 Interpretao Coeficiente de Variao.


Captulo 4 Medidas de Variabilidade55

Medidas de variabilidade para dados


agrupados em tabelas de frequncia

Os dados abaixo se referem ao tempo de espera na fila de um


caixa de supermercado (em minutos):

Tempo de espera na fila (minutos)


Tempo de espera (x) Frequncia (f) % x.f

0 5 8,0 0x5=0

2 25 40,3 2 x 25= 50

4 30 48,4 4 x 30= 120

6 2 3,2 6 x 2= 12

Total 62 (n) 100 182

Mdia:

Agora, vamos calcular a varincia e o desvio-padro. Nes-


se caso, devemos considerar a frequncia de cada valor da
varivel.
56Estatstica Aplicada

Varincia:

Tempo de espera na fila (minutos)


Tempo de espera (x) Frequncia (f) % (x )2. f

0 5 8,0 (0 2,9)2. 5 = 42,05

2 25 40,3 (2 2,9)2. 25 = 20,25

4 30 48,4 (4 2,9)2. 30 = 36,3

6 2 3,2 (6 2,9)2. 2 = 19,22

Total 62 (n) 100 117,82

s2 = minutos2

Desvio-padro:

s = 1,4 minutos
Captulo 4 Medidas de Variabilidade57

Interpretao:
Em mdia, o tempo de espera na fila desse supermercado
de 2,9 minutos com uma variao em torno dessa mdia de
1,4 minutos.

Recapitulando

As Medidas de Variabilidade (Varincia, Desvio-padro e Coefi-


ciente de Variao) so extremamente teis no tratamento de da-
dos, pois estas indicam a variao existente em torno da mdia.

Quando realizamos o tratamento estatstico de dados pro-


venientes de variveis quantitativas, o clculo e interpretao
dessas medidas fornece informao detalhada e de extrema
importncia na tomada de deciso do pesquisador.

Atividades: Medidas de variabilidade

Questo 1. Os dados abaixo so referentes s taxas de de-


semprego (em %) em alguns pases selecionados da Amrica
do Sul e da Amrica do Norte:

Brasil Uruguai Chile Argentina Canad EUA Venezuela


11.4 12.1 5.6 7.3 4.8 5.3 7.3

Calcule e interprete a Mdia e o desvio-padro para esses


dados.
58Estatstica Aplicada

Questo 2. A capacidade em litros dos porta-malas dos car-


ros populares produzidos no Brasil foi investigada obtendo-se
os seguintes dados:

Corsa: 240 litros Uno: 224 litros Hobby: 325 litros


Gol: 146 litros

Calcule e interprete a mdia e o desvio-padro para esses


dados.

Questo 3. Um fabricante de molas est interessado em im-


plementar um sistema de controle de qualidade para monitorar
seu processo de produo. Para isto, foi registrado o nmero
de molas fora da conformidade em cada lote de produo. Os
dados apresentados na tabela de frequncia abaixo se referem
a 20 lotes selecionados, observando-se o nmero de molas
fora de conformidade.

Nmero de molas fora de conformidade


Nmero de molas f %

6 3 15,0

7 6 30,0

8 4 20,0

9 3 15,0

12 4 20,0

Total 20 100,0

a) Calcule e interprete as medidas descritivas: mdia e des-


vio-padro para esses dados.
Captulo 4 Medidas de Variabilidade59

Questo 4. Considere a seguinte tabela:

Nmero de faltas no ms de uma amostra de 153 funcionrios na empresa WK


N de faltas N funcionrios %

0 85 55,5

1 20 13,1

2 40 26,1

3 8 5,3

Total 153 100,0

Calcule e interprete a mdia e o desvio-padro para esses


dados.

Questo 5. Duas turmas de Estatstica apresentam as seguin-


tes estatsticas para as notas na prova G1:

Turma A: mdia = 7,8 pontos e desvio-padro = 1,4 pontos.

Turma B: mdia = 8,2 pontos e desvio-padro = 2,5 pontos.

Qual das duas turmas teve um desempenho mais homog-


neo na prova G1? Justifique.

Gabarito das atividades propostas

Questo 1.
A taxa mdia de desemprego 7,7% com uma variao em
torno dessa mdia de 2,9%.
60Estatstica Aplicada

Questo 2.
Em mdia, a capacidade do porta-malas desses carros de
233,8 litros com uma variao em torno dessa mdia de 73,4
litros.

Questo 3.
Em mdia, so produzidas por lote 8,4 molas fora de confor-
midade com uma variao de 2,2 molas.

Questo 4.
Em mdia, os funcionrios da empresa WK possuem 0,8 fal-
tas, com uma variao em torno dessa mdia de 1 falta.

Questo 5.
CVA = 17,9% CVB = 30,5% CVA < CVB

A turma A teve um desempenho mais homogneo na prova


G1, comparada com a turma B, pois tem um coeficiente de
variao menor.
Simone Echeveste

Captulo 5

Distribuio de
Probabilidade Normal

A
distribuio Normal ou Gaussiana , sem d-
vida, o modelo probabilstico mais conhecido. Vrias
tcnicas estatsticas necessitam da suposio de que os
dados se distribuam normalmente para serem utilizadas.
Na natureza, uma grande quantidade de variveis apre-
senta tal distribuio.
O objetivo desse captulo a apresentao dessa dis-
tribuio por meio de exemplos de aplicaes na rea
da administrao; espera-se que o aluno compreenda as
situaes problema em que ela possa ser aplicada e as
interpretaes dos resultados fornecidos.
62Estatstica Aplicada

A distribuio Normal o modelo probabilstico mais utilizado


no tratamento estatstico de dados, pois diversas ferramentas
estatsticas necessitam da suposio de que os dados se distri-
buam normalmente para serem utilizadas.

A sua funo densidade de probabilidade da distribuio


normal f(x) dada por:

; para - < x < , - < < e 2 > 0

Os parmetros da Normal so a mdia ( ) e o desvio-


-padro ( s ), que permitem infinitas curvas normais com dife-
rentes formatos (mas sempre simtricas). O grfico da funo
densidade de probabilidade apresentado a seguir:

Figura 14 Grfico da Curva Normal.


Captulo 5 Distribuio de Probabilidade Normal63

Figura 15 Caractersticas da Distribuio Normal.

A distribuio Normal, independentemente dos valores


dos parmetros, apresenta sempre a seguinte relao (Fi-
gura 11):
64Estatstica Aplicada

Figura 16 reas importantes da Curva Normal.

Distribuio normal-padro ou normal


reduzida - Z

A funo densidade de probabilidade f(x) da distribuio nor-


mal depende dos valores de e ; por essa razo, teremos
vrias equaes para vrios diferentes valores de e . Todas
as curvas normais representativas de distribuies de frequn-
cias podem ser transformadas em uma curva normal padro,
usando-se a mdia e o desvio padro da varivel em
estudo.
Captulo 5 Distribuio de Probabilidade Normal65

Para evitar clculos com a integrao, uma tabela nica foi


desenvolvida para uma varivel aleatria agora chamada de
Z com =0 e =1, e sua distribuio de probabilidades
definida como normal padronizada, ou ainda normal padro.

Seja X uma varivel aleatria normalmente distribuda com


quaisquer parmetros mdia e desvio-padro . Para reali-
zar o processo de padronizao, devemos realizar a seguinte
transformao:

Onde:
x = valor de interesse da varivel

= mdia da varivel

= desvio-padro da varivel

Aps a padronizao, poderemos obter as probabilidades


associadas a cada rea por meio da Tabela Normal padro
apresentada a seguir:

Tabela da Distribuio Normal Padro P(Z < z) VALORES POSITIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
66Estatstica Aplicada

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Captulo 5 Distribuio de Probabilidade Normal67

Tabela da Distribuio Normal Padro P(Z < z) VALORES NEGATIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
68Estatstica Aplicada

-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Como utilizar a tabela normal padro

Na tabela, desejamos saber a rea correspondente a um de-


terminado valor de z, devemos considerar duas informaes
importantes obtidas a partir do valor de z que so: a linha e
a coluna em que devemos procurar o valor.

Por exemplo, para P(z < 1,35), l-se probabilidade de z


ser inferior a 1,35:

Devemos dividir esse nmero em duas partes: a primei-


ra composta pela parte inteira do nmero e a primeira casa
aps a vrgula que representa os dcimos; a segunda parte
composta pela segunda casa aps a vrgula que representa o
centsimo.
Captulo 5 Distribuio de Probabilidade Normal69

Para o nosso exemplo P(z < 1,35), deveremos buscar na ta-


bela dos valores de z positivos a linha 1,3 e a coluna 0,05:

Tabela da Distribuio Normal Padro P(Z < z) VALORES POSITIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8557 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441

Ento P(z < 1,35) = 0,9115 ou ainda 91,15%.

Outro exemplo: P(z < -0,27)


70Estatstica Aplicada

Deveremos buscar na tabela dos valores de z negativos


a linha -0,2 e a coluna 0,07:

Tabela da Distribuio Normal Padro P(Z < z) VALORES POSITIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-08 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

Ento P(z < -0,27) = 0,3936 ou ainda 39,36%.

Exemplo 1

O valor gasto em uma refeio em um restaurante tem dis-


tribuio normal com mdia de 20 reais e desvio-padro de
0,50 reais. Qual a probabilidade que um cliente aleatoria-
mente selecionado gaste menos de 21 reais?

Passo 1: Dados do Problema

x = valor gasto em uma refeio

= 20 reais

= 0,50 reais
Captulo 5 Distribuio de Probabilidade Normal71

Pede-se: P(x < 21 reais)

Passo 2: Padronizar para obter o clculo da rea pela tabela


Normal Padro

Passo 3: Buscar o valor da probabilidade P(z < 2,00) na


tabela normal
72Estatstica Aplicada

Deveremos buscar na tabela dos valores de z positivos


a linha 2,0 e a coluna 0,00:

Tabela da Distribuio Normal Padro P(Z < z) VALORES POSITIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 ,05948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890

Ento a P(x < 21 reais) = 0,9772 ou 97,72%.


Captulo 5 Distribuio de Probabilidade Normal73

Exemplo 2

O nmero de unidades vendidas em uma loja de materiais es-


portivos no perodo de um ms normalmente distribudo com
mdia de 7000 unidades e desvio-padro de 600 unidades.
Qual a probabilidade de que em um determinado ms essa
loja venda menos de 6400 unidades?

Passo 1: Dados do Problema

x = nmero de unidades vendidas em uma loja de materiais


esportivos no perodo de um ms

m = 7000 unidades

s = 600 unidades

Pede-se:

P(x < 6400 unidades)


74Estatstica Aplicada

Passo 2: Padronizar para obter o clculo da rea pela tabela


Normal Padro

Passo 3: Buscar o valor da probabilidade P(z < -1,00) na


tabela normal
Captulo 5 Distribuio de Probabilidade Normal75

Deveremos buscar na tabela dos valores de z negativos


a linha -1,0 e a coluna 0,00:

Tabela da Distribuio Normal Padro P(Z < z) VALORES POSITIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985

Ento a P(x < 6400 unidades) = 0,1587 ou 15,87%.

Nos exemplos anteriores, observe que as reas/probabi-


lidades solicitadas foram sempre reas INFERIORES a um
76Estatstica Aplicada

valor x de interesse; observe que, na tabela normal padro


utilizada, as probabilidades que ali se encontram referem-se
sempre a reas inferiores:

Tabela da Distribuio Normal Padro P(Z < z) VALORES POSITIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

Quando a probabilidade desejada for uma rea SUPE-


RIOR a algum valor de x ou ainda ENTRE dois valores de
x, devemos utilizar a mesma tabela, porm observando as
seguintes regras:

No mesmo exemplo anteriormente citado, vamos consi-


derar agora que desejamos saber a probabilidade dessa loja
vender mais de 7500 unidades:

Pede-se:

P(x > 7500 unidades)


Captulo 5 Distribuio de Probabilidade Normal77

Observe que aqui desejamos a rea localizada DIREITA


no grfico (rea escura), ou seja, uma rea SUPERIOR, po-
rm a tabela apresenta apenas o clculo das reas INFERIO-
RES, ou ainda ESQUERDA do grfico (rea clara). Nesse
caso utilizaremos a informao que a curva ao todo possui
100% de rea, ento calcularemos a rea INFERIOR e do re-
sultado obtido na tabela subtrairemos 100%.

Ento poderemos estabelecer a seguinte regra:

P( x a ) = 100% - P( x a )

Voltando ao exemplo:

b) Probabilidade de vender mais de 7500 unidades.

Pede-se:

P(x > 7500 unidades)


78Estatstica Aplicada

Vamos ento aplicar a regra:

P(x > 7500 unidades) = 100% - P(x < 7500 unidades)

Padronizando para obter o clculo da rea pela tabela


Normal Padro.

Buscando o valor da probabilidade P(z < 0,83) na tabela


normal.

Deveremos buscar na tabela dos valores de z positivos


a linha 0,8 e a coluna 0,03:
Captulo 5 Distribuio de Probabilidade Normal79

Tabela da Distribuio Normal Padro P(Z < z) VALORES POSITIVOS


z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

Ento a P(x < 7500 unidades) = 0,7967 ou 79,67%.

ATENO!!!

No esquea que a probabilidade desejada SUPERIOR a 7500


horas, ento:
P(x > 7500 horas) = 100% - P(x < 7500 horas)
P(x > 7500 horas) = 100% - 79,67%
P(x > 7500 horas) = 20,33%
80Estatstica Aplicada

Agora, vejamos o terceiro e ltimo tipo de rea/probabili-


dade a ser calculada: ENTRE dois valores.

Qual a probabilidade dessa loja vender entre 6300 uni-


dades e 7400 unidades?

Pede-se:

P( 6300 x 7400 )

Nesse caso, teremos dois valores de x que devero ser


padronizados resultando em dois valores de probabilidade,
uma referente rea inferior a 7400 e outra inferior a 6300.
Captulo 5 Distribuio de Probabilidade Normal81

Para obter a rea de interesse, devemos subtrair uma rea


da outra. Assim, poderemos estabelecer a seguinte regra:

P( a x b ) = P( x b ) P( x a )

Voltando ao exemplo:

Pede-se:

P( 6300 x 7400 )
82Estatstica Aplicada

Vamos ento aplicar a regra:

P( 6300 x 7400 ) = P(x 7400) P(x 6300)

Padronizando para obter o clculo da rea pela tabela


Normal Padro.

Na tabela: linha 0,6 e coluna 0,07 0,7486 ou 74,86%

Na tabela: linha -1,1 e coluna 0,07 0,1210 ou


12,10%

Ento:

P( 6300 x 7400 ) = 74,86% 12,10%

P( 6300 x 7400 ) = 62,76%


Captulo 5 Distribuio de Probabilidade Normal83

Recapitulando

A distribuio de probabilidades para uma varivel aleatria


X expressa por meio de um modelo matemtico que repre-
senta as probabilidades associadas aos possveis valores que
essa varivel pode assumir.

A Distribuio Normal o modelo probabilstico mais co-


nhecido, no qual vrias tcnicas estatsticas necessitam da
suposio de que os dados se distribuam normalmente para
serem utilizadas. Seus parmetros so a mdia e o desvio-
-padro.

Atividades: Distribuio de probabilidade


normal

Questo 1. Determinado atacadista efetua suas vendas por


telefone. Aps alguns meses, verificou-se que os pedidos se
distribuem normalmente com mdia de 3.000 pedidos e des-
vio-padro de 180 pedidos. Qual a probabilidade de que em
um ms selecionado ao acaso essa empresa venda menos
de 2700 pedidos.

Questo 2. O contedo lquido das garrafas de 300 ml de


um refrigerante normalmente distribudo com mdia de 300
ml e desvio-padro de 2 ml. Determine a probabilidade de uma
garrafa selecionada ao acaso apresentar contedo lquido:

a) Inferior a 306 ml.


b) Superior a 305 ml.
84Estatstica Aplicada

c) Entre 302 e 304 ml.

Questo 3. O lucro mensal obtido com aes de determi-


nada empresa tem distribuio normal com mdia de 12 mil
reais e desvio-padro de 5 mil reais. Qual a probabilidade de
que em determinado ms o lucro dessa empresa seja:

a) Superior a 18 mil reais.


b) Inferior a 8 mil reais.
c) Entre 10 e 15 mil reais.

Questo 4. Suponha que a renda mdia anual de uma grande


comunidade tenha distribuio normal com mdia de 15 mil re-
ais e com um desvio-padro de 3 mil reais. Qual a probabilida-
de de que um indivduo aleatoriamente selecionado desse grupo
apresente uma mdia salarial anual superior a 18 mil reais?

Questo 5. O escore de um estudante no vestibular uma


varivel com distribuio normal com mdia de 550 pontos e
desvio-padro de 30 pontos. Se a admisso em certa faculda-
de exige um escore mnimo de 575 pontos, qual a probabi-
lidade de um aluno ser admitido nessa faculdade?

Gabarito das atividades propostas

Questo 1. P(x < 2700 pedidos) = 4,75%


Questo 2. a) 99,87% b) 0,62% c) 13,59%
Questo 3. a) 11,51% b) 21,19% c) 38,12%
Questo 4. P(x > 18 mil reais) = 15,87%
Questo 5. P(x > 575 pontos) = 20,33%
Simone Echeveste

Captulo 6

Amostragem

Q
uando uma pesquisa/estudo analisa os dados de
todo o Universo/grupo que ele tenta compreender,
dizemos que est trabalhando com a populao. Entre-
tanto, muitas vezes, o pesquisador trabalha com tempo,
energia e recursos econmicos limitados, tornando poss-
vel a anlise de apenas parte do grupo de dados retirados
da populao. Esse grupo denomina-se amostra.
Neste captulo, sero apresentados os elementos im-
portantes relacionados ao processo de seleo da amos-
tra que far parte da pesquisa. Com o estudo da teoria da
amostragem, espera-se que o aluno conhea as diferentes
metodologias de seleo da amostra, bem como compre-
enda os procedimentos do clculo do tamanho mnimo de
uma amostra em uma pesquisa.
86Estatstica Aplicada

Frederick Mosteller, estatstico e professor em Harvard, dis-


se, certa vez, que possvel mentir usando estatsticas, mas
que se mente mais, e melhor, sem estatsticas. preciso en-
tender que as amostras podem levar a concluses erradas.
Contudo, as opinies pessoais, sem base em dados, levam,
em geral, a concluses muito mais erradas.

Amostragem o conjunto de procedimentos e tcnicas para


extrao de elementos da populao para compor a amostra.
O objetivo da amostragem obter amostras representativas
das populaes em estudo.

As tcnicas de amostragem se dividem em: probabilsti-


cas e no probabilsticas. As tcnicas probabilsticas so
aquelas em que todos os elementos da populao tm uma
probabilidade no nula de seleo. Nas tcnicas no proba-
bilsticas, no podemos garantir que todos os elementos tm
probabilidade de serem selecionados para a amostra.

Tcnicas de amostragem probabilsticas

Amostra Aleatria Simples


Uma amostra aleatria simples selecionada tal que todos
os elementos da populao tenham a mesma chance de
serem selecionados, por exemplo, por um sorteio.

Amostra Sistemtica
Uma amostra sistemtica poder ser tratada como uma
amostra aleatria simples se os elementos da populao
estiverem ordenados aleatoriamente, e a seleo ser re-
Captulo 6 Amostragem87

alizada por meio da escolha sistemtica, por exemplo, de


uma a cada cinco elementos.

Amostra Estratificada
Esta tcnica consiste em dividir a populao em subgrupos,
que so denominados estratos. Esses estratos devem ser
internamente mais homogneos do que a populao toda,
com respeito s variveis em estudo.

Amostra por conglomerados


Chamamos de conglomerado um agrupamento de elemen-
tos da populao. Por exemplo, numa populao de alunos
de uma escola, as turmas formam conglomerados de alunos.

Tcnicas de amostragem no
probabilsticas

Amostra por cotas


Nesta tcnica, a populao vista de forma segregada,
dividida em diversos subgrupos. Numa pesquisa socioeco-
nmica, por exemplo, a populao pode ser dividida por
faixas de renda, faixas de idade, nvel de instruo etc.

Amostra por julgamento


Os elementos escolhidos so aqueles julgados como tpi-
cos da populao que se deseja estudar.

Amostra por fluxo


Os elementos so selecionados a partir do fluxo destes em
determinado local. Por exemplo, considere uma pesquisa
88Estatstica Aplicada

referente opinio das pessoas sobre a administrao da


cidade. A amostra pode ser selecionada considerando o
fluxo das pessoas no centro de Porto Alegre.

As perguntas mais frequentes em relao ao tamanho m-


nimo da amostra podem ser resumidas em trs questes apre-
sentadas na figura 17.

Figura 17 Questes mais frequentes sobre o tamanho da amostra.

Nesse contexto, definir o tamanho mnimo da amostra


indispensvel para garantir a capacidade de o estudo respon-
der aos objetivos propostos considerando o rigor cientfico in-
dispensvel em qualquer pesquisa. importante observar que
no existe um tamanho de amostra predeterminado, ou seja,
cada pesquisa deve ser realizada considerando sua populao
e seus objetivos.

A determinao do tamanho amostral realizada mediante


frmulas estatsticas, conhecidas como frmulas para clculo
de tamanho de amostra que consideram alguns elementos im-
portantes apresentados na figura 18.
Captulo 6 Amostragem89

Figura 18 Elementos que devem ser considerados no clculo do tamanho


mnimo da amostra.

Determinao do tamanho mnimo da


amostra

Quando desejamos coletar uma amostra aleatria de dados


que ser utilizada para estimar uma mdia populacional ,
quantos valores amostrais devem ser obtidos? De acordo com
TRIOLA (2008), a determinao do tamanho de uma amostra
muito importante, pois amostras desnecessariamente gran-
90Estatstica Aplicada

des gastam tempo e dinheiro, e amostras muito pequenas po-


dem levar a resultados pobres.

No podemos evitar a ocorrncia do ERRO AMOSTRAL,


porm podemos limitar seu valor a partir da escolha de uma
amostra de tamanho adequado. Obviamente, o ERRO AMOS-
TRAL e o TAMANHO DA AMOSTRA seguem sentidos contrrios
(conforme apresentao da Figura 19, abaixo). Quanto maior
o tamanho da amostra, menor o erro cometido e vice-versa.

Figura 19 Relao entre o erro amostral e o tamanho da amostra.

Clculo do tamanho mnimo da amostra

A) PARA ESTIMAR UMA MDIA QUANDO A POPULA-


O CONHECIDA

Para estimarmos uma mdia, o clculo para o tamanho


mnimo de amostra necessita das seguintes informaes:

- Determinao do erro de estimao (e).


Captulo 6 Amostragem91

- Nvel de confiana desejado nos resultados (normalmente,


esse valor estipulado em 95%).

Valores de z para nveis de confiana estabelecidos e o


tamanho da amostra.

Nvel de confiana Valor tabela Z

90% 1,645

95% 1,960

99% 2,575

- Tamanho da populao de interesse do estudo (N).

A frmula utilizada :

Onde:

2 desvio-padro populacional elevado ao quadrado (vari-


ncia)

Z2 valor da tabela normal padro elevado ao quadrado

e2 erro mximo de estimao estabelecido pelo pesquisador

N tamanho da populao
92Estatstica Aplicada

Exemplo

Deseja-se determinar o tamanho mnimo de uma amostra


para estimar a mdia de gastos mensais em supermercado de
clientes que possuem o carto fidelidade, considerando um
erro mximo de estimao de 15 reais e uma confiabilidade
de 95%, o desvio-padro desse gasto sabido ser de 200 re-
ais. Considere que, ao todo, 6500 clientes possuem o carto
fidelidade.

Informaes do problema:
Deseja estimar a mdia de gastos mensais no supermercado.

N = 6.500 clientes (Populao)

Z = 1,96 (valor da tabela normal para uma confiana de 95%)


e = 15 reais (erro amostral)
= 200 reais (desvio-padro)
Captulo 6 Amostragem93

Para o valor final, recomenda-


se o arredondamento sempre
para o prximo nmero inteiro.
n = 619

Para essa pesquisa, deve-se investigar no mnimo 619


clientes.

Para o caso do desvio-padro ser desconhecido, deve-se utili-


zar uma estimativa desse valor com base em dados amostrais,
como por exemplo:

- A partir de um estudo piloto com base na primeira coleta


de, pelo menos, 31 valores amostrais selecionados aleato-
riamente, calcular o desvio-padro amostral.

- Por meio da utilizao do desvio-padro obtido em outra


pesquisa semelhante (caractersticas populacionais, men-
surao das variveis) da que est sendo realizada.

B) PARA ESTIMAR UMA MDIA QUANDO A POPULA-


O DESCONHECIDA

Para o caso do tamanho total da populao ser desconhecido,


ou ainda naqueles casos em que a populao infinita, pode-
remos utilizar a seguinte frmula para determinar o tamanho
mnimo da amostra:
94Estatstica Aplicada

Exemplo

Um Administrador de empresas deseja estimar a renda mdia


para o primeiro ano de trabalho em sua rea de atuao.
Quantos administradores devem ser selecionados, desejando
ter 95% de confiana em que a renda mdia amostral esteja a
menos de 20 reais da verdadeira renda mdia populacional?
Sabemos, por um estudo prvio, que o desvio-padro de
150 reais.

Devemos, portanto, obter uma amostra de, ao menos, 216


administradores que estejam no primeiro ano de trabalho, se-
lecionados aleatoriamente.

C) PARA ESTIMAR UMA PROPORO QUANDO A PO-


PULAO CONHECIDA

Outro parmetro estatstico cuja determinao afeta o ta-


manho da amostra a proporo populacional. A frmula
para clculo do tamanho da amostra para uma estimativa da
PROPORO POPULACIONAL (p) dada por:
Captulo 6 Amostragem95

Onde:
Z valor da distribuio normal (para 95% de confiana, z =
1,96)

p = proporo da caracterstica a ser estudada (quando no


sabemos essa proporo, utilizamos o valor de p = 50% ou
ainda p = 0,50)

N = tamanho da populao

e = erro mximo de estimao (normalmente, para pesquisas


na rea de administrao, utilizamos 5% - 0,05)

Exemplo 1

Vamos supor uma pesquisa com uma populao de 1450 as-


sinantes da NET; qual o tamanho mnimo que a amostra deve
ter considerando um erro mximo de estimao de 5%?

Informaes do problema:
Z 1,96 (para 95% de confiana, z = 1,96)

p = 0,50 (quando no sabemos essa proporo, utilizamos o


valor de p = 0,50)

N = 1.450

= 0,05
96Estatstica Aplicada

z 2 p (1 p ) N 1,96 2.0,50(1 0,50).1450


n= = =
( N 1)e 2 + z 2 p (1 p ) (1450 1).0,05 2 + 1,96 2.0,50(1 0,50)

3,84 0,25 1.450


n=
1449 0,0025 + 3,84 0,25

0,9604 1.450 1.392,58


n= = = 303,86
3,6225 + 0,9604 4,5829

Devemos, ento, investigar uma amostra de 304 assinantes


da NET.

D) PARA ESTIMAR UMA PROPORO QUANDO A PO-


PULAO DESCONHECIDA

Quando a populao desconhecida, utilizamos para es-


timar uma proporo a seguinte frmula:

Exemplo

Uma pequena indstria fabricante de gneros alimentcios


deseja realizar uma pesquisa em um supermercado de uma
Captulo 6 Amostragem97

regio de So Leopoldo com o objetivo de estimar a propor-


o de consumidores que preferem o leite embalado em sacos
plsticos. Qual deve ser o tamanho mnimo da amostra consi-
derando um nvel de confiana de 95% e um erro mximo de
estimao de 5%?

Informaes do problema:
Z 1,96 (para 95% de confiana, z = 1,96)

p = 0,50 (quando no sabemos essa proporo, utilizamos o


valor de p = 0,50)

= 0,05

Devemos, ento, investigar uma amostra de 385 consumi-


dores.
98Estatstica Aplicada

Recapitulando

A determinao do processo de amostragem e do tamanho


da amostra so decises muito importantes em qualquer pes-
quisa. Cabe sempre ao pesquisador procurar desenhar seu
planejamento amostral procurando reduzir o mximo possvel
a fonte de erros.

Dependendo da varivel principal a ser estimada e algu-


mas informaes a respeito da populao alvo da pesquisa,
podemos utilizar diferentes frmulas para determinar o tama-
nho mnimo da amostra.

Atividades: amostragem

Questo 1. Uma pesquisa planejada para determinar as


despesas mdicas anuais das famlias dos empregados de
uma grande empresa. A gerncia da empresa deseja ter 95%
de confiana de que a mdia da amostra est no mximo com
uma margem de erro de 50 reais da mdia real das despe-
sas mdicas familiares. Um estudo-piloto indica que o desvio-
-padro pode ser calculado como igual a 400 reais. Qual o
tamanho de amostra necessrio?

Questo 2. Um estudo deseja saber a proporo de eleitores


que se declaram indecisos em relao a certo candidato. Qual
Captulo 6 Amostragem99

dever ser o tamanho mnimo de amostra para uma confiana


de 95% e um erro mximo de estimao de 5%?

Questo 3. Uma grande loja de departamentos deseja reali-


zar uma pesquisa com seus clientes que possuem o carto da
loja. Ao todo, so 4500 clientes. Qual o tamanho da amostra
que deve ser adotado com um erro mximo de estimao de
5% e um nvel de confiana de 95%?

Questo 4. Um gerente de restaurante deseja estimar o tem-


po mdio que os clientes levam para realizar uma refeio.
Com base em estudos anteriores, sabe-se que o desvio-pa-
dro de 15 minutos. Utilizando uma confiana de 95% e um
erro mximo de 5 minutos, qual deve ser o tamanho mnimo
da amostra para esse estudo?

Questo 5. Uma pesquisa deseja estimar a proporo de


analfabetos em uma regio do interior do Brasil com uma con-
fiabilidade de 95% e com um erro de estimao mxi-
mo de 2,5%. Qual o tamanho da amostra a ser utilizada?

Gabarito atividades propostas

Questo 1. n = 245,8 246

Questo 2. n = 384,16 385


100Estatstica Aplicada

Questo 3. n = 354,01 355

Questo 4. n = 34,57 35

Questo 5. n = 1.536,64 1.537


Simone Echeveste

Captulo 7

Estimao

N
este captulo, sero trabalhados alguns conceitos im-
portantes a respeito de estimao pontual e intervalar.
Ser apresentado ao aluno a construo e a interpretao
de um Intervalo de Confiana, bem como a importncia
da informao fornecida por ele.
102Estatstica Aplicada

O aluno, ao final deste captulo, dever realizar estimaes


intervalares para parmetros como a mdia e a proporo a
partir da construo de intervalos de confiana, bem como
realizar a correta interpretao dos mesmos.

Ao realizar uma pesquisa, na grande maioria das vezes,


necessitamos conhecer algumas caractersticas da populao
por meio de informaes amostrais, ou seja, uma amostra
extrada da populao e, a partir da sua anlise, as in-
formaes obtidas so inferidas para toda a populao de
interesse.

A estimao o processo que consiste no uso de dados


da amostra (dados amostrais) para estimar valores de par-
metros populacionais desconhecidos, tais como mdia, desvio
padro, propores etc.

Estimao o processo pelo qual utilizamos um valor


amostral (estimador) com o objetivo de inferir o seu respec-
tivo valor populacional (parmetro).

IMPORTANTE:

A mdia populacional estimada por .


O desvio-padro populacional estimado por s.
A proporo populacional p estimada por p.
Captulo 7 Estimao103

Estimao por ponto e por


intervalos de confiana

A estimao pontual, ou por ponto de um parmetro, ocorre


sempre que calculamos alguma estatstica utilizando apenas a
aplicao da frmula de seu estimador. Nesse tipo de estima-
tiva a informao fornecida composta por um nico valor.

Quando calculamos, por exemplo, o salrio mdio de um


grupo de pessoas e chegamos ao resultado = 3.250 reais,
estamos estimando que, em mdia, essas pessoas tenham um
salrio de 3.250 reais. Observe que nossa estimativa pontu-
al, ou seja, feita utilizando apenas um nico valor.

J a estimao intervalar consiste na determinao de um


intervalo de valores do qual, com certa confiana (probabilida-
de), esteja contido o parmetro desconhecido, utilizando, para
isso, a informao obtida com o seu estimador. A utilizao
de intervalos de confiana uma alternativa sempre muito in-
teressante no processo de estimao, pois permite determinar
o erro mximo de estimao cometido com certa confiana
preestabelecida.

Intervalo de confiana para mdia

Ao construir um Intervalo de Confiana para uma mdia, de-


sejamos estabelecer um intervalo de valores com uma proba-
bilidade preestabelecida, considerando a estimativa da mdia
( ) corrigida pelo erro de estimao ().
104Estatstica Aplicada

Destaca-se aqui que a varivel analisada (x) deve apresen-


tar distribuio aproximadamente normal para que se possa
realizar esse procedimento de estimao intervalar.

Figura 20 Representao do Intervalo de Confiana 95% para a mdia.

Duas situaes so consideradas quando desejamos estabe-


lecer um Intervalo de Confiana para a mdia populacional :

) Quando o desvio-padro conhecido.


1
2) Quando o desvio-padro desconhecido.

Seja X uma varivel aleatria que apresenta distribuio


normal com desvio-padro desconhecido, o Intervalo de
Confiana para a mdia pode ser assim determinado:

Ateno!
= mdia amostral
= erro de estimao
Onde:
t = valor tabelado tabela t-student
s = desvio-padro amostral
n = tamanho da amostra

Captulo 7 Estimao105

Observe que, nesse intervalo, utilizaremos a distribuio t-


-student que uma distribuio muito semelhante distribui-
o normal e utilizada em casos de pequenas amostras ou
ainda quando desconhecido. A tabela t-student apresenta-
da abaixo possui ( n 1) graus de liberdade:

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010

1 12,706 31,821 63,656

2 4,303 6,965 9,925


3 3,182 4,541 5,841
4 2,776 3,747 4,604
5 2,571 3,365 4,032
6 2,447 3,143 3,707
7 2,365 2,998 3,499
8 2,306 2,896 3,355
9 2,262 2,821 3,250
10 2,228 2,764 3,169
11 2,201 2,718 3,106
12 2,179 2,681 3,055
13 2,160 2,650 3,012
14 2,145 2,624 2,977
15 2,131 2,602 2,947
16 2,120 2,583 2,921
17 2,110 2,567 2,898
106Estatstica Aplicada

18 2,101 2,552 2,878


19 2,093 2,539 2,861
20 2,086 2,528 2,845
21 2,080 2,518 2,831
22 2,074 2,508 2,819
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
60 2,000 2,390 2,660
99 1,984 2,365 2,626
100 1,984 2,364 2,626
120 1,980 2,358 2,617
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576
Captulo 7 Estimao107

Exemplo 1

Em um estudo realizado com uma amostra de 25 clientes in-


vestidores de um banco, verificou-se uma idade mdia desses
clientes de 54,7 anos com um desvio-padro de 5,2 anos.
Construa o Intervalo de Confiana (IC) 95% para a verdadeira
idade mdia de todos os clientes investidores desse banco.

Dados do Problema:
Varivel (x) Idade (em anos)

Amostra (n) = 25 clientes

= 54,7 anos

s = 5,2 anos

t = 2,064 (veja na pgina a seguir como encontrar esse valor)

Intervalo de Confiana 95%


108Estatstica Aplicada

= 2,1466

[ ]

[54,7 2,15]

[54,7 2,15 a 54,7+ 2,15]

[52,55 a 56,85]

Interpretao: Estima-se, com 95% de confiana, que


a verdadeira idade mdia desses clientes seja um valor entre
52,55 anos e 56,85 anos.

Como encontrar o valor de T na tabela


T-student

Na tabela t, devemos considerar duas informaes impor-


tantes: a linha e a coluna em que o valor se encontra. Na
linha, temos os graus de liberdade (gl) que correspondem sem-
pre ao tamanho da amostra menos 1 (n-1), e na coluna deve-
mos observar o nvel de confiana do intervalo desejado.

No exemplo acima, o tamanho da amostra 25 e o Inter-


valo de Confiana solicitado 95%, ento devemos olhar na
tabela a linha 25 1 = 24 e a coluna que corresponde ao IC
95%:
Captulo 7 Estimao109

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
1 12,706 31,821 63,656
2 4,303 6,965 9,925
3 3,182 4,541 5,841
4 2,776 3,747 4,604
5 2,571 3,365 4,032
6 2,447 3,143 3,707
7 2,365 2,998 3,499
8 2,306 2,896 3,355
9 2,262 2,821 3,250
10 2,228 2,764 3,169
11 2,201 2,718 3,106
12 2,179 2,681 3,055
13 2,160 2,650 3,012
14 2,145 2,624 2,977
15 2,131 2,602 2,947
16 2,120 2,583 2,921
17 2,110 2,567 2,898
18 2,101 2,552 2,878
19 2,093 2,539 2,861
20 2,086 2,528 2,845
21 2,080 2,518 2,831
22 2,074 2,508 2,819
23 2,069 2,500 2,807
24 2,064 2,492 2,797

O valor de t, ento, para esse exemplo, de 2,064.

t = 2,064
110Estatstica Aplicada

Exemplo 2

Em uma central 0800 de atendimento a dvidas sobre os pro-


dutos de um empresa, foi registrado, em uma amostra de 15
dias, uma mdia de 53 atendimentos ao dia com um desvio-
-padro de 4 atendimentos. Obtenha o Intervalo de Confiana
95% para a verdadeira mdia de atendimentos dirios recebi-
dos por essa central.

Dados do Problema:
Varivel (x) Nmero de atendimentos realizados ao dia

Amostra (n) = 15 dias

= 53 atendimentos

s = 4 atendimentos

t = 2,145 (procurar na tabela - linha 14 e coluna IC95%)

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
1 12,706 31,821 63,656
2 4,303 6,965 9,925
3 3,182 4,541 5,841
4 2,776 3,747 4,604
5 2,571 3,365 4,032
6 2,447 3,143 3,707
7 2,365 2,998 3,499
8 2,306 2,896 3,355
9 2,262 2,821 3,250
Captulo 7 Estimao111

10 2,228 2,764 3,169


11 2,201 2,718 3,106
12 2,179 2,681 3,055
13 2,160 2,650 3,012
14 2,145 2,624 2,977
15 2,131 2,602 2,947
16 2,120 2,583 2,921
17 2,110 2,567 2,898

Intervalo de Confiana 95%

= 2,22

[53 2,22]

[53 2,22 a 53 + 2,22]

[50,78 a 55,22]

Interpretao: Estima-se, com 95% de confiana, que o


verdadeiro nmero mdio de atendimentos realizados por essa
central seja um valor entre 50,78 e 55,22 atendimentos ao
dia.
112Estatstica Aplicada

Intervalo de confiana para proporo p

Seja p a proporo de ocorrncia de algum evento de inte-


resse em uma populao, o Intervalo de Confiana para uma
proporo da populao pode ser definido como:

Figura 21 Representao do Intervalo de Confiana 95% para a


proporo.

Ateno!
p = proporo observada na amostra
e = erro de estimao
z = valor tabelado tabela normal
n = tamanho da amostra

Os valores de Z (normal-padro) podem ser obtidos na


tabela t com infinitos graus de liberdade. Valores tpicos:
Captulo 7 Estimao113

z0,05= 1,645 (IC 90%)

z0,025 = 1,96 (IC 95%)

z0,005 = 2,576 (IC 99%)

Exemplo

Num depsito, uma amostra de 230 latas de certo produto ali-


mentar armazenadas para serem distribudas foram verificadas
constatando-se que 12 j ultrapassaram o prazo de validade.
Construa e interprete o Intervalo de confiana 95% para a pro-
poro verdadeira de latas que j ultrapassaram o prazo de
validade.

Dados do Problema:
Proporo investigada proporo de latas com prazo de va-
lidade vencido

Amostra (n) = 230 latas

Verifique que, de acordo com o enunciado do problema


das 230 latas, 12 ultrapassaram o prazo de validade.

z = 1,96 (valor obtido a partir da normal padro de acordo


com os valores de z apresentada na pgina anterior)
114Estatstica Aplicada

Intervalo de Confiana 95%

Aps o intervalo construdo,


multiplique os valores obti-
dos por 100 para apresentar
o intervalo em percentual.

Interpretao: Estima-se, com 95% de confiana, que a


verdadeira proporo de latas que j ultrapassaram o prazo de
validade seja um valor entre 2,35% a 8,09%.

Recapitulando

A Estimao o processo pelo qual utilizamos um valor amos-


tral (estimador) com o objetivo de inferir o seu respectivo valor
populacional (parmetro), podendo ser realizada de duas for-
mas: estimativa pontual ou estimativa intervalar.
Captulo 7 Estimao115

A estimao intervalar construda a partir do clculo


do estimador de interesse ajustado a um erro de estimao,
corresponde a uma alternativa sempre muito interessante no
processo de estimao, pois permite ao pesquisador conside-
rar em uma estimativa pontual o erro de estimao que pode
ocorrer nesse valor.

Atividades: Estimao

Questo 1. Um determinado Instituto de Pesquisa investigou


uma amostra de 400 Administradores a respeito do tempo que
levaram para obter seus diplomas. A mdia obtida foi de 4,5
anos com um desvio-padro de 0,5 anos. Com base nesses
dados amostrais, construa um intervalo de 95% de confiana
para o verdadeiro tempo mdio gasto por todos os Adminis-
tradores para obter seus diplomas.

Questo 2. Uma amostra de 539 lares de certa cidade foi


selecionada e determinou-se que em 133 deles havia, pelo
menos, uma arma de fogo. Usando um nvel de confiana de
95%, calcule o Intervalo de Confiana para a verdadeira pro-
poro de lares com, pelo menos, uma arma de fogo.

Questo 3. Para estimar o tempo mdio de atendimento em


um restaurante do tipo fast-food, um pesquisador anotou o
tempo gasto por 40 garonetes para completar um pedido-
-padro (consistindo de 1 hambrguer, uma poro de fritas e
uma bebida). As garonetes levaram, em mdia, 4,3 minutos
com um desvio-padro de 2,4 minutos para completar os pe-
116Estatstica Aplicada

didos. Construa o Intervalo de Confiana 95% para o verda-


deiro tempo mdio necessrio para completar um pedido-
-padro.

Questo 4. Quarenta e uma pessoas, de uma amostra alea-


tria de 500 trabalhadores, esto desempregadas. Calcule um
Intervalo de Confiana 95% para essa proporo.

Questo 5. Para avaliar o peso mdio de uma nova safra de


limes, o administrador de uma fazenda obteve os pesos de
50 limes novos, encontrando uma mdia de 115,5 gramas,
com um desvio-padro de 20,4 gramas. Construa e interprete
confiana 95% para o verdadeiro peso mdio dos limes.

Gabarito das atividades propostas

Questo 1. R: [4,45 anos a 4,51 anos].

Questo 2. R: [21,03% a 28,31%].

Questo 3. R: [3,56 minutos a 5,04 minutos].

Questo 4. R: [5,8% a 10,6%].

Questo 5. R: [109,85 gramas a 121,15 gramas].


Simone Echeveste

Captulo 8

Testes de Hipteses

N
este captulo, estudaremos uma importante ferramen-
ta de anlise estatstica muito utilizada na rea da Ad-
ministrao que o Teste de Hipteses. Essa ferramenta
permite ao pesquisador verificar se uma afirmao sobre
um parmetro (mdia) pode ser aceita para toda a popu-
lao ou no.
Ao final deste captulo, o aluno dever identificar os ti-
pos de problemas que podem ser analisados por meio de
um teste de hipteses, compreender todos os passos que
compem a realizao deste, bem como concluir sobre os
resultados obtidos.
118Estatstica Aplicada

Em algumas situaes de pesquisa, existe um particular inte-


resse em decidir sobre a verdade ou no de uma hiptese
especfica (se dois grupos tm a mesma mdia ou no, ou se o
parmetro populacional tem um valor em particular ou no).
Na Estatstica, quando falamos em hipteses, referimo-nos a
uma afirmao a respeito de um parmetro, como a mdia ou
o desvio-padro, por exemplo.

Nesse caso, precisamos de ferramentas que permitam tes-


tar se uma afirmao aceita ou rejeitada, tendo como base
as informaes obtidas em uma amostra. O Teste de hip-
teses viabiliza uma estrutura para que faamos isto; ele til
quando desejamos verificar a alegao (afirmao) feita sobre
um parmetro (mdia ou proporo).

Exemplos:
O lucro mdio mensal da empresa de 500 mil reais.
As vendas mdias da loja A so superiores s da loja B.
O tempo mdio de entrega da mercadoria de 7 dias.

Um teste de hipteses deve considerar alguns passos im-


portantes na sua realizao. Iniciamos com a determinao
da hiptese a ser investigada, ou ainda com o efeito que de-
sejamos comprovar; este deve se referir a algum parmetro
populacional como a mdia ou a proporo, por exemplo.

A hiptese estabelecida comparada aos resultados obti-


dos considerando uma pesquisa realizada com uma amostra
de n elementos. As informaes obtidas com os estimadores
dos parmetros de interesse adicionadas a alguns elementos
Captulo 8 Testes de Hipteses119

de probabilidade permitiro ao pesquisador decidir se a hip-


tese verdadeira ou no.

Figura 22 Elementos de um Teste de Hipteses.

Em geral, estipula-se um nvel de 5%. O valor da proba-


bilidade de se obter o efeito observado, dado que a hiptese
nula verdadeira, chamado de p-valor. Se o valor do p-valor
for menor que o nvel de significncia estipulado (normalmente
de 5%), assume-se o erro tipo I e rejeita-se a hiptese nula. Ao
contrrio, se o p-valor for maior, no assumido o erro tipo I
e se aceita a hiptese nula.

Os testes podem rejeitar ou aceitar a hiptese nula e, nessa


deciso, podem ocorrer dois possveis tipos de erros conforme
demonstra a Figura 20:
120Estatstica Aplicada

Figura 23 Tipos de Erros em um Teste de Hipteses.

Em um teste de hipteses, obviamente desejvel que se


reduza ao mnimo as probabilidades e dos dois tipos de
erros. A reduo simultnea dos erros ocorre sempre
quando aumentamos o tamanho da amostra.

Componentes de um teste de hipteses

Hipteses de pesquisa
O primeiro passo consiste em formular hipteses sobre a afir-
mao de estudo. As hipteses estatsticas sempre comparam
dois ou mais parmetros e podem ser classificadas em dois
tipos:

Hiptese Nula (H0) estabelece a ausncia de diferen-


a entre os parmetros. sempre representada por uma
igualdade.
Captulo 8 Testes de Hipteses121

Hiptese Alternativa (H1) a hiptese contrria


H0; geralmente, a hiptese que o pesquisador quer ver
confirmada. Pode representar simplesmente uma desi-
gualdade, ou ainda a ideia de superioridade/inferiori-
dade.
- O tempo mdio de entrega da mercadoria de 7 dias.

H0 : m = 7 dias
H1 : 7 dias

- A quantidade mdia de peas defeituosas do fabricante A


superior a do fabricante B.

H0 : A = B
H1 : A > B

Estatstica do teste

A estatstica do teste um valor calculado com as informaes


provenientes da amostra e, posteriormente, utilizado para se
tomar a deciso sobre a aceitao ou rejeio da hiptese
nula (H0).
122Estatstica Aplicada

Regra de deciso

Se o valor da estatstica do teste localiza-se na regio crti-


ca, rejeitamos a hiptese (nula) H0, pois existe uma forte evi-
dncia amostral de sua falsidade. Ao contrrio, aceitamos H0,
concluindo que no existe evidncia amostral significativa para
sua rejeio.

Concluso experimental

Aps a regra de deciso, o teste deve ter uma concluso expe-


rimental na qual o pesquisador, de acordo com o contexto do
problema, finalizar a sua anlise descrevendo os resultados
obtidos.

Figura 24 Etapas de um teste de hipteses.


Captulo 8 Testes de Hipteses123

Teste de hipteses para uma mdia


(Teste T Student)

O objetivo desse teste comparar os valores obtidos em uma


amostra com uma mdia estabelecida como referncia.

Hipteses

Ho: = 0 (referncia)
Ha: 0 (referncia)

Estatstica do teste
Onde: = mdia da amostra
X o 0 = valor de referncia
t cal =
s s = desvio-padro da amostra
n n = tamanho da amostra

Regra de deciso

Na regra de deciso, devemos considerar que a varivel ana-


lisada tenha distribuio aproximadamente normal. Nesse
caso, a partir dos valores da tabela t-student, iremos definir os
pontos de corte na regra de deciso, ou seja, a partir de que
ponto inicia e termina a regio crtica (regio de rejeio).

A regra estabelece que, se o valor calculado na estatstica


do teste for um valor localizado na regio de aceitao, de-
veremos ento aceitar a hiptese nula H0 que representa a
deciso de que a diferena encontrada nos dados amostrais
com os parmetros populacionais NO significativa.
124Estatstica Aplicada

Para o caso do valor calculado na estatstica estar locali-


zado na regio crtica, deveremos ento rejeitar a hiptese
nula H0 que representa a deciso de que SIM, existe diferena
significativa dos dados amostrais com os parmetros popula-
cionais.

Figura 25 Regra de deciso.

Como obter o valor tabelado da Regra de


Deciso
Utilizaremos aqui o valor da tabela t-student, da mesma forma
como j fizemos para a construo dos Intervalos de Confian-
a, utilizando a mesma tabela. A linha a ser utilizada corres-
ponde aos graus de liberdade, obtidos a partir do tamanho
da amostra investigada menos 1 (n 1). J a coluna corres-
ponder ao nvel de significncia desejado do teste (p-value)
que corresponde ao erro do teste normalmente esse nvel de
significncia estabelecido em no mximo 5%.
Captulo 8 Testes de Hipteses125

Nvel de significncia do teste

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
1 12,706 31,821 63,656
2 4,303 6,965 9,925
3 3,182 4,541 5,841
4 2,776 3,747 4,604
5 2,571 3,365 4,032
6 2,447 3,143 3,707
7 2,365 2,998 3,499
8 2,306 2,896 3,355
9 2,262 2,821 3,250
10 2,228 2,764 3,169
11 2,201 2,718 3,106
12 2,179 2,681 3,055
13 2,160 2,650 3,012
14 2,145 2,624 2,977
15 2,131 2,602 2,947
16 2,120 2,583 2,921
17 2,110 2,567 2,898
18 2,101 2,552 2,878
19 2,093 2,539 2,861

Exemplo 1

Uma fbrica de mveis afirma que o tempo mdio de entrega


de seus produtos vendidos de 18 dias. Para verificar essa
afirmao, uma amostra de 30 pedidos dessa empresa foi
analisada, verificando-se um tempo mdio de entrega de 17,8
126Estatstica Aplicada

dias com um desvio-padro de 5,6 dias. Analise os dados e


conclua ao nvel de significncia de 5%.

Passo 1 Dados do Problema


Varivel (x) = Tempo de entrega dos produtos (dias)
0 = 18 dias (valor de referncia)
n = 30 pedidos (tamanho da amostra)
= 17,8 dias (mdia da amostra)
s = 5,6 dias (desvio-padro da amostra)
= 0,05 (nvel de significncia do teste: p = 5%)

Passo 2 Hipteses de Pesquisa

H0 : = 18 dias
H1 : 18 dias

Passo 3 Clculo da Estatstica do Teste

Passo 4 Regra de Deciso


Vamos agora identificar o valor tabelado a ser utilizado na
Regra de Deciso: A amostra dessa pesquisa foi de 30 televi-
sores, ento o grau de liberdade (n-1) 30 1 = 29 (linha 29
da tabela t). O nvel de significncia estabelecido no problema
Captulo 8 Testes de Hipteses127

de 5% ento a coluna a ser utilizada da tabela a que


corresponde 0,05.

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
18 2,101 2,552 2,878
19 2,093 2,539 2,861
20 2,086 2,528 2,845
21 2,080 2,518 2,831
22 2,074 2,508 2,819
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
60 2,000 2,390 2,660
99 1,984 2,365 2,626
100 1,984 2,364 2,626
120 1,980 2,358 2,617
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576

O valor de t tabelado ento 2,045 esse valor deter-


minar na regra de deciso os limites da regio crtica.
128Estatstica Aplicada

Regra de Deciso

A regra estabelecida : se o valor da estatstica do teste for


SUPERIOR a +2,045 ou INFERIOR a -2,045, nossa deci-
so ser REJEITAR H0, ou seja, h diferena significativa entre
os valores observados na amostra com o valor estabelecido
como referncia.

J se o valor da estatstica do teste estiver ENTRE -2,045


e +2,045, nossa deciso ser de ACEITAR H0, o que implica
na existncia de uma diferena NO significativa entre os va-
lores da amostra com a referncia.

Para o nosso exemplo, o valor da estatstica do teste foi de


t = -0,196.
Captulo 8 Testes de Hipteses129

Esse valor (t = -0,196) est localizado, na nossa regra de


deciso, dentro da regio de aceitao ento nossa deciso
ser ACEITAR H0.

Ao aceitar a hiptese nula H0, estaremos aceitando a se-


guinte afirmao:

H0 : = 18 dias

No contexto do problema, estaremos ento aceitando que


o tempo mdio de entrega dos produtos dessa fbrica de m-
veis no difere significativamente de 18 meses, ou seja, a dife-
rena encontrada em relao a esse tempo mdio na amostra
NO FOI SIGNIFICATIVA.

Passo 5 Concluso

Na concluso, escreveremos um pargrafo referente ao re-


sultado final do teste de hipteses:
130Estatstica Aplicada

Verifica-se, a partir do teste estatstico realizado, ao nvel


de significncia de 5%, que o tempo mdio de entrega dos
produtos no difere significativamente de 18 meses.

Exemplo 2

Uma indstria alimentcia produz determinado tipo de po,


cujo peso mdio deve ser de 190 gramas. Devido a mudan-
as na poltica cambial, que ocasionou aumento no preo do
trigo, alguns ingredientes da receita foram substitudos. Uma
equipe do controle de qualidade dessa indstria resolveu ve-
rificar se o peso do produto aumentou e escolheu, aleatoria-
mente, 200 unidades, medindo o peso de cada uma. O peso
mdio obtido da amostra foi de 182 gramas com um desvio-
-padro de 12 gramas. Analise os dados e conclua ao nvel de
significncia de 5%.

Passo 1 Dados do Problema

Varivel (x) = Peso do po (gramas)


0 = 190 gramas (valor de referncia)
n = 200 pes (tamanho da amostra)
= 182 gramas (mdia da amostra)
s = 12 gramas (desvio-padro da amostra)
= 0,05 (nvel de significncia do teste: p = 5%)

Passo 2 Hipteses de Pesquisa

H0 : = 190 gramas
H1 : 190 gramas
Captulo 8 Testes de Hipteses131

Passo 3 Clculo da Estatstica do Teste

Passo 4 Regra de Deciso

A amostra dessa pesquisa foi de 200 pes televisores, en-


to o grau de liberdade (n-1) 200 1 = 199 (no temos
na tabela a linha 199, ento usaremos a mais prxima, nesse
caso, a linha 200). O nvel de significncia estabelecido no
problema de 5% ento a coluna a ser utilizada da tabela
a que corresponde 0,05.

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
18 2,101 2,552 2,878
19 2,093 2,539 2,861
20 2,086 2,528 2,845
21 2,080 2,518 2,831
22 2,074 2,508 2,819
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
132Estatstica Aplicada

30 2,042 2,457 2,750


39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
60 2,000 2,390 2,660
99 1,984 2,365 2,626
100 1,984 2,364 2,626
120 1,980 2,358 2,617
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576

O valor de t tabelado ento 1,972 esse valor deter-


minar na regra de deciso os limites da regio crtica.

Regra de Deciso

Para o nosso exemplo, o valor da estatstica do teste foi: t


= -9,41.
Captulo 8 Testes de Hipteses133

Esse valor (t = -9,41) est localizado, na nossa regra de


deciso, FORA da regio de aceitao, ou ainda, ele se loca-
liza na REGIO CRTICA ento nossa deciso ser REJEI-
TAR H0.

H0 : = 190 gramas
H1 : 190 gramas

Ao rejeitar a hiptese nula H0, estaremos concordando


com a afirmao feita em H1:

H1 : 190 gramas

No contexto do problema, estaremos ento concluindo que


os pes tm um peso mdio DIFERENTE de 190 gramas, ou
seja, a diferena encontrada em relao a esse peso mdio na
amostra FOI SIGNIFICATIVA. Como essa diferena foi signifi-
cativa, poderemos observar, na amostra, que o peso encontra-
do de 182 gramas INFERIOR ao peso de referncia 190
gramas.

Passo 5 Concluso

Verifica-se, a partir do teste estatstico realizado, ao nvel


de significncia de 5%, que o peso mdio dos pes aps
a substituio de alguns ingredientes significativamente
DIFERENTE de 190 gramas. Observa-se, ao analisar os
resultados da amostra, que esse peso significativamente
INFERIOR a 190 gramas.
134Estatstica Aplicada

Teste de hipteses para comparao entre


duas mdias (T-student para duas amostras)

Esse teste muito semelhante ao anteriormente visto. Porm


aqui no teremos um valor de referncia a ser comparado,
mas sim duas amostras provenientes de dois grupos distintos;
e o objetivo aqui comparar as mdias dessas duas amostras
independentes, verificando se existe ou no diferena signifi-
cativa entre elas.

Cada um dos grupos investigados (ou amostras investiga-


das) gera suas estatsticas descritivas que devero ser utilizadas
no clculo da estatstica do teste: tamanho da amostra (n),
mdia amostral ( ) e desvio-padro amostral (s).

Grupo 1 Grupo 2

Hipteses:

As hipteses so estabelecidas a partir da comparao da


mdia dos grupos. Na hiptese nula H0, novamente teremos a
ausncia de diferena significativa, ou seja, a mdia do grupo
1 igual a mdia do grupo 2. J a hiptese alternativa H1
Captulo 8 Testes de Hipteses135

indica que EXISTE diferena significativa entre as mdias dos


grupos 1 e 2.

Estatstica do teste

Onde:

1
= Mdia do grupo 1

2
= Mdia do grupo 2
s12 = varincia do grupo 1 (desvio-padro ao quadrado)
s12 = varincia do grupo 2 (desvio-padro ao quadrado)
n1 = tamanho de amostra do grupo 1
n2 = tamanho de amostra do grupo 2

Regra de deciso
A regra de deciso para esse teste praticamente a mesma do
teste anterior. Porm, a nica diferena refere-se aos graus de
liberdade que agora, como teremos dois grupos, ser: (n1 +
n2 2), ou seja, deve-se somar os tamanhos de amostra dos
dois grupos e subtrair dois.
136Estatstica Aplicada

Exemplo 1

Uma empresa fabricante de telefones celulares afirma que a


durao mdia em horas (em stand by) da sua bateria supe-
rior durao das concorrentes. Duas amostras formadas por
40 baterias desse fabricante e 40 do concorrente apresenta-
ram mdias iguais a 65 e 60 horas, com um desvio-padro de
2 e 3 horas, respectivamente. Seria possvel supor que a ba-
teria da empresa do fabricante tenha significativamente maior
durao? Considere um nvel de significncia de 5%.

Passo 1 Dados do Problema

Varivel (x) = Tempo de durao da bateria (horas)


Grupo 1 Fabricante Grupo 2 Concorrente
1
= 65 horas
2
= 60 horas
s12 = (2 horas)2
s12 = (3 horas)2
n1 = 40
n2 = 40
= 0,05 (nvel de significncia do teste: p = 5%)

Passo 2 Hipteses de Pesquisa


Captulo 8 Testes de Hipteses137

Passo 3 Clculo da Estatstica do Teste

Passo 4 Regra de Deciso

A tabela a ser utilizada a mesma tabela do teste anterior.


Na linha, vamos obter os graus de liberdade (gl), considerando
a soma dos dois tamanhos de amostra dos grupos menos 2:

Gl: (n1+n2 2) = (40+40 - 2) = 78 (Na tabela, no temos


linha 78, ento iremos para a mais prxima que a linha 60).

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
29 2,045 2,462 2,756
30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
138Estatstica Aplicada

49 2,010 2,405 2,680


50 2,009 2,403 2,678
59 2,001 2,391 2,662
60 2,000 2,390 2,660
99 1,984 2,365 2,626
100 1,984 2,364 2,626
120 1,980 2,358 2,617
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576

O valor de t tabelado ento 2,000 esse valor deter-


minar na regra de deciso os limites da regio crtica.

Regra de Deciso

Para o nosso exemplo, o valor da estatstica do teste foi: t


= 8,77.

Esse valor (t = 8,77) est localizado, na nossa regra de de-


ciso, FORA da regio de aceitao, ou ainda, ele localiza-se
na REGIO CRTICA ento nossa deciso ser REJEITAR H0.
Captulo 8 Testes de Hipteses139

Ao rejeitar a hiptese nula H0, estaremos concordando


com a afirmao feita em H1:

H1 : 1 2

No contexto do problema, estaremos ento concluindo que


os grupos de celulares (fabricante e concorrente) tm um tem-
po mdio de durao da bateria DIFERENTE um do outro, ou
seja, a diferena encontrada em relao a esse tempo m-
dio de durao na amostra investigada FOI SIGNIFICATIVA.
Como essa diferena foi significativa, poderemos observar na
amostra que o tempo mdio de durao do fabricante (65
horas) SUPERIOR ao tempo mdio de durao do concor-
rente (60 horas).

Passo 5 Concluso

Verifica-se, a partir do teste estatstico realizado, ao nvel


de significncia de 5%, que o tempo mdio de durao da
bateria significativamente DIFERENTE entre os dois gru-
pos de estudo (fabricante e concorrente). Observa-se, ao
analisar os resultados da amostra, que esse tempo mdio
significativamente SUPERIOR para o fabricante.
140Estatstica Aplicada

Exemplo 2

Duas tcnicas de venda so aplicadas em dois grupos de ven-


dedores com o objetivo de verificar se alguma delas mais efi-
caz que a outra. Foi observado o Nmero de unidades vendi-
das no perodo de uma semana. Os dados observados foram:

Tcnica de venda N Vendedores Venda Diria Mdia Desvio-Padro

Tcnica A 20 76 unidades 9 unidades

Tcnica B 25 78 unidades 8 unidades

Analise esses dados a um nvel de significncia de 5%.

Passo 1 Dados do Problema

Varivel (x) = venda diria (unidades)


Grupo 1 Tcnica de vendas A Grupo 2 Tcnica de vendas B
1
= 76 unidades
2
= 78 unidades
s12 = (9 unidades)2
s12 = (8 unidades)2
n1 = 20
n2 = 25
= 0,05 (nvel de significncia do teste: p = 5%)
Captulo 8 Testes de Hipteses141

Passo 2 Hipteses de Pesquisa

Passo 3 Clculo da Estatstica do Teste

Passo 4 Regra de Deciso

Gl: (n1+n2 2) = (20 + 25 - 2) = 43 (Na tabela, no te-


mos linha 43, ento iremos para a mais prxima que a linha
40).

Tabela de valores crticos da distribuio t de Student.


Gl (n-1) IC 95% IC 98% IC 99%
0,050 0,020 0,010
18 2,101 2,552 2,878
23 2,069 2,500 2,807
24 2,064 2,492 2,797
25 2,060 2,485 2,787
26 2,056 2,479 2,779
27 2,052 2,473 2,771
28 2,048 2,467 2,763
142Estatstica Aplicada

29 2,045 2,462 2,756


30 2,042 2,457 2,750
39 2,023 2,426 2,708
40 2,021 2,423 2,704
49 2,010 2,405 2,680
50 2,009 2,403 2,678
59 2,001 2,391 2,662
200 1,972 2,345 2,601
infinito 1,960 2,326 2,576

O valor de t tabelado ento 2,021 esse valor deter-


minar na regra de deciso os limites da regio crtica.

Regra de Deciso

Para o nosso exemplo, o valor da estatstica do teste foi: t


= 0,78.

Esse valor (t = 0,78) est localizado, na nossa regra de


deciso, DENTRO da regio de aceitao, ou ainda, ele lo-
Captulo 8 Testes de Hipteses143

caliza-se na REGIO DE ACEITAO ento nossa deciso


ser ACEITAR H0.

Ao aceitar a hiptese nula H0, estaremos concordando com


a afirmao feita em H0:

H1: 1 = 2

No contexto do problema, estaremos ento concluindo que


no existe diferena significativa para as vendas mdias entre
as tcnicas de venda A e B.

Passo 5 Concluso

Verifica-se, a partir do teste estatstico realizado, ao nvel


de significncia de 5%, que no existe diferena significativa
para as vendas mdias entre as tcnicas de venda A e B.

Recapitulando

Os Testes de hipteses fornecem ao pesquisador uma fer-


ramenta til na comprovao ou no de hipteses feitas sobre
um parmetro (mdia ou proporo). Trata-se de uma com-
provao cientfica da existncia de diferenas significativas a
partir da anlise de resultados provenientes de amostras com
parmetros populacionais.
144Estatstica Aplicada

Atividades: Testes de hipteses

Questo 1. O tempo de deslocamento de Porto Alegre at


So Leopoldo, antes das obras da copa, apresentava uma m-
dia de 40 minutos. Atualmente, devido s obras em andamen-
to, uma amostra de 50 indivduos que realizaram esse traje-
to apresentou uma mdia de tempo de 70 minutos com um
desvio-padro de 5 minutos. Analise os dados e conclua ao
nvel de significncia de 5% se houve um aumento significativo
nesse tempo mdio de deslocamento.

Questo 2. Foi feita uma comparao salarial entre profis-


sionais de determinada categoria que atuam nos setores pbli-
co e privado. Foram investigados 45 profissionais do setor p-
blico, encontrando-se mdia de R$ 1220, com desvio-padro
de R$ 240. Entre 28 profissionais do setor privado, a mdia foi
de R$ 1470, com desvio-padro de R$ 270. Usando 5% de
significncia, analise e conclua sobre esses dados.

Questo 3. A industrial ABC S.A., fabricante de determina-


do equipamento eletrnico, procedeu substituio de cer-
to componente importado pelo similar nacional. Um grande
comprador da referida indstria supe que tal substituio te-
nha diminudo a durao do produto que antes era anunciada
como sendo, em mdia, de 210 horas. Para julgar a aceita-
bilidade de sua suposio, o comprador testou uma amostra
de 100 unidades, verificando um tempo mdio de durao de
197 horas com um desvio-padro de 16 horas. Fixado o nvel
de significncia de 5%, conclua sobre o caso.
Captulo 8 Testes de Hipteses145

Automvel n Mdia de consumo Desvio-padro

Colossal 12 unidades 14 km/l 2 km/l

XP15 10 unidades Km/l 4 km/l

Questo 4. O dono de uma empresa de entregas e mudan-


as possui uma frota de automveis e est interessando em
testar duas marcas de pneus radiais. Os dados em km rodados
at o desgaste do pneu para uma amostra de 25 unidades do
pneu A e 25 unidades do pneu B so:

Pneu A : Mdia: 38500 km; Desvio-padro: 1200 km

Pneu B : Mdia 36700 km; Desvio-padro: 960 km

A partir desses dados, foi realizado o teste t-student de


comparao de duas mdias, resultando um valor de estats-
tica do teste t = 5,86. Ao analisar esses dados, ao nvel de
significncia de 5%, voc poderia concluir que:

A. ( ) No existe diferena significativa para a quantidade de


km rodados at o desgaste entre os pneus A e B.
B. ( ) Existe diferena significativa para a quantidade de km ro-
dados at o desgaste entre os pneus A e B. Observa-se
que quantidade superior para o pneu B.
C. ( ) No existe diferena significativa para a quantidade de
km rodados at o desgaste entre os pneus A e B. Observa-
-se que quantidade superior para o pneu A.
146Estatstica Aplicada

D. ( ) Existe diferena significativa para a quantidade de km ro-


dados at o desgaste entre os pneus A e B, porm essa
diferena insignificante.
E. ( ) Existe diferena significativa para a quantidade de km ro-
dados at o desgaste entre os pneus A e B. Observa-se
que essa quantidade significativamente superior para o
pneu A.

Questo 5. O tempo mdio gasto para profissionais da rea


de Cincias Contbeis realizarem uma determinada tarefa tem
sido de 50 minutos. Um novo procedimento est sendo imple-
mentado. Nesse novo procedimento, retirou-se uma amostra
de 25 pessoas, com um tempo mdio de execuo dessa mes-
ma tarefa de 48 minutos e um desvio-padro de 11,9 minutos.

A partir desses dados, foi realizado o teste t-student, resul-


tando um valor de estatstica do teste t = 0,84. Ao analisar
esses dados, ao nvel de significncia de 5%, voc poderia
concluir que:

A. ( ) Aceita-se H0, no existe diferena significativa para o tem-


po de execuo mdio da tarefa com o novo procedimen-
to.
B. ( ) Rejeita-se H0, existe diferena significativa para o tempo
de execuo mdio da tarefa com o novo procedimento.
Observa-se que esse tempo com o novo procedimento
significativamente inferior a 50 minutos.
Captulo 8 Testes de Hipteses147

C. ( ) Aceita-se H0, existe diferena significativa para o tempo


de execuo mdio da tarefa com o novo procedimento.
Observa-se que esse tempo com o novo procedimento
significativamente superior a 50 minutos.
D. ( ) Rejeita-se H0, existe diferena significativa para o tempo
de execuo mdio da tarefa com o novo procedimento.
Observa-se que esse tempo com o novo procedimento
significativamente inferior a 48 minutos.
E. ( ) Aceita-se H0, existe diferena significativa para o tempo
de execuo mdio da tarefa com o novo procedimento.
Observa-se que esse tempo com o novo procedimento
significativamente inferior a 50 minutos.

Gabarito das atividades propostas

Questo 1. t = 42,25

Concluso: Rejeita-se H0, logo, existe diferena significativa


no tempo mdio de deslocamento. Observa-se que ,com as
obras em andamento, esse tempo de deslocamento de Porto
Alegre a So Leopoldo significativamente superior a 40 mi-
nutos.

Questo 2. t = -4,01

Concluso: Rejeita-se H0, logo, existe diferena significativa


para o salrio mdio dos profissionais entre os setores pblico
e privado. Observa-se que o salrio mdio dos profissionais
148Estatstica Aplicada

do setor privado significativamente superior ao dos funcio-


nrios do setor pblico.

Questo 3. t = -0,77

Concluso: Aceita-se H0, logo, no existe diferena significa-


tiva na mdia de consumo entre os dois tipos de automveis.

Questo 4. Letra E.

Existe diferena significativa para a quantidade de km rodados


at o desgaste entre os pneus A e B. Observa-se que essa
quantidade significativamente superior para o pneu A.

Questo 5. Letra A.

Aceita-se H0, no existe diferena significativa para o tempo de


execuo mdio da tarefa com o novo procedimento.
Simone Echeveste

Captulo 9

Anlise de Correlao

N
este captulo, ser abordada uma ferramenta estats-
tica com grande aplicabilidade em estudos da rea
de Administrao dos quais necessrio investigar o grau
de relacionamento entre duas variveis quantitativas. Ser
apresentado o clculo do Coeficiente de Correlao de
Pearson e a sua interpretao no contexto do problema.
150Estatstica Aplicada

Espera-se que o aluno, aps o trmino de estudo deste


captulo, possa identificar em quais situaes aplica-se essa
ferramenta, bem como realize os clculos necessrios para a
mensurao da correlao entre duas variveis, interpretando
corretamente os resultados obtidos.

Muitas vezes, na prtica, necessitamos estudar o relacio-


namento de duas variveis, coletadas como pares de valores,
para resolver questes, como por exemplo:

Figura 26 Exemplos de correlaes na rea da Administrao.

A existncia de uma relao entre as variveis e a men-


surao desse grau de relao o que caracteriza o objeto
da Anlise de Correlao. Essa ferramenta estatstica indica a
existncia ou no de relacionamento entre duas variveis e se
esse relacionamento fraco, moderado ou forte.

Os dados para a anlise de correlao so provenientes


de observaes de variveis aos pares, isso significa que cada
Captulo 9 Anlise de Correlao151

observao da amostra composta por dois valores (x e y), e


com esses valores podemos, inicialmente, construir o digrama
de disperso que uma forma de verificar o tipo de correlao
existente entre duas variveis.

Diagrama de Disperso
Um dos mtodos mais usados para a investigao de pares de
dados a utilizao de diagramas de disperso. Geometrica-
mente, um diagrama de disperso considerado uma coleo
de pontos num plano cujas duas coordenadas cartesianas so
os valores de cada membro do par de dados. um grfico no
qual cada ponto representa um par de valores observados,
em que podemos visualizar a relao entre as variveis, bem
como, a partir da disposio dos pontos, podemos observar
a existncia ou no de um possvel relacionamento entre as
variveis.

Grfico 1 Diagrama de Disperso para as variveis: Renda X Aplicao


Mensal na poupana.
152Estatstica Aplicada

Tipos de correlaes

A) Correlao Positiva ou Direta

Ocorre quando as duas variveis crescem no mesmo senti-


do, esto diretamente correlacionadas. medida que a vari-
vel X aumenta, Y aumenta tambm (ou vice-versa).

Exemplo: Vendas X Gastos em propaganda

B) Correlao Negativa ou Inversa

Ocorre quando as duas variveis crescem em sentidos


opostos, esto inversamente correlacionadas. medida que
uma varivel aumenta, a outra diminui.
Captulo 9 Anlise de Correlao153

Exemplo: Nmero de faltas X Desempenho do aluno

C) Ausncia de Correlao

Ocorre quando as duas variveis no esto correlacionadas.

Exemplo: Altura X Quociente de Inteligncia


154Estatstica Aplicada

Coeficiente de correlao de pearson ( r )

O Coeficiente de correlao de Pearson uma medida do


grau e da direo de uma relao linear entre duas variveis.
O smbolo r representa o coeficiente de correlao popula-
cional e o smbolo r representa o coeficiente de correlao
amostral.

Figura 27 Condies importantes do Coeficiente de Correlao de Pearson.

Sua frmula :
Captulo 9 Anlise de Correlao155

Como Calcular:
1) Obtenha a soma dos valores de x : x
2) Obtenha a soma dos valores de y: y
3) Multiplique cada valor de x por seu valor y correspondente e obte-
nha a sua soma: x.y
4) Eleve ao quadrado cada valor de x e obtenha a sua soma: x2
5) Eleve ao quadrado cada valor de y e obtenha a sua soma: y2
6) Use essas cinco somas para calcular o coeficiente de correlao.

Interpretao do coeficiente de correlao


de pearson ( r )

O Coeficiente de Correlao de Pearson foi desenvolvido de


forma que seu resultado final ser sempre um valor entre -1
e +1, ou seja: -1 r 1. A partir dos valores de r, podemos
verificar o tipo da correlao existente entre as variveis estu-
dadas considerando as seguintes regras na interpretao de
seu resultado:

Se r > 0, indica uma correlao positiva ou direta en-


tre as variveis, um aumento na varivel X provocar
um aumento na varivel Y.
Se r < 0, indica uma correlao negativa ou inversa
entre as variveis, um aumento na varivel X provoca-
r uma reduo na varivel Y.
Se r = 0, indica a inexistncia de qualquer relao ou
tendncia linear entre as variveis X e Y.
156Estatstica Aplicada

Exemplo 1

Uma amostra de 6 residncias selecionadas aleatoriamente foi


observada quanto idade do imvel, em anos, e quanto ao
preo de venda, em unidades monetrias. Os dados observa-
dos foram:

Residncia Idade do Imvel (x) Preo de venda (y)

1 1 100

2 2 80

3 3 90

4 4 15

5 5 50

6 6 20

Para esse exemplo, temos as seguintes informaes:

n = 6 residncias

x = Idade do Imvel

y = Preo de venda dos imveis

Para calcular o Coeficiente de Correlao de Pearson, pre-


cisaremos dos seguintes somatrios:

) Obtenha a soma dos valores de x: x


1
2) Obtenha a soma dos valores de y: y
3) Multiplique cada valor de x por seu valor y correspondente
e obtenha a sua soma: x.y
Captulo 9 Anlise de Correlao157

4) Eleve ao quadrado cada valor de x e obtenha a sua soma:


x2
5) Eleve ao quadrado cada valor de y e obtenha a sua soma:
y2

Tabela de clculos:

Residncia Idade (x) Preo de venda (y) x.y x2 y2

1 1 100 100 1 10000


2 2 80 160 4 6400
3 3 90 270 9 8100
4 4 15 60 16 225
5 5 50 250 25 2500
6 6 20 120 36 400

Totais 21 355 960 91 27.625

Clculo do Coeficiente de correlao de Pearson


158Estatstica Aplicada

Interpretao:
Como r apresenta um valor negativo, indica correlao
inversa/negativa entre a idade do imvel e o seu preo
de venda, ou seja, quanto maior a idade do imvel (mais
antigo for) menor tende a ser o preo de venda.

Interpretao da intensidade da
correlao

Podemos, alm de identificar a existncia de correlao e o


seu tipo (direta, inversa), analisar a sua intensidade da seguin-
te forma: (Callegari-Jacques, 2003)

Se 0,00 < r < 0,30 existe correlao fraca


Se 0,30 r < 0,60 existe correlao moderada
Se 0,60 r < 0,90 existe correlao forte
Se 0,90 r < 1,00 existe correlao muito forte

Considere o smbolo relacionado ao sinal da correla-


o se negativo (-), inversa e, se positivo, direta (+).

Exemplo 2

Uma cadeia de supermercados financiou um estudo para ve-


rificar a relao entre a renda mensal (salrios mnimos) e as
Captulo 9 Anlise de Correlao159

despesas semanais em supermercados de 8 famlias selecio-


nadas aleatoriamente.

Renda mensal (salrios mnimos) x Despesa semanal supermercado (reais)


Famlia Renda mensal (x) Despesa semanal supermercado (y)

1 3,5 280

2 3,8 360

3 2,6 200

4 1,9 110

5 3,1 230

6 2,8 210

7 4,2 330

8 4,0 350

Para esse exemplo, temos as seguintes informaes:

n = 8 famlias

x = Renda mensal (salrios mnimos)

y = Despesa semanal supermercado (reais)


160Estatstica Aplicada

Tabela de clculos:

Famlia Renda mensal (x) Despesa super. (y) x.y x2 y2

1 3,5 280 980 12,3 78400

2 3,8 360 1368 14,4 129600

3 2,6 200 520 6,8 40000

4 1,9 110 209 3,6 12100

5 3,1 230 713 9,6 52900

6 2,8 210 588 7,8 44100

7 4,2 330 1386 17,6 108900

8 4,0 350 1400 16,0 122500

Total () 25,9 2070 7164 88,2 588500

Considere:

Clculo do Coeficiente de correlao de Pearson


Captulo 9 Anlise de Correlao161

Interpretao:
Como r apresenta um valor positivo, indica correlao dire-
ta/positiva entre a renda mensal e as despesas semanais no
supermercado, ou seja, quanto maior a renda, maior tende
a ser a despesa semanal no supermercado. Podemos ainda
destacar se essa correlao muito forte.

Recapitulando

Na Anlise de Correlao, estamos interessados em mensurar


o grau de associao entre duas variveis por meio do clculo
do Coeficiente de Correlao de Pearson. Quando duas va-
riveis esto correlacionadas, essa relao pode ser direta (a
medida que uma varivel aumenta, a outra aumenta tambm
ou vice-versa) ou inversa (a medida que uma varivel aumen-
ta, a outra diminui).
162Estatstica Aplicada

Atividades: Anlise de correlao

Questo 1. Um comerciante de temperos est curioso sobre


a grande variao nas vendas de loja para loja e acha que as
vendas esto associadas com o espao nas prateleiras dedica-
dos a sua linha de produto em cada ponto de venda. Oito lo-
jas foram selecionadas ao acaso, e as duas seguintes variveis
foram mensuradas: x: total de espao de frente (comprimento
x altura em cm2) dedicado a sua linha de produtos na loja e y
= total das vendas dos produtos, em reais, no ltimo ms. Os
dados so apresentados na tabela a seguir:

Vendas x espao dedicado aos produtos


Loja Loja 1 Loja 2 Loja 3 Loja 4 Loja 5 Loja 6 Loja 7 Loja 8 Totais (S)

Espao 340 230 405 325 280 195 265 300 x = 2340
(x)

Vendas 71 65 83 74 67 56 57 78 y= 551
(y)

X.Y 24140 14950 33615 24050 18760 10920 15105 23400 x.y= 164940

X2 115600 52900 164025 105625 78400 38025 70225 90000 x2= 714800

Y2 5041 4225 6889 5476 4489 3136 3249 6084 y2= 38589

Calcule e interprete o Coeficiente de Correlao de Pear-


son para esses dados.

Questo 2. Considere as seguintes informaes referentes a


15 Municpios do Rio Grande do Sul:
Captulo 9 Anlise de Correlao163

RELAO ENTRE O NDICE DE POBREZA (%) E O PIB PER CAPTA (REAIS)


Municpio ndice de Pobreza (X) PIB per capta (Y) X.Y X2 Y2

Alegrete 30,9 14,2 438,8 954,8 201,6

Bag 26,8 10,1 270,7 718,2 102,0

Bento Gonalves 21,1 24,2 510,6 445,2 585,6

Camaqu 26,6 16,9 449,5 707,6 285,6

Canoas 29,5 49,5 1460,3 870,3 2450,3

Caxias do Sul 20,9 30,5 637,5 436,8 930,3

Erechim 26,3 21,4 562,8 691,7 458,0

Guaba 31,4 20,1 631,1 986,0 404,0

Porto Alegre 23,7 26,3 623,3 561,7 691,7

Rio Grande 29,1 32,0 931,2 846,8 1024,0

Santa Maria 25,3 12,8 323,8 640,1 163,8

Sapucaia 31,4 14,0 439,6 986,0 196,0

Tramanda 28,9 8,9 257,2 835,2 79,2

Vacaria 28,8 14,7 423,4 829,4 216,1

Viamo 33,1 7,0 231,7 1095,6 49,0

Totais () 413,8 302,6 8191,5 11605,3 7837,2

Ao realizar a Anlise de Correlao de Pearson para esses


dados, o valor do coeficiente foi r = -0,272. Sobre a interpre-
tao desse valor, voc diria que:
164Estatstica Aplicada

A. ( ) Pode-se concluir que existe uma correlao direta entre


o ndice de Pobreza e o PIB per capta desses municpios,
ou seja, quanto maior o ndice de Pobreza, menor tende a
ser o PIB per capta.

B. ( ) Pode-se concluir que no existe diferena significativa


entre o ndice de Pobreza e o PIB per capta desses muni-
cpios, ou seja, o PIB no superior em Municpios mais
pobres.

C. ( ) Pode-se concluir que existe uma correlao inversa en-


tre o ndice de Pobreza e o PIB per capta desses munic-
pios, ou seja, quanto maior o ndice de Pobreza, menor
tende a ser o PIB per capta.

D. ( ) Pode-se concluir que existe uma correlao inversa en-


tre o ndice de Pobreza e o PIB per capta desses munic-
pios, ou seja, quanto maior o ndice de Pobreza, maior
tende a ser o PIB per capta.

E. ( ) Pode-se concluir que existe uma correlao inversa ex-


tremamente forte entre o ndice de Pobreza e o PIB per
capta desses municpios, ou seja, para todos os munic-
pios, quanto maior o ndice de Pobreza, menor foi o PIB
per capta.

Questo 3. Procurando quantificar os efeitos da escassez de


sono sobre a capacidade de resoluo de problemas simples,
um agente tomou ao acaso 10 sujeitos e os submeteu a ex-
perimentao. Deixou-os sem dormir por diferentes nmeros
de horas, aps o que solicitou que os mesmos resolvessem
os itens contas de adicionar de um teste. Obteve, assim, os
seguintes dados:
Captulo 9 Anlise de Correlao165

Amostra Horas sem dormir (x) N de erros (y) x.y x2 y2

1 8 8 64 64 64

2 8 6 48 64 36

3 12 6 72 144 36

4 12 10 120 144 100

5 16 8 128 256 64

6 16 14 224 256 196

7 20 14 280 400 196

8 20 12 240 400 144

9 24 16 384 576 256

10 24 12 288 576 144

Total () 160 106 1848 2880 1236

Calcule e interprete o coeficiente de correlao linear de


Pearson para esses dados.

Questo 4. Em uma indstria de cervejas, realizou-se um


estudo com o objetivo de correlacionar a temperatura do dia
com as vendas de refrigerante. Realizou-se, para isso, uma
Anlise de Correlao entre essas variveis resultando em um
coeficiente de correlao de Pearson de r = 0,926. A partir
da interpretao desse valor, podemos concluir que:

Existe uma correlao direta forte entre a temperatura


A()
do dia e as vendas de refrigerante.
166Estatstica Aplicada

Existe uma correlao inversa fraca entre a tempera-


B()
tura do dia e as vendas de refrigerante.
Existe uma correlao inversa forte entre a temperatu-
C()
ra do dia e as vendas de refrigerante.
D() Essas variveis no possuem nenhuma correlao.
Existe uma correlao direta muito forte entre a tem-
E()
peratura do dia e as vendas de refrigerante.

Questo 5. Um estudo de correlao foi realizado com o ob-


jetivo de verificar a relao entre as variveis Horas de estudo
(x) e nota na prova de Estatstica (y). Os dados observados em
uma amostra de 8 alunos foram:

Aluno Horas de estudo (x) Nota na prova (y) x.y x2 y2

1 2 1 2 4 1

2 4 3 12 16 9

3 5 6 30 25 36

4 5 6 30 25 36

5 6 8 48 36 64

6 8 7 56 64 49

7 9 8 72 81 64

8 10 10 100 100 100

Total () 49 49 350 351 359


Captulo 9 Anlise de Correlao167

Calcule e interprete o coeficiente de correlao linear de


Pearson para esses dados.

Gabarito das atividades propostas

Questo 1. r = 0,857
Existe uma correlao forte direta entre total de espao
de frente dedicado a sua linha de produtos na loja e y =
total das vendas dos produtos, em reais, no ltimo ms, ou
seja, quanto maior o espao de frente dedicado linha
de produtos, maior tende a ser as vendas dos produtos.

Questo 2.
C. ( x ) Pode-se concluir que existe uma correlao inversa
entre o ndice de Pobreza e o PIB per capta desses muni-
cpios, ou seja, quanto maior o ndice de Pobreza menor
tende a ser o PIB per capta.

Questo 3. r = 0,801
Existe uma correlao forte direta entre o nmero de
horas sem dormir e o nmero de erros, ou seja, quanto
maior o nmero de horas sem dormir, maior tende a ser
o nmero de erros cometidos.

Questo 4.
Existe uma correlao direta muito forte entre a tem-
E. ( x )
peratura do dia e as vendas de refrigerante.
168Estatstica Aplicada

Questo 5. r = 0,911

Existe uma correlao muito forte direta entre o nme-


ro de horas de estudo e a nota na prova, ou seja, quanto
maior o nmero de horas de estudo, maior tende a ser
a nota na prova.
Simone Echeveste

Captulo 10

Anlise de Regresso

N
este captulo, ser apresentada uma ferramenta de
anlise estatstica aplicada em estudos em que se de-
seja estabelecer um modelo matemtico que represente a
relao entre duas variveis X e Y. Esse modelo extrema-
mente til ao pesquisador, pois permitir a ele a realiza-
o de previses e estimativas.
Ao final desse estudo, o aluno dever ser capaz de
identificar as situaes em que a Anlise de Regresso
pode ser utilizada na resoluo de problemas na rea de
Administrao de empresas, bem como interpretar cor-
retamente os resultados obtidos com essa ferramenta de
anlise de dados.
170Estatstica Aplicada

A relao linear entre duas variveis X e Y pode ser inves-


tigada de duas formas: pela Anlise de Correlao, na qual
quantificamos a intensidade dessa relao, e pela Anlise de
Regresso, na qual a forma dessa relao explicitada por
meio de um modelo matemtico.

Usamos Anlise de Regresso quando acreditamos que h


relaes entre as variveis e desejamos expressar matematica-
mente tais relaes. A Regresso Linear nos fornece equaes
do primeiro grau para determinarmos estimativas dos valores
mdios de algumas variveis em funo dos valores das outras.

Modelo de regresso linear

Os Modelos de regresso simples so modelos matemticos


que relacionam o comportamento de uma varivel Y com uma
varivel X a partir de uma funo:

F(X) = Y = a + bX

Nesse modelo, a varivel X a varivel independente da


equao, enquanto Y = f(X) a varivel dependente das va-
riaes de X.

Figura 28 Denominao das variveis no modelo de Regresso Linear.


Captulo 10 Anlise de Regresso171

Poderemos utilizar seus resultados para os seguintes objetivos:

Realizar previses sobre o comportamento futuro de al-


gum fenmeno por meio de uma coleta de dados.
Simular os efeitos sobre uma varivel Y em decorrncia
de alteraes introduzidas nos valores de uma varivel X.

Estimadores para o modelo de


regresso linear

Os estimadores dos coeficientes angular (b) e linear (a) sero


designados respectivamente por b e a. Assim, a estimativa do
modelo adotado ser dada por:

Y = a + bX

Os valores de a e b sero determinados pelo Mtodo dos


Mnimos Quadrados (MMQ), aplicado na amostra sele-
cionada, utilizando-se as seguintes frmulas:

onde e so as mdias dos valores de Y e X.


172Estatstica Aplicada

INFORMAES IMPORTANTES

A inclinao (b) da regresso mede a direo e a magnitude


da relao. Quando as duas variveis esto correlacionadas
positivamente, a inclinao (valor de b) tambm ser positiva,
enquanto, quando as duas variveis esto correlacionadas
negativamente, a inclinao (valor de b) ser negativa.

A magnitude da inclinao da regresso pode ser lida como segue:


para cada acrscimo unitrio na varivel (X), a varivel dependente
aumentar/diminuir b unidades de y.

Exemplo 1

Certa empresa, estudando a variao da demanda de seu


produto (unidades vendidas) em relao variao de preo
de venda (reais), obteve os dados que esto na tabela abaixo:

PREO DO PRODUTO X DEMANDA


Ms Preo (X) Demanda (Y)
1 35 350
2 40 325
3 50 290
4 55 270
5 60 250
6 65 240
7 70 235
8 80 220
9 95 215
10 110 205
Captulo 10 Anlise de Regresso173

Observe, no diagrama de disperso acima apresenta-


do, que podemos traar uma reta que representa a relao
entre as variveis.

Clculos da equao da reta de regresso

Para esse exemplo, temos as seguintes informaes:

n = 10 meses

x = Preo (reais)

y = Demanda (unidades vendidas)

Primeiramente, precisaremos, para a realizao dos clcu-


los, de acordo com as frmulas, dos seguintes somatrios: x,
x.y e x2
174Estatstica Aplicada

Ms Preo (x) Demanda (y) x.y x2

1 35 350 12250 1225

2 40 325 13000 1600

3 50 290 14500 2500

4 55 270 14850 3025

5 60 250 15000 3600

6 65 240 15600 4225

7 70 235 16450 4900

8 80 220 17600 6400

9 95 215 20425 9025

10 110 205 22550 12100

Total () 660 2.600 162.225 48.600

Clculo das Mdias


Captulo 10 Anlise de Regresso175

Clculo do Coeficiente b

Clculo do Coeficiente a

Ateno ao sinal de negativa


do coeficiente!!!
176Estatstica Aplicada

Equao da Reta de Regresso:

Equao da Reta para as variveis:


x: preo e y: demanda

Aps a determinao da Equao da Reta, poderemos utili-


z-la agora com o objetivo de fazer previses. Por exemplo,
poderemos estimar qual ser a demanda esperada
para um preo de 100 reais.

Nesse caso, estamos determinando o valor de x = 100


reais e desejamos estimar qual ser valor de y = demanda
(unidades vendidas). Para isso, basta substituirmos os dados
na Equao da Reta obtida:

Para x = 100 reais

Concluso
Estima-se que, para um preo de 100 reais, sejam vendidas
em torno de 196,76 unidades do produto.
Captulo 10 Anlise de Regresso177

Exemplo 2

Os dados abaixo representam o x: tempo de experincia em


anos, e os respectivos y: salrios (em salrios mnimos) de uma
amostra de 8 Administradores:

Tempo de Experincia X Renda Mensal


Administrador X: Experincia (anos) Y: Salrios Mnimos

1 2 5

2 5 6

3 10 11

4 8 9

5 6 7

6 12 10

7 15 14

8 11 10

Para esse exemplo, temos as seguintes informaes:

n = 8 administradores

x = Tempo de experincia (anos)

y = Renda mensal (salrios mnimos)


178Estatstica Aplicada

Tabela de clculos:
Administrador X: Experincia (anos) Y: Salrios Mnimos x.y x2

1 2 5 10 4

2 5 6 30 25

3 10 11 110 100

4 8 9 72 64

5 6 7 42 36

6 12 10 120 144

7 15 14 210 225

8 11 10 110 121

Total () 69 72 704 719

Clculos para a construo da Equao da Reta

Clculo das Mdias


Captulo 10 Anlise de Regresso179

Clculo do Coeficiente b

Clculo do Coeficiente a

Equao da Reta:

Equao da Reta para as variveis:


x: Tempo de experincia e y: Renda mensal
180Estatstica Aplicada

Questo:
Qual ser a renda mensal estimada de um Administrador com
15 anos de experincia?

Nesse caso, estamos determinando o valor de x = 15 anos


e desejamos estimar qual ser valor de y = renda mensal (sa-
lrios mnimos). Para isso, basta substituirmos os dados na
Equao da Reta obtida:

Para x = 15 anos

Concluso
Estima-se que, para um tempo de experincia de 15 anos, o
salrio mensal de um Administrador seja em torno de 13,27
salrios mnimos.

Recapitulando

A Anlise de Regresso linear simples estuda o relacionamento


entre uma varivel dependente (y) e outra varivel indepen-
dente (x). Esse relacionamento representado por um modelo
Captulo 10 Anlise de Regresso181

matemtico, por meio de uma equao que associa a varivel


dependente com a varivel independente.

Aps a determinao da Reta de Regresso, ou ainda


Equao de Regresso, poderemos utiliz-la com o objetivo
de realizar projees ou simulaes com as variveis utilizadas
no modelo.

Atividades: Anlise de regresso

Questo 1. Uma amostra de funcionrios de uma empresa


foi observada quanto s variveis: tempo de experincia na
funo (anos), e produtividade na realizao da tarefa (nme-
ro de relatrios produzidos). Para os dados obtidos com uma
amostra de 20 funcionrios, obteve-se a seguinte Equao da
Reta de Regresso: y = 58,13 + 1,62x. A partir dessa equa-
o, responda s seguintes questes:

- Pelo valor do coeficiente b da reta, podemos dizer que a


correlao entre o tempo de experincia na funo e a produ-
tividade :

a. ( ) Inexistente

b. ( ) Direta/positiva

c. ( ) Inversa/Negativa

d. ( ) Direta/Negativa

e. ( ) Inversa/Positiva
182Estatstica Aplicada

- Para um funcionrio com 10 anos de experincia, estima-se


que este produza aproximadamente quantos relatrios?

a. ( ) 1,62 relatrios

b. ( ) 74 relatrios

c. ( ) 58 relatrios

d. ( ) 10 relatrios

e. ( ) 120 relatrios

Questo 2. Suponhamos que uma cadeia de supermercados


tenha financiado um estudo dos gastos em alimentao para
famlias de quatro pessoas. Obteve-se a seguinte equao de
regresso linear: y = 200 + 0,10 x, onde y representa a
despesa mensal estimada com alimentao e x a renda lquida
mensal. A partir da Equao da Reta estabelecida, estime a
despesa de uma famlia de quatro pessoas com renda mensal
de R$ 15.000.

Questo 3. Foi feito um levantamento a respeito dos imveis


de dois dormitrios alugados por uma imobiliria da zona sul
da cidade de Porto Alegre. Para verificar a relao entre o va-
lor do aluguel cobrado (reais) e a sua distncia em relao ao
centro da cidade (metros), coletou-se os dados de 8 imveis
cadastrados nessa imobiliria.
Captulo 10 Anlise de Regresso183

Valor do aluguel X Distncia do centro


Imvel Distncia do centro (x) Valor do Aluguel (y)

1 5 950

2 4 980

3 6 1000

4 9 1100

5 6 1090

6 4 990

7 6 970

8 8 1030

a) Obtenha a Equao da Reta de regresso para esses da-


dos.
b) Estime o valor do aluguel de um imvel localizado a 10
metros.

Questo 4. Um corretor do mercado de aes, visando pre-


ver o nmero de negcios fechados por dia, decidiu utilizar
o nmero de chamadas telefnicas recebidas como varivel
independente. Os resultados obtidos para uma amostra de 10
dias foram:
184Estatstica Aplicada

Nmero de chamadas recebidas X Nmero de negcios fechados


Dia N chamadas recebidas N Negcios fechados

1 591 42

2 146 32

3 185 36

4 245 44

5 600 82

6 510 70

7 394 56

8 486 65

9 483 63

10 106 23

a) Obtenha a Equao da Reta de regresso para esses da-


dos.
b) Estime o nmero de negcios fechados para um dia em
que se recebam 500 chamadas.

Questo 5. Os dados abaixo representam o valor de um


determinado ms da fatura do carto de crdito (em reais) e
a renda mensal (em salrios mnimos) de uma amostra de 7
indivduos:
Captulo 10 Anlise de Regresso185

Indivduo Renda Mensal (x) Gasto carto (y)

1 3,5 520

2 5,0 850

3 2,8 310

4 4,5 800

5 5,2 860

6 5,8 910

7 6,9 900

a) Obtenha a Equao da Reta de regresso para esses da-


dos.
b) Estime o gasto no carto de uma famlia com renda de 7,5
salrios mnimos.

Gabarito das atividades propostas

Questo 1.
b. ( X ) Direta/positiva.

b. ( X ) 74 relatrios.

Questo 2.
R: R$ 1.300,00
186Estatstica Aplicada

Questo 3.
a) R: Y = 885,57 + 21,36 X

b) R: R$ 1.099,17

Questo 4.
a) R: Y = 20,42 + 0,08 X

b) R: 60,42 negcios fechados.

Questo 5.
a) R: Y = 15,20 + 149,66 X

b) R: 1.137,65 reais.

Referncias Bibliogrficas
BARBETTA, Pedro Alberto. Estatstica Aplicada s Cincias So-
ciais. Florianpolis: Ed. Da UFSC, 2001. 337 p.

CALLEGARI-JACQUES, S.M. Bioestatstica: Princpios e Aplica-


es. ArtMed, Porto Alegre, 3a reimpresso, 2006.

CLARK, J. DOWNING, D. Estatstica aplicada. So Paulo : Sa-


raiva, 1998.

MOORE, D. A Estatstica Bsica e sua prtica. Rio de Janeiro:


Ed. LTC, 2000.

SIMON, Gary A. FREUND, John E. Estatstica Aplicada. Porto


Alegre : Bookman, 2000. 404 p.

Вам также может понравиться