Вы находитесь на странице: 1из 46

Estatstica Aplicada

Universidade Estcio de S - FAP

Cursos: Administrao e
Contabilidade

Professora: Luciana
1. Introduo: Estatstica

Dados tm sido coletados ao longo da histria. Nas civilizaes Egpcia, Grega e Romana os dados
eram obtidos principalmente com o objetivo de coletar impostos e para o recenseamento militar.

Na Idade Mdia, as instituies religiosas freqentemente e mantinham registros relativos a


nascimentos, mortes e casamentos.

Nos Estados Unidos, vrios registros eram mantidos durante os tempos coloniais, e a partir de 1790
a Constituio dos EUA passou a exigir que um censo fosse realizado a cada 10 anos.

Estatstica a cincia que tem por objetivo coletar, organizar, resumir, apresentar e analisar um
conjunto de dados. Desta forma possvel a tomada de deciso com base em um experimento
cientfico.

A estatstica possui duas principais subdivises:

a) Estatstica descritiva: oferece uma srie de ferramentas, tais como tabelas, grficos e
mdias, no sentido de organizar e resumir informaes em relao a um conjunto de
observaes existentes.
b) Estatstica inferencial: permite utilizar um pequeno lote de observaes existentes, no
sentido de verificar: a veracidade de uma declarao de um fabricante em relao ao
desempenho de toda uma populao de carros.

Na rea de humana precisa conhecer estatstica pelas seguintes razes:

a) Para saber como apresentar e descrever informaes de forma apropriada.


b) Para saber como tirar concluses a partir de grandes populaes, com base somente na
informao obtida a partir de amostra.
c) Para saber como melhorar os processos.
d) Para saber como obter previses confiveis.

1.1 Coleta de dados

Tendo um tema de pesquisa bem definido no tempo e no espao podemos decidir a melhor forma de
coletar os dados: por populao ou por amostra.

Populao Pesquisa feita com TODOS os elementos do estudo.

Amostra Pesquisa feita com um subgrupo de todo o universo que poderia ser pesquisado.

Amostragem com e sem reposio

A amostragem com reposio: Ocorre quando o item que foi selecionado volta a fazer parte da
populao.

2
Exemplo: o lance de um dado, em que o mesmo nmero j sorteado poder ser sorteado
novamente em qualquer jogada.

Amostragem sem reposio: Ocorre quando o item selecionado no volta a fazer parte da populao.
Exemplo: o sorteio das dezenas em bingos, que, ao serem sorteadas, no voltam para a urna.

Tipos de amostragem

a) Amostra aleatria simples: os elementos da populao so escolhidos de tal forma que


cada um deles tenha igual chance de figurar na amostra. Os elementos podem ser escolhidos
por diversos mtodos, inclusive sorteio, tabelas de nmeros aleatrios e uso computadores
para gerar nmeros aleatrios.

Exemplo: Um cabo eleitoral escreve o nome de cada senador dos EUA, em cartes
separados, mistura-se e extrai 10 nomes.

b) Amostragem sistemtica: ocorre quando os elementos da populao encontram-se


ordenados e a retirada feita periodicamente. Na amostragem sistemtica escolhe-se um
ponto inicial e em seguida, seleciona-se cada k-simo (tal como cada 50 o.) elemento da
populao.

Exemplo: A empresa Sony seleciona cada 200CD de sua linha de produo e faz um teste de
qualidade rigoroso.

c) Amostragem por conglomerados: comeamos dividindo a rea da populao em sees


(ou conglomerados); em seguida selecionamos algumas dessas sees e, finalmente,
tomamos todos os elementos das sees escolhidas.

Exemplo: Um pesquisador mdico da Universidade Johns Hopkins entrevista todos os


portadores de leucemia em cada um de 20 hospitais selecionados aleatoriamente.

d) Amostragem estratificada: subdividimos a populao em, no mnimo, duas subpopulaes


que compartilham das mesmas caractersticas (ex: sexo) e, em seguida, extramos uma
amostra de cada estrato.

Exemplo 1: O programa de Planejamento Familiar pesquisa 500 homens e 500 mulheres


sobre seus pontos de vista sobre o uso de anticoncepcionais.

Exemplo 2:
Sexo Populao Amostra
M 54 9
F 36 6
Total 90 15

Exerccios:

3
1) Responda se os dados foram obtidos atravs de populao ou amostra:

a) Para avaliar a eficcia de uma campanha de vacinao no Estado de MG, 200 mes
foram perguntadas a respeito da ltima vez que vacinaram seus
filhos.______________________
b) Para obter o nmero de lmpadas produzidas em SP, todas as fbricas da capital
foram avaliadas a respeito da fabricao de lmpadas.______________

2) Indique qual o tipo de amostragem utilizado nos estudos abaixo, justificando sua escolha.

a- A coordenao de um curso deseja conhecer a opinio dos alunos sobre a resoluo que
estabelece horrios fixos para o atendimento dos alunos pelos professores. Para compor a
amostra foram sorteados 10% dos alunos.
b- Uma listagem numerada contm 1000 nomes, numerados consecutivamente a partir de 1.
Iniciando-se do 15 nome, uma amostra foi composta considerando sorteados os nomes
referentes aos nmeros 25, 35, 45, 55 e assim sucessivamente at que fossem escolhidos 100
nomes.
c- Para observar o tempo de execuo de uma determinada tarefa, foram observados os
desempenhos de 60 funcionrios em trs turnos (manh, tarde e noite).

3) Suponha que 5000 faturas sejam separadas em quatro grupos. O grupo 1 contm 50 faturas,
grupo 2 contm 500 faturas, grupo 3 contm 1000 faturas e grupo 4 contm 3450 faturas.

a) Que tipo de amostragem deveria ser realizada? Por qu?


b) Por que o tipo de amostragem em (a) no uma amostra aleatria simples?

4) Um relatrio patrocinado pela Florida Citrus Commission concluiu que os nveis de


colesterol podem ser reduzidos mediante ingesto de produtos ctricos. Por que razo a
concluso poderia ser suspeita?

1.2 Classificao das variveis

Tendo o tema da pesquisa bem definido, podemos propor algumas variveis para compor o estudo.
Variveis so caractersticas que iremos pesquisar do pblico alvo. As variveis podem ser
classificadas em:

Qualitativas so aquelas representadas por categorias. Elas esto subdivididas em:


1. Nominais onde atribumos nomes. Ex: sexo (masculino, feminino).
2. Ordinais entre as categorias se estabelece uma relao de ordem.
Ex: nvel de instruo (fundamental, mdio e superior).

Quantitativas so aquelas representadas por nmeros. Elas esto subdivididas em:


1. Discretas quando podemos enumerar (contar). Ex: n de filhos (1,2,3,...)
2. Contnuas quando podemos mensurar (medir ou pesar). Ex: altura (1,59;
1,72; 1,64;...)

Exerccios:

4
1) Administrar o tempo se tornou uma das tarefas mais imprescindveis e difceis na atualidade.
Tentar gerenciar o prprio tempo passa por alguns caminhos fceis de entender, mas de relativa
dificuldade de aplicao, escuta-se cada vez mais nos dias atuais no tenho tempo para nada. Ser
que o mundo moderno nos obriga a fazer alm do que podemos ou ser que nem o nosso prprio
tempo conseguimos administrar? Voc como um conhecedor de administrao, proponha 2 variveis
importantes que poderiam auxiliar as pessoas a administrar seu prprio tempo e classifique-as.

2) Administrao , antes de tudo, planejamento, organizao e controle. Logo, habilidade com


nmeros, esprito de liderana e capacidade de argumentao so atributos indispensveis ao
administrador. Sendo voc um futuro administrador, proponha 2 variveis importantes para avaliar o
perfil dos clientes de uma empresa automobilstica. Classifique estas variveis e sugira a melhor
maneira de coletar esses dados, por populao ou amostra, justificando sua resposta.

4) Suponha que duas empresas desejam empregar um contador e aps considerar as vantagens de
cada uma, voc vai escolher aquela que lhe oferecer melhor bem estar. Cite trs variveis para lhe
auxiliar a tomar esta deciso.

5) Determine o nvel de mensurao mais adequado (nominal, ordinal).

1- Classificao como superior, acima da mdia, mdio, abaixo da mdia ou pobre para encontros
marcados com desconhecidos:
2- Sexo:
3- Cor dos olhos:
4- Resultado do concurso de beleza:
5- Campo (ou curso) de estudos:

1.3 Nveis de Mensurao

Algumas escalas de medidas podem ser usadas para caracterizar as unidades de observao
(variveis):

a) Escala Nominal

Neste nvel os nmeros so usados apenas como cdigo de uma classe ou categoria. Os elementos
de uma classe so compreendidos como idnticos sob algum aspecto que permite sua incluso no
conjunto. A nica operao possvel a contagem de quantos elementos h em cada categoria
(freqncia).

Exemplos: o sexo, o estado civil, etc.

b) Escala Ordinal

5
Neste nvel os nmeros so utilizados para assinalar a posio dos objetos, organizados em
categorias que tm entre si uma relao hierrquica. Pode-se dizer que h uma ordem entre os
objetos, em termos de mais e menos, mas no qual a diferena entre os objetos.

Exemplos: o grau de instruo, a classificao em classes scio-econmicas, etc.

c) Escala Intervalar

A varivel pode assumir vrias categorias que mantm uma relao de ordem, alm de intervalos
iguais de medio.

Exemplo: a temperatura, velocidade, etc.

2. Representao de dados

Aps a realizao da pesquisa preciso fazer a representao das variveis do estudo, para que
possamos ter uma viso global da variao das variveis. Esta representao poder ser feita atravs
de grficos ou de tabelas, que iro nos fornecer rpidas e seguras informaes a respeito das
variveis de interesse.

2.1 Representao tabular


Podemos representar os dados atravs de dois tipos de tabelas:

Tabelas de distribuio de freqncia


Alguns conceitos so importantes na construo das tabelas:

a) Tamanho da amostra (n) representa o n total de elementos pertencentes ao estudo.


b) Freqncia absoluta (fi) a contagem de elementos dentro de cada categoria.
c) Freqncia relativa (fr) a representada pela razo entre a freqncia absoluta e o
tamanho da amostra.
fi
Fr
n
d) Porcentagem (%) representado pelo produto entre a freqncia relativa e 100.
% = fr x 100

Exemplo:

1) Os dados abaixo representam o tipo sanguneo de 32 pacientes de uma clnica. Construa uma
tabela de distribuio de freqncia para representar os dados:

O O A B AB O A O O A O B AB AB O O
A A O B O AB O O A O O O O A B O

Passos para a construo da tabela:


1 Identificar qual a varivel de estudo.
6
2 Quais as categorias dessa varivel.
3 Clculo do fi contagem dos elementos de cada categoria, ou seja, montar a tabela.
4 Clculo do fr (freqncia relativa).
5 Clculo da % (freqncia relativa percentagem).
6 Calculo da freqncia acumulada.

Verificao do clculo em uma tabela de distribuio de freqncia:


A soma das freqncias absolutas dever ser o tamanho da amostra.
A soma das freqncias relativas aproximadamente 1.
A soma das porcentagens aproximadamente 100.

Exerccios:

1) Quinze funcionrios de uma empresa de informtica foram pesquisados quanto ao grau de


complexidade do seu trabalho, obtendo os valores abaixo:

A M A M M B A M B M B B M M A

Onde:
A Alto
M Mdio
B - Baixo

Pede-se:
a) A tabela de distribuio de freqncia absoluta.
b) A tabela de distribuio de freqncia relativa.
c) Classifique a varivel de estudo.
d) Analise o conjunto de dados, dando sua interpretao para o estudo.

2) Tabela: Uma distribuio de freqncia para os nveis sricos de zinco de um grupo de homens
entre as idades de 15 e 17 anos exibida a seguir. Complete-a.

Nvel Srico N de Homens Freq. Relativa Freq. Percentagem


50 |- 60 6
60 |- 70 35
110
116
91
63
Total ------------- ------------

Tabelas de distribuio de freqncia com intervalos de classe

7
Exemplo: Os dados abaixo referemse ao salrio (em salrios mnimos) de 20 funcionrios de uma
empresa de fabricao de computadores:
10,1 3,1 3,3 4,7
7,3 2,2 10,7 3,5
8,5 9,0 1,5 6,5
4,2 6,1 10,0 6,1
5,0 9,4 8,2 8,9

Pede-se:

a) Tabela com intervalo de Classe comeando por 0 de amplitude 2.

Exerccios:

1 Os dados a seguir referem-se ao nmero de acidentes de trnsito com vtimas fatais, onde 11.712
pessoas eram pedestres; 7.116 eram passageiros e 8.478 eram condutores. Monte uma tabela de
distribuio de freqncia absoluta e freqncia relativa.

2 Os dados abaixo representam o peso ao nascer de alguns recm nascidos:

2,5 3,2 4,1 1,9 3,4 3,2 2,9 2,4 3,1 3,8
2,9 4,4 3,7 2,3 2,7 2,1 2,1 2,9 2,8 1,9

Pede-se:
a) Construa uma tabela de distribuio de freqncia absoluta, com amplitude de 0,5
comeando por 1,5.

3 Os dados abaixo representam as idades com que os funcionrios de uma empresa de calados
comearam a trabalhar.

17 21 16 35 24 22 18 29 23 17 21 15 19 23 25 32

a) Construa uma tabela de distribuio de freqncia com intervalos de classe comeando por
15 de amplitude 5.

2.2 Representao grfica


Os grficos so utilizados para dar uma impresso rpida ao pesquisador do fenmeno a ser
estudado.
Diagrama de barras simples As freqncias absolutas, relativas e percentuais so
expressos atravs de barras verticais ou horizontais.
Exemplo:
Grau de anemia N de pacientes
Alto 3
mdio 10
baixo 5

8
Histograma de barras simples: Nmero de pacientes segundo o grau de anemia
12
10
8
6
nm ero de pacientes
4
2
0
alto mdio baixo
Grau de anem ia

Histograma de barras simples: Percentual de pacientes segundo o grau de anemia

baixo

mdio
Grau de anem ia

alto

0.0 10.0 20.0 30.0 40.0 50.0 60.0


% de pacientes

Grfico de pizza em uma circunferncia so representadas as porcentagens. Da varivel


em questo.

Sexo Percentual de doadores de sangue


M 30
F 70

9
Percentual de doadores de sangue segundo o sexo

30%
M F

70%

Grfico de disperso utilizado para verificar a relao entre 2 variveis quantitativas.

Exemplo:
Idade Peso
25 52
30 55
35 62
40 70
Grfico de disperso: Relao entre a idade e o peso
80

60

40
Peso
20

0
24 26 28 30 32 34 36 38 40 42
Idade

Grfico de sries temporais utilizado para representar uma varivel no tempo.

Exemplo:

Anos 1990 1993 1995 1997 2000 2003 2005 2007


N de mortes por fumo 2350 2500 2920 2400 3200 3300 3450 4000

10
Grfico de Sries Temporais: Mortes de fum antes por ano
5000
4000
3000
N de fum antes 2000
1000
0
1990 1993 1995 1997 2000 2003 2005 2007
Ano

Grfico de Ogiva Trata-se de um grfico de linha que representa as freqncias acumuladas.

Exemplo:
Peso N de pessoas Fac
55 3 3
65 5 8
75 9 17
85 5 22
95 6 28

Grfico de Ogiva
30

25

20

15
FAC (n de pess oas )
10

0
55 65 75 85 95
Pes o

Grfico de Histograma: quando os dados esto agrupados em classes.

Exemplo: As freqncias de idades em anos de um grupo de contadores.

Classe Freq. Absoluta


0 |- 10 2
10 |- 20 3
20 |- 30 9
30 |- 40 4
11
40 |- 50 1

Exerccios:

1) A tabela abaixo representa os suicdios ocorridos no Brasil em 1986, segundo a causa atribuda:
Causas atribudas Frequncia
Alcolismo 263
Dificuldade financeira 198
Doena mental 700
Desiluso amorosa 416
Outras 406

a) Faa um grfico de barra para representar as causas de suicdios no Brasil em 1986.

2) A tabela abaixo se refere aos nmeros de estabelecimentos de sade por setor (pblico ou
privado) segundo algumas espcies.
Estabelecimentos
Espcie
Pblicos Privados
Hospital 1.002 5.132
Pronto-socorro 150 156
Policlnicas 1.531 6.136
Outros (1) 14.393 472
(1) Inclui postos de sade, centros de sade e unidades mistas.
A partir dos dados faa:
a) Um diagrama de colunas simples para representar o setor privado.

3) Faa uma representao grfica de histograma do conjunto de dados abaixo:


Volume Exportado (US$) Nmero de Empresas
50 000 60 000 8
60 000 70 000 10
70 000 80 000 16
80 000 90 000 14
90 000 100 000 10
100 000 110 000 5
110 000 120 000 2

12
4) A tabela a seguir relaciona os pesos (em centenas de libras) e as taxas de consumo de combustvel
em rodovia (em mi/gal) para uma amostra de carros de passeio novos. Construa um grfico de
disperso?

Peso (x) 29 35 28 44 25 34
Combustvel(y) 31 27 29 25 31 29

5) A distribuio de freqncias a seguir exibe os nmeros de casos peditricos de Aids registrados


nos Estados Unidos entre 1983 a 1987. Construa o grfico de srie temporal.

Ano Nmero de casos


1983 87
1984 122
1985 187
1986 250
1987 330

2.3.Sries Estatsticas

Denominamos srie estatstica toda tabela que apresenta a distribuio de um conjunto de


dados estatsticos em funo da poca, do local ou da espcie.

Conforme varia os elementos da srie podemos classific-las em histrica, geogrfica e especfica.

Srie Histrica, tambm chamada de cronolgica e temporal So aquelas discriminadas


segundo os intervalos de tempo.
Exemplo:
Produo de borracha Natural
Anos Produo (em toneladas)
1991 29.543
1992 30.712
1993 40.663
Fonte: IBGE,1981.

Srie Geogrfica, tambm conhecida por territoriais ou de localizao So aquelas


discriminadas segundo as regies.
Exemplo:

13
Durao mdia dos estudos
superiores
Pases N de anos
Itlia 7,5
Alemanha 7,0
Frana 7,0
Holanda 5,9
Inglaterra menos de 4 anos
Fonte: Revista Veja, 1994.

Sries especficas ou categricas So aquelas discriminadas segundo especificaes ou


categorias.
Exemplo:
Avicultura brasileira

Espcies N (1.000 cabeas)


Galinhas 204.16
Frango 435.465
Codorna 2.488
Fonte: IBGE, 1992.

Exerccios

1) A tabela abaixo mostra a distribuio percentual da superfcie, segundo regies: Brasil, 1980.
Qual a Srie Estatstica deste exemplo?
Regio Superfcie (%)
Norte 42
Nordeste 18
Sudeste 11
Sul 7
Centro-Oeste 22

2) A tabela a seguir mostra a evoluo dos coeficientes de mortalidade por tuberculose, na


cidade do Rio de Janeiro, no perodo 1855-1990. Qual a Srie Estatstica deste exemplo?
Ano Coeficiente por 100 mil hab.
1855 850
1860 1000
1870 700
1880 615
1890 530
1900 400

14
3) Faa uma busca em revistas, internet ou jornais e selecione um exemplo de cada tipo de
Srie Estatstica.

Notao de somatrio
A letra grega maiscula SIGMA () utilizada para denotar o somatrio das observaes de uma
varivel.
n

xi
i 1
Representa a soma de todos os valores da varivel x com ndice variando de 1 n.

3. Medidas de Tendncia Central

A anlise de variveis quantitativas costuma sintetizar as informaes contidas nos dados sob a
forma de medidas, que podem ser representadas em diferentes grupos, como as medidas de posio.

Medidas de posio central, como o prprio nome revela, preocupam-se com a caracterizao e a
definio do centro de dados.

As medidas mais importantes so: mdia, moda e mediana.

Os centros de dados

Imagine que um professor desejasse comparar a performance de dois alunos na sua disciplina,
atravs dos conceitos obtidos durante o semestre. As notas dos dois alunos esto apresentadas na
tabela seguinte:

Aluno Notas
Pedro 7 4 8 5
Thiago 3 9 4 6

Provavelmente, a primeira idia e o primeiro procedimento empregado para sintetizar a informao


contida nas notas dos dois alunos envolveria a obteno de mdias.

Aluno Mdia
Pedro 6,0
Thiago 5,5

OBS: Segundo os valores encontrados, seria possvel concluir que Pedro apresentou uma
performance acadmica ligeiramente superior a Thiago. A mdia, assim como as demais medidas de
tendncia central, correspondem a valores que resumem o comportamento central dos dados e
podem representar um conjunto de dados.

15
3.1 Mdia Aritmtica

A mdia , provavelmente, a mais usual medida em pregada em estatstica. Corresponde a um valor


representativo do centro geomtrico de um conjunto de dados, apresentando um valor nico e
utilizando todos os dados analisados no seu clculo. Alm disso, apresenta a importante
caracterstica, nem sempre desejvel, de ser sensvel aos valores discrepantes, ou seja,
demasiadamente extremos em relao ao universo estudado.

Conjunto de dados simples:

definida pelo somatrio dos dados dividido pela quantidade de nmeros da srie.

xi
x i 1

Conjunto de dados agrupados:

Quando os dados analisados estiverem tabulados, isto , contados, torna-se preciso ponderar as
somas dos dados por suas freqncias.

xifi
x i 1

Clculo da mdia para um conjunto de dados agrupados em intervalos de classes:

Para dados agrupados em classe, a mdia resulta de uma ponderao dos pontos mdios pelas
freqncias.

PM * fi
n
Onde PM o ponto mdio de cada classe.

Exerccios:

16
1) Um sorveteiro vendeu, nas quatro ltimas semanas, 1.500, 1.300, 1.100 e 1.800 picols. Qual
foi a quantia mdia vendida na semana?

2) Os salrios de quatro funcionrios das Indstrias Maquinarias Ltda. So: 20.000,00;


30.000,00; 15.000,00; 10.000,00. Determine a mdia aritmtica de seus salrios?

3) A tabela a seguir mostra o nmero de vezes que alunos estiveram ausentes das aulas em
determinada semana. Encontre a mdia aritmtica?
Aulas perdidas em uma semana Nmero de vezes (Freqncia)
0 8
1 10
2 12
3 6
Total

4) Voc recebeu uma proposta de trabalho, em que poder optar pela empresa que ir atuar. Os
dados abaixo representam os salrios dos funcionrios destas duas empresas.

Empresa A
Salrio (R$): 900 650 700 520 3600 680

Empresa B
Classes Salariais N de
(R$) empregados
600 |---760 2
760 |---920 3
920 |---1080 1

Pede-se:
a) O salrio mdio de cada empresa.
b) Com base nos resultados acima, que empresa voc escolheria para trabalhar?

3.2 Mediana

A mediana o valor central de um conjunto de dados ordenados. Uma distribuio ter 50%
dos seus valores antes e 50% dos valores depois da mediana.

De todas as vantagens relacionadas para a mediana, a principal consiste no fato de no ser


afetada por valores extremos.

Clculo da mediana para dados no agrupados:

Tendo um n mpar de observaes a mediana ser exatamente o valor central dos dados
ordenados

17
Tendo um n par de observaes a mediana ser a mdia aritmtica dos dois valores
centrais, estando o conjunto de dados ordenados.

Exemplo:

Idades: 53 55 48 46 50

Idades: 22 24 18 27

Exerccios

1) Os nmeros de defeitos existentes em diferentes lotes de tecidos foram iguais a: 37 45 52


610 49 55 37. Qual a mediana destes valores?

2) Os dados a seguir referem-se ao nmero de livros estudados por ms em uma determinada


turma de Contabilidade durante 12 meses. Calcule a mediana?

10 9 8 5 5 3 5 5 6 7 9 11

3.3 Moda

o valor mais freqente de um conjunto de dados.

A distribuio pode ser:


Unimodal 1 moda
Bimodal 2 modas
Multimodal 3 ou mais modas
Amodal sem moda

Para dados no agrupados:

Exemplos:

Calcule e classifique a Moda das distribuies abaixo:

a) 17 23 17 25 38
b) 43 49 51 57 60
c)
Xi fi
35 3
40 3
45 5
50 2

18
Para dados agrupados em classes, h diversas frmulas para o clculo da Moda:

Frmula de Czuber: para calcular a moda com base nesta frmula, devem ser seguidos alguns
passos:

1 Passo: Identifica-se a classe modal (aquela que possuir maior freqncia).

2 Passo: Aplica-se a frmula.

1
Mo l h
1 2
Em que:

l = limite inferior da classe modal


1 = diferena entre a freqncia da classe modal e a imediatamente anterior
2 = diferena entre a freqncia da classe modal e a imediatamente posterior
h = amplitude da classe

Exemplo: Determinar a moda para a distribuio.


Classes F
0 |- 1 3
1 |- 2 10
2 |- 3 17
3 |- 4 8
4 |- 5 5
Total 43

1 Passo: Indica-se a classe modal. No caso, trata-se da 3 classe 2 |- 3.

2 Passo: Aplica-se a frmula.

l=2
1 = 17 10 = 7
2 = 17 8 = 9
h=1

Portanto:

7
Mo 2 1 2,44
79

19
Exemplo;

1) A distribuio das idades de um grupo de alunos matriculados em Teoria da Administrao


pode ser vista na tabela seguinte. Pede-se cacule a moda dos alunos?

Idade em anos Freqncia simples


17 |- 19 1
19 |- 21 4
21 |- 23 8
23 |- 25 6
25 |- 27 4

Exerccios complementares:

1) O administrador de uma rede hospitalar est fazendo um estudo sobre o nmero de internaes
por dia em duas clnicas, para isto ele avaliou o n de internaes em cinco dias, conforme tabela
abaixo. Calcule:
a) o nmero mdio de internaes da clnica A? e da B?
b) o nmero mediano de internaes da clnica A? e da B?
c) o nmero modal de internaes da clnica A? e da B?
Clnica A Clnica B
13 14
10 11
12 15
9 9
13 11

2) Numa turma de 20 alunos, 5 tiraram nota 6; 8 tiraram nota 8; 2 tiraram nota 7; 3 tiraram nota 9 e
2 tiraram nota 10. Qual a nota mdia desta turma?

3) Uma auditoria em grande empresa observou o valor de algumas notas fiscais emitidas durante
um ms. Esta amostra apresentou os seguintes valores em dlares. Calcule a Moda.

23.440,00 15.315,00 42.320,00 23.313,00 12.417,00 38.000,00 32.414,00


35.780,00 22.010,00 30.400,00 35.318,00 23.300,00 6.551,00 34.782,00
26.432,00 22.300,00 40.300,00 32.000,00 30.000,00 12.319,00 27.312,00
20.414,00 18.620,00 21.350,00 13.253,00 27.435,00 30.515,00 25.400,00

4) Uma indstria embala peas em caixas com 100 unidades. O controle de qualidade
selecionou 48 caixas na linha de produo e anotou em cada caixa o nmero de peas defeituosas.
Obteve os seguintes dados:

2 0 0 4 3 0 0 1 0 0
1 1 2 1 1 1 1 1 1 0
1 2 0 2 0 0 0 0 0 0

20
0 0 3 0 0 0 2 0 0 1
0 0 0 0 0 0 1 0

a) Calcule a moda
b) Qual grfico poderia representar os dados?

5) Um produto acondicionado em lotes contendo cada um deles 10 unidades. O lote s


aprovado se apresentar um peso superior a 40 quilos.
Se as unidades que compem determinado lote pesam: 3; 4; 3,5; 5; 3,5; 4; 5; 5,5; 4; 5, este
lote ser aprovado? Qual o peso mdio dos produtos?

6) A tabela a seguir apresenta a distribuio das importaes de uma empresa de plsticos. Pede-se
calcular a Moda.

Volume importado Freqncia absoluta


50 |- 60 6
60 |- 70 9
70 |- 80 20
80 |- 90 10
90 100 5
Total 50

4. Medidas de Disperso

As medidas de disperso, objeto central desta anlise, completam a informao contida nas
medidas de posio, revelando o afastamento absoluto ou relativo dos dados. Quanto maior a
disperso, menor a informao contida na medida de posio central.

Muitas medidas de disperso, como o desvio mdio, a varincia ou o desvio-padro,


analisam o afastamento em relao mdia.

So utilizadas para verificar a variabilidade dos dados.

As medidas de disperso mais importantes so:

4.1 Amplitude total

Denotada pela letra grega delta (). Compreende a diferena entre o maior e o menor valor de um
conjunto de dados.

Ex: 5 4 2 9 3

21
4 = 9 2 = 7

4.2 Varincia:

A varincia corresponde ao somatrio do quadrado da diferena entre cada elemento e sua mdia
aritmtica, posteriormente pela quantidade de elementos do conjunto.

xi x
2

Var
n 1
Conjunto de dados simples:

OBS: Quando se trata de uma populao, o denominador no clculo da varincia representado


somente por n. A diviso por n-1, se d quando o clculo feito para amostras. Como trabalhamos,
em grande parte do tempo, com dados extrados de uma amostra, a frmula da varincia ficar como
a mostrada acima. Varincia amostral pode ser representada pela letra s.

4.3 Desvio padro (s2)

De um modo geral, o desvio padro representa a mais clssica medida de disperso da estatstica.
Sua associao ao valor da mdia, somado ou subtrado, permite encontrar e determinar as
freqncias relativas dos valores analisados.

O desvio padro corresponde raiz quadrada da varincia.

Compara a variabilidade de variveis com a mesma medida.

DP var

4.4 Coeficiente de variao (CV)

A mais usual medida de disperso relativa o coeficiente de variao, representado pela razo entre
o desvio padro e a mdia aritmtica.

Compara a variabilidade de variveis com medidas diferentes.

DP
CV
x

Exemplo para dados no agrupados: Calcule a amplitude, a mdia, a varincia, o desvio padro e
coeficiente de variao para o conjunto de dados abaixo:
X: 17 5 8 6 4

22
Exerccios:

1) A produo de manteiga dos ltimos seis meses do Laticnio Sabor de Leite Ltda, est
apresentada a seguir. Com base nos nmeros apresentados, calcule a mdia, a varincia, o
desvio padro e o coeficiente de variao.

11 8 4 10 9 12

5 .Medidas de Ordenamento

So valores que ocupam determinados lugares de uma srie ordenada.

23
Esquema

50% Me 50%

P10 P25 P50 P75 P90

Q1 Q2 Q3

D1 D2 D3 D4 D5 D6 D7 D8 D9

Quartil: Divide a distribuio em 4 partes iguais em um conjunto ordenado de valores.

Eis uma descrio dos quartis:

Q1 (primeiro quartil): Separa os 25% inferiores dos valores ordenados dos 75% superiores.
Q2 (segundo quartil): O mesmo que a mediana; separa os 50% inferiores dos valores ordenados dos
50% superiores.
Q3 (terceiro quartil): Separa os 75% inferiores dos valores ordenados dos 25% superiores.

Percentil: Divide a distribuio em 100 partes iguais em um conjunto ordenado de valores.

Decil: Divide a distribuio em 10 partes iguais em um conjunto ordenado de valores.

Percentis

A mediana de um conjunto de dados o valor do meio, de modo que 50% dos valores so iguais ou
menores do que a mediana e 50% dos valores so iguais ou maiores do que a mediana. Assim como
a mediana divide os dados em duas partes iguais, os trs quartis, representados por Q1, Q2 e Q3,
dividem os valores ordenados em quatro partes iguais.

24
A seguir ser mostrado um procedimento para clculo dos percentis.

H tambm 99 percentis, representados por P 1, P2, ..., P99, que dividem os dados em 100 grupos com
cerca de 1% dos valores em cada um.

O processo para encontrar o percentil que corresponde a determinado valor de x indicado na


expresso seguinte:

nmero de valores menores que x


percentil do valor x 100
nmero total de valores

Exemplo 1: A tabela abaixo lista 40 nveis ordenados de cotinina para fumantes. Ache o percentil
correspondente ao nvel de cotinina 112.
0 1 1 3 17 32 35 44 48 86
87 103 112 121 123 130 131 149 164 167
173 173 198 208 210 222 227 234 245 250
253 265 266 277 284 289 290 313 477 491

Soluo:
Ordenar os dados.

Na tabela vemos que h 12 valores menores que 112, de modo que:

12
percentil de 112 100 30
40

Interpretao: O nvel de cotinina 112 o 30o. percentil.

Exemplo 2: Ache o percentil correspondente ao nvel de cotinina 227?

25
Exemplo 3: Ache o percentil correspondente ao nvel de cotinina 164?

Exemplo 4: Ache o percentil correspondente ao nvel de cotinina 284?

Exemplo 5: Ache o percentil correspondente ao nvel de cotinina 17?

6. Intervalo de Confiana

uma amplitude ou um intervalo de valores que tem probabilidade de conter o verdadeiro


valor da populao.
A mdia amostral a melhor estimativa pontual da mdia populacional.
Portanto possvel calcular um intervalo de que permite estimar a faixa na qual a mdia
verdadeira poder ser encontrada.
Os limites deste intervalo de confiana, conhecidos como limites de confiana, so dados
pela expresso:

Limites de confiana de , com n medidas repetidas:

26
ts
x
n

x= mdia
s = desvio padro
n = tamanho da amostra
t = um parmetro que depende do nmero de graus de liberdade e do nvel de confiana que se
deseja (1% ou 99%, 5% ou 95% e 10% ou 90%). O valor de t verificado na Tabela do Teste t.

Exemplo 1: A mdia de quatro determinaes do contedo de cobre de uma amostra de liga foi de
8,27% com desvio padro 0,17%. Calcular o limite ou intervalo de confiana, com = 5% ou 95%,
do verdadeiro valor.

Resoluo: pela Tabela de t, o valor de t com = 5%, com (n 1) graus de liberdade, ou seja, com 3
graus de liberdade, : 3,18.

Ento, pela equao:

Limite de confiana:

3,18 * 0,17
8,27
4

8,27 0,27

Assim, h a confiana de 95% de que o verdadeiro valor do contedo de cobre na liga esteja
no intervalo 8,00 a 8,54%.

Exemplo 2: A vida til mdia de uma amostra de n=10 lmpadas mdia (4000 horas), com desvio
padro da amostra (200 horas). Calcular o intervalo de confiana com 95%, do verdadeiro valor. (t =
2,26)

27
Exemplo 3: Suponha que uma amostra de 100 faturas de vendas seja selecionada, a partir da
populao de faturas de vendas, durante um ms, e a mdia da amostra foi 110,27 reais, com desvio
padro de 28,95 reais. Calcule o intervalo de confiana com 95% do verdadeiro valor. (t = 1,98)

7. O Erro padro das Mdias

A mdia aritmtica de uma determinada amostra consolida a mdia de todos os valores na


amostra.
Uma populao pode consistir em resultados individuais, que podem assumir uma grande
amplitude de valores, desde extremamente pequenos at extremamente grandes.
No entanto, se um valor extremo cair na amostra, embora v ter um efeito na mdia
aritmtica, este ser reduzido, uma vez que a mdia est sendo calculada juntamente com
todos os outros valores da amostra.
medida que cresce o tamanho da amostra, o efeito de um simples valor extremo vai se
tornando menor, uma vez que a mdia est sendo calculada juntamente com outras tantas
observaes.
Esta medida de variabilidade da mdia aritmtica, de amostra para amostra, chamada de
Erro padro da mdia (mdia ou SE).

Erro padro: corresponde a /n, ou seja, inversamente proporcional ao tamanho da


amostra. ( ou s)

medida que cresce o tamanho da amostra, o erro-padro da mdia aritmtica ir decrescer


em um fator raiz quadrada do tamanho da amostra.

28
Exemplo 1: Se uma amostra de 25 caixas for selecionada aleatoriamente sem reposio, a partir de
mais de 5000 caixas abastecidas por turno, a amostra contm, de longe, bem menos do que 5% de
toda a populao. Se o desvio padro do processo de abastecimento de cereais for igual a 15 gramas,
calcule o erro padro da mdia aritmtica?

s 15 15
= = =3
mdia = n 25 5

Exemplo 2: Se uma amostra de 40 caixas for selecionada aleatoriamente sem reposio. Calcule o
erro padro da mdia aritmtica?

Exemplo 3: Se uma amostra de 100 caixas for selecionada aleatoriamente sem reposio. Calcule o
erro padro da mdia aritmtica?

8. Distribuio Normal

a. Medidas de Assimetria

Essas medidas referem-se forma da curva de uma distribuio de freqncias, mais


especificamente do polgono de freqncia ou do histograma.

29
Dizemos que uma distribuio simtrica quando a mdia, a moda e a mediana coincidem. Quando
a mdia, a mediana e a moda so diferentes a distribuio dita assimtrica. A assimetria pode ser
positiva ou negativa.

As medidas de assimetria procuram caracterizar como e quanto distribuio de freqncia se afasta


da condio de simetria.

Assimetria positiva (assimetria direita)


A mdia apresenta um valor maior que a mediana, que, por sua vez, apresentar um valor maior do
que a moda. Assim,

x Md Mo
Assimetria negativa (assimetria esquerda)
A mdia ser menor do que a mediana e esta ser menor do que a moda.

x Md Mo
Simtrica
A mdia, a mediana e a moda so iguais.

x Md Mo

Graficamente:

30
Calculo do Coeficiente de Assimetria de Pearson

Proposto por Pearson como uma maneira de avaliar o grau de deformao da curva, isto ,
indicar a grandeza do afastamento em termos relativos.

X Mo
AS
DP

AS = 0: distribuio simtrica.

AS > 0: distribuio assimtrica positiva ou direita.

AS < 0: distribuio assimtrica negativa ou esquerda.

Exemplo 1:

Dada uma distribuio amostral. Calcular o Coeficiente de Assimetria de Pearson?


Onde mdia = 66,875, moda = 41,429 e desvio-padro = 31,96.

Salrios Empregados
30 |- 50 80
50 |- 100 50
100 |- 150 30

31
Resoluo:

66,875 41,429
AS 0,796
31,96

Concluso: Como As > Zero, diz-se que a distribuio assimtrica positiva.

Exemplo 2:

Dada uma distribuio amostral. Com mdia = 3,89, moda = 1,50 e desvio-padro = 2,70.
a) Calcular o Coeficiente de Pearson?

b) Atravs do Coeficiente de Pearson qual o tipo de assimetria que pertence esses dados?

a) ( ) assimtrica positiva direita


b) ( ) assimtrica negativa esquerda
c) ( ) simtrica

b. Curvas Achatadas ou Alongadas ou Curtose

A anlise de curtoses busca estudar o grau de achatamento ou alongamento da distribuio. As


diferentes formas das distribuies podem ser vistas:

a) Platicrtica: curvas achatadas apresentam menor curtose.

32
b) Mesocrtica: curvas perfeitas, nem achatadas, nem alongadas e de curtose mediana.

c) Leptocrtica: curvas alongadas com alta curtose.

c. Distribuio Normal ou Curva Normal ou de Gauss

Aps aprender a calcular o desvio padro, com certeza observou que ele uma das medidas mais
importantes da Estatstica bsica. Entretanto, algumas dvidas ainda ficaram no ar. Por exemplo:

No possvel avaliar a dimenso de um , a no ser comparando o com outro?

At agora s sabemos que, se A = 3 e B = 6, ento o conjunto de B tem o dobro da disperso


do conjunto A. Algo assim como dizer que fulano tem o dobro da idade de sicrano, sem todavia
conhecer a idade de um ou de outro. Daqui para frente, com o conhecimento da curva normal, tudo
ficar mais fcil.

Exemplo: Faa um Histograma para os dados agrupados em classe, na tabela abaixo, relativos s
estaturas dos alunos da FCECA, ano 1977.

Estaturas (cm) N de alunos(fi)


150 | 156 4
156 | 162 6
162 | 168 10
168 | 174 8

33
174 | 180 6

Temos, assim, que uma curva de distribuio pode descrever a forma da distribuio de uma
populao. Conhecendo-se a forma e mais a mdia e o desvio-padro, completa-se a caracterizao
dessa populao.

Como veremos em seguida, essas curvas que representam a distribuio de uma populao
de dados, vo permitir que se calculem probabilidades a respeito da varivel representada.

Um tipo de curva bastante comum para representar a distribuio de populaes de dados


biolgicos a curva normal ou curva de Gauss, cujas caractersticas e aplicaes sero vistas neste
captulo.

0,5 0,5

34
1- Propriedades da Curva Normal

1.1- Deve-se mencionar que a rea entre uma curva normal e o eixo horizontal igual a 1 ou
100%.

1.2- A curva simtrica em torno do ponto x = (mdia) e tem forma aproximada de um sino.

1.3- Portanto, para cada par de nmero e pode ser traada uma curval normal.

2- reas sob a Curva Normal

Como vimos anteriormente na construo de histogramas, a proporo de observaes que caem


entre dois valores quaisquer, digamos x1, e x2, pode ser determinada medindo-se a rea sob o
histograma, entre x1 e x2.

Existem tabelas preparadas para isto. Como seria impossvel fazer uma tabela para cada curva
normal, faz-se uma transformao nos dados de modo que uma tabela apenas, para uma curva
normal particular, chamada curva normal padro, ser suficiente.

Quando a varivel em estudo tiver distribuio normal, poderemos usar a tabela preparada para a
curva normal padro, desde que substituamos o valor de x para o qual queremos a rea, pelo nmero
de desvios padro que esse valor de x est afastado da mdia. Isso equivale a calcular o desvio (x -
) / .

Essa transformao, aplicada a cada valor de x, produz uma nova varivel:

x
z

z = distribuio normal reduzida


= este parmetro especifica a posio central (mdia) da distribuio da probabilidade.

35
= este parmetro especifica a variabilidade (desvio padro) da distribuio de probabilidades.

A nova varivel z tambm chamada varivel reduzida ou desvio relativo, pois mede o
afastamento dos valores de x em relao mdia, em unidades de desvio padro.

Exemplo 1: Suponhamos uma populao de estaturas de homens adultos, com distribuio normal,
mdia 172cm e desvio padro 5cm. Um homem com 177cm, por exemplo, tem qual z reduzido?

Exemplo 2: Suponhamos uma populao de estaturas de homens adultos, com distribuio normal,
mdia 172cm e desvio padro 5cm. Um homem com 167cm, por exemplo, tem qual z reduzido?

OBS: Com o valor de z pode-se procurar na tabela o percentual da distribuio.

Exemplo 1: Como ilustrao, suponhamos que se deseja encontrar a rea de z = 1,42.

OBS: Procurar na Tabela em anexo.

36
Na tabela procura-se na 1 coluna at encontrar o valor de = 1,4, depois segue-se na mesma linha
para a direita at a coluna encabeada por 0,02 (isto completa z = 1,42), encontrando, no corpo da
tabela, na interseco dessa linha com essa coluna, 0,4222 ou seja, 42,22%. Esta a rea desejada.

Exemplo 2: Deseja encontrar a rea de z = 2,78.

Exemplo 3: Deseja encontrar a rea de z = 0,65.

Suponhamos agora que se deseje encontrar a rea sob parte de uma curva normal com mdia
diferente de zero e desvio padro diferente de 1. Ser necessrio, inicialmente, transformar a
varivel x original em varivel reduzida.

Exerccios:

1- Uma anlise estatstica de 1.000 chamadas telefnicas de longa distncia, realizadas nos
escritrios da Embratel, indica que a durao destas chamadas distribuda de forma normal,
com mdia de 240 segundos e desvio padro 40 segundos.

a) Que percentagem destas chamadas durou menos de 180 segundos?

b) Qual a probabilidade de que uma determinada chamada tenha durado mais de 180 segundos?

c) Qual a probabilidade de que uma determinada chamada tenha durado menos que 310
segundos?

d) Qual a probabilidade de que uma determinada chamada tenha durado mais de 270 segundos?

2- Um conjunto de notas de provas finais, em curso de Introduo Estatstica, foi considerado


como normalmente distribudo, com uma mdia igual a 73 e um desvio padro igual a 8. Que
percentual de alunos tirou entre 65 e 89?

37
9. Noes de Testes de Hipteses

Muitas vezes o pesquisador tem alguma idia, ou conjetura, sobre o comportamento de uma
varivel, ou de uma possvel associao entre variveis. Nestes casos, o planejamento da pesquisa
deve ser de tal forma que permita, com os dados amostrais, testar a veracidade de suas idias sobre a
populao em estudo. Adotamos que a populao seja o mundo real e as idias sejam as hipteses de
pesquisa, que podero ser testadas por tcnicas estatsticas denominadas de testes de hipteses ou
testes de significncia.

Testes Paramtricos: so testes em que se conhece a forma da distribuio da populao da qual foi
retirada a amostra.

1) Teoria dos testes de Hipteses

Hiptese: alegao ou afirmao sobre uma propriedade de uma populao.

Testes de hipteses: representam uma regra de deciso que permite rejeitar ou no uma
hiptese questionada, sendo a deciso tomada em funo de valores obtidos em uma
amostra.

Objetivo do teste de hiptese: fornecer ferramentas que nos permitam validar ou rejeitar
uma hiptese atravs dos resultados da amostra.

2) As Hipteses de um Teste Estatstico

O teste de hipteses geralmente tem incio com base em alguma teoria, declarao ou afirmativa,
em relao a um determinado parmetro de uma populao (tal como ).

a) Hiptese Nula (H0)

Para realizar tal teste, comeamos com a afirmao de que a mdia da populao igual a algum
valor postulado 0. Essa afirmao sobre o valor do parmetro da populao chamada hiptese
nula ou H0. Ou seja, hiptese que ser testada; admite-se aqui que a diferena observada entre a
estatstica amostral e o parmetro populacional devida apenas ao acaso, ou seja, essa diferena no
significativa.

b) Hiptese alternativa (HA ou H1)

38
Representada por HA, uma segunda afirmao que contradiz H0. Qualquer hiptese diferente da
hiptese nula; admite-se aqui que a diferena observada entre a estatstica amostral e o parmetro
populacional significativa.

Exemplo: Se quisssemos testar se o nvel mdio srico de colesterol as subpopulao de fumantes


hipertensos igual mdia da populao geral de homens de 20 a 74 anos:

a) hiptese nula (H0): = 0 = 211mg/100ml.


b) hiptese alternativa (HA): 211mg/100ml.

Juntas, as hipteses nula e alternativa cobrem todos os valores possveis da mdia da populao;
conseqentemente, uma das duas afirmaes verdadeira.

3) Erros de Deciso

Ao ser utilizada uma estatstica da amostra para tomar decises sobre um parmetro da
populao, existe um risco de que uma concluso incorreta seja obtida. Dois tipos de erro podem
ocorrer ao ser aplicada a metodologia de teste de hipteses: Erros do Tipo I e Erros do Tipo II.

c) Erro do tipo I: ocorre caso a hiptese nula (H0), seja rejeitada quando, de fato, ela
verdadeira e no deveria ser rejeitada. A probabilidade de ocorrer um erro do Tipo I

representada atravs de .

d) Erro do tipo II: ocorre caso a hiptese nula (H0), no seja rejeitada quando, de fato,
ela falsa e deveria ser rejeitada. A probabilidade de ocorrer um erro do Tipo II
representado atravs de .

4) Nvel de significncia

Reflete a preciso desejada pelo investigador para testar a hiptese nula. A escolha do valor
completamente arbitrria, sendo convencionalmente utilizado o valor 0,05 (5%).

5) Eficcia de um Teste

a probabilidade de que
seja rejeitada a hiptese nula quando de fato ela for falsa e deva ser rejeitada, representada por 1 .

Tabela: Teste de hipteses e tomada de deciso.

39
Deciso Estatstica H0 Verdadeiro H0 falso
No rejeitar H0 Deciso correta Erro do Tipo II
Rejeitar H0 Erro do Tipo I Deciso correta

6) Regies de Rejeio e de No-rejeio

A distribuio de amostragem da estatstica do teste dividida em duas regies, uma regio


de rejeio (s vezes chamada de regio crtica) e uma regio de no-rejeio.

Caso a estatstica do teste se posicione na regio de no-rejeio, a hiptese nula no pode ser

rejeitada.

Caso a estatstica do teste se posicione em uma regio de rejeio, a hiptese nula rejeitada.

Teste Unilateral: rejeita-se a Ho em apenas uma cauda da distribuio.

Teste Bilateral: rejeita-se a Ho em ambas as caudas.

Para tomar uma deciso com relao hiptese nula, voc primeiramente determina o valor
crtico da estatstica do teste. O valor crtico faz a diviso entre a regio de no-rejeio e a regio de
rejeio.

40
7) Testes de Hipteses para Duas Amostras

Existem dois tipos de desenhos experimentais: independentes e pareados


.

Dependentes ou pareados: existe uma relao de forma que os valores de uma amostra esto
emparelhados com os valores da outra amostra.

Exemplo: Realizou-se um estudo para investigar alguns efeitos do treinamento fsico numa
empresa. Os dados amostrais esto relacionados a seguir. Com nvel de significncia 0,05, teste a
afirmao de que o peso mdio antes do treinamento igual ao peso mdio aps o treinamento?

Indivduo Antes do treinamento Aps o treinamento


A 99 94
B 57 57
C 62 62
D 69 68
E 74 66

Independentes: valores amostrais de uma populao no esto relacionados (emparelhados ou


combinados) com os valores amostrais selecionados da outra populao.

Exemplo: Uma emissora de televiso de Nova York decide produzir um documentrio comparando
duas ferrovias na rea. Analistas de sistemas da emissora de televiso realizaram amostras sobre o
cumprimento de horrio para vrias viagens de trem, com horrio marcado em relao a cada
ferrovia. Os dados sobre a quantidade de minutos que o trem est adiantado (nmeros negativos) ou
atrasado (nmeros positivos) so apresentados a seguir:

Ferrovia A Ferrovia B
5 8
9 10
12 14
21 7
15 12
18
10
20

41
10. Correlao Linear de Pearson

Objetivo: verificar se h ou no uma relao entre duas variveis e, se tal relao existir
(correlao).

1- Correlao Linear

Dizemos que duas variveis, X e Y, esto positivamente correlacionadas quando elas



caminham num mesmo sentido ( ).


Esto negativamente correlacionadas quando elas caminham em sentidos opostos ( ).

Tcnicas de correlao so usadas para verificar existncia de relacionamentos;

Podem ser usadas na anlise exploratria e em testes de hipteses.

Ferramentas da anlise de correlao:

a) Diagrama de disperso (grfico)

Uma maneira de visualizarmos a (possvel) correlao entre as observaes de duas


variveis, atravs do diagrama de disperso, em que os valores destas variveis so representados
por pontos, num sistema cartesiano. Esta representao feita sob forma de pares ordenados (x,y),
onde x um valor observado de uma varivel e y o correspondente valor da outra varivel.

Exemplo de grfico de disperso: Os dados da tabela a seguir representam uma srie de vendas
anuais reais ao longo de um perodo de 7 anos (1990-1996).

Ano 1990 1991 1992 1993 1994 1995 1996


Vendas 12,0 13,0 17,0 19,0 20,0 20,8 19,0

42
Srie de vendas anuais (1990-1996)
25
20
15
Vendas 10

5
0
1989 1990 1991 1992 1993 1994 1995 1996 1997
Ano

Correlao Positiva: Se as variveis X e Y crescem no mesmo sentido, isto , se quando X


cresce Y em mdia tambm cresce, diz que as duas variveis tm correlao positiva.

Correlao Negativa: Se as variveis X e Y variam em sentidos contrrios, isto , se quando


X cresce, Y em mdia decresce, diz-se que as duas variveis tm correlao negativa.

43
Correlao nula: No existe correlao entre as duas variveis.

Exemplo 1: A tabela seguinte mostra as despesas com propaganda e as vendas associadas de


determinado produto. Desenhe o grfico de disperso e comente h associao entre as duas
variveis.

Despesas (x) Vendas (y)


8 25

44
12 35
11 29
5 24
14 38
3 12
6 18
8 27
4 17
9 30

Arredodamento (Relembrando)

Aproximao de Valores Numricos: so cortes realizados nas casas decimais de valores no


inteiros.

1) Observe em qual casa decimal voc ir fazer a aproximao;

Ex.: Aproximar o valor 12,56789 na segunda casa decimal.

1 2 5 6 7 8 9
Parte Inteira Parte Decimal
1 CD 2 CD 3 CD 4 CD 5 CD

O algarismo da 2 Casa Decimal o 6.

2) Observe o algarismo que est na primeira casa a direita da casa que sofrer a aproximao;

1 2 5 6 7 8 9
1 CD 2 CD 3 CD 4 CD 5 CD

Algarismo da primeira casa a


Algarismo que sofrer direita da casa que sofrer a
a aproximao aproximao

45
Se o algarismo da primeira casa a direita da casa que sofrer a aproximao for maior ou igual que 5, acrescente uma
unidade no algarismo da casa que sofrer a aproximao e abandone todas os algarismos das casas decimais que
estiverem a sua direita. Caso ele seja menor que 5, mantenha inalterado o algarismo da casa que est sofrendo a
aproximao e abandone as demais que estiverem a sua direita.

Exemplos:

a) 3,25679 aproximado na 2 casa decimal fica 3,26.


b) 4,56753 aproximado na 3 casa decimal fica 4,568.
c) 2,43567 aproximado na 1 casa decimal fica 2,4.
d) 1,18697 aproximado na 4 casa decimal fica 1,1870.
e) 3,99950 aproximado na 3 casa decimal fica 4,000.

46