Вы находитесь на странице: 1из 306

,

ESTATISTICA
APLICADA S CINCIAS SOCIAIS
!l

8 edio revista

.
~

PEDRO ALBERTO

BARBETT~

~ editora ufsc

;;','

Esta obra surgiu de vrios anos de


experincia com a atividade de
ministrar aulas de Estatstica para
cursos das reas de Cincias Sociais e
Humanas. Um novo enfoque aqui
desenvolvido, diferenciando este de
outros livros didticos, ao motivar o
aprendizado de tcnicas estatsticas
a partir de situaes prticas e
desenvolver a capacidade criativa
dos alunos com diversos exemplos e
exerccios que j apresentam a
anlise estatstica pronta, deixando
ao aluno a tarefa de interpretar os
resultados. Tudo isso feito com
centenas de figuras, proporcionando
um aprendizado mais rpido e
agradvel.

Pedro Alberto Barbetta

ESTATSTICA
APLICADA S CINCIAS SOCIAIS

8 edio revista

~ editora ufsc

1994, 1997, 1999, 2001, 2003, 2006, 2010 Pedro Alberto Barbetta

Direo editorial:

Paulo Roberto da Silva


Capa:

Paulo Roberto da Silva

s~

Reviso:

Maria Gera/da Soprana Dias

Ficha Catalogrfica
(Catalogao na fonte pela Biblioteca Universitria da
Universidade Federal de Santa Catarina)

G643a

CtossRio d E sMbolos ........... . .. . ..

Barbetta, Pedro Alberto


Estatstica aplicada s Cincias Sociais I Pedro Alberto
Barbetta. 8. ed. rev. - Florianpolis: Ed. da UFSC, 2012.

318p.: il. (Coleo Didtica)


Inclui bibliografia

P1~tCiO ........................ . .. .. .. ... .


CApTulo 1- INTRoduo ....... ........

PARTE

1. Estatstica. 2. Cincias Sociais. I. Ttulo.

o plANEjAMENTO dA Cekt-

1-

CAprulo 2 - PEsouisAS E dAdos .. ...


CDU: 31:3
CDD: 300:21

ISBN: 978-85-328-0604-8

2.1

plAl\EjAMENTO dE U"1A pESOL :~

2.2

DAdos E vARivEis ........... .. ... .

2J

ElAbORAO dE UM QUESTOl\RiO

2.4

UMA ApliCAO ...... .......... ..

2.5

CodifiCAO dos dAd~s ....... .

ANEXO ........................ ........ .. .. .


CApru lo ' - TCNicAs dE AMOSTRAlf-"'

'.l

MOSTRAyEM A[EATRiA SiMplEs .

J.2

UTROS Tipos dE AMOSTRAQE\ S !- -

7J
7.4
7.5

TAMANHO d E UMA AMOSTRA AIEAT_

MOSTRA<:;ENS NO AlEATRiAS ...


foNTES dE ERROS NOS lEVANTA'L

PARTE li
Todos os direitos reservados. Nenhwna parte desta obrapoder ser
reproduzida, arquivada ou transmitida por qualquer meio ou forma
sem prvia permisso por escrito da Eclitora.
impresso no Brasil

C Aprulo

ESCRiO E EXplOR.!-: ,-,

4-

DAdos CATE(iORiZAdos

4.1 C!AssificAO si"1plEs ...... .. ....


4.2 RcpRESENTAEs qRficAs .... .._

SuMRio

dE sMbolos ................... .. .. ....... . .... .. ... ... ....................... .. .... .. ....... 9

ClossRio

? erlro Alberto

PREcio .. .. ......................................... . ......................... .. .. ..... .. . .. . ............ 1}


(Aprulo

INTROduo . ..... .................. ..... .. .................. ..... . .. .. .. .. .. ........ ... 15

1- O plANEjAMENTO dA colETA dos dAdos

PARTE

(Aprnlo

CDU: 31:3
CDD: 300:21

l-

2-

PEsouisAs E d Ados . .... .... .. ... .............. .... .... ... ....... .. .. .. . .. .. .. .. 2}

2.1
2.2
2.7
2.4

plANEjAMENTO

dE UMA

pESQUiSA ... ... ... ... . ... . . ... ...... . ...... .... ... .. ... . . .. .. .. 24

UMA ApliCAO ..... .......... . .. .... . .. . .. . ... ... .. ... . .. ..... .. ...... ........ . .. ... ......

}5

2.5

CodificAo dos dAd~s ..... ... .................... ....... .... . ... ... ... . ........ .. .. ....

77

DAdos E VAJ~ivEis ...... .......... ....... .... .. . ...... . .. ..... ... .. ... . .. ... ... .. ... . .. .. .. .. 29
ElAboRAO dE UM QUESTiONRio .. .. .... ..... ........ .... .. .. ................ . ... .. . .... }2

A\JEXO }9
(Aprnlo } - TCNCAS de AMOSTRAGEM ......................... ... .... .. .. .. .... ... ... ..........

}.1
}.2

41

AMOSTRAGEM AlEATRiA siMplEs .......... . ........................... ...... .... : 45


UTROS Tipos dE A'AOSTRA(jE\JS AlEATRiAS .................... . .... ... ....... ............... 47

~J

AMOSTRA(jENS J\O AlEATRiAS ................................ ........ ....... .. .. ...... .. ........ 54

}.4

T!l.MANHO dE UMA AMOSTRA A[EATRiA SiMplES ............................ ... .. .... ..........

}.5

57
FONTES dE ERROS NOS lEVA\JTA\1ENTOS POR AMOSTRAGEM . ............... ........ ...... ...... 61

PARTE

11 -

(Aprnlo

4.1
4.2

ESCRiO EExplORAO dE dAdos

4-

D Ados CATEGORi7.Ados ............ . .. ... ... . .............. . .. .. . .. ..... ... ...... 65

CIAssificA\o siMplEs .. .. ... . .... .. .. ... ... ................ ......... . .. .... ... ..... ... .. ....

65

REPRESENTAES GRiCAS .. .... . . ... . .. ... ..... . ... ... .. .... . . ... ... ............ . .. ...... 68

4 J DuplA clAssificAO .. . ....... . .. ... .. ... ... .. .. .. ........ ...... ... ... . .. .. .. . ........ .. . .. . 71
ANEXO .. ..... ... .... ...... .. ....... . ... .............. ............ . ... .. . . ... . ... ... . ....................... 77
D Ados QUANliTATivos .. ....... ... ........ .. . .. ....... ..... ..... . ... .. ..... ... ...

79

VARiVEiS diSCRETAS ... . .. ..... .... ...................... ... .... ... ......... .. .. ... .. ....... . .....

79

C Aprulo

5.1
5.2
5J

VARivt:is CONTNUAS . ... . ....... ... ........... .. . .......... .... .... ..... . .... . .. ................. 2
RAMo-E-foU-tAS ... .. ... .. ........... . .............................. ..... . .. ....... . .... .... . ..... .. 88

C ApTulo

5-

MdiA E d Esvio pAdRO ....... . ......................... .. .. ......... ... .......... .... . .. .. .. .. .. 91

6.2
6J
6.4

FRMuAs PARA o clculo dE X E S ........... ...... ...... ........ ....................... ... 95


MEdidAs bASEAdAs NA ORdEMO dos dAdos .... .. . .... .... .. .. ........ . ... .. .. .. ......... 99
RiENTAO PARA ANliSE ExplORATRiA dE dAdos . .. .. . . . ....... ... ... ..... . . 109

PARTE Ili - ModElos dEpRobAbilidAdE


7.1
7.2
7J

8.1
8.2
8J
8.4

7-

ModElos pRobAbilsTicos ... ........ ..... ..... ...... . ... . .. .... . .. .. ... . . ... ...... .

DiSTRibuiES CONTNUAS E MOdElo NORMA[ ..... .... . ...... .. ... . .. .. .. .. ... . . ...

DisrnibuiEs l'lORMAis ... ... ..... . .. ... ...................... ...... .. .. ... .. ... . ... . ...........
lAbElA dA d isTRibuio NORMA[ pAdRo .......................... . ...... . ....... . .. ... ......
DAdos obsERVAdos E MOdElo NOR\1Al ...................... ..... ... .... .. . .. ...... " ..... ..
ApROXi\1AO NORMA[ bi'IOMiA( . ............................. .. ...... ........ ...... .. .....

m
176
IJ9
147
145

PARTE IV - INERNCA ESTATSTCA


C ApTulo

9 - EsTiMAi\ o d E pAR~lETROs ........ .... .... ..... ... .......... .... ..... . .... . .. .. ...

l~

Esr iMAO d E UMA pRopoRo .. .. ... ... . ...... .. .. ........ .. .. ... .. ... .. .. .. .. .. . ..... .... .. 160
Esr iMAO d E UMA MdiA .. .. .. .... .. . .... ........ .. . .. ... ..... . . ....... .... .... . ... . .. ... . . ... 165
CORREES PARA TAMANHO d E populAo CONHECido .... . . .. . ... . ........ . ... . .. .. ...... 170
TAMANHO MNiMo d E UMA AMOSTRA AlEArRiA siMplEs ...... . ... .. ... .... . .. .. . .. ... . . .... 172

CAprulo

10.!
10 .2

10 -

TEST1:s ESTATSTicos d E 1-iipmEs . .... .. .. ... . ... .. ... ... ... ... ... . . ... ... .. .. . ....

179

As HipTESES dE UM TESTE ESTATSTCO .. .... . .. . ......... .. .. . .. .. . .. . .... . .. .. ..... .... . ... . 180
CoNcEiTos b1o\ sicos .... ... .... . ... .. . ...... ..... ... ... .. ... .... .. ... .... .. ..... .. . ... . . .. .. . 152

10} TESTES UNilATERAiS E bilATERAiS .. ..... . ....... .. .. . ......... . ... .... ... ..... ... ......... .. ...... 187

10.4
10.5

Uso dE disrnibuiEs ApRox iMAdAs ............ .. ......... . ... .. .. .. ...... ... ..... . ..........

CApr ulo

12.1
J2.2

12 -

ANlisE de dAdos O:::'~~

TESTE de ASSOCiAO Ql 1-QL


M EdidAS dE ASSOCAO ...

17 .1 DiACjRAMAS d diSPERSO ..

17.2

COEfici ENTE dE CORREIAO

17.7
r~ .4
17.5
17 .6

CoRRElAo poR posrns ...


REGRESSO liNEAR SMples . .
ANlisc dos Resduos e nt~
INTROdUO RECjRESSO ""

ANEXO . .... .. .. .. ...................


R EfERNCiAS . ........ ........ . .... .
ApNdicE ... ..... .. ..... . ... .. .... .
R EsposTAS

9.1 Disrnibuio AMOSTRAl ... . .. ...... ...................... .... ... . .... .. .. .... ..... . . .. ... . 157

9.2
9J
9.4
9.5

PARTE V - REIAO ENTRE VAR'.~\E6

C Aprulo 17 - CORRElAO E RE~

115
DEfiNiES bsicAs .......... .. .. .. ..... ...... ... ............. .. . .. ... . ... . . .... ... .... . .. . ....... 116
MOdElo biNOMiAl: CARACTERi ZAO E USO dA TAbf[A .... . ... . . .. . .. ..... .. .. . . ......... 126
MOdElO biNOMiA[; fORMUlAO MATEMTiCA .. ...... ... . .... . ... . ... .. ....... .. ... .. . .. . 129

CAprulo

ll.1 TESTES dE SiCjNifiCNCiA E dE!;:e


11.2 o TESTE dos SINAIS .. ... ...... .
ll .7 O TESTE T pARA dAdos p~:.eo~
IJ.4 TCSTC T pARA AMOSTRAS -,~
11.5 TAMANHO dAS AMOSTRAS
11.6 CoMENTRios AdlciO\Ais ...

6 - MEdidAs dEscRiTivAs .. .............. ... ... ...... ... ......... .. .. ........ ... ........... 91

6.1

CApTulo

CApfrulo 11 - Tesm d E coMpAA.\Q -

189

Apli CAO dE TESTES ESTATSricos l'>A PESQUSA ...... . ...... ... ... ..... .. .. .......... .. .. .... 191

de AlquNs EXERcc1os

.............. ................. 71
77
.... ..... ........... ...... 79
........ ... ..... ................ . 79

---- 82
............ ..................... 88
.......................... ........ 91
.............. ................. .. 91
........ ... ... ...... .. .... 95
99

.............. .... ............... 109

195
TESTES dE S(ii\ifiCNCA E dEliNEAMENTOS dE PESQUSA ............. . ... .. .. .. ... ... ........ 195
o TESTE dos SiNAiS ...... . ........ .. ...... .......................... ... . ........ . ........... .... . 198
O TESTE T pARA dAdos pAREAdos .. . .. .. .. .. .. ... ... ... . ... . ............. .. ..... ... . .. .. . . .... 201
TESTE T pARA AMOSTRAS iNdEpENdENTES . ...... . ... . ... . ... .. ... ...... ... . ... . ... . ... ..... 209
TAMANHO d As AMOSTRAS . ....... .. . .... .. ........ ............... .. .. .... ...... . . ... ... . ... . ...... 217
CoMENTRios AdiciO"IAis ...... .. . . ... .............. . ....... . ........ ........ .. ..... . ...... ... .. 219

CApTulo

11.J
11.2
li J
11.4
11.5
11.6

................................. ll6

126
.......... .............. ....... 129
177

TESTES dc COMPARAO ENTRE d uAs A\IOSTRAS .................. . .... . .. .. ... . ... .

PARTE V - REIAO ENTRE VARiVEiS


CAprulo

12 -

ANlisE d E dAdos CATE(iORiZAdos ... .. ......... . ............ ... . ... .. .. .. ......... 2Z1

12.1 TESTE dE ASSOCiAO QUi - QuAdRAdO ......... ...... .. ...... . ........ . ........ .. .. . .. . .... 228
12.2 MEdidAs d E ASSOCiAO ..... .. ... .. .... .. .. . ... . .... . ....... .. .. . ... . . ... ..... ... . ... ... . ...... 241
CApTulo

--........ ...... ................. ll5

li -

17.l
17.2

17 -

CORRELAO E RECJREsso . . ... . ......... . ... . ... . ... . .. .. ... ........ ....... ........

D iACjRAMAS dE disprnso ... .. .. .. ... .. ...................................... .. .............. .

o coEficiE\TE dE CORRElAO liNEAR dE PEARSON ................... ... . ... .... .. .. ......

251
252
254

17 J
17.4

CoRRElAO pOR pOSTOS .... ..... ...... ..................................... ..... .. ..... ...... 26~

17.5

ANlisE dos RESduos E TRAf\SIORMAES ..... . ........... . ......... .............. ...... . .... 277

17.6

I NTROdUO RE(iRESSO MhiplA . . ............................... ........ .... . ....... . .. .... 287

RECJREsso

EAR siMplEs .....................................................................

266

ANEXO

288

..... .... .... .... 179


............................. .... 147

R EfERNCAS .... .. .............. .. ... . . ... . . ... ... . ... ... . ......... .. ...... . .. .. ..... .......... . .. ... . .

289

........ ................. ....... 145

ApNdicE ........................... .. .............. . ... . .. ..... .. ........... .. ...... . ...... . ...........

291

176

REsposTAS

................. ......... ......

I~

.157

............... ................. . 160


........ ........ .............. .... 165
......... ........ ........... ...... 170
....... ........ ........ .... ..... 172

........ ............. ........... 179


................... ............. 180
................ ........... .... 182
................. ............ ..... 187

.......... ......... ............. 189


........................ ....... 191

dE Alc;uNs EXERCcios

....... ........................................ .. .... .. ..... .... ...

705

ClossRio dE sMbolos

LETRASdo AlfAbETo pORTuqus

Eo

Significado
Estimativa do coeficiente escalar
(intercepto) de uma reta de regresso
Estimativa do coeficiente angular de uma
reta de regresso
Coeficiente de contingncia
Coeficiente de contingncia modificado
Desvio entre quartis
Extremo inferior
Extremo superior
Margem de erro/ Frequncia esperada
Margem de erro tolerada

gl

Graus de liberdade

Ho
H1
Md

Hiptese nula
Hiptese alternativa
Mediana
Tamanho (nmero de elementos) da
populao
Tamanho (nmero de elementos) da
amostra
Valor preliminar no clculo do tamanho
da amostra
Frequncia observada
Valor p ou probabilidade de significncia
Probabilidade de ocorrer o evento A
Probabilidade de ocorrer o valor x
Quartil inferior

Smbolo

a
b

e
e
do
E1
Es
E

N
n

no

o
p

P(A)
p(.x.j
Q1

Sees
13.4
13.4
12.2
12.2
6.4
6.4
6.4
9.2 , 9.3 / 12.1
3.4, 9 .5
9 .3 , 11.3, 11.4,
12 .l
10.1
10.2
6.3
3.1,3.4
3 . 1,_ 3.4, 7.2
3.4, 9 .5
12.1
10.2
7 .1
7 .2
6.4

10

Smbolo
Qs

r
rs
R2

s
S2
Sp

S-X
SD
Sa

s2a
Se

t
V

x
y
z

Esr11rsrir.11 AplicA<iA

CiNCiAs Soci11is

Significado
Sees
Quartil superior
6.4
Coeficiente de correlao de Pearson
13.2
Coeficiente de correlao de Spearman
13.3
Coeficiente de determinao da equao
13.4
de regresso
Desvio padro dos dados / Desvio padro
6. 1, 6.2 / 9 .3
amostral
Varincia dos dados/ Varincia amostral 6.1/9.3
Estimativa do erro padro da proporo
9 .2, 9.4
amostral
Estimativa do erro padro da mdia
9.3, 9.4
amostral
Desvio padro de diferenas
11.3
Desvio padro agregado
11.4
Varincia agregada
11.4
Desvio padro dos resduos da regresso
13.4
Valor da distribuio t de Student / Valor 9 .3 / 11.3,
da e statstica t
1 1.4
Coeficiente de associao de Cramr
12.2
Mdia aritmtica dos valores de X/
6 . 1, 6 .2 / 9.3
Mdia amostral
Valor predito por uma equao de
13.4
regresso
Valor padronizado/ Valor da distribuio
8 .1/ 9 .2
normal padro

SMbolos MATEMTicos ElETRAs do AlfAbETo qREqo


Smbolo

""

>

;;::
<
:::;;

a
~

y
~

Significado
Aproximadamente igual
Mais ou menos
Maior
Maior ou igual
Menor
Menor ou igual
Nvel de significncia de um teste
estatstico / Coeficiente escalar
(intercepto) de uma reta de regresso
Proba bilidade do erro tipo II / Coeficiente
angular de uma reta de regresso
Coeficiente de correlao gama
Coeficiente de associao phi

Sees

10.2 / 13.4
10.2 / 13.4
12.2
12.2

C lossRio

dE

sf'vlbolos

Smbolo

n
7t

x.2
cr
cr2
CJp

:Lx
LX2

Erro aleatrio
Mdia do modelo-populaciona!
Valor esperaeo ~
amostral
Espao amos ... ~
Probabilidade ~ / Proporo pc~
Estatstica qc:~~
Desvio padro b
Erro padro e.a :
Erro padro e.a~
Soma dos ele~~
Soma dos qu2r ~
varivel X

Sees
6.4
13.2
13.3
13.4
-~..e

;>adro

6 .1 , 6 .2 / 9.3
6. 1 / 9 .3
9 .2, 9.4
9.3, 9.4
11.3
11.4
11.4
13.4
9.3 / 11.3,
11.4
12.2

6. 1, 6.2 / 9 .3
13.4
8.1/ 9 .2

Sees

10.2 / 13.4
10.2 / 13.4

12.2
12.2

Significado
Smbolo
Erro
aleatrio
e
Mdia do modelo normal / Mdia

populacional
Valor esperado de uma proporo
p
amostral
Espao amostral
Q
Probabilidade (parmetro de um modelo)
7t
/ Proporo populacional
Estatstica qui-quadrado
x2
Desvio padro do modelo normal
cr

Sees
13.4
7.1 / 9.3
9 .1
7 .1
7.1, 7 .2 / 9.1
12.1
7.1

cr2
<Jp

L:x
LX2

Erro padro da proporo amostral


Erro padro da mdia amostral

9.1
9.3

Soma dos elementos da varivel X


Soma dos quadrados dos elementos da
varivel X

6.1
6.1

PREfcio

statstica aplicada s Cincias Sociais foi escrito com o objetivo de ser


um livro-texto em disciplinas de Estatstica para cursos de Cincias
Sociais e Humanas. A motivao para escrever este texto surgiu quando
aproximamos o ensino da Estatstica a problemas prticos nas reas
sociais , inserindo os alunos em pequenos projetos de pesquisa e
mostrando-lhes a necessidade do uso de tcnicas estatsticas. A motivao
e o aproveitamento dos alunos cresceram tanto que resolvemos
desenvolver esta abordagem em forma de livro-t exto.

Este texto apresenta uma introduo estatstica, acompanhada


de uma orientao de como planejar e conduzir uma pesquisa quantitativa.
Ao invs de apresentarmos a Estatstica com um raciocnio tipicamente
matemtico, como usual nos livros-texto de Estatstica, optamos por
apresentar os conceitos e tcnicas dentro de um processo de pesquisa
em Cincias Sociais e Humanas. Em geral, os captulos iniciam com
problemas prticos que motivam e justificam a introduo de tcnicas
estatsticas.
O livro inicia com uma viso geral das tcnicas estatsticas e
apresenta algumas ideias bsicas sobre o planejamento de uma pesquisa
social (Captulos 2 e 3). Os Captulos 4 a 6 trazem alguns dos principais
elementos da Estatstica Descritiva e da Anlise Exploratria de Dados,
incluindo algumas aplicaes em pesquisas de campo desenvolvidas em
nossa Universidade. Alguns modelos de probabilidades, que sero
nece ssrios para o entendimento de captulo s posteriores , so
apresentados nos Captulos 7 e 8. O Captulo 9 coloca o problema de
generalizar resultados da amostra para a populao, atravs de intervalos
de confiana, e aplicado especialmente em pesquisas de levantamento

14

EsrArs1 icA Aplic11dA s CiNCiAs Sor.iAis

por amostragem, como nas pesquisas eleitorais. O Captulo 10, embora


enfoque tambm a questo de generalizar resultados da amostra para a
populao, o faz atravs de testes de hipteses. Os conceitos de testes de
hipteses geralmente so de difcil entendimento, mas, neste livro ,
apresentamo-los de uma forma que os alunos no costumam ter maiores
dificuldades. Os Captulos 11 e 12 abordam testes de hipteses e anlises
estatsticas bastante u s ados nas Cincias Sociais e Humanas. Finalmente,
o Captulo 13 apresenta procedimentos estatsticos para avaliar a relao
e ntre duas variveis, assim como desenvolve tcnicas para construir
modelos voltados para alguns tipos de relaes .
Ao longo das vrias edies, fomos corrigindo erros, aperfeioando o
texto, introduzindo novos exemplos e exerccios, alm de incluir s aidas
de pacotes computacionais estatsticos e de planilhas eletrnicas, fazendo
com que o presente material sirva tambm como livro-texto para
disciplinas que usam o computador. Nesta s exta edio, reescrevemos o
texto com uma linguagem mais direta, procurando melhorar aspectos
didticos e dando maior destaque aos principais conceitos, alm de
aprimorar a qualidade da apresentao. Tambm estamos criando u ma
pgina na Internet com slides baseados no livro, orientaes para uso de
alguns pacotes computacionais e arquivos de dados para exerccios e
trabalhos acadmicos, alm de outras facilidades. Ver www.inf.ufsc.br/
- barbetta/livro l .htm.
Finalmente, gostaramos de agradecer aos colegas professores e
alunos que tanto contriburam para o desenvolvimento deste texto, em
especial ProP- Svia Modesto Nassar, que teve a pacincia de ler
criteriosamente todo o texto e oferecer contribuies significativas nos
Captulos 2 e 3.

Pedro Alberto Barbetta

(ApTulo l
1NTR~:._

este primeiro captulo ,;..~


preliminar do que esta::.s:.
nas reas das cincias s ocia:s e

Quem est estudando ~


associada a nmeros, tabelas e
de organizar e apresentar :::::
tentaremos mostrar nes te li~
estar presente nas diversas e::
planejamento at a interpre~
influenciar na conduo do p:-=
exemplo para facilitar a n ossa -

EXEMplo 1.1 Com o objetivo de


instruo do chefe da casa, nas;;____...
II, Florianpolis:-- SC, decidiu-s.

conhecer certas
amostra.
Populao o conjunto de elementos:;-.;...._
sejam vlidas - o universo de nosso
amostra.

Este problema faz parte de uma Pes'.-4 apresenta parte dos dados coletado:.

E:!r-= ~plicAdA s CiNCiAs SociAls

INTRoduo

~ eio ,

reescrevemos o
melhorar aspectos
p - .:=_?2!s conceitos, alm de
~estamos criando uma
- ..... ->:...orientaes para uso de
e-:: .ados para exerccios e
.;:;:r ;:;-Ces_ Ver www.inf.ufsc.br/
i=x-..::~o

este primeiro captulo, tentaremos oferecer ao leitor uma ideia


preliminar do que estatstica e como ela pode ser usada em pesquisas,
nas reas das cincias sociais e humanas.
Quem est estudando estatstica pela primeira vez deve imagin-la
associada a nmeros, tabelas e grficos que sero usados no momento
de organizar e apresentar os dados de uma pesquisa. Mas, como
tentaremos mostrar neste livro, isto no bem assim! A estatstica pode
estar presente nas diversas etapas de uma pesquisa social, desde o seu
planejamento at a interpretao de seus resultados, podendo, ainda,
influenciar na conduo do processo da pesquisa. Tomemos o seguinte
exemplo para facilitar a nossa discusso.

EXEMplo 1.1 Com o objetivo de levantar conhecimentos sobre o nvel de

Pedro Alberto Barbetta

instruo do chefe da casa, nas famlias residentes no bairro Saco Grande


II, Florianpolis:-- SC, decidiu-se pesquisar algumas destas farrlias. 1
Temos, no Exemplo 1.1, um problema tpico de estatstica aplicada:
conhecer certas caractersticas de uma populao, com base numa
amostra.
Populao o conjunto de elementos para os quais desejamos que as nossas concluses
sejam vlidas - o universo de nosso estudo. Uma parte desses elementos dita uma
amostra.

Este problema faz parte de uma pesquisa realizada pela UFSC, 1988. O anexo do Capitulo
4 apresenta parte dos dados coletados.

16

EsTATSTiCI\ Ap l icAdA s CiNciAs SociAis

Co.p(rulo l - INrRoduo

ColETA dE dAdos
Para conhecermos certas caractersticas dos elementos de uma
populao (ou de uma amostra ), precisamos coletar dados desses
elementos. uma fase da pesquisa que precisa ser cuidadosamente
planejada para que dos dados a s erem levantados se tenham informaes
que atendam aos objetivos da pesquisa. no planejamento da obteno
dos dados que devemos tambm planejar o que fazer com eles. Voltaremos
a essa discusso nos Captulos 2 e 3.
No problema apresentado no Exemplo 1.1, os dados foram coletados
atravs de entrevistas, aplicadas numa amostra de 120 famlias. Ao
observar o nvel de instruo do chefe da casa, o entrevistador classificava
a resposta do entrevistado numa das trs seguintes categorias: (1) sem
instruo, (2) fundamental (primeiro grau) e (3) mdio (segundo grau). Ao
coletar os dados desta forma, j se tinha em mente os procedimentos
estatsticos que seriam usados na futura anlise desses dados .

ESCRiO E EXplORAO dE dAdos

36%

II, Florianpo'.!s-3:.

A regio em estude =
Residencial Monte Verde. =

tr s localidades, co ns~.r
distribuies de frequnca"'.

Depois de observada uma amostra de familias (Exemplo 1.1), temos


disposio um conjunto de dados acerca da varivel nvel de instruo
do chefe da casa. Esses dados devem ser organizados para que possam
evidenciar informaes relevantes, em termos dos objetivos da pesquisa.
Esta etapa usualmente chamada de descrio de dados. Um conceito
importante nesta fas e do trabalho o de distribuio de frequncias.

Nvel de

;~~::::-

~ ~-~

li nenhum
15%

:?.;.

A distribuio de frequncias compreende a organizao dos dados de acordo com as


ocorrncias dos diferentes resultados observados.

Uma distribuio de frequncias do nvel de instruo, por exemplo,


deve informar quantas pessoas (ou a percentagem de pessoas) se
enquadram em cada categoria preestabelecida. A Figura 1. 1 mostra, sob
forma grfica , uma distribuio de frequncias. 2 Temos, nesta figura, a
informao da percentagem de chefes da casa que esto em cada nvel de
instruo. Em outras palavras, a Figura 1.1 fornece uma visualizao do
perfil do nvel educacional dos chefes das casas, na amostra em estudo .

A construo de distribuies de frequncias, assim como suas r epresentaes em tabelas


e grficos, sero vistas nos Captulos 4 e 5.

57%

28%

Monte Verde
40 famlias

Figura 1.2 Distribuio de frequ::.:m


Amostra de 120 familias do Bairro -sa.- :

Ao descrever os dac.::
populao de onde eles fora:::. =
sugerir que, na populao e= ,
chefe da casa melhor no C3:::

..

Nivel de instruo do chefe da casa

;::c:-ecisa s er cuidadosamente
- .-:=os se tenham informaes
~ - - ~"'lejamento da obteno
--~_,_,
__ - ~)zercom eles. Voltaremos

36%

nenhum
1 fundamental

_ mdio
32%

-"' -.:.:. .:: e::~evistador classificava


~ eg"...:::rtes categorias: (1) sem
: - .dio (segundo grau}. Ao

~~~ias

(Exemplo 1.1), temos

2==:;<: e.a ~-ivel

Figura 1.1 Distribuio de frequncias do nvel de instruo do


chefe da casa. Amostra de 120 familias do bairro Saco Grande
II, Florianpolis-Se, 1988.

A reg1ao em estudo dividida em trs localidades: Conjunto


xesidencial Monte Verde, Conjunto Residencial Parque da Figueira e
-=:ncosta do Morro. Considerando que haja interesse em comparar essas
:::-s localidades, construmos a Figura 1 .2, que apresenta trs
distribuies de frequncias, sendo uma para cada localidade.

nvel de instruo

Nvel de instruo do chefe da casa

~dos

para que possam


=:s d.os objetivos da pesquisa.
-2.-.'di~ de dados. Um conceito
-

li nenhum

D fundamental

16%

15%

:.::::s::-~o de frequncias.

O mdio

49%
28%

~ 6e

instnio, por exemplo,

- p::Jcer..:agem de pessoas) se

...>"'-

~---=ex:- A
,,.__,;-f-es .:

Figura 1.1 mostra, sob


7emos, nesta figura, a
~~.:.e esto em cada nvel de
- f:J...""i:.ece uma visualizao do
~ aa amostra em estudo.

Monte Verde
40 familias

33%

Pq. da Figueira

Encosta do Morro

43 familias

37 familias

.Figura 1.2 Distribuio de frequncias do nvel de inst ruo do chefe da casa, por localidade.
-.::!ostra de 120 familias do Bairro Saco Grande li, Florianpolis - SC, 1988.

Ao descrever os dados, comeamos a explorar como deve ser a


?OPUlao de onde eles foram extrados. A Figura 1.2, por exemplo, parece
sugerir que, na populao em estudo, o perfil do nvel de instruo do
chefe da casa melhor no Conjunto Residencial Monte Verde e pior na

18

F~ 1A1sricA AplicAdA s C ihcl1\S SociAis

CAprulo

J -

11'TRoduo

.:::.:.::..:.:..:=-~-----=--~~~~~~~~..,

Encosta do Morro, ficando o Conjunto Residencial Parque da Figueira verificar a sua validade, co:= ~
numa situao intermediria. Este tipo de anlise pode ser caracterizado testes estat.sticos de hipr.eses
como uma anlise exploratria de dados, ou sej a, uma tentativa de captar descreve:
a essncia das informaes contidas nos dados, atravs da construo
O cientista tem ideias ~E.:-
de tabelas e grficos. Em termos mais tcnicos, uma anlise expl.oratria
hiptcses) e frequen~e.-~
de dados consiste na busca de um padro ou modelo que possa n os
sistemtica.
orientar em anlises posteriores.

INfERNCiA ESTATSTiCA

Ao -analisar os dados de uma amostra, devemos estar atentos ao


fato de que alguma s difere nas podem ser mera mente casuais ,
ocasionadas por caractersticas prprias da amostra, n o representando,
necessariamente, propriedades da populao que gostaramos de
conhecer. Nes te contexto, importante estudarmos os chamados modelos
probabilsticos (Captulos 7 e 8), que so uma forma de mensurar a
incerteza. Esses modelos constituem-se na base da metodologia estatstica
de generalizar resultados de uma amostra para a populao d e onde ela
foi extrada, que pode ser sob a forma de estimao de parmetros ou de
teste de hipteses.
Um parmetro uma medida que descreve certa caracterstica dos elementos da
populao.

Por exemplo, n a populao descrita no Exemplo 1.1, a percentagem


de famlias em que o chefe da casa possui nvel mdio de instruo um
parmetro .
Na Figura 1.1, verificamos que , na amostra, a percentagem de
famlias em que o chefe da casa possui o nvel mdio de 36% . Mas este
no o valor exato do parmetro que de screvem os, pois n o pesqu isamos
toda a populao, mas somente uma amostra. No Captulo 9, estudaremos
uma metodologia capaz de avaliar, de forma aproximada, o valor de
determinado parmetro, considerando apenas os resultados de urna
amos tra, ou seja, estudaremos o chamado processo de estimao de
parmetros.
O ato de generalizar resultados da parte (amos tra) para o todo
(populao) conhe cido corno inferncia estatstica. A estimao de
parmetros uma forma de inferncia estatstica. Outra forma surge
quando temos alguma hiptese sobre a populao em estudo e qu eremos

No proble ma do Exe::I:.; :- s eguinte hiptese: a distr:1:--:o


deve variar conforme a loca-;;-;.-~,.
Figura 1.2, a p ontam para ct.:=localidades. Por exemplo,~
com o chefe da casa possu--..:=
percentual ca para 16%. ~.~
so s uficiente s para afin::2::
populao?
Para inferirmos se as 5 existe m em toda a popula:S=
ocorrer meramente pelo a:") ~
hipteses (Ca ptulo 10) faC'-~--=-:o

Em p esquisas emp-~ 1 ......


formuladas, pois estas, qua.:X= ~
s ervir de sup orte para ou ..... .::S
e ncadeamento de conheci.me::=::::::-..
(veja a Figura 1.3).

1 pesquisa
Figura 1.3 O processo iterativo da

~er:cial

Parque da Figueira
;-: -se pode ser caracterizado
- se!a.. t:ma tentativa de captar
.__,..::os, atravs da construo

verificar a sua validade, com base em uma amostra. So os chamados


testes estatsticos de hipteses ou testes de significncia. Levin (1985, p. 1)
descreve:

uma anlise exploratria

O cientista tem ideias sobre a natureza da realidade (ideias que ele denomina
hipteses) e frequentemente testa suas ideias atravs de pesquisa
sistemtica.

..!

modelo que possa nos

-=.a forma de mensurar a


-= ....-ria metodologia estatstica
---i:,.c;.-c:. a populao de onde ela
es:::::::-_;2D de parmetros ou de

--= o:=ac-...eristica dos elementos da


7

~:riplo

1.1, apercentagem
- ..,.,..dio de instruo um

a percentagem de
- -_.dio de 36% . Mas este
- !!::JDS. pois no pesquisamos
- - - -o Captulo 9, estudaremos
~"" aproximada, o valor de
s;x-""ZS os resultados de uma
:_:::::::=~~ _?:ucesso de estimao de
-

No problema do Exemplo 1. 1, poderamos ter interesse em testar a


seguinte hiptese: a distribuio do nvel de instruo do chefe da casa
deve variar conforme a localidade. Os dados da amostra, como vimos na
Figura 1.2, apontam para diferentes distribuies de frequncias nas trs
localidades. Por exemplo, enquanto no Monte Verde temos 57% de familias
com o chefe da casa possuindo o nvel mdio, na Encosta do Morro, este
percentual cai para 16% . Mas estas diferenas nos resultados da amostra
so suficientes para afirmarmos que tambm existem diferenas na
populao?
Para inferirmos se as diferenas observadas na amostra tambm
existem em toda a populao, precisamos saber se elas no poderiam
ocorrer meramente pelo acaso. O estudo dos testes estatsticos de
hipteses (Captulo 10) facilitar a soluo desse tipo de problema.
Em pesquisas empricas, fundamental testar as hipteses
formuladas, pois estas, quando comprovadas estatisticamente, passam a
servir de suporte para outras pesquisas, construindo-se, assim, um
encadeamento de conhecimentos, levando-nos a novas fronteiras do saber
(veja a Figura 1.3).

~ostra,

.....,..._ __,, .;;;..... p:=r..e amostra) para o todo


es:.a:isrica. A estimao de
es-:"'_.s!ica. Outra forma surge
~em estudo e queremos

1 pesquisa 1

o::> 1 dados 1 na~ 1 nfonnaeSJ ua~

novos conhecimentos,
novas hipteses
L-~~~~~~~~---'

Figura 1.3 O processo iterativo da evoluo do conhecimento.

PARTE

oplANEjAMENTO dA colETA dos dAdos


CoMo plANEjAR AdEQUAdAMENTE AcolETA dos dAdos
CoMo AlquNs CONCEiTOs bsicos dAEsrATsricA podEMAuxiliAR NO
plANEjAMENTO dA pESQUiSA

(ApTulo

2
PEsQuisAs EdAdos1

m nossas decises do dia a dia, estamos direta ou indiretamente


nos baseando em dados. Ao decidir, por exemplo, pela compra de
determinado bem, procuramos verificar se ele satisfaz as nossas
necessidades, se o seu preo compatvel com nosso oramento, alm de
outras caracteristicas. Posteriormente, comparamos os da dos desse bem
com eventuais alternativas e, atravs de uma anlise processada
internamente em nossa mente, tomamos a deciso de compr-lo ou no.
Nas pesquisas cientficas, tambm precisamos coletar dados que
possam fornecer informaes capazes de responder s nossas indagaes.
~as para que os r esultados da pesquisa sejam confiveis , tanto a coleta
dos dados quanto a sua anlise devem ser feitas de forma criteriosa e
objetiva. A Figura 2.1 ilustra as principais etapas de uma pesquisa que
envolve levantamento e anlise de dados .

1 Definio do problema, objetivos 1

Planejamento da pesquisa
Metodologia
da rea de
estudo

/__.,,,...

Execuco da pesquisa

\,

Resultados

:t

Concluses

Figura 2.1 Etapas usuais de uma pesquisa quantitativa.


Este captulo teve a participao da professora Slvia Modesto Nassar, doutora em Engenharia
Biomdica e Professora Titular do Departamento de Informtica e Estatst ica da UFSC.

24

b1Arsrirn 11plicAdA ' CiNCiAS SociAiS

Embora a aplicao de tcnicas estatsticas seja feita basicamente


na etapa de anlise dos dados, a metodologia estatstica deve ser aplicada
nas diversas etapas da pesquisa, interagindo com a metodologia da rea
em estudo. No possvel obter boas informaes de dados que foram
coletados de forma inadequada. A qualidade da informao depende da
qualidade dos dados! Do mesmo modo , para que a utilizao dos
resultados estatsticos seja feita de forma correta, toma-se necessrio
que o pesquisador conhea os princpios bsicos das tcnicas usadas.
Ne.ste captulo faremos uma breve explanao sobre as linhas gerais
do planejamento de uma pesquisa, dando nfase ao planejamento da
coleta de dados.

CApwlo 2 - PEsouisA~ F dii.dos

Os objetivos de a,
que descreva as carac~L""
o objetivo (e) mais aI?a'.:exista associao entre
ser colocada prova :::=.
A elaborao dos -.
que fornea uma prffi:=w.:.
observar ou medir nos
para atingir aos obj e ..;. J"3:.
as seguintes caracte::s ~--
servio, nvel de ins7--.; treinamento, nvel de ::r=s

2.1 plANEjAMENTO dE UMA pESQUiSA


o pRoblEMA dE pESQuisA
Para se iniciar qualquer processo de pesquisa, deve-se ter bem
definido o problema a ser pesquisado . Isto normalmente envolve uma
boa reviso da literatura sobre o tema em questo .

Depois de os ob:=decidir sobre as lin1'~


delineamento da pes:

ExEMplo 2.l (coNTiNuA!.:: FoRMulAo dos objETivos


Os objetivos de uma pesquisa devem ser elaborados de forma bastante
clara, j que as demais etapas da pesquisa tomam como base esses objetivos.

ExEMplo 2.1 Objetivo geral:. conhecer o perfil de trabalho dos funcionrios


de determinada empresa para orientar polticas de recursos humanos.

dados a partir da a?::.


funcionrios. Dados. :es
ao sistema de trabalho :::......

POPULAO: todos

funcionrios da err;=

Para podermos dar sequncia a esta pesquisa, precisamos especificar


melhor o que queremos conhecer da populao de funcionrios, ou seja,
os objetivos especficos. Alguns destes objetivos especficos poderiam ser:
a) Conhecer o tempo mdio de servio dos funcionrios na empresa.
b) Conhecer a distribuio do nvel de instruo dos funcionrios.
c) Verificar o interesse dos funcionrios em participar de programas de
treinamento.
d) Avaliar o nvel de satisfao dos funcionrios com o trabalho que
exercem na empresa.
e) Verificar se existe associao entre o nvel de satisfao do funcionrio
com a sua produtividade.

Conjunto de dados :;e_

Na pesquisa de levanta.,... _.._

elementos de uma ce:-~


entrevistas. A observaZ:; ~ -

vpnulo 2 -

::!i~::::S::!::-::::..::.<:.~ C.e,e

s er aplicada
a =:e:odologia da rea
====;::::s ..:~ eados que foram
.......~--.o. ~o depende da
"O.- e a utilizao dos
~---- m~-se necessrio
-~.____, .-..,,~ Lc:ticas usadas.
:..:::::::::::ij-~s:::ixe as linhas
-....:..,,;,~
- ~

gerais
planejamento da

25

PESQUiS~S ( d~dos

Os objetivos de (a) a (d) podem ser alcanados por uma pesquisa


0}e descreva as caracteristicas pertinentes da populao. Por outro lado,
a objetivo (e) mais analtico, pois nele est embutida a hiptese de que
exista associao entre satisfao e produtividade, hiptese que dever
ser colocada prova no decorrer da pesquisa.
A elaborao dos objetivos especficos deve ser feita de tal forma
que fornea uma primeira indicao das caractersticas que precisamos
observar ou medir nos indivduos a serem pesquisados. Por exemplo,
?M atingir aos objetivos do problema em questo, precisamos levantar
as seguintes caractersticas de cada funcionrio da empresa: tempo de
servio, nvel de instruo, interesse em participar de programas de
;reinamento, nvel de satisfao com o trabalho e produtividade.

Tipos dE pEsQuisA
Depois de os objetivos estarem explicitamente traados, devemos
decidir sobre as linhas bsicas da conduo da pesquisa, ou seja, o
delineamento da pesquisa. O Exemplo 2 . 1 mostra uma pesquisa de
:evantamento ou survey e o Exemplo 2.2 uma pesquisa experimental.

2xEMplo 2.1 (coNTiNUAO) Delneamento da pesquisa: um levantamento de


dados a partir da aplicao de um questionrio em uma amostra de
:UUcionrios. Dados: resultados de diversos atributos e medidas relativas
ao sistema de trabalho dos funcionrios respondentes. Esquematicamente:
Aplicao de um
questionrio

..- -:e dos funcionrios


... ~..:..""Sos humanos.

POPULAO: todos os
funcionrios da empresa ~

Pl~~-----'---------.

----~os especificar

......:: f-~onrios , ou seja,


s::=eci-~-X::os poderiam ser:

amostragem
Conjunto de dados observados

~-----

os na empresa.
::1:.ncionrios.
:::::t;,:P-= de p rogramas de

!Z~~-2.--o

do funcionrio

AMOSTRA: parte dos


funcionrios d empresa

pesquisa de levantamento ou survey observam-se diversas caractersticas dos


elementos de uma certa populao ou amostra, utilizando-se questionrios ou
entrevistas. A observao feita naturalmente e sem interferncia do pesquisador.
~a

26

EsrArs1icA AplicAd A s CiNCiAs Sc-ci11is

A pesquisa de levantamento bastante comum nas Cincias Sociais


e costuma gerar grandes conjuntos de dados. Na sequncia deste livro,
daremos mais destaque a esse tipo de pesquisa.

c~prulo

L-

PESOUiS1\S E d11do~

formulao criteriosa das a:::


qualitativa no se costum
abordaremos neste livro

ExEMplo 2.2 Objetivo geral: comparao de dois mtodos de treinamento


de funcionrios, sendo um deles usualmente aplicado, e o outro, novo.
Especificamente, queremos decidir qual o mtodo mais dequado, no
sentido de aumentar a produtividade dos funcionrios de determinada
empresa. Delineamento da pesquisa: so formados dois grupos de
funcion~os, sendo cada grupo treinado por um dos mtodos. Dados:
uma medida de produtividade de cada operrio, resultando em dois
conjuntos (amostras) de valores de produtividade, relativos a cada mtodo
de treinamento. Esquematicamente:

~~
Grupo 1 de funcionrios , ,

>

Grupo 2 de funcionrios

>

L-.-----~~----'

Amostra 1 de valores
de produtividade

Populao-alvo o conjunL iz
So os elementos para os Cf..Z:S
sejam vlidas.

No exemplo s obre
empresa, a populao-al"funcionrios da empresa. de dados for feita no prp::n:
os funcionrios que nes~~
:.nacessveis de serem obse.~

Amostra 2 de valores
de produtividade

~
O Exemplo 2.2 enfoca um delineamento de pesquisa experimental.
Na pesquisa experimental o pesquisador exerce controle sobre o tratamento que vai
ser aplicado a cada elemento da(s) amostra(s). H, portanto, interferncia do pesquisador.

Esse tipo de pesquisa usado para resolver problemas bem


especficos, geralmente formulados sob forma de hipteses de causa e
efeito. No exemplo em questo, tem-se implicitamente a hiptese de que
a produtividade de u m funcionrio influenciada pelo mtodo de
treinamento . Geralmen te a quantidade de dados gerada por uma pesquisa
experimental pequena, mas os dados so suficientemente estruturados
(devido ao controle do pesquisador) para que se possa decidir, atravs de
uma anlise estatstica apropriada, se uma hiptese previamente
formulada pode s~r aceita ou rejeitada.
H situaes em que conhecemos muito pouco sobre o universo a
ser estudado. Nesses casos, podemos realizar uma pesquisa qualitativa,
observando detalhadamente um pequeno nmero de elementos, sem uma

Populao acessvel, ou ,,~~ ~ - )


queremos abranger em noss'l ~
respeito s caractersticas ~

Quando houver j~~


populao acessvel, pod~
anlise para toda a po?~
:-e latrio da pesquisa a
e specificamente para a ?C?
os resultados da pesquisa

Nem sempre os e:eJ


claramente definidos na ..._
:evantamento sobre as c .!- populao pode ser de~-=-=
bairro, o conjunto de ind-- ~
conjunto indivduos com
p opulao depende bas:::z::
caracteristicas a serem lCT"E~
casos, podemos trabalhar cr::=:.

--==

O' .\S ScclAis

CAprulo 2 -

PESQuiSAS [

27

<fados

formulao criteriosa das caracteristicas a serem levantadas. Na pesquisa


qualitativa no se costuma aplicar mtodos estatsticos e, por isto, no a
abordaremos neste livro.

PopulAo e AMOSTRA
Um passo importante no delineamento da pesquisa consiste na
deciso de quem se vai pesquisar.
Populao-alvo o conjunto de elementos que queremos abranger em nosso estudo.
So os elementos para os quais desejamos que as concluses oriundas da pesquisa
sejam vlidas.

No exemplo sobre o perfil de trabalho dos funcionrios de uma


empresa, a populao-alvo pode ser definida como o conjunto de todos os
funcionrios da empresa, numa determinada poca. Contudo, se a coleta
de dados for feita no prprio local de trabalho e no periodo de uma semana,
os funcionrios que neste perodo esto de frias ou de licena ficam
inacessveis de serem observados. Assim, as concluses baseadas nesses
dados no valem, necessariamente , para todo o conjunto de funcionrios.
Populao acessvel, ou simplesmente populao, o conjunto de elementos que
queremos abranger em nosso estudo e que so passveis de serem observados, com
respeito s caractersticas (variveis) que pretendemos levantar.

;irnblemas bem

_:eses de causa e
-~-

a hiptese de que
oe:o mtodo de
~;xir uma pesquisa
=-::;;.=~~~=::~e estruturados
c.ecidir, atravs de
-ese previamente
~==~z.~

Quando houver diferena razovel entre a populao-alvo e a


populao acessvel, pode haver vis ao generalizar os resultados da
anlise para toda a populao-alvo. Assim, recomendvel citar no
relatrio da pesquisa a limitao de que seus resultados valem
especificamente para a populao definida como acessvel, evitando que
os resultados da pesquisa sejam usados de maneira inadequada.
Nem sempre os elementos que definem a populao ficam
claramente definidos na formulao dos objetivos. Por exemplo, num
levantamento sobre as condies socioeconmicas de um bairro, a
populao pode ser definida como o conjunto de famlias residentes no
bairro, o conjunto de indivduos moradores do bairro ou, ainda, como o
conjunto indivduos com mais de dezoito anos do bairro. A definio da
p opulao depende basicamente dos objetivos da pesquisa, das
caractersticas a serem levantadas e dos recursos disponveis. Em alguns
casos, podemos trabalhar com mais de uma populao.

28

EsTl\rsricA AplicAdA s CiNCiAs SociAiS

Em grandes populaes interessante a realizao de uma


amostragem, ou seja, a seleo de uma parte da populao para ser
observada. Para um leigo em estatstica, surpreendente como um~
amostra de 3.000 eleitores fornece um perfil bastante preciso sobre a
preferncia de todo o eleitorado, na vspera de uma eleio presidencial.
Mas isto s verdade se esta amostra for extrada sob um rigoroso plano
de amostragem capaz de garantir a sua representatividade. 2

AcolETA dE dAdos
Depois de definirmos os objetivos e a populao a ser estudada,
precisamos pensar como ser a coleta de dados . Em muitas situaes
no precisamos ir at aos elementos da populao para obter os dados,
porque eles j existem em alguma publicao ou arquivo. o que
chamamos de dados secundrios. No Exemplo 2.1, os dados sobre o tempo
de servio e nvel de instruo dos .funcionrios talvez possam ser obtidos
no departamento de pessoal da empresa. Outras caracteristicas, tais como
interesse em participar de programas de treinamento e satisfao com o
trabalho, necessitam ser levantadas, observando diretamente cada
funcionrio. So os dados primrios.
Nes ta fase da pesquisa, devemos verificar exaustivamente o que j
existe de dados sobre o assunto em estudo, pois a utilizao de dados
secundrios pode reduzir drasticamente os custos de uma pesquisa.
Quando os dados forem levantados diretamente dos elem entos da
populao, necessrio construir um instrumento para que s ua coleta
seja feita de forma organizada. Chamaremos este instrumento de
questionrio, cuja elaborao e formas de aplicao discutiremos na
Seo 2 .3.

ExERCcios
1) Seja uma pesquisa eleitoral, a ser realizada a poucos dias de uma eleio
municipal, com o objetivo de verificar a inteno de votos para cada candidato
prefeitura. Defina a populao-alvo e a populao acessvel.
2) A pesquisa descrita no Exerccio l experimental ou de levantamento?
Justifique.

: .\J)Tulo 2 - PESOViSfl!> t dAdOS

2.2

DADOS E VARI,~ ~

As variveis su.--ge= ~
:nedir nos elementos C:e - -'.'.'"
:nedida) de uma vari. apenas um resultado.
As variveis so as casa~

elemento da populao. so: ~,

Co

Na populao de ~ -:r==:i11
';"ariveis, tais como: te:-~
_as com perguntas do~?H quanto tempo o &.
Qual o seu estado d:;.:
Contudo,essaspe.~

de interesse, pois os ::.~-n- =i


:'.onnas. Na primeira pe:s:
'nais de 12 anos, h 7
caracterizando propri~
por no estarem sendo c-=-Para que as obse.r: a:::::::
mesmas condies, prel"".!.._.:...,s;:"""-~
exemplo, anos completos =e-~
H quanto tempo o :::..anos completos.

Quanto varive! es: ?ara evitar alguma respos:.a


as possveis alternativas e.~
Qual o seu estado
( ) divorciado

Algumas t cnicas de amostragem sero estudadas no Captulo 3.

&~

----- ~ :-ealizao de uma


-:::::=-.-= e=; ?O?ulao para ser
L-:=-.;::;e:::.dente como uma
~~<e preciso sobre a
===:. ~e!o presidencial.
~----:im rigoroso plano

se=

~ulo

2 - PEsQuisAs E dAdos

:.2

ADOS E VARIVEIS

29

As variveis surgem quando perguntamos o que vamos observar ou


=edir nos elementos de uma populao ou amostra. A observao (ou
::?.edida) de uma varivel num elemento da populao deve gerar um e
::;penas um resultado.
-~

variveis so as caractersticas que podem ser observadas (ou medidas) em cada

elemento da populao, sob as mesmas condies.

- - - =;:o a s er estudada,

-~

-=-~

::auitas situaes
obter os dados,
- - - , -- =:: arquivo. o que
__ ~dados sobre o tempo
.- e.e.. possam s er obtidos
~:..e;-lsticas, t ais como
-

COMO dEfiNiR UMA VARivEI NA pRTicA?

~- ?fu.-a

Na populao de funcionrios de uma empresa, podemos definir


Jariveis, tais como: tempo de servio, estado civil, etc. Podemos observ28 com perguntas do tipo:

__,,__ ,.,.-_;o e satisfao com o


~diretamente

~-- ~tivamente

o que j

a utilizao de dados
- -s ~ uma

p esquisa.

-~-~~ _?a.--ra

que sua coleta


:s'ie instrumento de
'-;:'."'---=:;:o discutiremos na

-.:c::::;a:JS

dias de uma eleio


para cada candidato

_e v:=

~.......--

acessvel.

~~-==~--~-=~

H quanto tempo o Sr. (ou Sra.) trabalha nesta empresa? _ __


Qual o seu estado civil? _ __

cada

ou d e levantamento?

Contudo, essas perguntas no esto identificando bem as variveis


interesse, pois os funcionrios podem interpret-las de diferentes
:Onnas. Na primeira pergunt a, podem ocorrer respostas como: h pouco
~lls de 12 anos, h 7 meses, h muito tempo e assim por diante , no
.::ara cterizando propriamente observaes da varivel tempo de servio,
:;>ar no estarem sendo observadas de forma homognea.
~e

Para que as observaes do tempo de servio sejam feitas sob as


2esmas condies, precisamos estabelecer a sua unidade de medida, por
exemplo, anos completos de trabalho na empresa. E a pergunta poderia ser:
H quanto tempo o Sr . (ou Sra.) trabalha nesta empre sa? _ _ _ __
anos completos.

Quanto varivel estado civil, as possveis respostas so atributos.


?ara evitar alguma resposta estranha, podemos estabelecer previamente
~ possveis alternativas de resposta. E a pergunta poderia ser:
Qual o seu estado civil? ( ) solteiro ( ) casado ( ) vivo ( ) desquitado
( ) divorciado

~o

EsrArsricA AplicAdA s CiNciAs Soc1111s

DpTulo

2-

Pf~(~ui~A~ E dAdo5

Ao efetuar estas perguntas a um funcionrio da empresa, teremos,


para cada pergunta, apenas uma resposta. Cada pergunta est, ento,
associada a uma varivel.

No primeiro caso o
!lari_uel qualita~ua, pois o~
as tres categonas aprese:r::::::3...4
satisfao nas trs o ~

YAnivEis ouAliTATiVAS E QUANTiTATiVAS

No segundo caso :::::::::::


quantitativamente, p ois
ser o seu nvel de satisfa ~O. Cabe observar que ....,
informativa, na presenLC e:: " ""'
pois, um 7 (sete} para~
um 7 (sete} para outro. )3:.
entendida de forma clife:-e:-~

Quando os possveis resultados de uma varivel so nmeros de


uma certa escala, dizemos que esta varivel quantitativa. Quando os
possveis resultados so atributos ou qualidades, a varivel dita
qualitativa (veja a Figura 2 .2) .
quantitativa

>I

dados quantitativos

Varivel
qualitativa
ou categrica

dados qualitativos
ou categorizados

Figura 2.2 Classificao das variveis e dos dados em termos do nvel de mensurao.

A deciso de corr-.D ~
vrios aspectos, mas s.:
_
;>roposta leva aos obje tiros _
ser aplicada.

No exemplo precedente, o tempo de servio (em anos completos)


uma varivel quantitativa, enquanto estado civil qualitativa.
Nem

Na descrio das variveis envolvidas na pesquisa, devemos incluir


a escala (ou unidade) em que sero mensuradas as variveis quantitativas
e as categorias (possveis respostas) das variveis qualitativas. Sempre
que uma caracterstica puder ser adequadamente medida sob forma
quantitativa, devemos usar este tipo de mensurao, porque as medidas
quantitativas so, em geral, mais informativas do que as qualitativas. Por
exemplo, dizer que um funcionrio trabalha h 30 anos na empresa
mais informativo do que dizer que ele trabalha h muito tempo na empresa.

Assinale os esportes ..,..


( ) futebol
( ) ba.s.":-"----~
( ) outros. Especifica=-

Este item

ExEMplo dE MENSURAO dE UMA VARivEl

Muitas caractersticas podem ser mensuradas de vrias formas e


nem sempre fica evidente qual delas a mais apropriada. Os dois itens
abaixo, por exemplo, procuram levantar o nvel de satisfao de um
funcionrio com a poltica de trabalho na empresa.

A especificao do es;i= =1
posteriormente, p odendo ~
tipo pratica ou no praxico..

(a) Em termos do trabalho que voc exerce na empresa, voc se sente:


( ) muito satisfeito
( ) pouco satisfeito
( ) insatisfeito
(b ) De urna nota de O (zero) a 10 (dez), relativa ao seu nvel de satisfao

com o trabalho que voc exerce na empresa. Nota: _ _ _ _

Uma outra possibilidade seria~


respostas todas as combinaes 12:
seria dificil, dado o grande :::.:===

- ;s CihciAs

.E::..::::.:.a

Soc;iAi>

est, ento,

~~-- so

.::tmeros de
-----a. Quando os
-------"-'"" _ -;:__-:vel dita

:.:ua.ri.uos 1

(Apru!o 2 - PesQuisAs

dr.dos

11

No primeiro caso, o item do questionrio est associado a uma


varivel qualitativa, pois o respondente deve atribuir uma resposta dentre
a s trs categorias apresentadas. Como existe uma ordenao do nvel de
satisfao nas trs opes, dizemos que a varivel qualitativa ordinal.
No segundo caso, tenta-se mensurar a caracterstica satisfao
quantitativamente, pois o respondente vai atribuir um valor, que ele julga
ser o seu nvel de satisfao, tomando-se como base uma escala de O a
:o. Cabe observar que, apesar da mensurao quantitativa ser mais
informativa, na presente situao ela pode causar algumas distores,
pois, um 7 (sete) para um respondente pode no significar exatamente
um 7 (sete) para outro, j que a escala de O (zero) a 10 (dez) pode ser
entendida de forma diferenciada entre os indivduos.
A deciso de como medir determinada caracterstica depende de
vrios aspectos, mas sempre recomendvel verificar se a mensurao
proposta leva aos objetivos da pesquisa e, alm disso, se ela vivel de
ser aplicada.

VARiVEiS E iTENS dE Ul\1 QUESTiONRiO

Nem sempre h uma relao direta entre um item de um


questionrio e uma varivel. Veja o exemplo a seguir.
Assinale os esportes que voc costuma praticar regularmente:
( ) futebol
( ) basquetebol
( ) voleibol
( ) outros. Especificar: _ _ __ __

Este item no est associado diretamente a uma nica varivel

esportes, pois um respondente pode praticar mais de um esporte, violando


a suposio bsica da varivel assumir um e apenas um resultado, por

~-------'~,

e.e >iias formas e

Os dois itens
S<ci.sfao de um

:;.a.a..

:espondente. Podemos, por outro lado, associar vrias variveis a este


~tem, tais como: (1) quantidade de esportes que pratica regularmente, (2)
_rutebol (pratica ou no), (3) basquetebol (pratica ou no), e assim por diante. 3

A especificao do esporte na categoria outros pode ser analisada


posteriormente, podendo ser includas novas variveis indicadoras do
-::ipo pratica ou no pratica.

=~s:;.,.-

.-oc se sente:
r::.sa:isfeito

- -31 de satisfao

Uma outra possibilidade seria definir a varivel esportes que pratica, tendo como possveis
respostas todas as combinaes de modalidades de esportes. Mas a anlise destas respostas
seria dificil, dado o grande nmero de possveis alternativas.

E:srArsriCA AplicAdA

A-,

Cii\CiAs SociAis

3)

Defina que variveis precisam ser levantadas para cada um dos objetivos especficos do Exemplo 2 .1. Considerando as suas definies, verifica r quais
so qualitativas e quais so quantitativas.

4)

Considerando a populao das cria nas e m creches municipais de


Florianpolis, completar as definies das seguintes variveis e verificar quais
so qualitativas e quais so quantitativas.

2.7

c) idade
d) sexo
g) local do nascimento.

E ~bORAO dE UM QUESTONRiO

a) Separar as caractersticas (variveis) a serem levantadas .


Para ilustrar, retomemos o Exemplo 2.1, com os seguintes objetivos
especficos:
- conhecer o tempo mdio de servio dos funcionrios na empresa;
- conhecer a distribuio do nvel de instruo dos funcionrios e
- avaliar o nvel de satisfao dos funcionrios com o trabalho que
exercem na empresa.
Temos, ento, as seguintes caractersticas a serem levantadas dentre
os funcionrios da empresa: tempo de servio, nvel de instruo e nvel
de satisfao com o trabalho.
b) Fazer uma reviso bibliogrfica para verificar formas de mensurar as
variveis em estudo.
No exemplo precedente precisamos avaliar o nvel de satisfao dos
funcionrios. Podemos procurar referncias que nos orientem em como
medir a satisfao. Em levantamentos de dados socioeconmicos,
podemos consultar os modelos de questionrios utilizados pelo IBGE,
os quais j foram bastante estudados e testados .4
IBGE a sigla do Instituto Brasileiro de Geografia e Estatstica, rgo responsvel por
diversos levantamentos no Brasil, como os censos demogrficos, censos agropecurios ,
censos industriais e anurios estatsticos.

Para as variveis quanfr


de medida (meses, metro...
Nas variveis qualitaC-.:....
nativas, mesmo que se:""
no tem opinio etc. Po:r:::..
quantitativamente, em~
de instruo, em categc;;fundamental, mdio e s:.._.
ser avaliado por uma es;:
insatisfeito, 2 - insatisje:5 - completamente satis_ ~

e) cor

Na conduo de uma pes quisa, a construo de um questionrio


uma etapa longa que deve ser executada com muita cautela. Tendo em
mos os objetivos da pesquisa claramente definidos, bem como a
populao a ser estudada, chamamos a ateno de alguns procedimentos
para a construo de um questionrio.

Pt~Oui'>I\~ ~ dado~

e) Estabelecer a forma de

Exrnccios

a) altura
b) peso
f) nacionalidade do pai e

Ciwh1ilo 2 -

d) Elaborar uma ou mais ?


A varivel nvel de satis/:-
enfoques, como a sat:is:.a
no emprego, com a ac::-Estes itens podem ser
escala, como a escala :..
satisfao ser mensu:-c.:.
e) Verificar se a pergun~
As perguntas deve::::
compreensvel para w..no devem deixar d~..-:.
f)

No se deve, por exe=:-<


funcionrio com o
negativos do trabalho
g) Verificar se a respos:<:.. Dependendo da forma do salrio recebido, a :l:
da real satisfao qi:e respostas : sim e no
sugerida anterionne::~.
entre os respondentes .
de como usar as resposras ~
de nossa pesquisa. O q-.:.

"5 \CIAs SociAis

CApTu\o 2 - PEsouisAs t dAdos

e) Estabelecer a forma de mensurao das variveis a serem levantadas .


.:=.

~ cbjetivos

_....,..=

espeerificar quais

de

e cor

Para as variveis quantitativas, devem estar bem definidas as unidades


de medida (meses, metros, kg etc.) que devem acompanhar as respostas.
Nas variveis qualitativas deve haver uma lista completa de alternativas , mesmo que s eja necessrio in clu ir categorias como: outros,
no tem opinio etc. Por exemplo, o tempo de servio pode ser observado
quantitativamente, em anos completos de servio na empresa; e o nvel
de instruo, em categorias mutuamente exclusivas, como: nenhum,
fundamental, mdio e superior. O nvel de satisfao com o trabalho pode
ser avaliado por uma escala de cinco pontos, sendo 1- completamente
insatisfeito, 2 - insatisfeito, 3 - mais ou menos satisfeito, 4 - satisfeito e

5 - completamente satisfeito.

= --=-~esrionrio

.-_ ...e=-a.. Tendo em

d) Elaborar uma ou mais perguntas para cada varivel a ser observada.


A varivel nvel de satisfao com o trabalho pode ser avaliada sob vrios
enfoques, como a satisfao com o salrio que recebe, com a segurana
no emprego, com a autonomia de trabalho que a empresa oferece, etc .
Estes itens podem ser avaliados isoladamente, num mesmo tipo de
escala, como a escala de cinco pontos sugerida em (c). E o nvel de
satisfao ser mensurado como a soma das respostas destes itens.
e) Verificar se a pergunta est suficientemente clara.
As perguntas devem ser formulad as numa linguagem que seja
compreensvel para todos os elementos da populao e, alm disso,
no devem deixar dvidas de interpretao.

:!a empresa;
- :;-..:z.cionrios e
~ o ::rabalho que

~==l:I::::=_::;s

--~<:

--~-

frr..sz:ruo e nvel

ce mensurar as

- oii~tem em como
- socioeconmicos ,
.._-- udos pelo IBGE,

==~=::, ~

responsvel por

~~----""" ~

agropecurios,

f) Verificar se a forma da pergunta no est induzindo alguma resposta.

No se deve, por exemplo, ao tentar avaliar a satisfao de um


funcionrio com o trabalho que exerce, citar aspectos positivos ou
n egativos do trabalho . Isto pode induzir a resposta.
g) Verificar s e a resposta da pergunta no bvia.

Dependendo da forma como se pergunta sobre a satisfao com o valor


do salrio recebido, a resposta ser sempre no, independentemente
da real satisfao que o funcionrio tenha com respeito a esse item.
Isto deve ocorrer, por exemplo, quando s existem dois nveis de
respostas: sim e no. Us ando uma escala de cinco pontos, como
sugerida anteriormente, podemos detectar melhor algumas diferenas
e ntre os respondentes .
Um aspecto fundamental nesta fase da pesquisa o planejamento
de como usar as respostas dos diversos itens para responder s indagaes
de nossa pesquisa. O questionrio tambm deve ser feito de forma a

'4

Ew\TsricA AplicAdA s Ci~NciAs SoclAIS

facilitar a anlise dos dados. O questionrio deve ser completo, no sentido


de abranger as caracteristicas necessrias para atingir os objetivos da
pesquisa; ao mesmo tempo, no deve conter perguntas que fujam desses
objetivos, pois, quanto mais longo o questionrio, menr tende a ser a
confiabilidade das respostas.

CAprulo 2 - PEsoulsAs e dAdo<i

ExERccios
5)

Elaborar um esboo e.:

6)

Ao longo deste cap~


deve ser a confiab~

7)

foRMAS

dE ApliCAO dE UM NSTRUMENTO dE pESQUSA

Nesta fase , tambm devemos decidir sobre a forma de aplicao de


nosso questionrio, ou, mais genericamente, do instrumento de pesquisa.
Um questionrio propriamente dito respondido pelo prprio
elemento da populao, sem que algum encarregado da pesquisa observe
o respondente no momento do preenchimento. Numa entre vista
estruturada, o entrevistado responde verbalmente as perguntas e o
entrevistador as transcreve para uma ficha. Nesta segunda situao, o
entrevistador pode ou no interferir, sob forma de esclarecimento de algum
item, anotando aspectos que julgar relevantes, mas nunca influenciando
na resposta do entrevistado.

Em pesquisas que envolvem aspectos ntimos dos respondentes,


deve-se dar preferncia a um questionrio annimo, com o cuidado de
que o respondente preencha o question rio individualmente e vontade.
Por outro lado, numa pesquisa a ser realizada numa populao que tenha
pessoas no alfabetizadas, uma entrevista estruturada mais adequada.
Deve sempre haver homogeneidade na forma de aplicao dos questionrios. Em pesquisas que envolvem vrios entrevistadores, toma -se necessrio um prvio treinamento para garantir a homogeneidade na aplicao.

2.4 UMA ApliCA3.~


Nesta seo ap:i.~;::.relativamente simples ,
disciplina de Estatisnc:a
1991 / 1, com finalidaee

O problema de pesq=---

Objetivo geral: e:=::


curso (curso de Cin cias =.
nas polticas de melho=
Objetivos

espe~~

1) Avaliar o nket -

realizando.
2)

PR,TESTAGEM

Antes de iniciar a coleta de dados atravs de um questionrio,


precisamos verificar se o instrumento est bom. Nesse contexto, tornase fundamental a realizao de um pr-teste, aplicando o questionrio em
alguns indivduos com caract ersticas similares aos indivduos da
populao em estudo. Somente pela aplicao efetiva do ques tionrio
que podemos detectar algumas falhas que tenham passado despercebidas
em sua elaborao, tais como: ambguidade de alguma pergunta, resposta
que no havia sido prevista, no variabilidade de respostas em alguma
pergunta, etc. O pr-teste tambm pode ser usado para estimar o tempo
de aplicao do questionrio.

3)
Populao: Estua-"""""'
do curso de Cincias da

Amostra: Alunos:--~---

s CI \ CiAs SocAis

~;>:ero, no sentido

- --.,ss- os objetivos da
____ ...:.e fujam desses
~

:ende a ser a

Ui>frulo 2 - PtsouisAs E dAdos

Exrnccios
5)

Elaborar um esboo de questionrio para o problema descrito no Exemplo 2.1.

6) Ao longo deste captulo escrevemos: quanto mais longo for o questionrio menor
deve ser a confiabilidade das respostas. Explique por que isto geralmente ocorre.
7)

Com respeito ao Exerccio 1, sobre uma pesquisa eleitoral, complemente com


algun s objetivos especficos e proponha um questionrio para a obteno
dos dados. Discuta sobre a forma de aplicao que voc julga ser a mais
adequada para a presente situao.

2.4
e o
situao, o
~::i~o de algum
i:::::r.:a :nfluenciando

UMA ApliCAO

::....:..-==~~ .:o.S ~rguntas

~.:...:::.a

Nesta seo apresentaremos um exemplo de um projeto de pesquisa


relativamente simples, desenvolvido com a participao dos alunos da
disciplina de Estatstica do curso de Cincias Sociais da UFSC, semestre
1991/1, com finalidades puramente acadmicas.
O problema de pesquisa: A relao do aluno universitrio com o curso.

Objetivo geral: Conhecer melhor a relao entre o aluno e o seu


curso (curso de Cincias da Computao da UFSC), para servir de subsdio
nas polticas de melhoria do curso.
Objetivos especficos:
1) Avaliar o nvel de satisfao do aluno com o curso que est
realizando.
2) Verificar se existe associao entre o nvel de satisfao do aluno
com o seu desempenho no curso.
3) Levantar os aspectos positivos e negativos do curso, na viso do
aluno.

------=s

roma-se neces,::::=::;:::!:c::C2::rl e na aplicao.

-=questionrio,
co::n exto, toma___
- _, - questionrio em
-s indivduos da
- - co questionrio
>a"n despercebidas
~::-g-u.nta, resposta
~:as em alguma
~ estimar o tempo
~

Populao: Estudantes que estavam cursando as trs ~timas fases


do curso de Cincias da Computao da UFSC, semestre 1991 / 1.
Amostra: Alunos presentes no dia de aplicao dos questionrios,
realizada em salas de aula de trs disciplinas obrigatrias das ltimas
fases do curso.5
~

Como veremos no prximo captulo, essa forma de seleo da amostra pode causar vis,
pois os alunos que costumam faltar s aulas ficam quase que inacessveis. E alguns desses
alunos podem estar faltando sistematicamente por estarem insatisfeitos com o curso.

76

EsTAr~riei\ ApliCAdA s CiNCiAs SociAi~

CAprulo 2

PEoulm

dAdoc;

foRMA dE MENSURAO dAS VARiVEiS

Satisfao com o curso: avaliao numrica, numa escala de 1 (um)


a 5 (cinco), de acordo com a percepo do aluno. Alm de uma medida de
satisfao geral, complementa-se com avaliaes de aspectos especficos
do curso, como corpo docente, recursos materiais e contedo curricular.

Os itens
realmente pertence ?":_
na anlise dos dados.

Desempenho do aluno: ndice de Aproveitamento Acumulado,


calculado pela instituio, em funo dos conceitos (ou notas) obtidos
pelo aluno nas disciplinas cursadas.

curso, na percepo~
item est associado co:=
a (f) procuram atin~ :
sero usadas com \is~.

Aspectos positivos e negativos do curso: 1) avaliaes numricas,


numa escala de 1 (um) a 5 (cinco), de acordo com o nvel que o aluno
julgar que melhor se adapte sua concordncia com alguns aspectos do
curso; 2) avaliaes qualitativas, em que o aluno descreve livremente o
principal aspecto positivo e negativo do curso. Na segunda avaliao, as
categorias de cada varivel sero criadas depois de uma anlise das
respostas dos questionrios, onde as respostas similares sero agrupadas
numa nica categoria.
QUESTIONRIO

Este questionrio faz parte de um trabalho acadmico. Os questionrios so


annimos, portanto no coloque seu nome. Solicitamos sua colaborao respondendo
correta e francamente os diversos itens, agradecendo-lhe antecipadamente. Os resultados
da pesquisa ficaro disponveis para a comunidade acadmica.

O item 4 procu_-au
uma pergunta aberra..
O item 5 uma=
pela instituio e u sab.
em geral, os alunos ::..=_
questionrio levou ll7"" -=
de toda a turma, para e;:"".:..;;
o na folha do ques ti~
item 3(g), sero usa25

2.5 CodificAo ~-- -

1) Qual o curso que voc est realizando na UFSC? _ _ __


2) Qual a fase predominante em que voc se encontra? _ __ _
3) D uma nota de 1 (um) a 5 (cinco), sendo 1 o nvel minimo e 5 o nvel mximo, para as
seguintes caractersticas relacionadas com voc e seu curso.
a)
b)
c)
d)
e)
fj
g)
4)

Didtica dos professores de seu curso ......................... (1


Nvel de conhecimento dos professores ..... ................... (1
Bibliografia disponvel ................................................. (1
Laboratrios e outros recursos materiais ..................... (1
Contedo dos programas das disciplinas oferecidas ..... (1
Encadeamento das disciplinas ............................. .... ... (1
Satisfao com o curso, num sentido geral .................. (1

2
2
2
2
2
2
2

3
3
3
3
3
3
3

4
4
4
4
4
4
4

5)
5)
5)
5)
5)
5)
5)

1)
2)
3)

b) Nvel de conhecirr'"
c) Bibliografia dispon..~

Apresente o principal ponto positivo e negativo de seu curso.


POSITIVO:._ _ _ __ __ _ _ _ _ _ __ .
NEGATIVO:_ _ _ _ _ _ __ _ _ _ __ _ .
6

5) Anote o seu ndice de Aproveitamento Acumulado

(ver tabela com o aplicador).

D uma nota de 1 (u:::::. ==

seguintes caracteris.-"-4- ......


a) Didtica dos profes.s::: :s

A incluso deste dado ::x: ;:-com outras respostas i:o E-inclui-lo depois da cole-..a :l::l5

MI

!b

O h clAs SoclAis

Dprulo 2 - Prsous.>.S

d.>.dos

CoMENTnios sobnE os iTENS do QUESTioNnio

-::-..ns especficos
_co curricular.

es n umricas,
~= que o aluno
.:: -.:::.s aspectos do
~--'--"":e J-rremente o
-~ a't"aliao, as
_..a anlise das
---.,:,~d> agrupadas

Os itens 1 e 2 so de controle, para verificar se o respondente


realmente pertence populao em estudo. Estes itens no sero usados
n a anlise dos dados.
No item 3 estamos tentando quantificar algumas caracteristcas do
curso, na percepo do aluno, numa escala de 1 (um) a 5 (cinco). Este
item est associado com os trs objetivos da pesquisa. Os subitens de (a)
a (f) procuram atingir o objetivo 3, j que as respostas do subitem (g)
sero usadas com vistas aos objetivos 1 e 2 .
O item 4 procura complementar a informao do item 3, atravs de
uma pergunta aberta .
O item 5 uma medida de desempenho do aluno no curso, calculada
pela instituio e usada para estabelecer prioridades na matricula. Como,
em geral, os alunos no sabem de cor o seu ndice, o aplicador do
questionrio levou uma relao contendo os ndices de aproveitamento
de toda a turma, para que o aluno pudesse localizar o seu, transcrevendona folha do questionrio. As respostas deste item, juntamente com o
item 3(g), sero usadas para atingir o objetivo 2 .6

-.. -"'::.""tionrios so
respondendo
===:::::::=:i::.e. ~s resultados
=-:::::::~-~

r- - - ---

2.5 CodificAo dos dAdos


Depois de os dados terem sido coletados, precisamos organiz-los,
para facilitar a realizao da anlise . Tomemos o primeiro questionrio
respondido.
R ESPOSTAS DE UM QUESTIONRIO

1)

Qual o curso que voc est realizando na UFSC? Computaco.

2) Qual a fase predominante em que voc se encontra? Oitava.


3)

D uma nota de 1 (um) a 5 (cinco), sendo 1 o nivel mnimo e 5 o nvel mximo, para as
seguintes caractersticas relacionadas com voc e seu curso.
a) Didtica dos professores de seu curso ........................ . (1 )! 3 4 5)
b) Nvel de conhecimento dos professores ........................ (1 2 3 )( 5)
c) Bibliografia disponvel ................................................. (1 )! 3 4 5)

d:dac:omo aplicador).

A incluso deste dado no prprio questionrio era importante para podermos associ-lo
coro outras respostas do aluno. Como o questionrio era annimo, no seria possvel
inclu-lo depois da coleta dos dados.

78

EsTArsr icA AplicAdA s CiNCiAS SociAis

d)
e)
fj
g)

4)

Laboratrios e outros recursos materiais ........................... {)J:: 2 3


Contedo dos programas das disciplinas oferecidas ............ (1:2'. 3
Encadeamento das disciplinas ......................... .. .............. (1:2'. 3
Satisfao com o curso, num sentido geral ........................ (1 )( 3

4
4
4
4

5)
5)
5)
5)

ANEXO
Dados da p es--
questionrios.

Apresente o principal ponto positivo e negativo de seu curso.


POSITIVO: Professores ramvei.s.
NEGATIVO: Falta e m conservaco de laboratrios.

5) Anote o seu ndice de Aproveitamento Acumulado? 1.95 (ver tabela com o aplicador).
Os dados normalmente so armazenados numa matriz (ou quadro),
onde cada coluna se refere a uma varivel e cada linha a um respondente .7
A Tabela 2.1 mostra os dados armazenados dos cinco primeiros
respondentes. Os dados do questionrio respondido acima esto na
primeira linha da tabela.

Tabela 2.1 Armazenamento dos dados de cinco respondentes


Item do uestionrio

nQ do
quest.

1
2
3
4
5

3(a)
3(b)
didat . conhec.

2
2
3
2
3

4
3
2
2
3

3(c)
bibl.

3(d)
labor.

3(e)
disc.

3(f)
curric.

3 (g)
satisf.

2
2
1
3
4

1
1
1
1
3

2
2
3
4
3

2
3
2
4
4

2
3
3
3
2

5
de sem

9
3
3
3

1,95
1,72
2,39
2,57
2,5 1

As categorias relativas aos itens 4(a) e 4{b) foram criadas a partir de


uma anlise das respostas dos questionrios, agrupando respostas similares. Para o item 4(a), ponto positivo, as categorias e correspondentes
cdigos foram: 1 - Professores, 2 - Atualizao, 3 - Abrangncia, 4 - Aplicaes
prticas, 5 - Currculo e disciplinas e 9 - Outros. Para o item 4(b), ponto
negativo, foram: 1 - Professores, 2 - Laboratrios e recursos materiais,
3 - Currculo e disciplinas, 4 - Aplicaes, 5 - Atualizao e 9 - Outros.
No Anexo, final deste captulo, apresentamos os dados dos 60
respondentes desta pesquisa. A anlise desses dados ser feita ao longo
dos exerccios dos prximos captulos.

CAprulo 2 - PEsouisAs dAos

Em linguagem computacional, a matrz de dados corresponde a um arquivo, as variveis


so os campos e os dados de um respondente so os registros do arquivo.

no do
quest.
1
2
3
4

5
6
7
8

3(a)

3(b)

didat.
2
2
3
2
3
2

conhec.

10
11

12
13
14
15
16

3
4

4
3

2
2
3
2
3
3
3
4

3
4
3

17

18

19
20

4
2'
3

21
22

23
24

2
3

25
26
27
28

3
3
3

32

2
3
3
2

33

34
35

2
3
3
3

29
30

31

36
37
38

39
40
41

2
4
3

42

2
3

43

..:.

4
4
3
4
3
2

3
4

3
3
4
2
4

3
3
4

3
3

>.5

Ci'ICiAs

SociAis

39

CAprulo 2 - PEsOuiSAS E dAdos

ANEXO
Dados d a p esquisa descrita na Seo 2.4 . Respostas de 60
questionrios.

~ a:m o aplicador).
~~-:z

ou quadro),

-~~i::=: :espondente. 7

-=.co primeiros

.:.ro
5
=.e;;at. d esem
2
1
3
5

~---

1,9 5
1,72
2,39
2,57
2,51

-=-;>osras simi-

e - ::-espondentes
..!.- Aplcaes
-:e= 4 (b), pont o

~::::z~c.

ne do 1 3(a) 1 3(b) 1 3(c) 1 3(d) l 3(e)


auest. didat. conhec. bibl. la bor. clisc.
4
2
1
2
1
2
1
2
2
2
3
2
3
2
1
1
3
3
4
4
2
2
1
3
4
3
3
3
3
5
1
2
2
2
3
6
4
7
4
3
1
1
2
2
2
3
2
8
4
3
2
3
9
3
10
4
2
1
3
3
2
2
3
3
3
11
4
4
4
2
3
12
4
4
2
3
3
13
2
2
3
14
2
3
2
4
2
3
3
15
3
3
1
2
3
16
4
4
17
2
4
3
4
4
4
1
1
18
4
4
2
1
19
3
2
1
1
3
20
2
1
21
2
3
2
3
4
4
4
3
22
3
4
2
3
2
3
23
4
4
4
4
24
3
4
4
2
3
25
3
2
26
3
3
2
3
4
27
3
2
3
3
4
3
3
2
3
28
2
3
2
29
2
1
1
3
4
30
3
3
3
3
4
2
3
31
2
3
1
1
3
32
4
3
2
1
33
3
4
4
34
2
4
3
2
2
4
3
3
35
3
4
2
2
3
36
4
37
3
3
3
3
3
4
3
3
3
38
2
3
3
39
l
3
4
3
4
40
4
1
4
41
3
3
3
3
2
3
3
42
2
3
4
43
2
2
3
3

3(f) 1 3 (g) 1 4(a) 1 4(b) 1


5
curric. satisf. posit. negat. desemp.
2
1,95
2
2
1
3
3
1
1,72
9
2
3
3
2,39
3
5
2, 57
4
3
3
4
1
2
2,5 1
3
2,04
1
3
2
9
1,99
2
5
l
9
3
1
2,69
3
4
2,57
4
5
2
4
1
4
2,10
1
3
3
2
2
3 ,61
2,37
4
2
3
1
1,62
3
4
1
3
1,87
3
3
1
2
3
2,47
3
4
2
1
2,61
3
2
3
3
1
2,73
4
2
2,50
5
9
4
3
3
1
3,12
1
3,19
3
3
9
4
3
2
2
3, 65
2
4
3,01
5
1
1
2,13
3
3
1
3
3
9
9
1,25
4
2,34
1
9
5
2,69
4
3
2
5
3
4
3
2, 59
9
4
2
1
2,27
9
1
2
l
3
1,30
4
4
1
3,18
9
l
2,54
4
4
3
2
5
2 ,07
3
3
4
1
2 ,26
2
1
1
2,02
4
9
5
2, 19
4
2
3
4
4
4
2
3,48
4
4
2
1
3 ,29
1
2 ,94
3
3
l
2,92
4
3
9
1
2,10
4
3
2,37
2
3
3
4
1
2,43
3
3
4
4
4
3
2,00

40
3(a)
3{b)
n do
3(c)
3(d)
3(e)
quesl. dida t . conhec. bibl. labor. disc.
44
2
2
2
l
3
45
3
3
2
3
4
46
4
2
3
1
2
47
3
4
3
3
4
48
3
4
3
3
3
49
2
3
3
1
3
50
3
4
2
l
3
51
3
3
1
1
2
52
4
2
2
4
".l
53
3
4
1
2
3
54
3
3
3
2
5
55
3
4
3
2
4
56
4
3
5
3
4
57
3
4
3
2
3
58
2
3
3
3
4
59
3
4
3
3
5
60
3
3
1
1
3
NOTA: O ponto (.) representa no resposta.

EsrATsrcA AplicAdA s CiNCAS SociAis

3(f)
curric.
3
5
3
4
4
3
3
3
3
3
4
4
4
4
4

5
3

3(g)
satisf.
3
4
3
5
3
3
3
3
4
4
3
4

4(a)
posit.
4
9
9
2
9
9

9
1
5

4(b)
negat.
1
1
2
1
1
1
2
2
9
2
2

5
1
5
5

2
1
1

3
2
3
3

5
desemp.
1,83.
2,93
2 ,50 1
3,00
2,06
1,56
2,27
2,14 1
2 ,42
3,56
3,52
3,22
3,63
3,53
2, 13
2,3 1
3,62

(Aprulo 7

Tc.

apenas uma amos~


amostra, obter valo:-e:;. de interesse. Esse tipc
por amostragem. Co=--

-=

obsexvados deve

se~~

Populao o conjun::- -::= pesquisa sejam vlidas.. : ou mensurados sob as~

5
desemp.
l ,83
2,93
2 ,50
3,00
2,06
1,56
2,27
2,14
2,42
3,56
3,52
3,22
3,63
3,53
2,1 3
2,31
3,62

TCNiCAS dE AMOSTRACJEM

amostragem naturalmente usada em nossa vida diria. Por exemplo,


para verificar o tempero de um alimento em preparao, podemos provar
(observar) uma pequena poro. Estamos fazendo uma amostragem, ou seja,
extraindo do todo (populao) uma parte (amostra), com o propsito de termos
uma ideia (inferinnos) sobre a qualidade do tempero de todo o alimento.

Nas pesquisas cientficas, em que se deseja conhecer algumas


caractersticas (parmetros) de uma populao, tambm podemos observar
apenas uma amostra de seus elementos e, com base nos resultados da
amostra, obter valores aproximados, ou estimativas, para os parmetros
de interesse. Esse tipo de pesquisa usualmente chamado de levantamento
por amostragem. Contudo, a seleo dos elementos que sero efetivamente
observados deve ser feita sob uma metodologia adequada, de tal forma
que os resultados da amos tra sejam suficientemente informativos para se
inferir sobre os parmetros populacionais. E o objetivo do presente capitulo
estudar esta metodologia , ou seja, o processo de amostragem.
AlquNS CONCEiTOS E EXEMplos

Como definimos no captulo anterior,


Populao o conjunto de elementos para os quais desejamos que as concluses da
pesquisa sejam vlidas, com a restrio de que esses elementos possam ser observados
ou mensuradossob as mesmas condies.

Este capitulo teve a participao da professora Slvia Modest o Nassar, doutora em Engenharia
Biomdica e Professora Titular do Departamento de Informtica e Estatstica da UFSC.

42

EsrArsricA AplicAdA s CiNCiAs SociAis

A populao pode ser formada por pessoas, familias, estabelecimentos industriais, ou qualquer outro tipo de elementos, dependendo
basicamente dos objetivos da pesquisa. Mas, em geral, o interesse se
resume em alguns parmetros.
Parmetro uma medida que descreve certa caracterstica dos elementos da populao.

EXEMplo 7.1 Numa pesquisaepiderrolgica, a populao pode ser definida


como todas as pessoas da regio em e s tudo, no momento da pesquisa. O
principal parmetro a ser avaliado deve ser a percentagem de pessoas
contaminadas.
EXEMplo 3.2 Numa pesquisa eleitoral, a trs dias de uma eleio municipal,
a populao so os eleitores que vo votar no municpio (populao-alvo),
mas, para viabilizar a pesquisa, comum definir a populao como o
conjunto dos eleitores que residem no municpio. Os principais parmetros
so as percentagens de votos de cada candidato, no momento da pesquisa.
ExEMplo 3J Para planejar polticas de recursos humanos numa empresa,
com milhares de funcionrios, pode ser realizada uma pesquisa para
avaliar alguns parmetros da populao de funcionrios, tais como: tempo
mdio de servio, percentagem de funcionrios com nvel de instruo
superior, percentagem de funcionrios com interesse num certo programa
de treinamento, etc.
Nos trs exemplos, o leitor pode perceber a dificuldade em pesquisar
toda a populao. So situaes em que se recomenda usar amostragem.
Veja a Figura 3.1.

CApwlo ~ - T~cNiCAS de ~,

de uma amostra pa.-a ... "'


de onde foi extraida a.....___,
e com o objetivo C:e =estimativas desses pa: -:=:;-~
percentagens dos~=.;:
das verdadeiras pe:ce:;:::::::;
Amostra: parte dos~
Estimativa: valor ~-~

ExEMplo 3J (coNTiNt..u)of

l)

Economia. Em gera::., .
--4111
iii"a parte da pop-:- 3 . -

2)

Tempo. Numa pese;:-_,__


1ia veria tempo su 5ce=:;
pas, mesmo que

"'" --=--

3)

Confiabilidade dos

Opemcionalida.e.

.=: - -

problemas tpicos ~
controle dos entra--;:

AMOSTRA: uma
parte dos eleitores

l)

Populao pequena. :.
~

numa sala de a ula


INFER~NCIA

Figura 3.1 Pesquisa eleitoral: um caso tipico de levantamento


por amostragem.

elemento$, pOcle-~&:
nas respostas.
4)

AMOSTRAGEM

s.:

acusar 60% de farn~.;., =--dizer que o valor 6C


da empresa favor>e;s

-_

:\S

Cir-.ciAs SociAis

- =1jas , estabeledependendo
o interesse se

~ :ns.

- -:ns da populao.
--~- -?Orle ser definida

--~-

ea pesquisa. O

=:;;ge:-"..

de pessoas

CApTulo

7-

TCNiCAS

df

4~

AMOSTRAGEM

O termo inferncia estatstica refere-se ao uso apropriado dos dados


de uma amostra para se ter conhecimento sobre parmetros da populao
de onde foi extrada a amostra. Os valores calculados, com base na amostra
e com o objetivo de avaliar parmetros desconhecidos, so chamados
estimativas desses parmetros. Numa pesquisa eleitoral, por exemplo, as
percentagens dos candidatos, divulgadas antes da eleio, so estimativas
das verdadeiras percentagens, relativas a toda a populao de eleitores.

Amostra: parte dos elementos de uma populao.


Amostragem: o processo de seleo da amostra.
Estimativa: valor calculado com base na amostra e usado com a finalidade de avaliar
aproximadamente um parmetro.

- - e+.:""io municipal,
-~-

_!XJJT..tlao-alvo),

~.i:ao

como o
-~- .::e:sparmetros
=:::=:=::::o da pesquisa.

ExEMplo ~J (coNTNUAO) Se uma amostra de 200 funcionrios da empresa


acusar 60% de favorveis a um certo programa de treinamento, podemos
dizer que o valor 60% uma estimativa da percentagem de funcionrio;>
da empresa favorveis a esse programa de treinamento .

::--.:ma empresa,
===. :;:iesquisa para

~------''
.=;_......__ _

PoR ouE AMOSTRAGEM?

, _____ ___..,t.z:s como: tempo


-

_e de instruo
:::ert.0 programa

1) Economia. Em geral, toma-se bem mais econmico o levantamento de somente


uma p arte da populao.
2)

Te~o. Numa pesquisa eleitoral, a trs dias de uma eleio presidencial, no


haveria tempo suficiente para pesquisar toda a populao de eleitores do
pais, mesmo que houvesse recursos financeiros em abundncia.

3)

Confiabilidade dos dados. Quando se pesquisa um nmero reduzido de


elementS, Pd-=--s e dar mais ateno aos casos individuais, evitando erros
nas respostas.

4)

Qp_~acionalidade. mais fcil realizar operaes de pequena escala. Um dos


problemas tpicos nos grandes censos (pesquisas de toda a populao) o
controle dos entrevistadores.

- - - -""""'-""- em pesquisar
~--"- ~ a::::J.ostragem.

UANdO O USO dE AMOSTRAGEM NO NTERESSANTE?

l)

Populao pequena. Imagine que se queira saber a percentagem de mulheres


numa sala de aula com dez alunos, antes de conhecer a turma. intuitiva a

necessidade de observar quase todos os estudantes da sala para se ter uma


estimativa razovel. Em especial, quando a amostragem obtida sorteando
elementos da populao (amostragem aleatria), mais vale o tamanho absoluto
da amostra do que a percentagem que ela representa na populao.

44
2)

EsrArsricA Apl ic11d1\ s CiNciAs SociAis

Caracterstica de fcil mensuraa.o. Talvez a populao no seja to pequena,


ns a varive l que se q~~Servar d e Lo fcil mensurao que no
compensa investir num plano de amostra gem. Por exemplo, para verificar a
percentagem de funcionrios favorveis mudana no horrio de um turno
de trabalho, podemos entrevistar toda a popula o no prprio local de trabalho.
Esta atitude pode tambm ser politicamente mais recomendvel.

3 ) Necess idade de alta preciso. A cada dez anos o IBGE realiza um censo
demogrfico para estudar diversas carac tersticas da populao brasileira.
Dentre essas caractersticas, t em-se o parmetro nmero de habitantes
residentes no pas. um parmetro que precisa ser avaliado com grande
preciso; por isso, pesquisa-se toda a populao.

CApTulo ~ - T( <.:Ni<.:As

7.1

de 111.1

AMOSTRAQE'
Para selecionz:- - -

lista completa dos e~e.=-- ::t-4

apropriadas) . Este ti?='


atravs de um sorre:.:- ~
Seja uma pop~
amostra aleatria s_-'
elementos da popu "a';'.:=
n pedaos. Consice~

PIANO dE AMOSTRAGEM
Para elaborar um plano de amostragem, devemos ter bem definidos
os objetivos da pesqu isa, a populao a ser amostrada, bem como os
parmetros que precisamos es timar para atingir aos objetivos da pesquisa.
Num plano de amostragem deve constar a definio da unidade de
amostragem, a forma de seleo dos elementos da populao e o tamanho
da amostra.
A unidade de amostragem a unidade a ser selecionada para se
chegar aos elementos da populao. As unidades de amostragem podem
ser os prprios elementos da populao, ou outras unidades qu e sejam
mais fceis de serem selecionadas, mas que tenham correspondncia
com os elementos da populao. Por exemplo, numa populao de famlias
moradoras de uma certa cidade, podemos planejar a seleo de domiclios
residenciais da cidade. Chegando ao domicilio (unidade de amostragem),
podemos chegar famlia moradora deste domiclio (elemento da
populao) .

A seleo dos elementos que faro parte da amostra pode ser feita
sob alguma forma de sorteio. So as chamadas amostragens aleatrias,
que so particularmente interessantes por permitirem a utilizao das
tcnicas clssicas de inferncia estatstica, facilitando a anlise dos dados
e fornecendo maior segurana ao generalizar resultados da amostra para
a populao. Estudaremos, inicialmente, alguns tipos de amostragem,
em especial as aleatrias. Posteriormente, discutiremos a questo do
tamanho da amostra.

mais que uma vez.

A amos trage= I!:......'-'-'-"


qualquer subconjul?4=
fem a mesma proba:; ~~
temos que cada el.er-_
por
de pertencB"

..,

%)

As tabelas de =::........._
uma amostra alea~~
sucessivos sorteios .
apresentados algu.r:~ .- ~
Tabela 1 do ap n~
servem, apenas, para~
na sua utilizao.
59 58 48 36 47
53 26 215021

ExEMplo 7.4 Com o

e~

funcionrios de uma e:':-~


simples de tamanho ...:.__
apresentada a seguir .!'
~

Para facilitar a

exemp~

Contudo, como j diSC'-===:.


muito pequena.

~ ~

C if, til\S Socl.\iS

C\pn.lo

7.1

- Tto.IC.\s dt

45

.>.\IOSTRA(jr\I

AM.OSTRA~EM AlEATRiA siMplEs


Para selecionar uma amostra aleatria simples, precisamos ter uma

lista completa dos elementos da populao (ou de unidades de amostragem

apropriadas). Este tipo de amostragem consiste em selecionar a amostra


atravs de um sorteio, sem restrio.

__,,:-bem definidos
----~~ bem como os
~da pesquisa.
~__..,.....- ca u nidade de

Seja uma populao com N elementos. Uma forma de extrair uma


amostra aleatria simples de tamanho n, sendo n < N, identificar os
elementos da populao em pequenos pedaos de papel e retirar, .~acaso..i.
n pedaos. Consideraremos, neste livro, que o sorteio seja feito sem
reposio, ou seja, cada elemento da populao no pode ser sorteado
\
mais que uma vez.
A amostragem aleatria simples tem a seguinte propriedade:
qualquer subconjunto da populao, com o mesmo nmero de elementos,
iem a mesma probabilidade de fazer parte da amostra. Em particular,
temos que cada elemento da populao tem a mesma probabilidade (dada
por
de pertencer amostra.

'fw)

NMEROS AlEATRiOS

As tabelas de nmeros aleatrios facilitam o processo de seleo de


uma amostra aleatria. So formadas por nmeros resultantes de
sucess ivos sorteios independentes de {O, 1, 2,. .. , 9}. A seguir, so
apresentados alguns nmeros aleatrios (as duas primeiras linhas da
Tabela 1 do apndice). Os espaos colocados a cada dois algarismos
servem, apenas, para facilitar a visualizao da tabela, no interferindo
na sua utilizao.
Nmeros aleatrios

-s ragens aleatrias,
-=~~~---

a utilizao das
=- ~~a'ise dos dados
_ _.,,::,.._-.,.-.a amostra para
_:;;; ce amostragem,
~ a questo do

59 58 48 36 47
53 26 215021

92850508 6 5
37 93 85 52 86

474910 41 05
86 22 75 34 37

10 75 59 7 5 99
69 85 2 5 03 78

17 28 97 99 75

50 26 18 25 10

ExEMplo 7.4 Com o objetivo de estudar algumas caractersticas dos


funcionrios de uma certa empresa, vamos extrair uma amostra aleatria
simples de tamanho cinco. A listagem dos funcionrios da empresa
apresentada a seguir.2
2

Paz-a facilitar a exemplificao das tcnicas de amostiagem, usaremos populaes pequenas.


Cont udo, como j discutimos, n o se costuma usar amostragem aleatria em populao
muit o pequena.

46

EsrArsricA ApliCAU1\

CiNciAs SociAis

POPULAO: funcionrios da empresa


Aristteles
Cardoso
Emestino
Geraldo
Joana
Josefa
Paula

Anastcia
Carlito
Endevaldo
Gabriel
Joaquim
Josefina
Paulo Csar

Arnaldo
Cludio
Francisco
Getlio
Joaquina
Maria Jos

Bartolomeu
Ermlo
Felicio
Hiraldo
Jos da Silva
Maria Cristina

Bernardino
Hercilio
Fabrcio
Joo da Silva
Jos de Souza
Mauro

CApru lo ~ - TtCN iCAs de ~

ExERccios

1) Considerando a~
simples de n = 10 !a-n ;r'4
aleatrios (Tabela : e:::
2)
Aristteles
Cardoso
Erncstino
Geraldo
Joana
Josefa
Paula

Para utilizar uma tabela de nmeros aleatrios, precisamos associar


cada elemento da populao a um nmero. Por simplicidade , consideraremos nmeros inteiros sucessivos, com a mesma quantidade de
algarismos, iniciando-se por 1 (um).

2
7

Ca:~
En~

Gab~

16

2
l

Numerao dos elementos da populao


O1. Aristteles 02. Anastcia

06. Cardoso
11. Ernestino
16. Geraldo
21. Joana
26. Josefa
31. Paula

07.
12.
17.
22.
27.
32.

Carlito
Endevaldo
Gabriel
Joaquim
Josefina
Paulo Csar

03. Arnaldo
08. Cludio
13. Francisco
18. Getlio
23. Joaquina
28. Maria Jos

04.
09.
14.
19.
24.
29.

Bartolomeu
Ermilio
Felicio
Hiraldo
Jos da Silva
Maria Cristina

05. Bernardino
10. Herclio
15. Fabrcio
20. Joo da Silva
25. Jos de Souza
30. Mauro

Para extrairmos uma amostra aleatria simples de tamanho n = 5,


basta tomar cinco nmeros aleatrios do conjunto {01, 02, ... , 32}. Os
funcionrios associados aos nmeros selecionados formaro a amostra.
No existe forma especfica para extrair os nmeros da tabela. Iniciaremos,
neste exemplo, pela primeira linha, desprezando os valores que estiverem
fora do conjunto {01, 02, ... , 32} e os valores que se repetirem.
Nmeros aleatrios extrados da tabela: 05, 08, 10, 17 e 28.
Amostra: {Bernardino, Cludio, Hercilio, Gabriel e Maria Jos}

Na prtica, estamos interessados na observao de certas variveis


associadas aos elementos da amostra. No exemplo em questo,
poderamos estar interessados na varivel tempo de servio na empresa,
em anos completos. Denominaremos esta varivel de X. Para cada
funcionrio da amostra, temos um valor para a varivel X. O conjunto
desses valores chamado amostra aleatria simples da varivel X, conforme
ilustrado a seguir:
Amostra de funcionrios:
{Bernardino, Cladio, Hercilio, Gabriel e Maria Jos}

l
Amostra da varivel X:
{X"
onde X1 o tempo de servio do Bernardino,

JS,

Xi

l
~.

X4,
X5 },
o tempo de servio do Cludio, etc.

3)
4)

5)

numerao vai de : =
nmeros aleatn~
necessrio efe~ :::.;.._
Seja um conjunto ~
de nmeros ale~
de 1O crianas.

7.2

UTROS TipC~

Muitas vezes, ~
parecidas com a ale.a-
que o apresentado~ s.=
de 1.000 fichas, de::=:=
sistematicamente, 1r..r da populao tenha a
devemos sortear a p:--=:;.__

Uma amostra ')-' ~ ...


aleatria simples se
aleatoriamente. A !"e-3: exemplo das fichas , o =-_

CApTulo 7 -

3e=ardino
-::.e:tilio
rabricio
_oo da Silva
~osc de Souza
Ya..!ro

Hc,icAs

47

de A\IOSTRAGE"

Exrnccios
1) Considerando a populao do Exemplo 3.4, extraia u ma amostra aleatria
simples de n = 1 O funcionrios. Inicie pela segunda linha da tabela de nmeros
aleatrios (Tabela 1 do apndice).
2) Ainda com respeito ao Exemplo 3.4, suponha que o tempo de servio destes
funcionrios, em anos completos, so os valores seguintes:
Aristteles
Cardoso
Ernestino
Geraldo
Joana
Josefa
Paula

2
16
7

8
2
1
4

5 Arnaldo
Anastcia
Carlito
3 Cludio
Endevaldo 2 Francisco
Gabriel
8 Getlio
Joaquim
22 Joaquina
Josefina
5 Maria Jos
Paulo Csar 2

2
1

o
2
3
3

Bartolomeu
Ermlio
Felicio
Hiraldo
Jos da Silva
Maria Cristina

1
13
10
9
4

Bernardino
Hercilio
Fabricio
Joo da Silva
Jos de Souza
Mauro

11
10

5
4

2
11

Apresente a amostra da varivel tempo de servio associada amostra de


funcionrios obtida no Exerccio 1.
5 Bernardino

Hercilio
_5. Fabrcio
_ Joo da Silva

:amanho n = 5,
:.. 02, ..., 32}. Os

Usando a primeira coluna da tabela de nmeros aleatrios, extraia uma


amostra aleatria simples de 4 (quatro) letras do alfabeto da lngua portuguesa.
4) Os elementos de uma certa populao esto dispostos numa lista, cuja
numerao vai de 1.650 a 8.840. Descreva como voc usaria uma tabela de
nmeros aleatrios para obter uma amostra de 100 elementos. Seria
necessrio efetuar nova numerao?
5) Seja um conjunto de 20 crianas numeradas de 1 a 20. Usando uma tabela
de nmeros aleatrios, dvida aleatoriamente essas crianas em dois grupos
de 1O crianas.

3)

7.2

UTROS Tipos dE AMOSTRAqENS AlEATRiAS


AMOSTRAGEM SiSTEMTiCA

-- ,..: X O conjunto
~IX, conforme

c..... --:-:el e Maria Jos}

l
X~,

~do

X5 },
Cludio, etc.

Muitas vezes, possvel obter uma amostra de caractersticas


p arecidas com a aleatria simples, por um processo bem mis rpido do
que o apresentado na seo anterior. Por exemplo, para tirar uma amostra
de 1.000 fichas, dentre uma populao de 5.000 fichas, podemos tirar,
sistematicamente, uma ficha a cada cinco. Para garantir que cada ficha
d a populao tenha a mesma probabilidade de pertencer amostra,
d evemos sortear a primeira ficha dentre as cinco primeiras.
Uma amostra sistemtica poder ser tratada como uma amostra
aleatria simples se os elementos da populao estiverem ordenados
aleatoriamente. A relao
chamada i~alo de seleo. No
exemplo das fichas, o intervalo de seleo 5. 00 l .OOO = 5 .

o/n

48

E>1A1b1iCA Apl icAcJA t CitNCi/\o SociAi;

ExEMplo

7.5 Usaremos, como exemplo, a populao dos N = 32 funcionrios

do Exemplo 3.4. Vamos realizar uma amostragem sistemtica par a


obtermos uma amostra de tamanho n = 5. Calculemos, inicialmente, o
intervalo de seleo: N 1 = 32/ ~ 6.

ln

75

Populao: funcionrios da empresa


O1. Aristteles
06 . Cardoso
11 . Erncstino
16. Geraldo
21. Joana
26. Josefa
31. Paula

02.
07.
12.
17.
22.
27.
32.

Anastcia
Carlito
Endevaldo
Gabriel
Joaquim
Josefina
Paulo Csar

03. Arnaldo
08. Cludio
13. Francisco
18. Getlio
23. Joaquina
28. Maria Jos

04. Bartolomeu
09. Ermilio
14. Felcio
19. Hiraldo
24. Jos da Silva
29. Maria Cristina

de

~"

Sobre os diversu
aleatrias, de forma ik.
das amostras de cada~
POPULAO

Estrato 1
05. Bernardino
10. Hercilio
15. Fabrcio
20. Joo da Silva
25. Jos de Souza
30. Mauro

Estrato 2

1 a1ea:
~
-

Estrato k
Figura 3.2 Esquema da se>

Devemos sortear um elemento dentre os seis primeiros, podendo,


para isso, tomar um nmero da tabela de nmeros aleatrios. Tomando,
por exemplo, o primeiro nmero de um algarismo da segunda linha (53
26 ...), temos que o primeiro funcionrio da amostra o quinto elemento,
portanto o Bernardino. E a amostra sistemtica: 3
5
5+6 = 11
11+6 = 17
17 + 6 = 23
23 + 6 = 29

C:Aprnlo;; - TcNicAs

Amostragem es: :e; 3ii


amostragem estratifica:.
da populao mzcorresponde a 2oe corresponder a 2 00!: C2

~Bernardino
~

Emestino

~Gabriel
~Joaquina
~

Maria Cristina

MOSTRAGEM ESTRATificAdA

A tcnica da amostragem estratificada consiste em dividir a


em subgrupo~, que denominaremos estratos. Os estratos
devem ser internamente mais homogneos do que a populao toda, com
respeito s principais variveis em estudo . Por exemplo, para estudar o
interesse dos funcionrios, de uma grande empresa, em realizar um
programa de treinamento, podemos estratificar a populao por nvel de
::::..instruo, pelo nvel hierrquico ou por setor de trabalho . Devemos
'"Sernr um critrio de estratificao que fornea estratos bem
homogneos, com respeito ao que se est estudando. Assim,
fundamental um prvio conhecimento sobre a populao em estudo.
~ulao

Devido ao arredondamento no clculo do intervalo de seleo, o nmero n de elementos da


amostra pode ficar diferente do nmero planejado. Se o intervalo de seleo for grande
(digamos, maior que 10) a diferena ser desprezvel.

Figura 3.3 llustrac :..;;

A amostrageI'.:. es;::;:-da populao tenha e. -

7.6 Com o o"t?


comunidade de u ~

ExEMplo

maneira:

.os

Cif 'ICA~ SOciAiS

= 32 funcion rios
s..s~emtica

para
_ _........., LJ.icialmente, o

CAprulo 7 -

Tcl\iCA~

dt

A\'IOSTRA(jE\1

Sobre os diversos estratos da popu lao, so realizadas sele es


aleatrias , de forma independente. A amostra obtida atravs da agregao
das amostras d e cada e strato (veja a Figura 3 .2) .
POPULAO
Estrato 1

A5. Bernardino

Estrato 2

:o. Hercilio
_5_ Fabrcio
.:'.y. J oo da Silva
~5.

J os de Souza

,:;}_

~auro

Es trato k

:::::=::-subgrupo 1 da amos tra }


selees
aleatrias

subgr upo 2.~ amostra

AMOSTRA
ESTRATIFICADA

subgrupo k da amos tra

Figura 3.2 Esquema da seleo de uma amostragem estratificada.

Amostragem estratificada proporcional: neste caso particu lar de


amostragem estratificada , a proporcionalidade do tamanho de cada estrato
d a popu lao man tida na amostra. Por exemplo, se um estrato
c orresponde a 20% do tamanho da populao, ele tam b m deve
corresponder a 20% da amostra. Veja a Figura 3.3.
POPULAO: comunidade de uma
AMOSTRA: parte da
com unidade da escola

60%

professor

a servidor

---.:ao toda , com


para e studar o

'"!Si=:::::.~

D aluno

Figura 3.3 Jlustraco de uma amostragem estratificada proporcional.

A amostragem estratifica da proporcional garante que c~da elemento


da populao tenha a mes ma probabilidade de perte ncer amostra.

ExEMplo 7.6 Com o objetivo de estudar o estilo de liderana preferido pela


comunidade de uma escola , va mos reali zar um levanta mento por
amostragem . A populao co m posta por 10 profess ores, 10 s ervidore s
tcnico-administrativos e 30 alunos, qu e identificare mos da seguinte
maneira:

50

bTATsTicA AplicAdA As C il'ciAs

SociAis

Pl

P2

P3

P4

Servdores:

Sl
Al
All
A21

S2
A2
Al2
A22

S3
A3
A13
A23

S4 ss
A4 AS
Al4 Al5
A24 A25

Alunos:

PS

P6

P7

P8

pg

PlO

S6
A6
Al6
A26

S7
A7
Al7
A27

S8
A8
Al8
A28

S9
A9
A19
A29

SlO
AlO
A20
A30

Tabela 3.1 Clculo do tamanho da amostra em cada estrato.


Proporo na p opulao
10/50 = 0,20 (ou 20%)
10/ 50 = 0,20 (ou 20%)
30/ 50 = 0,60 (ou 60%)

,.

A amostrager::
situaes em que o cada estrato, ou quan:

Supondo que a preferncia, quanto ao estilo de liderana, possa ser


relativamente homognea dentro de cada categoria , vamos realizar uma
amostragem estratificada proporcional por categoria, para obter uma
amostra global de tamanho n = 10. A tabela seguinte mostra as relaes
eprpi-cionlidade.
-

ESTRATO
Professores
Servidores
Alunos

d~

Amostragem es
quantidade de eleme::
se obter uma amostra - ~
selecionar 4 indivdu-

POPULAO
Professores:

CAprulo ; - TtcNicAs

importante o~
levar em conta o pla>"".

dados proveem de u::ia


clculos de mdias e
se queira uma mdia e
de cada estrato por n ~
as propores de ca..a

Tamanho do su bgrupo na amostra


= (0,20) 10 = 2
11s = (0 ,20) 1 0 = 2
np

na=

~o_,~opo

=6

Para selecionar aleatoriamente dois professores, usaremos a


numerao j existente na populao, substituindo o 10 por O, o que
permite usar a Tabela 1 do apndice com apenas um algarismo. Usando
a primeira linha (59 58 ... ), temos os seguintes professores s elecionados:
{PS, P9}. Para os servidores, usando a segunda linha (53 26 ...), com o
mesmo p rocesso de numerao, temos : {SS, S3}. Para os alunos,
precisamos extrair nmeros de dois algarismos. Usando a prpria
numerao da populao e a terceira linha da tabela, temos: {A7, A2,
Al6, AS, A24, A22}.

Chamamos de
populao. Por exemp..=.
uma cidade, os quar:
primeiro estgio, so s
observam todos os el e - --1
estgio (amostragem e.e
comum, faz-se nova
conglomerados extrad
em dois estgios). T~

A amostr a {PS, P9, SS, S3, A7, A2, Al 6, AS, A24, A22} uma amostra
estratificada p roporcional da comunidade da escola. Cada indivduo desta
amostra dever ser pesquisado para se levantar a caracteris tica de
interesse , ou seja, o estilo de liderana por ele preferido.

Desde que, no problema em estudo, os estratos formam subgrupos


mais homogneos do que a populao como um todo, uma amostra
estratificada proporcional tende a gerar resultados mais prximos dos
parmetros populacionais, quando comparada com uma amostra aleatria
simples de mesmo tamanho.

Figura 3.4 Ilustrai;:


estgios.

5l

?9

Amos trage m estratificada uniforme: sele ciona-se a mesma


quantidade de elementos em cada estrato. No exemplo pre cedente, para
se obte r uma amostra estratificada uniforme de n = 12 indivduos, devemos
selecionar 4 indivduos de cada categoria.

PlO

SlO
AlO

A amostragem estratificada uniforme costuma ser usada em

situaes em que o maior interesse obter estimativas separadas para


cada estrato, ou quando se deseja comparar os diverso s estratos.
~

- e:;a'"la , possa ser


ns realizar uma
,?a.'"a obter uma

im por tante observar que na fase de anlise dos dados deve-se


levar e m conta o planejamento amostral utilizado . Por exemplo, se os
dados proveem de uma amostragem estratificada no proporcional, os
clculos de mdias e propores devem ser feitos em cada e strato . Caso
se queira uma mdia ou proporo global, devemos agregar os resultados
de cada estrato por uma mdia aritmtica ponderada, tomando como pesos
as propores de cada estrato na populao.

AMOSTRAGEM dE CONqloMrnAdos

- es u saremos a

:::: por O, o que


- ....:.a;-:.smo. Usando
_;;;;~--e: selecionados :

Chamamos de conglomerado a um agrupamento de elementos da


populao. Por exemplo, numa populao de domiclios residenciais de
uma cidade, os quarteires formam conglomerados de domiclios . Num
primeiro estgio, so selecionados alguns conglomerados. Depois, ou se
observam todos os elementos dos conglomerados selecionados no primeiro
e stgio (amostragem de conglomerados em um estgio), ou, como mais
c om u m, faz-se nova seleo, tomando amostras d e elementos dos
conglomerad os extraidos no primeiro estgio (amostragem d e congl.omerados
em d ois es tgios). Todas as selees devem ser aleatrias (ver Figura 3.4) .

'..lllla amostra
s p rximos dos
..:=.:. ~tra aleatria

i;:::;._~-'-"'' -

::!l
..,,

Amostra de elementos:
Figura 3.4 Ilustrao do processo de amostragem de conglomerados em dois
estgios.

72

EsrArsricA ApllcMJ11 s Ci'\ciAs SoclAls

Em pesquisas de grande escala, a amostragem pode ser feita em


mais estgios. Por exemplo, para selecionar uma amostra de domiclios
do estado de Santa Catarina, podemos selecionar municpios (primeiro
estgio); dos municpios selecionados, selecionar setores censitrios
(segundo estgio);~ e dos setores censitrios selecionados, selecionar
domiclios (te rceiro estgio) .
Chamamos de frao de amostragem relao ~ ou seja, a
proporo.da populao que ser efetivamente observada. Se a frao de
--_________...
amostragem for constante para todos os conglomerados selecionados,
ento todos elementos da populao tm a mesma probabilidade de
pertencer amostra.

CAphulo ~ - TcNiCA~

clt "'"

selecionamos os doI!"
Amostra selecionada
E6, E4}.

O leitor deve o
anteriormente, a ame_,
todos os elementos dz.
de conglomerados e.
somente para os congl

ExEMplo 7.7 Seja o problema de selecionar uma amostra de domiclios de


uma cidade. Podemos tomar as ruas como conglomerados, como indicado
no quadro a seguir, onde Al representa o primeiro domicilio da Rua A, A2
o segundo, e assim por diante.
Ruas

Domiclios

A
B

A 1 A2 A3 A 4 AS A6
Bl B2 B3 B4 BS B6 B7\s8 B9 BlO Bl 1 B12 B13 B14
Cl C2 C3 C4 C5 C6 C7 CB C9 10
Dl D2ID3 D4
El E2 E3 E4\ES E6 E7 E8

D
E

Vamos realizar uma amostragem de conglomerados, selecionanclo trs


ruas (primeiro estgio) e, nas ruas selecionadas, uma frao de
amostragem de 50% de domiclios (segundo estgio). Ento:
12 ESTGIO. Seja a seguinte numerao das ruas (unidades de

amostragem neste estgio): 1 ~A, 2 ~ B, 3 ~ e, 4 ~D e 5 ~E. Tomemos,


por exemplo, os nmeros com um algarismo da sexta linha da tabela de
nmeros aleatrios 1. 26 ~6 ... ), que leva amostra de conglomerados
(ruas) B, De E, pois: 2 ~ B, 4 ~ De 5 ~E.

amostra de conglome-co:
parmetros populacicr.;
simples de mesmo ~a
bem menor.

Exrnccios
6)

Selecione uma w:

populao do Exe=.
7)

Considerando a p

8)

O mapa seguinte s:.=-

correspondem aos
bairro. Os nmeros

22 ESTGIO. Para satisfazer a frao de amostragem de 50% em cada


conglomerado, precisamos selecionar 7 domiclios da Rua B, 2 da De 4 da E.
Rua B. Tomando nmeros de dois algarismos , a partir da stima linha da
tabela de nmeros aleatrios, e usando a prpria numerao de
identificao dos domicilos, chegamos a B9, B2, Bl, Bl 1, B12, B3 e B4.

"' Setores censitrios so pequenas reas contiguas, com aproximadamente o mesmo nmero
de domiclios. Essas reas so determinadas pelo IBGE e usadas em suas pesquisas.

9 l8

~5

22

b 9

71 7;

::.s Cl\CiA~ SoclAis

CA1ulo 7 -

TCNiCAs

dr

AMOSTRA(jFM

Rua D. Tomando nmeros com um algarismo na dcima primeira linha,

selecionamos os domiclios D4 e D3.


Rua E. Usando a dcima segunda linha, selecionamos ES, E3, E6 e E4.

Amostra selecionada: {B9, B2, Bl, Bl 1, B12, B3, B4, D4, D3, ES, E3,
E6, E4}.

,..

;__ ~

ou seJa, a
_:-= Se a frao de
s selecionados,
-:habilidade de

romo indicado
_ _.._.........-...., da Rua A, A2

O leitor deve observar que, ao contrrio dos planos discutidos


anteriormente, a amostragem de conglomerados no exige uma lis ta de
todos os elementos da populao. Basta, no primeiro estgio, uma lista
de conglomerados e , no segundo estgio, uma lista de elementos, mas
somente para os conglomerados previamente selecionados.
Ao contrrio da amostragem estratificada, as estimativas de uma
amostra de conglomerados tendem a gerar resultados mais distantes dos
parmetros populacionais, quando comparada com uma amostra aleatria
simples de mesmo tamanho. Contudo, seu custo financeiro tende a ser
bem menor.

Exrnccios
6) Selecione uma amostra estratificada uniforme, de tamanho n
populao do Exemplo 3 .6 .

12, da

7) Considerando a populao de funcionrios do Exemplo 3.4, faa uma


amostragem estratificada proporcional de tamanho n = 8, usando a varivel
sexo para a formao dos estratos.

de

8 ) O mapa seguinte simboliza os domiclios de um bairro. Os quadros grandes


correspondem .aos quarteires, divididos em duas localidades (estratos) do
bairro. Os nmeros dentro dos quadradinhos (domiclios) correspondem ao
nmero de cmodos do domiclio, que a varivel a ser levantada na pesquisa.
4 5 2 9
4
7

2 6 4

5JC o em cada
B.2 da De 4 da E.

de
312, B3e B4.

~:: merao

=: :

1 l 4 416
4
5
213 2j3

7 2 2 4

4 l l 613
4
2
516 4 13

213 Sj4
4
3
415 4j2

6
8
2 4 5 6
Estrato A

8 5 2 3
8
5

2 4 5 9

9 8 18
22 8 9
7 7 9 9

8 7 9 6

14

8 9

14 9 9
8 7
12

8 8

15

8 9 8 8

Estrato B

54

Fo;1A1h 1iCA Apl icAdA s CiNCiAs SociAis

a) Selecione uma amostra estratificada proporcional de 9 domiclios. Anote


o nmero de cmodos dos domiclios selecionados na amostra.
b)

F~a uma amostragem de conglomerados em dois cstgios. No primeiro


estgio, s elecione 3 quarteires e, no segundo estgio, 3 domicilios em
cada conglomerado selecionado. Anote o nmero de cmodos dos domic~lios
amostrados.

CAprulo ; - T( CNiCAS

dE A'1os;:t:tQ:

cientifica dos departam


sobre o assunto pode es...~
aqueles que melhor re::;6est"" ~

No exemplo pre~- =-i


pode no ser recome~..=~
outro lado, dcpende::.::..cientifica, um levanta .....=---'"
tempo. Ento, o uso C=
boa alternativa, mes:::.
pesquisa no necessa:-==s=wl
universidade.

==-

7.7

AMOSTRAqENS NO AlEATRiAS

Existem situaes prticas em que a seleo de uma amostra


aleatria m uito dificil, ou at mesmo impossvel. Geralmente a maior
dificuldade est na obteno de uma lista dos elementos da populao.
Algumas vezes este problema contornvel pela amostragem aleatria
de conglomerados, que exige, inicialmente, apenas uma lista de
conglomerados. Em outras vezes, quando nem isso possvel, passamos
a pensar em procedimentos no aleatrios para seleo da amostra.
Veremos, tambm, algumas situaes em que uma amostragem no
aleatria pode ser mais adequada do que uma amostragem aleatria.
Em geral, as tcnicas de amostragens no aleatrias procuram gerar
amostras que, de alguma forma, representem razoavelmente bem a
populao de onde foram extradas. Discutiremos, em particular, a
amostragem por cotas e a amostragem por julgamento.

AMOSTRAGEM pOR COTAS

A amostragem por cotas assemelha-se com a amostragem


estratificada proporcional. A populao vista de forma segregada , dividida
em diversos subgrupos. Seleciona-se uma cota de cada subgrupo,
proporcional ao seu tamanho. Ao contrrio da amostragem estratificada,
a seleo no precisa ser aleatria. Para compensar a falta de aleatoriedade
na seleo, costuma-se dividir a populao num grande nmero de
subgrupos. Numa pesquisa socioeconmica, a populao pode ser dividida
por localidade, por nvel de instruo, por faixas de renda, etc.

AMOSTRAGEM poR julGAMENTO

Os elementos escolhidos so aqueles julgados como tpicos da


populao que se deseja estudar. Por exemplo, num estudo sobre a produo

Os exemplos q-..::e
descrio de certas ~:j
principal objetivo cc- . .
populaes. Por exer.:...;!
populao de indivduos sadios, podemos usa:- ::::___
de pessoas com cnce:- ~

em estudos compara::-:'.
generalidade, mas s :._ .
amostras que esto e= obter amostras cou...~
respeito ao fator de -::--comparao o atrib..:::..... ~
devem ser o mais si ......- -:-formada por pessoas x=
amostras se estudaria =-

as Ci'jciAs SoclAis

...= 9 ri1:1miclios. Anote

CAp1ulo 7 - TC1'iC'AS dE

A\lOSTRACjC\1

55

cientfica dos departamentos de ensino de uma universidade, um estudioso


sobre o assunto pode escolher os departamentos que ele considera serem
aqueles que melhor representam a universidade em estudo.
No exemplo precedente, a utilizao de uma amostragem aleatria
pode no ser recomendvel, j que temos uma populao pequena. 5 Por
outro lado , depende ndo do que se pretenda estudar sobre produo
cientfica, um levantamento de todos os departamentos pode gastar muito
tempo. Ento, o uso de uma amostragem por julgamento pode ser uma
boa alternativa, mesmo com a limitao d e que os resultados desta
pesquisa no necessariamente valham para todos os departamentos da
universidade.

Esrndos coMpARATivos

___.-........,,- ?:-OCuram gerar


:::iente bem a
er:: particular, a

= a amostragem

--==se~ada,
=

dividida
caca subgrupo ,

--- ~=:=.estratificada,

.-..::acie aleatoriedade

--=-C.e n mero de
~-'"-'"-_.pode s er dividida

Os exemplos que vimos neste captulo tinham como objetivo a


descrio de certas caracteristicas da populao. Em muitos casos, o
principal objetivo comparar certas caracteristicas em duas ou mais
populaes . Por exemplo, para se comparar o hbito de fumar entre a
populao de indivduos com cncer no pulmo e a populao de indivduos
sadios, podemos usar duas amostras de indivduos, sendo uma composta
de pessoas com cncer no pulmo, e outra de pessoas sadias.
Por razes prticas, uma amostra de pessoas com cncer no pulmo
geralmente obtida num hospital, tomando-se todas as pessoas em
tratamento dessa doena. Obviamente essa amostra no uma amostra
aleatria de toda a populao de pessoas com cncer no pulmo. Mas,
em estudos comparativos, normalmente o principal objetivo no a
generalidade , mas s im, a busca das verdadeiras diferenas entre as
amostras que esto em anlise .
Neste contexto, a principal preocupao no plano de amostragem
obter amostras comparveis, ou seja, que se diferenciem somente com
respeito ao fator de comparao. No presente exemplo, o fator de
comparao o atributo de ter cncer no pulmo. Assim, as duas amostras
devem ser o mais similar possvel, a no ser o fato de que uma delas
formada por pessoas com cncer no pulmo e a outra no. Nessas duas
amostras se estudaria e compararia o hbito de fumar.
5

como tpicos da
__;;_, sob!'C a produo

A maioria das universidades brasileiras tem menos de cinquenta departamentos de ensino.


Como veremos posteriormente, para grande parte dos estudos de levantamento, uma
amostra aleatria razovel deve conter centenas de observaes, ou atingir um nmero de
observa es prximo ao tamanho de toda a populao.

56

E~1A1b1icA ApliCAUA ~ CitNCil\~ SociAi~

Num estudo experimental, em que possvel controlar os elementos


que vo pertencer a cada um dos grupos, a comparabilidade dos grupos
(amostras) pode ser obtida por uma diviso aleatria dos elementos entre
os grupos. Para comparar dois mtodos de ensinar matemtica para
crianas, podemos sortear uma parte das crianas escolhidas para o
estudo, alocando-as no grupo de ensino do primeiro mtodo. As outras
crianas ficariam no grupo de ensino do outro mtodo. No final do
experimento, os dois mtodos seriam comparados com respeito ao
aprendizado de matemtica.

Exrnccios
9) Comente sobre os seguintes planos de amostragens , apontando suas
incoerncias, quando for o caso.
a) Com a finalidade de estudar o perfil dos consumidores de um
supermercado , observaram-se os consumidores que compareceram ao
supermercado no primeiro sbado do ms.
b) Com a finalidade de estudar o perfil dos consumidore s de um
supermercado, fez-se a coleta de dados durante um ms, tomando a cada
dia um consumidor da fila de cada caixa do supermercado, variando
sistematicamente o horrio da coleta dos dados.
c) Para avaliar a qualidade dos itens que saem de uma linha de produo,
observaram-se todos os itens das 14:00 s 14:30 horas.
d) Para avaliar a qualidade dos itens que saem de uma linha de produo,
observou-se um item a cada meia hora, durante todo o dia.
e) Para estimar a percentagem de empresas que investiram em novas
tecnologias no ltimo ano, enviou-se um questionrio a todas as empresas.
A amostra foi formada pelas empresas que responderam ao questionrio.
10) Num estudo sobre o estado nutricional dos estudantes da rede escolar de
uma cidade, decidiu-se complementar os dados antropomtricos com alguns
exames laboratoriais. Como no se podia exigir que o estudante fizesse esses
exames, decidiu-se estratificar a populao por nvel escolar (fundamental e
mdio) e por tipo de escola (pblica e privada), selecionando voluntrios em
cada estrato, at completar as cotas. Com base nos dados da tabela abaixo,
qual deve ser a cota a ser amostrada em cada estrato, considerando que se
deseja uma amostra de 200 estudantes?
Distribuio dos estudantes da rede escolar,
segundo o nvel e o tipo de escola
Tipo de escola
Nvel escolar

pblica

fundamental
m dio

48%
26%

privada
14%
12%

TCNiCAs

de "''

TAMANHO

dE

CAprulo ; -

7.4

O clculo dora~- -
livro, ficaremos res::Tambm no aborda-;__,
A

heterogene~.-0:;:.-

quer estimar (propc .;--


determinao do tar:-~-'
mais refinadas, as c:r~
ficaremos restritos ~ e=_
pesquisas em que ;:::...:=... ... ...,
propores (ou perce- . ~

Como j defir:; . ;
caracterstica dos e:e::J!"r': """li

usada para avaliar .... _


estimador. Por exen:~
n =percentagem de/':.z-..:.um parmetro. Numa--- -..11
ao programa de tr~
pode ser consideradc :::=:..

especificar o erro amos::::.t


na avaliao do(s) ~;
de pesquisas eleito~ e
presente pesquisa toler=
pesquisa aponta de:-=- ~
eleitorado, est afj;--candidato, em toda ar:
18% a 22% (ou seja, = Je

Ciht.IA5 Soc;iAis

::::nm os elementos
-~~.....:a.uue

dos grupos
elementos entre
- n:.atem tica para
escolhidas para o
r:=;:odo. As outras
meio. No final do

apoatando suas

CAprulo 7 - TiCNiCAs dE AMOSTRAGEl\J

7.4

TAMANHO dE UMA AMOSTRA AlEATRiA siMplEs

O clculo do tamanho da amostra um problema complexo e, neste


livro, ficaremos restritos ao caso da amostragem aleatria simple s .
Tambm no abordaremos aspectos financ eiros, mesmo sabendo que
muitas vezes o tamanho da amostra fica restrito aos recursos disponveis.

A heterogeneidade da populao e os tipos de parmetros que se


quer estimar (propores, mdias, etc.) so pontos importantes na
determinao do tamanho da amostra . Esses pon tos entrar o em frmulas
mais refinadas, as quais apresentaremos n o Captulo 9 . Nesta seo,
ficaremos restrit os a uma formulao bastante genrica, usada n as
pesquisas em que queremos usar a amostra para es timar diversas
propores (ou percentage n s). 6

CONCEiTO

e:-cado, variand o

-=:=:!:::a:= ao questionrio.
c:ii. ~e

escolar d e

::-:-:=-=:==~~:;coscomalguns

dEERRO AMOSTRA[

Como j definimos , parmetro uma medida que descreve certa


caracteristica dos e lementos da popu lao. De forma a nloga, estatstica
uma medida ass ociada aos elementos da amos tra. A estatstica, quando
usada para avaliar (ou e stimar) um parmetro, tambm chamada de
estimador. Por exem plo, n a populao dos funcionrios de u ma empresa,
7t =percentagem de funcio nri.os favo rveis a um programa de treinamento
um parmetro. Numa amostra a ser retirada, P = perceragem de favorveis
ao programa de treinamento, na amostra, uma estats tica. P tambm
pode s er considerado um estimador do p armetro n.
1 Erro amostral a diferena entre uma estatstica e o parmetro que se quer estimar.

""'re fizesse esses


- fundamental e
~===:c:C

voluntrios em

Para a determinao do tamanho da amostra, o pesquisador precisa


especificar o erro amostral tolervel, ou seja , o quanto ele admite errar
na avaliao do(s) parmetro(s) de interesse. Por exemplo, na divulgao
de p esquisas eleitorais, comum encontrarmos no relat rio algo como: a
p resente p esquis a tolera um erro de 2 %. Isso quer dizer que, quando a
pesquis a aponta determinado candidato com 20% de preferncia do
eleitorado, est afirmando , na verdade, que a preferncia p or esse
candidato, em toda a popu lao de eleitores , um valor no intervalo de
18% a 22% (ou seja, 20% .. 2%).
6

Como a abordagem que estamos apresentando bastante genrica, ela pode fornecer um
tamanho de amostra superior ao tamanho que seria necessrio para uma dada situ ao
especfica.

f;

e...- ..,,,_,
78

EsrArsricA AplicAdA s CiNCiAs SociAis

A especificao do erro amostral tolervel deve ser feita sob um enfoque


probabilstico, pois, por maior que seja a amostra, existe o risco de o sorteio
gerar uma amostra com caractersticas bem diferentes das caractersticas
da populao de onde ela est sendo extrada. Na abordagem preliminar
desta seo, consideraremos sempre o erro amostral sob 95%. de
pro habilidade. Assim, se fixarmos o erro amostral tolervel em 2%,
estaremos afirmando que uma estatstica, calculada com base na amostra
a ser selecionada, no deve diferir do parmetro em mais que 2% , com
95% de probablidade.
MA fRMUlA pARA O TAMAN~O MNiMO dA AMOSTRA

Sejam: Ntamanho (nmero de elementos) da populao;


n tamanho (nmero de elementos) da amostra;
n0 uma primeira aproximao para o tamanho da amostra e
E 0 erro amostral tolervel.
Um primeiro clculo do tamanho da amostra pode ser feito, mesmo sem se
conhecer o tamanho da populao, atravs da seguinte expresso:7
1
no - E2

Se a populao for muito grande (digamos, mais que vinte vezes o


valor calculado nJ, ento n0 j pode ser adotado como tamanho da amostra
(n = nJ. Caso contrrio, sugerida a seguinte correo:
n

N-n 0

=---''-

N +n0
ExEMplo }.8 Planeja-se um levantamento por amostragem para avaliar
diversas caractersticas (parmetros) da populao das N = 200 famlias
moradoras de um certo bairro. Os principais parmetros so propores
(ou percentagens), tais como: percentagem de familias que usam programas
de alimentao popular, percentagem de famlias que moram em casas
prprias, etc. Qual deve ser o tamanho mnimo de uma amostra aleatria
simples para que possamos admitir, com 95% de probabilidade, que os
erros amostrais no ultrapassem 4% (E0 = 0,04)?

Soluo. Primeiramente:
7

Lembramos que esta expresso voltada para a estimao de propores, com probabilidade
aproximada de 95% do erro amostral no superar E0 No Capitulo 9 voltaremos a esta
discusso.

CAprulo

7 - TCNiCAS dE

A.\1~

Corrigindo, em funo b
(2 CG

n=-'--- - 2C.: - -- -

ror, qual deveria ser o -.. .=:--..........


para todo o municpio. ~-=

Soluo. O valor de n0 e : _
com a correo em ter==.o:

n. =-- - No Exemplo 3.9, ~


em termos do tamanho '!"
a populao for mui:u E,
amostra (n = nJ.

foi necessria uma amo'> .e.


extraidos de 200); e:,--~
amostra de apenas 0.3
errnea a ideia de cp:e ~ _
abranger uma percenta:= _
600
~

u;

500

g 400
Cll
Cll

300

"O

_g

200

e:
Cll

E 100

Figura 3.5

da amosca

:=-

E
~ ~ Ci'ICiAs SociAis

CAprulo 7 -

0i"6 -t>

~~

IY)

TC'\iCAS dE A\IOSTRAGC\I

;f:::::a sob um enfoque

n0 =

':' :-=_sco de o s orteio

1
f,

\0,04

)2

= 625

Corrigindo , em funo do tamanho N da popula o, temos:

n = (200)(625) = 125.000= 152 famlias.


200 + 625

825

ExEMplo ~.9 Considerando os objetivos e os valores fixados no exemplo anterior, qual deveria ser o tamanho da amostra se a pesquisa fosse ampliada
para todo o municpio, que contm N = 200.000 familias residentes?
::- .nstra;
,____,,_-:..o da amostra e
2:"~

mesmo sem se

~---~:

Soluo. O valor de n 0 continua o mesmo do caso anterior (n0


com a correo e m termos do novo valor de N, temos:

625), mas

(200.000) (625) = 623 famlias.


200.000 + 625

No Exemplo 3.9, praticamente no houve altera o com a correo


em termos do tamanho N da populao (n0 = 625 e n = 623). Em geral, se
a populao for muito grande, podemos u s ar n 0 como o t amanho da
amostra (n = nJ.

-=--anho da amostra

::=gem para avaliar


- --"""'-'-'' ::.as : = 200 famlias
_ _ _i_=ns so propores
~:...e usam programas
~ "!oram em casas

a a::::nostra aleatria
.....; .i:-obabilidade, que os

No Exemplo 3.8, para garantir o erro amostral no su perior a 4%,


foi necess ria uma amostra abrangendo 76% da populao (152 elementos
extrados de 200); e n quanto no Exemplo 3.9 fo i suficiente uma
amostra de apenas 0 ,3% da populao (6 23 de 200.000). Portanto,
errnea a ideia de qu e para uma amostra ser representativa ela deva
abranger urna percentagem fixa da populao (veja a Figura 3 .5).
600
~ 500

~ 400

<ti
<ti

300

_g

200

-o

100

500

1000

1500

2000

2500

3000

tamanho da populao

Figura 3.5 Relao entre tamanho da populao e tamanho


da amostra para um dado erro amostral.

60

EsrnrsricA AplicAdA ~ CiNCiAs SoclAI~

CAf1ulo 1

7.5

TAMANko dA AMOSTRA EM subGRUpOS dA populAo


comum termos interesse em estudar separadamente crtos
subgrupos da populao. Por exemplo , numa pesquisa eleitoral, podemos
ter interesse em saber as preferncias das mulheres e dos homens. Numa
pesquisa sobre condies socioeconmicas das famlias de uma cidade,
podemos querer apresentar resultados para cada bairro da cidade.

Quando precisamos efetuar e stimativas sobre partes (subgrupos)


da populao, necessrio calcular o tamanho da amostra para cada
uma dessas partes. O tamanho total da amostra vai corresponder soma
dos tamanhos das amostras dos subgrupos . Pelo exposto, o tamanho
total da amostra pode ser muito grande. Por isso, o pesquisador no deve
ser muito exigente na preciso das estimativas nos subgrupos, tolerando
erros amostrais maiores.

TcNiCAS dE ~

FO NTESdE E

O erro amostra.!.. . - , ...


ser calculada com ba..-c:e
valor do parmetro a;::
parte do princpio de
erros. Havendo erros:_
entre a estatstica e~ :iz::~
Por isso, o planeja.me:::
muita cautela, p ara e~
amostra, conhecidos
desses erros , comuns

PopL
EXEMplo J.10 Seja o problema do Exemplo 3.9, mas suponha que se queira
fazer estimativas isoladas para os seguintes estratos: (1) centro da cidade,
(2) bairros e (3) periferia, mantendo-se a mesma preciso para cada estrato
(E0 = 0 ,04). Seriam necessrias:
1
1
n =2 = (
) = 625
Eo
0 ,04 2

por convenincia, re .......elementos (populacc


pesquisa eleitoral pa...'-----=

Portanto, a amostra total deve conter: ntorai = 3(625) = 1.875 familias.

Observamos que na fase de anlise dos dados, os clculos so feitos


para cada estrato. Para se ter resultados de todo o municpio, necessrio
agregar os resultados dos estratos por uma mdia ponderada, tomandose como peso o tamanho relativo de cada estrato no municpio.

Exrnccios
11.l Para estudar a preferncia do eleitorado a uma semana da eleio presidencial,
qual deve ser o tamanho de uma a.mostra aleatria simples de eleitores para
garantir, com 95% de probabilidade, um erro amostral no superior a 2%?
22) Numa empresa com 1.000 funcionrios, deseja-se estimar a percentagem de
funcionrios favorveis a um certo programa de treinamento. Qual deve ser
o ~amanho de uma amostra aleatria simples que garanta, com 95% de
probabilidade, um erro amostral no superior a 5% ?

Devemos cor!c-_:_~
populao -alvo . Q:~ n
abrangncia da pe~

comum
selecionados n a a.J:::!:
populao em estudo e
a um questionrio o..l .
respeitando o d ire:
capacidade de pers1 ~_;;;_ -

Uma prtica~
nos resultados, a de
que no so encontrad....i :
devemos efetuar v~ ;:----"

~ Ci \ CiA$ !>OCiAiS

CAprulo } - Ttc:-.iCAs

7.5

61

d ~ A\ IOSTRACjE\1

FONTES dE ERROS NOS lEVA TAMENTOS pOR AMOSTRAqEM

certos

~es (subgrupos)
a=ostra para cada
::-:-esponder soma
eI":::-s~o. o tamanho
- --:-~sador no deve

O erro amostral, definido como a diferena entre uma estatstica (a


ser calculada com base em uma amostra de n elementos ) e o verdadeiro
valor do parmetro (caracterstica de uma populao de N elementos) ,
parte do princpio de que as n observaes da amostra so obtidas sem
erros. Havendo erros ou desvios nos dados da prpria amostra, a diferena
en tre a es tatstica e o parmetro pode ser maior que o limite tolervel, E 0
Por isso, o planejamento e a execuo da pesquisa devem ser feitos com
muita cautela, para evitar, ou reduzir os erros nos prprios dados da
amostra, conhecidos como erros no amostrais. Abordaremos alguns
desses erros, comuns em pesqu1sas de levantamentos.

PopulAo ACEssvEI difERENTE dA populAo~Alvo


~na

que se queira
_ centra da cidade,
- ;;iara cada estrato

- = 1.875 famlias .

c!culos so feitos
=riyio. necessrio
--e=ada, tomando-

Muitas vezes, queremos pesquisar uma certa populao-alvo, mas,


por convenincia, retiramos uma amostra de um conjunto incompleto de
elementos (populao acessvel ou populao amostrada). Por exemplo, numa
pesquisa eleitoral para avaliar a preferncia dos eleitores de um municpio,
costuma-se tomar como base para a seleo da amostra a lista de domiclios
residenciais do municpio, o que deixa inacessveis os eleitores que moram
em outros municpios, mas com domicilio eleitoral no municpio em estudo.
Devemos concentrar esforos para retirar a amostra de toda a
populao-a lvo. Quando isso no for possvel, devemos limitar a
abrangncia da pesquisa populao que foi efetivamente estudada .
O?Ulh'CA:J C.OW\ El.E-17'~

FAITA dE RESPOSTA

_e.co presidencial,

-....-,... e eleitores para


_ _ _ :;.:i:;;

superior a 2%?

_...._-...- a percentagem de
Qual deve ser
~aa.a. com 95% de

===:==z:::i.:~ .

comum no conseguirmos respostas de alguns elementos


selecionados na amostra, como ocorre frequenteme nte quando a
popula o em estudo a humana, pois nem todos se dispem responder
a um questionrio ou dar uma entrevista. O entrevistador, eticamente e
respeitando o direito do entrevistado em no participar, deve ter
capacidade de persuaso e empenhar-se para conseguir a participao
do maior nmero possvel dos indivduos selecionados.

Uma prtica muito comum, mas que pode levar a srias distores
no.s resultados, a de substituir indivduos que se recusam a responder ou
que no so encontrados no momento da pesquisa Para evitar esse problema,
devemos efetuar vrios retornos aos elementos selecionados na amostra.
,
R~s fbs 1A sc 1~ cMc:.vrE" ~(E , ~~vt-L
""

~C>l.t=. t.

C.lflv f)10 ?.

62

[sTATSTlcA AplicAdA ~ CiNCiAs SoclAls

ERROS

dE

MENSURAO

Nem sempre conseguimos medir exatamente aquilo que queremos.


Por exemplo, numa pesquisa eleitoral, o eleitor pode, por vrias razes,
apontar um candidato, quando na verdade ele pretende votar em outro.
Podemos reduzir a ocorrncia desse tipo de erro com a elaborao
de um questionrio que tenha alguns itens de controle, capazes de detectar
algumas ms respostas. Um bom treinamento dos entrevistadores tambm
ajuda a reduzir esses erros .
Alm desses trs tipos de erros no amostrais, poderamos citar
muitos outros. O pesquisador, ao aplicar mtodos adequados de
estatstica, consegue avaliar, de alguma forma, a magnitude provvel dos
erros amostrais. Mas o tratamento dos erros no amostrais mais difcil e
depende fundamentalmente do planejamento e execuo da pesquisa.

ESCR.~'.:

ExERCcios coMpLEM ENTARES

13) Considere a seguinte populao composta de 40 crianas do sexo masculino


(representados por H 1, H2, ... , H40) e 20 crianas do sexo feminino
(representadas por Ml, M2, ... , M20).
Hl
Hll
H21
H31
Ml
Mll

H2
Hl2
H22
H32
M2
M12

H3
Hl3
H23
H33
M3
Ml3

H4
Hl4
H24
H34
M4
Ml4

H5
HIS
H25
H35
MS
Ml5

H6
HI6
H26
H36
M6
Ml6

H7
HI7
H27
H37
M7
Ml7

H8
Hl8
H28
H38
MB
Ml8

H9
Hl9
H29
H39
M9
M19

HlO
H20
H30
H 40
MIO
M20

a) Retire desta populao de 60 crianas, uma amostra aleatria simpl es


de tamanho n = 10. Use a primeira coluna da tabela de nmeros aleatrios .
b) Retire desta populao uma amostra aleatria estratificada proporcional
de tamanho n = 12, usando o sexo como varivel estratificadora. Use a
segunda coluna da tabela de nmeros aleatrios para o estrato dos homens
e a terceira coluna para o estrato das mulheres.
c) Se o estudo tem por objetivo avaliar o tipo de brincadeira preferida pelas
crianas, qual o tipo de amostra voc acredita ser a mais adequada? E
se for para avaliar o quociente de inteligncia? Justifique suas respostas.
14) Uma empresa tem 3 .414 empregados repartidos nos seguintes departamentos:
Administrao (914). Transporte (348), Produo (1.40 1) e Outros (751).
Deseja-se extrair uma amostra para verificar o grau de satisfao em relao
qualidade da comida do refeitrio. Apresente um plano de amostragem
para esse problema.

Q:

CoMo co

o.d-\ ~s CiNCiAs Soc iAi~

PARTE

-====:::::::::s. poderamos citar

11

ESCRiO E ExploRAO dE dAdos

s adequados de
rude provvel dos
s;rms mais difcil e
-?o da pesquisa.

--=-

~:::i:;;:as

o sexo masculino
cio sexo feminino

E9

5i9
H29
639
5
Mi9

HlO
H20
H30
H40
MlO
M20

CoMo EXTRAiR i fORMAES dos dAdos


COMO CO STRUR, APRESENTAR E iNTERpRETAR TAbEIAS,
CjRicos E MEdidAS dESCRTVAS

Ados CATEqORizAdos

os trs prximos captulos, vamos considerar que os dados j foram


efe tivamente observados, sej am de u ma amostra ou de uma
populao. E o objetivo bsico consistir em introduzir tcnicas que
permitam organizar, resumir e apresentar esses dados, de tal forma que
possamos interpret-los luz dos objetivos da pesquisa. Esta parte do
tratamento dos dados chamada de Estatstica Descritiva.
Com os dados adequadamente resumidos e apresentados em tabelas
e grficos, poderemos observar determinados aspectos relevantes e
comear a delinear hipteses a respeito da e strutura do universo em
estudo. a chamada Anlise Exploratria de Dados.
No presente captulo, aprenderemos a descrever e explorar dados
de variveis qualitativas, isto , variveis cujos possveis resultados s o
observados na forma de categorias. o caso de variveis como nvel de
instruo, sexo, estado civil, etc. Por exemplo, ao observar a varivel sexo
(gnero) num conjunto de indivduos, estare mos classificando cada
indivduo na categoria masculino ou na categoria feminino.

4.1 ClAssi fiCAO siMplEs


Iniciaremos o tratamen to de dados analisando isoladamente cada
varivel (anlise univariada) .
Um dos primeiros passos para entendermos o comportamento de
uma varivel, em termos dos elementos observados, a construo de
uma distribuio de frequncias.

66

EsrArsricA .:i.pllc.i.dAls Ci~\CiA~

Sacio.is

A distribuio de frequncias compreende a organizao dos dados de acordo con as

ocorrncias dos diferentes resultados observados. Ela pode ser apresentada sob forma
tabular ou grfica.

Para ilustrar a construo de uma distribuio de frequncias,


considere os dados de um levantamento de uma amostra de 40 famlias
do Conj~nto Residencial Monte Verde, com respeito varivel nvel de
instruo do chefe da casa (ver anexo deste captulo).

\..Apirulo 4

- DAdOS CATE

apresenta uma mec-7"


percentagens so o
nmero total de obscc
(cem). As med idas~
importantes para cc~
corresponde distri"'
do nvel de instruo

Dados do ltim nvel de instruo completado pelo chefe da casa (cdigos:


1 - nenhum; 2 - fundament.al. e 3 - mdio) :
33223133322122323333

333223132332311 13333

Para construir uma distribuio de frequncias com dados de uma


varivel qualitativa, basta contar a quantidade de resultados observados
em cada categoria (ver Tabela 4 . 1). 1

Nvel de instruo
nenhum
fundamental

Tabela 4.1 Distribuio de frequncias do ltimo nvel de instruo


completado pelo chefe da casa, numa amostra de 40 famlias do conjunto
residencial Monte Verde, Florianpolis - SC, 1988.
Nvel de Instruo
nenhum
fundamental
mdio
Total

Frequncia

Total

Percentagem

6
11
23

15,0
27,5
57,5

40

100,0

A primeira coluna da Tabela 4.1 mostra todas as categorias


previamente estabelecidas da varivel nvel de instruo. A segunda coluna
resulta da contagem de quantas observaes se identificam com cada
categoria; so as frequncias observadas. Finalmente, a terceira coluna
1

mdio

A apresentao de tabelas num relatrio regida por normas especficas elaboradas pelo
Instituto Brasileiro de Geografia e Estatstica (IBGE) e adotadas pela Associao Brasileira
de Normas Tcnicas (ABNT). Toda tabela deve ser auto-ex-plicativa, sendo necessrio um
titulo que informe ao leitor o que est sendo apresentado, onde e quando foram coletados
os dados. Uma tabela tem sua estrutura formada por trs linhas horizontais, sendo duas
que delimitam o cabealho e uma que faz o fechamento. Qualquer outra linha vertical ou
horizontal poder ser traada, desde que venha contribuir para melhor leitura dos dados
da tabela, mas ela no deve ser fechada nas verticais . Alguma explicao complementar
pode ser colocada no rodap da tabela, em particular, a fonte, quando se trata de dados
secundrios. A insero de uma tabela num relatrio somente deve ser feita aps ela ser
referenciada no te"-1:0.

Interpretao da :;.!l

Residencial Monte T~
com os melhores r
pesquisadas na En::
instruo do chefe
nem o fundame n ta...:

O leitor de\"e
distribuio de freq-~~
pertencem a cada c:a..!1f
nvel de instruo fa-~~
do nvel de instruo
uma varivel, essa -- ::; . .,.

Uma tabela do tipo Ta:..:z::!;;;E


ou tabela de contingim

"~

\s Cl\CIAs SoclAis

~---~

e frequncias,
40 famlias
'Cllivel nivel de

-~de
~--

-_e da casa (cdigos:

C'.Apfrulo 4 - DAdos

apresenta uma medida relativa da frequncia de cada categoria. As


percentagens so obtidas dividindo-se a frequncia de cada categoria pelo
nmero total de observaes e, em seguida, multiplicando-se por 100
(cem). As medidas relativas (percentagens) so particularmente
importantes para comparar distribuies de frequncias.
A Tabela 4.2 mostra trs distribuies de frequncias. A primeira
corresponde distribuio da Tabela 4 .1, e as outras duas s distribuies
do nvel de instruo do chefe da casa em outras duas localidades. 2
Tabela 4.2 Distribuio de frequncias do ltimo nvel de instruo
completado pelo chefe da casa, numa amostra de 120 famlias, dividida
segundo as localidades do bairro Saco Grande II, Florianpolis - SC, 1988.
Localidade

Nvel de instruo

-:--e: de

instruo
-=-~;as do conjunto

Monte Verde

Pq. da Figueira

Encosta do Morro

nenhum

6 (1 5 ,0)

14 (32,6)

18 (48,7)

fundamental
mdio

11 (27,5)
23 (57,5)

14 (32,6)
15 (34,8)

13 (35,1)
6 (16,2)

40 (100,0)

43 (100,0)

37 (100,0)

Total
?crcentagem
15,0
27,5
57,5
100,0
~s a s catego rias
- _.... segunda coluna
"':::.::i:icam com cada
=::::;~=~.. a :erceira coluna

67

CATHiORiZAdo~

NOTA: O s nmeros entre parnteses correspondem s percentagens em relao ao total de familias


observadas em cada localidade.

Interpretao da Tab ela 4.2 - As famlias pesquisadas no Conjunto


Residencial Monte Verde apresentam, relativamente, os chefes da casa
com os melhores nveis de instruo . Por outro lado, temos nas famlias
pesqu is adas n a Encosta do Morro o pior perfil, em termos de grau de
instruo do chefe da casa, com quase 50% deles no tendo concludo
nem o fundamental. 3
O leitor deve notar que, ao organizar e resumir os dados numa
distribuio de frequncias, no dada a informao de quais elementos
pertencem a cada categoria (por exemplo, quais indivduos no tm nem o
nvel de instruo fundamental no aparece na distribuio d~ frequncias
do nvel de instruo). Contudo, para entender o comportamento geral de
uma varivel, essa informao normalmente no relevante.

Uma tabela do tipo Tabela 4.2, pelo seu formato, conhecida como tabela de dupla entrada
ou tabe la de contingncia.
Note que a anlise feita especificamente com respeito s familias pesquisadas. Inferncias
para a populao sero discutidas a partir do Captulo 9.

68

[sTATSTicA AplicAdA ~ Cit, CiA'> SociA1<;

CAprulo 4 - DAdos

CAI(~

Ex rnccios
1) Com b ase nos dados do anexo deste captulo, construa uma tabela de
frequncias para a varivel PAP (uso, ou no, de programas de alimentao
popular), considerando, apenas, as famlias residentes n o Conjunto
Residencial Monte Verde.

nenhum
fund amenta

2) Construa uma distribuio de frequncias para a varivel PAP (ver anexo),


para cada localidade em estudo. Apresente essas distribuies numa ta bela
de dupla entrada e interprete.
3) Sejam os resultados d a pesquisa descrita na Seo 2.4, cuj os dados esto n o
anexo do Capitulo 2 . Faa uma distribuio de frequncias para o p rincipal.
ponto positivo do Curso de Cincias da Computa.o da UFSC, na viso do
aluno. Interprete.

rrdio

Figura 4.1 ="-


completado :;ie.
Co1~unto

4.2

REpRESENTAES qRfiCAS

As representaes grficas fornecem, em geral, uma visualizao


mais su gestiva do que as tabelas. Portanto, constituem-se numa forma
alternativa de apresentao de distribuies de frequncias. Nesta s eo,
apresentaremos o grfico de barras e o grfico de setores, que s o
particularmente importantes na representao de dis qi buies de
frequncias de dados categorizados.

Cnfico dE

Para constn:-::= ._
um ngulo, em g:c._.
lembrando que ur::. ....:..
relao para a cates- ~

bARRAS

A Figura 4 . 1 representa a distribuio de frequncias da Tabela 4 .1


por um grfico de barras. Cada categoria repres entada por uma barra
de comprimento proporcional sua frequncia (n mero de fam ilias),
conforme identificao do eixo horizontal.4

Opcionalm ente, pode-se apresentar as categorias no eixo horizon tal


e a frequ ncia no eixo vertical. o chamado grfico de colunas.
1..

Rcs;::.::;::c;

Da mesma forma que as tabelas, as figuras devem conter um ttulo, contendo as informaes
do seu contedo e colocado abaixo dela.

Donde :

CX1 =

.~~

--.)

categoria 1 r..er
categoria 2 L~
Com a ajuda ~'=
indicado na Figura - ~e

>.S CiN ciAs Soc:IAIS

69

CApfrulo 4 - Ado~ CATE<;ORiV\dO~

Nvel de instruo do chefe da casa


nenhum

--;:;:;;-as de alimentao
=-==:es no Conjunto
-=""e. PAP (ver anexo),
--==-1:es numa tabela

fundamental
mdio

nmero de famlias

Figura 4.1 Distribuio de frequncias do ltimo nvel de instruo


completado pelo chefe da casa, numa amostra de quarenta famlias do
Conjunto Residencial Monte Verde, Florianpolis - SC, 1988.

Gnfico dE SETORES
visualizao
numa forma
~'.:ias. :'.'lesta seo ,
-= sei:ore s, que so
__:: C:stribuies de
::::la

~---- -se

Para construir um grfico de setores, basta fazer uma relao entre


um ngulo, em graus, e a frequncia observada em cada categoria,
lembrando que um crculo tem 360. O esquema, a seguir, mostra esta
relao para a categoria nenhum:
Relao entre o tamanho do setor [a.) e o
crculo todo [360').

Relao entre a frequncia da categoria (6) e


o total obsen-ado (40).

~ =~
360

--=--7s da Tabela 4 . 1
por uma barra
----e:-c> de famlias),

-""-~...+_.-a....

Donde : a 1 =

40

6
(360) = 54
40

Repetindo a "regra de trs" para as outras categorias, temos:


categoria 1 (nenhum):
categoria 2 (fundamentaQ:
categoria 3 (mdio) :

setor de tamanho a 1 = 54;


setor de tamanho a 2 = 99;
setor de tamanho a 3 = 207.

Com a ajuda de um transferidor, podemos construir o grfico


indicado na Figura 4.2 .

c:z:::e!ldo as informaes

70

EsrArsricA ApliCAdA As Ci\CiAs Soc;,, ;s

CAphulo 4 - D Ados

CATE

Nwel de instruo corJl>leto do chefe da casa

---

Para re prese~
qualitativas nomina:.s
sido muito u sado, prde apres en tao e~ ;:re
categoria a travs de --

nenhum

23~--

;;;; fundarrental

11

- rrdio

Quando a van.a:
mais in dicados, po1s
grficos tambm so
ou quando se quer _
Neste ltimo caso . .t':u::-- .,_

Figura 4.2 Distribuio de frequncias do ltimo nvel de


instruo completado pelo chefe da casa, numa amostra de
quarenta familias do Conjunto Residencial Monte Verde,
Florianpolis - SC, 1988.

Em se tra tando da descrio de dados de variveis ordinais , como


no presente caso, recomen damos os grficos de barras ou de colunas,
que permitem enfatizar a ordem das categorias.

GRfico dEbARRAS MlriplAs


Para efetuar uma anlis e comparat iva de vrias distribuies,
podemos construir vrios grficos de setores, ou um grfico de barras
mltiplas, como na Figura 4.3, que repre s enta graficamente as
distribuies de frequncias da Tabela 4.2 . No eixo horizontal, optamos
por colocar as frequncias relativas, em forma de percentagens, para
facilitar a comparao.

representar mais de
de frequncias cor._,
sero vistas na pr~
Distribuies :.e
prprios , como os ~
Captulo 13 sero a;
analisar possveiS ~

Exrnccios
4)

5)

Nivel de instruo do chefe da casa

l
l

M:mte Verde

4.7 DuplA clAss

l
~

f
~-

-.

da Figueira
; -

Cl nent um

Ofundamental

:;.;jt~.;:.

Encosta do Morro

o rrdio

1
1

10

20

30

40

50

60

70

percentagem de f amiias

Figura 4.3 Distribuio de frequncias do ltimo nvel de instruo completado


pelo chefe da casa, numa amostra de 120 famlias, dividida segundo as
localidades do bairro Saco Grande II, Florianpolis - SC, 1988.

de usurios de proq-::;;::=.
faixa de renda, o que
de alimentao pop: ....,

uph1ilo 4 - DAdos

CATEGORi2.AdO~

71

OuE Tipo dE qnfico usAn?


Para representar distribuies de frequncias de vanaveis
qualitativas nominais com poucas categorias, o grfico de setores tem
sido muito usado, principalmente devido a sua visualizao, possibilidade
de apresentao em trs dimenses e possibilidade de destacar alguma
categoria atravs de um leve afastamento do setor.

:.e

- :-.s ordinais, como


ou de colunas,

~-:as

Quando a varivel ordinal, grficos de barras ou de colunas so


mais indicados, pois permitem manter a ordem das categorias. Esses
grficos tambm so mais adequados quando se tm muitas categorias
ou quando se quer dar mais destaque s categorias mais frequentes.
Neste ltimo caso, podemos ordenar as categorias pelas frequncias.
Grficos de barras (ou de colunas) mltiplas so usados para
representar mais de uma distribuio de frequncias, ou distribuies
de frequncias conjuntas de duas variveis qualitativas, corno as que
sero vistas na prxima seo.
Distribuies de frequncias de variveis quantitativas tm grficos
prprios , como os histogramas, que sero estudados no Captulo 5. J no
Captulo 13 sero apresentados os diagramas de disperso, que permitem
analisar possveis relaes entre duas variveis quantitativas.

_ ~-.as distribuies,
:::::: grfico de barras
- ....:. g:-aficamente as
=izontal, optamos
~ &Je&eentagens, para

Exrnccio s
4 ) Faa um grfico de barras e um grfico de setores para re presentar a
distribuio de frequ ncias do Exerccio 1.
5) Faa um grfico de barras mltiplas para representar as distribuies de
frequncias do Exerccio 2.

4.7

DuplA clAssifiCAO

"lellhum
;:: 'a'ldarrental

=--edio
70

Este tpico focaliza uma anlise conjunta de duas variveis


qualitativas (anlise bivariada).
Nas Cincias Sociais e Humanas, comum o interesse em verificar
se duas variveis apresentam-se associadas num certo conjunto de
elementos. Por exemplo, pode-se ter interesse em verificar se o percentual
de usurios de programas de alimentao popular varia de acordo com a
faixa de renda, o que caracteriza uma associao entre o uso de programas
de. alimentao popular e a faixa de renda nas famlias pesquisadas. Esse

fY

72

EsrArsricA AplicAdA s Ci'.N CiAs SociAis

tipo de anlise passa pelas distribuies conjuntas de frequncias, que


geralmente so apresentadas nas chamadas tabelas de contingncia ou
tabelas de dupla entrada, como veremos a seguir.
Para construirmos uma distribuio conjunta de frequncias,
devemos observar simultaneamente as duas variveis nos elementos em
estudo. A Figura 4.4 mostra a construo de uma distribuio conj unta,
com as variveis nvel de instruo do chefe da casa e uso de programas

C Ap(1ulo

4 - 0Ados

CATEQO~:..::::

Para facilitar a o=-incluir as frequn cias ~


em relao aos totais-=::::
Tabela 4.4 so i nc~~
colunas. Esta tabe:Z. ~
alimentao popula=-" _
instruo do chefe &

..-

de alimentao popular.
As cinco primeiras observaes das variveis nvel de instruo do chefe da casa e uso de programas
de alimentao popular (anexo deste capitulo).
Cdigos do nvel de instruo: l - nenhum; 2 - primeiro grau e 3 - segundo grau.
Cdigos do u so de programas: 1 - sim e O- nao.

familia
1
2
3

4
5

Dados
nvel de
instruo

3
3
2
2
3

u so de
programas

Total

0--1--- ~ 11

Para a construo da distribuio conjunta de frequncias, cada


elemento (famlia) deve pertencer a uma e apenas uma clula da tabela. 5
Fazendo a classificao de todas as famlias observadas e contando as
frequncias em cada clula, chegamos Tabela 4.3. O leitor deve notar
que os totais das colunas formam a distribuio de frequncias da varivel
nvel de instruo do chefe da casa, quando observada isoladamente;
enquanto os totais das linhas constituem a distribuio da varivel uso
de programas de alimentao popular.

Tabela 4.3 Distribuio conjunta de frequncias do nvel de ins truo do


chefe da casa e uso de programas de alimentao popular.

sim
no
Total

ne~:::=.

sim
no

Figura 4.4 Esquema de como fazer a contagem para uma distribuio conjunta.

Uso de
programas

Uso de
programas

Construo da tabela

o
o-- - 1------

Tabela 4.4 Distribu;;_.;.:


por nvel de instruZ:

Nvel de instruo do chefe da casa


nenhum
fundamental
mdio
31
22
25
7
16
19
38
38
44

associao entre ou~ instruo do chefe ~


baixo, a grande me:~--::-_
(81,6%), no nvel e =--z:::-esses programas (56 ~
relao ao total das - . instruo do c hefe ~ e .
que usam e famf~;:cc.
interpretao da Tahe..:;a L -

Tabela 4.5 Distribu~c:Z:


o uso de programas e
Uso de
programas

Total

sim

78
42
120

no
Total

3 8 13:. -

NOTA: Os nmeros entre~~


6

Chamamos de clula ao cruzamento de uma linha com uma coluna.

ne:::.._
3 1 ~7 :.6-

Uma anlise estatisticc. - essa associao reaim.~

S Ci~NCll\~ SOCAS

....z. :':"equncias, que


--"--"" G.e contingncia ou

-= C:e frequnc ias ,


=.os elementos em
--::ruio conjunta,
:...so de programas

CApr1.1lo 4 - DAdo~ cArcc;oRiLAdos

Para facilitar a anlise de uma tabela de contingncia, podemos


incluir as frequncias relativas (percentagens), que podem ser calculadas
em relao aos totais das linhas ou colunas, dependendo do objetivo. Na
Tabela 4.4 so includas as percentagens em relao aos totais das
colunas. Esta tabela evidencia os perfis do uso de programas de
alimentao popular, considerando as famlias separadas por nvel de
instruo do chefe da casa (perfis coluna).
Tabela 4.4 Distribuio do uso de programas de alimentao popular,
por nvel de ins truo do chefe da casa.
Uso de
programas

Nvel d e instruo do chefe da casa


nenhum
mdio
1 fundamental 1

sim
no
Total

31 (81,6)
7 (18,4)

22 (57,9)
16 (42,1)

25 (56,8)
19 (43,2)

78 (65,0)
42 (35,0 )

38 (100,0)

38 (100,0)

44 (100,0)

120 (100,0)

Total

:\OTA: Os nmeros entre parnteses so percentagens em relao aos totais das colunas.

li

Interpretao da Tabela 4.4-Nos dados observados, verifica-se uma

frequ ncias, cada


-=:ac~la da tabela. 5
..-;;:se contando as
:.eitor deve notar
- -=,:a isoladamente;

- ---.e..."".... da varivel

uso

associao entre o uso de programas de alimentao popular e o nvel de


instruo do chefe da casa, pois, enquanto no nvel de instruo mais
baixo, a grande maioria das famlias pesquisadas usam os programas
(81,6%), no nvel de instruo mais alto, pouco mais da metade usam
esses programas (56,8%). 6
A Tabela 4.5 mostra a Tabela 4.3 acrescida de percentagens em
relao ao total das linhas. Esta tabela evidencia os perfis do nvel de
instruo do chefe da casa, considerando a amostra dividida em familias
que usam e familias que no usam os programas (perfis linha). A
interpretao da Tabela 4.5 deixada para o leitor.

Tabela 4.5 Dis tribuio do nvel de instruo do chefe da casa, segundo


o uso de programas de alimentao popular.

Total
78
42
120

Uso de
programas

Nvel de instruo do chefe d a casa


nenhum
mdio
1 fundamental 1

sim
no
Total

3 1 (39,7)
7 (16,7)

22 (28,2 )

2 5 (32, 1)

78 (100,0)

16 (38,1)

19 (45,2)

42 (100,0)

38 (31 ,7)

38 (31 ,7)

44 (36,7)

120 (100,0)

Total

l\OTA: Os nmeros entre parnteses so percentagens em relao aos totais das linhas.
5

T,Jma anlise estatstica mais elaborada, como veremos n o Captulo 12, poder detectar se
essa associao r ealmente vlida para t oda a populao de familia s do bairro em estudo.

74

EsrArsricA .o.plicAdA s CiNciAs SociAis

Na Seo 4.1, quando discutamos classificao simples, juntamos


trs distribuies de frequncias da varivel nvel de instruo do chefe
da casa, correspondentes a trs localidades diferentes (Tabela 4.2).
Observamos, agora, que esse tipo de tabela tambm pode ser analisado
como uma tabela de contingncia, como apresentado nesta seo, mesmo
que na sua construo no tenhamos observado simultaneamente as
duas variveis, pois as localidades j estavam previamente estabelecidas
- constituem estratos da populao.

CAprulo 4 - DAdos CArt<;oRiia.i:&

amostra. sugere algn- ..,


de alimentao pop~

uma tabela de

con~

7) As tabelas a seguir ~=;


Catarina (Fundao !>=":que julgar mais corm:.;;;

Tabela 1 Relao

en.~

Participao religwsz.
frequ entemente

as vezes

Uso do coMpurndon

no particii;a

Com o uso de programas computacionais de estatstica, ou mesmo


com planilhas eletrnicas, as tabelas e grficos podem ser feitos com
relativa facilidade. A Figura 5.5 mostra uma tabela e um grfico feitos
com o auxlio do Microsoft Exce zt', utilizando os dados sobre localidade e
uso de programas de alimentao popular do anexo. 7 Deixamos a
interpretao da sada computacional como exerccio para o leitor.

Tabela 2 Relao entre

alegre

triste
8)

Ao estudar,

Percentagem da utilizao de programas de


alimentao popular por focalidade

80.00% ,

ao uso de program~s =
mesma classificao , :familiar (baixa ou alta.1.

-m- .
:~:~~: :lT--~
- - - . . ~- - - .- - -

50.00% _ _ ...-._
40.00%
30.00%
20,00%

-_ - - .. -.

10 0 0% 0:00% 1

..

---

- -

'"'

'~

Morro

J~

Nvel de

Pq. Da

instru_o

Figueira

baixo

Contagem de p.a.p

Local

p.a.p
no u sa

Encosta do Morro Monte Verde


32,43%
67 ,57%
100,00%

45,00%
55,00%
100,00%

Pq. da Figueira Total Global


35,00%
27,91%
72,09%
65,00%
100,00%
100,00%

Figura 4.4 Sada computacional do relatrio de tabela e grficos dinmicos do Excel.

alto

Tabela 2 Elementos cl2ss -,

e uso de programas de

Renda familiar
baixa
alta

Exrnccios
6)

- -

Encosta do fW:>nte Verde

u sa
Total Glob al

Tabela 1 Elementos ...,,,,

Considerando os dados do anexo deste captulo, classifique as famlias com


renda mensal de at 5 salrios mnimos, como de renda baixa; famlias com
rendimentos mensais acima de 5 salrios mnimos, como de renda alta. A
Em Wll\rw.inf.ufsc.br/ -barbetta/ livrol.htm voc pode obter algumas orientaes sobre o
uso do Excel para anlise exploratria de dados.

a ) Qual a sua conclus.::


de programas de a.lime:-'1
(Tabela l)?
b) Analisando a Tabela.:.
que voc conclui?

~...dA <> C iNci,,s SociAis

~~~""=""'-.....
~ simples,

juntamos
e mstruo do chefe
"'"'='~:es (Tabela 4.2) .
----~- ?Ode ser analisado

n---=~,,,.-~~ -

U:taneamente as
estabelecidas

75

CAprulo 4 - DAdo<; CATFtiORizAdos

amostra sugere alguma associao entre renda familiar e uso de programas


de alimentao popular? Justifique atravs da construo e interpretao de
uma tabela de contingncia.
7) As tabelas a seguir baseiam-se numa amostra de a dolescentes de Santa
Catarina (Fundao Promover - SC, 1990). Calcule os perfis d e percentagens
que julgar mais convenientes e interprete.

,,;::- "'<l.te

Tabela 1 Relao entre participao religiosa e uso de bebidas alcolicas.


Uso de bebidas alcolicas
sim
no
82
460

Participao religiosa
frequentemente
s vezes
no p articipa

921
126

323
86

Tabela 2 Relao entre alegria e satisfao sexual.


Sentimento do respondente

?81' o leitor.

8)

Satisfao sexual
frustrado

525
34

alegre
t r iste

a:::exo .7 Deixamos a
~

satisfeito

69
19

Ao estudar, numa cer ta p opulao, a possvel associao entre nvel de


instru.o e uso de programas de alimentao popular, suspeita-se que a varivel
renda familiar esteja induzindo esta associao. A Tabela 1 apresenta os
elementos classificados segundo o nvel d e instruo (baixo ou alto) e quanto
ao uso de programas d e alimentao popular (sim ou no). A Tabela 2 faz a
mesma classificao, mas separando os indivduos em termos da renda
familiar (baixa ou alta).
Tabela 1 Elementos classificados segundo o nvel de instruo e u so de
programas de alimentao popular.

....... 7:,s-ueira Total Global

T 9:0 o
-~

- J()%

35,00%
65,00%

100,00%

-.z-:::x:s do Exce!.

Renda familiar

alta

as famlias com
~....dG baixa; famlias com
----. a:r=o de renda alta. A
~

::;s

as orientaes sobre o

sim
350
200

no
150
300

Tabela 2 Elementos classificados segundo a renda familiar, nvel de instruo


e uso de programas de alimentao popular.

baixa

~e

Uso de programas

Nvel de
instruo
baixo
alto

Nvel de instruo
baixo
alto
baixo
alto

Uso d e programas
sim
n o
1

320
80
30
120

80
20
70
280

a) Qual a sua concluso sobre a associao entre o nvel de instruo e uso


de programas de alimentao popular, sem levar em conta a renda familiar
(Tabela l)?
b) Analisando a Tabela 2, isto , considerando tambm a renda familiar, o
que voc conclui?

76

fa1A1~ 1 ic11. AplicAdA ~ CiNciAs SociAi~

Ex rnccios

coM plEMENTARES

ANEXO

9) Com o objetivo de verificar se existe associao entre a carreira escolhida


(Economia, Administrao ou Cincias Contbeis) e tabagismo (fumante ou
no fumante ), numa determinada faculdade, fez-se uma enquete onde se
verificaram os seguintes dados: dos 620 alunos do Curso de Economia, 157
eram fumantes; dos 880 alunos do Curso de Administrao, 218 eram
fumantes; e dos 310 alunos das Cincias Contbeis, 77 eram fumantes.
Apresente estes dados numa tabela de contingncia (ou tabela de dupla
entrada), calcule percentagens que facilitem visualizar uma possvel associao
e discuta se os dados sugerem uma associao.
10} Os da dos a seguir referem-se participao em programas de treinamento (1
= sim e O = no) e desempenho no trabalho ( 1 - ruim, 2 = regular, 3 = bom) dos
30 funcionrios de uma empresa.
Ind.

desemo.
2

2
3

1
1

3
3

12
13

2
1

14

15
16
17

5
6
7
8
9
10

oartic.

lnd. 1 oartic.

o
o
1
o
1

1
3
3
1

Aplrulo 4 - DAdos o.TE

11

o
o
1

18

24
25
26
27
28
29
30

2
3
l

2
l

o
o
1
o
o
l
o

23

19
20

Ind. 1 oar lic.


21
1
22
o

dcsemo.
2
1
2

Este anexo cc-:-...familias residentes ::.


pesquisa foi realiz.af.;; """"'
os efeitos polticos C'.J'S
a seguir, algumas cias

Local (localidade

<lesemo.
2
2
1

3
1
2
3

P.a .p. (uso de algu=--


O = no.
1 = sit:!:_
Instr. (ltimo nve: de

3
3

a) Construa uma distribuio de frequncias para cada varivel,


apresentando-as em forma grfica.
b) Construa a distribuio de frequncias conjunta. Apresente esta
distribuio numa tabela de dupla entrada, calculando percentagens que
enfatizam o desempenho dos funcion.rios em cada grupo (participantes e
no participantes).

Tam. (nmero de pe

11) Os alunos do Curso de Psicologia da UFSC (turma 302, sem: 99/ 2) realizaram
uma pesquisa com moradores de Florianpolis, respeito da coleta seletiva
de lixo. Uma das tabelas apresentada a seguir:

N2
1

2
3

Sistema de coleta seletiva de lixo


Nvel de instruo do
reSQOndente
n enhum
fundamental
m dio
s uperior incompleto
superior completo

conhece
sim
12
23
43
25

50

no

9
3
3
1
1

colabora
1

sim
9
16
30
13

26

da~

5
6

no
10
15

7
8

22

10
11
12

Calcule percentagens que facilitem a interpretao da tabela e descreva as


p rincipais informaes.

13
14

15
16
8

P.a.

1
1
l
1
1

l
1
1

19
27

Local

1
1
1
1
l
1
l
l

Hoje a regio

o
o
l

o
1

,. ;

1
l
1

o
1

o
o
o
o

2
2
i
2
2
3
'>

pesqui~

~.\s CiNciAs SociAis

77

CAprulo 4 - DAdos CATEGORI ZMlo~

ANEXO
~

a carreira escolhida
~smo (fumante ou
:..::ia enquete onde se
- :-so de Economia, 157
--=..strao, 218 eram
--~::::.. -; e ram fumantes.
u tabela de d upla
_ _ _ ;;::.a possvel associao
"="'.:;:?::!:=;.aaiss de treinamento (1
- =regular, 3 = bom) dos

2
3

3
3
~a

cada varivel,

- a Apresente esta
_.___ _,._.,o percentagens que

Este anexo contm parte dos dados de entrevistas realizadas em


famlias residentes no Saco Grande II, Florianpolis - SC, 1988. 8 A
pesquisa foi realizada pela UFSC e tinha como objetivo principal avaliar
os efeitos polticos dos programas de alimentao popular. Transcrevemos,
a seguir, algumas das variveis levantadas, numa amostra de 120 familias.

VARivEis Ecdiqos
Local (localidade da moradia) :
1 =Conjunto Residencial Monte Verde;
2 =Conjunto Residencial Parque da Figueira;
3 = Encosta do Morro.
P.a.p. (uso de algum programa de alimentao popular):
O= no;
1 =sim.
Instr. (ltimo nvel de instruo completado pelo chefe da casa):
1 =nenhum;
2 = fundamental;
3 = mdio.
Tam. (nmero de pessoas res identes no domicilio).
Renda (renda familiar mensal, em quantidade de salrios mnimos) .

rg::"-po (participantes e

DAdos dE 120 fAMliAs


N2

= colabora
;
_6
30

13
16

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

no
10
15
22

19
27

tabela e descreva as

Local 1 P.a.n. 1 Instr. 1Tam. 1 Renda


4
10,3
o
l
3
4
15,4
1
o
3
4
9 ,6
1
1
2
2
5 ,5
1
o
5
4
9,0
1
l
3
2,4
1
1
1
1
4,1
2
1
o
3
8 ,4
1
3
3
1
10,3
1
1
3
6
4
4,6
1
2
1
18,6
1
o
2
6
4
7,1
1
1
1
4
12,9
o
2
1
8,4
1
o
2
6
19,3
o
3
l
3
10,4
2
1
o
5

N2

17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

Local 1 P.a.n. 1 Instr. 1 Tam. 1 Renda


8,9
1
1
3
3
1
12,9
4
o
3
5,1
1
3
4
o
1
12,2
4
1
3
1
5
5,8
1
3
12,9
1
1
3
5
7,7
1
5
o
3
1,1
1
2
4
o
7,5
1
o
2
8
4
5,8
1
1
3
7,2
1
1
1
5
8,6
1
3
3
o
4
5,1
1
l
2
1
3
5
2,6
o
7 ,7
1
1
3
5
2 ,4
1
2
2
1

Hoje a regio pesquisada compreende os bairros Saco Grande e Monte Verde.

78

EsrArh1iCA AplicAclA s Cil,.ciAs SociAis

N2 Local 1 P.a.p. 1Instr.1 Tam. 1 Renda

33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76

1
1
1
1
1
J

1
1
2

2.
2
2
2
2

2
2
2
2
2
2
2
2
2
2
2
2

2
2
2
2
2
2
2
2
2

1
1
1
1
1
1

o
o
1
1
1
l

o
1
1
1
1

o
1

o
1

1
3
3
3
3
2
1
1
1
1
1
3
2
1
2

3
1
2

3
2

o
o
1

o
1
1
1
1
1

o
l

2
2
2
2

1
1
1
1
1

2
2
2

1
1

1
1

3
3
2

3
1
1
1
3
3
1
3
2
3
2

5
2
6
8
3
5
5

3
5
3
6
5

6
8
4
4
5
3
5

3
2
4
3
4
5
2
4
4
1
7

3
7
3
6
6
3
5

4,8
2,1
4,0
12,5
6,8
3 ,9
9,0
10,9
5,4
6,4
4,4
2,5
5 ,5
14,0
8 ,5
7,7
5,8
5,0
4 ,8
2,8
4,2
10,2
7 ,4
5,0
6,4
5,7
10,8
2,3
6,1
5 ,5

3 ,5
9,0
5,8
4,2
6,8
4,8
6,0
9,0

5
7
4
4
1

3 ,9

6,4

5 ,3
3,1

6,4

N!!

77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120

Local 1 P.a.n. 1 Instr. 1Tam. 1 Renda


2,7
2
1
3
4
2
4
2 ,4
2
o
4
3,6
2
o
2
6,4
2
o
3
5
2
11,3
2
o
3
1
1
5
3,8
2
1
2
4,1
2
3
3
1
1
5
1,8
7,1
1
3
5
3
1
13,9
3
o
3
1
2
4,0
3
6
2,9
3
1
1
6
2
3,9
3
1
9
1
1
4
2,2
3
o
2
3
5,8
3
3
o
2
5
2,8
1
2
5
4,5
3
2
4
5,8
3
o
8
3
3,9
o
3
o
2
7
2,8
3
1,3
1
1
3
3
1
5
3,9
3
3
1
5,0
3
3
5
0,1
1
1
5
3
4,6
3
o
2
3
1
2
4
2,6
3
o
1
6
2,3
3
4,9
1
2
5
3
1
2,3
1
3
5
l
1
3,9
3
3
2,1
1
1
4
3
2 ,7
1
1
4
3
11,1
1
2
5
3
6,4
1
l
3
6
25,7
o
3
7
3
l
l
4
0,9
3
1
3
5
3,9
3
1
1
5,1
3
5
4,2
l
2
6
3
l
1
6
4,4
3
1
7
7,9
1
3
o
1
4
4,2
3
o
1
4
3,5
3
11,4
o
2
6
3

NOTA: O ponto(.) representa falta de resposta e "'.""" representa o nmero de ordem da familia pesquisada.

( Aprulo

uando a vari\e~ ~
grande ganho e;:::.=Este capitulo trata e.=.
va riveis quantitati\'as.
sobre essas di strib~

Uma varivel quantitatr.-a~--_

O rulmero de ftIJ-.::.s
so exemplos de var:;
valores no conju nto :::
3,. ..}. As variveis disc:-.._
Uma varivel quantitati>a ~

intervalo.

O peso de um iiu......:...__.:i5
qualquer valor no inter-.::
costumam ser geradas ?

5.1 VARivEis discR=


A construo de c_-:::
discre ta pode ser fei:z
frequncias de dados e~

~" S Ci~NCiAs SociAis

:rnstr. l Tam. 1 Renda


3
4
2,7
2
4
2,4
2
4
3,6
3
5
6,4
3
i
2

2
5
3

5
3

3
2
!

2
2
2

2
2

3
2
3
3
1
2
2
1
2
!

6
6

9
4
3

11,3
3,8

4,1
1,8
7, 1
13,9
4,0
2,9
3,9
2,2
5,8

2,8

5
4
8

4,5

2,8

1,3

5,8
3,9

3,9
5,0
0,1
4,6
2,6

2 ,3

5
5

4,9
2,3

3 ,9
2,1

5
3

4
4

2,7
11, 1

5
6

6,4

25,7
0,9

7
4
5
5
6

7
4
4
6

Ados QUANTiTATivos

uando a varivel em estudo for mensurada numericamente, temos


grande ganho em termos de tcnicas de anlise exploratria de dados.
Este captulo trata da construo de distribuies de frequncias de
variveis quantitativas, bem como das interpretaes que podemos fazer
sobre essas distribuies.

Uma varivel quantitativa dita discreta quando seus possveis valores puderem ser listados.
O rulmero de filhos de um casal e o nmero de cmodos de uma casa

so exemplos de varive is discretas, pois a primeira s pode assumir


valores no conjunto {O, l, 2 , ...}, enquanto a segunda no conjunto {l, 2,
3, ...}. As variveis discretas geralmente resultam de alguma contagem.

3,9

5, 1
4,2
4,4
7,9
4,2
3,5
11,4

=-:e= a familia pesquisada.

Uma varivel quantitativa dita contnua quando puder assumir qualquer valor num
intervalo.
O peso de um indivduo uma varivel contnua, pois pode assumir
qualquer valor no intervalo, digamos, de O a 300 kg. As variveis contnuas
costumam ser geradas por um instrumento de mensurao.

5.1 VARivEis disCRETAs


A construo de distribuies de frequncias de dados de varivel
discreta pode ser feita da mesma forma que uma distribuio de
frequncias de dados categorizados, desde que no haja grande quantidade

80

EsrA1sricA AplicAd" s c;r"ciAs SociAis

de diferentes valores observados. 1 Como exemplo, usaremos os dados da


varivel nmero de pessoas residentes no domiclio, considerando uma
amostra de quarenta residncias do Conjunto Residencial Monte Verde
(anexo do Captulo 4} .

prulo 5 - DAdos

"
a

~ 14-- - -- - - - - -

n~
~
~

L- - - - f - - - - ,
10L----~t--jt----12

~ sL----+-it---

Dados

44454123646446353444
555484 5 3455252683553

A Tabela 5.1 apresenta a distribuio de frequncias dess es dados,


construda atravs da contagem das repeties de cada valor.

'8
-~
.E

L ----.r-+-11--1

4 L-2

--1---11---J-r-

L--1-~l--t-Jt-iil

~ o

....
"'-

Nm~oc.r ~

Tabela 5.1 Distribuio de frequncias do nmero de pessoas residentes


no domiclio , numa amostra de quarenta residncias do Conjunto
Residencial Monte Verde, Florianpolis - SC, 1988.
Nmero de gessoas
1
2
3
4
5

Freguncia de residncias
1
3
6
13
11

6
7

Percentag_em de residncias
2 ,5
7,5
15,0
32,5
27,5
10,0
0,0
5,0

Para representar graficamente a distribuio de frequncias de uma


varivel quantita tiva, devemos construir um par de eixos cartesianos. Na
abscissa (eixo horizontal} construimos uma escala para representar os
valores da vari vel em estudo, enquanto na ordenada (eixo vertical},
representamos a frequncia de cada valor.
A Figura 5. 1 mostra duas formas alternativas de repre sentao
grfica da distribuio de frequncias da Tabela 5.1. A primeira consiste
em traar hastes verticais sobre os valores efetivamente observados (Figura
5. la). A altura de cada haste d eve ser proporcional fre quncia do
correspondente valor. Na segunda representao, su bstituimos os riscos
por retngulos (Figura 5 .1 b). Esses retngulos d evem ter a mesma largura
e podem ser justapostos. O eixo vertical (das frequncias) deve sempre
iniciar no zero; o eixo horizontal (dos valores da varivel) pode iniciar
prximo ao menor valor da varivel.
1

Quando a varivel apresenta grande nmero de diferentes valores, podemos usar os artificios
que descreveremos para variveis contnuas (Seo 5.2).

EX E RC C OS

1)
de moradores p..=- _
e m termos do ::-
2} Considerando a s.
a) construa r:,,:;,
satisfao cL
b)
e) interprete.

3) As duas tabelas

N2 de fil hos
Frequ ncia

N~

de filhos

Frequ ncia

Apre sente

_ _...

~ ' \s Ci~NCiA~ SociAis

-'"'-'-..- co:isiderando uma


-e:::icial Monte Verde

81

CAphulo S - D11dos QUA'ITir11 1ivos

b)

a)
UI

ai

14

..,

12

.,

o
d

'O
e;;
.,....

14

10'

.
i
~

10

1 86

"!

o
e:.,

12

10

-~
<l

<.>
'O
(!)

o 4

,5:;,

o
2

.:: o

-=..:: ;x:ssoas residentes


- --cias do Conjunto
;agem de residncias
2,5
7,5
15,0
32,5
27,5
lO,O
0,0

5,0

- -a..-a representar os
-..ada (eixo vertical),

~de pessoas residentes

Nmer o de pessoas residentes

Figura 5.1 Representaes grficas da distribuio de frequncias da Tabela 5. L

ExeRccios
1) Observando a Figura 5.1, descreva qual a quantidade tpica (ou faixa tpica)
de moradores por domiclio. Existe algum domiclio muito diferente dos demais,
em termos do nmero de moradores?
2)

Considerando os dados do anexo do Captulo 2, faa os seguintes itens:


a) construa uma tabela de distribuio d e frequ ncias para o nvel de
satisfao do aluno com o curso (item 3.g do questionrio);
b) apresente essa distribuio sob forma grfica e
c) interprete.
3) As duas tabelas de frequncias seguintes referem-se s distribuies do
nmero de filhos dos pais e dos avs maternos de uma amos tra de 212
alunos da UFSC, pesquisada p elos a lunos do Curs o d e Cincias Sociais,
primeiro semestre de 1990.
Distribuio do nmero de filhos dos pais dos respondentes

representao
?:imeira consiste
~~=:!:=-~~

cbservados (Figura
_ ____,,.._---... frequ ncia do
s:::::..::sd~imos

os riscos

mesma largura
~) deve sempre
..:..~el) pode iniciar

-~:-a

N2 de filhos

Frequncia

10

45

32

50

23

23

10

11

12

Distribuio do n mero de filhos dos avs matemos dos respondentes


2

N2 de filhos

Frequncia

10 11 12 13 14 15 16 17 18

17 32 17 29 23 2 0 22 21 14

Apresente e ssas duas dis tribuies em grficos e faa uma descrio


comparativa entre elas.

82

EsTATSTiCA ADliCAdA s CiNCiAs SociAis

5.2

CApfrulo 7 - DAdos

9~ ~~--

VARVES CONTNUAS

Para as variveis contnuas, no faz muito sentido contar as


repeties de cada valor, pois, considerando que dificilmente os valores
se repetem, no chegaramos a um resumo apropriado.

DiAGRAMA

dE

PONTOS

Quando temos um conjunto com poucos dados, podemos analislo atravs de um diagrama de pontos, isto , representando cada resultado
(valor) por um ponto na reta de nmeros reais (veja a Figura 5.2).

DadQ)2

2..~4

2,9

2,7

1,4

2,2

2,0

1,5

1,9

2,5

2,3

2,7

2,5

1,7

Nas Cincias c:-centenas ou milha;i;;s


pontos fique impracz ::o
agrupando resul~
pequenos intervalos===
abrangem todo o co:::::..: ser construdas de :e..'.:

Como exe mp~


aleatria de quarer:~ ~

3,1

..

3,0

57,25
72,81
54,70
59,07

76,85
66,0 1
67,95
68,04

Figura 5.2 Construo de um diagrama de pontos.

possvel colocr duas ou mais distribuies num mesmo grfico;


basta identificar os pontos com smbolos diferentes , ou coloc-los em
nveis diferentes, como ilustra a Figura 5.3 .

Sul
Norte 1
0,52

0,62

. ..

0,72

* ..... * .

Observe que 1
menor valor 45.3 ...,. e
classes mutuame:!::~ ,_
todos os valores. :.:~
com amplitude P-' '
de 40,00 a .;!9 ~

>

0,82

IOH
Figura 5.3 Diagrama de pontos do ndice de Desenvolvimento Humano (IDH) de duas amostras
aleatrias de quatorze municpios: uma da Regio Sul e outra da Regio Norte.2

sendo que o simb~ '"' incluindo o valor C.tJ T-=

Interpretao da Figura 5.3 - Os municpios da amostra da Regio Sul


apresentam, em geral, IDH maiores do que os municpios da amostra da
Regio Norte. Tambm observamos que as duas amostras de municpios
diferenciam-se quanto disperso dos valores. Enquanto na amostra da
Regio Sul os municpios apresentam IDH relativamente prximos (maior
homogeneidade), na amostra da Regio Norte os valores variam bastante
de municpio para municpio (maior heterogeneidade).
2

Dados extrados do Atlas do Desenvolvimento Humano (www.pnud.org.br / atlas). O IDH,


calculado para cada municipio, foi constru.!do com base nos dados do Censo Demogrfico
de 2000. Observe que neste exemplo os elementos das amostras so municpios.

Dados do Censo

~-

ai

:\s CiNCiA~ SociAis

-- sentido contar as
~""'Llllente os valores

:::s podemos analis. .- .do cada resultado

CAphulo '.i - DAdos QuA~1iiA 1ivos

8~

Nas Cincias Sociais, geralmente trabalhamos com conjuntos de


centenas ou milhares de observaes, fazendo com que o diagrama de
pontos fique impraticvel. Podemos construir distribuies de frequncias,
agrupando resultados em classes preestabelecidas. As classes so
pequenos intervalos mutuamente exclusivos, tais que, quando reunidos,
abrangem todo o conjunto de dados. Em outras palavras, as classes devem
ser construdas de tal forma que todo valor observado pertena a uma e
apenas uma classe. Por simplicidade, e para facilitar a interpretao,
consideraremos todas as classes com a mesma amplitude.
Como exemplo, usaremos as taxas de alfabetizao de uma amostra
aleatria de quarenta municpios brasileiros. 3

2,7

1,7

s,1

..

3,0

_ =:!m m esmo grfico;

- -es ou coloc-los em

.. * . . . .

57,25
72,81
54,70
59,07

76,85
66,01
67,95
68,04

92,90
90,52
69,91
73,22

89,07
87,94
95,02
95,34

Dados:
75,49 84,33
58,88 86,34
77,62 57,14
88,40 83,52

65,28
45,37
91,22
64,1 9

94,59
81 , 15
64,65
64,17

71,20
94,83
85,70
95,34

82,30
81,42
81,34
84,66

Observe que todos os valores esto no intervalo de 40 a 100 (o


menor valor 45,37 e o maior 95,34) . Devemos definir um conjunto de
classe s mutuamente exclusivas, tais que, quando reunidas, contenham
rodos os valores. Uma possvel escolha seria construir 6 (seis) classes
com amplitude aproximada de 10 (dez), como segue:
de 40,00 a 49,99; de 50,00 a 59,99; ... ;de 90,00 a 99,99
Para simplificar a notao, representaremos essas classes por:

0,82

40,00

1- 50,00; 50,00

l-60,00; ... ; 90,00

1- 100,00

sendo que o smbolo "1-" representa o intervalo entre os dois valores,


incluindo o valor do lado esquerdo e excluindo o valor do lado direito.
A tabela de frequncias construida atravs da contagem da
frequncia de casos em cada classe, como mostramos a seguir:
.:::=:zs ::as de municpios
----:anto na amostra da
~-::::e prximos (maior
-:-es ,ariam bastante

classes
401- 50
5 01-60
601-70
701-80
801- 90
901- 100

contagem
1
11111
11111111
111111
111111111111
11111111

frequncia
1
5
8
6
12
8

:-r-.:'tiorg.br /atlas). O IDH,

:::.aos do Censo Demogrfico


~._,.,,..,_
-=

so m unicpios.

Dados do Censo Demogrfico, 2000 lwww.ibge.gov.br).

84

EsrArsricA AplicAdA s Ci'NCiA~ SociAis

Na a presentao de uma tabela de frequncias, comu m colocar


tambm os pontos mdios das classes, isto , para cada class e, a mdia
dos seus limites. Por exemplo, na classe 40 1- 50 o ponto mdio 5. O
ponto mdio representa o valor tpico da classe. A Tabela 5.2 apresenta a
distribuio de frequncias dos dados em discusso.
Tabela 5.2 Tabela de frequncias de valores da taxa de alfabetizao,
relativos a uma amostra aleatria de municpios brasileiros, ano 2000.
Classes da taxa de
ai fa b.etizaco
401-::>0
501-60
60 l-70
70 l- 80
80 1- 90
901- 100
Total

Pon to
mdio
45
55

Frequn cia
d e municpios

Percentagem
de municpios
2,;:>
12,5
20,0
15,0
30,0
20,0
100,0

5
8
6
12
8
40

65

75
85
95
-

CAprulo 7 -

Uma forma

~;:e_-- -

de variveis quantita..:: ~
e os polgonos de freq""::~---

-=-i

A Figura 5 .4 ~~
partir da Tabela 5.2. S:
da varivel em estuC:=
frequn cia observada~
12

"'o

:.

10

d
::i

.~

O nmero de classes a ser usado na tabela de frequ n cias uma


escolha arbitrria. Quanto maior o conjunto de dados, mais classes podem
ser usadas . Uma tabela com poucas classes apresenta a distribuio de
forma bastante resumida, podendo deixar de evidenciar a lgumas
caracteristicas relevantes. Por outro lado, quando se usam muita s classes,
a tabela pode ficar muito grande , no realando aspectos re levantes da
distribuio de frequncias.
Em geral, so usadas de cinco a vinte classes, dependendo da
quantidade de dados e dos objetivos. Dentro desta faixa, uma sugesto
usar, aproximadamente, Fn classes, onde n a quantidade de valores. 4
Em nosso exemplo: n = 40, resultando em
= 6,32 ' o que sugere seis ou
sete classes; adotamos 6 classes. Como os dados extremos so 45,37 (o
menor) e 95,34 (o maior), temos u ma amplitude total de 95,34 - 45,37 ';: : 50.
Assim, se as classes iniciarem p elo menor valor, cada classe deve ter
amplitude : 5 = 8,33. Mas, para facilitar a leitura da tabela de frequn cias, optamos por iniciar em 40,00 e usar classes com intervalos iguais a
10,00. Esquematicamente:

DAtlo~ OLA\i'

't:l
(lj

Ti
d

<V

2-

li:

o1

..Y/'"

rn

Interpretao da Figura 5

municpios com taxas ce :


adulta, mais de 80% de :(-..!!
com taxas de alfabetiza:
por regio demogrfica ?~

lntervA IO onde esto os da dos

45,37

95,34

Classes:

40

50

60

70

RO

90

100

O polgono de freq-_ Para constru-lo, toma-se e


de cada classe. Coloc~
~

Quando se tm valores discrepantes no conjunto de dados, recomenda-se que o nmero


de classes seja maior.

Quando as classes no tm a
por exemplo, Bussab e Mm~
u sando percentagens no ei.w

_ ..\d.\ i\s CiNciAs SociAis


~s

comum colocar
carla classe, a mdia
;><>nto mdio 5. O

85
Uma forma alternativa de apresentar distribuies de frequncias
de variveis quantitativas atravs de grficos, tais como os histogramas
e os polgonos de frequncias , que apresentaremos a seguir.
HiSTOCjRl\MI\

:::2J:a de alfabetizao,
::as-_eiros, ano 2000 .

Percentagem
de munic ios
2,5

A Figura 5.4 mostra um histograma de frequncias, construdo a


partir da Tabela 5.2. So retngulos justapostos, feitos sobre as classes
da varivel em estudo. A altura de cada retngu lo proporcional
frequncia observada da correspondente classe. 5

12,5

20,0
15,0
30,0
20,0
100,0

.,. ::equncias uma


"""!3is classes podem
.a a distribuio de
_enciar algumas
. =sa...'11 muitas classes,
t:tos relevantes da
s. dependendo da

12
(/)

"Si 10

:
e
;:J
s

8
6
4

40

50

60

70

80

90

100

Taxa de alfabetizao

Figura 5.4 Histograma de frequncias de valores da taxa de alfabetizao,


relativos a uma amostra aleatria de municpios brasileiros, ano 2000.

Interpretao da Figura 5.4 - Observamos um contingente razovel de

municpios com taxas de alfabetizao acima de 80 (dentre a populao


adulta, mais de 80% de alfabetizados). Mas tambm h muitos municpios
com taxas de alfabetizao muito baixa (entre 50 a 80). Uma anlise similar
por regio demogrfica poderia trazer mais informaes relevantes.

PolqoNo dE fREOUNCiAs
O polgono de frequncias uma representao grfica alternativa.
Para constru-lo, torna-se o ponto mdio (x) e a correspondente frequncia (f)
de cada classe. Colocamos os pares (x, f) como pontos num par de eixos
100

=-=aida-se que o nmero

s Quando as classes no tm a mesma amplitude, necessrio fazer alguns ajustes. Veja,


p~r exemplo, Bussab e Morettin (2002, p. 27). O histograma tambm poderia ser feito
usando percentagens no eixo vertical, mas a sua forma no mudaria.

86

E~ 1 A 1 b1ic:A AplirndA s Ci?Nci11s SociAis

cartesianos. A ilustrao ao lado mostra a representao


do ponto (5, 1), num par de eixos cartesianos. Para
completar o grfico, devemos unir os pontos com semirretas, ligando os pontos extremos ao eixo horizontal.

--.s/

o
5
X
A Figura 5.5 apresenta o polgono de frequncias construido a partir
da Tabela 5.2. O leitor deve notar que as informaes fornecidas pelo
polgono de frequncias so equivalentes s observadas num histograma.

CAprulo 5 - DAdos

Ol~:-- -

O leitor de\-e cexplorar possveis ;e varivel qualitativa ,


de frequncias, de. o
dos valores), a di~:"SDizemos que uma d~~ ~

do outro lado.

14 -

"'o. 12 -

comum
simtricas. Por e::==:
assimtricas, pois e. ;:
com alta renda (pr::. _

-~

:g

10 -

E 8-

"'

-o
~

"

6 -

,.,>:: 4,
;J

O'

ti:

21

'
_)__

o30

40

50

60

70

80

100

90

1 10

Ta.x a de alfabetizao

Figura 5.5 Polgono de frequncias de valores da taxa de


alfabetizao, relativos a uma amostra aleatria de municpios
brasileiros, ano 2000.

A Figura 5.6 apresenta dois polgonos de frequncias num mesmo


grfico, usando dados do anexo do Captulo 4. O uso de percentagens no
lugar de frequncias absolutas foi proposital, porque facilita as
comparaes entre as duas distribuies de renda. Deixamos para o leitor
a interpretao das informaes contidas neste grfico.

ExERccios

~ 48

4)

E 40

"E

"f;f

5
c'!::.

em relao ao se-:: :S..

32

?.1on te Verde
- - En costa do Morro

24

" ..

16

o 1-.
o

........ ..

. " .. . .,
'\.~

no Departamenw ::: = E

pode-se dizer que ~


professor com o cie-~

15
20
25
Renda familia r (c m :;a.lrios minimos)
10

de 12 professores: _._

30

Figura 5.6 Distribuies de frequncias das rendas familiares no


Monte Verde (amostra de 40 familias) e na Encosta do Morro (amostra
de 37 famlias), Bairro Saco Grande II, Florianpolis-Se, 1988.

Apresente os dois ~-
anlise compara.:--a..

~dl s CiNCiAs SociAis

~-"-'"""'~s construdo

.~

O leitor deve observar que um grfico como o da Figura 5.6 permite


explorar possveis relaes entre uma varivel quantitativa (renda) e uma
varivel qualitativa (localidade). Ao comparar histogramas ou polgonos
de frequncias, devemos observar a posio no eixo horizontal (nvel tpico
dos valores), a disperso e a assimetria.

a partir

- - :5cs fornecidas pelo


~nu m

87

CAp1 ulo 5 - DAcJo; OUAN1 i1A1ivo;

histograma.

Dizemos que uma distribuio simtrica quando um lado da distribuio o reflexo


do outro lado.
comum medidas fsicas terem distribuies razoavelmente
simtricas. Por outro lado, distribuies de renda em geral so
assimtricas, pois existem mais pessoas com baixa renda do que pessoas
com alta renda (principalmente no Brasil~. Veja a Figura 5.7.
(a) Distribuies diferentes em

termos da posio cen trai

(b) Distrib uies diferentes

quanto

a disperso

.l>~

__
_ /) \>.. _ _

--o

~ :zta

de
::::::dpios

--...-..:.::cias num mesmo


-- :::e p ercentagens no
~n:-qu e fac ili ta as
~o s para o leitor

(e) Distribuio simtrica

(d) Distribuio assimuica

_A

______:___)

Figura 5.7 Diferentes formas de distribuies de frequncias.

ExERCcios
4 ) Os dados a seguir so medidas da identidade social que os professores sentem
em relao ao seu departamento de ensino. Foram observadas duas amostras
de 12 professores: uma no Departamento de Engenharia Mecnica e a outra
no Departamento de His tria, ambas na UFSC. Pelo instrumento utilizado,
pode-se dizer que quanto maior o valor, maior a identificao social do
professor com o departamento de ensino a que pertence.

=
_.:;:

30

Valores de identidade social


Departamen to de Eng. Mecnica
4 6 48 47 48 49 50
3 7 46 47 48 44 47

Departament o de Histria
35 24 43 4 3 44 33
38 35 39 37 40 35

Fonte: Laboratrio de Psicologia Social / UFSC, 1990.

Apresente os dois conjuntos de dados num diagrama de pontos e faa u ma


anlise comparativa.

88

Es1ATSTiCA ApllCAdA S Ci [ \ CiAs Socl1\IS

5)

Considere os dados do anexo do Capitulo 2.


a) Construa uma tabela de frequncias para o desempenho do aluno no
curso (item 5 do questionrio).
b) Faa um histograma. Interprete .
e) Construa um polgono de frequ ncias.

CApfrulo ~ - D,,dos ot~:.

57
72

76

54

67
68

59

66

6 ) Considerando os da dos sobre renda familiardo anexo do Capitulo 4, construa


trs histogramas, sendo um para cada localidade. Faa uma comparao
descrevendo as diferenas entre as trs distribuies de renda familiar.

a)

7)

5
6
7
8

Jndivid\Jos normais
(amostra de 43 indivduos)

30~

40

50UL

30

.,
,, 10

-~ 20

.,. o .1.....-.1.._..___.__,___.____.___._~9

10 11

12

13

14

15

presso inlfaocufar

16

lndividuos portad0<es de glaucoma


(amostra de 34 individuas)

8 25
20
~ 15
.;; 10
,, 5

5J

Os grficos apresentados a seguir represe ntam distribuies de presses


intraoculares para indivduos normais e para indivduos portadores de
gla ucoma. Quais a s semelhanas e d iferenas que podemos observar na
presso intraocular desses dois grupos de indivduos?

o _.___.__ _,__,__..__.__..____.__..____
16

20

24

28

32

36

40

44

O leitor deve
se a forma da distr..o.>-..... ._
d eitado (compare e
Figura 5.4).

presso intraocular

RAMO--E--fol~As

Quando a quantidade de dados no for muito grande (digamos, at


uma centena de observaes), podemos construir, com relativa facilidade,
um ramo-e-folhas, o qual fornece a forma da distribuio de frequncias e
ainda preserva a magnitude aproximada dos valores. Num ramo-e-folhas,
os dados ficam ordenados crescentemente, o que facilita a obteno de
algumas medidas descritivas, como veremos no prximo captulo.
Voltemos a considerar as taxas de alfabetizao de uma amostra de
municpios brasileiros. Para facilitar a construo do ramo-e-folhas, vamos
usar apenas os dois algarismos mais relevantes, desprezando os algarismos
decimais.
Para cada valor, o primeiro algarismo colocado do lado esquerdo
do trao vertical, formando os ramos. O segundo algarismo colocado do
lado direito do trao, formando as folhas. Assim, o valor 57 fica representado
por 517 (veja a segunda linha da Figura 5.8a), o 76 por 716 (quarta linha),
e assim por diante . Na apresentao final de um ramo-e-folhas, devemos
tambm ordenar as folhas, como mostra a Figura 5.8b.

res. Em nosso exeigual a 1 (um), ou se:.,,_


naturalmente, e me:-=.:__
folha. Por exem plo ~ . Na constru~
a escolha dos alga.-::::
d epende do c o~~~
anlise . Tome mos
onde trabalharemos
Dados da poptta 6.512
3.682
18.084

8.453 3"
19.985
13.084

17 .189

9.709

Fonte: IBGE.

cinco, temos a me=a o;,,

respectivamente).

""

...C >. .\~ Citi\Cl>.s SociAls

89

C>.pn..lo ~ - D>.dos Ol-Ai\TiT.\TiYo~

.=.penho do a luno no

57
72
54
59

captulo 4, construa
- .:.:ca uma comparao
i.:;.c renda familiar .

76
66
67
68

Dados com os dois algarismos mais relevantes:


92
89
75
84
65
94
90
87
58
86
45
81
69
95
77
57
91
64
73
95
88
83
64
64

a)
4
5
6
7
8

-uies de presses
-- =cuos portadores de
~emos obscnrar na

71
94
85
95

82
81
81
84

b)

5
78479
56794844
651273
942761151834
24045155

4
5
6
7
8

5
47789
44456789
123567
111234456789
01244555

Figura 5.8 Construo de um ramo-ejolhas

3:2

36

40 44

r.l'aOa!far

O leitor deve notar que, ao observar os dados num ramo-e-folhas, vse a forma da distribuio de frequncias , como se fosse um histograma
d eitado (compare o ramo-e-folhas da Figura 5.8b com o his tograma da
Figura 5.4).
No histograma, temos a liberdade de escolher a amplitude do intervalo
de classe; num ramo e folhas, tambm podemos dividir cada ramo em dois
ou cinco.6 Na Figura 5.9, os algarismos
4 5
f olhas) de O a 4 ficaram num ramo e os 5 4
algarismos de 5 a 9 no outro ramo. A uni- 5 7789
d a.de indica como devem ser lidos os valo- 6 444
:-es. Em nosso exemplo, temos a unidade 6 56789
7 123
!gual a 1 (um), ou seja, os valores so lidos 7 567
:latu ralmente, emendando o ramo com a 8 1112344
8 56789
.tolha. Por exemplo, 4 I 5 lido como 45 .
Na construo de um ramo-e-folhas,
a escolha dos algarismos mais relevantes
de pende do conjunto de dados em
anlise. Tomemos um novo exemplo,
onde trabalharemos com dois algarismos.

9
9

01244
555

Unidade = l
4 15 = 45

Figura 5.9 Aprescntap, em ramo-efolhas, dos valores da taxa de alfabetimo,


relativos a uma amostra aleatria de
municpios brasileiros, ano 2000.

Dados da populao residente dos municpios do Oeste Catarinense, 1986.


6 .5 12
3.682
18.084

17.189

8.4::>3 30.::>92 9.279


19.985 11.133 24.959
13.084
5.464 30.377
9.709 8.713 16.127

105.083 21.083 17.968 2;:,.089 14 .867


9.612 12.935 19.739
12.315 28.339
26.966 9.094 11.943 21.234 44. 183
3 .163 33.245 27.291

F"onle: lBGE.

- Em cada ramo, podemos ter at dez algarismos diferentes. Ento, dividindo-se por dois ou
cinco, temos a mesma quantidade de algarismos possveis cm cada ramo (cinco e dois,
respectivamente).

90

EsrArsricA AplicAd1\ s CiNciAs SociAis

Ao construir um ramo-e-folhas para estes dados, optamos por


desprezar os trs ltimos algarismos, transformando a unidade bsica
de habitantes para mil habitantes (veja a Figura 5.10).

o
o
1
l

2
2

(Aprulo

33

56889999
112234
677899
114
5678

3
3

003

Unidade = 1.000

o 13 = 3.000

Valor discrepante: 1015

Figura 5.10 Apresentao, em ramo-e-folhas , da


populao residente nos municpios da
Microrregio Oeste catarinense, 1986.

os dois capim:~

Exrncdos
8) Considerando os dados do anexo do Captulo 2, construa um rarrw-e-folhas
para os valores do desempenho do aluno no curso. Interprete.
9)

Considerando os dados do anexo do Captu lo 4 , construa um rarrw-e -folhas


para a renda familiar, em cada localidade. Interprete.

ExERCcios coMpLEMENTARES
10) Foram anotados os tempos decorridos entre a incidncia de uma certa doena
e sua cura, em 50 pacientes. Estes tempos so os seguintes, em horas:
21
44
27
323
99
20
90
66
39
16
47
96
127
74
82
92
69
43
33
12
84
41
02
61
35
74
02
83
03
13
24
24
41
10
80
87
40
14
82
58
35
114
120
67
16
37
126
31
04
56
Construa um histograma e comente sobre alguns aspectos relevantes desta
distribuio.
11) A tabela seguinte apresenta os salrios, em reais, dos funcionrios de duas
empresas.
Em resa A

400
350
480
1800
720
130
420

1200
620
720
1320
830
190
380

300
340
310
920
400
980
590

280
620
620
780
2900
320
1320

Em resa B

700
550
1700
1100
830
1540
2720

190
2100
3200
510
320
920
3000

230
380
11 00
160
3500

420
520
840
190
230

11 0
190
210
200
120

230
310
630
230
290

Faa uma descrio comparativa usando grficos apropriados.

330
620
160
990
340

420
380
240
355
720

distribuies de.::. varivel se distribui.. e::::


vamos usar outra es::-~
complementar, pa:::-a :: ~
Quando a vari"~=-
informaes dos dar;... exemplo, para s e_ cc:::.'comunidade, podemosCE-
nascidos nessa com~
peso dessas crianas.
suma, neste captulo~
que descrevem info:;:-;-=;t
Primeiramente_ e
as medidas mais u~f:=
Seo 6 .3 introduzi..- e -;;.

6.1 MdiA E dES'

O conceito de r;familiar. Matematica=.e::::::


dividida pelo nmero ~

--es dados, optamos p or


- - - -- --do a unidade bsica

MEdidAs dEscRiTivAs
N

os dois captulos anteriores, aprendemos a organizar da dos em


distribuies de frequnc ias, onde foi poss ve l visu alizar com o uma
vari ve l se dis tribui, em termos dos elementos observa dos. Neste captulo,
vamos u s ar outra estratgia, que pode ser usada de forma altern a tiva ou
complementar, para descrever e explorar dados quantitativos.

.~rete .

-..la u m ramo-e-folhas

---".........."""de u ma certa doena


~.x;:ites,

em horas:

39
33
03
82
56

S6
)

16
12
13
58
04

_;;.ec-.os relevantes desta

Quando a varivel em estudo quantitativa, podemos resumir certas


informaes dos dados (valores) por algumas medidas descritivas. Por
exemplo, para se con h ecer o peso tpico d e recm-nascidos n uma
comunidade, podemos calcular a mdia ou a mediana dos pesos dos recmnascidos nessa comun idade. Para se ter ideia da magnitude de variao do
p eso dessas crianas, podemos calcular o ch amado desvio padro. Em
suma, neste captulo vamos aprender a calcular e interpretar certas medidas
que descrevem informaes especficas de u m conjunto de valores.
Primeirame n te, consideraremos a mdia e o desvio padro, que so
as m edidas mais usadas para estudar a posio central e a disperso. Na
Seo 6.3 introdu ziremos algumas medidas alternativas.

funcionrios de duas

6.1 MdiA EdEsvio pAdRO

::.;:;;:;i:esa B

__ .,
n

.9C

:e

2"00

L7C

230
310
630
230
290

330
620
160
990
340

420
380
240
355
720

A Md iA ARTMTCA
O conceito de mdia aritmtica, ou simplesmente mdia, bastante
famiar. Matematicamente, podemos defin i-la como a soma dos valores
dividida pelo nme ro de valores observados. Por exemplo, dada a nota

Cf2.

[srArsricA AplicAdA s CieNciAs SociAis

final dos oito alunos de uma turma (4, 5, 5, 6, 6, 7, 7 e 8), podemos


calcular a mdia aritmtica por:
4+5 + 5+6 + 6+7+7+8 = 6
8
De modo geral, dado um conjunto de n valores de uma certa varivel
X, podemos definir a mdia aritmtica por:

C Ap 1ulo 6 - M EdidAs dEscRrL

Observando a F:.;
pontos a mdia aritmrt.ft.:.
dos valores. Mais espec-~
indica o centro de um cede ponto de equilbrio : _
como pesos sobre u;:;.;;.
equilibraria a tbua

-X = -Ix-

A mdia aritmtica res-...- .e

onde LX representa a soma dos valores da varivel X Em geral, a mdia


aritm tica bastante informativa. Se , por exemplo, na primeira avaliao
de uma disciplina, a mdia das notas dos alunos foi igual a 7,0, e na
segu nda avaliao foi igual a 9 ,O, podemos dizer que, em geral, os alunos
tiveram melhor aproveitamento na segunda avaliao, mesmo sem nos
referirmos s notas de cada aluno individualmente. Mas devemos sempre
ter em mente que a mdia um resumo dos dados e, por isso, pode
esconder informaes relevantes.

ExEMplo 6.1 Vamos considerar a comparao de trs turmas de estudantes


em termos de suas notas (veja a Tabela 6.1eFigura 6.1 ).

Observamos, naJrL_
de estarem distribucius
mdia. Comparando GS
verificamos que as nc~
que essa turma ma;:;;
discrepante dos demaT";;
fica abaixo da maior.a
Para melhorar ::::_
da mdia aritmtica __
desvio padro.

Tabela 6 . 1 Notas finais de trs turmas de estudantes e as r espectivas


mdias.
Turma

Notas dos alunos

4
1

Desvio Padro
A 1,3

2
6

4
7

6
6
7

'

7
7
9
10
7,5 7 ,5

6
6
7
Q

..
o

6,00
6,00
6,00

Tanto a varinc::;.
informaes comple=.
medidas avaliam a
~

O Turm a A
O Tu rma 8
O Turma C
.t. indicao da m dia

--

C 2,7

8
10

B 3,5

Mdia da turma

..r-<-

Descrico

Valores

(notas~ ~

Mdia
Desvios
Desvios quadrjo:s

10

notas

Figura 6.1 Representao das distribuies das notas de trs turmas e as


correspondentes posies das mdias aritmticas.

'

Podemos observar no~


discrepante arrasta a:propriamente um valor _

dados que contenham ,,..,.,

CAprulo 6 - M EdidAs dEsCRifi\.\S

6. 7. 7 e 8), podemos

X Em geral, a mdia
i::a primeira avaliao
___ liO: igual a 7,0, e na
P"ll geral, os alunos
..S.O. mesmo sem n os
as devemos sempre
~ e, por isso, pode

;mas

de estudantes

::..::a 6 :).

Observando a Figura 6.1, percebemos que em cada diagrama de


pontos a mdia aritmtica representa, num certo sentido, a posio central
dos valores. Mais especificame nte, podemos dizer que a mdia aritmtica
indica o centro de um conjunto de valores, considerando o conceito fisico
de ponto de equilbrio ou centro de gravidade. Se imaginarmos os pontos
como pesos sobre uma tbua, a mdia a posio em que um suporte
equilibraria a tbua.
A mdia aritmtica resume o conjunto de dados em tennos de uma posio central ou
valor tpico, mas, em geral, no fornece informao sobre outros aspectos da distribuio.

Observamos, na Figura 6.1, que os trs conjuntos de valores, apesar


de e starem distribudos sob diferentes formas, apontam para uma mesma
mdia. Comparando as notas da Turma A com as notas da Turma B,
verificamos que as notas da Turma B so bem mais dispersas, indicando
que essa turma mais heterognea. Na Turma C, observamos um ponto
discrepante dos demais, uma nota extremamente baixa. Com isso, a mdia
fica abaixo da maioria das notas da turma. 1
Para melhorar o resumo dos dados, podemos apresentar, ao lado
da mdia aritmtica, uma medida de disperso, como a varincia ou o
desvio padro.

es e as respectivas

A VARiNCiA Eo dEsvio pAdRO


~1dia

da tu rma

6,00
6,00
6,00

Tanto a varincia quanto o desvio padro so medidas que fornecem


informaes complementares informao da mdia aritm tica. Estas
medidas avaliam a disperso do conjunto de valores em anlise. Para
calcularmos a varincia ou o desvio padro, devemos considerar os desvios
de cada valor em relao mdia aritmtica. Depois, construmos uma
espcie de mdia desses desvios. Ilustramos, a seguir, as etapas de clculo,
usando as notas da Turma A.

~a A

Descrio
Valores (notas dos alunos)
Mdia
Desvios
Desvios quadrticos

::: -~aB

=-,..-ac
~

.:-.aAo da mdia

- =!s turmas e as

notao

X
X
X-X

resultados numricos
5 5 6 6 7 7 8
6
-2 -1 -1 o o 1 1 2

(x-xY

o o 1 1

Podemos observar no diagrama de pontos referente Tunna C que a presena de um valor


discrepante arrasta a mdia para o seu lado. Assim, a mdia deixa de representar
propriamente um valor tfpico do conjunto de dados. Um tratamento mais adequado para
dados que contenham valores discrepantes ser visto na Seo 6.3 .

94

EsrArsiicA ApliCAdA ,\s

C~/\CiAS

Para evitar o problema dos desvios negativos, vamos trabalhar com


os desvios quadrticos, (x A varincia definida como a mdia
aritmtica dos desvios quadrticos. Por convenincia, vamos calcular esta
mdia, u sando como denominador n-1 no lugar de n. 2 Assim, definimos
a varincia de um conjunto de valores pela expresso:

XJ.

Ao analisarmos a-
os alunos das trs n.b -~

p e los desvios padres., cr ~

notas relativamente ~

B foram as que se P-~

s2= =2:'--(x_- x_)


n- l

O desvio padro fornece ~---"WI


dos valores.

onde ~ (x - x) a soma dos desvios quadrticos. Em relao ao conjunto


de notas da Turma A, a varincia

s 2 = 4+1+1 +0 +0+1+1+4 =l 71
8 -1

'

Como a varincia de um conjunto de dados calculada em funo


dos desvios quadrticos, sua unidade de medida equivale unidade de
medida dos dados ao quadrado. Nesse contexto, mais comum
trabalhar com a raiz quadrada positiva da varincia. Esta medida
conhecida como desvio padro, o qual expresso na mes ma unidade de
medida dos dados em anlise . Ento, o desvio padro de um conjunto de
valores pode ser calculado por:

s ~ /L(x - xj
n- l

ExERCcios
1)

2) Admita que todos cs ~I


Qual o valor da m~

3) A tabela seguinte ::padres das taxas _..


microrregies cata:: tabela?

Em termos do conjunto de notas da Turma A, temos o seguinte


desvio padro: S = .J1,71=1,31.
Ao compararmos os desvios padres de vrios conjuntos de dados,
podemos avaliar quais dados se distribuem de forma mais (ou menos)
dispersa. O desvio padro ser sempre no negativo e ser to maior
quanto mais dispersos forem os valores em anlise . A Tabela 6.2 mostra
o desvio padro das notas de cada uma das trs turmas de alunos,
referente aos dados do Exemplo 6.1.
Tabela 6.2 Medidas descritivas das notas finais dos alunos de trs turmas.
Turma
A

e
2

Nmero de alunos
8
8
7

Mdia
6 ,00
6,00
6 ,00

6.2 FRMulAs pAs:-

Desvio E_adro

1,31
3,51
2L69

Muitos autores costumam diferenciar a frmula da varincia quando os dados se referem


a uma populao ou a uma amostra. Quando os dados representam uma populao de N
elementos, a varincia definida com o denominador N. Quando os dados se referem a
uma amostra de n elementos devemos usar o denominador n- 1. Por simplicidade, vamos
considerar sempre o segundo caso.

um valor fracio n..-:.:;


arredondamento, que?
este inconveniente , pn::~
3

Observe, pela Figura 6. ! -r-turma A. Porm, o valor ~


Se o valor discrepante fas!C
o menor de todos - a me:..it

~d.\ s Ci\ Cl1\S SociAis

ir--=::=::xc;a -amos calcular esta


_... - - Assim, definimos

95

CApfrulo 6 - MEdidAs dEsCRiriv,,s

Ao analisarmos a Tabela 6.2, verificamos, atravs das mdias, que


os alunos das trs turmas tenderam a ter as notas em tomo de seis, mas,
pelos desvios padres, conclumos que os alunos da Turma A obtiveram
notas relativamente prximas umas das outras, quando comparados aos
alunos das outras turmas. Por outro lado, as notas dos alunos da Turma
B foram as que se a presentaram mais heterogneas. 3
O desvio padro fornece informao sobre a disperso (varincia ou heterogeneidade)
dos valores.

ca:culada em funo
- -- =:::\ale unidade de
----=r.
.....o. mais comum
-_: ria Esta medida
---~=.a ::nesma unidade de

-- temos o seguinte

Exrnccios
1)

Faa os clculos dos desvios padres das notas dos alunos das turmas B e C
(Tabela 6 . 1). Verifique se os resultados conferem com os apresentados na
Tabela 6 .2 .

2)

Admita que todos os alunos de uma Turma D obtiveram notas iguas a sete.
QuaI o valor da mdia aritmtica? E qual o valor do desvio padro?

3)

A tabela seguinte mostra os resultados dos clculos das mdias e desvios


padres das taxas de crescimento demogrfico dos municpios de duas
microrregies catarinenses. Quais as concluses que voc pode tirar desta
tabela?

Medidas descritivas das taxas de crescimento demogrfico de


duas microrregies de Santa Catarina, 1970-80.
Microrregio

e ser to maior
~~......_.-~Tabela 6.2 mostra
-....-.-~ ~

S errana
Litoral de Itaja

Na de
municpios
12
8

6.2 FRMulAs pARA o clculo dE X


Desvio padro
1,31
3,51
2 ,69

-0,36

Desvio
padro
0,67

3,55

2,47

Mdia

ES

"

Ao calcular o desvio padro nos casos ~m que a mdia, . X, 'acusar


um valor fracionrio, os desvios, X -X, acumularo erro s de
arredondamento, que podero comprometer o resultado final . Para evitar
este inconveniente, podemos usar a seguinte frmu la para o clculo do
Observe, pela Figura 6.1, que as notas da turma Cesto mais concentradas do que as da
turma A. Porm, o valor discrepante, alm de deslocar a mdia, aumenta o desvio padro.
Se o valor discrepante fosse desconsiderado, o desvio padro das notas da turma e seria
o menor de todos - a mdia seria 7 e o desvio pa<l;o 0,55. ,

96

F<;Tl\T<;rirn AplicAcJA ~ Ci~NCiAs SociAis

CA[)irulo 6 - MEdidAS cJp.,(j

desvio padro, que matematicamente equivalente quela apresentada


no tpico anterior:

A Tabela 6 .3 =-41<=
mdia e do desvio pae:-.

s=/Ix'-nX'
n-1

Tabela 6.3 Clculos;;; "

onde: LX 2 a soma dos valores quadrticos;


X 2 a mdia elevada ao quadrado; e
n o nmero de valores.

Not.aX
4

Ilustraremos o uso desta nova formulao com as notas obtidas


pelos alunos da Turma A (Exemplo 6.1) .

8
Total

Valores (notas)

X: 4

~1

6
7

~X = ~eX = ~

Valores ao quadrado X2 : 16 25 25 36 36 49 49 64 ( LX2 = 300)

Assim,

= d.8

8 =

Assim,
2

S=,J300 -8(6)
1

=~300-288 = {12 = l 31
1

existirem muitas rey:-,

V7 '

Como era de se esperar, chegamos ao mesmo resultado .encontrado


anteriormente .
PoNdERANdo pEIAs fREOUNciAs

Outro aspecto relativo ao clculo da mdia e do desvio padro referese soma de valores repetidos. Por exemplo, ao calcularmos a mdia das
notas da Turma A, fizemos a seguinte soma:

LX =

4 + 5 + 5 + 6 + 6 + 7 + 7 + 8,

que equivalente a: 4 x 1 + 5 x 2 + 6 x 2 + 7 x 2 + 8 x 1 =
(X f)
onde consideramos apenas os valores distintos de X e ponderamos pelas
respectivas frequncias, f Analogamente, podemos calcular a soma
quadrtica dos valores de X por

2: (x 2 !)=4 2 +5 2 x 2 + 6 2 x2+72 x 2+8 2 =


Com esta nova notao, as formulaes de mdia e desvio padro
so apresentadas a seguir.

x = =I=---(x_. !_)
n

s = fI (x2 I )- n . x

n- 1

somente podero ser~


de cada classe para --~="'!,..---1
(veja Exemplo 6.2).'"

ExEMplo 6.2 Clculo a.~~


alfabetizao, relati..-os 2.
ano 2000.
Classes da taxa de
alfabetizao

40 l- 50
50 l- 60
601- 70

70 l- 80
801-90
901-100
Total

::.

Ao buscarmos dados em Ca;;;::;:;:


cm distribuies de frequ!:=
forma aproximada.

-.:ilic~dA ~ CiNCiAs SociAis

CAprulo

6-

97

M EdidAs dEsCRi1ivA~

A Tabela 6 .3 mostra a sequncia de clculos para a obteno da


mdia e do desvio padro, usando as notas finais dos alunos da Turma A.
Tabela 6.3 Clculos auxiliares para a obteno de

8
Total

1
8

64

48

300

5
6

~ ~ (LX 2 = 300)

-- -

:: = ~ ,31

Xj
10
12
14

(LX =48eX =6)

S.

Frequncia!
1
2
2
2

Nota X

Xe

48
Assim X = - =6

'

S = ~300 - 8 (6)2
7

16
50
72
98

= 131

'

Os clculos usando as frequncias facilitam bastante quando


existirem muitas repeties de valores.

DAdos qRupAdos EM clAssEs


~

::..:: esrio padro refere- -:!larmos a mdia das


- - - - S.

-= ~ (X J)
- ;~e ponderamos pelas
: - s calcular a soma
~-82 =
-~a

Quando os dados esto grupados em classes, os clculos de X e S


somente podero ser feitos de forma aproximada, usando o ponto mdio
de cada classe para representar os valores que ocorreram nessa classe
(veja Exemplo 6 .2). 4

ExEMplo 6.2 Clculo aproximado de X e S dos valores da taxa de


alfabetizao, relativos a uma amostra aleatria de municpios brasileiros,
ano 2000.
Classes da taxa de
a lfabetizao
40 l- 50
501- 60
. 60 1- 70
70 l- 80
80 1-90
901-100
Total

Ponto
mdio X
45
55
65
75
85
95
-

Frequncia
de municpios f
1
5
8
6
12
8
40

Xf

X2f

45
275
520
450
1.020
760
3.070

2 .025
15.125
33.800
33.750
86.700
72.200
243.600

e desvio padro
Ao buscarmos dados em fontes secundrias, muitas ~ezes j os encontramos grupados
em distribuies de frequncias, donde os clculos de X e S soment e podero ser feitos de
forma aproximada .

98

EsTATsTICA Aplir.AdA s CitNCiAs Soc:IAis

Donde:5

X=40 =76,75

3.070

n-1

MEdid~

Exrnccios

s = ,/ 243.600 -(40) . (76,75)2 = 14 30

CAprulo 6 -

Dado o seguinte
a) a mdia e
b) o desvio padro
5) Calcule a1efut e 1
4)

'

---

Distribllit 2
famlias do Ci

MdiA poNdrnAdA

O clculo da mdia e do desvio padreio com ponderao pela


frequncia um caso particular de mdia e desvio padro ponderados.
Em geral, a ponderao feita sempre que preci~amos dar mais
importncia a um caso do que a outro. Por exemplo, a mdia aritmtica
simples dos valores do ndice de Desenvolvimento Humano (IDH) dos
municpios da Microrregio da Grande Florianpolis, embora seja um
valor central .do IDH desses municpios, no corresponde ao IDH da
Microrregfao, porque temos municpios mais importantes (mais populosos)
que ou tros. Para se ter o IDH da Grande Florianpolis, precisamos
ponderar pela populao do municpio, como segue:
Municpio

Antnio Carlos
Biguau
Florianpolis
Governador Celso Ramos
Palhoa
Paulo Lopes
Santo Amaro da Imperatriz
So Jos
So Pedro de Alcntara
Soma

Mdia simples:

Populao p
6.434
48.077
342.3 15
11.598
102.742
5.924
15.708
173.559
3 .584
709 .941

IDHX

Xp

0,83
0,82
0,88
0,79
0,82
0,76
0,84
0,85
0,80
7,37

5 .320,9
39.327,0
299.525,6
9 .162,4
83.837,5
4.496,3
13.24 1,8
14 .7351 ,6
2 .849,3
605.112,5

2
3
4
5
6

7
8

6) Faa um histogra::.;:
indique o valor da
7) Considerando os
padro dos valores
considerando:
a) os dados do .a.-.
b) a tabela de distr.;
anterior (cl~:;
8) Sejam os dados d
a) Calcule as mc...::.
do questionr?.
b) Apresente os:
c) Interprete , ccCaptulo 2 ).
9)

X = LX= 7 37 = 0,82
n

__ L (Xp) =6os. 112,s=


Mdia ponderada: XP -

da

Lp

709. 941

085
'

Se tivssemos feito os clculos diretamente com os 40 valores da taxa de alfabetizao (ver


captulo anterior), encontraramos X 76,89 e S = 13,4 1.

6.7 MEdidAs b~sEA mdia e o des--:


a posio central e ;:,
essas medidas so fo;-- '"":li

apl: AdA s C iNCiAs SociAis

99

CAprulo 6 - MEdidAs dFsCRiTiVAS

ExERccios
4)

5)

Tamanho da familia Frequ ncia de famlias

ponderao pela
padro ponderados.
-~i $amos dr mais
---~ -

a mdia aritmtica

-=

Humano (IDH) dos


- ~s . embora seja um
~sponde ao IDH da
~~s (mais populosos)
--:-polis, precisamos

6)
7)

Xp
5.320,9
39.327,0
299.525,6
9.162,4
83.837,5
4.496,3
13.241,8
14.7351,6
2.849,3
605.112,5

Dado o seguinte conjunto de dados: {7, 8, 6, 10, 5, 9, 4, 12, 7, 8}, calcule:


a) a mdia e
b) o desvio padro
.
___...,_
Calcule a mdia e o desvio padro da seguinte distribuio de frequncias:
Distribuio de frequncias do tamanho da familia, numa amostra de 40
famlias do Conjunto Residencial Monte Verde, Florianpolis, SC, 1988.
Percentagem de famlias

2
3
4

3
6
13

5
6

11
4

2 ,5
7,5
15,0
32,5
27, 5
10,0

5,0

o.o

Faa um histograma para a distribuio de frequncias do Exemplo 6.2 e


indique o valor da mdia aritmtica no grfico.
Considerando os dados do anexo do Captulo 2, obtenha a mdia e o desvio
padro dos valores do ndice de desempenho do aluno (item 5 do questionrio),
considerando :
a) os dados do anexo do Captulo 2 (clculo exato);
b) a tabela de distribuio de frequncias construida no Exerccio 5 do captulo
anterior (clculo aproximado).

8) Sejam os dados do anexo do Captulo 2.


a) Calcule as mdias e os desvios padres das respostas dos itens 3(a) a 3(g)
do questionrio.
b) Apresente os resultados numa tabela.
c) Interprete, considerando os objetivos 1 e 3 da p esquisa (Seo 2.4,
Captulo 2).
9) Sejam os dados do anexo do Captulo 4 .
a) Calcule a renda familiar m dia em cada uma das trs localidades.
b) Calcule o desvio padro da renda familiar em cada localidade.
c) Apresente esses resultados numa tabela.
d) O que voc pode concluir a partir desses resultados?

6.7 MEdidAs bAsEAdAs NA oRdENAO dos dAdos


A mdia e o desvio padro so as medidas mais usadas para avaliar
a posio central e a disperso de um conjunto de valores. Contudo,
essas medidas so fortemente influenciadas por valores discrepantes. Por

100

EsTATs1iCA ,,pltc"dA S

Ci~i'>C:i11s

SociAis

CApiulo 6 - MHli<lAs dea:=:.


/''

exemplo, nas notas da Turma C (Exe mplo 6.1), o valor discrepante O (zero)
puxa a mdia para baixo, como ilustra a Figura 6 .2. Apesar de a mdia
aritmtica ser 6 (seis), o diagrama de pontos sugere que o valor 7 (sete)
seja um valor mais tpico para representar as notas da turma, pois, alm
de ser o valor mais frequente, ele o valor do meio, deixando metade das
notas abaixo dele e nietade acima.
/

valor
discrepante

9o

~8

notas

b) {5; 3,lf, 8 , -

Ordenando
c) {3, 5, 6, 7 , 1r-

A Figura6.3 =:
de pontos. Note que
mediana.

mdia
Figura 6.2 A influncia de um valor discrepante no clculo da mdia
aritmtica.

Nesta seo apresentaremos algumas medidas que so menos


afetadas por valores discrepantes e, em consequncia, so mais
recomendadas para a anlise de dados que possam conter valores
discrepantes.

AmdiANA
A mediana avalia o centro de u m conjunto de valores, sob o critrio de
ser o valor que divide a distribuio ao meio, deixando os 50% menores
valores de um lado e os 50% maiores valores do outro lado. Por exemplo, o
conjunto de valores {2, 3, 4, 5, 8} tem como mediana o valor 4 (quatro},
porque a quantidade de valores com magnitude inferior a 4 a mesma do
que a quantidade de valores com magnitude superior a 4. Mais precisamente :
Dado um conjunto de n valores, definimos mediana como o valor, Md, que ocupa a
posio 1 , considerando os dados ordenados crescente ou decrescentemente. Se
mediana "; 1 for fracionrio, toma-se como mediana a mdia dos dois valores de posies mais
prximas a ";1 .

n;

ExEMplos:
a) Conjunto de notas da Turma C: {O; 6; 7 ; I; 7; 7,5 1,5}
~

posio: -

+1
2

- =4

-+ Md = 7.

A Figura 6.distribuies con: ,. .


No primeiro caso.
as sim tricas , a mc..:n

mdi2 :

Figura 6.4 Posi~


distribuio.

Em geral, d2"" _
cen tral mais adecr~~
como uma alterna~ ...

...d,. >.s

CiNCl/\s SociAi~

,.._ ,;.screpante O (zero)


- Aresar de a mdia
___ q--..ie o valor 7 (sete)
e.a LUrma, pois, alm
- -=-z,2ndo metade das

101

C/\pTUlO 6 - MEdidAS dtSCRiTiVAS

n +1

b) {5 , 3, 2, 8, 4}

Ordenando: 2, 3, 1_, 5, 8

posio: -

- =3

Md = 4 .

n+l

6 +7

c) {3, 5, 6, 7, 10, 11} ~posio : -

- = 3,5 (3"e 4) ~ Md= -

- = 6,5

COMPARAO ENTRE 1\1diA E 111EdiA\A

A Figura 6.3 mostra os valores da mdia e da mediana num diagrama


de pontos. Note que o valor discrepante 62 puxa mais a mdia do que a
mediana.
50% dos valores ---<11---+~ 50% dos valores

o
so menos
~-;,:ncia, so mais
--::ssa:n conter valores

os 50% menores
:::::>'lado. Por exemplo, o
::z:.a o valor 4 (quatro),
~a4 a mesma do
- ~lais precisamente:

cxpBoMo&BI a, 88 1
10
2~~30
40
Md = 22,5

50

60

70

= 24,7

Figura 6.3 Posio da mdia e da mediana no diagrama de pontos das taxas de


mortalidade infantil dos municipios da Microrregio Oeste de Santa Catarina, 1982.

A Figura 6.4 mostra as posie s da mdia e da mediana em


" distribuies com diferentes formas: uma simtrica e outra assimtrica.
No primeiro caso, a m dia e a mediana so iguias. Em distribuies
assimtricas, a mdia tende a se deslocar para o lado da cauda mais longa.

:::-;::;:::::::::D

2m, Ma, que ocupa a


Se

~escentemente.

(b) Distribuio
assimtrica

mdia mediana

mediana

mdiH

Figura 6.4 Posies da mdia e mediana, segundo a forma (simtrica ou assimtrica) da


distribuio.

- -: 1,5 7,5}

Em geral, dado um conjunto de valores, a mdia a medida de posio


central mais adequada, quando se supe que estes valores tenham uma
distribuio razoavelmente simtrica, enquanto a mediana surge
como uma alternativa para representar a posio central em distribuies
ento a mediana para casos muito assimtricos

102

E~ 1 ArsriCA Apl icAdA ~ CiNc~s SoclAi~

muito assimtricas.6 Muitas vezes, calculam-se ambas as medidas para


avaliar a pos io central sob dois enfoques diferentes, como tambm para
se ter uma primeira avaliao sobre a assimetria da distribuio.

CApfru lo

6-

MEdidAs d~

superior, Q,./ Se a =-..__-=t


vamos convencioc.a: ~

ExEMplos:

OuARTis EEXTREMOS

a) Dados: 2, O, 5. - , -

Na maioria dos casos prticos, o pesquisador tem interesse em


conhecer outros aspectos relativos ao conjunto de valores, alm de u m
valor central, ou valor tpico. Algumas informaes relevantes podem ser
obtidas .atravs do conjunto de medidas: mediana, extremos e quartis,
como veremos a seguir.
Chamamos de extremo inferior, E1 , ao menor valor dos dados em
anlise . De extremo superior, E5 , ao maior valor. Por exemplo, dado o
conjunto de valores {5, 3 , 6, 11, 7}, temos E 1 = 3 e E 5 = 11.
Chamamos de primeiro quartil ou quartil inferior, Ql' ao valor que
delimita os 25% menores valores. De terceiro quartil ou quartil superior,
Q5 , o valor que separa os 25% maiores valores. O segundo quartil, ou
quartil do meio, a prpria mediana, que separa os 50% menores dos
50% maiores valores. Veja a Figura 6.5.

Ordenando:

b) Dados (j orde--2"'

ExEMplo 6J Obter.~
s taxas de alfabe-5 .:

Md

(20)
(20)
(13)

Qs

Figura 6.5 Os quartis dividem a distribuio em quatro partes iguais.

Dado um conjunto de valores ordenados, podemos obter, de forma


aproximada, o quartil inferior, Qr como a mediana dos valores de posies
menores ou iguais posio da m ediana. A m ediana dos valores de
posies maiores ou iguais posio da mediana corresponde ao quartil
6

(2)
(6)
(9)
(14)
(17)

25%

Q1

(1)

Mesmo para variveis que supostamente tenham distribuies razoavelmente simtricas,


a mdia e a mediana podem no se igualar, porque, em geral, estamos observando apenas
alguns valores (amostras) dessas variveis. Para variveis com distribuies razoavelmente
simtricas , a mdia a medida de posio central mais adequada, porque usa o mximo
de informaes dos dados. A mdia calculada usando a magnitude dos valores, enquanto
a mediana u tiliza somente a ordenao dos valores.

(8)
(3)

n = 40

5
6 -

6 557

x==

7
8.;,..
8
9

9 555

-+ posio: - -

Dado um conjunto :r
partes iguais. O ~I
satisfatria quancio
s No ra111D-e-folhas.,
frequncias acum~
centro (mediana) .a ,..:.i::;:=" ~
da m ediana e~~

""' ~ s Cifl\clA~ SoclAls

10~

CAprulo 6 - MFdidAs descRiTivAs

superior, Qs 7 Se a mediana coincidir com u m valor do conjunto de valores ,


vamos convencionar e m consider-la tanto no cmpu to de Q1 com o de Qs

ExEMplos:
a) Dados: 2, O, 5, 7, 9, 1, 3, 4, 6, 8 .
-""""'~~ ~em

interesse em
- ra.ores, alm de um
--~ ~_e~antes podem ser
- - - extremos e quartis,

Ordenando:

~or
~=-

dos dados em
exemplo, dado o

Q,, ao valor que


ou quartil superior ,
- segundo quartil, ou

b) Dados (j orde nados):

a-::-~-

~-~

- s: 50% menores dos

1 Q,= 1 /

(2)
(6)

(9)
(14)

(17)
(20)
(20)
(13)
(8 )
(3 )

----- '-alores de posies


.c:~a dos valores de
-esponde ao quartil
~elmente simtricas,
cs:z:::;os observando apenas

J:::5i::lbuies razoavelmente
:::;;;::;;::;..:'..;"":.. porque usa o mximo
--~-dos valores,

enquanto

s '5 s
1

""!s

10

\ 1Qs=7,51

ExEMplo 6J Obteno d a mediana num ramo-e-folhas: valores referentes


s taxas de alfabetizao de quarenta municpios brasileiros , ano 2000.8
(1)

::r-os obter, de forma

n = 40

4 5
5 4
5 7789
6 444

6 56789
7 123
7 56Z
8 11 12344
8 56789
9 01244

9 555

Unidade= 1
415 = 45

~posio : n + 1 =20,5
2

(20 e 21")

Md =

77 + 81
= 79.
2

Dado u m conjunto de valores, nem sempre conseguimos dividi-lo exatamente em quatro


partes iguais. O procedimento exposto oferece uma soluo aproximada, m as bastante
satisfatria quando a quantidade de valores for grande e com poucas repeties .
No ramo-e-folhas, con strudo na seo 5.7, inclumos uma coluna esquerda com as
frequncias acumuladas. Essas frequncias foram acumuladas das extremida des at o
centro (mediana) da distribuio, o que facilita a contagem das frequncias p ara a obteno
da mediana e quartis.

104

Es1111sricA AplicAdA s Ci~i\il\~ SociAis

Para os quartis: n' = 20

~ posio

10,5 (lO"e 11") . Da:

CAprulo 6 - MEdidAs dESa::::_

O desvio en~ ...,,


uma medida de di~
a distrib uio, m aie7

Q1 = 65,5 e Q8 = 87,5.

Podem os considerar o valor Md = 79 como o valor tpico das taxas de


alfab e tiza o dos quarenta municpios em e s tudo, pois meta de dos
municpios a cu sa taxa de a lfabetizao inferior a 79 e a outra metade
tem nveis mais elevados de alfabetizao. Com os quartis , pode mos dizer
que os 50% dos municpios mais tpicos, em termos de alfabetiz ao,
a cusam taxas variando de 65,5 a 87 ,5. Podemos dizer, tambm, que 2 5%
desse s municpios tm taxas de alfabetizao no superiores a 6 5,5;
enquanto 25% de m unicpios tm taxas iguais ou su periores a 8 7,5.

os valore s dos q:!~


distribuies simL:"
igual distncia e=::::=
distribuies assi"!"'"'~C
verificar se existe a:..:._
do que (1,5)d0 do~
d =

Q,-

EsouEMAdEciNco NMrnos
O esquema de cinco nmeros uma forma de apre sentao da
mediana, quartis e extremos, como mostramos ao lado~ Atravs des ses
cinco n me ros podemos ter informaes sobre
n = 40
a posio central, disperso e assimetria da M
79
dis t ribuio de fre qu ncias, como ilustra a
d
8 7,5
Figura 6.6.
Q j65,5
E l 45

95

ExEMplo 6.4 Com o e"...


em duas localidru:3.
cinco nmeros pa:: ...
fazem parte do al:e:;:::;:

Conj. Res. Me:-.-=

Et

Q1

Md

Qs
)

Es

dg
25%

E1

Q1 Md Qs

Es

----==----

25%

E1

Q1

~<

Md

)(

Qs

Es

)~~~~~~

Figura 6.6 Posies da mediana, quartis e extremos em distribuies diferentes


quanto disperso e assime tria.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

1
1446
9
168
11588
8
12577
4469
6
3349

u_,__

25999
Md

Q-

--

E - -

tpliLldA .h Ci:...clAS SociAis

- .... <pico das taxas de


--~-

pois metade dos

-g e a outra metade

_a_Li.s, podemos dizer


----..:>s de alfabetizao,
~~ ~bm,

que 25%
s11periores a 65,5 ;
S-,?eriores a 87,5.

105

C..pf11,lo 6 - M edidA~ dcscRirivAs

O desvio entre quartis, d 0 = Q5 - Q,, muitas vezes usado como


uma medida de disperso. Veja na Figura 6.6 que, quanto mais dispersa
a distribu io, maior ser o valor de d 0 . Em distribuie s mais dispersas,
os valores dos quartis (e dos extremos) ficam mais distantes. Em
distribuies simtricas, a distncia entre o quartil inferior e a mediana
igual distncia entre a mediana e o quartil superior, enquanto que em
distribuies assimtricas isto no acontece.
Uma regra muitas vezes usada para detectar valores -discrepantes
verificar se existe algum valor do conjunto de dados que. se afasta mais
do que (1,5)d0 do quartil superior (ou inferior). No Exemplo 6.3, tem<1>s:
dQ= Q5 - Q, = 87,5- 65,5

22

Q1 - (l,5)dQ = 65,5 - (l,5)(22) = 32,5


Q5 + (l,5)d 0 = 87,5 + (l,5)(22)

---==. C.e a presentao da


taco. At:ravs desses
n = 40
79
87,5

95

= 120,5

Como nenhum valor est fora do intervalo (32,5; 120,5), no temos


valor suspeito de ser discrepan te.

ExEMplo 6. 4 Com o objetivo de comparar as distribuies da renda familiar


em duas localidades, construmos um ramo-e-folha.s e um esquema de
cinco n meros para cada localidade, corno mostramos a seguir. Os dados
fazem parte do anexo do Capitulo 4 .
Renda familiar mensal em quantidade de salrios mnimos
Encosta do Morro

Conj. Res. Monte Verde

Es

Es
)'

-...:; :::es diferentes

1446
9
168
11 588
8
12577
4469
6
3349

3
4
5
6
7
8
9
10
11
12
13
14

Unidade = 0,1
111 = 1,l
Discrepantes:
1816 e 191 3

n = 40

25999

15 4

2
3
4
5
6
7

19
38
123367889
599999
2 2 4569
188
4
19
Discrepan tes :
11 11, 11 l 4 , 13 19 e 25 17

Mc1.
Q 4,95
E 1,1

n = 37

7,7
10,35
19,3

Md
Q 2,7
E 0,1

3,9
5,1
25,7

106

Esrruis1icA AplicAdA s CiNCiAs SoclAIS

Notamos, inicialmente, que o nvel de renda no Conjunto Residencial


Monte Verde (mediana de 7 ,7 salrios mnimos} maior do que na Encosta
do Morro (mediana de 3,9 salrios mnimos) . No Monte Verde, 50% das
familias mais tpicas, em termos de renda, esto na faixa de 4,95 a 10,35
salrios mnimos mensais; j na Encosta do Morro, as rendas familiares
esto na faixa de 2,7 a 5, 1 salrios mnimos mensais.
A distribuio de renda na Encosta do Morro mais concentrada
em torno de um valor tpico. Esta caracterstica pode ser observada pelo
desvio entre os quartis, d< que menor na Encosta do Morro do que no
Monte Verde. O desvio entre extremos maior na Encosta do Morro, mas
tal desVio deve ser observado com cautela, pois em ambas as distribuies
os extremos superiores so valores discrepantes em relao maioria
dos outros valores.
As duas distribuies so razoavelmente simtricas, quando
observadas prximas de suas medianas, pois, em ambas as distribuies,
as distncias entre Q1 e Md so prximas das distncias entre Mtf e Q!'r
Contudo, fora do intervalo entre os quartis temos uma cauda mais longa
do lado direito, mostrando que existem algumas poucas famlias com
renda relativamente alta em relao ao tpico destas localidades. O valor
O, 1 salrios mnimos, que aparece no extremo inferior da distribuio da
Encosta do Morro, apesar de no ser um valor discrepante em termos
estatsticos, um valor estranho de renda familiar. Provavelmente tenha
sido coletado erroneamente e deveria passar por uma verificao.

CAprulo b - M cdldAS cea.,.. __

A Figura 6.8 ~-"


em caixas para u=a ""'
para uma distrib-..
diferenas e imagi.~'"
em caixas se tivsse=:
dispersa.

caixas das duas .. s=-Exemplo 6.4. Com?<'--s


os ramos-e-folhas.....::

Figura 6.i ;-_____.

DiAqRAMA EM CAiXAS

Renda

Uma maneira de apresentar aspectos relevantes de uma


distribuio de frequn cias atravs do chamado diagrama em caixas
ou desenho esquemtico. Traamos dois retngulos: um representando
o espao entre o quartil inferior e a mediana, e o outro entre a mediana
e o quartil superior. Esses retngulos, em conjunto, representam a faixa
dos 50% dos valores mais tpicos da distribuio. Entre os quartis e os
extremos traamos uma linha. Caso existam valore s discrepantes
[valores inferiores a Q1 - l ,SdQ ou superiores a Q5 + 1,SdQJ, a linha
traada at o ltimo valor no discrepante; e os valores discrepantes
so indicados por pontos (veja a Figura 6.7).

familiar
(sal. mi

QC,\cf.\ s Ci 'KiAs SociAis

___ mjunto Residencial


xr do que na Encosta
::te Verde, 50% das
:21."""ta de 4,95 a 10,35

mais concentrada
- ser observada pelo
.o Morro do que no
!:..l::.~sta do Morro, mas
-Oa.s a s distribuies
-'--~.... ei= relao maioria
~-

s-...mtricas , quando
_-.aras as distribuies,
-:::las entre Md e Os
- a cauda mais longa
iXl ....cas famlias com
~ .ocalidades. O valor
:- da distribuio da
:::::srepante em termos
?:-o:avelmente tenha

107

CAprulo 6 - MEdid1\S drscRlrlvAs

A Figura 6.8 mostra a forma do diagrama


em caixas para uma distribuio simtrica e
para uma distribuio assimtrica. Note as
diferenas e imagine como ficaria um diagrama
em caixas se tivssemos uma distribuio mais
dispersa.
A Figura 6. 9 apresenta os

diagramas em

em caixas

~m representando
--o entre a mediana
;-epresentam a faixa
Enrre os quartis e os
..::....o:-es discrepantes
- ~.5 dJ, a linha
-aores discrepantes

O.

.... o

----

dQ
l A

--
QJ ......................

Exemplo 6.4. Compare esta representao com


os ramos-e-folhas vistos anteriormente.

E1 --

Figura 6.7 Esquema para construo de um diagrama em


caixas.

-rnFigura 6.8 Diagrama em caixas e a forma da distribuio.

28

~-~- ~rama

(l,S)i

caixas das duas distribuies de renda do

Renda

-e.e\antes de uma

Es

familiar

(sal. mn.)

23 -- - -- ---- -- -- 18

- -- -

__ __ ___ _ _

13

Monte
Verde

Encosta
do Morro

Figura 6.9 Representao em diagramas em caixas das distribuies


de renda do Exemplo 6.4.

108

EsrArsriCA ApliCl\dA s Cil\Cil\~ Soci,,.is

6.4

Uso do coMpuTAdoR
Em geral, nos p acotes computacionais de estatstica, ou mesmo em
planilhas eletrnicas, bastante simples obter um conjunto de medidas
descritivas dos valores de uma varivel quantitativa. A Figura 6.1 Oapresenta
medidas descritivas da renda, em salrios mnimos, de u ma amostra de
famlias de um bairro de Florianpolis (anexo do Capitulo 4). As medidas
descritivas foram obtidas atravs da planilha eletrnica Excel. Ao lado
apresentado o histograma de frequncias para facilitar a interpretao. 9
Renda
<>....-~~~~~~~~~~~~~~~~~~

Media
Erro padro
Mediana
Moda
Desvio padro
Varincia da amostra
Curtose
Assimetria
Intervalo
Mnimo
Mximo
Soma
Contagem

6 ,34
0 ,37
5,40
3,90
4,03
16,26
4,55
1,71
25,60
0,10
25,70
754,50
119

3S
30

~
8

"

CAprdo 6

MFdicW;

RiENTAC~: ..,
~

inicialmente, cons~____.,
varivel, verificant.1
discrepantes, etc. t
Lembramos que a
dependem do tipo
Numa fase s
(associaes ou
mentos tamb!I! d.e

-e:

25
20

~ 15
E

10

or

10

12

t==
1

1e

,,

20

22

===

2~

2t

Re nd3 (-e-slano!. m(nimos}

l u~~

Figura 6.10 Medidas descritivas calculadas com o auxlio do Excelt e um histograma

feito com apoio do STATISTICA't..

Em termos de posio central, temos a mdia, a mediana e a moda.


Esta ltima medida apresenta o valor mais frequente do conjunto de dados.
O fato de a mdia apresentar um valor maior que a mediana e a moda
s ugere uma distribuio assimtrica, com cauda mais longa para o lado
direito, o que confirmado pelo grfico. Alis, na lista de medidas, aparece
o chamado coeficiente de assimetria, com valor igual a 1,73. Em distribuies
simtricas esse coeficiente se aproxima de zero. Coeficiente de assimetria
positivo (especialmente quando superior unidade) indica cauda mais
longa para o lado direito. Por outro lado, quando negativo (especialmente
quando inferior a-1 ), indica cauda mais longa para o lado esquerdo.
A medida erro padro ser apresentada no Captulo 9. A curtose
pouco u sada e, por isso, no ser discutida neste texto. O intervalo ou
amplitude outra medida de disperso , definida como a distncia entre
os dois valores extremos; e a contagem o nmero (n) de valores usados
no clculo das medidas descritivas.

Anli~

bivarie.~--+

_.

Exrnccios
10) Calcule a mea'"":::.

Sobre o u so do Excel, ver Excel.docemwww.inf.ufsc.br / -barbetta/ livrol.htm. O histograma


foi construdo com o apoio do STATISTICACll). Ver www.statsoft.com.br.

,j a) {15, 9, 7, 2C
b) {~. ~ \7, Lc,

c ,wwlo 6 -

6.4

109

MEdidA5 dE5CRiTiVAS

RiENTAO PARA ANlisE EXplRATRiA dE dAdos

.._-::~rica,

ou mesmo em
de medidas
?".:gura 6 .10 apresenta
~ uma amostra de
~:lllo 4) . As medidas
::::=:a Excel. Ao lado
~---....-,_ a interpretao. 9
_

~::junto

Na anlise exploratria de grandes conjuntos de dados, comum,


inicialmente , construirmos uma distribuio de frequncias para cada
vari vel, verificando os valores ou categorias tpicas, possveis casos
discrepantes , etc. a descrio ou caracterizao dos dados e m estudo.
Lembramos que a construo da distribuio e a representao grfica
dependem do tipo de varivel em estudo, em termos do nvel de
mensurao (ver Figuras 6.11).
Numa fase seguinte , comum buscarmos possveis relaes
(associaes ou correlaes) entre as variveis em estudo. Os procedimentos tambm dependem do tipo das variveis (ver Figura 6.12).
Tabela
Distribuio
de frequncias
Varivel
qualitativa

Grfico d e
barras,
colunas ou
setores

Percentagens
Anlise
univariada
- ~ '1Ill

histograma

Distribuio
de frequncias
Varivel
quantitativa

1 Histograma 1
Ramo-e-folhas

Medidas descritivas
(mdia, desvio padro,
mediana, etc.)

a rtediana e a moda.
....: conjunto de dados.
~ =ediana e a moda

Figura 6.11 Esquema para anlise de cada varivel individualmente.

Uma varivel quantitativa


e outra qualitativa
Anlise
bivariada

.:-~vo

(especialmente
lado esquerdo .

Medidas descritivas da
varivel quantitativa em cada
categoria da qualitativa

1 Diagrama em caixas mltiplas 1

Duas variveis
qualitativas
Duas variveis
quantitativas

Tabela de contingncia
Diagrama de disperso (cap. 13)
Coeficiente de correlao (cap. 13)

Figura 6.12 Esquema para anlise entre pares de variveis.

de valores usados

Exrnccios
10) Calcule a mediana e os quartis dos seguintes dados:

--~~""'---~
~
~.,,.,o...,,I.,,..h,.,,tm..,..

=-br.

O histograma

a) {15, 9, 7 , 20, 18, 19, 23, 32,14, 10, 11}


b) {~, ~ ' \ 2Q,~~' 2-3., 32,14, 1'0~

'N.

110

EsrArsricA AplicAdA s CiNci.o.s Soei.o.is

11) Obtenha a mediana e os quartis da distribuio de frequncias do Exercicio 5


(Seo 6.2).

\]

J 12) Considere o anexo do Captulo 2:


'

a ) Obtenha a mediana, os quartis e eis extremos ds valores do lndice de


desempenho do aluno (item 5 do questionrio) e interprete. Sugesto:
apresente, inicialmente, os dados num ramo-e-folhas.
b) Comparando o valor da mediana com o valor que voc obteve para a mdia
aritmtica no Exerccio 7 (igual a 2,311), o que voc diria sobre a simetria
da distribuio desses valores?

CApruto 6 - M Edidl\s

da.>:

16) No Exemplo 6.1. ~

uma amostra e; ~-
municpios de n- ... :::_
interpretado co~ _

17) O grfico

seguT--~

dados do anexo :

13) A tabela abaixo mostra a distribuio de frequncias do nmero de filhos dos

pais de alunos da UFSC, considerando uma amostra de 212 estudantes,


entrevistados pelos alunos do Curso de Cincias Sociais, UFSC, 1990. Obtenha
os extremos, a mediana e os quartis.
~

N2 de filhos

frequncia

10

10 11 12

.:!

45 32 50 23 23

14) A tabela seguinte composta de medidas descritivas, calculadas a partir de

quatro conjuntos de valores, oriundos de uma amostra de 212 estudantes da


UFSC. Os e s tud antes foram indagados acerca do nmero de filhos que
p lanejam ter , do nmero de filhos de seus pais, do nmero de filhos de seus
avs matemos e do nmero de filhos de seus avs paternos.
Medidas
descritivas

nmero de filhos
dos avs
maternos
4,23
6,35
2,29
3,2 1
1
1
2
4
4
6
5
8
12
18

planejados

mdia
desvio padro
extremo inferior
quartil inferior
mediana
quartil superior
extremo superior

dos pais

2,06
1,26

o
1

2
2
12

dos avs
paternos
6,1 5

15) A figura seguinte apresenta cinco distribuies de frequncias representadas


por diagramas em caixas. So dados de presso ntraocular de uma amostra
de 243 indivduos, divididos em cinco grupos, segundo a condio clnica da

doena glaucoma.. Descreva as principais informaes oriundas desta anlise:

presso
intra-ocular

40

30

20

10

. 1 .

---------5
Grupo de indrviduos

boxplot

cida~

Cidade
A

Descreva um ~
dados da tabela.
19) Os dados abah;.:;

local de trabal":x:

1,a

2.s

o_.;

1,1
3,2
1,4

1,7
15,1
1,8

l ,:'
2,:
2 ,C

"""=--::;et
.~

a) Apresente ess...""!'
b) Na empresa 3~
funcionrios ........ -

-cb-- ~------

::~J:. ~ $--

em duas

1
4

Faa uma redao comparando os quatro conjuntos de valores, tomando por


base as medidas descritivas apresentadas na tabela.

50

18) Com o objetivo ce .-,--211

3,12

6
8
16

~
~

Mediana = 2,8
Extremo infeno. ~ .
Grupo 1: normais
Grupo 2: suspeitos
Grupo 3: doentes
Grupo 4: em tratamento
Grupo 5: operados

""

i)c.a , S CitNCiAS SOCIAIS

~~cias

do Exerccio 5

CAphulo 6

111

- V1Edid11s drsCRirivAs

Exrnccios coMpLEMENTARES
16) No Exemplo 6.2, calculamos a mdia aritmtica da taxa de alfabetizao de
uma amostra de municpios brasileiros. Se esses municpios fossem os
J
municpios de uma Unidade da Federao, o valor da mdia (76,75) poderia ser
interpretado como a taxa de alfabetizao dessa Unidade da Federao? Explique.
17) O grfico seguinte foi construdo com o auxlio da planilha Excel, a partir dos
dados do anexo do Capitulo 4 . Interprete.
Renda mdia das famlias usurias e no usurias de
programas de a limentao popular, por localidade

~~---

ce 21 2 estudantes,
1990. Obtenha

-~

_.;..:...,;>- ~7SC,

~
-~

'E
..,.

11 12

~ ~------------~
9

---------

.g
~

ca."'culadas a partir de
~~--"' -~ 212 estudantes da
.=--=iero de filhos que
-=::...=e:-o de filhos de seus

--

.!!?
.!!!

- ---------

P""--

o no usa

ousa
2

o ..__..___.__.._ _.._..___.__......___._,,__,
Monte Verde

Enco sta do
Morro

Pq <la Figueira

18) Com o objetivo de comparar a distribuio da renda familiar em duas cidades,

levantou-se a renda familiar de cada populao e calcularam-se algumas


medidas descritivas, apresentadas na tabela abaixo.
aternos
6, 15
3,12
1
4
6
8
16

~cias

representadas
de uma amostra
~ .:o condio clnica da
~--- cr-:-".Jldas desta anlise:
-~

Medidas descritivas da renda familiar, em quantidade de salrios mnimos,


em duas cidades.
Cidade

mdia

A
B

4,8
4,9

desvio
padro
3,2
6 ,2

quartil
inferior
3,4

3,0

4,9

quartil
superior
6 ,5

3,8

9,0

mediana

Descreva um texto observando as principais informaes verificadas nos


dados da tabela.
19) Os dados abaixo apresentam a distncia (em km) entre a residncia e o
local de trabalho dos funcionrios da empresa AAA.
1,8
1,1
3,2
1,4

2,5
1,7
15,l
1,8

0,4
1,2
2,1
2 ,0

1,9
2 ,3
1,4
l,l

4,4
1,9
0 ,5
1,0

2 ,2
0 ,8
0 ,9
0,8

3 ,5
1,5
1,7

0,2
1,7
0 ,5

0,9
1,4
0,8

1,4
2,1
3,7

a) Apresente esses dados em ramo-e-folhas.


b) Na empresa 888, a distncia (em km) at a residncia dos seus 300

funcionrios apresenta as seguintes medidas descritivas:


Mediana= 2,8
Quartil inferior= 1,6
Quartil superior = 4,2
Extremo inferior = O, 4
Extremo superior = 8,8
Quais as principais diferenas entre as empresas AAA e BBB em termos
da distncia entre a residncia e o local de trabalho dos funcionrios?

112

E~ 1 MsricA AplicAdA s CiNCiAs SociAis

20) Apresentam os, abaixo, algumas medidas descritivas d a distribuio d e


salrios , em R$, de trs empresas de um certo ramo.
Empresa

mdia

300
400
420

desvio
padro
100
180
350

extremo
inferior
100
100
100

quartil
inferior
200
250
230

quartil extremo
mediana superior sup_e rior
400
302
5 10
398
550
720
650
10.000
300

O que se pode dizer sobre a distribuio dos salrios nas trs empresas?
Quais as diferenas em termos da posio central, disperso e assimetria?
21) Dada a tabela abaixo, compare os quatro departamentos da UFSC quanto
aos escores de identidade social com o departamento. Quanto maior o escore,
identidade social mais elevada.

Me::::_

Medidas descritivas do nvel identidade social com o departamento.


Depto

Tamanho
da amostra
40
24
19

Mdia

Mediana

Eng. Mecnica
46,9
47,0
42,5
Arquitetura
40,8
Psicologia
42,5
44,0
Histria
21
38,4
39,0
Fome: Laboratrio de Psicologia Social (Depto de Psicologia/UFSC).

Desvio
padro
2, 1
5 ,9
5 ,4
5,4

COMO us~

s da d istribuio de

:-anil

extr emo
-:>erior s uperior
4()0
51 0
550
720
550
10.000

:laS trs empresa s?


::>e:-so e assimetria?

~s

d a UFSC quant o

-anto maior o escore,

Desvio
a dro

2 ,1
5 ,9
5 ,4
5 ,4

COMO USARMOdElos dE pRObAbilidAdE PARAENTEN dER MElHORos


fENM ENOS AlEATRiOS

( ApTUlO

ModElos pRobAbilsTicos
N

os captulos anteriores, procuramos entender uma varivel estudando


o comportamento de um conjunto de observaes (amostra) . Desta
forma, estudamos a distribuio de frequncias do uso (sim ou no) de
programas de alimentao popular, com base numa amostra de familias
da regio de interesse (Captulo 4). Nessa abordagem, predomina o raciocinio
indutivo: com base na organizao e descrio de dados observados,
procuramos fazer conjeturas sobre o universo (populao) em estudo .
Neste captulo, faremos o raciocnio de forma inversa, em que
procuraremos entender como podero ocorrer os resultados de uma
varivel, considerando certas suposies a respeito do problema em estudo
(raciocnio dedutivo). Exemplo: supondo que 60% das familias do bairro
usam programas de alimentao popular, o que se pode deduzir sobre a
percentagem de famlias que usam esses programas, numa amostra
aleatria simples de dez famlias?
A resposta a esta indagao no um simples nmero, pois,
dependendo das dez familias selecionadas na amostra, teremo ~ resultados
diferentes. Para responder adequadamente, precisamos apresentar quais
so os possveis resi:iltados e como eles podero ocorrer. Essa descrio
feita em termos dos chamados
modelos probabilsticos.

A Figura 7.1 faz um paralelo entre modelos probabilsticos e um mtodo de anlise


exploratria de dados, em
termos do tipo de raciocnio .

Hipteses, conjeturas, etc.

Modelos
probabilsticos

Distribuies
de frequncias

Resultados ou dados observados


Figura 7.1 Distribuies de frequncias e modelos
probabilsticos.

116

EsTArsricA AplicAdA .s CiNCiAs SociAis

7.l DEfiNiEs bsicAs


Os nwdelos probabilsticos so construdos a partir de certas hipteses ou conjeturas sobre o
problema em questo e constituem-se de duas partes: (1) dos possveis resultados e (2) de uma
certa lei que nos diz quo provvel cada resultado (ou grupos de resultados).

Seja o experimento de lanar uma moeda e observar a face voltada


para c~a. Os possveis resultados so cara e coroa. Se supusermos que
a moeda perfeitamente equilibrada, e se o lanamento for imparcial,
podemos tambm dizer que a probabilidade de ocorrer cara a mesma de
ocorrer coroa.

CApfw lo 7 - Mod~los ~

fj Numa escola d e e s
a sua altura. Co=.
precisa ser cons~ _
tal como Q = {x, ...::-

Ressaltamos~-==

nica, porque depe...,._;:


consideraes sob~~
Um espao amosrr. ,

contnuo quando rr -..::__


de nmeros reais.

No Exemplo -

EspAO AMOSTRAl E EVENTOS

Seja um experimento aleatrio, isto , urna experincia ou situao


em que deve ocorrer um, dentre vrios resultados possveis.

[ Evento um conju::::: =

Espao amostral o conjunto de todos os resultados possveis do experimento e ser


denotado por n.

Por exemplo -nos seguintes eve2~


B

ExEMplo 7.1

- a) Lanar uma moeda e observar a face voltada para cima. Temos, neste
caso, dois resultados possveis: cara e coroa. Ento, o espao amostral
o conjunto Q = {cara, coroa}.

;\

b) Lanar um dado e observar o nmero de pontos marcado no lado


voltado para cima. Temos: Q = {l, 2, 3, 4, 5, 6}.
c) Numa urna com bolas azuis e vermelhas, extrair uma bola e observar
sua cor. Temos: Q = {azul, vennelha}.

ocorrer u..-:i.

ocorrer 14..-:

Em termos de -::
C = {6} e D= { }. Re~
isso, represen ta.e:
Vejamos, ~

alocao de probal:f o-:

d) Num certo bairro, indagar a uma famlia se ela costuma utilizar-se de


algum programa de alimentao popular. Um possvel espao amostral
para esta situao Q = {sim, no}. Considerando, porm, a possibilidade do respondente no saber ou se negar a responder, podemos ser
levados a tomar um espao amostral mais amplo: rr = {sim, no, no
resposta}.
e) Num certo bairro, selecionar uma amostra de dez famlias e verificar
quantas u tilizaram algum programa de alimentao popular nos
ltimos dois meses. Um espao amostral adequado Q = {O, 1, 2, ... , 10}.

e = ocorrer o.:'

Probabilidade UIE ~:::::.: ......-


resultados possveis&:: h_.

Em linguagem maie:::::.z.::z::i
subconjunt o do espa:

- ;pliCAdA s CiNciAs SociAis

~..eses ou conjeturas sobre o

CApfrulo 7 - M odElos pRob,\bilfsricos

f) Numa escola de ensino fundamental, selecionar uma criana e medir


a sua altura. Como altura uma varivel contnua, o espao amostral
precisa ser construdo como um conjunto de nmeros reais possveis,
tal como n = {x, tal que x e 3~ e O < x < 2,00 m}.

~ resultados e (2) de uma

- ::-sj{ados).

.., Se supusermos que


- - ento for imparcial,
--~ cara a mesma de

117

Ressaltamos que a especificao do espao amostral pode no ser


nica, porque depende daquilo que estamos observando e de algumas
consideraes sobre o problema. Veja, por exemplo, o item (d) .
Um espao amostral discreto quando podemos listar os possveis resultados.
contnuo quando temos uma infinidade de resultados possveis dentro de um intervalo
de nmeros reais.
No Exemplo 7.1 , nos itens de (a) a (e) temos espaos amostrais
discretos; j no item (f), temos um espao amostral contnuo.

~veis.

Evento um conjunto de resultados do experimento. 1

~ o experimento e sec 1

A = ocorrer um nmero par,


B = ocorrer um nmero menor que trs;
e = ocorrer o ponto seis; e
D = ocorrer um ponto maior que seis.

cima. Temos, neste

- =- o espao amostral

Por exemplo, no lanamento de um dado, podemos ter interesse


nos seguintes eventos:

~a

bola e observar

Em termos de notao de conjunt o, temos: A= {2 , 4, 6}, B = {l, 2 },


C = {6} e D = { }. Repare que o ltimo caso um evento impossvel e, por
isso, representado pelo conjunto vazio.
Vejamos, agora, a segunda parte de um modelo probabilstico: a
alocao de probabilidades aos resultados possveis .

CDS:'....tma utilizar-se de
porm, a possibi:::.5?0:Ider, podemos ser

---:::~.

Probabilidade um valor entre O(zero) e 1 (um). A soma das probabilidades de todos os


resultados possveis do experimento deve ser igual a 1 (um).

:.=:z :amlias e verificar

:==:ao popular nos


~- Q =

{O, 1, 2, ... , 10}.

Em linguagem matemtica, podemos dizer que A um evento se e somente se A um


subconj unto do espao amostral n, pois n o conj unto de t odos os resultados possveis.

118

EsTATSTicA AplicAdA s C il\CiAs Soc iAis

ExEMplo 7.1 (coNTNUAO) Vamos apresentar os modelos probabilsticos para


alguns experimentos aleatrios, alocando, de forma intuitiva, a probabilidade de cada resultado do espao amostral. O princpio que norteia a
alocao dessas probabilidades ser apresentado posteriormente.
a) No lanamento de uma moeda, se considerarmos a moeda perfeitamente
equilibrada e lanamento imparcial, os resultados tornam-se
equiprovveis. Assim, podemos alocar probabilidade 0,5 tanto para cara
como para coroa, resultando no seguinte modelo probabilstico:
Resultado
cara

2
l

16

3
l

16

1 J6

1 J6

6
1

c) Na seleo de uma bola de uma urna, para construirmos um modelo


para a cor da bola a ser extrada, precisamos conhecer a quantidade
(ou a percentagem) de bolas de cada cor. Se tiverem sete bolas azuis e
trs vermelhas e, ainda, supusermos que a bola seja extrada
aleatoriamente, temos o seguinte modelo: 2
Resultado
azul
vermelha

=--

de

alimentao ~

0 ,5

b) No lanamento de um dado, se considerarmos o dado perfeitamente


equilibrado e o lanamento imparcial, tem-se o seguinte modelo
probabilstico:
1[6

Populao

quanto ao uoo :=

Probabilidade
0,5

coroa

Resultado
Probabilidade

CAp TUlo 7 - Mexi dos p.XJ:::

Pro ba bilidad e
0 ,7
0,3

Para aloca!" ::--=:


equiprobabilidade ::r-
podemos fazer o seg""da u rna tem a mB
bolas azuis dentre E;..,
uma bola azul 1 __ - ~
.
uma bola vermeJ.l:.i:. ~
usualmente enu::-r::::-=
como apresentaruos
Princpio c.

experime nto
J,Jrobabilidade

3~

S ll$==-'=-o-

::-:-::-=---:--

d) No problema de verificar se uma famlia de um bairro costuma utilizar

programas de alimentao popular, vamos supor, por simplicidade, a


inexistncia de no resposta, ou seja, qualquer que seja a famlia
selecionada, as possveis respostas devem estar em Q = {sim, no}.
Como no caso anterior, necessrio o conhecimento da distribuio
desta caracterstica na populao. Vamos supor que em todo o bairro
60% das famlias utilizam e 4 0% no u t ilizam programas de
alime ntao popular. Se a famlia for selecionada aleatoriamente,
podemos explicitar o modelo probabilstico, como mostra o esquema
seguinte.

Usaremos frequentemente o t ermo seleo aleatria para uma seleo que garant a que
todos os elementos tenham a mesma probabilidade de serem selecionados. No caso de
bolas numa urna, a seleo aleat ria pode ser equivalente a uma seleo ao acaso, desde
que todas as bolas tenham o m esmo tamanho e que estejam bem misturadas.

eventos, baseados=-==
equilibrado.

as probabilidades :=:s
dado:
P(0tn::. =--

clic~d~ s CiCN<:iAs SociAis

-.....:::i.;.s::, :;lrobabilsticos

para
-=.a intuitiva, a proba::::-:::'.cipio que norteia a
?JS-..eriormente.

Populao de familias dividida


quanto ao uso de programas de
alimen tao popular (sim ou no).

-~ ;;

-----.,.. _ Ca.do perfeitamente


--: o s eguinte modelo
6
6

_::-..J.irmos um modelo
_ ~ecer a quantidade
--e:n sete bolas azuis e
- "'- oola seja e xtrada

Modelo de probabilidades para o


resultado (sim ou no) de uma
familia e}l.trada ao acaso e
indagada sobre a utilizao de
programas
de
alimentao
popular.

sorteio de
uma familia

.,.....-,---""'.::.~da perfeitamente

_:-;:.ados tornam-se
- - -==._-e 0,5 tanto para cara
_ __.._, frnbabilistico:

119

CAprulo 7 - ModElos pRobAbilsricos

Resultado 1 Probabilidade
sim
no

0,6
0,4

Para alocar probabilidades, podemos lanar mo do princpio da


equiprobabilidade. Por exemplo, no problema da uma (Exemplo 7. lc),
podemos fazer o seguinte raciocnio: como a seleo aleatria, toda bola
da uma tem a mesma probabilidade de ser selecionada. Como tm 7
bolas azuis dentre as 10 bolas da urna, a probabilidade de selecionar
uma bola azul 7/ 10 (ou 0,7). Analogamente, a probabilidade de selecionar
uma bola vermelha o/10 (ou 0 ,3) . O princpio da equiprobabilidade
u sualmente enunciado em termos da probabilidade de algum evento,
como apresentamos a seguir.
Princpio da equiprobabilidade: quand o as caractersticas do
experimento suge rem N resultados po ssv eis, t odos com igual
probabilidade de ocorrncia, a probabilidade de um certo e vento A,
contendo NA resultados, pode ser definida por:

~-:o costuma utilizar

?Qr simplicidade, a
~ que seja a famlia

P(A) =

NA
N

Usando este princpio, vamos alocar probabilidades aos seguintes


eventos, baseados num lanamento imparcial de um dado perfeitamente
equilibrado.
Probabilidade
P(A) = % = 112 ou 0,5
P(B) = % = 1/3
P(q = l/6

Evento
A = ocorrer um nmero par
B = ocorrer um nmero menor que trs
C = ocorrer o ponto seis
D = ocorrer um ponto maior que seis

seleo que garanta que


sielecionados. No caso de
i=.a seleo ao acaso, desde
bem misturadas.

P(D) = % = O

Uma forma mais geral de alocar pro habilidades a eventos somando


a s probabilidades dos resultados que compem o evento . No exemplo do
dado:
P(ocorrer um nmero par)=

1
/

+ 1/6 + 1~

= 1;;

120

EsrArsriCA ApliCAdA s Ci~NCiAS Soci1\is

CApfru lo 7 - M odelos

Este procedimento pode ser usado mesmo quando os resultados no


so equiprovveis.3
Os ensaios de 5t:

XEMplo 7.2 Seja uma uma com 5 bolas brancas, 3 verme lhas e 2 pretas.

apenas um elcmer!;:o =

elecionar uma bola ao acaso. Qual a probabilidade da bola sele cionada


er branca ou vermelha?

ExEMplo 7.4 So exe=-

P(branca ou vermelha) = P(branca) + P(vermelha) = 51; 0 + 3/ 10 = o/10 (ou 0,8) .

Tambm chegaramos a este resultado se lembrssemos que a soma de


todos os resultados possveis igual a 1. Assim,
P( branca) + P( vermelha) + P(preta)

P( branca.ou vermelha)

=l -

= 1 , ou:

P(preta) = 1 - 2!10

a) Numa umacorr: 7 bola da uma e o---...~


b} Observar, ao ac;::s.-,_,
a um certo proj~
opinio formada.~
e) Lanar uma moe-"....c:. ~

= 8/ 10

Dois eventos so independentes quando a ocorrncia de um deles no altera a


probabilidade da ocorrncia do outro.

Por exemplo, no lanamento imparcial de um dado e de u ma moeda,


os eventos A = nmero par no dado e B = cara na moeda podem ser
admitidos como independentes, j que a ocorrncia de A (ou de B) nada
tem a ver com a ocorrncia de B (ou de A).
Quando a ocorrncia de um evento puder ser inte rpreta da como
resultante da ocorrncia simultnea de dois outro s e ve nto s
independentes, sua probabilidade pode ser obtida pelo produto das
probabilidades individuais desses eventos.

li

EMplo 7J Lanar duas vezes, de forma imparcial e independente, um

d) Lanar um dado e
e) Selecionar, alea:=::.
se ele pretende--que todos os e:e:_,...,.....
f) Selecionar, alea:c=
de produo e t:_: -,_.,

Em todos esse
Sob certas suposi.=-s.
distribuio de sir.. e
probabilstico.

ExEMplo 7.4 (co~Ti \::!c~-

b)
o seguinte moe. _

do perfe itamente equilibrado. Calcular a probabilidade de ocorrer


umero par em ambos os lanamentos.

e)

P(nmero par em ambos os lanamentos) =


= P(n.!! par no 12 lanamento) x P(n2 par no 22 tanamento)

= ( ~)

(~)

imparcial, temos

Res::....

= 1/4

Prob:l

Na prtica, dificil s:::;icrcontornar este pro~


w
descartando os inderis:&
s Neste exemplo, temos ses ~
no ponto seis, p ode=as ..o: 1 . x

'

Estamos supondo qu e os resultados de um e>..1)erimento so mutuament e exclu sivos , ou


seja, ao r ealizar o experimento vai ocorrer somente um resultado.

Aplic.>.d.>. s Ci@1'CiAS SociAis

CAprt-lo 7 -

Modtlo~

ENsAios dE BrnNoulli

lc":::::::::=::a:xlo os resultados no

jl:i:=::::::=;.. 3

-ermelhas e 2 pretas.
ea bola selecionada

,....~~--....e

- o/10

o/10 (ou 0,8).

u::: deles no altera a

- c:ado e de uma moeda,

..::: 7Weda podem ser


e A (ou de .B} nada

91C_:=-=::~

_s outros eventos
=-:::::.a pelo produto das

=::idependente, um
~-,;dade

121

pROb.>.bilsricos

Os ensaios de Bernoulli ocorrem em situaes onde observamos


apenas um elemento e verificamos se este tem (ou no) um certo atributo.

ExEMplo 7.4 So exemplos de ensaios de Bernoulli:


a) Numa urna com bolas brancas e pretas, extrair, aleatoriamente, uma
bola da urna e observar se de cor branca.
b) Observar, ao acaso, um morador da cidade e verificar se ele favorvel
a um certo projeto municipal. Admita que todos os moradores tm
opinio formada. 4
c) Lanar uma moeda e observar se ocorreu cara.
d) Lanar um dado e observar se ocorreu o ponto seis. 5
e).Selecionar, aleatoriamente, um eleitor numa certa cidade e verificar
se ele pretende votar em determinado candidato prefeitura. Admita
que todos os eleitores desta cidade j tenham definido seu voto.
f) Selecionar, aleatoriamente, uma pea que est saindo de uma linha
de produo e verificar se ela defeituosa.

Em todos esses casos o espao amostral pode ser Q = {sim, no}.


Sob certas suposies a respeito do experimento e supondo conhecida a
distribu.io de sim e no na populao, podemos especificar o modelo
probabilstico.

ExeMplo 7.4 (coNTiNUAo)


b) Se admitirmos que 70% dos moradores so favorveis ao projeto, temos
o seguinte modelo probabilstico:

de ocorrer

Re sultado
Probabilidade

sim c oncorda)
0,7

no (discorda)
0,3

c) Se admitirmos que o dado perfeitamente equilibrado, e o lanamento


imparcial, temos:

Resultado
Probabilidade

sim

no ou t ro ponto

5 6

Na prtica, difcil supor que todos os moradores tenham opinio formada. Pode-se
contornar este problema restringindo o estudo queles que tenham a opinio formada,
descartando os indecisos.
s Neste exemplo, temos seis resultados possveis, mas, considerando que o interesse somente
no ponto seis , podemos restringir o espao amostral a O = (seis , no seis}.

122

E~TATSTiCA ApliCAdA ~ CiNCiAS SOCIAIS

Muitas vezes no conhecemos informaes suficientes para


especificar completamente o modelo probabilstico. No item (b), por exemplo,
podemos no conhecer a percentagem de favorveis na populao. Nesse
caso podemos apresentar apenas o jeito do modelo, como segue:
Resultado
sim

CAprulo

7 - ModElos

pt

onde: n
X

e UID possr

p(x) a probavc..~:,....~~
probabilidade ..;,;

Probabilidade
7t

no

1-

lt

onde n um valor (desconhecido) entre O e l. Por exemplo, se a


probabilidade de sim n = 0,7, ento a probabilidade de no 1 - n = 0,3.
Chamamos de parmetro a uma quantidade desconhecida do modelo, que se tornaria
conhecida se tivssemos informaes adicionais sobre a populao de ond~ est sendo
tirada a amostra (ou sobre o fenmeno em que se est tirando algumas observaes).
O nmero n, do modelo anterior, corresponde ao parme tro
proporo de favorveis ao projeto na populao.

Quando temos
est na varivel alea:ll1:::1;

aleatoriamente, dl.4as
urna a primeira bola
reposio.

VARivd AlEATliA

Varivel aleatria uma caracterstica numrica associada aos resultados de um


6

experimento.

Exemplo: X =,nmero de caras em trs lanamentos de ui;na moeda;


Y = percentagem de pessoas favorveis a um projeto municipal,
numa amostra de 500 moradores da cidade.

Podemos caracterizar um ensaio de Bernoulli por uma va!ivel


aleatria X, definida da seguinte forma:
o, se no
X= {
1, se sim
e o modelo de probabilidade:
X

p(x)

lt

1 - n

~O esquema, a segu=
lidades de X = TUIT'..e-<::
l extrao

e~

5-

- -'is - .__2;.

<__.

Probabilidade de X = O:
extraao ~ bola branre
1

Probabilidade de X.-. 2
Probabilidade de X= 1

Formalmente, uariuel aleatria e definida como uma funo, que associa resultados do
espao amostral, n, ao conjunto de nmeros reais.

bola preta na 1~ ~ bo'Logo, a probabilidace e:

~'c~d.1. s CiNciAs SociAis

==s suficientes para


- :--.em (b), por exemplo,
...--~~'na

CAphulo 7 - ModElos pRob.,bilsrico<;

onde:

populao. Nesse

uma quantidade entre O e 1 (parmetro do modelo);


x um possvel valor de X (no caso, O ou l); e
p(x) a probabilidade de ocorrer o valor x. Assim, p(O) = 1 probabilidade de no e p(l) = n a probabilidade de sim.

7t

7t

Um modelo probabilstico, quando apresentado em termos de uma


varivel aleatria, tambm chamado de distribuio de probabilidades.
_ Por exemplo, se a
C.e no 1 - n = 0,3.

Dois ENSAios dE BrnNoulli

~=----=---e-

........~--....., I::Odelo, que se tornaria


-~de oncte est sendo

Quando temos dois ensaios de Bernoulli, geralmente o interesse


est na varivel aleatria:
X

nmero de ocorrncias de sim nos dois ensaios.

ExEMplo 7.5 Seja uma urna com trs bolas brancas e duas pretas. Extrai;-j
aleatoriamente, duas bolas , sendo uma aps a outra, tal que repomos na
urna a primeira bola antes de extrairmos a segunda - amostragem com
reposio.

\ :. r

-=s e uma moeda;


- -=projeto municipal,
_i

Extrair, aleatoriamente, duas


bolas com reposio.

X= nmero de bolas pretas

O e squema, a seguir, mostra a construo da distribui o de probabilidades de X= nmero de bolas pretas extradas na amostra.
lll extrao

2a extrao

por uma varivel

,/ --

<:0

0 -

'l. - ~2
1s _

lls - -

<;:.:_'is _

Distribuio de X

p(x)

~....,.----=----X

'-

st O

1~5

9125 (ou 0,36)


1
(ou 0,48)
.~_2_ _ _4....,V2=s_..lo.....u..._...O.._,l_.6..._)_

Probabilidade de X= O: calcula-se a probabilidade de ocorrer bola branca na I


extrao ~ bola branca na 2 ll extrao, ou seja, (3/ 5 )-( 3/ 5 ) = %s

4fi

Probabilidade de X = 2: de forma anloga, (2 / 5 H2 / 5 ) = 5 .


Probabilidade de X = 1:
bola branca na l ! ~ bola preta na 2:i (com probabilidade (3/sH 2 / 5 ) =
bola preta na 1 ~ bola branca na 2! (com probabilidade (2 /5 )(3/5 ) =
Logo, a probabilidade de X= 1

%5 + %.s = 12/ 25 .

%5 ) ou
%5 ).

124

E;1,\lb1 ic" Aplic.~d" i\s Ci?NCiA~ SociAis

\xEMplo 7.6

Idem ao exemplo anterior, mas sem repor a primeira bola na


.

~egunda extrao - amostragem sem reposio.

CAprulo 7 - ModElos

Exrnccios
1)

-~

::. /

bolM ,:,',':~;d""

Extrair, aleatori
.om

a)
b)

X - numero de bolas pretas

e)

A configurao da uma na segunda extrao depende do que


aconteceu na primeira extrao. Assim, o resultado da primeira extrao
condiciona as probabilidades da segunda extrao.

,_

'l.- ---

Numa sala com :E ~,~


o sexo (masculi= ~ _

3)

Numa eleio pa.oa.


votar no Candida=
se um eleitor n.a ....,_-:;--a) Apresente u= b) Qual a pro~na~-:?"~~-

4)

Seja uma famli:=.

2 e>..'trao

li! e>..'trao

~~

2)

..,,..--1.

o~

p (x)
~---L1. ~--:-:-::~ o
6/20 (ou 0,30)
-- -::::------.; 1
I2f2o (ou 0,60)
2

---

- - -2;.4

-~Y.i-_
.
3

Dis tribuio de X
X

----~
-

2/20(ouO, I O)

Quando a amostragem feita com reposio, como no Exemplo 7 . 5,


h independncia entre os ensaios, pois os resultados de um ensaio no
alteram as probabilidades de outros. Isto no a~ontece quando a
amostragem feita sem reposio, como no Exemplo 7 .6, onde os
resultados de uma extrao dependem do que ocorreu nas extraes
anteriores.
Se compararmos as distribuies de probabilidades dos Exemplos
7.5 e 7.6, notamos que o efeito da dependncia entre os ensaios provoca
uma grande alterao na distribuio de probabilidades. Contudo, se o
leitor refizer esses clculos, co:p.siderando um grande nmero .de bolas
(digamos, 2.000 bolas brancas e 3.000 bolas pretas), as distribuies de
probabilidades dos dois casos (com e sem reposio) sero praticamente
as mesmas.

Em grandes populaes podemos supor independncia entre os ensaios mesmo que a


amostragem seja feita sem reposio. 7

Como referncia, vamos considerar a populao grande quando o tamanho desta superar
em vinte vezes o tamanho da amostra (N > 20 n).

sim
no
To tal

a)
b)
e)
d)
e) usuria de p~_,__
o nvel mdio;
f)

g) tal que o che~ ::.....


tenha sido :-es::::
popular.
5) Seja a populao .=
famlias, sendo ~~
antes de procec!e:- z ~
probabilidade de -~
alimentao popr:C,,:i

125

CApfrdo 7 - ModElos pt<ob"bilsricos

Exrnccios
1) Numa urna com 10 bolas numeradas de 1 a 10, extrair, aleatoriamente, uma
bola e observar o seu nmero.
a) Construa um modelo probabilstico.
b) Liste os resultados contidos nos eventos: A = nmero par, B = nmero
mpar e C = nmero menor que 3.
c) Atribua probabilidades aos eventos do item (b) .

depende do que

Numa sala com 10 homens e 20 mulheres, sorteia-se um indivduo, observando


o sexo (masculino ou feminino) . Construa um modelo probabilstico.
3) Numa eleio para prefeitura de uma cidade, 30% dos eleitores pretendem
votar no Candidato A, 50% no Candidato B e 20% em branco ou nulo. Sorteiase um eleitor na cidade e verifica-se o candidato de sua preferncia.
a ) Apresente um modelo probabilstico.
b) Qual a probabilidade de o eleitor sorteado votar num dos dois candidatos?
2)

4)

Seja uma familia sorteada de uma populao de 120 famlias, as quais se


distribuem conforme a seguinte tabela.
Distribuio conjunta de frequncias do nvel de instruo do chefe da casa e uso de

programas de alimentao popular, num conjunto de 120 famlias.

~.:.::io

no Exemplo 7.5,
.:.os de um ensaio no
acontece quando a
-x=~plo 7.6, onde os

~~-=e.ades

dos Exemplos
os ensaios provoca
-~--"'a....
ces. Contudo, se o
;:-=::e nmero de bolas
as distribuies de
~

sero praticamente

Uso de programas
sim
no
Total

Nvel de instruo do chefe da casa


nenhum
fundamental
mdio
31
22
25
7
19
16
44
38
38

Total
78
42
120

Calcule a probabilidade de a famlia sorteada ser:


a) usuria de programas de alimentao popular;
b) tal que o chefe d a casa tenha o nivel mdio;
c) tal que o chefe da casa no tenha o nvel mdio
d) usuria de programas de alimentao popular, e o chefe da casa ter o
nvel mdio;
e) usuria de programas de alimentao popular, e o chefe da casa no ter
o nvel mdio;
f) usuria de programas de alimentao popular, considerando que o sorteio
tenha sido restrito s famlias cujo chefe da casa tenha o nvel mdio;
g ) tal que o chefe da casa tenha o nvel mdio, considerando que o sorteio
tenha sido restrito s famlias usurias de programas de alimentao
popular.
5) Seja a populao descrita no Exerccio 4 . Selecionam-se, aleatoriamente, duas
famlias, sendo uma aps a outra, repondo a primeira famlia selecionada
antes de proceder a segunda seleo (amostragem com reposio). Qual a
probabilidade de que ambas as familias sejam usurias de programas de
al'irnentao popular?

126

7.2

EslAlsriA AplicAdA s CiNCiAS SociAis

o ModElo biNOMiAl: CARACTER2AO Euso dA TAbEL~

Nesta seo, vamos caracterizar um tipo de modelo probabilstico


que se presta a diversas situaes prticas, em especial s situaes em
que observamos a presena (ou ausncia) de algum atributo. O interesse
no nmero ou na percentagem de elementos que tm o atributo, numa
amostra de n elementos.
CARACTERZAO dE UM EXpERiMENTO biNOMiA[

Para conhece-_distribuio binollllli:. ~


da distribuio bi.12c -=

reposio, duas bofil ~


brancas. Seja X o~,;-.....,, __

Inicialmente. ~=- do p:-:~-'


n = 2/ 5 = 0,40. Entrc! . ..;=.;:
na tabela da dist:ffiJ""~ .
indica o esquema ao ...::a..::.
mesma distribuio 6e ~~
havamos dese mo1...-o~-=
caracter~ticas

Um experimento dito binomial, quando:


a) consiste de n ensaios;
b) cada ensaio tem apenas dois resultados de interesse: sim ou no; e
e) os ensaios so independentes, com probabilidade constante n de ocorrer sim (o< 11 < 1).

Vamos estudar a distribuio de probabilidades da vari vel aleatria

nmero de ocorrncias de sim nos n ensaios,

conhecida como distribuio binomial. As quantidades n e n ff.o os


parmetros da distribuio cujos valores dependem das caractersticas
do problema que se est modelando.
No Exemplo 7 .5, a varivel aleatria X= nmero de bolas pretas obtidas
nas duas extraes tem distribuio binomial de partnetros: n = 2 (pois,
estamos extraindo duas bolas) e n = 2/ 5 (pois, a probabilidade de sair bola
preta numa particular extrao 2/ 5). No Exemplo 7.6 no temos um
experimento binomial, pois no h independncia entre os ensaios.

ExEMplo 7.7 So exemplos de experimentos binomiais:


a) O nmero Y de caras, em trs lanamentos imparciais de uma moeda
perfeitamente equilibrada. Valores dos parmetros: n = 3 e n = 0,5.
b) Dentre uma grande populao de pessoas, em que 70% so favorveis
a um projeto municipal, o nmero X de favorveis, numa amostra
aleatria de dez pessoas. Parmetros: n = 10 e n = 0,7.
c) O nmero F de eleitores, que se declaram a favor de um certo candidato,
numa amostra de 3.000 eleitores, extrada aleatoriamente de uma
populao de 100.000 eleitores. Parmetros: n = 3.000 e n =proporo
de eleitores favorveis ao candidato na populao.

so favorveis a u::::.. ;:;~


que, numa amo ~ ~~
maioria seja favorfu.=- e__

binomial, pode moses.,~-=

= nmero de favo r:.~


de ocorrer o eve::::.: ~
favorvel, correspc= -'.,.
aleatria X, ao e\e:::::o
lado. A probabilidaC.e ~
resultados individuais. r:.__
P(X> 5) =
= p(6) + p(7) + p (8) - ?'.;::: = 0,2001 + 0,2668 - ];...Z;:"'-= 0,8497 .

experimentos compos::= ~::w


a qual ser estudada n= :%
"

=t<:~d.\ .~s Cih ci.\S SociAis

127

CAph ulo 7 - M oddos pRobAbllh11cos

A TAbEL~ dA disrnibuio biNoMiAl


Para conhecermos as probabilidades de uma varivel com
distribuio binomial, podemos fazer uso da Tabela 2 do apndice (Tabela
da distribuio binomial).8

ExEMplo 7.8 Retomemos ao problema de extrair, aleatoriamente e com


reposio, duas bolas de uma uma, que contm duas bolas pretas e trs
brancas. Seja X o nmero de bolas pretas extradas.
Inicialmente, verificamos pelas
caracters ticas do problema que n = 2 e
7t = 2/ = 0,40. Entrando com estes valores
5
na tabela da distribuio binomial, como
indica o esquema ao lado, encontramos a
mesma distribuio de probabilidades que
havamos desenvolvido no Exemplo 7 .5.

n
x
2

lo.os

1t

0,40

... 0,95

0 ,3600
0,4800
0 ,1600

1
2

~~=-~--

n so os
das caractersticas

ExEMplo 7.9 Seja g populao de pessoas de u m municpio em que 70%


so favorveis a um certo projeto municipal. Qual a probabilidade de
que, numa amostra aleatria s imples de 10 pessoas dessa populao, a
maioria sej a favorvel ao projeto?
Note que temos um experimento binomial, com n
7t = 0,70. Usando a tabela da distribuio
binomial, podemos especificar a distribuio de X
= nmero de favorveis na amostra. A probabilidade
de ocorrer o evento a maioria da amostra ser
favorvel, corresponde, em termos da varivel
aleatria X, ao evento X > 5 , como ilustramos ao
lado. A probabilidade deste eve nto ser a somados
resultados individuais, ou seja:

= 10 e

.;:::~

:-0% so favorveis
__ ,_;_ d s, numa amostra
-= 0,7.
- C:e um certo candidato,
~~riamente de uma
- =3.000 e n =proporo

P(X> 5) =
= p(6) + p(7) + p(8) + p(9) + p(lO) =
= 0,2001 + 0,2668 + 0,2335 + 0,1211 + 0,0282
= 0,8497.
9

Parte da Tabela 2

10

o
1
2
3
4

s
6
7

X>S

8
9
10

1t

0,70
0,0000
0,0001
0 ,0014
0 ,0090
0,0368
0,1029
0,2001
0 ,2668
0,2335
o, 1211
0,0282

A Tabela 2 fornece as probabilidades para experimentos com at 15 ensaios. Uma frmula


geral para o clculo dessas probabilidades ser apresentada na prxima seo. Para
experimentos compos tos de muitos ensaios (ngrandc), podemos usar a distribuio normal,
a qual ser estudada no prximo captulo.

128

EsrArsric.A AplirndA s CifNci1\S SociAis

Uma distribuio de probabilidades tambm pode ser apresentada


sob forma grfica, de maneira anloga s distribuies de frequencias,
substituindo o eixo das frequncias por probabilidades. A Figura 7.2
mostra grficos tpicos para variveis aleatrias discretas, como o caso
da binomial.
P(4

0,2

0, 1

0,1

8)

Considere o expe:=:::=
Qual a probabiirxvoc esperava ql!e .::S::2
Por qu?

9)

Seja uma popula;:i e:::


projeto. Aprese:::z .~

favorveis numa e:=.

0,3.... P14

0,2

CAprulo 7 - ModFlos

10 ) Construa um gr5ro

dois ou m ais ~,,, -='b ) menos de do!s -==.. ~


c) mais de 50% ~~ ~~
12) Considerando o

0,0 1
0

1
4

1 1

1 1

1 )
10 X

o.o 1

- - - ' -- 1

Figura 7.2 Representaes grficas da distribuio binomial com n = 10 e

6
;r =

10

0,7 (Exemplo 7.7b).

Exrnccios
6)

7)

~.:::-

Dos experimentos abaixo, verificar quais so binomiais, identificando, quando


possvel, os valores dos parmetros n e n. Para aqueles que no so binomiais,
apontar as razes.
a) De urna sala com cinco mulheres e trs homens, selecionar, aleatoriamente
e com reposio, trs pessoas. A varivel aleatria de interesse o t;imero
de mulheres selecionadas n a amos tra.
b) Idem (a), mas considerando a a mos tragem sem reposio.
c) De uma populao de milha res de h o mens e mulheres, selecionar
aleatoriamente e sem re posi o, vinte pessoas. O interesse est no nmero
de mulheres na amostra.
d ) Selecionar uma amostra aleatria simples de 500 pessoas no Estado de
Santa Catarina. O interesse est no nmero de favorveis mudana da
capital do municpio de Florianpolis para o municpio de Curitibanos.
e) Selecionar, aleatoriamente, um morador de cada municpio de Santa
Catarina. A varivel aleatria de interesse a mesma do item anterior.
D Observar uma amostra aleatria simples de 100 crianas recm-nascidas
em Santa Calarina. O interesse verificar quantas nasceram com menos
de 2 kg.
g) Observar uma amostra aleatria simples de 100 crianas recm-nascidas
em Santa Catarina. A varivel aleatria em questo o peso, em kg, de
cada criana da amostra.
Lanar, de forma imparcial, uma moeda perfeitamente equilibrada, cinco
vezes. Calcule as seguintes proba bilidades:
a) ocorrer exatamente trs cara s;
b) ocorrer 60% ou mais de caras, isto , P(X 2: 3), onde X o nmero de caras.

de 80% das pessoas de sete pessoas -..-.= ~


a) exatamente <:=. =...:::.111111
b) menos de a ~~
14) Um certo proces,,,._
defeituosos . Ull!a ==~

__

com rc =O, 10, o~e- ~

7.7 MOdElO ~
Seja X o nme~
numa amostra alea:fr_'...:.
em que a proporo ~:
da populao sej a ~--
supor que a vari~
parmetros n e n. Ye,;a
Populao

rFl/'\0 ~~

w===z

~liCAdA As Cit ~ CfAs SociAis

__..~::;.pode ser apresentada


-""':!!es de frequncias,
'"';dades. A Figura 7 .2

129

CAphulo 7 - ModElos pRohAhilsric:os

8)

Considere o experimento do exerccio anterior, porm com dez lanamentos.


Qual a probabilidade de se obter 60% ou mais de caras? Intuitivamente
voc esperava que esta probabilidade fosse menor do que a do Exerccio 7?
Por qu?
9) Seja uma populao cm que 40% so favorve is e 60% so contrarias a um
projeto . Ap resente a distribuio de probabilidades de X = nmero de
favorveis numa amostra aleatria de n = 5 moradores.
10) Construa um grfico para a distribuio de probabilidades do exerccio anterior.
11) Com respeito ao Exerccio 9, calcule a probabilidade de a amostra acusar:
a) dois ou mais favorveis, ou seja, P(X;:: 2};
b) menos de dois favorveis, ou seja, P(X < 2);

c) mais de 50% de favorveis.


12) Considerando o Exerccio 9, construa a distribuio de probabilidades da

varivel aleatria P
X

se-lecionar, aleatoriamente
ce interesse o i;imero

selecionar

Ys (proporo de indivduos favorveis, na amostra).

de 80% das pessoas a ele submetidas, qual a probabilidade de, numa amostra
de sete pessoas que sejam submetidas a esse programa de treinamento,
a} exatamente cinco melhorarem de rendimento?
b) menos de a metade melhorar de rendimento?

e : = 0,7 (Exemplo 7.7b).

_ _ _...,,_identificando, quando
~ ~Je no so binomiais,

13} Sob a hiptese de que um certo programa de treinamento melhora o rendimento

14) Um certo processo industrial pode, no mximo, produzir 10% de itens


defeituosos. Uma amostra aleatria de 10 itens acusou 3 defeituosos. Calcule
a probabilidade de ocorrerem, numa amostra de tamanho n = 10, trs ou
mais itens defeituosos, supondo que o processo esteja sob controle (digamos,
com rr = O, 10, onde 7t a probabilidade de cada particular item sair defeituoso).

7.7

o ModElo biNOIVliAl: ORMUlAO iVlATEMTiCA

Seja X o nmero de pessoas favorveis a um certo projeto municipal,


numa amostra aleatria simples de n pessoas, extrada de um8: populao
em que a proporo de favorveis igual a 1r. Admitindo que o tamanho
da populao seja bastante superior ao tamanho da amostra, podemos
supor que a varivel aleatria X tenha distribuio binomial, com
parmetros n e 1r. Veja esquema a seguir:
-

~_anas

recm-nascidas
o peso, em kg, de

-=::ite equilibrada, cinco

Populao

amostragem

(87\o~a~I
~ ocontrarias

X o nmero de caras.

X = nmero de favorveis

l~O

E~1A1b1icA

AplicAdA s CiNCiAs SociAis

Para cada uma das pessoas indagadas a respeito do projeto, vamos


representar por S a resposta sim (favorvel} e por N a resposta no
(contrria). A Figura 7 .3 apresenta as possveis combinaes de respostas
Se N, numa amostra de n = 4 pessoas. Esta figura tambm mostra os
valores da varivel aleatria X e suas respectivas probabilidades.

CAprulo 7 - Mnd~ lo~

X=

O:

x= 1:

Respostas possveis de quatro pessoas:

Valores de X:
Probabilidades:

NNNN

SNNN
NSNN
NNSN
NNNS

SSNN
SNSN
SNNS
NSSN
NSNS
NNSS

(1 - 11)'

47!(1-11)'

611'(1 - rr)'

X=

2:

(o4) 4!
(4)= 4! 4! -.;
- 2
(42 )= 2!2!
=

4!0! =

3!1! = ~

SSSN

SSNS
SNSS

NSSS

ssss

4n 3(l - n)

n.
il

Figura 7.3 Possveis sequncias de respostas e construo de uma distribuio


binomial de probabilidades com n = 4 e n genrico.

Para generalliz:"

na Figura 7.3,

co::~

binomial de parm.'";
assumir um certo a....::
pela expresso:

O evento X= Oocorre quando so sorteadas quatro pessoas contrrias


ao projeto (NNNN}, cuja probabilidade (1 - n} (l -11:)-(l - n)(l - n) = (1 - rc} 4

O evento X = 1 ocorre quando forem observadas trs pessoas


contrrias e uma favorvel, em qualquer ordem (SNNN, NSNN, NNSN ou
NNNS}. Como cada um destes resultados tem probabilidade n(l - n) 3 , a
probabilidade do evento X= 1 47t(l - n) 3 . As outras probabilidades
podem ser obtidas de forma anloga.

so favorveis a u~
numa amostra a:e~
encontrarmos exa-;:;;--<

Soluo: X tem di~


Ento, a probabiEc -=

CodiciENTES biNOMiAis
No clculo da probabilidade do evento X= 1, contamos quatro
maneiras diferentes de aparecer uma resposta S nos n ensaios (SNNN,
NSNN, NNS N e NNNS) . Em geral, para calcular a probabilidade do evento
X = x da distribuio binomial, onde x um valor possvel da varivel
aleatria X, precisamos calcular o nmero de maneiras em que podemos
combinar a s x respostas S dentre as n respostas. Esse nmero, conhecido
.como coeficiente binomial, pode ser obtido na Tabela dos coeficientes
binomiais (Tabela 3 do apndice), ou calculado pela seguinte expresso:

p(3)= ..)~

Exrnccios
15) Refazer o Exercic::O

16) (BUSSAB;

MOfu.
~

n}
n!
( x = (n - x)! x!
onde n! = n(n - l)(n - 2) ... 1 (l-se nfatori.aij e, por conveno, O! = 1. Por
exemplo, para n = 4 temos os seguintes coeficientes binomiais:

viva daqui a 30 <lX"'


a) exatamente ci-.:zs,
b) todas as pes.sn2r;

.11~d~ ~

CifNCiAS SociAis

CAprulo 7 - Moddos pRob~bilsricos

~w do

projeto, vamos
a resposta no
-=::naes de respostas
- ,,. .......-.:. tambm mostra os
;:;:nbabilidades.
- ln'.:!:- ~

X =

0:

x=l:

X=

2:

~) = 4~~! =

::

=1

4. 3. 2 1
4)
4!
( 1 =3!1!=3211= 4
4)
(2

4!
2!2!

X=

3:

4!
4. 3 . 21
4)
4
( 3 = 1!3! = 13 2 1 =

X=

4:

(:) =

~~! = ::

=1

4 . 3. 2. 1
6
2 121 =

ExpnEsso qrnAl dA disrnibuio biNOMiAl

ssss

Para generalizar o raciocnio que fizemos ao obter as probabilidades


na Figura 7.3, considere X uma varivel aleatria com distribuio
biriomial de parmetros n e n (sendo O < n < 1). A probabilidade de X
assumir um certo valor x, pertencente ao conjunto {O, 1, 2, ... , n}, dada
pela expresso:
p(x) = ( : ) . 1tX (1 -

,.;;;::- adas trs pessoas


:::- _~-. ~SN N, NNSN ou
~.:aO-Jidade n(l - n) 3 , a
_:::as probabilidades

1{

r-

ExEMplo 7.10 Seja a populao de pessoas de um municpio em que 70%


so favor veis a um certo projeto municipal. Qual a probabilidade de,
numa amostra aleatria simples de quatro pessoas desta populao,
encontrarmos exatamente trs pessoas favorveis ao projeto?
Soluo: X tem distribuio binomial com parmetros n
Ento, a probabilidade pedida dada por:

4 e n

0,7.

p(3) = (;} (o,7)3 . (o,3)1 = 4. (o,7)3 . (o,3) = o,4116


=

~.

contamos quatro

..::. .::. -s n ensaios (SNNN,


-~bitidade

do evento
;x>ssvel da varivel
=.=_-as em que podemos
......:s= ::lmero, conhecido

Se o leitor procurar na tabela da distribuio binomial (Tabela 2 do


apndice), deve encontrar o mesmo resultado.

-~

-~dos
-::ei...a.

coeficientes

seguinte expresso:

Exrnccios
15) Refazer o Exerccio 9, sem usar a tabela da distribuio binomial.
16) (BUSSAB; MORETIIN, 2002, p.122) Uma companhia de seguros vendeu aplices a cinco pessoas, todas da mesma idade e com boa sade. De acordo com
as tbuas atuariais, a probabilidade de que uma pessoa daquela idade esteja
viva daqui a 30 anos de 2/ 3 . Calcular a probabilidade de que, daqui a 30 anos:
a) exatamente duas pessoas estejam vivas;
b) todas as pessoas estejam vivas;

172

EsrArsriCA ApliCAdA s CiNCiAs SociAis

c) pelo menos 3 pessoas eslejam vivas.


Indique as suposies necessrias para a aplicao do modelo b inomial.
17) Dentre sessenta alunos do Curso d e Cincias da Computao da UFSC,
obseivamos qc1e quatro estavam plenamente satisfeitos com o curso que
estavam realizando (anexo do Captulo 2). Se fizermos cinco sorteios com
reposio dessa populao, encontre a probabilidade de:

(Aprnlo

o~5"1

a) nenhuma resposta "plenamente satisfeito";


b) a maioria "plenamente satisfeito";
c) pe!o menos um "plenamente satisfeito".
ExERCcios coMpLEM ENTARES
18) De uma sala com quatro homens e duas mulheres, selecionar, ao a caso e
sem reposio, duas pessoas. Qual a probabilidade de se obler exatamente

uma mulher?
19) Uma sala contm vinte mulheres e oitenta homens. Se forem feitos seis
sorteios, um aps o outro e com reposio, qual a probabilidade de que se
observe:
a) cinco ou mais homens?
b) exatamente duas mulheres?
c) pelo menos uma mulher?
20) Numa populao onde 32% dos ind ivduos tm alguma descendncia indgena,

retira-se uma amostra aleatria de seis pessoas. Qual a probabilidade de se


encontrar
a) exatamente duas pessoas com descendncia indgena?
b) mais de uma p essoa com descendncia indgena?
21) Suponha que 10% dos clientes que compram a crdito em uma loja deixem

de pagar regularmente as su as contas (prestaes). Se num particular dia, a


loja vende a crdito para dez pessoas, qual a probabilidade de que:
a) exatame n te uma deixe de pagar?
b) mais de 20% delas deixem de pagar?

este captulo es::::.::..__


da Estatstica: ~
Diversas aplicaes :::._
captu los. Para per.!=

conceito de equ ipro-x:= =a


Dizemos que uma

n?-~

seus possveis res~


de nmeros reais.

22) Admitamos igualdade de probabilidade para o nascimento de m enino e

Por exemplo. a.. ....


varivel aleatria cc=~
possveis de altu ra e.e
o resultado ser u=. e:
meio, o qual cont= ..:........:.

menina. De todas as famlias com seis filhos:


a) que proporo tem trs meninos e trs meninas?
b) que proporo tem quatro ou mais meninas?
23) Um exame de mltipla escolha consiste em dez questes, cada uma com
quatro possibilidades de escolha. A aprovao exige, no mnimo, 50% de
acertos. Qual a probabilidade de aprovao se o candidato comparece ao
exame sem saber absolutamente nada, a pelando ap enas para o "palpite"?

Em variveis "=--;;:-~
probabilidade a caG.. :,1...
por intervalos de "C...:::-=-

Suponha que as dez pessoas que fizeram credirio nesse dia correspondam a
uma amostra aleatria de clientes potenciais de ssa loja.

importa a probabili.- =
pode estar n a pro~
m; o u acima de 1, 9C -:::. -=

~ IC.\dA s Cirr-.ci.>.s SociAis

~'--'"'"-...,do

modi::lo binomial.

_ Computao da UFSC,
e:ros com o curso que

isrnibuiES CONTNUAS E
MOdElO NORMAl
-~~

selecionar, ao acaso e

-~~---

C:e se obter exatamente

s Se forem feitos seis


de que se

~babilidade

~-

cescendncia indgena,

e a probabilidade de se

este captulo estudaremos o modelo de probabilidades mais conhecido


da Estatstica: a chamada distribuio normal de probabilidade.
Diversas aplicaes deste modelo estaro presentes ao longo dos demais
captulos. Para podermos estud-la, vamos inicialmente estender o
conceito de e quiprobabilidade para variveis aleatrias contnuas.
Dizemos que uma varivel aleatria contnua quando no conseguimos enumerar
seus possveis resultados, por esses formarem um conjunto infinito, num dado intervalo
de nmeros reais.

menino e

C'!!eStes, cada uma com


no mnimo, 50% de
c.andidato comparece ao
-='- ' - -' ~nas para o "palpite"?

Por exemplo, a altura de um indivduo, tomado ao acaso, uma


varive l aleatria continua, pois no possvel enumerar todos os valores
possveis de altura de indivduos, mas podemos dizer, por exemplo, que
o resultado ser um nmero real do intervalo de zero a dois metros e
meio, o qual contm infinitos nmeros.

DismibuiES CONTNUAS
Em variveis aleatrias contnuas, no existe interesse em atribuir
probabilidade a cada particular valor, mas sim, para eventos formados
por inte rvalos de valores. Ao observar a altura de um indivduo, no
importa a probabilidade de ele medir 1,682333 ... metros; mas o interesse
pode estar na probabilidade de ele ter altura no intervalo de 1,60 a 1,80
m; ou acima de 1,90 m; e assim por diante.

174

EsrArsricA AplicAd A s CiNCiAs SociAis

A especificao da distribuio de probabilidades de uma varivel


aleatria continua realizada por u m modelo matemtico que permite
calcular probabilidades em qualquer intervalo de nmeros reais. O Exemplo
8.1 ilustra a construo de u m modelo para u ma varivel aleatria continua.

CAph ui <>

8-

D tsmtbuiE">

C;;.'.

probabilidade ass~:a.::~ rea. Neste contexto aF_-,_


parar no quadrante : __

a)
ExEMplo 8.1 Considere um crculo, com me didas de
ngulos, em graus, a partir de uma determinada
origem, como mostra a figura ao lado. Neste crculo,
tem um ponteiro que colocado a girar no sentido 1ao 1
anti-horrio.

90

j{x)
rea .....::z.=

(" ,....

10

Seja X a varivel aleatria que indica o ponto


em que o ponteiro para de girar. Como existem
270
infinitos pontos no intervalo de O a 360, e sta varivel aleatria contnua.
Vejamos, inicialmente, a probabilidade de o ponteiro parar no quadrante
I, isto , a probabilidade de X assumir um valor entre O e 90.
Supondo que no exista regio de preferncia para o ponteiro parar,
podemos deduzir, pelo princpio da equiprobabilidade, que as probabilidades de parada so iguais para os quatro quadrantes. Assim, a probabilidade de o ponteiro parar no primeiro quadrante deve ser igual a 1/ 4 .
Podemos representar o evento ponteiro parar no quadrante I por
Os X< 90; e esta probabilidade por P(O S X < 90). Em termos de variveis
aleatrias contnuas, os sinais "<" e "S" so equivalente s , pois,
considerando a equiprobabilidade de todos os pontos e a existncia de
infinitos pontos, podemos definir a probabilidade de ocorrnc ia de um
particular ponto como nula.

Adistribuio de probabilidades de uma varivel aleatria contnua pode ser representada


por uma funo no negativa, com a rea entre o eixo-X e a curva igual a 1 (um). Os
eventos podem ser representados por intervalos no eixo-X, enquanto as probabilidades,
pelas correspondentes reas sob a curva (ver Figura 8.1).
A funo descrita n a Figura 8. la uma constante no inte rvalo de O
a 360, porque o experimento sugere que todos os intervalos de mes m o
tamanho devem ser igualmente provveis. Para que a rea total seja igual
1
unidade, a constante deve ser
Construda a distribuio, qualquer

%60"

A rea de um retngulo dada por base x altura. Como a base e 360 e a rea e 1, ento a
altura tem que ser 1/ 360

X'6o1

//ft=--____,,,
:::::a,,.

Figura 8.1 Ilustrao de:


8. l; e (b) a probabilidade

'---

e_. 1:1

ExEMplo 8.2 Selecio-::iTemos, novamente."-= razovel atribuir a=~ Por exemplo, intuiJ"165 e 175 cm seja~
ambos os intervalos ..4t.__

A Figura 8.2a suge:e


Por este modelo, co:::::.....
existe um valor tpire,.
adultos, deve estar er::i
mdio tm altas p~ , .
diminu em na m ec.:'.2.
indiferentemente se..:__
direito (para valores::-..;____
evento o estudante sr:-=

CAplTulo

8-

DisTRibt.iEs COi'.T'llt..As E

Muddo

1~5

r-<OR\1Al

probabilidade associada varivel X pode ser obtida pelo clculo de certa


rea. Neste contexto, a Figura 8.1 bilustra a probabilidade de o ponteiro
parar no quad rante I, que e..igual a: 9 0 . -1- = -1 .
360

a)

b)
j{x)
rea total

j{x)

=1

rea = P(O s X < 90) = V4

~60
270

alea tria contnua.


-o ?mar no quadrante
::-e O e 90.

pa::a o ponteiro parar,


-~-:e;. que as probabili---~s. Assim, a proba~e\e ser igual a 1/ .
1
........ ??.O

quadrante I por

- - :e rmos de variveis
e~ivalentes, pois,
:os e a existncia de
--- - - .::e ocorrncia de um

_ _.._---~no intervalo de O
=~rvalos de mesmo
a ...-ea total seja igual
.:....s::::ibuio, qualquer
.Jl50 e

a rea 1, ento a

360

Dg

360

Evento {O S X < 90}


Figura 8.1 Ilustrao de: (a) uma distribuio de probabilidades para a varivel aleatria do Exemplo
8.1; e (b) a probabilidade do evento (O~ X< 90}.

ExEMplo 8.2 Selecionar, aleatoriamente , de uma certa universidade, um


estudante do sexo masculino. Seja X o valor de sua altura, em centmetros .
Temos, novamente, uma varivel aleatria contnua, mas, desta vez, no
razovel atribuir a mesma probabilidade para diferentes faixas de altura.
Por exemplo, intuitivo que a probabilidade do estudante ter altura entre
165 e 175 cm seja bem maior do que entre 190 e 200 cm, mesmo que
ambos os intervalos .tenham a mesma amplitude .
A Figura 8.2a sugere um modelo mais adequado para a presente situao .
Por este modelo, conhecido como distribuio normal de probabilidades,
existe um valor tpico, ou valor mdio, que no caso de alturas de homens
adultos, deve estar em torno de 170 cm. Intervalos em torno deste valor
mdio tm altas probabilidades de ocorrncia, mas as probabilidades
diminuem na medida em que nos afastamos deste valor mdio,
indiferentemente se do lado esquerdo (para valores menores) ou do lado
direito (para valores maiores). A Figura 8.2b identifica a probabilidade do
evento o estudante sorteado ter mais de 180 cm

176

fa1A rsricA Af)!icAdA s Ci~NCiAs SociAis

a)

b)

/(~

CAprulo

8 - Di<;TRihui<;

A Figura 8.4 ~
parmetros ~L e cr. E.
distribuio de alru:-~

/(~

a)

130

140

150

;eo

1ro

laJ

100

200

210

130

il

150

160

170

laJ

100

Zl'.l

210

Altura (em cm.)


El:emo X > 180

Figura 8.2 Um modelo para a altura de alunos universitrios.

80

8.1 DisrnibuiES NORMAiS


A distribuio normal caracterizada por uma funo, cujo grfico
descreve uma curva em forma de sino. Esta distribuio depende de dois
parmetros, a saber:

(mdia ou valor esperado): especifica a posio central da


distribuio de probabilidades;
cr (desvio padro): especifica a variabilidade da distribuio de
probabilidades. 2

A Figura 8.3 apresenta a forma grfica de um modelo normal genrico,


com parmetros e cr. A curva perfeitamente simtrica em tomo da mdia
e , independentemente dos valores de e cr, a rea total entre a curva e o
eixo-X igual a 1 (um), permitindo identificar probabilidades de eventos
como reas sob a curva, como j ilustramos na Figura 8.2b.

apresentam, aproxi-o'~
quarta srie os esP..=~
os estudante s da ?-~
da Figura 8.4b po:e=.
srie e (4) alturas 2 ~--
supor, neste caso. <r-~
deve ser aproximaca=
no grupo formado C.a

VAloRES r---:.-.~

Jlx)
uma curva normal. ?33
a para a distribuic

A distribuio noI"II!2! "-'-


distribuio normal pa.;. -e;

+ C'r

Figura 8.3 Grfico de uma distribuio normal com parmetros e o.


2

Os parmetros e cr do modelo normal tm analogia com as estatisticas Xe S (Captulo 6),


usadas para medir, respectivamente, a posio central e a disperso de u ma distribuio
de frequncias.

e desvio padro G .=.


fazer a seguinte ope_

Oiic>.dA

,\s

CiNciAs SociAis

CAprulo

8-

DismibuiES CONTNUAS E MdElo NORMA[

A Figura 8.4 mostra diferentes modelos normais, em termos dos


parmetros e cr. Estes modelos podem representar, por exemplo, a
distribuio de alturas de crianas, em diferentes populaes.
b)

a)

Evento X> 180

80

100

1 20

1 40

1 60

1 80

70

90

Figura 8.4 Distribuies normais em funo dos parmetros e

==..a..~.lllo ,

cujo grfico
---::?o depende de dois
?OSio central da

=:o-:~!<> normal

==~:;:;:-.:::....
a em torno

genrico,
da mdia

110

1 30

150

170

190

0.

As duas distribuies da Figura 8.4a podem representar, por


exemplo, ( 1) alturas de estudantes da primeira srie do ensino fundamental
e (2) da quarta srie. Podemos admitir que ambas as distribuies
apresentam, aproximadamente, a mesma disperso (cr 1 1:::1 cr2), porm, na
quarta srie os estudantes devem ter, em mdia, alturas maiores do que
os estudantes da primeira srie (2> ~1J Por outro lado, as distribuies
da Figura 8.4b podem representar (3) alturas de estudantes da terceira
srie e (4) alturas de estudantes da primeira quinta srie. razovel
supor, neste caso, que a mdia das alturas dos dois grupos de estudantes
deve ser aproximadamente igual ( 3 1:::1 4), mas a disperso deve ser maior
no grupo formado da primeira quinta srie (cr4 > crJ

YAlORES pAdnoNizAdos E A disrnibuio NORMA[ pAdRO


Com o objetivo de facilitar a obteno de determinadas reas sob
uma curva nonnal, podemos fazer uma transformao na varivel, levandopara a distribuio normal com mdia O (Zero) e desvio padro 1 (um) .

A distribuio normal com mdia O (zero) e desvio padro 1 (um) conhecida como
distribuio nonnal padro.
X

Para transformar um valor x, de uma distribuio normal com mdia


e desvio padro cr, em um valor z da distribuio normal padro, basta
fazer a seguinte operao:
.....__-:,,...ras Xe S(Captulo 6),
::::;:;e::s:o d e uma distribuio

x-
z = -a

178

Es1Arsrici>. i>.plici>.di>. s CiNCii>.s Socii>.is

C Ap 1ulo

8 - DlsTRibuiF"

Distrib~

O valor z conhecido como valor padronizado uma medida relativa. Mede o quanto x
se afasta da mdia (), em unidade de desvio padro (cr).

normal com

~x)

ExEMplo 8J Suponha que numa certa universidade , a altura dos estudan-

:1:11" -

l_-/i

tes do sexo masculino tenha distribuio normal com mdia = 170 cm


e desvio padro cr = 10 cm. A Figura 8.5 mostra a relao entre a escala
dos va lores das a lturas de universitrios masculinos (x) e seus
correspondentes valores padronizados (z). Por exemplo, para um estudante
de altura. x = 180 cm, temos o valor padronizado:

140 150 160 170

z = 180 -1 70 = 1
10
Podemos dizer que este estudante de altura 180 cm encontra-se a
1 (um) desvio padro acima da altura mdia dos estudantes do sexo
masculino da universidade.

Exrnccios
1) Supondo que as

f(x)

dis tribuio nor-.a"

valores padroniza::
a) x = 190 cm;
2)

C1 -

140

150

-3

160

-1

170

perfeitamente
1
180

190

1
2

200

Figura 8.5 Transformao de valores de alturas de universitrios


(,l) em valores padronizados (z.j.

Seja X a altura, em centmetro, de um estudante do sexo masculino,


selecionado ao acaso. Considere que temos interesse no evento X> 180.
A Figura 8 .6 mostra a equivalncia da probabilidade deste evento, P(X >
180), com rea na distribuio normal padro. Para facilitar a notao,
identificaremos por Z uma varivel aleatria com distribu io normal
padro.

estudante soneic..::
3) Suponha que as -. -=
mdia de 60 pon::::s. ~
a) Se voc presrr:""..:
posio

rela~

e:::

desvio padr!'"=
b) Se foram co::s!_

8.2 TAbElA dA e~

=-

Como vimos
distribuio nonn. p
distribuio noi-maJ ppositivos dez com _-...a:s
so apresentados cc-

~d>. s Ci~NCiAs SociAis

CApTulo

8-

D isTRibuiE> CONI NUAS E MOd Elo NORMA[

j{x)

1k

Jlz)

/~P(X>

""'-'-..........;-~ ~ a!nua

dos estudan~-~ -== :ndia = 170 cm


-=:2.o entre a escala
~~n os (x) e seus
_ _ _n-,....,. para um estudante

Distribuio de Z:
normal padro

Distribuio de X:
normal com = 170 e <J = 10 cm.

ma Mede o quanto x

- -1

140 150 160 170 180 190 200

180) : P(Z> l )

_..-/f

>

'"====--'--...!....-.1.---l.I-'-'-",....""""~ ~

. 3

>

'

x-

z=-- =
a

180- 170

=1

10

Figura 8.6 Transformao de um even to da distribuio normal de parmetros


e <J = l O cm em um evento da distribuio normal padro.

= 170 cm

- .. ~cm encontra-se a

:: a>LU.dantes do sexo

Exrnccios
. 1) Supondo que as alturas dos estudantes de uma universidade tenham
distribuio normal com mdia 170 cm e desvio padro 10 cm, encontre os
valores padronizados de:
a) x = 190 cm;
b) x = 185 cm;
c) x = 170 cm;
d) x = 165 cm.
2) Considerando o exerccio anterior e lembrando que a distribuio normal
perfeitamente simtrica em tomo da mdia , qual a probabilidade de um
estudante sorteado dessa universidade apresentar altura acima de 170 cm?

z
~S:trios

_____..-=_..-.._
:e. co

sexo masculino,

3) Suponha que as notas X de um vestibular tenham distribuio normal com


mdia de 60 pontos e desvio padro de 15 pontos.
a) Se voc prestou esse vestibular e obteve nota x = 80 pontos, qual a sua
posio relativa em relao mdia dos vestibulandos, em unidade de
desvio padro?
b) Se foram considerados aprovados os candidatos que obtiveram nota
mnima correspondente a 1 (um) desvio padro acima da mdia, qual a
nota mnima de aprovao na escala original?

- .=ssc !lo evento X> 180.


ceste evento, P(X >
a notao,
;:!:suibuio normal

-.e._ _...
-=~~;

?~

~facilitar

8.2 TAbElA dA disrnibuio NORMAl pAdRo


Como vimos na seo precedente, as probabilidades de uma
distribuio normal podem ser representadas por reas sob a curva da
distribuio normal padro. A Tabela 4 do apndice relaciona valores
positivos de z com reas sob a cauda superior da curva. Os valores de z
so apresentados com duas decimais. A primeira decimal fica na coluna

CsTATSTiCA ApliCAdA s CiC~ciAs SociAis

140

Cilprdo B - Os1Ribt..i&s

da esquerda e a segunda decimal na linha do topo da tabela. A Figura 8.7


mostra como podemos u sar essa tabela.
Segunda decimal de z

O,OL
z

1 o 1 1 1 2 1 ... 1

0,1
0,2

0 ,4168

o
rea total

0,4168
rea na cauda superior

Portanto, P(Z <

o 0 ,21

Figura 8. 7 Ilustrao do uso da tabela da distribuio normal padro (Tabela 4 do apndice) para
encontrar a rea na cauda superior relativa ao valor de z = 0,21.

b) P(Z < -0,42). O esq-_


da curva para oi:>Le-

ExEMplo 8J (coNTiNUAO) Suponhamos que a altura X de um estudante do


sexo masculino, tomado a o acaso de uma universidade, tem d istribuio
normal com mdia 170 cm e de svio padro 10 cm . Vimos que a
probabilidade de ele acusar altura superior a 180 cm corresponde rea
acima de z = 1 da curva normal padro, isto , P(X > 180) = P(Z > 1).
Usando a Tabe la 4 do apndice, podemos enco ntrar esta rea
(probabilidade), como ilustra o esquema seguinte:
/

- 0,42

Portanto, P(Z < ...... e) P(-0 ,42 < Z <

O ,~:!

Segunda decimal dez

1,0 10, 1587

...

Portanto,
P(X > 180)

0,1 587
- 0,42

A Tabela 4 considera valores de z entre O (zero) e 5 (cinco). Alm de


z = 5 a rea pode ser con saiderada nula. Alis, a partir de 3 (trs) a rea

j praticamente nula. reas para valores negativos de zpodem ser obtidas


por simetria, considerando os correspondentes valores positivos.

ExEMplo 8. 4 Seja Z uma varivel aleatria com distribuio normal padro.


Vamos usar a Tabela 4 para encontrar as seguintes probabilidades:

Ento,

0,42
P(-0,~2 <

Como vimos
probabilidade de qua_
por manipulaes ae=-..,_:-~
como obter um \a2ointere sse ..

ExEMplo 8.5 Qual o ";-;:'

a ) P(Z < 0,42). Esta probabilidade corresponde


rea da distribuio normal padro indicada
ao lado. Podemos obter esta rea, fazendo a
seguinte operao:

z} = 0,95? Ou se~a
que no intervalo de -z
sob a curva de 0,95.
lado.
<

0,42

C~p11,1(0

8-

141

iSTRibLiES CO.,_T\l:.\S t \IOdelo .._OR\IA(

.a tabela. A Figura 8. 7

0 ,4168

rea total = 1

rea = 0,3372

0 ,42

(pela Tabela 4)

Portanto, P(Z < 0,42) = 0,6628.

o 0,21
:a!Jela 4 do apndice) para

b) P(Z < -0,42). O esquema seguinte mostra como podemos usar a simetria
da curva para obter a rea pedida na Tabela 4 .

-:::e um estudante do
tem distribuio
_: cm . Vimos que a
corresponde rea
: > 180) = P(Z > 1).
esta rea

-=

rea = 0,3372
(Tabela 4)

~e.

so

0,42

rea = 0,6628
(pela subtrao)

- 0,42 o
Portanto, P(Z

<

-0 ,42)

0,42

= 0 ,3372.

0,1587
- 0,42

-._.!o normal padro.

0,42

- 0,42

0,42

Ento, P(-0,42 < Z < 0,42) = 1 - 2x(0,3372) = 0,3256 .

---' e 5 (cinco) . Alm de


~de 3 (trs) a rea
i...---._e zpodem ser obtidas

Como vimo s nos exemplos precedentes, podemos obter a


probabilidade de qualquer evento relativo a uma varivel normal padro,
por manipulaes adequadas com reas sob a curva. O Exemplo 8.5 mostra
como obter um valor de z a partir da fixao de uma certa rea de
interesse~

---~ :;rubabilidades:

ExEMplo 8.5 Qual o valor de z, tal que P(-z < Z


< z) = 0,95? Ou seja, precisamos obter z, tal
que no intervalo de -z at z resulte numa rea
sob a curva de 0,95, como ilustra a figura ao

lado.
0 , 42

IJI

0,95 -

EsTATfsricA AplicAdA s CiNCi1\~ SociAis

142
Considerando a simetria da curva
normal e o fato de a rea total sob a curva ser
igual a 1 (um), podemos transformar esta
pergunta em: qual o valordezquedei.xauma
rea de 0,025 alm dele? A figura ao lado
ilustra a equivalncia entre as duas perguntas.
Entrando com o valor de
rea O,Q2 5 na Tabela 4 do
apndice, e n contramos o valor de
zigual a 1,96. Este processo est
ilustrado ao lado.

OLOO

1,9~

CAprulo 8 - DisrnibuiN: ~~

ExEnccios
4)

~o c:;. ~

-z

0,01

z=?

...

0,06

1'
-

5)

0,09

0,025

mdia 170 cm e a) P(X > 190);


d) a percentage='""""

6)

'1

ExEMplo 8.6 Suponha que o desempenho dos alunos das trs ltimas fases
do Curso de Cincias da Com putao da UFSC tenha distribuio normal
de mdia 2,5 e desvio padro de 0,6.3 Selecionando aleatoriamente um
aluno desta populao, qual a probabilidade de ele acusar desempenho
entre 2 e 3,5?

Admitindo que a
de uma certa esc~ :

pontos, calcule
a) a probabilicL:.Ce
Q .1. superior..,
b)

7)
,\.

a percentagc= Ci\'X" :=..&.

Suponha que

n~

normal com mC..4 -


tenha distribuio,_,_

Soluo: Primeiramente precisamos transformar os valores de desemper;6,

x, em valores padronizados:
x-

x -2,5
0,6

z=--= - -

Para x = 2:

z = - 2 5 = - O 83
0,6

3,5-2,5
06
'
(veja a figura ao lado).

Para x

8.7 DAdosobs=~

3,5: z =

'

= 1,

A Figu.ra 8 .S
dirias de presso

1,67

Observamos que o~

2 2 ,5

0 ,83

-=--

de sino, donde po.'"'


Usando a Tabela 4 do apndice,
encontramos paraz= -0,83 e z = 1,67 as reas
nas extremidades da curva: 0,2033 e 0,04 75,
respectivamente (lembrando que para valores
negativos dez, como -0,83, procuramos na
Tabela 4 o seu valor simtrico positivo, n o
0,8 3 o
1,61
z
caso, z = 0,83). fcil observar, pela figura ao lado, que a probabilidade
desejada corresponde ao complemento da soma destas reas, ou seja:
P(2 <X< 3,5) = 1 - (0,2033 + 0,0475) = 0,7492.
3

Foram usados como estimativas de ~t e cr, os valores das estatsticas X e S, calculadas a


partir dos dados observados nes ta populao (anexo do Captulo 2).

a i~

1:

6 1-

4~

~dA s Ci~l\ CiAs SoclAls

14}

CAprulo 8 - D isTRibl.iES COl\T'IL.M t ModElo ' OR\ 1AI

ExERCcios

J
z=?
...

0,09

0,025

-=---<=..distribuio normal
um
i:Usar desempenho

~---..-aleatoriamente

4) Seja Z uma varivel aleatria com distribuio normal padro. Calcule:


a) P(Z > 1,65);
b) P(Z < 1,65);
c) P(-1 < Z < l);
d) P(-2 < Z < 2);
e) P(-3 < Z < 3);
f) P(Z > 6);
g) o valor de z, tal que P(-z < Z < z) - 0,90;
h) o valor de z, tal que P(-z < Z < z) - 0,99 .

5) Sendo X a varivel aleatria que representa a altura de um estudante tomado


ao acaso de uma universidade, supostamente com distribuio normal de
.j
mdia 170 cm e desvio padro 10 cm, calcule:
a) P(X > 190);
b) P(l50 <X< 190);
c) P(X 160);
d) a percentagem esperada de estudantes com altura entre 150 e 190 cm.
6 ) Admitindo que a distribuio do quociente de inteligncia (Q.I.) de crianas
de uma certa escola seja normal com mdia 100 pontos e desvio padro 10
'J
pontos , calcule:
a ) a probabilidade de uma criana, tomada ao acaso desta escola, acusar
Q.I. superior a 120 pontos;
b) a percentagem esperada de crianas com Q .I. na faixa de 90 a 110 pontos.
7) Suponha que numa certa regio, o peso dos homens adultos tenha distribuio
normal com mdia 70 kg e desvio padro 16 kg. E o peso das mulheres adultas
tenha distribuio normal com mdia 60 kg e desvio padro 12 kg. Ao selecionar
uma pessoa ao acaso, o que mais provvel: uma mulher com mais de 75 kg ou
(
um homem com mais de 90 kg? Responda calculando essas probabilidades.

8.7 DAdos obsrnvAdos EMOdElo NORMAl


-0 ,83

1,67

A Figura 8.8 mostra um histograma de frequncias das mdias


dirias de presso intraocular, numa amostra de 43 indivduos sadios.
Observamos que o traado do grfico se aproxima de uma curva em forma
de sino, donde podemos inferir que um modelo normal pode representar
razoavelmente bem a distribuio desta varivel, em indivduos sadios.
12

t"rcquno.a de
indvdu~

10

8
6
4

11

13

IS

17

PressAo intraocular
Figura 8.8 Histograma de frequncias das mdias dirias de presso
intraocular, numa amostra de 43 indivduos sadios.

144

EsmrlsricA AplicAdA s CiNci11s SociAi5

Uma varivel que possa ser identificada como uma soma, ou. mdia,
de vrios itens, geralmente se distribui de forma parecida com uma
distribuio normal. o caso do exemplo anterior, em que cada valor
corresponde mdia aritmtica de sete medidas de presso intraocular,
observadas ao longo do dia. As medidas fisicas ou comportamentais, tais
como altura, peso, quociente de inteligncia e ndices de aptides, tambm
c.ostumam se distribuir de forma parecida com um modelo normal, porque
elas podem ser vistas como somas de uma infinidade de componentes
inerentes ao individuo e ao seu meio.
Quando temos uma varivel que acreditamos ter distribuio aproximadamente normal, podemos usar algumas propriedades desta distribuio
na anlise dos dados dessa varivel. Uma propriedade da distribuio
normal, muito usada na anlise exploratria de dados, a seguinte:
-

ao afastar um desvio padro, em ambos os lados da mdia


(intervalo de - a at + a), a rea sob a curva atinge ,
aproximadamente, 0,683;
ao afastar dois desvios padres (intervalo de
rea cresce para 0,955;

~1 -

2cr at

~1

+ 2a), a

C11plrulo - Dis1Ribu1i-'

maisde 9~

at X _,_

3~-

Assim, algu= - .:;;


considerado um \a-::- X 2S podem ser- - -

ExEMplo 8.7 Sejam os~


de crianas.
44 52 50 49 s2

~s

50 70 54 49 5 1 5,-

Pelo diagrama ;;;:.


os demais apresen-;;-~
Calculando a mcEa .a:i_

X.= s1,1

o afastamento de trs desvios padres (intervalo de - 3cr a-t


+ 3cr) gera uma rea de O,997 (veja a Figura 8. 9).

ponL.::.

Da:

X 3S= S L: ::: . :-:

~u~

2a

2cr

Verificamos q-..::..e..
no intervalo X:!:: 25 -~'"'--
caracterizando urc;;..
aptido mecnica .
pesquisadas.

8.4

--~3-a~---~~~3a~-

Figura 8. 9 reas sob a curva normal em funo de afastamentos de desvios


padres cr, em torno da mdia .

Dado um conjunto de valores, podemos calcular a mdia X e o


desvio padro S, como vimos no Capitulo 6. Se os dados em anlise se
distribuem de forma parecida com um modelo normal, devemos esperar:

diudA S C:i~NC:iA\ SOC iAi~

~a

CAprulo 8 - Di~mibuiOFs

- e!? torno de

soma, ou mdia,

VJodElo

145

NORMAl

~5%

dos dados em X 2S (isto , no intervalo de


X - 2S at X + 2S); e

- ..:::::::a ;>arecida com uma


------.....-. em que cada valor
::.e ~sso intraocular,
a:c:iportamentais, tais
~s ~e aptides, tambm
-==Xelo normal, porque
=- -;;re d e componentes

mai~e 99% dos dados em X 3S (isto , no intervalo de X - 3S


at X + 3S).

Assim, algum valor que esteja fora do intervalo X 3S pode ser


c!?nsiderado um valor discrepante dos demais. Valores fora do intervalo
X 2S podem ser vistos como suspeitos.

ExEMplo 8.7 Sejam os seguintes valores de aptido mecnica, numa turma


de crianas.

-~--:.=---:-distribuio

aproxi- - : o - zes d esta distribuio


~-=2de da distribuio

~~ ~0

CONTNUAS E

44 52 50 49 52 46 53 48
50 70 54 49 51 50 49

40

45

50

55

60

65

Apt ido mecnica

70

75

Pelo diagrama de pontos, observamos que, com exceo do valor 70,


os demais apresentam-se d e maneira compatvel com um modelo normal.
Calculando a mdia aritmtica e o desvio padro desses dados, temos:

a curva atinge ,

;e - 2cr at . + 2cr), a

X = 51,1 pontos e S = 5,8 pontos. 4

Da:

X 2S = 51,1 2(5,8) = 51, 1 11,6-+ intervalo de 39,5 a62,7 pontos;

X 3S= 51 ,1 3(5,8) = 51, 117,4-+ intervalo de 33,7 a68,5 pontos.


Verific8Elos que, com exceo do 70, todos os demais valore~ esto
no intervalo X 2S. Alis, o 70 tambm no pertence ao intervalo X 3S,
caracterizando um ponto discrepante. A criana que obteve 70 no tes te de
aptido mecnica , neste contexto, anonn.al perante as demais crianas
pesquisadas.

2a

8.4
*ri s

c,.ws de desvios

C2'..'="~ a mdia X e o
::.e as dados em anlise se
~.devemos

esperar:

ApROXiMAO NORMAl biNOMiAl

Em muitas situaes prticas, a distribuio normal pode ser usada


como uma aproximao razovel de outras distribuies. o que acontece,
por exemplo, em experimentos binomiais com n grande. Apesar de a
distribuio verdadeira ser a binomial, os clculos das probabilidades podem
ser feitos com a distribuio normal. Seja o problema de amostragem e as
variveis aleatrias binomiais X e Y definidas na Figura 8 . 10.
4

Os clculos de X

e S foram vistos no Captulo 6 .

146

EsrArsriCA ApliCAd.o. s Ci~NciAs SociAi~

CApfrulo 8 - Dlsr Rlbui<"'

Verificamos pe2..~

Populao de uma cidade


ndios

binomial aproxima-se 0,5, a aproximao~-_

20%

homens
50%

brancos
80%

mulheres

5 0%

Amostragem aleatria simples


de n pessoas

1) n grande e

2)

Y = nmero de ndios

X= nmero de homens

a) n n

Ambas as variveis aleatrias tm distribuio binomial com nigual


ao tamanho da amostra. Quanto ao parmetro n, temos X com n = 0,5 e Y
com n = 0,2. A Figura 8.11 apresenta as distribuies de probabilidades
de Xe Ypara n = 2 , 10 e 50.
Parmetros

o,s - p (x )

n=2

LL
0,5

0,3 -

~:: L~
p (x )

0,5
0,4

0 ,1

o -

o
2X

1p (x )

0 ,1

'

1 2

5 6

p(x)

'

'

..

0. 1

0,05

..

5 6

7 8

9 10

35

45

Figura 8.11 Distribuies binomiais para diferentes valores de n e n.

Calculemos . c::-

25 ou mais de

"':..........

25

0 ..........

7t no um vaca:- aproximao nor::::-


padro cr dados, !'e~

populao exista= -

1 2 3

p(x)

0 , 15

15

OI

9 10

2X

o,os

,,

O, l

n = 50

lP~x)

0, 1

' ' ' 7'


3

"1

(favorvel ou con..... .:;. ~

- "j . .

n -10

0 ,2

0, 1 -

o,3

ExEMplo 8.8 Obse:-c:'."


aleatria de n =5C ~=s... .

0,2

binomial, segundo as 1

.. ../

Ao aproximar --=obter os parmetros ;: ..-..-

n = 0,2

0,4

5
b) n(l - :.

Figura 8.10 Ilustrao de duas variveis aleatrias binomiais.

10

..

fam~

aproximada por um. .,;__ X

20

30

~oJ<:Ad11

s CiNci11~

SoclAis

CAphdo 8 -

D isTRibt.iEs co\T\uAs E

,,odeio

147

l'.OR\IAl

Verificamos pela Figura 8 .11 que, para n = 50, a forma da distribuio


binomial aproxima-se da curva de uma distribuio normal. Quando n =
0,5, a aproximao j parece razovel para n = 10.
De maneira geral, as condies para se fazer uma aproximao da
distribuio binomial para a normal so:
1) n grande e
2) n no muito prximo de O (zero) ou de 1 (um}.

Uma regra prtica considera a aproximao razovel se as duas


seguintes inequaes forem satisfeitas:
a) n n

b ) n (1 - n) ~ 5

____;.~- ~omial com n igual


- -"'=os X com n =0,5 e Y
~s de probabilidades

Ao aproximar uma distribuio binomial para uma nonna~ podemos


obter os parmetros e cr da normal, em funo dos parmetros n e n da
binomial, segundo as expresses seguintes:
=nn

- = 0,2

/ --

Ili

!2

Pelas caractersticas do experimento, a varivel aleat ria Y tem


distribuio binomial com parmetros n = 50 e n = 0,4 . Como n grande
e n no um valor muito prximo de zero ou de um, podemos usar a
aproximao normal. 5 Esta distribuio normal deve ter mdia e desvio
padro cr dados, respectivamente, por:

6 7 8

9 10

ExEMplo 8.8 Observar o nmero, Y, de respostas fa vorveis, numa amostra


aleatria de n = 50 pessoas, as quais foram indagadas a respeito da opinio
(favorvel ou contrria) sobre um projeto municipal. Suponha que na
popula o existam 40% de favorveis .

..
_ ::....__ __
o

CY =

~x
20
30

= n n = 50 (0,4) = 20

~n 7 (1- 7)

~50 (0,4} (1- 0,4)

3,464

Calculemos, como exemplo, a probabilidade de se ter na amostra


25 ou mais de favorveis, isto , P(X~ 25). Esta probabilidade pode ser
aproximada por uma rea sob a curva da distribuio normal de mdia
5

Poderamos usar a regra prtica: (a) n 1t ~ 50(0,4) = 20 e (b) n (1 - it) = 50( 1 - 0,4) = 30.
Como ambos os resultados so no inferiores a cinco, podemos usar a aproximao normal.

148

EsrArsricA AplicMIA ~ CiNCiAs SociAis

C~pru l o

/3 -

Di~11b uiB

= 20 e desvio padro cr = 3,464. O valor x = 25 corresponde ao seguinte


valor padronizado:

= X - , =
(J

25 - 20 = l, 44
3,464

Jlx1
0,2

Usando a Tabela 4 (apndice), encontramos a probabilidade 0,0749.


Esquematicamente:

0 .1

20

25

1,44

CorrnEO dE CONTiNuidAdE

Ao calcular probabilidades de eventos oriundos de experimentos


binomiais como reas sob uma curva normal, estamos fazendo uma
aproximao de uma varivel aleatria discreta, que s assume val.Qr.es
inteiros, para u ma varivel contnua, cujos eventos constituem intervalos
de nmeros reais. Por isso, devemos fazer alguns ajustes, como mostra o
exemplo seguinte .

Para x = 3.5; f
encontrando a pro~"'r

. EXEMplo8.9 Seja Y o nmero de caras obtidas em 10 lanamentos


imparciais de uma moeda perfeitamente equilibrada.
Pelas caractersticas do experimento, podemos deduzir que Y tem
distribuio binomial com n = 10 e 7t = 0,5, a qual pode ser aproximada
pela d istribuio normal de mdia e desvio padro dados por:

cr = ~n 7t (1 -

= n 7t

7t)

= ~10 (0,5) (1- 0,5)

10 (0,5) = 5

que pode ser obtida ::iei

=~2,5

= 1,58

Seja o seguinte evento de interesse: {Y = 4}, isto , ocorrer quatro


caras. Ao expressar este evento em termos de uma varivel aleatria
contnua X, com distribuio normal, devemos considerar um intervalo
em tomo do valor 4, porque, para variveis contnuas, s faz sentido
avaliar probabilidades em intervalos. O intervalo adequado, neste caso,
construdo pela subtrao e soma de meia unidade ao valor quatro, ou
seja, {3,5 <X< 4,5}, como mostra a Figura 8.12.

Ento, P(3.5

<X<~ -

~ciA ~ CiFi'<CIAs SociAis

CAphulo 8 - D isrnibui~

COi\ 1NuAS

f(x)
0 ,2

149

E \todrlo NOlntAl

P(Y = 4) = 0,205 1
pela binomial
(Tabela 2)

P (3 , 5 < X< 4,5 )

-=:/..........

rea sob a curva


de uma normal

==::;.a.-:nbabilidade 0 ,0749.
O, 1

141s

3,5

10

4,5

Figura 8.12 Aproximao da probabilidade do evento {Y = 4} (da


distribuio binomial) para a probabilidade do evento {3,5 < X <
4,5} (da distribuio normal).

---~.

:.os de experimentos
e:::.a:::ios f02en do uma
- s assu me valores
:=.stiruem intervalos
s:es, como mostra o

:o

Usando a distribuio normal, a probabilidade do evento {3,5 <X<


4,5} deve ser colocada em termos de valores padronizados:
x-u x - 5
Z =--' = - - . . ..
Cj
1,58
Para x = 3,5, temos z = -0,95 e para x = 4,5, temos z = -0,32,
encontrando a probabilida de 0,2034, conforme mostra o esquema a seguir:

lanamentos

A rea que se
quer igual a:

--~-.....
-

ceduzir que y tem


pc<ie ser aproximada
dados por :

0,95 0,32

0 ,32 0,95

que p ode ser obtida pela dife rena das duas reas representadas abaixo :
rea= 0,1711
(Ta bela 4)

ts~ , ocorrer quatro


-=::=::a vari ve l aleatria

0)2

Ent o, P(3,5

< X <

4,5) = 0,3745 - O, 1711 = 0,2034.

0,9 5

150

b 1ArsriCA Aplic:AdA <. Ci~l\CiAs Soc iAis

claro que neste exe mplo bem mais fcil usar a dis tribuio
binomial. A probabilidade pedida encontrada diretamente na Tabela 2
do apndice , s endo igual a 0,2051. Mas quando n grande, a aproximao
normal mais fcil.

Exrnccios

8) Sejam dez lanamentos imparciais de uma moeda perfeitamente equilibrada.


Calcul a p robabilidade de ocorrer mais de 6 caras, usando:
a) a distribuio binomial e
b) a aproximao normal.
Obs: ao usar a aproximao normal voc deve considerar o evento {X>
6,5} (correo de continuidade).
9) Com respeito ao exerccio anterior, calcule a probabilidade de ocorrer o evento
cinco ou mais caras (use a distribuio normal).
10) Resolva novamente o Exemplo 8.8, aplicando a correo de continuidade .
11) Numa amostra aleatria de 3 .000 eleitores, qual a probabilidade de a maioria
se declarar favorvel a um certo candidato, se na populao existem 52% de
favorveis a este candidato?

'1

Exrnccios coMpLEMENTAREs

12) Um teste padronizado aplicado a um grande nmero de estudantes. Os


seus resultados so normalmente distribudos com mdia de 500 pontos e
desvio padro de 100 pontos. Se Joo conseguir 650 pontos, qual a
percentagem esperada de estudantes com mais pontos do que Joo?

....

13) Suponha que as notas de um teste de aptido tenham distribuio normal


com mdia 60 e desvio padro 20. Qual a proporo de notas que
a) excedem 85?
b) esto abaixo de 50?
~ 14) Considere que na cidad e Paraso , composta de um milho de habitantes,
existam 40% de homens e 60% de mulheres. Numa amostra extraida por
"
sorteio (amostra aleatria), calcule a probabilidade de se obter mais mulheres
do que homens, considerando:
a) que a amostra tenha sido de cinco pessoas;
b) que a amostra tenha sido de cinquenta pessoas.
15) a) Um exame de mltipla escolha consiste em dez questes, cada uma com
quatro possibilidades de escolha. A aprovao exige, no mnimo, 50% de
acertos. Qual a chance de aprovao se o candidato comparece ao exame
sem saber absolutamente nada, apelando apenas para o upalpite"?
b) E se o exame tivesse cem questes?
16) Calculou-se em 70 minutos o tempo mdio para o vestibular de uma universidade,
com desvio padro de 12 minutos. Quanto deve ser a durao da prova, de
modo a permitir tempo suficiente para que 90% dos vestibulandos tenninem a
prova? Admita distribuio normal para o tempo de durao da prova.
'-

..

1rxfHE

~dA ,\ s Ciel\cfAs SociAis

u sar a distribuio
--==:amente na Tabela 2

P ARTE
-

.::e:-"..et.amente equilibrada.
::sanda:

~erar

ESTATSTiCA

o evento {X >

=.=.o de estudantes. Os
:=ed.ia de 500 pontos e
~~- 550 pontos, qual a
- do que Joo?

amostra extrada por

- - - " ..::: SE

1NfER NCiA

IV

obter mais mulheres

--

COMO QENERAliZAR RESUlTAdos dE UMA AMOSTRA PARA


A populAo dE ONdE ElA foi EXTRAdA
COMO TESTAR Hi pTESES COM bASE EM AMOSTRAS

(Aprnlo 9

EsTiMAO

dE pARMETROs

este captulo, estudaremos o problema de avaliar certas caracteristicas


dos elementos da populao (parmetros) , com base em operae s
com os dados de uma amostra (estatsticas). o que acontece nas
pesquisas eleitorais, em que queremos conhecer as percentagens de cada
candidato na populao de eleitores (parmetros), mas observamos apenas
uma parte da populao (uma amostra), na qual podemos calcular as
percentagens de inteno de voto relativas a cada candidato (estatsticas) .

---

Na estimao de parmetros fazemos um raciocnio tipicamente


indutivo, porque generalizamos resultados da parte (amostra) para o todo
(populao). um caso especial de inferncia estatstica (ver Figura 9.1) .
POPULAO (universo do estudo)
Parmetros: n =? u = ?

Estimao de parmetros

AMOSTRA (dados obsenrados)

Figura 9.1 O raciocnio indutivo da estimao de parmetros: uma


forma de inferncia estastica.

Reforando algumas definies:


Populao o conjunto de elementos para os quais desejamos que as concluses da

pesquisa sejam vlidas, com a restrio de que esses elementos possam ser observados
ou mensurados sob as mesmas condies.

154

EsrA1~1iCA Apllc\dA s Ci\CiA!. SoclAis

up(11ilo

9-

EsT'1AO d,

A estatstica X

Parmetro uma medida que descreve certa caracterstica dos elementos da populao.
Amostra aleatria simples: uma parte da populao, sendo que os elementos so
extrados por sorteio.
Estatstica: alguma medida associada com os dados de uma amostra a ser extrada da
populao. Quando usada com o objetivo de avaliar (estimary o valor de algum parmetro,
tambm~ chamada de estimador.

apenas uma amosr:-a e

Erro amostral a diferena entre uma estatstica e o parmetro que se quer estimar.

Quando estiYe:-:::as
certa populao, gera---- de elementos com o a::-=

Estimativa: valor da estatstica (estimador), calculado com base na amostra efetivamente


observada.

EXEMplo 9.1 A prefeitura pretende avaliar a aceitao de um projeto de


mudana no transporte coletivo. Depois de aprese nt-lo aos usurios, os
responsveis por sua execuo pretendem conhecer, mesmo que de forma
aproximada, o parmetro:

Apre sentamos
estatsticas que gera:~

n = proporo de favor veis ao projeto (na populao de u surios


do transporte coletivo do municpio) .

caractersticas .2.
n

= proporo de a_;;--

dcntre os ele~ec:
opulafo.
=mdia de algu-a
quantitativa. r:...s
populao.
o =desvio padro ~
dentre os ele~
o ou lao.

Para estimar este parmetro, a prefeitura planeja uma amostragem


aleatria simples de n = 400 usurios . Dessa amostra, calcular a
estatstica:

P= proporo de moradores favorvei s ao projeto (na amostra).


Observada efetivamente a amostra, devemos ter P =F n, devido ao
erro amostral. Ento, pensaremos em avalia r a margem de erro que
podemos estar cometendo por examinar apenas uma amostra e no toda
a populao.

ExEMplo 9.2 Para estudar o efeito da merenda escolar, introduzida nas


escolas de um municpio, planeja-se acompanhar uma amostra de n =
100 crianas, que esto entrando na rede municipal de ensino. Dentre
diversas caractersticas de interesse, pretende-se avaliar o parmetro:

u ma amostra, a esta
clculo), chamado de t i
moradores do Exe~p
seguinte estimati\a p.;_.

= ganho mdio de peso durante o primeiro ano letivo (na populao de


crianas da rede municipal de ensino)

Da amostra de crianas em estudo, pode-se calcular a estatstica:


X= ganho mdio de peso, durante o primeiro ano letivo, das 100 crianas
em observao.

e o desvio padro S. J
Na literatura de Estatis::::
Em nosso exemplo, p = ~
varivel aleatria) e es: :::z:

:;;;;:;

Apli~dA

s Ci@NCiAS

~~-- :::s

=:ementos da populao.
~ que os elementos so

~.e ~ostra a
~

155

SociAi~

ser extrada da
-~..:Or dealgum parmetro,

A estatstica X pode ser usada como um est~ador do parmetro


, mas, como no exemplo anterior, devemos ter Xi= devido ao erro
amostral. Nas prximas sees, vamos estudar um processo que permite
avaliar a margem de erro que podemos estar cometendo por examinar
apenas uma amostra e no toda a populao.

Quando estivermos estudando a incidncia de algum atributo numa


certa populao, geralmente o interesse est na proporo, ou percentagem,
de elementos como atributo, como no Exemplo 9.1. Por outro lado, quando
estamos pesquisando alguma caracterstica quantitativa, como no Exemplo
9 .2, comum o interesse em estimar uma mdia.

- - io de um projeto de
-=- ~-lo aos

usurios, os
_ _ ,_._:-, :nesmo que de forma
--pulao de usurios
.,......~ja u ma
~

amostragem
a:nostra, calcular a

n, devido ao
- .argem de erro que
.-=.a amostra e no toda
;;s <:er P ;

-=---

~lar, introduzida nas


- ------ -:.l.illa amostra de n =
--~~ de ensino. Dentre
- a-aliar o parmetro:

Apresentamos, a seguir, alguns parmetros e as respectivas


estatsticas que geralmente so usadas para estim-los. 1
PARMETROS
ESTATSTICAS
(caractersticas da populaco)
(caractersticas da amostra)
P = proporo de elementos com o
n = proporo de algum atributo,
atributo, dentre os que sero
dentre os elementos da
observados na amostra.
populao.
= m dia de alguma varivel
X - mdia da varivel, a ser
quantitativa, nos elementos da
calculada com os elementos da
populao.
amostra.
a = desvio padro de uma varivel, S = desvio pad ro da varivel, a s er
calculado com os elementos da
dentre os elementos da
amostra.
populao.

Em geral, os parmetros so nmeros desconhecidos (somente sero


conhecidos se for feito um censo - pesquisa de toda a populao). J as
estatsticas so variveis aleatrias, pois seus valores dependem dos
elementos a serem sorteados na amostragem. Ao observar efetivamente
uma amostra, a estatstica se identifica com um valor (resultado do
clculo), chamado de estimativa. Por exemplo, se na amostra de n = 400
moradores do Exemplo 9. 1, encontrarmos 240 favorveis, ento temos a
seguinte estimativa para o parmetro 1t: 2
P

= 240 =O 60
400

'

(ou, 60%)

Lembramos que as expresses para o clculo de algumas estatsticas, tais como a mdia

X e o desvio padro S, foram vistas no Captu lo 6.


Na literatura de Estatstica, geralmente so u sadas letras minsculas para as estimativas.
Em nosso exemplo, p = 0,60. Neste livro, usaremos a mesma notao para estimador (uma
varivel aleatria) e estimativa (um nmero).

156

E 5 1 A 1~1 ici\ 1\plicAdA s CiNCiAS

SociAis

Contudo, no devemos esperar que este valor coincida com o


parmetro n, devido ao que chamamos de erro amostral Um dos principais
objetivos na teoria da estimao estimar um limite superior provvel
para o erro amostral. Esse valor ser a base para avaliarmos a preciso
de nossa estimativa.
Dizemos que uma estimativa to mais precisa quanto menor for o limite superior
provvel de seu erro amostral.

Toda a formulao que apresentaremos parte da suposio de que


os dados em anlise constituem uma amostra aleatria simples da
populao de interesse.

CAprulo </ - E~riMAo dr -

9.1

n, a qual se refe:i::: 2
Como na prtica _
a esta pergunta de fo~
distribuem os poss er:s
obtidos por diferemes ~
de interesse, sob as -=--

Exrnccios
1)

O esquema seguinte representa uma populao de noventa domiclios,


situados em quadras residenciais. Os valores dentro dos quadradinhos

(domiclios) indicam o nmero de cmodos. Esses valores, na verdade, somente


sero conhecidos aps a realizao da pesquisa.

4 151219
1121614

4
5
1~

2 3 2 3

7 2 2 4
6
8
2 4 5 6

5 2 3
5
2 4 5 9

4
2
4~

2 3 5 4
4
3
4 5 4 2

9 8 18
22 8 9
7

9 9

5 6 4 3

8 7 9 6
14

9 9
8 7 12

14

8 9

8 8
15
8 9 8 8

Calcular os seguintes parmetros:


a) n = propor.o de domiclios com mais de cinco cmodos;
b) = nmero mdio de cmodos por domicilio.
2) Selecione uma amostra aleatria simples de vinte domiclios da populao do
Exerccio 1.3 Com base na amostra selecionada, calcule o valor das seguintes
estatsticas:
a) P = proporo de domiclios com mais de cinco cmodos, na amostra;
b) X = nmero mdio de cmodos por domiclio, na amostra.

Se voc no se lembrar de como e"'trair uma amostra aleatria simples, leia novamente a
Seo 3.1 (Captulo 3). Lembre que o primeiro passo numerar os domiclios.

Para simplific;bastante grande, de :a..


probabilidade de ele~
dos elementos j o~s=
probabilidades, refere;; -

POPULAO: usurios
transporte coletivo do ~.

Sim
(n)

111

sz:o. ~plitAdA s Clf, clAs SociAis

-e ,-alor coincida com o


- ..=srral Um dos principais
-

c~rn,,lo

9-

E'.Ti\1A:i.O

dr

157

r>~R\lTRO~

9.1 Disrnibuio AMosrnAl

7:.T?tite superior provvel

-a. a\-aliarrnos a preciso

=enor for o limite superior

-:-..e da suposio de que


==:a aleatria simples da

C.e noventa domiclios,


dos quadradinhos
~- na verdade, somente

~r:o

~
~

Considere a seguinte pergunta, relativa ao Exemplo 9 . 1:


- o valor de P (proporo de favorveis numa amostra de n = 400 usurios
do tra nsporte coletivo) vai ser um valor p rximo da verdad eir a proporo
n, a qual se refere a todos os usurios do mu nicpio?

Como na prtica o valor de 7t desconhecido, tentaremos responder


a esta pergunta de forma indireta, atravs do conhecimento de como se
distribuem os possveis valores de P. Diferentes valores de P podem ser
obtidos por diferentes amostras de n elementos, extradas da populao
de interesse, sob as mesmas condies. Para cada amostra observada,
temos um valor para P. A distribuio do conjunto de todos os possveis
valores de P, correspondentes s possveis amostras de tamanho n, forma
a chamada distribuio amostral de P.
A distribuio amostral de uma estatstica a distribuio dos possveis valores dessa
estatstica, se examinssemos todas as possveis amostras de tamanho n, extradas
aleatoriamente de uma populao.

Para simplificar, vamos supor que a populao em estudo seja


bastante grande, de tal forma que, para cada elemento observado, a
probabilidade de ele ser favorvel seja sempre igual a n, independentemente
dos elementos j observados . A Figura 9.2 mostra o modelo de
probabilida des, referente a cada observao .
POPULAO: usurios de
AMOSTRA:
400 usurios

transporte coletivo do municpio.

Para cada elemento observado :


_:::=.;clios da populao do
~..e o valor das seguintes

Sim
(n)

Resultado
sim
no

Probabilidade
n

Clculo
de P

1- n

Figura 9.2 Modelo de probabilidades associado ao processo de amostragem do Exemplo 9.1.

158

EsTATSTic.>. ApliCAdA s CiFNCiAs SocLo.is

UMA

siMulAo

Para ilustrarmos a distribuio amostral de P, conforme a situao


da Figura 9 .2 , podem os sim u lar vrias amostras de tamanho n = 4 00.
Como exemplo, suporemos, artificialmente , que o parmetro n = 0,7
(populao com 70% de favorveis). A simulao pode ser realizada com
o apoio de uma tabela de n meros alea trios {Tabe la 1 do apndice).
Cada nmero de um algarismo da ta bela s imula a observao de um
elemento da popu lao, da s eguinte forma:
-

quando o algarismo extrado da tabela de nmeros a leatrios for


um valor do conjunto {O, 1, 2 , 3, 4, 5, 6}, que acontece com
probabilidade ~10 = 0,7, simula a obs ervao de u m indivduo
favorvel ao projeto;
quando o algarismo for um valor do conjunto {7 , 8, 9}, que ocorre
com probabilidade 3/10 = 0,3, simula a observa o de u m indivduo
contrrio ao proj eto .

Ao observarmos 400 algarismos da tabela de nmeros aleatrios ,


podemos calcular:
P .. p roporo de nmeros no conjunto {O, 1, 2, 3 , 4, 5, 6}, s imulando a
proporo de indivduos favorveis ao projeto.

C \prulo

9-

Erf\1AO

dr

Pe la Figura 9.3 , <=100 simuladas, resu!::o::e=::


:::'llesta s ituao ficc.a.
verificamos que o valo:- e:::::::
igual a 0 ,76- 0,70 =e.JS..
de que uma estimatr"G. :.=~ ~
de tamanho n = 400. s:J'--
n o carregar um erro
~

que iro compor a a '' ".'!..


feitas com um certo podemos fazer o seg::observamos que 96 ~I':
em e rros amostrais :::. '"~;:-.
afirma r que uma es.......-.-::-"
simulao dever :e e::
confiana em tomo e~

Para avaliarmos a distribuio amostral de Pe termos informaes


sobre o erro amostral, precisamos rep etir esse proce sso vrias vezes, sob
as me sm as condies . Os valores da Figura 9.3 refe rem-se a valores de P,
oriundos da simula o de 100 amos tras de tamanho n = 400.
Histograma de frequncias

Valore s simulados de P
0,70
0,69
0,72
0,67
0 ,70
0,73
0 ,73
0 ,74
0,70
0,69
0,72
0 ,66
0 ,72

0 ,67
0 ,71
0,71
0,72
0 ,72
0 ,67
0 ,69
0 ,70
0,69
0,70
0 .65*
0,65
0 ,68

0,69
0 ,7 1
0 ,68
0,73
0,71
0 ,7 1
0 ,69
0 ,70
0,73
0,74
0,69
0,68
0,68

0 ,70
0 ,68
0,69
0,7 1
0,68
0 ,76*
0,68
0,67
0,70
0,75
0,69
0,69
0,73

0,74
0,71
0,69
0 ,70
0,70
0,73
0,69
0 ,70
0 ,74
0 ,71
0 ,70
0,69

0,71
0,7 1
0,66
0 ,67
0,72
0,70
0 ,7 1
0,71
0 ,72
0,69
0,7 1
0 ,68

0,6 8
0,70
0,69
0,70
0 ,70
0 ,68
0 ,69
0,69
0 ,70
0,71
0 ,66
0,7 1

0,69
0,7 0
0,69
0 ,71
0,72
0,66
0 ,74
0,72
0,68
0 ,70
0,71
0 ,7 1

.:I': j~
0 ,64 0.66 0,68 0 ,7 0, 72 0,74 0,76
Valor calculado de P

Valor mximo e valor mnimo.

Figura 9 .3 Cem observaes da distribuio amostral de P, considerando amostras de tamanho


n = 400 e i! = 0,70.

Por exemplo, na esti,..,...==--p?aleatria simples, o e::i:_:::l'!:


n (tamanho da amosca e anterior, vimos que se
de u ma distri.buio ~
desvio padro s o de-.:e-:-

-~

,\J)liCAdA s Cil\Cf!\s SociAi~

conforme a situao
de tamanho n = 400.

:>
_

_ _ ...;s

11: = 0,7
ser realizada com
= abela 1 do apndice) .
_a a observao de um

- e parmetro
~ode

- 5

que acontece com

- - "':o de um individuo

-=.:o 7, 8, 9}, que ocorre


ao de um individuo
'=

Fe

:!meros aleatrios,

CApn.. lo 9 - Es1h1AO de p>.R\TETROs

159

Pela Figura 9 .3, verificamos que em nenhuma amostra, dentre as


100 simuladas, resultou em um valor de Pfora do intervalo de 0,65 a 0,76.
Nesta situao fictcia, adotamos o valor de n = O, 70. Na simulao,
verificamos que o valor mais distante foi 0,76, apontando um erro amostral
igual a O, 76 - O, 70 = O,06. Podemos dizer que temos uma altssima confiana
de que uma estimativa P, obtida atravs de uma amostra aleatria simples
de tamanho n = 400, sob as mesmas condies da simula o realizada,
no carregar um erro amos tral superior a 0,06 (ou seja, 6%) .
O fato de nenhuma das amostras simuladas ter carregado um erro
amostral superior a 0,06 no garante que, numa amostra efetivamente
extrada da populao em estudo, o erro amostral no possa ser superior
a 0,06, pois sempre existe o efeito do azar ao sortearmos os elementos
que iro compor a amostra. Neste contexto, as afirmaes so sempre
feitas com um certo nvel d e confiana.
Para entendermos melhor o significado do termo nivel de confiana,
podemos fazer o seguinte raciocnio em termos da nossa simulao:
observamos que 96 valores de P, dentre os 100 simulados , resultaram
em erros amostrais inferiores a 0,05 (veja a Figura 9.3). Assim, podemos
afirmar que uma estimativa construda s ob um modelo anlogo ao da
simulao dever ter um erro amostral inferior a 0,05, com nvel de
confiana em torno de 96/ 100 = 96%.

~ermos

informaes
~sso vrias vezes, sob
.:.:e:n-se a valores de P,
_ _..___~.... n = 400.
a:::ia

Na prtica examinamos apenas uma amostra, resultando em um nico valor para a


estatstica - uma estimativa. Porm, o conhecimento da distribuio amostral da
estatstica permite avaliarmos um limite superior para o erro amostral (margem de
erro), com certo nvel de confiana.

de frequncias

USANdo AdisrnibuiO NORMAi

;-; :: 6a 0 .1

0.12 o.H

o.76

.a.Dr Clllcullldo de P

:-z::.o amostras de tamanho

Na maioria dos problemas de estimao de parme tros, no


necessrio realizar simulaes para avaliar a preciso de uma estimativa.
Por exe mplo, na estima o de uma proporo, com base em uma amostra
aleatria simples, o experimento tipicamente binomia~ com parmetros
n (tamanho da amostra) e n (proporo do atributo em questo). No capitulo
anterior, vimos que se n for grande , a distribuio binomial se aproxima
de uma distribuio normal No caso da estatstica proporo, a mdia e o
desvio padr o so determinados em funo de n e n, da seguinte forma: 4
- No captulo anterior, trabalhamos mais com a varivel aleatria X nmero de favorveis na
amostra. Aqui esramos trabalhando com a proporo P= X/ n, razo pela qual as ex-presses da
mdia e do desvio padro so diferentes. O subinclice Puas notaes usuais de mdia e desvio
padro, e cr, para lembrar que esses parmetros referem-se distribuio amostral de P.

160

Esr . .rfsriCA Apl iCAdA s Ci~NCiAS SociAis

9-

l:.sriMAo c1E

que a populao de ~
necessitando conS:C.~

P = TC

aP

C\pTulo

~ 7r. (~- 7r)

Comassupo~

com os dados da pJ..:..;


A Figura 9.4(a) mostra a forma aproximada da distribuio amostral
de P. Note que esta distribuio est centrada no prprio valor do
parmetro de interesse, n. Pela teoria da distribuio normal, sabido
que existe 95% de probabilidade de que um valor seja observado a menos
de 1,96 desvios padres da mdia (Exemplo 8.5, Capitulo 8). Assim, com
probabilidade de 95%, o erro amostral no deve exceder 1,96 desvios
padres, como mostra a Figura 9.4(b).

onde P a proporo :5::::: -

Fixado o n.-e: ':~


limite mximo para ;:;. = ilustra a Figura 9.~ ~:
de o valor de P cai:" .e:. =--,

n (1,96)up

Figura 9.4 (a) Forma aproximada da distribuio amostral de P; (b) Faixa cm que deve estar o valor
de P calculado com base na amostra (95% de probabilidade).

ExEMplo 9.1 (coNTii\L~~


encontramos 60% de~padro:

---

Sp

Usando nve: ;:; .


erro amostral de:
O desvio padro da distribuio amostral de uma estatstica comumente chamado de
erro padro da estatstica.

,,.

E= (L~S =

Representare- -.~ -

9.2

EsTiMAO

dE UMA pRopORO

No que segue, estaremos considerando que j examinamos uma


amostra aleatria simples da populao de interesse.
Limitaremos o estudo para o caso em que o tamanho da amostra
razoavelmente grande e o atributo em observao no seja muito raro ou
quase certo, de tal forma que seja vlida a aproximao da d istribuio
binomial para a normal. 5 Nesta e na prxima seo , tambm suporemos
5

Desde que n no seja prximo de O ou d e 1, podemos usar a distribuio normal para


n;;:: 30. Uma discusso mais det alhada sobre esta aproximao foi feita na Seo 8.4.

o intervalo de limite - ;....,.._


60,0% + 4,8% = 64.S:

Podemos dizer. a:;::::


4,8% contm o pa:.;-;-:_

De modo gera:.. :- _

E = (l,96)S,
represe=_.:
p

C'..ApnJo

9-

Es1h1AO

161

dE pAR\IHRO'>

que a populao de onde foi extrada a amostra seja muito grande, no


necessitando considerar o seu tamanho nos clculos.
Com as supos ies anteriores, o erro padro de P pode ser e s timado
com os da dos da prpria amostra, usando a express o:

- ----'-e.a distribuio amostral


a no prprio valor do
--.:o normal, sabido
- se~a observado a menos
Capitulo 8). Assim, com
= exceder 1,96 desvios

sp

-~

onde P a proporo do atributo, na amostra; e n o tamanho da amos tra.


Nvfl dE CONfiANA

dE 95%

Fixado o nvel de confiana em 95%, como usual n a prtica, o


limite m xim o para o erro amostral fica em torno de (l,96)SP, pois, como
ilustra a Figura 9.4(b), temos, aproximadamente, 95% de proba bilidade
de o valor de Pcair a menos de 1,96 desvios padres der..

-=

1,96)CT

- .ii:k

em que deve estar o valor

ExEMplo 9.1 (coNTNUAO) Suponha que na amostra de n = 400 pessoas,


encontramos 60% de favorveis. Temos, ento, P = 0,60 (ou 60%), com erro
padro:
Sp

= ~P(l-P) = /(0,60)(0,40) =00245


n
~
400
'

Usando nvel de confiana de 95%, temos um limite supe rior para o


erro amos tral de:

E = (1,96)SP = (1,96) (0,0245)

0,048 (ou 4 ,8 %)

Representaremos por:
60,0% 4,8%

examinamos uma

-:::o seja muito raro ou


=:ao da distribuio
tambm suporemos

o intervalo de limite inferior 60,0% - 4,8% = 55,2% e de limite superior


60,0% + 4,8% = 64,8 % .
Podemos dizer, com nvel de confiana de 95%, que o intervalo 60,0%
4 ,8% contm o parrnetro n (proporo de favorveis em wda a populao).

De modo geral, o intervalo centrado em P e com semia mplitude


E = (1,96)SP, representado por:

a Cl.stnbuio normal para


-===;;;i-ioioi feita na Seo 8.4.

ou

(P - E,

P +E)

162 ,

EsTllTsriCA AplicAdA s CiNciAs SociAis

C\pTulo 9 -

[~TIMAO GE

dito um intervalo de confiana para o par metro n , com vel de


confiana de 95% . O e squema seguinte ilustra e s te intervalo sobre a re ta
de nm eros reais:
Intervalo de 95% de confiana para 1t

P - ( 1 ,96)~

P+ ( 1,96) -~

Ournos NVEis dE coNfiANA


A Figura 9.5 mostra uma tabela, construda com base n a Ta bela 4
do apndice (tabela da distribuio normal padro) , que associa os n veis
usuais de confiana com os respectivos valores de z.

-z
rea
z

deve conter o verear'==:-

O esquema se-5 __::


n veis de confiana e=:
Exemplo 9. 1.

Observe qu::.

1 0 ,800 0 ,900 0,950 0,980 0,990 0 .995 0,998


1 1,282 1,645 1,960 2 ,326 2,576 2,807 3 ,090

Figura 9.5 Valores de z para alguns nveis de confiana

Fixa do o nvel de con fiana , podemos obter o correspondente valor


de z, como ilustra a Figura 9 .5 . Depois, calculamos uma estim a tiva para
o limite superior do erro amostral por:

Para um dado n.e :.E


quanto menor for a a=:;:

Observe , pe"...a
n a tural de au me~::E._~
aumento do tama;-.2:~ -

E = z Sp
e o

intervalo de confiana para n:

Exencc ios

P E

ExEMplo 9.1 (CONTiNUAO) Adote o nvel de confiana de 99% . Ento, pelo


e s quema da Figura 9.5, temos:

3) (Para fazer em

sa~

__

agora considera--=-~ ;: .,
aluno deve simU:Z:. ~
calcu le P. Aprese:-:=
nessa simulao ,..

CAphulo 9 -

EsriMAO

dE

rea= 0,99 ~ z = 2,576

n, com nvel de

~~eu-o

~ iatervalo

sobre a reta

167

p ARMETROS

resultando no seguinte limite provvel para o erro amostral:


E =

z Sp= (2,576).(0,0245)

0,063 (ou 6,3%)

Ento, com nvel de confiana de 99%, o intervalo:


- __96)5P

60,0% 6,3%

deve conter o verdadeiro parmetro rc.

~com

-=

base na Tabela 4

que associa os nveis

O esquema seguinte ilustra os intervalos de confiana para rc com


nveis de confiana de 95% e de 99%, referentes amostra descrita no
Exemplo 9 .1.
Intervalo de 99% de confiana para rr
(60,0 6,3%)

<

Intervalo de 95% de confiana para rr


(60,0 4,8%)

53,7% 55,2%

60,0%

64,8%

66,2%

Observe que, ao exigir maior nvel de confiana, o intervalo de


confiana aumenta em magnitude. Tente entender o porqu disto!

Para um dado nvel de confiana, dizemos que uma estimativa to mais precisa
quanto menor for a amplitude de seu intervalo de confiana.
--e correspondente valor
estimativa para

~ -5 :ima

Observe, pela expresso do intervalo de confiana, que a maneira


natural de aumentarmos a preciso de uma estimativa atravs do
aumento do tamanho n da amostra.

Exrnccios

____......
-de 99% . Ento, pelo

3) (Para fazer em sala de aula.) Com respeito populao do Exemplo 9.1, mas
agora considerando n = 0,60, simule 50 amostras de tamanho n = 10 (cada
aluno deve simular uma ou duas amostras). Para cada amostra simulada,
calcule P. Apresente os valores encontrados de P num histograma. Com base
nessa simulao, discuta sobre o erro amostral associado a uma amostra de

164

l:srArsricA Aplit:,.d 11 s Ci1'ciAs Soc1... 1~

tamanho n = 10, para estimar o parmetro n, relativo proporo


atributo da populao.

d~

algum

4) Seja o problema de construir um intervalo de confiana para a proporo 7t


de alunos favorveis presena da Polcia Militar no Campus de u ma grande
universidade, com base numa amostra aleatria simples de n alunos. Faa
os itens abaixo e, com base nos resultados, discuta sobre a preciso das
estimativas ao variar n e n.
a) nvel de confiana de 90% , n"" 400, com 60% de favorveis na amostra.
b) nvel de confiana de 90%, porm considerando que a amostra tenha sido
de n = 1.000 alunos, sendo que 600 disseram ser favorve l.
e) nvel de confiana de 95%, n = 400, com 80 favorveis.
d) nvel de confiana de 95%, n = 400, com 320 favorveis.
e) nvel de confiana de 95%, n = 400, com 200 favorveis.
5) Numa pesquisa mercadolgica, deseja-se estimar a proporo n de
consumidores que passariam a usar certo produto aps experiment-lo pela
primeira vez. Para atingir esse objetivo, selecionou-se uma amostra aleatria
simples de n = 200 consumidores potenciais, fornecendo-lhes amostras grtis
do produto. Depois de um ms, voltou-se a contatar os consumidores da
amostra, oferecendo-lhes o produto por um certo preo. Trinta por cento da
amostra decidiu adquirir o produto. Construa uma estimativa intervalar para
7t, com nvel de confiana de 95% .
6) O vestibular COPERVE-1991 teve como tema de redao a possvel mudana
da capital de Florianpolis para Curitibanos.
a) Foram observadas 400 redaes, extrada s por sorteio, dentre todas as
redaes. Nessa a mostra, 120 mostraram-se favorveis mudana da
capital. O que se pode dizer a respeito da proporo de vestibulandos
favorveis mudana, na amostra? E na populao de vestibulandos?
b) Foram observadas 400 redaes, correspondentes aos alunos que
prestaram o vestibular num dos locais de realizao das provas (por
exemplo, na regio de Curitibanos). Nessa amostra, 250 eram favorveis
mudana da capital. O que se pode dizer a respeito da proporo de
favo rveis mudana, na populao d e vestibulandos?
7)

l..Af)rulo 9 - Esri\1AS.o

caractersticas ~
popular (PAP). e..~
confiana para o ~
alimentao pop~
9)

Interprete esses ::::-

9.7

EsTiMACO dE
j

Como o valor =
falar em erro p adr:;: e::
pode ser estimado w=

Num trabalho de auditoria nas contabilidades das empresas, para estimar a


proporo de empresas que deixaram de pagar algum tributo no ano anterior,
foi selecionada uma amostra aleatria simples de 40 empresas. Os resultados
foram os seguintes (1 = deixou de pagar, O = pagou corretameme):
001010001101001 0000 0
110010000101010 011 00

Construa um intervalo de 90% de confiana para a populao de empresas


que deixaram de pagar corretamente os tribulos no ano anterior.
NOTA: Observe que quando os dados esto codificados com O e 1, o clculo
de P coincide com o clculo da mdia aritmtica X, ou seja, a proporo
uma mdia em dados do tipo O e 1.
8) No anexo do Capitulo 4, temos o resultado de uma amostra alea tria simples
de 120 famlias do bairro Saco Grande II, Florianpolis - SC, 1988. Uma das

a soma dos valores e::-

Ix

= 8-' - L'

CApfrulo

:=-o p roporo de algum


~-a p ara a proporo 7t
- -- Campus de uma grande
s:::=~es de n alunos. Faa
_2 sobre a preciso das

.:e a amostra tenha sido

165

9 - EsriMAO dt pARMETRos

caractersticas pesquisadas foi o uso (sim ou no) de programas de alimentao


popular (PAP). Com base nessa amostra, construa um intervalo de 95% de
confiana para o parmetro 7t (proporo de famlias que usam programas de
alimentao popular, em todo o bairro) .
9)

A amostra descrita no Exe rccio 8 est, na verdade , dividida em trs


localidades. Construa intervalos de 95% de confiana para a proporo de
familias que usam programas de alimentao popular, para cada localidade.
Interprete esses intervalos de confiana.
NOTA: Observe que, ao trabalhar com subgrupos de uma amostra, as precises
das estimativas tendem a ser piores (intervalos de confiana mais longos),
quando comparadas com a anlise de toda a amostra.

a proporo 7t de
-_-.:."S exp eriment-lo pela

---.l"

'-Se u:na amostra aleatria


==-r-=-r-o-lhes amostras grtis
____;;;;:.: os consumidores da
-=-~- Trinta por cento da
.=s ativa intervalar para

9.7

EsTiMAO dE UMA MdiA

Quando a varivel em estudo quantitativa, normalmente se tem


~resse no parmetro (mdia). Tendo uma amostra aleatria simples
da populao de interesse, poaemos ter uma estimativa de ~t atravs do
clculo da mdia dos valores da amostra:

~...eio,

dentre todas as
mudana da
de vestibulandos

~=,,.eis
~----so

Como o valor de X vai depender da amostra selecionada, podemos


falar em erro padro e em distribuio amostral de X. O erro padro de X
pode ser estimado com os dados da amostra por:

S-x= ..Jn
~-esas,

para estimar a

-== cibuw no ano anterior,


-

~;iresas.

Os resultados

~tamente) :

onde S o desvio padro dos dados, conforme apresentado no Captulo


6. Por exemplo, se uma amostra de 9 alunos em que se observaram as
seguintes notas:

8
-~C

?=J?ulao de empresas
2:D anterior.

com O e 1, o clculo
::::r seja , a proporo

_- -5

.a=.astra

aleatria simples

-...:..;;-...:. - SC, 1988. Uma das

10

temos a soma dos valores:

LX

72
a mdia da amostra: X = - = 8

a soma dos valores quadrticos:

'

7
72;

o;

166

E~1AT'iricA Ai.>liCAd A s Cir-.ci.>.s SociAiS

CAphulo 9 - E51iMAo d<

a varincia da amostra:
2
L:x
-n X2 588-9(8)2
s = n-1
=
=l 5
8
'

= ganho m6::

crianas da

.[C5 = 1,225;

o desvio padro da amostra: S

e o erro padro da mdia: Sx

s 1,225
= .Jn = .J9 = 0 ,408

Formalmente, o erro padro de

X :

os

Numa amos<:ra letivo, em que se ~ _

se~intevesU:-a;!

rn

o-= X

~o

ree~ ~

onde CJ o desvio padro de todos os elementos da populao . Como, em


geral, o parmetro CJ des conhecido, usamos em seu lugar S, resu ltando
na estimativa Sx , apresentada anteriormente.
No Exerccio 7, vimos que, se o conjunto de valores formado por
zeros e uns, s endo 1 quando o indivduo tem uma certa caracterstica, e
O quando no tem, ento a m dia aritmtica desses valores igual
proporo P de indivduos com a caracterstica . Da mesma forma, o erro
padro da mdia, Sx, iguala-se ao erro padro da proporo, Sv 6 Ou seja,
o estudo da proporo (seo anterior) caso particular do estudo da mdia.
Vimos, tamb m, que a distribuio amostral de P aproximadamente
normal para amostras grandes. O mesmo acontece com a distribuio
amostral de X.

primeiro ano da

rec.~ -~ ~

m erenda esped..a:. - o::-

Para amostras aleatrias grandes (n ~ 30), a distribuio amostral de X aproximadamente normal.

'L:.15. ;; ~

x ~ M.=~6
x .:- A. :t ?:6

A~10smAs CjRANdEs

Quando temos uma amostra grande (n ~ 30), podemos estimar o

limite superior para o erro amostral por:

Para os ca sos razoavelmente si.r!:_

E = z S-x

onde z obtido conforme indicado na Figura 9.5, em funo do nvel de


confiana previame nte fixado.
6

O clculo dos dois erros padres deve acusar pequena diferena , porque usamos o
denominador n - 1 no desvio padro da amostra.

Note que o interv!l :::.: ,


medida da varivel e:::

-11

.i.plicAdA s Cif, cil).s SociAis

CApTlilo 9 -

Es ri\1AO

ExEMplo 9.2

dr

167

pAR.h1ETROS

(CONTiNUAO) O objetivo estimar o parmetro:

= ganho mdio de peso durante o p rimeiro ano letivo, na populao d e


crianas da rede municipal de ensino, d evido a uma merenda especial.

Numa amostra aleatria simples de n = 100 crianas do primeiro


ano letivo, em que se es ta va servindo a m erenda especial, foram obtidos
o~s_re sultados:

- 08

Ganho mdio de p eso: X = 6,0 kg;


Desvio padro: S = 2,0 kg .

Procedendo a es tima tiva do erro padro de


SX

X:

~ = 22.._ = O 2 kg

Fn

.J100

'

O limite superior para o erro amostra l (nvel de confia na de 95%):

e.a popu lao. Como, em


seu lugar S, resu ltando

E = (1,96) (0,2) = 0,392 kg

donde resulta o seguinte intervalo de 95% de confiana para :


-alores formado por
- certa caracterstica, e
sses valores igual
~~. :nesma forma, o e rro
p:uporo, Sr 6 Ou seja ,
~-'...,.r-,~ ... do estudo da mdia.
? aproximadamente
=::::::ce com a distribuio

6,000 0,392 kg.


Ou seja, a partir do a companhamento da amostra das cem crianas,
chegamos concluso de que o intervalo de 5 ,608 a 6,392 kg contm,
com 95% de confiana , o ganho mdio de peso,, de todas as crianas do
primeiro ano da rede m unicipal de ensino, que venham a ser submetidas
merenda especial. 7 E squematicamente:
lnt eTValo de 95% de confiana para
(6,000 0,392)
)

<

~~~--<o~~~~~-e
a--~~~~o~~~-+
~

aproxi-

5,608

6,000

6,392

Ganho de peso (em kg)

AMOSTRAS PEQUENAS

podemos estimar o

- e.= funo do nvel de

~a, porque usamos o

Para os casos em que a varivel em estudo tiver distribuio


razoavelmente simtrica , parecida com u ma normal, possvel construir
estimativas intervalares para a mdia populacional, , mesmo que a
amostra s eja pequena (n < 3 0) . Nesse ca so, necessrio u s ar a chamada
distribuio t de Student (Tabela 5 do Apn dice).
7

Note que o intervalo de confiana de uma mdia a presentado na mesma unidade de


medida da varivel em e studo.

168

EsrArsricA AflliCMIA \ C':i ~NCil\s SociAis

A distribuio t de Student, como mostra a Figura 9 .6, tem forma


parecida com a normal padro, sendo um pouco mais dispersa. Esta
disperso varia com o tamanh o da amostra, sendo bastante dispersa para
amostras pequenas, mas aproximando-se da normal padro para amostras
grandes. Sua disperso funo de um parmetro denominado graus de
liberdade, gl. No problema de estimao de uma mdia, tem-se: gl = n - 1.

CArirulo 9 - EsriMA.O

ExEMplo 9J Para ve:=--..


acidentes de tra=::: ~
implementando e~
escolhidas ao acaso- ::;;.
percentuais de

red~

;-C=

obse rvadas.

j(x)

20
5

'/ /

'//

t com gl = 00 (
: t-cbfll gl =
normal padro)

'//

O objetivo

es;- -

t comgl = 1

~,
.,,

0
Figura 9.6 Grficos de distribuies

Estimativa .o e...-

t de Student e normal padro.

Para obtermos o valor t da distribuio tde Student, basta calcular os


graus de liberdade : gl = n - 1; fixar o nvel de confiana desejado; e usar a
Tabela 5 do apndice. Por exemplo, para gl = 9 e nvel de confiana de
95%, devemos usar a Tabela 5 , como mostra a Figura 9 .7.
Distribuio t com gl = 9

rea na cauda superior


gl

n = lOegl= n - :.

Assim:

.. Ento, temos parmetro :

0,025
9

t ~ Valor obtido
na Tabc~l a 5

...

2,262

00~

t = 2,262

Figura 9.7 Uso da tabela da distribuio t de Student. Ilustrao com gl = 9 e nvel de confiana de
95%.

Se n < 30 e a varivel em estudo tiver distribuio aproximadamente nonnal, podemos


estimar o limite superior para o erro amostral por:
E= t Sx

onde t obtido na Tabela 5 com gl = n - 1. Para amostras grandes,


uso de qualquer uma das duas distribuies.

t""' z, permitindo o

Exrnccios
10) Quer se avaliar o-==posto de servio. ~
simples de 14 c!.:e:=...
minutos):
15

17

Calcule :
a) a mdia da

19 ::.
ar;:,--~

==::e;:_, .\;)licAdA s Ci.''lCiAs Soci/\is

a :::gura 9.6, tem forma


--~ ::aais dispersa. Esta
- ~tante dispersa para
~~?adro para amostras
""'-~ cenominado graus de
Xa, tem-se: gl= n - 1.

169

CAprulo 9 - EsriMAO d F pARM FTRos

ExEMplo 9J Para verificar a eficcia de um programa de preveno de


acidentes de trabalho, foi realizado um estudo experimental,
implementando esse programa em dez empresas da construo civil,
escolhidas ao acaso, numa certa regio. Os dados abaixo se referem aos
percentuais de reduo de acidentes de trabalho nas dez empresas
observadas.
Amostra
20 15 23 11 29
5
20 22 18 17

= r

Estatsticas
Mdia:
X = 18
Desvio adro: S = 6 ,65

normal padro)

O objetivo estimar o parmetro:

p = mdia da reduo percentual de acidentes de trabalho, em todas as

empresas da construo civil da regio, que venham a ser submetidas ao


programa preventivo.
)

Estimativa do erro padro de X:


6 65
S - = '
= 2 10
X

basta calcular os
- - ...a d esejado; e usar a
"' ::....~el de confiana de

J10

'

Usando nvel de confiana de 95%, graus de liberdade gl = 9 (pois,


n

= 10 e gl = n - 1), obtemos na Tabela 5 (apndice) o valor t = 2,262.

Assim:

-_::~-a9 .7.

E= t Sx = (2,262)x(2,10) = 4,75::::: 4,8

:_=a na cauda superior

Ento, temos o seguinte intervalo de 95% de confiana para o


parmetro :

0,025 ...

18,0 4,8 pontos percentuais8

_ __. 2,262
======~

t= 2,262

Exrnccios
10) Quer se avaliar o tempo mdio, 11, que um cliente leva para ser atendido num

posto de servio, no horrio de maior movimento. Uma amostra aleatria


simples de 14 clientes apontou para os seguintes tempos de espera (em
minutos):
15 17 19 10 13 14 20 18 16 15 16 22 13 16

- :' =9 e nvel de confiana de


-==~=:;:;....,;;:.,;::~~1ente

normal, podemos

Calcule:
a) a mdia da amostra;
b). o desvio padro da amostra;

s- - --'. es, t ,,. z, permitindo o


$

O intervalo de confiana foi colocado em term os da unidade pontos percentuais, porque


era esta a unidade dos dados originais (reduo percentual de acidentes de trabalho).

170

EsrA1s1icA ApliCAdA ~ CihciAs SociAis

c) o erro padro da mdia amostral;


d) um intervalo de 95% de confiana para J.1.
11) A tabela seguinte mostra as mdias e os desvios padres da renda familiar,
calculados com base em uma amostra de 120 famlias, estratificada em trs
localidades. Essa tabela foi construda com os dados do anexo do Captulo 4.
Localidade
Monte Verde
Pq. da Figueira
Encosta do Morro

Tamanho
da amostra
40
42

37

Renda familiar (sal. mn.)


mdia
desvio oadro
8,1
4,3
5,8
2 ,6
5,0
4,5

Construa um intervalo de confiana, ao nvel de confiana d e 95%, para a


renda familiar mdia de cada localidade. Interpr ete as estimativas.
12) Suspeita-se que um certo fiscal tende a favorecer os devedores, atribuindo
multas mais leves. Fazendo-se uma auditoria numa amostra aleatria de oito
empresas, verificaram-se os seguintes valores que deixaram de ser cobrados,
em reais:

200 340

180

420

100 460 340

ExEMplo 9.4
a) Vamos refaze:-

a) Apresente um intervalo de 95% de confiana para o parmetro .


b) Qual o significado, no presente problema, do parme tro ?
c) Interprete a estimativa do item (a).

sx = s

,n

13) Considerando a amostra do Exerccio 2, construa um intervalo de 99% de


confiana para o nmero mdio de cmodos por domiclio, no bairro em estudo.
Verifique se o parmetro , calculado no Exerccio l, pertence a este intervalo.
14) Considere as informaes do anexo do Captulo 2. Selecione uma amostra
aleatria simples de 10 alunos e observe os d ados relativos varivel
desempenho no curso. Com esta a.mostra, faa os seguintes itens:
a)
b)
e)
d)

Apresente um intervalo de 90% de confiana para o parmetro .


Qual o significado do p armetro , neste caso?
Interprete a estimativa do item (a) .
Usando toda a populao, calcule o parmetro e verifique se o intervalo
que voc construiu no item (a) contm este parmetro. Consulte seus
colegas de sala. Verifique quantos obtiveram intervalos de confiana
contendo o parmetro .

b)
Neste cas o:

S- = r '
X

iJ n

:11 -:::.

i'r'

9.4 CoRREEs pARA TAMANHO dE populAo coNHEcido


O leitor pode estar estranhando que, na avaliao da preciso das
estimativas, o tamanho N da populao no tenha sido considerado. Na
verdade , o conhecimento deste valor s relevante em populaes
pequenas. Neste caso, basta fazer as seguintes mudanas nas estimativas
dos erros padres de P e X :

Comparando =~
a incluso do ta7"";:
somente acarreto~~--=(b) o tamanho da .P0.=1"...::

(N > 20n). N esse cas=.,, ~

e rro padro.

~dA As Cl@NCiA~ SociAb

CAprulo 9 - EsriMAO de

1-P . ~N-n
s ;> -~
-N-1n

,,.-..:::--es da renda familiar,

171

pAR\lETROs

-s, estratificada em trs


::.o anexo do Captulo 4.

SX

~a

i....----

de 95%, para a

as estimativas.

=~ )N-n
../n. N - 1

O restante dos clculos dos intervalos de confiana mantm-se


inalterado. Cabe tambm observar que se N for muito grande (digamos,
mais que vinte vezes o tamanho da amostra), ento o segundo fator das
frmulas acima ser aproximadamente igual a um, podendo ser
desprezado, resultando nas frmulas anteriormente apresentadas.

=s :.evedores, atribuindo
~

aleatria de oito

ExEMplo 9.4
a) Vamos refazer o Exemplo 9.3, considerando que existam N
empresas na regio. Neste caso:

s- =~.
../n. ~NN --1n
X

= (2

3 0-l0
10)
~
,
30 -1

= 30

= (2 10). to 83)= 1 74
'
~ '
'

E= t Sx = (2,262) (1,74).,,, 3,9

Resultando no seguinte intervalo de 95% de confiana para a mdia:

18,0 3,9 pontos percentuais.


parmetro .

b) E se a populao fosse constituda de N

400 empresas?

Neste caso:

e ;;:i!ique se o intervalo
----".=e:.'"O. Consulte seus
-,.--..-,. ~aios de confiana

sx

~ ~: ~~ = (2,10) :0i0-~1 = (2,10) (o,99)= 2'.08


E= t Sx = (2,262) (2,08) = 4,7

E o intervalo de 95% de confiana para a mdia m:

CO\~Ecido

18,0 4,7 pontos percentuais.

comparando os resultados dos Exemplos 9.3 e 9.4, verificamos que


a incluso do tamanho da populao, N, no clculo do erro padro,
somente acarretou alterao relevante no caso (a). Observe que no caso
(b) o tamanho da populao mais que vinte vezes o tamanho da amostra
(N > 20n). Nesse caso, poderamos ter usado a frmula mais simples do
erro padro.

172

EsrA1sriCA Apl iC/\dA s Ci ~NciAs SociAis

Esri ~1AO

Se a popula:~
tamanho da amos~

Exrnccios
15) Numa amostra aleatria simples de 120 domiclios, realizada m.~m certo
bairro da cidade, observou-se que apenas 33,3% possuam instalaes
sanitrias adequadas. Considerando que existam 460 domiclios no bairro,
encontre um inteIValo de 95% de confiana para a proporo de domiclios
com instalaes sanitrias adequadas.
16) Refazer os Exerccios 13 e 14, considerando o tamanho da populao.

9.5

Cl\phulo 9 -

TAMANHO MNiMO dE UMA AMOSTRA AlEATRiA siMplEs

tamanho da amos::a e

fixado o nvel d e ar':!basicamente d a '\"c


sua varincia (quaC..:
urna proporo, a -a_a2 =

......,

n; (1 - n;).

Na fase de planejamento de pesquisa que envolva um


levantamento por amostragem, urna das principais preocupaes o
nmero de elementos que precisaro ser pesquisados (tamanho da
amostra, n).

Como o pa...-.:::;:
clculo de n, co ne:~,~

No Captulo 3, descrevemos algumas tcnicas para a seleo de


uma amostra e apresentamos uma primeira frmula para a determinao
de seu tamanho . Com a teoria discutida neste capitulo, temos condies
de complementar a questo da determinao do tamanho da amostra,
s upondo o plano de uma amostragem aleatria simples.

uma pesquisa e_
Apre s entaremos .observao e mpr:cae _

As frmulas para o clculo do tamanho da amostra so extradas


das expresses dos intervalos de confiana, fixando a priori o nvel de
confiana e o erro amostral tolerado. Suporemos, tambm, que haja
condies para a observao de uma amostra razoavelmente grande, que
permita o uso da distribuio normal, na representao das distribuies
amostrais de X e de P.
Tendo o valor z da distribuio normal, em funo do nvel de
confiana desejado, como tambm E0 (erro amostral tolerado), podemos
obter o tamanho da amostra por uma das duas seguintes frmulas,
dependendo se o objetivo final estimar uma proporo ou uma mdia:
a ) para estimar uma proporo rc:

_ z 2 TC (1 - n:)
no 2
Eo
b) para estimar u ma mdia :
2

no =~
2
Eo

estudo anterior ou e.
realizada n a fase e fi:
o instrumento (que--.__
estimativa inicial ea p:"~

ExEMplo 9.5 Con s:c:!e:e,. - -"'"""


de peso das criar:es
ano letivo (Exem?lo 9 _
realizado num ou~ -.
crianas, que res~::c.
nvel de confiana e=. gramas (isto , E:: = ~ _
Solu-o: Nvel de cc.- .::_::.Usaremos , no luga;- ~ C"
. , . s2= ('_ .;~
a - "
mun1c1p10:
r
0
aleatria s imples :

CAprulo

9-

[ sTiMAO d E pAR\\1FTRO~

Se a populao for muito grande (digamos N> 20rlu), ento n0 j o


tama nho da amostra:
-~....-"'

realizada num certo


?Qssuam instalaes

- 5C domiclios no bairro,

n=n 0

S e o tamanho da populao for conhecido e n o for muito grande, o


tamanho da amostra dado por (expresso aproximada):

- ;;:uporo de domiclios

Nn
n=--
N+n 0

-:-o da populao.

Pelas frmulas apresentadas, podemos observar que, depois de


fixado o nvel de confiana e o erro tolervel, o tamanho da amostra depende
basicamente da variabilidade da varivel em estudo, representada pela
sua varincia (quadrado do desvio padro) , cr2 . No caso da estimao de
uma proporo, a varincia e xpressa em funo do parmetro n por:

a 2 =n (l-n) .
que envolva um
preocupaes o
~do s (tamanho da
:=

-~~--~....
s

p ara a seleo de
___.:;.para a determinao
--:lo.O, temos condies
--:.=ianho da amostra,

.....c-.............-....,,;;;...,s

so extradas
~ a p riori o nvel de
tambm, que haja
"el:nente grande, que
..,._..________ -o das distribuies
~stra

:Uno do ntvel de

----=:: :olerado) , podemos


::..::s seguintes frmulas ,
~::-o

ou uma mdia:

Como o parmetro <>2 aparece no numerador das expresses do


clculo de n, conclumos que, quanto mais heterognea for a populao
em estudo, maior dever ser o tamanho da amostra.
Uma dificuldade existente na fase do planejame nto amos tral de
u m a pesquisa que o parmetro cr 2 , em geral, d esconhecido.
Apresentaremos duas sugestes para contornar est e problema: (1)
observao e mprica e (2) argumentos tericos.
ObsrnvAO EMpRiCA

Pode mos usar no lugar de cr2 uma estimativa, S ~, obtida de algum


estudo ante rior ou de uma amostra piloto , isto , uma pequena amostra
realizada na fase de planejamento da pesquisa, com propsitos de avaliar
o instrume nto (questionrio), t reinar pesquisadores ou obte r alguma
estimativa inicial da populao.

ExEMplo 9.5 Considere, novamente, o problema de estimar o ganho mdio


de peso das crianas da rede municipal de ensino, durante o primeiro
ano letivo (Exemplo 9.2). Suponha que um estudo similar tenha sido
realizado num outro municpio, onde observaram uma amostra de 80
crianas, que resultou num desvio padro igual a 1,95 kg. Fixando o
nvel de confiana em 95% , e tolerando um erro amostral de at 200
gramas (isto , E0 = 0,2 kg) , qual deve ser o tamanho da amostra?
Soluo: Nvel de confiana de 95% acarreta z = 1,96 (ver Figura 9 .5).
Usaremos, n o lugar de o 2 , o valor da varincia da amostra do outro
mu nicpio: sg= (1,95) 2 = 3,8. Assim, o tamanho mnimo de u ma amostra
aleatria simples :

174

E~rAr~ricA

AplicA<lA ~ CirNciA'> SociAi~

CAprulo 9 - Esri\\ ~

= z 2 . 2 ~ z 2 . 5 2 = (1,9 6f-(3,8) = 365

E/

(o,2f

Eo2

Como N desconhecido, este j o tamanho da amostra (n = 1lo = 365


crianas).

comum, no clculo do tamanho da amostra, aproximar o valor z =


1,96 para z = 2 , pois, alm de facilitar as contas , compensa, em termos, o
erro introduzido pela substituio de cr2 por S. No Exemplo 9.5, usando z
= 2, obtemos como resultado: n =380 crianas. No caso de se usar uma
amostra piloto pequena, digamos, de tamanho m < 30, melhor substituir
z por t com gl = m - 1.

ARGUMENTOS TERiCOS: o CASO dE ESTMAO dE pnopORES

Muitas vezes, pela forma de mensurao da varivel, possvel obter


alguma avaliao sobre cr2 , ou, pelo menos, algum limite superior para
este parmetro. Uma situao particularmente interessante na
estimao de uma proporo n. Neste caso, a varincia pode ser expressa
em termos do parmetro n, da seguinte forma:
0 2

1C .

(1 - 1C) = 1C -

cr

= n:

ExEMplo 9.6 Cor:: e;


de uma eleio- r estimativas dos
devem ser pes ~ - ,_

Soluo: no "" _- ~ =

Como N
eleitores).

1C2

Ou seja, cr2 uma funo de segundo grau de n, cujo grfico (parbola)


mostrado na Figura 9 .8 . Observe que o valor mximo de cr2 ocorre quando
n = % . Nesse caso, cr2 = % % = Y4.
2

queremos esri,..,.,margem de e~~ E:


estabelecida, E-;r ,- -o nvel usual li= ..,
...,.

ExEMplo

de scc-T-.~~

9.7

~r - ::. _

de confiana. e ?=--- - -

( 1-n)

V4

Soluo: Dada a ~

'12

1t

Figura 9.8 O parmetro cr em funo da proporo rr.

Nos problemas de estimao de uma proporo, em que no temos


qualquer avaliao inicial sobre n, ou quando acreditamos que a proporo
n esteja prxima de 1 / 2 , podemos usar, no lugar de a 2 , o seu valor mxim o,
1
/ 4 . Assim,

Assim,

n = ,_,_ - --

CAprulo

<J - EsTi MAO

dE

175

PARM ETROS

?
1
z- -

-- =~ 5

z-

n ------E 2 - 4 E 2

..-:..=::::aostra (n = n0 = 365

_;x:::isa, em termos, o
-:- "" plo 9.5, usando z
::c.so d e se usar uma
- : ::nelhor substituir

:~pORES

_....:. .J, possvel obter


.:_.ite superior para
~ c.:.er essante na
~_?Ode ser expressa
-

- :::::;_'.::>grfico (parbola)
&;.;:==::.:: =z u2 ocorre quando

Em pesquisas de levantamento por amostragem, normalmente


queremos estimar vrias propores (vrios parmetros n), com dada
margem de erro, E0 . A expresso precedente garante a preciso
estabelecida, E0 , para as vrias estimativas. Nesta expresso, se usarmos
o nvel usual de confiana de 95%, temos z ,.. 2. Ento, a frmula do
tamanho da amostra para vrias propores :
no

1
= -2

Eo

ExEMplo 9.6 Com o objetivo de avaliar a preferncia do eleitor na vspera


de uma e leio para a prefeitura de um municpio, planeja-se um
levantamento por amostragem aleatria simples. Considere que seja
admissvel um erro amostral de at 2%, com 95% de confiana, para as
estimativas dos percentuais dos vrios candidatos. Quantos eleitores
devem ser pesquisados?
1
1
Soluo: no ::::: E/ = (o,o 2 )2 = 2.500
Como N desconhecido, este j o tamanho da amostra (n =
eleitores).

~ =

2.500

ExEMplo 9.7 Numa pesquisa epidemiolgica deseja-se estimar, com 90%


de confiana, o parmetro:
n

proporo de pessoas infectadas

com erro amostral mximo de 1o/o. Qual deve ser o tamanho de uma
amostra aleatria simples, supondo que, na populao em estudo, no
existam mais que 20% de indivduos infectados?
Soluo: Dada a informao que n s 0,20, ento o valor mximo de cr2 :
n(l-n) = (0,20)(1 -0,20)

= 0,16

Assim, .
que no temos
~=::s que a proporo
~ =seu valor mximo,
e:;:

?
(
n=n =z~rcl
- rc ) :::::(1,645)2 (0,16)= _
4 330
o
2
(O, 01 )2
Eo

176

E~1.41isrlcA

AplicAd A s CiF'\CiAs SociAi~

Dprulo 9 - Eri~1A:\o d:=

confiana p ara o :;e~


frustrados sexua!=e--

ExERccios
17) Com o objetivo de estimar o tempo mdio de um caixa eletrnico para atender
um cliente , planeja-se fazer um levantamento por amostragem. Qual deve
ser o tamanho d e uma amostra aleatria simples de clientes, para garantir
uma estimativa com erro no superior a 2 segundos, ao nvel de confiana de
95%? Suponha que se verificou, atravs de estudos anteriores, que o desvio
padro no passa de 8 segundos.

23) Numa amostra

a.:ea - -

contm cerca de 5C:

e.:.=..... ~

a)
b) Admitindo que =.

18) Deseja-se estudar as percentagens de ocorrncias de diversos atributos, numa

qual deve ser

comuntdade de 600 famlias. Qual deve ser o tamanho de uma amostra aleatria
simples, considerando erro mximo de 4% e nvel de confiana de 95%?

ExERccios coMpLEMENTARES
19) Nas situaes descritas abaixo, descreva qual a populao, a amostra, o
parmetro de interesse e uma estatstica que pode ser usada para estimar o
parmetro.
a) Para avaliar a p roporo de alunos do Curso d e Administrao favorveis
eliminao da disciplina de Estatstica do currculo, selecionou-se
aleatoriamente 80 alunos do Curso.
b) Para avaliar a eficcia de um curso que orienta como fazer boa alimentao
e exerccios fsicos, s elecionou-s e uma amostra aleatria de 20 p essoas
obesas de uma certa cidade.
c) Para avaliar uma campanha contra o fumo, conduzida pela prefeitura de
uma cidade, acompanhou-se uma amostra aleatria de 100 fumantes.

a)
b)

e)

25) Uma empresa re= _

empregados para ......


comida no refeiar-L 'E.=
se para o grau de ;;;;;_,...--:
a) Determine o .,,- - -

20) Um instituto de pesquisa observou uma amostra aleatria de 800 habitantes


de uma grande cidade. Verificou que 320 indivduos desta amostra apoiam a
administrao da prefeitura, enquanto que os outros 480 a criticam.
a ) O que se pode dizer sobre a percentagem de indivduos que apoiam a
administrao da prefeitura, dentre os indivduos da amostra?
b) O que se pode dizer sobre a percentagem de indivduos que apoiam a
administrao da prefeitura, dentre os habitantes da cidade?

b)

e)

Obs.: Em caso de estimativa, usar nvel de confiana de 95% .


21) Com o objetivo de avaliar a aceitao de um novo produto no mercado, planejase fazer um levantamento amostral para estimar a proporo de futuro s
consumidores desse produto.
a) Qual deve se r o tamanho de uma amostra aleatria simples, que garanta
uma estimativa com erro mximo de 5% e nivel de confiana de 99%?
b) Efetuou -se a amostragem conforme o tamanho calcu lado no item (a). F'oi
verificado que 200 pessoas desta amostra passariam a usar regularmente
o produto. Construa um intervalo de 99% de confiana para o parmetro
de interesse. Interprete o resultado.
22) Numa pesquisa realizada sobre uma amostra de 647 adolescentes em Santa
Catarina, 88 responderam que se sentiam frustrados sexualmente. Admitindo
que a amostragem tenha sido aleatria, construa um intervalo de 95% de

d)

Divulgado no

Jorn~ =-~

CAp1 ulo 9 - EsriMAO dE pAR~\lt:11<0~

177

confiana para o percentual de adolescentes catarinenses que se dizem


frustrados sexualmente.
~ eletrnico

para atender
- ~ostragcm . Qual deve
c:e clientes, para garantir
20 nvel de confiana de
~eriorcs, que o desvio

23) Numa amostra aleatria de 12 estudantes do Curso de Administrao, que


contm cerca de 500 alunos, levantou-se o grau de satisfao do aluno com
o Curso, numa escala de 1 a 5. Os resultados foram os seguintes:

2 2 3 3 3 3 4 4 4 4 5 5
a) Construa um intervalo de 95% de confiana para o nvel mdio de satisfao
dos alunos com o Curso.
b) Admitindo que a amostra do item anterior era apenas um estudo piloto,
qual deve ser o tamanho de uma amostra aleatria simples para que o
erro amostral no seja superior a 0,2 unidade, com 95% de confiana?

- C7-ersos atributos, numa


aleatria
..: rn.-iana de 95% ?

- ---';.j;;:r uma amostra

24) Para verificar a eficcia de uma dieta de emagrecimento, realizou-se um expe-

rimento com 10 indivduos, que se submeteram dieta por um periodo de um


ano. A variao de peso de cada indivduo, medido em kg, apresentada abaixo.
- 5 - 10 5 -20 -8 10 o -2 -8 - 1
a) Calcule a mdia, mediana e desvio padro da amostra.
b) Construa um intervalo de 95% de confiana para o parmetro , sendo
a reduo de peso esperada em um ano de dieta.
e) Considerando o resultado do item anterior, voc pode afirmar, com nvel
de confiana de 95% , que a dieta em questo realmente tende a emagrecer os indivduos?

;:"..4.lao, a amostra, o
s:- usada para estimar o

iazer boa alimentao


-=a-.ria de 20 pessoas

::..:::"Sta

amostra apoiam

..:.30 a criticam .

a
apoiam a

~-----:-.o

i-::::::~

mercado, planejade futuros

~poro

- "'--'...-:i.-

smiples, que garanta

-= confiana de 99%?

:::: E".:.lado no item (a) . Foi


~::::::::::..~ a u sar regularmente
S-- ica para o parmetro
--

~lescentes

em Santa

25) Uma empresa tem 2.400 empregados. Deseja-se extrair uma amostra de
empregados para verificar o grau de satisfao em relao qualidade da
comida no refeitrio. Em uma amostra piloto, numa escala de O a 10, obtevese para o grau de satisfao nota mdia igual a 6,5 e desvio padro igual a 2,8.
a) Determine o tamanho minimo da amostra, supondo um planejamento
por amostragem aleatria simples, com erro mximo de 0,5 unidade e
nvel de confiana de 99% .
b) Considere que a amostra planejada no item anterior tenha sido realizada.
A mdia dos dados da amostra foi 5,3 e o desvio padro foi 2,6 pontos.
Faa um intervalo de 99% de confiana para o parmetro .
c) Considerando o resultado do item anterior, voc pode afirmar, com nvel de
confiana de 99%, que se a pesquisa fosse aplicada nos 2.400' funcionrios, a nota mdia seria superior a cinco? Justifique.
d) Realizada a amostra planejada no item (a), suponha, agora, que 120
atriburam notas iguais ou superiores a cinco. Apresente um intervalo de
90% de confiana para a percentagem de indivduos da populao que
atribuiriam notas iguais ou superiores a cinco.
26) Uma pesquisa realizada por pesquisadores da Universidade Federal de Minas
Gerais, que se baseou em amostras de sangue de 250 pessoas brancas das
regies Norte, Nordeste, Sudeste e Sul, concluiu que por parte das ancestrais
mulheres, 39% da herana gentica dos brcl.Ilcos europeia, 28% negra e 33%
indgena.9 Supondo que a amostragem tenha sido aleatria, qual a margem de
erro de cada uma dessas estimativas, considerando nivel de confiana de 95% ?
9

Divulgado no Jornal Hoje - Rede Globo, cm 18 abr. 2000.

(Aprnlo 10

TESTES ESTATSTCOS dE HipTESES

uitas vezes o pesquisador tem alguma ideia ou conjetura sobre o


comportamento de uma varivel, ou de uma possvel associao entre
variveis. Nes te caso, o planejamento da pesquisa deve ser de tal forma
que permita, com os dados amostrais, testar a veracidade de su as ideias
sobre a populao em estudo. Adotamos que a populao seja o mundo
real e as ideias sejam as hipteses de pesquisa que podero ser testadas
por tcnicas estatsticas denominadas testes de hipteses ou testes de
significncia.

ExEMplo 10.1
a) Na problemtica de verificar se existe relao entre tabagismo e
sexo, em certa regio, pode-se lanar a seguinte hiptese: Na
regio em estudo, a propenso de fumar nos homens diferente
da que ocorre nas mulheres.

b) Para se verificar o efeito de uma propaganda nas vendas de certo


produto, tem-se interesse em verificar a veracidade da hiptese:
A propaganda produz um efeito positivo nas vendas.
c) Na conduo de uma poltica educacional, pode-se ter interesse
em comparar dois mtodos de ensino. Hiptese: Os mtodos de
ensino tendem a produzir resultados diferentes de aprendizagem.

Para verificar estatisticamente a veracidade de uma hiptese ,


precisamos de um conjunto de dados, observados adequadamente na
populao em estudo.

180

EsrnrsricA AplicAdA .s Ci~c,ciA' SociAIS

Antes de execu tar a coleta dos dados, torna-se fundamental fixar


claramente a populao a ser estudada, bem como a maneira pela qual
se vai observar as variveis descritas nas hipteses. Por exemplo, numi
hlptese de"-Ssciao entre sexo e tabgismo, dev~mos definir a regio
de abrangncia da pesquisa ou, mais precisamente, a populao a ser
estudada. Tambm devemos estabelecer uma forma de medir a varivel
tabagismo. Uma maneira razoavelmente simples de mensurar tabagismo
, a partir de critrios previamente estabelecidos, classificar os indivduos
em fumantes e no fumantes, gerando dados categorizados.
A Tabela 10. l apresenta os resultados da classificao de 300
indivduos, selecionados aleatoriamente de uma determinada populao,
segundo o sexo (masculino ou feminino) e tabagismo (/Um.ante ou no ju.m.ante).

Tabela 10.1 Distribuio de 300 pessoas, classificadas segundo o sexo e


tabagismo
Tabagismo
fum a nte
n o fumante
Total

Sexo
m asculino
92 (46%)
108 (54'Vol
200 (100%)

feminino
38 (38% )
62 162%)
100 {lOOOA>)

Total
130 (43%)
170 157%)
300 1100%)

Na amostra, a percentagem de homens fumantes (46%) diferente


da percentagem de mulheres fumantes (38%); os dados parecem
comprovar a hiptese de que existe diferena entre homens e mulheres,
quanto varivel tabagismo. Contudo, no devemos nos esquecer de
que estamos examinando uma amostra e, consequentemente , as diferenas observadas podem ter ocorrido por fatores casuais, de tal forma
que, se tomssemos outras amostras da mesma populao, sob as
mesmas condies, as concluses poderiam ser diferentes.
A aplicao de um teste estatstico (ou teste de significncia) serve para verificar se os
dados fornecem evidncia suficiente para que se possa aceitar como verdadeira a hiptese
de pesquisa, precavendo-se, com certa segurana, de que as diferenas observadas
nos dados no so meramente casuais.

10.1 As HipTESES dE

uM TESTE ESTATsTico

Dado um problema de pesquisa, o pesquisador precisa saber escrever


a chamada hiptese de trabalho ou hiptese nula, H0 . Essa hiptese

c ..prulo

10 -

TESTES ESP-

descrita em termos d: ---- negao daquilo qu


diferenas observadas

ExEMplo 10.1 (coMi '-t~os problemas desc:::

b) H 0 :
pro~

e) H 0 :

resU::.a:bs.

Quandoos datl::.::s~~

nula, H 0 , falsa, o
hiptese alterna~
pesquisador que:considerando a fo,~

ExEMplo 10.1 (coMhr~-

b) H 1:
c) H 1 :

comumH
populacionais , e nq"-a..:
diferente).
No Exemplo :3.
duas propores (H:: e nm a proporo de~
outro lado, a hiptese
item (b), as hipte ses
maneira: H 0 : e = . e propaganda e s o -.a ~

JC>.d .\ s CiNCiA\ SociAis

a maneira pela qual


c:::::::;:::::;::::::::-~?or exempio, numa
~os definir a regio
"'"----- --...=-. a populao a ser
--=::=2. de medir a varivel
:.:= = ensurar tabagismo
...2.SSificar os indivduos
de 300

CAphulo 10 - TESTES

Esr11rsrico~

dE

k ipTFS f~

181

descrita em termos de parmetros populacionais e , basicamente, uma


negao daquilo que o pesquisador deseja provar. Sob essa hiptese, as
diferenas observadas nos dados so consideradas casuais.

ExEMplo 10.l (CONTiNUAO) Podemos ter as seguintes hipteses nulas para


os problemas descritos anteriormente.
a) H 0 : A proporo de homens fumantes igual proporo de
mulheres fumantes , na populao em estudo.
b) H 0 : Em mdia, as vendas no aumentam com a in troduo da
propaganda.
c) H0 : Em mdia, os dois mtodos de e nsino produzem os mesmos
resultados.

Total
130 (43%)
170 57%
300 100%

(4 6%) diferente
os dados parecem

~-:es

Quando os dados mostrarem evidncia suficiente de que a hiptese


nula, H0 , falsa, o tes te a rejeita, aceitando em seu lugar a chamada
hiptese alternativa, H 1 . A hiptese alternativa , em geral, aquilo que o
pesquisador quer provar, ou seja, a prpria hiptese de pesquis a,
considerando a forma do planejamento da pesquisa.

ExEMplo 10.1

(CONTiNUAO) As hipteses alternativas.

a) H1 : A proporo de homens fumantes diferente da proporo


de mulheres fumantes, na popu lao em estudo.
b) H 1: Em mdia, as vendas aumentam com a intro duo da
propaganda.
c) H 1 : Em mdia, os dois mtodos de ensino produzem resultados
diferentes.

- - - -' ~ para verificar se os


~:> verdadeira a hiptese
as a:ferenas observadas

-.-'-'---- - ;.recisa saber escrever


=:.a.. :10 . Essa hiptese

igualdade de parmetros
populacionais, enquanto H 1 e m forma de desigualdade (maior, menor ou
diferente) .
comum H0 ser apresentada em termos de

No Exemplo 10.1, item {a), H0 descrita em termos de igualdade de


duas propores (H0 : n h = 7tm ' onde nh a proporo de homens fumantes
e 7tm proporo de mulheres fumantes, na populao em estudo). Por
outro lado, a hiptese alterna tiva pode ser e scrita como H 1 : n h -:t: n m. J no
item {b), as hipteses podem ser escritas em termos de mdias da seguinte
maneira: H0 : e = se H 1: e > s, onde e o valor mdio das vendas com
propaganda e o valor mdio das vendas sem propaganda. E em {c)?

182

EsTATsrlcA AplicAdA s Cit~ CiAs

SociAis

-ADTulo 10 - TE5TF'i EST~~

ExEMplo 10.2 Suponha, por exemplo, que se suspeite que u ma certa moeda,
usada num jogo de azar, viciada, isto , h urna tendncia de ocorrerem
mais caras do que coroas, ou mais coroas do que caras. Entendendo-se
como moeda honesta aquela que tem a mesma probabilidade de dar cara
e coroa, podemos formular as hipteses da seguinte maneira:
H 0 : a moeda honesta e

H 1 : a moeda viciada

Se chamarmos n probabilidade de ocorrer cara num lanamento


dessa moeda, podemos escrever:
H0 : n

0,5 e H 1:

7t

* 0,5

10 .2 CoNCEiros bsicos

Para realizar probabilidade de occ:::;::m


amostra 8), em 10 >- ;::;=---precisamos da dis~
s u pondo H 0 verd~s
referncia bsica pc:==; L-- ~
e ntre H 0 e H 1.

No exemplo e~

n = 10 e n = 0,5
Usaremos o Exemplo 10.2 p ara a presentar alguns conceitos.
Suponhamos , inicialmente, H 0 como verdadeira. H0 somente vai ser
rejeitada em favor de H 1, se houver evidncia suficiente que a contradiga.
A existncia dessa possvel evidncia ser verificada num conjunto de
observaes relativas ao problema e m estudo (amostra). No presente
exe mplo, a amostra consis te de n lanamentos imparciais da moeda.

~,,.

referncia para o \-a"'~


a presenta a distril:T.'""- ;,As probabilidades.?.-.
(Tabela 2 do apnC.~
foram arredondadas~~.
p(y )

Em cada lanamento da moeda, observamos um resultado: cara ou


coroa. Ao observar n lanamentos, podemos computar o valor da estatstica:
Y = nmero total de caras nos n lanamentos

A e s tatstica Y poder ser u sada na definio de um critrio de


deciso:
Aceitar H0 ou
Rejeitar H 0 em favor de H1.

Neste contexto, a estatstica Y chamada de estatstica do teste.


Sejam n = 10 lanamentos e as duas seguintes amostras:
AMOSTRA A - Suponha que nos 10 lanamentos observamos Y = 10 caras.
Podemos rejeitar H0 e m favor de H 1?
AMOSTRA B - E se tivssemos observado Y = 7 caras?

Na amostra A, intuitivo que existe mais evidncia para rejeitar H0 .


Contudo, em nenhuma das duas situaes podemos rejeitar H0 com a
certeza de que H0 falsa, pois estamos trabalhando com um fenmeno
aleatrio, em que plenamente possve l nos 10 lanamentos de uma moeda

da moeda, sob -::

podemos avaliar me-- -.com base na amos~


resultados mais pw G.. -::i:!:
valor central da dis~

.\PlicAdA s CiNCiAs SociAis

- - "".Je u ma certa moeda,


- :;e:=dncia de ocorrerem
;::a..""as. Entendendo-se
-:::iabilidade de dar cara

--=

.....--...._~ :::a.- a num lanamento

18~

CApirulo 10 - Tcsrcs ESTArsricos de l 1ipTESES

sabidamente honesta (H 0 verdadeira), ocorrerem 7, 8, 9 ou at mesmo 10


caras! Por outro lado, se a ocorrncia de u m certo resultado for muito
pouco provvel para uma moeda honesta, natural decidirmos por H 1 .
Para realizar o te ste estatstico, necessrio conhecer a
probabilidade de ocorrerem Y = 10 caras (amostra A), ou Y = 7 caras
(amostra B), em 10 lanamentos de uma moeda honesta. Mais geralmente,
precisamos da distribuio de probabilidades da estatstica do teste Y,
supondo H 0 verdadeira. Esta distribuio de probabilidades ser a
referncia bsica para analisarmos o resultado da amostra e decidirmos
entre H 0 e H 1.

Disrnibuio dE REfrnNciA

----~g-.ins
=-a_

conceitos.

H 0 somente vai ser

--=-..=::~e

que a contradiga.
num conjunto de
z:::lostra). No presente
-.::Ja:ciais da moeda.
~a

-"--,, ::::n resultado:

No exemplo em questo, Y tem distribuio binomial com parmetros


n = 10 e n = 0 ,5 (supondo H 0 verdadeira) . Esta ser a distribuio de
referncia para ovalor calculado da estatstica do teste, Y. A Figura 10.1
apresenta a distribuio de referncia do presente tes te, sob forma grfica.
As probabilidades, p(y), foram obtidas na tabela da distribuio binomial
(Tabela 2 do apndice). Para facilitar a exposio, essas probabilidades
foram arredondadas para trs decimais.
p(y )

0,246

cara ou

0,20 5

0,205

---==-a valor da estatstica:


0, 1 1 7

""20

0,117

de u m critrio de
0,044

-=estatstica do teste.
=-=?
::-::-X:-acia para rejeitar H0 .
~ rejeitar H com a
0
---------~

com um fenmeno

~ntos de

uma moeda

0,044

o
2
3
4
s
6
7
8
9
10
y
Figura 10.1 Distribuio da estatstica Y = nmero de caras em 10 lanamentos

da moeda, sob H0 (binomial com n = 10 e rr = 0,5).

Com a distribuio de probabilidades da estatstica do tes t e ,


podemos avaliar melhor a adequao de H0 com o resultado de Y, calculado
com base na amostra. A Figura 1O.1 mostra que se H0 for verdadeira, os
resultados mais provveis esto em tomo de 5 caras. Chamaremos este
valor central da distribuio de probabilidades de valor esperado ou valor
mdio, e o denotaremos por .

184

EsrArsricA Alic:AcJ,, s

YAlOR

Ci~NCiAs

SociAis

CAprulo 10 - Tt'> i t~ tsrAris

p (yJ

Supondo H0 verdadeira, a probabilidade de significncia; ou valor


p , a proba bilidade de a estats tica do teste acusar um resultado to ou
mais distante do e sperado por H 0 , como o resultado da amostra observada .

ExEMplo 10.7 Retomemos amostra A, em que observa mos Y = 10 caras em


n = 10 lanamentos da moeda em estudo. Cons iderando o nmero
esperado de caras sob H 0 ( = 5) como referncia, verificamos que to ou
mais dii;;tante do que o valor observado na amostra (Y = 10), encontra -se
o valor O e o prprio valor 10, como ilustra a Figura 10.2.
p(y)

o .246
o .20 5

0 ,205

0,117

0 . 117

0,04 4

0 .04 4

o.o
o

..

t)l

10

Esta se gunea
verdadeira), tem-SE ~. ~
to ou mais dis~~
neste caso (Y = ~ ~
desprezvel, mais ;;:-----

Figura 10.2 Distribuio de Y, sob H0 As setas indicam os valores que distam


do esperado, = 5, to ou mais do que o valor Y = 10, observado na amostra A..

No h evid~=--

Consequentemente, a probabilidade de significncia ser:


p = p(O) + p (lO)

= 0,001

+ 0 ,001 = 0 ,002 (ou 0 ,2% )

Ou seja, para uma moeda h one sta (H 0 verdadeira), tem-se a pequena


probabilid ade p = 0,002 de ocorrer um resultado to ou mais distante do
valor espera do, como o que, de fato, ocorreu neste caso (Y = 10 caras).
Como p = 0,002 uma probabilidade muito pequena , natural rejeitar a
hiptese de que a moeda honesta (H0 ), de cidindo-se pela h iptese de
que a moeda viciada (H 1) .
Os dados mostram evidncia suficie nte para dizer que a moeda
viciada!

O valor p aponta o
hiptese verdadeira.

Quanto menc:- .::valor p tambm poC.= =>f


errada aps a obse:--c.;afirmssemos que a!::.
n = 1O lanamen~~
estarmos fazendo u:r;:;.c.

ExEMplo 10.4 Vejamos, agora, a amostra B, e m que observamos Y = 7 caras


em n = 10 lanamentos. Nesta amostra, to ou mais distante do que o
valor Y= 7 so encontrados os valores: 7, 8 , 9 , 10, O, 1, 2 e 3, como ilustra
a Figura 10.3.

confirmar ou refu ~ ~
probabilidade tale.. .;.~.

>.pliCAd"' s Cl1\CiA~ SociAis

CAprulo

10 -

TESTES ESTATSTicos

de

185

l1ip61c~~~

p(y)

o ,246
o ,205

0,205

6! significncia, ou valor
-sa:-urn resultado to ou
--~--- da amostra observada.

o . l 17

O,l 17

0.044

Y = 1O caras em
:::siderando o nmero
~erificamos que to ou
Y = 10), encontra-se
- --~a. 10.2.
~:-amo s

---e.

0,044

fi

\..

fi

Figura 10.3 Distribuio de Y, sob H0 As setas indicam os valores que distam


do esperado, = 5, to ou mais do que o valor Y = 1 , obseivado na amostra B.

Temos, ento , a seguinte probabilidade de significncia:

p(O) + p(l) + p(2) + p(3) + p(7) + p(8) + p(9) + p(lO) =


0,001 + 0,010 + 0,044 + 0,117 + 0,117 + 0,044 + 0,010 + 0,001
= 0,344 (ou, 34,4%) .
=
=

Esta segunda situao mostra que, para uma moeda honesta (H0
verdadeira), tem-se a probabilidade p = 0,344 de ocorrer um resultado
to ou mais distante do valor esperado, como o que, de fato, ocorreu
neste caso (Y = 7 caras). Como p = 0,344 no uma probabilidade
desprezvel, mais prudente no rejeitar H0 .

~nO .OOl
9

10

.<!

'Ci:cres que distam


na amostra A.

~::-1?!:5:1.

No h evidncia suficiente para afirmar que a moeda viciada!

O valor p aponta o quo estranho foi o resultado da amostra, se supusermos H0 a


hiptese verdadeira.

Ci

::izer que a moeda

-.. .:iservamos Y = 7 caras


--..aj s distante do que o
- :. 2 e 3, como ilustra

Quanto menor for o valor p, maior a evidncia para rejeitar H0 O


valor p tambm pode ser interpretado como o risco de se tomar a deciso
errada aps a observao da amostra, caso se rejeite H 0 . Por exemplo, se
afirmssemos que a moeda viciada com a evidncia de Y = 7 caras, em
n = 10 lanamentos, estariamos incorrendo num risco de 34,4% de
estarmos fazendo uma afirma.o errada.

NvEl dE siqNificNciA
Ainda na fase do planejamento de uma pesquisa, quando desejamos
confirmar ou refutar alguma hiptese, comum estabelecer o \-alor da
proba bilidade tolervel de incorrer no erro de rejeitar H0 , quando H 0

186

Es1MsrtCA Aplici'd" s Ci'\CiA.s SociAis

verdadeira. Este valor conhecido como nvel de s ignificncia do t este


e designado pela letra grega a. Em pesquisa social, comum adotar
nvel de significncia de 5%, isto , a = 0,05 .
Estabelecido o nvel de significncia a, tem-se a seguinte regra geral
de deciso de um teste estatstico:
p > a

aceita H 0
rejeita H 0 , em favor de H 1

Observamos:::.....

Exrnplo 10J (coNTNUAo) Seja o nvel de significncia de 5% (a = 0,05). Na


amostra A, quando observamos dez caras em dez lanamentos, o teste
estatstico rejeita H 0 , em favor de H 1 (pois a probabilidade de significncia,
calculada com base na amostra, foi p = 0,002 e, portanto, menor do que o
valor adotado para a) .

ExEMplo 10.4 (CONTNUAO) Seja a= 0,05 . Na amostra B, quando observamos


sete caras em dez lanamentos, o teste estatstico no rejeita H0 , porque a
probabilidade de significncia, calculada com base na amostra, foi p = 0,344;
que no menor do que o valor adotado para a.

Quando o teste rejeita H0 em favor de H 1 (p ~a), a probabilidade de se


estar tomando a deciso errada , no mximo, igual ao nvel de significncia
a adotado. Desta forma, temos certa garantia da veracidade de H 1 .
Uma interpretao um pouco diferente dada quando o teste aceita
a h iptese n ula H 0 (p >a) . Neste cas o, podemos dizer: os dados esto em
conformidade com a hiptese nula! Isto no implica, contudo, que H0 seja
realmente a hiptese verdadeira, mas que os dados no mostraram
evidncia suficiente para rejeit-la e , por isso, continuamos acreditand o
em sua veracidade . Conforme Ronald A. Fisher, conhecido como o pai da
estatstica experimental (FISHER, 1956, p . 16):
A hiptese nula pode ou no ser impugnada pelos resultados de um
experimento. Ela nunca pode ser provada, mas pode ser desaprovada no
curso da experimentao.

Estabelecido um nvel de significncia a antes da observao dos


dados, temos as seguintes possibilidades:

H0 , n o temos con:::S
probabilidade de oc~
proba?ilidade ~ ~ ~
u ma lmguagem ma:s C::::...::.::::

p rovaram

estatisru:;:;:;-~

suave quando o te~

suficiente de que a - ---

Exrnccios
1) Seja n a probabL::::::.z.:::
"" 0,5. Lana-se :~
Usando a tabela t:=

2 ) Adotando o nvel ::.= item do Exerccio :

3) possvel, para -- 1%, mas rejeit-z20

10.7 TEsrEs u r\ iL~r::e.'._


favor de H 1 : n;t 0,5. se quanto muito grande~

....,

CAprulo 10 - TESTES Esr,,1s1ico~ dE kip1EsEs

--=.: 1:.r significncia do teste

Realidade
(desconhecida)

sx:=l.8.l, comum adotar

Ho verdadeira
-~ a seguinte

regra geral
Ho falsa

r--------..ade 5% (a= 0,05). Na


:.anamentos, o teste
~-~.:c:
....a.a.d e de significncia,
..---.anto, menordo que o

-==

187

Deciso do teste
Aceita Ho
Re eita Ho
Deciso
Erro tipo I
correta
(Probab. =ex)
Erro tipo II
Deciso
Probab. =
correta

Observamos no esquema que, se o teste rejeitarH 0 , temos controle


do risco de erro (probabilidade igual a a). Por outro lado, se o teste aceitar
H 0 , no temos controle do risco de erro. No esquema, representamos a
probabilidade de ocorrer o erro tipo II como ~ ' mas, ao contrrio de a, a
probabilidade ~ no fixada a priori. Em razo disso, estamos usando
uma linguagem mais enftica quando o teste rejeita H 0 (p. ex., os dados
provaram estatisticamente que a moeda viciada) e uma linguagem mais
suave quando o teste aceita H 0 (p. ex., os dados no mostraram evidncia
suficiente de que a moeda viciada, portanto admite-se que ela honesta).

~:=:;;:;a.3

quando observamos
H 0 , porque a
::::;.CCTlostra~ foi p = 0,344;

-~__..~ rejeita

a probabilidade de se

Exrnccios
1) Seja na probabilidade d e cara de uma certa moeda. Sejam H0 : rr = 0,5 e H 1: rr
~ 0,5. Lana-se 12 vezes esta moeda, observando-se o nmero de caras.
Usando a tabela"da distribuio binomial (Tabela 2 do Apndice), obtenha a
probabilidade de significncia para cada um dos seguintes resultados:
a) 1 cara;
b) 4 caras e
c) 11 caras.
2) Adotando o nvel de significncia de 5% , qual a concluso do teste em cada
item do Exerccio 1.
3) possvel, para uma mesma amostra, aceitar H0 ao nvel de significncia de
1%, mas rejeit-la ao nvel de 5%? E o inverso? Exemplifique.

-=ontudo, que H0 seja


c:.G.rlos no mostraram
~-~
~uamos acreditando
.....- -ecido como o pai da

- . . -..... ::ie..os resultados de um


-=e ser desaprovada no

10.7 TESTES u iilATRAiS E bilATERAiS


No teste discutido no tpico anterior, a rejeio de H0 : n = 0,5, em
favor de H 1 : n =t 0,5, se d tanto quando ocorre um valor muito pequeno,
quanto.muito grande de caras. Essa uma situao tpica de teste bilateral
Existem situae s em que pretendemos rejeitar H0 somente num
dos sentidos. Por exemplo, se suspeitamos que a moeda tende a dar mais
caras do que coroas, ento, sendo na probabilidade de ocorrer cara, o
teste pode ser formulado da seguinte maneira:

188

fa rA1s1iCA AplicAdl\ ~ CihCiA5 Sor.iAi~

lprulo 10 -

Com essas hipteses , s faz sentido rejeitar H0 , em favo r de Hl' s e


na amostra ocorrer um nmero significativamente maior de caras do que
de coroas, resultando no que chamamos de teste unilateral.
Um teste pode ser unilateral ou bilateral, dependendo do problema em estudo. Nos
testes unilaterais, a probabilidade de significncia computada em apenas um dos
lados da .distribuio de referncia.

EXEMplo 10.5 Considere que , para testar H0 : rr = 0,5 con tra H 1: n > 0,5,
tenhamos lanado a moeda n = 10 vezes e observado Y = 7 caras. A
probabilidade de significncia ser:
p = p(7) + p(8) + p(9) + p(lO) = 0,117 + 0,044 + 0,010 + 0,001 =O, 172

H 0 : n = 0,5 (o C:~~---~-
n o de~.:

sorvete com odor -:e-;:


podemos deduzir cr....:e
binomial com n = 8 e .- =
Os resultados::.-=
seis indicaram corre-- a distribuio bi.::m=:;A
probabilidade de sig;- .::.

que corresponde metade da probabilidade de significncia do tes te


bilateral, discutido no Exemplo 10.4. Com o nvel de significncia de 5%,
o teste no rejeita H0 (pois, p >a.) . Veja a Figura 10.4.
0.2 46

ITT"'

0. 0 21

d.

? 1
1

[ .

1
4

1
5

t~

p (6} +

p~

- -

Exrnccios
4)

~O H

1
6

...i

diferena de odor em

1 0 . 117

0,117

EST_,__,

Cha mando de -

H0 : 7t = 0,5 (a moeda honesta) e


H 1 : n > 0,5 (a moeda tende a dar mais caras do que coroas).

PIY)

TF~t~

<)

R fi 11

5)

<

0 ,5 . Lana-se

:~

Figura 10.4 Ilustrao do clculo da probabilidade de significncia de um

Usando a tabela eia --_

teste unilateral (Exemplo 10.5).

probabilidade de ':--""'a) l cara; b) 4 crua::.,, e

ExEMplo 10.6 (TEIXEIRA; MEINERT; BARBETTA, 1987, p . 137) Com o objetivo de testar se a diferena de odor em sorvetes de morango percebida por degustadores, efetuou-se o seguinte experimento: para cada
um dos 8 (oito) degustadores selecionados para o experimento, foram
dadas, em ordem aleatria e sem identificao, d uas amostras de sorvete, sendo uma com odor mais forte e outra normal. As amostras de
sorvete foram elaboradas de forma to similar quanto possvel, c om
exceo da intensidade de odor, que a caracte rstica e m estu do.

10 .4 Uso dE disTt?
Os exemplos de
amostras de tarnan!-!._
dis tribuio binomi

=-

.. ~

CAprulo 10 - Tcsrcs csrArsrcos de liiprcscs

......:. ~.:>

que coroas).

-?~. em

favor de H 1 , se
-~--- ~aio r de caras do que

Chamando de n a probabilidade de o degustador acusar


corretamente a amostra de sorvete com odor mais intenso, temos interesse
em testar as seguintes hipteses.
H0 : n = 0,5 (o degustador chuta a resposta, isto , o odor mais intenso
no detectado) e
H 1: n > 0,5 (existe uma tendncia de o degustador perceber o sorvete
que tem o odor mais intenso) .

- -;...<ilateral.
~hlema

em estudo. Nos
-.:,.;a em apenas um dos

- ""' - 5 con tra H 1: n > 0,5,


~do Y = 7 caras. A
-

- =-;)10 + 0,001=0,172

Seja Y o nmero de degustadores que indicam corretamente o


sorvete com odor mais intenso. Pelas caractersticas do experimento,
podemos deduzir que se H 0 for correta, a estatstica Y tem distribuio
binomial com n = 8 e n = 0 ,5.
Os resultados do experimento mostraram que dos oito degustadores,
seis indicaram corretamente o sorvete de odor mais intenso (Y= 6). Usando
a distribuio binomial (Tabela 2 do apndice), podemos computar a
pro habilidade de significncia:

~ ~cncia

do teste
- =significncia de 5%,

189

p = p(6) + p(7) + p(8) = 0,109 + 0,031 + 0,004 = 0,144

Assim, se estamos trabalhando com o nvel de significncia de 5% (a.


0,05), a hiptese nula no pode ser rejeitada. Portanto, conclumos que os
dados resultantes do experimento so insuficientes para se afirmar que a
diferena de odor em sorvetes de morango seja percebida pelos degustadores.
=

Exrnccios
4)
e:>
y
e:_ ~raiicia

de um

Para cada um dos itens do Exemplo 10.1 , descrever qual abordagem


(unilateral ou bilateral) mais apropriada.

5) Seja it a probabilidade de cara de uma certa moeda. Sejam H0 : n = 0,5 e H 1 : n


< 0 ,5. Lana-se 12 vezes esta moeda, observando-se o nmero de caras.
Usando a tabela da distribuio binomial (Tabela 2 do apndice), obtenha a
probabilidade de significncia para cada um dos s eguintes resultados:
a ) 1 cara; b) 4 caras; e c) 6 caras .
Usando nvel de significncia de 5%, em quais casos acima o teste rejeita H0 ?

=~--

p. 137) Com o objee m orango perce~:-=...;nen to : para cada


--- =experimento, foram
=-as amo s tras de sor- _::::ai As amostras de
------ ..::anto possvel, com
-;-:,.. ~ca em estudo.

10.4 Uso dE disrnibuiEs ApRoxi MAdAs


Os exemplos de testes de hipteses discutidos at aqui usavam
amostras de tamanho pequeno, o que permitia o uso da tabela da
distribuio binomial no clculo das probabilidades de significncia. Em

190

E~rAr~ricA Apl icAdA s CiNCiAs SociAis

experimentos binomiais, quando o tamanho da amostra, n, for grande, a


probabilidade de significncia pode ser obtida, de forma aproximada, pela
distribuio normal de parmetros: 1
p=ntr

.jn n (1-

n)

ExEMplo 10.7 Considere que, para testar H 0 : n = 0,5 contra H 1: n > 0,5, onde
n a probabilidade de cara de uma certa moeda, tenham sido realizados
n = 40 lanamentos, dos quais 28 deram caras. Este resultado leva
rejeio de H 0 , em favor de H 1 , ao nvel de significncia de 5%?
Soluo: Como n grande, vamos calcular a probabilidade de significncia

pela distribuio normal. Levando-se em conta que o teste unilateral


(H 1 : n > 0,5), a probabilidade de significncia vai se identificar com uma
rea na cauda superior da curva normal. Considerando o resultado
observado, Y = 28 caras, e aplicando a correo de continuidade (Seo
8 .4, Captulo 8 ), a probabilidade de significncia corresponde rea acima
do ponto 27,5, como ilustra a Figura 10.5.

(Aprulo 10 - TEsTts ESTATS

Usando ~ :z...
apndice), encontra='.:s igual a 0,0089. Teircs. ~
o valor p. Como ? =
adotado (a = 0,05). o~~
mais caras do que CC7'--2S.

ExERCcios
6)

Refaa os clculos =.. -

resultados.
7) Seja na probabili;;""~
H 0 : n = 0,5 contra:-:: . "i: >
se 31 coroas.
a) O teste reje ita :=__, ~.

b) E se
8)

estivsserr;:;~

(LEVIN, 1985, p.

._-:..,-.___....

~i-=- ~

nmero 1 ou 2, co=:---=os pedaos de po. :::--

20

27,5

a.firmar, com

z
2,37
Figura 10.5 Obteno de uma probabilidade de significncia
atravs do modelo normal.
Para realizar o clculo da rea indicada na Figura 10.5, precisamos
calcular os parmetros do modelo normal:

= (40). (0,5 ) = 20

(J'

= X

- ,u
(J'

'

aula foi aplica do ;.:=


aluno. Ao final do =-:::.
quem melhorou e =que melhoraram e::::::
para se afirmar C!CE :

.j(40) . (0,5) . (0,5) = 3, 16

O valor 27,5 da escala original (escala x) corresponde ao seguinte


valor padronizado (escala z):

ne~

degustadores cor:ses~ _
9) Quarenta pessoas s:: - -

27,5 - 20
3,16

10 .5 ApliCAO dE ltS -

2,37

Vimos no Capitulo 8 que vale a aproximao normal se: (a) n. rr ::: 5 e (b) n ( ! - 1t)
onde 1t o valor declarado em H0 .

~ 5,

For mu lada u~a pesquisador precisa p:a ....


adequado situao. ~.'.';:;.s
testes bastante a plica:s1=-

CAprulo 10 - TESTES ESTArsricos dE 1-liprEsEs


~2::ostra,

~ :orma

n, for grande, a
aproximada, pela

~ co::itra H 1 :

n > 0,5, onde


:.enham sido realizados
- - Este resultado leva
- -..,eia de 5%?

191

Usando a tabela da distribuio normal padro (Tabela 4 do


apndice), encontramos para z = 2,37 a rea na cauda superior da curva
igual a 0,0089 . Temos, ento,p = 0,0089. Sendo o teste unilateral, este j
o valor p . Como p = 0,0089 me n or do que o n vel de significncia
adotado (a = 0,05), o teste rejeita H0 , concluindo que a moeda tende a dar
mais caras do que coroas.

- ---dade de significncia
~.:e o teste unilateral
se identificar com uma
.. - =;:::rerando o resultado
:..= continuidade (Seo
:r.::;esp:mde rea acima

ExERCcios
6 ) Refaa os clculos do Exerccio 1, usando a distribuio normal. Compare os
resultados.
7) Seja n a probabilidade de coroa de uma certa moeda. Com o objetivo de testar
H0 : n = 0 ,5 contra H 1 : n > 0,5; fizeram -se 50 lanamentos desta moeda, obtendose 31 coroas.
a) O teste rejeita H0 ao nvel de significncia de 5% (a = 0,05)?
b) E se estivssemos trabalhando com o nvel de significncia de 1% (a = 0,0 l )?
8 ) (LEVIN, 1985, p. 274) Para testar se consumidores habituais de determinada
margarina eram capazes de identific-la num teste comparativo com ou tra
margarina, foi realizado o seguinte experimento: 20 consumidores habituais
da margarina A provaram, cada um, em ordem aleatria, 2 pedaos de po um com A e outro com B (margarina desconhecida); cada degustador, aps
provar os 2 pedaos de po com margarina, procurou identificar A, dizendo o
nmero 1 ou 2, conforme a ordem - sempre casual - em que tenha recebido
os pedaos de po. No houve comunicao en tre os degustadores. Ao cabo
do experimento, verificou-se que 15 respostas e stavam corretas. Pode-se
afirmar, com nvel de s ignificncia de 5%, que h uma tendncia d e os
degustadores conseguirem, d e fato , reconhecerem A?
9 ) Quarenta p essoas se matricularam num curso de escrita criativa. Na primeira
aula foi aplicado um tes te para verificar a capacidade de escrever de cada
aluno. Ao final do curso foi aplicado novo teste. Um especialista verificou
quem melhorou e quem piorou sua capacid ade de escrever, encontrando 30
que melhoraram e 10 que pioraram. Estes dados mostram evidnci suficiente
para se afirmar que o curso tende a melhorar a capacidade de escrita?

C.5) = 3,1 6
~nde

ao seguinte

... ~ 5 e (b) n (1-n) "'= 5,

10.5 ApliCAO dE TESTES ESTATSTiCOS NA pESQUiSA


Formu lada uma pergunta ou uma hiptese de pesquisa, o
pesquisador precisa planejar a coleta de dados e um teste estatstico
adequado situao. Nos captulos seguintes, sero apresentados alguns
testes bastante aplicados em pesquisas nas reas das cincias humanas

192

EsrArsrlcA Apl icAdA s Ci~i\CiA~ Soc11,is

e sociais. Eles se diferenciam, basicamente, pelo tipo de problema que se


pretende resolver e pelo tipo de varivel em estudo. Existem testes voltados
para variveis quantitativas, em que normalmente as hipteses so
apresentadas em termos de mdias e testes voltados para variveis
qualitativas, em que as hiptese s so apresentadas em termos de
propores ou probabilidades de eventos. Os exemplos deste captulo esto
no segundo caso.

b)

valor anunciac.~ .
c) Dois mtodos~~ -,,

Em geral, na aplicao de um teste estatstico , devemos saber :


a) formular H0 e H 1 em termos de parmetros populacionais;
b) como obter a estatstica do teste (no exemplo da moeda, Y = nmero
de caras);

c) qual a distribuio de referncia para calcular o valor p (no


exemplo da moeda a distribuio binomial- ou a normal quando
n grande);
d) quais as suposies bsicas para o uso do teste escolhido (no
e xemplo da moeda, supusemos que os lanamentos foram
imparciais e realizados sob as mesmas condies - amostragem
aleatria simples).

b)
e)

que se tenha acu>~--~


o pesquisado! d:=e
12) Com o objetivo de

a)
b)

A deciso do teste estatstico feita pela comparao do valor p


com o nvel de significncia a preestabelecido, mas a implicao do
resultado estatstico depende da aplicao em questo. Por exemplo, num
estudo experimental, normalmente a deciso do teste estatstico implica
numa relao de causa e efeito, mas num estudo de levantamento, o
resultado do teste usualmente leva apenas a uma concluso de diferena
entre grupos.

Hoje em dia, o clculo da estatstica do teste e a obteno do valor

b)

p tomaram as tarefas relativamente fceis com o auxilio do computador. Ou

c)

seja, o pesquisador no mais precisa ter habilidades em clculos algbricos


para realizar testes estatsticos. Por outro lado, a anlise do problema de
pesquisa, o planejamento da cole ta dos dados, a escolha do teste
estatstico, a verificao das suposies e a correta interpretao do
resultado estatstico exigem conhecimento, raciocnio lgico e maturidade.

Exrnccios coMpLEMENTAREs
10) Para cada um dos itens a seguir, apresente as hiptese s nula e alternativa,
indicando qual abordagem (unilateral ou bilateral) a mais adequada.
a) Um mtodo de treinamento tende a aumentar a produtividade dos
funcionrios.

d) Qual a

conci~~

15) Para testar se 11=.


conhecimento sotr.e ~-

~d>. s CitNclAs SociAis

---_,c~-:.~e

as hipteses so
--.ados para variveis

:or.--C'9:::.adas em termos de
~=~~deste captulo esto

li-"'--'--~........,

devemos saber:

"""'-- ~'.S populacionais;


~-.,.......,camoeda,

Y= nmero

zcilcular o valor p (no


-ou a normal quando

:...: -;:este escolhido (no


:a:iamentos foram
--::.!:es - amostragem
=parao do valor p
:::as a implicao do

- e a obteno do valor

do computador. Ou
algbricos

--....;:;;::..==1 clculos

.- _;,::se do problema de
.:. escolha do teste
~=a interpretao do
~===~= .gico e maturidade.
~-'-.

~s

nula e alternativa,

e :. ::::i.as adequada.

a produtividade dos

CApTulo

10 -

TESTES ts1A1b1icos dE l-ripTESES

b) A velocidade de um veculo num percurso , em mdia, menor do que o


valor anunciado.
e) Dois mtodos de treinamento tendem a produzir resultados diferentes na
produtividade.
11) Para verificar as hipteses de seu trabalho, um pesquisador fez vrios testes

estatsticos (um para cada hiptese de pesquisa), adotando para cada teste o
nvel de significncia de 5%. Responda aos seguintes itens:
a) Num dado teste, o valor p foi igual a 0,0001. Com base no resultado da
amostra, qual deve ser a concluso (decide-se pela hiptese nula ou pela
hiptese alternativa)? Com base no resultado da amostra, qual o risco
de o pesquisador estar tomando a deciso errada?
b) Em outro teste, o valor p foi igual a 0,25. Qual a concluso? Qual o risco
de o pesquisador estar tomando a deciso errada?
e) Em outros dois testes, o valor p foi 0,0001 e 0,01, respectivamente. Supondo
que se tenha adotado nvel de significncia de 5%, em qual dos dois testes
o pesquisador deve estar mais convicto da rejeio de H 0 ? Por qu?
12) Com o objetivo de testar se uma certa moeda est viciada, decide-se lan-la
vrias vezes de forma imparcial e sempre sob as mesmas condies.
a) Se em 8 lanamentos ocorreram 2 caras (e 6 coroas), qual a concluso
do teste ao nvel de significncia de 5%?
b) Se em 80 lanamentos ocorreram 20 caras (e 60 coroas), qual a concluso
do teste ao nvel de significncia de 5%?
13) Para tes tar se uma criana tem algum conhecimento sobre determinado
assunto, foram elaboradas 12 questes do tipo certo-errado. A criana acertou
11. Qual a concluso ao nvel de significncia de 5%?
14) Para testar se uma criana tem algum conhecimento sobre determinado
assunto, foram elaboradas 12 questes, cada uma com 4 possibilidades de
escolha. A criana acertou 5.
a) Formule as hipteses em termos do parmetro 7t = probabilidade de acerto
de cada questo.
b) Qual o nmero esperado de acertos sob H 0 .
c) Calcule o valor p.
d) Qual a concluso do teste ao nvel de significncia de 5%?
15) Para testar se um sistema computacional "inteligente" adquiriu algum
conhecimento sobre determinado assunto, foram elaboradas 60 questes do
tipo certo-errado. O sistema acertou 40. Qual a concluso do teste ao nvel
de significncia de 5%?

(Aprnlo 11

TESTES dE COMpARAO ENTRE


duAs AMOSTRAS

o Captulo 10, introduzimos alguns conceitos bsicos da metodologia


dos testes estatsticos de hipteses, ou testes de significncia. Neste
captulo, discutiremos alguns testes bastante usados em pesquisa social,
com nfase nos chamados testes t de comparao entre duas mdias.
Iniciaremos com a apresentao de alguns problemas de pesquisa que
envolvem testes estatsticos.

11.1

TESTES dE siq ificNCiA E dEli EAMENTOS dE pESQUSA


Em geral, os testes estatsticos so usados para comparar diferentes

grupos de elementos (pessoas, animais, etc.), com respeito a alguma


varivel de interesse (varivel resposta). Esses grupos podem diferir quanto
a diferentes tratamentos aplicados a seus elementos, ou a diferentes
populaes de onde os elementos foram extrados.

ExEMplo 11.1 Para comparar dois mtodos, A e B, de ensinar matemtica


para crianas, podemos aplicar o mtodo A n u m grupo de crianas e o
mtodo B em outro grupo. Para evitar a influncia de fatores
intervenientes, a composio prvia dos dois grupos deve ser feita de
forma aleatria. 1 Ao longo do experimento, ambos os grupos devem ser
tratados sob as mesmas condies, exceto quanto aos mtodos de ensino
1

A diviso aleatria pode ser feita por sorteio ou atravs de uma tabela de nmeros aleatrios.
Veja o Exerccio 5, Captulo 3.

196

EsrArsricA AplicAd11 i\s CiNciAs Soc1111~

em estudo. A comparao entre os dois grupos realizada atravs de


uma avaliao que mensure os conhecimentos de Matemtica .de cada
criana (veja a Figura 11.1) .

Os testes estatsticos~

podem ser meramemeJ- ' - __....


reais (HJ

Crianas selecionadas para o experimento:

@@
@@
Mtodo A

Diviso aleatria

@@@

\\\\\\
Notas das crianas
provindas do mtodo A

\\\\\\
Notas das crianas
provindas do mtodo B

Figura 11.1 Esquema do planejamento de um experimento para comparar dois


mtodos de ensinar matemtica para crianas.

"A aleatorizao dos grupos fundamental para res guardar a


validade de um teste de significncia" (FISHER, 1956, p.19) . Entende-se
por aleatorizao no somente a diviso ale atria dos elementos nos
grupos, mas tambm as condies idnticas em que esses grupos devem
ser tratados, a no ser, claro, pelos diferentes tratamentos em estudo.
No Exemplo 11.1, devemos evitar qualquer interao entre as crianas
dos dois grupos, qualquer variao devida aos instrutores , etc.

EXEMplo 11.2 Para comparar o peso de recm-nascidos, em duas localidades,


podemos extrair uma amostra aleatria de nascimen t os e m cada
localidade, observando os pesos (veja a Figura 11.2).
1 LOCALIDADE 1 1

Amostra aleatria de nascimentos

Observao dos pesos


dos recm-nascidos

medidas: uma a"'!~es e


treinamento. Por o-....~
11 . 1 e 11 . 2 geram -
extraidas de grupos,..::,..

1 LOCALIDADE 2 1

Amostra aleatria de nascimentos

Observao dos pesos


dos recm-nascidos

Figura 11.2 Esquema de um planejamento amostral, num estudo tipo


levantamento, para comparar o peso de recm-nascidos em duas localidades.

O planejame~:.a.
de dados pareados. :::,,_
de indivduos relari""'2
nos individues de cada
de ensino (Exemplo ~
similares quanto possr.e.
sobre assuntos correta:
...-....'----.

CAprulo

s realizada atravs de
~e

Matemtica de cada

li -

CSTCS

de

197

COMPARAO CNTRE duAS AMOSTRAS

Os testes estatsticos permitem avaliar se as diferenas observadas entre os dois grupos


podem ser meramente justificadas por fatores casuais (H0), ou se tais diferenas so
reais (HJ
Diferenas reais (significativas) podem ser causadas pelos diferentes
tratamentos utilizados nos grupos em anlise , como no Exemplo 11.1,
ou pelas diferentes populaes que geraram as amostras em estudo, como
no Exemplo 11.2.

-=~

O Exemplo 11.3 mostra uma situao em que o objetivo central


comparar o comportamento de uma varivel, observada sobre um conjunto
de e lementos, em dois momentos diferentes.

\ \ \ \

ExEMplo lU Com o objetivo de avaliar o efeito de um programa de treinamento

-es das crianas


~do mtodo B

sobre a produtividade dos funcionrios de uma certa empresa, foi realizado


um estudo em que se observou a produtividade de u ma amostra de
funcionrios antes e depois do programa de treinamento (veja a Figura 11 .3).

_____....__, ;aa comparar dois

-"'=:a:

para resguardar a
-- _;56, p .19). Entende-se
---:-"...a dos elementos nos
_.__~ es se s grupos devem
<::-~entos em estudo.
-----...;o entre as crianas
-~tores, etc.

------.s.. em duas localidades,


em cada

Amostra de n fu ncionrios:

@ .. .

Amostra da
produtividade antes.

t t

Programa de treinamento

@ .. .

Amostra da

produtividade depois.

Figura 11.3 Esquema de um estudo, tipo antes-e-depois,


para avaliar o efeito de um programa de treinamento na
produtivi dade de funcionrios de uma empresa.

O planejamento de pesquisa descrito no

~xemplo

11.3. vai gerar

dados pareados, pois cada funcionrio estar associado a u m par de

medidas: uma a nte s e outra depois da aplicao do programa de


treinamento. Por outro lado, os planejamentos descritos nos Exemplos
11.1 e 11.2 geram amostras independentes, j que as medidas so
extradas de grupos de elementos distintos e independentes.

O planejamento tpo antes-e-depois apenas um exemplo de gerao


de dad,os pareados. Outro caso comum ocorre quando formamos pares
de indivduos relativamente similares, aplicando tratamentos diferentes
nos ind ivduos de cada par. Por exemplo, na comparao de dois mtodos
d e ensino (Exemplo 11. 1), podemos formar pares de indivduos to
similares quanto possvel em termos de inteligncia e conhecimento prvio
sobre assuntos correlacionados (ver Figura 11.4).

198

EsTATSTiCA ,,pllc>.dA ~ CiNCiA~ SociAis

~I MtodoAi
Pares de
indivduos
similares:

@
@ ...

CAplrulo 11 -

TESTES

dE

Voltemos a

~...:::

co~-=-

Em ordem
aleatria dentro
de cada par. .

~IMtocto BI
Figura 11.4 Planejamento de pesquisa alternativo para o Exemplo 11.l - dados pareados.

Ao realizar o planejamento de uma pesquisa, fundamental planejar,


tambm, o procedimento estatstico que vai ser usado na anlise dos
dados. ~articularmente, em pesquisas confirmatrias, isto , naquelas
em que temos hipteses que desejamos colocar prova, devemos realizar
o planejamento da pesquisa preocupando-nos em verificar se a realizao
da pesquisa planejad a vai ge rar dados pareados ou amostras
independentes, dados quantitativos ou categorizados, e assim por diante.
Para cada situao, h um teste estatstico especfico.
Um cuidado bsico no planejamento (delineamento) de uma
pesquisa a perfeita coerncia que deve haver entre a hiptese a ser
testada e o planejamento e realizao da pesquisa . Por exe mplo, o
planejamento proposto para o Exemplo 11 .3 (procedimento antes-e-depois)
somente recomendado quando se tem segurana de que, no perodo
entre as duas mensuraes, o nico fator que afeta sistematicamente os
dados (valores de produtividade) o fator em estudo (programa de
treinamento). Caso contrrio, mais recomendado um delineamento como
proposto no Exemplo 11.1 (amostras independentes).
Vamos apre sentar alguns testes estatsticos que podem ser aplicados
em problemas d e comparao entre duas amostra s, discutindo as
situaes adequadas para su as aplicaes.

11.2

o TESTE dos S NAS

O teste dos sinais no uma das tcnicas estatsticas mais usadas


em pesquisas sociais, mas ser apresentado em primeiro lugar devido a
s ua simplicidade e por usar distribuies de probabilidades bastante
discutidas em captulos anteriores. Este teste adequado quando:
- os dados so pareados e
- a varivel em estudo observada, ou analisada, de forma qualitativa,
e com apenas duas categorias, tal como: melhorou ou piorou.

H0 : 1t = 0,5 e onde n: representa.2.r-- aps o treinamem.o_


O teste re:::a
cada funcionrio
aplicao do prog;.- ::...,
ou se piorou (sina:. -

que aumentam a s'-4- _


Supondo que.

a estatstica Y tem e...~


exemplo da moeda r; _
pela distribuio b~

sinal + indica que !J


treinamento, e o sfr1a ' -

Funcionrio
Joo

Maria

Jos
Pedro
Rita

.mi

~ AplicAuA s Ci~NCI/\~ SociAis

l l.1 - dados pareados.

e fundamental planejar,
- ;,isado na anlise dos
_,.:rias, isto , naquelas
:r.ova, devemos realizar
erificar se a realizao
- -=eados ou amostras
--..cos, e assim por diante .
_.!:co.
_elineamento) de uma
.:.:itre a hiptese a ser
- .....isa. Por exemplo, o
=.:tlento antes-e-depois)
-<:;a de que, no perodo
:a sistematicamente os
estudo (programa de
wm delineamento como

1""------

......___, __ e podem ser aplicados


~s~as, discutindo as

11 -

C Apru lo

199

TESTES dE COMPARAO ENTRt duAS AMOSTRAS

Voltemos a considerar o Exemplo 11.3, em que se quer verificar se


um certo programa de treinamento aumenta a produtividade dos
funcionrios de uma certa empresa. Temos, ento, as seguintes hipteses:
H 0 : a produtividade no se altera com o programa de treinamento;
H 1: a produtividade aumenta com o programa de treinamento.
Vamos supor que ao observar a produtividade de um funcionrio,
antes e depois da realizao do programa de treinamento, possvel avaliar
se melhorou ou piorou. Neste contexto, as hipteses podem ser colocadas
em termos do parmetro n da distribuio binomial, como segue.
H 0 : n = 0,5 e H 1 : _n > 0,5
onde n representa a probabilidade do funcionrio aumentar a produ tividade
aps o treinamento.
O teste realizado com base numa amostra de n funcionrios. Para
cada funcionrio observada a sua produtividade antes e depois da
aplicao do programa de treinamento, verificando se melhorou (sinal+)
ou se piorou (sinal -) . A estatstica do teste o nmero Y de fundonrios
que aumentam a sua produtividade.

Supondo que:
-

todos os funcionrios sejam observados sob as mesmas condies;


no haja interao entre os funcionrios que esto participando
da pesquisa; e
o nico fator que esteja influenciando sistematicamente a produtividade dos funcionrios, ao longo do estudo , seja o programa
de treinamento,

a estatstica Y tem distribuio binomial com parmetros n e n (anlogo ao


exemplo da moeda do captulo anterior). Assim, o valor p pode ser compu tacio
pela distribuio binomial ou, quando n for grande, pela distribuio normal.
Considere que n = 1O funcionrios participaram da pesquisa descrita
no Exemplo 11.3, gerando os resultados constantes na Tabela 11.1. O
sinal + indica que o funcionrio melhorou sua produtividade aps o
treinamento, e o sinal - indica que piorou.

:a.Lsticas mais usadas


_:TI!leiro lugar devido a
~habilidades bastante

---=--~--a.... de

forma qualitativa,

:a..wrou ou piorou.

Tabela 11.1 Avaliao qualitativa da produtividade de 10 funcionrios, antes


e depois de serem submetidos a um programa experimental de treinamento.
Funcionrio
Joo

Avaliao da
rodutividade
+

Maria

Jos
Pedro
Rita

Funcionrio
Joana
Flvio
Paulo
Catarina
Feli e

Avaliao da
rodutividade
+

+
+

200

EsTATSTiCA AplicAdA !is C iNCiAs Soci11is

Pela Tabela 11.1, temos: Y = 7. Assim, pela distribuio binomial


(Tabela 2 do Apndice), com n = 10 e n = 0,5, temos:

p = p(7) + p(8) + p(9) + p(lO)


= 0 , 1719.

0,1172 + 0,0439 + 0,0098 + 0,0010

Considerando o nvel de significncia de 5% (a = 0,05), o teste dos


sinais no pode rejeitar H 0 em favor de H 1 (pois, p >o:). Conclumos, ento,
que os dados no mostram evidncia suficiente para garantir que o
programa. de treinamento melhora a produtividade de funcionrios.
Num estudo tipo antes-e-depois, muitas vezes no possvel
distinguir se u m certo indivduo melhorou ou piorou. Neste caso, comum
desprezar esses indivduos da amostra (veja o Exerccio ld) . Contudo, se
houver um nmero grande de indivduos nessa situao, a aplicao deste
teste estatstico pode ficar prejudicada.

C11prulo li -

TESTES dE e"-=-'

de mai.s para ~
mostram evidncia s::5< ;
indivduos da co::::......_..,__

11.7 O TESTE

r p~

dados quantitativos ~~
trataremos do caso ~

supor que a vari\-el _;r:x:.:::..::


numa escala que \a.;..::.C.: _
d ever o ser fonnui;::C:=..:;

Ho:

Exrnccios
1)

2)

Com o objetivo de avaliar se o desempenho de um certo candidato, numa


apresentao em pblico, foi positivo, foi selecionada uma amostra de uma
grande plateia, indagando de cada um, sua opinio sobre o candidato (se
melhorou ou se p iorou), antes e depois da apresentao.
a) Apresente as hipteses nula e alternativa.
b) Se, numa amostra de 11 p essoas, 8 passaram a ter uma opinio mais
favorvel, enquanto 3 passaram a ter opinio menos favorvel sobre o
candidato, o que se pode afirmar? Use nvel de significncia de 5%.
c) Se, numa amostra de 200 pessoas, 130 passaram a ter melhor impresso,
enquanto 70 pioraram sua impresso sobre o candidato, o que se pode
afirmar? Com que probabilidade de s ign ificncia? Sugesto : use a
aproximao normal (Seo 8.3).
d) Considere que exista tambm a resposta opinio inalterada. Numa amostra
de 100 pessoas, 60 passaram a ter opinio mais favorvel, 30 passaram a
ter opinio menos favorvel e 10 mantiveram a mesma opinio. O que se
pode afirm ar, ao nvel de significncia de 5% ? Sugesto: elimine da amostra
as pessoas cujas opinies ficaram inalteradas.
(SIEGEL, 198 1, p. 80.) Um pesquisador est interessado em avaliar se determinado
filme, sobre delinquncia juvenil, contribui para modificar a opinio de uma
comunidade s obre quo severa deve ser a punio em tais casos. Para tanto,
ele extrai uma amostra aleatria de 100 indivduos da comunidade e realiza
um estudo tipo antes-e-depois. Pergunta a cada indivduo da amostra se devem
aplicar, nos casos de delinquncia juvenil, punio mais forte ou mais fraca do
que a que vem sendo aplicada con-entemente. Em seguida, exibe o filme para
estes 100 indivduos e, aps a exibio, repete a pergunta. Oitenta e cinco
indivduos mudaram de opinio, sendo qu e 59 deles modificaram sua opinio

Ou, ainda,
H:
u . = u
O ' depois
;:::;;::s
onde:
ntcs:

produi:!IT=r -

d cpolS. : produ~-::a.:-=

Para colocar ~i.. .=:


antes e depois de :ec=.,_
pareadas de valores :.:.e

Tabela 11.2 Valor CG.,de um programa exx- - .


Funcionrio
J oo
Maria
Jos
Pedro
Rita
Joana

Flvio

Paulo
Catarina

Feli,e.e

- wlicAdA > CiNCiA> SociAis

-..a Cistribuio binomial


39 ~ 0,0098 + 0,0010

= 0,05), o teste dos


Conclumos, ento,
'---""-.:= ? ara garantir que o
= -~ c!e fu ncionrios.

> '.:!'.

:zes no possvel
-~este caso, comum
-. = _:cio ld) . Contudo, se
.a;fu:J, a aplicao deste

....=. :::eno candidato, numa


...........
-..._= :una amostra de uma
-~-- sobre o cand ida to (se

CAprulo 11 -

de mais para menos, enquanto que 26 de menos para mais. Estes dados
mostram evidncia suficiente de que o filme produz um efeito sistemtico nos
indivduos da comunida de em estudo? Com que probabilidade de significncia?

11 .7

O TESTE rpARA dAdos pAREAdos

O chamado teste t apropriado para comparar dois conjuntos de


dados quantitativos, em termos de seus valores mdios. Nesta seo,
trataremos do caso em que os dados so pareados.

ExEMplo 11.4 Retomemos o problema do Exemplo 11.3, mas, agora, vamos


supor que a varivel produtividade possa ser mensurada quantitativamente,
n uma escala que varia de 20 a 40 pontos. Para aplicar o teste t, as hipteses
devero s er formuladas em termos de valores mdios, como segue:
H0 : a produtividade mdia dos funcionrios no se altera com o
programa de treinamento;
H 1 : a produtividade mdia dos funcionrios aumenta com o programa
de treinamento .
Ou, ainda,
H O u
depois

m:.--==== :=. :e:- u ma

opinio mais
o
.:: ,;ficncia de 5% .
.::.. :er melhor impresso,
=-,;;dato, o que se pode
-~-~~a? Sugesto: use a

=-=os favorvel sob re

----erada. Numa amostra


==.""."1rvel, 30 passaram a
- =s:::ta opinio. O que s e
~: elimine da amostra

= uantes
1

onde:
antes :
depois :

produtividade mdia dos funcionrios antes do treinamento; e


produtividade mdia dos funcionrios depois do treinamento .

Para colocar H0 prova, vamos observar os n = 10 funcionrios,


antes e depois de receberem o programa de treinamento (duas amostras
pareadas de valores de produtividade). Os dados e s to na Tabela 11.2.
Tabela 11.2 Valor da produtividade de cada funcionrio, antes e depois
de um programa experimental de treinamento .
Funcionrio

.::=avaliar se determinado
=car a opinio de uma
~ :ais casos. Para tanto,
.:a comunidade e rea liza
~-_...... rla amostra se devem
~ ime ou mais fraca do
~ exibe o filme para
::e=s..mta Oitenta e cinco
=illiificaram sua opinio

201

TESTES d E COMPARAO EN TRC d uAS AMOSTRAS

Joo
Maria
Jos
Pedro
Rita.
Joana
Flvio
Paulo
Catarina
Felipe

Antes
X1

Produtividade
Depois
X2

22
21
28
30
33
33
26
24

25
28
26
36
32
39
28
33

31

30

22

27

Diferena
D=X2 - X1
3
7

-2
6
-1
6
2

9
-1
5

202

EsrArsriCA Ap liCAdA s CiNCiAS SociAis

A ltima coluna da Tabela 11 .2 mostra a diferena entre os valores


de produtividade antes e depois. Esses incrementos (ou redues) de
produtividade esto tambm apresentados na Figura 11.5, sob forma de
um diagrama de pontos.

-2

CAprulo li - TESTES

ExEM plo

3. Ento:

8
Sn

Figura 11.5 Diagra ma de pontos das diferenas de


produtividade.

Es1A1s1icA do TESTE
A estatstica do teste baseia-se nos valores observados da varivel
D, definida pela diferena de valores em cada par. Num estudo tipo antese-depois:

= (medida depois) -

=~

- ~

E, portanto.

Observamos no diagrama de pontos da amostra que houve uma


tendncia de ocorrer diferenas positivas (valores de produtividade depois
maiores, em geral, do que os valores de produtividade antes). A realizao
do teste t permite verificar se esta tendncia no poderia ser explicada,
apenas, por efeitos casuais.

O fato de a ~-~ ~
que, quanto maieh = .
:JJ
sobre o fenmeno e=. ,.;e..,.~
e ntre D e zero te~=~
a caso. A esta tis2a:=. t :&::......:: .....
medida do grau C.e ===-=- -.=:"=
Quanto maior ~ .::_a;....,....... ...,,
observadas enrre as _
real (ou significaiT-a._ -

(medida antes)

Se a hiptese nula for correta, devemos esperar que os valores desta


~arivel estejam em tomo de zero ou, ainda, que a mdia destas diferenas,
D, esteja p.:._xim a de zero. Usaremos, como estatstica do teste, uma
funo de D, conhecida como estatstica t para dados pareados, que
definida por:

t = D.fn

SD
onde

n : tamanho das amostras, que, neste caso, corresponde ao nmero


_

CO'

11. 4 (CONTt\"':..:.~;:

Variao da produtividade entre as duas medidas

de

de pares observados;

D : mdia das diferenas internas dos pares; e

S0 : desvio padro das diferenas internas dos pares.

Quando o y-.:.:._--:- -'""


H 0 poder ser aceiu;. ?-ser rejeitada, em ..:.::_ ..._ .- de referncia pa..-a es;-r
zero . Esta distrib~
Suposio

bsica ~ ,~

que a varivel D ::.:!~


distribuio norrr:=~ --~......
grande (n~ 3 0, po:- = - r = -

ApliCAdA s C itNCiAS SociAis

entre os valores
::.;;os (ou redues) de
__-a 1 1.5, sob forma de
-~na

CAprulo

11 -

TESTES de COM PARAO ENTRE duA5 AMO~ IRAS

ExEMplo 11.4 (coNTiNUAO) Diferenas D (ltima coluna da Tabela 11.2):


3, 7, -2, 6 , - 1, 6, 2, 9, -1, 5

Ento:
n

_ ~L.D
So -

L,D
34
D = - = - = 34
n
10
'

10

- n
n - 1

J52

246 - (10) (3,4)2


1- - -1-0'--'
_""""1.....___._

= 3,81

E, portanto,

t =D.Jn
- -So

3,4 . .J10
3,81

= 2,82

~::-a

que houve uma


- :rodutividade depois
__
<=- antes). A realizao
?-".:ieria ser explicada,

O fato de a estatstica do teste ser funo de n bem razovel, j

que, quanto maior o tamanho da amostra, mais conhecimento se tem


sobre o fenmeno em estudo e, consequentemente, um certo afastamento
entre D e zero tem menor probabilidade de ser explicado meramente pelo
acaso. A estatstica t tambm funo do desvio padro SD' que uma
medida do grau de heterogeneidade daquilo que estamos estudando.
Quanto maior esta heterogeneidade, maiores devem ser as diferenas
observadas entre as duas medidas para evidenciar uma diferena mdia
real (ou significativa) entre elas.

Disrnibuio do TESTE
- ~'.1e os valores desta
__..,.a destas diferenas,
s:ica. do teste, uma
~os p areados, que

Quando o valor calculado da estatstica t estiver prximo de zero,


H 0 poder ser aceita. Por outro lado , se t estiver longe de zero, H 0 dever
ser rejeitada, em favor de H 1 . n ecessrio, porm, ter uma distribuio
de referncia para especificarmos o que significa prximo ou longe de
zero. Esta distribuio de referncia existe sob a seguinte suposio.
Suposio bsica para a aplicao do teste: Teoricamente, devemos supor
que a varivel D (diferena entre as duas mensuraes ) segue uma

distribuio normal. Contudo, se o nmero de pares for razoavelmente


grande (n ~ 30, por exemplo), o teste ainda permanece vlido, mesmo que
a variyel D no tenha distribuio n ormal.
pares.

Na prtica, recomendamos fazer histogramas de frequncias ou


diagramas de pontos das duas amostras para verificar se no existe algum
ponto discrepante ou forte assimetria, o que poderia comprometer a

204

E~rArsricA

Aplic11d11 As CiNCiAs Soci11is

validade deste teste estatstico. Alternativamente, esta anlise


exploratria pode ser feita com os valores da varivel D, como foi
apresentado na Figura 11.5, onde no parece haver ponto discrepante ou
forte assimetria.

Amostras

t~

2,82

gl= 9

Distribuio de referncia:. Sob H 0 , e considerando a suposio acima


descrita, a estatstica t tem distribuio t de Student com gl = n - 1 graus
de liberdade (veja Figura 11.6).
0,4

f( t)

0,3

Figura 11.7 Uso a --___


significncia num :.es:r i::::::...=- _

0 ,2

o, 1
o

-4

o
1
2
3
-3
-2
-1
Possveis valore s da estatstic a t

Figura 11.6 Distribuio de referncia para o teste t do Exemplo 11.5. A


Distribuio t de Student com gl = 9 graus de liberdade.

A Figura 11.6 mostra a distribuio dos possveis valores da


estatstica t, na suposio de no haver diferena real entre as duas
mensuraes (H0 ) - somente variaes casuais em torno de zero.

que o valor t = : ~
valor tabulado 2 ,.3de significncia e
Conside:a::.
conclui que os ..;.
(pois, p = 0,010 e.
= 0,05), detecta;"
entre as duas me
fator, alm do p;: JZ- entre as duas ~-_

PnobAbilidAdE dE siqNific~NciA
Depois de observar os dados e calcular o valor da estatstica t,
podemos obter o valor p pela distribuio t de Student (Tabela 5 do
apndice), conforme mostrado na continuao do Exemplo 11.4.

ExEMplo 11.4 (CONTiNUAO} Para testar Ho: depo1s. = antes versus H l: depois. >
antes' observamos u ma amostra de n = 10 funcionrios, que produziu o
valor t = 2,82. Como n = 10, temos gl = n - 1 = 9 graus de liberdade .
Tomemos, ento, a linha de gl = 9 da Tabela 5 do apndice , como mostra
a Figura 11.7. Por esta tabela, obtemos a rea relativa a um valor maior
ou igual a t = 2 ,82. Como o teste unilateral, esta rea j correspon de
probabilidade de significncia p descrita pelos dados da amostra.

correspondem a!l
em apenas duas -dos testes dos S::-pelo fato do tes-.e
diferenas,encr.....a:::::::::
dados, trabalhan.:.
do que o teste dos
diferenas, qua::z.~~
t est condiciona::--=

~dA

Ci~NCiA~

SocJAfs

CAprnlo

l1 -

Amostras
.-a..-ivel D, como foi
-- ~to discrepante ou

t~=

205

TESTES <lE COMPARAO C'\TRC duAS AMOSIRA~

2,82
gl 9

rea na cauda su erior


o 05 0,025 0,010

0,25

o 10

0,703

1,383

1,833

2,262

2,821

0,005 ...
3,250 ...

a suposio acima

--: com gl = n - 1 graus


(pela tabelai

2,82

Figura 11.7 Uso da distribuio t de Student com gl = 9 para a obteno da probabilidade de


significncia num teste unilateral, com n = 10 e t 2,82.

Observando a linha correspondente a gl = 9, verificamos, na tabela,


que o valor t = 2,82 (calculado com base na amostra) est prximo do
valor tabulado 2,821. Logo, como ilustra a Figura 11.7, a probabilidade
de significncia , aproximadamente, p = 0,010.

4
;

valores da

==~

da estatstica t,
- -::-_c:ent (Tabela 5 do
- -=-"remplo 11.4.
- -:.ersus H i : depois >
-_ns, que produziu o
= : ~us de liberdade.

~----._

a um valor maior
.:..-eaj corresponde

-=~-a.

~da

amostra.

Considerando o nvel de significncia de 5% (a = 0,05), o teste


conclui que os dados mostram evidncia suficiente de que H 0 falsa
(pois, p = 0,010 e, portanto, menor que o nvel de significncia adotado a
= 0,05), detectando , ento , que houve um aumento real da produtividade
entre as duas mensuraes. Se admitirmos que no houve qualquer outro
fator, alm do programa de treinamento, atuando de forma sistemtica
entre as duas mensuraes, podemos concluir que o programa de
treinamento tende a aumentar a produtividade dos funcionrios.

O leitor pode ter observado que os dados do Exemplo 11.3


correspondem aos dados do Exemplo 11.4, se estes fossem classificados
em apenas duas categorias: melhorou(+) ou piorou(- ). Mas as aplicaes
dos testes dos sinais e t levaram a concluses diferentes. Isto pode ocorrer
pelo fato do teste dos sinais usar apenas uma a valiao qualitativa das
diferenas, enquanto que o teste t usa melhor a informao contida nos
dados, trabalhando com as quantidades. O teste t um teste mais poderoso
do que o teste dos sinais, no sentido de ter maior probabilidade de detectar
diferenas, quando elas realmente existem. Contudo, a validade do teste
test condicionada suposio de a varivel em estudo ter distribuio
normal, especialmente se a amostra for pequena.

206

EsTATsTlcA AplicAdA s CiNCiAs SociAis

CAprulo 11 -

TESTES

de

TESTES bilATERAS

No Exemplo 11.4, realizamos um teste u nilateral, pois a hiptese


alternativa foi formulada com o sinal">" (H 1: d epo1s. > u an1cs) . Quando o teste
bilateral, isto , a hipte se alternativa tem o sinal "=t", o procedimento
anlogo, mas o valor de rea da tabela dever ser dobrado, para que o
valor p corresponda s reas das duas caudas da distribuio.
ExEMplo 11.7 Desejamos verificar se uma certa alterao no turno de trabalho
produz a lgum efeito, positivo ou negativo, na produtividade dos
funcionrio s. Para isto, realizamos um estudo experimental, alterando o
turno de trabalho de uma amostra de n = 10 funcionrios da empresa.
Temos as seguintes hipteses:
H o:

dcp<iis

ante

comparam-se os -

Uma ma.I!e:..-a
consiste em cons=-. -
Os elementos de ~
das condies :=--c:U......_-:.........11
grupos. A obserpar, pela vari\e
(ver Figura 1 i..:.
ExEM plo 11.6 Para ~

e H i: dcp<iis * ontc

onde:
produtividade mdia dos funcionrios da empresa no horrio
habitual; e
d
. : produtividade mdia dos funcionrios da empresa com
cpo1s
alterao no turno de trabalho.
antes:

Por simplicidade, suponha que os resultados foram os mesmos do


Exemplo 11.4, apresentados na Tabela 11 .2, resultando, como j vimos,
em t = 2,82, com gl = 9. A obteno da probabilidade de significncia
anloga ao caso anterior, considerando, porm, ambos os lados da curva.
Assim, p = 2x (O,O 10) = 0,020. Portanto, ao nvel de significncia de 5%, o
teste rejeita H 0 , em favor de H 1 .

UTRAS fORMAS dE pAREAMENTO

O plano de pesquisa de observar a varivel resposta sobre os mesmos


elementos, antes e depois de aplicar um certo tratamento, pareceu
adequado no problema de avaliar o efeito de um programa de treinamento
sobre a produtividade de funcionrios. Contudo, se o programa de
treinamento for relativamente longo, de tal forma que, n esse perodo,
outros fatores puderem agir de forma sistemtica sobre a produtividade,
o estudo toma-se incuo, pois diferenas reais entre as duas mensuraes
podem ser tanto devidas ao programa de treinamento, como devidas a
fatore s intervenientes.

--p _

Este procec
quantita tivos (po".s _
Assim, podemos "'-
Exemplo 11.4.

Exrnccios
3)

Seja o probler::::.a

a)

b)

CAphulo 11 -

~--...
..... :al,

> -

pois a hiptese

J . Quando o teste

~=-.o

procedimento
eabrado, para que o

=.s:ribuio.
~::::::;3'.;::-o =10 turno

de trabalho
- ;i:-odu tividade dos
~.:nental, alterando o
w=irios da empresa.

s da empre sa com

TEs1es

de co,1pARAO

E1'1TRt

Um planejamento mais adequado para a situao colocada consiste


em observar dois grupos de funcionrios, sendo que apenas um dos grupos
recebe o programa de treinamento. Aps a realizao do treinamento,
comparam-se os valores de produtividade entre os dois grupos. 2
Uma maneira de constituir grupos de elementos comparveis
consiste em construir pares de elementos aproximadamente semelhantes.
Os elementos de cada par so separados e, cada um, submetido a uma
das condies (tratamentos) que se deseja comparar, formando os dois
grupos. A observao do efeito dos tratamentos pode ser feita, em cada
par, pela varivel D, definida como a diferena entre os elementos do par
(ver Figura 11.4).

ExEMplo 11.6 Para avaliar o efeito de um curso sobre alimentao e controle


de peso, em pessoas obesas, planeja-se realizar uma pesquisa com pares
de pessoas relativamente similares. Os pares sero constitudos por pessoas
de mesmo sexo, faixa de peso, faixa etria, alm de outras caractersticas
pertinentes. Em cada par, uma das pessoas, selecionada aleatoriamente ,
dever participar do curso, e a outra no. Depois de trs meses, medida
a variao de peso das pessoas de ambos os grupos. Esquematicamente:
Alocao por sorteio em cada par

os mesmos do
~do, como j vimos,
..-.--.......e de significncia
- s os lados da curva.
9lificncia de 5%, o

,...____...

-~raro

207

duAS A\lOSlRAS

Par 1

e
s

I~
C: com o curso
S: sem o curso

Este procedimento dever gerar um conjunto de dados pareados e


quantitativos (pois a varivel resposta, variao de peso, quantitativa) .
Assim, podemos aplicar o teste t de forma anloga ao que fizemos no
Exemplo 11.4.

Exrnccios

s-..ie, nesse perodo,


o:-e a produtividade,
:;s duas

3) Seja o problema do Exemplo 11.6.


a) Apresente as hipteses nula e alternativa.
Considerando que a realizao da pesquisa produziu os dados constantes
na tabela seguinte, qual a concluso?

br

mensuraes

-to, como devidas a

z Alternativamente, poder-se-ia comparar as variaes de produtividade entre os dois grupos.


Neste caso, torna-se necessrio, tambm, medir a produtividade de todos os funcionrios
(ambos os grupos) antes de iniciar o programa de treinamento.

208

EsrArsriCA ApliCAdA s CiNCi"'s SociAls


Par de pessoas obesas
participantes do estudo
1

Variao dopes?, em kg, ao longo de trs meses


com o ci1rso
sem o curso

-4

-2

-3

-1

4
5

-2
5
2

2
-5
-3
1

6
7

8
9

-1
-3

10

4
' Valores positivos indicam ganho de peso, e va lores negativos , perda de peso.

4) Para avaliar o efeito d e um brinde nas vendas de dete rminado produ to,
planeja-se comparar as vendas em lojas que vendem o produto com o brinde,
com a s vendas em lojas que no oferecem o brinde. Para reduzir o efeito de
variaes devidas a outros fatores, as lojas foram grupadas em pares de
lojas, sendo que as lojas de um mesmo par sejam to similares quanto
possvel, em term os do volume de vendas, localidade, identidade de preos,
etc. Em cada par de lojas, u ma passou a oferecer o brinde, e a outra no.
a) Apresente as hipteses nula e alternativa.
b) Os resultados das vendas, em quantidade de u nidades vendidas, fo ram
os seguintes:
Par de lojas

Vendas
[

sem brinde
33
43
26
19
37
27

2
3
4
5

com brinde
43
39
33
32
43
46

Os dados mostram evidncia suficiente para se afirmar que a oferta do brinde


aumenta as vendas? Use nvel de significncia de 5%.
5) Para resolver o mesmo problema do exerccio anterior, decidiu-se fazer um
planejamento do tipo antes -e-depois. Observou-se a ve nda mensal do produto
em ques to na s 12 lojas. Depois, passou-se a oferecer um brinde e voltou-se
a avaliar a venda m ensal desse produ to nas 12 loja s. Os incrementos (ou
redues) nas vendas foram os seguinte s:
7

10

CAprulo 11 - Tr~m dE

-2

-4

1 3

a) Os dados mostram evidncia suficieme para se afirmar que a oferta do


brinde aumenta as vendas? Use nve l de significncia de 5% .
b) No problema em discusso, aponte a s vantagens e desvantagens deste
planejamento de pesquisa, em relao ao apresentado no Exerccio 4.
e) Apresente um terceiro planejamento de pesquisa para este problema,
tentando aproveitar as vantagens dos dois procedimentos apres entados.
6) Para avaliar o gove rno perante os empresrios, um ins tituw de pesquisa
selecionou uma amostra aleatria de 64 empresrios, indagando a cada um

7)
diferena sigr"5'rr=":

professores e
nwteriais? t.: se
mais

satisfei:os~

11.4 TESTE
mostra o

exemp~O> ""-':s- .

submetidas ao ~-
submetidas ao -::::.i::
11 .1. Ao trmino~-

onde:

1 : nota mdz
mtodo -~ ci.? ~.
2 : nota md:.z

mtodo B .2 ~"
A Tabela : 1.3 ..
Exemplo 11.7 , con~
dez crianas. A Figu;c:;.
da avaliao, segu- .:"~

~"' s Ci::NCiAs SociAis

CAprulo

11 -

TF~TF~ dF COM PARAO F'HRF duA~ AMO">TRA">

209

sua aprovao com o governo, numa escala de O a 10. Foi realizada uma
pesquisa logo aps a posse do governo, e outra aps seis meses, mas com a
mesma amostra de empresrios. A primeira amostra apontou uma mdia de
8,4 e a segunda 6,8 (diferena mdia de 1,6) . O desvio padro da diferena
foi 2,0. Os dados mostram evidncia suficiente para afirmar que na populao
de empresrios houve reduo na aprovao ao governo? Use a = 0,01.

-'!""' de trs mescs 1


~-curso

3
-2
5
~

7)
~3

Considerando os dados do anexo do Captulo 2, podemos afirmar que existe


diferena significativa entre: (a) salisfat,;o dos alunos quanto didtica dos

professores e (b) .satisfao dos alunos quanto aos laboratrios e recursos


materiais? Use u = 0,01. Em qual dos dois itens os alunos esto, em mdia,

mais satisfeitos?
_.e~n:ninado

produto,

:;=OCuw com o brinde,


~

reduzir o efeito de
em pares de
.= ~ similares qu anto
--~-. ..=:entidade de preos,
'---=C.e , e a outra no.
~;ia.das

___.:.;.:.es vendidas, foram

11.4 TESTE

T pARA AMOSTRAS iNdEpENdE NTES

A formao de pares de elementos similares nem sempre vivel.


Uma forma alternativa considerar duas amostras independentes, como
mostra o exemplo seguinte.

ExEMplo 11.7 Retomemos o problema de comparar dois mtodos, A e B, de


ensinar matemtica para crianas. As hipteses podem ser:
H0 : em mdia, os dois mtodos produzem os mesmos resultados; e
H 1 : em mdia, os dois mtodos produzem resultados diferentes.
Para realizar o teste, precisamos de uma amostra de crianas
submetidas ao mtodo A de ensino, e outra amostra de crianas
submetidas ao mtodo B, conforme planejamento discutido no Exemplo
11 .1. Ao trmino dos estudos, todas as crianas devem efetuar uma mesma
avaliao para medir o grau de apren dizagem. Em termos do planejamento
proposto, podemos escrever:
~

Ho: 1 = 2 e H1: i* 2,

incrementos

onde:
a oferta do
e liesvantagens deste
:io Exerccio 4 .
__...... ~-a este problema,
~-roos apresentados.

e::~Z!:::::;;-c

..::sriuito de pesquisa
c::xiagando a cada um

1: nota mdia (ou esperada) de crianas que sejam submetidas ao

mtodo A de ensino; e
2 : nota mdia (ou esperada) de crianas que sejam submetidas ao

mtodo B de ensino.
A Tabela 11.3 mostra os resultados do experimento descrito no
Exemplo 11. 7, considerando que a m bos os grupos foram compostos por
dez crianas. A Figura 11.8 apresenta o diagrama de pontos dos resultados
da avaliao, segundo o mtodo de ensino.

210

fa1A1srlcA AplicAdA s CitNCiAS SoCiAis

CAprulo li - TF~rEs r1c

Tabela 11.3 Notas na avaliao, considerando o mtodo de ensino


Mtodo A de ensino

Mtodo B de ensino

45
42

45 35 43
45 41 43

,_

51
53

50
50

62 43
48 55

o 8:::l o

o --0-0--8-8

00

1
1

35

40

45

50

~I :

mdia
X 2 : md:a
S 12 . v~..;.;;----,
~~-Si: va.ri=::.c

O Mtodo B

60

55

onde:

O Mtodo A

30

59 48
49 39

Ea estatis

65

s; : v~

Nota

Figura 11.8 Diagrama de pontos das notas obtidas pelas crianas, segundo
o mtodo de ensino

ExEMplo 11.7 (CO:


da Tabela 11.3
Amostra_

EsrATsricA

do

Amosrra::

TESTE

Varincia~

A estatstica do teste toma como base a diferena entre as mdias


das duas amostras, X 1-X2 , mas leva tambm em considerao o nmero
de elementos em cada amostra e a variabilidade interna dessas amostras.
Quanto maiores as amostras, maior a evidncia de uma diferena real. Pense
no caso extremo de apenas uma criana em cada grupo, apontando uma
diferena de duas unidades numa escala de O a 1O - no d para dizer
muita coisa! Mas com 100 crianas em cada grupo, apontando uma diferena
de duas unidades, leva-nos a induzir que os mtodos produzem resultados
diferentes. Por outro lado, se h muita variabilidade entre os elementos de
cada amostra, uma possvel diferena fica nebulosa. Veja a Figura 11.9.
Evidncia de grupos diferentes

lJt
x, x,

n =tx1 -x2)v2-s:=
Portanto :~ =

No evidncia de grupos diferentes

(1)
(2)

.o.

: l?l:
C

OP

X,

~ (1 )

a...a....... (2)

X)

Figura 11.9 A importncia de se considerar a varincia interna dos grupos

Considerando o mesmo nmero n de elementos em cada amostra,


a varincia agregada, S~, obtida pela mdia aritmtica das varincias
. 3
d e cad a grupo, si2 e s2
2 'ou se3a:

s2 = s? +si
a
3

Lembramos ao leitor que a varincia (Sl) o desvio p adro (.$) ao quadrado.

...;

1)
2)

-..1

CApTUlo li -

Tcsrcs de

211

C0\1pARAO rnmc duAs AMOSTRAS

E a estatstica do teste dada por:


t

=(X, -x2) ~ 2 -~;

onde:
n : tamanho da amostra em cada grupo;
X 1 : mdia da amostra 1;
X2 : mdia da amostra 2;
s( : varincia da amostra 1;
S~ : varincia da amostra 2; e
s~ varincia agregada das duas amostras.

- :!todo A

f rodo B

::::z:as, segundo

ExEMplo 11.7 {coNTiNUAO) Calculando as mdias e as varincias dos dados


da Tabela 11.3:
Amostra 1: n = 10, x i = 49,90 e s,2
Amostra 2: n = 10, X2 = 44,70 e $ 22

= 35,66
=

42,23

Varincia agregada:

--=-;;a entre as mdias


----:.s:rlerao o nmero
- --::.a dessas amostras.

52 =

s?+ Si

= 35,66 + 42,23 = 77,89 = ,


38 95
2
2

Estatstica do teste:

t =f=

\Xi

-x 2) ~ 2.s;
n

=(4990 -4470)
lO
=(5,2) 10,1284 = (5,2)(0,358-:a
'
'
2(38,95)
"'
.....,

Portanto: t= 1,86.

;:::~os

elementos de
-ej a a Figura 11.9.

Suposies para a aplicao do teste:

............--..--....-i--...-.- (1)

~--......- - - - - - (2)
-

grupos

- .os em cada amostra,

--:=.tica das varincias

1) os dois conjuntos de dados proveem de distribuies normais e


2) tm a mesma varincia. 4
Na prtica, no fcil verificar a veracidade destas suposies.
Aconselhamos, contudo, construir histogramas de frequncias ou
diagramas de pontos para cada amostra. Esses grficos permitem avaliar
se existem fortes violaes das suposies, tais como a presena de pontos
discrepantes, distribuies com formas a ssimtricas ou, ainda, urna
4

- aa quadrado.

Se as amostras forem razoavelmente grandes (ctigamos, gl = 2n - 2 ;::; 30) a suposio (1)


pode ser relaxada. Quanto a suposio (2), s vai haver problemas srios se as varincias
das duas populaes forem demasiadamente diferentes.

212

Es11\lis1icA AplicAdA s Cifi\CiA~ SoclAls

distribuio bem mais dispersa do que a outra. No exemplo em discusso,


construmos diagramas de pontos para as duas amostras (Figura 11.8),
os quais mostram que as amostras em anlise parecem compatveis com
as suposies do teste.

Distribuio de refer~nci.a. Considerando que as suposies do teste estejam


satisfeitas, se as mdias populacionais forem iguais (H0 verdadeira), ento
a estatstica t tem distribuio t de Student com gl = 2n - 2 graus de
liberdade.

CAl1ulo li - Tu,1hs dE ....,..__

Quando as .. = calculada por:

onde:
n1

tamar.1- _

ExEMplo 11.7 (CONTiNUAO) O esquema seguinte ilustra o uso da Tabela 5 do


apndice para se obter a probabilidade de significncia associada ao valor
calculado t = l,86. No caso, tem-se gl = 2n - 2 = 2(10) - 2 = 18.
Amostras

-Area na cauda su crior

l
t

= 1,86 '-.._18

gl = 18

0 ,25

0,10

0,05 - 0,025~ 0,010

0,005 ...

0,688

1,330

1.734

2,878 ...

2.101

2,552

Os dados levaram ao valor t = 1,86, apontando para uma rea na


cauda superior da curva entre 0,025 e 0,05. Mas, como o teste bilateral
(H 1: 1 ~ 2 ), a rea deve ser dobrada para se ter o valor p correto. Veja o
esquema a seguir:

onde:

xi : mdia e.a.
: mdia =..a
2

S : des\io -;:r~~

experimentararrr a:.;~.
primeira vez ciife;-testar as hipteses

t = 1,86

-1 ,86

1,86

sendo 1 e 2 defi-;-:s
droga, como:

Portanto: 0,05 <p< 0,10.


Ao nvel de significncia de 5%, conclumos que os dados no comprovam uma diferena entre os dois mtodos de ensinar matemtica. Existe
uma probabilidade razovel, superior a 5%, de as diferenas observadas
nos dados experimentais serem provenientes de fatores casuais .

A pesquisa !"o,- '


sexo feminino) que JF

(Apf1ulo li - TESTCS dE

COMPARAO ENlRt duA~ l\\1Q)IRI\~

AMosrnAs

dE TAMANHOS difrnENTES

Quando as amostras tm tamanhos diferentes, a varincia agregada


calculada por:
'5es do teste estejam
!'i -erdadeira), ento
~ = 2n - 2 graus de

onde:
n1

tamanho da amostra 1;

'l.i : tamanho da amostra 2;

--~---....-...associada ao

- 2

s~ varincia da amostra 1;

valor

sg: varincia da amostra 2; e

= 18.

gl = n 1 +

'l.i - 2: nmero de graus de liberdade das duas amostras


agregadas.

0,005 ...

A estatstica do teste dada por:


t

2,878 ...

Xi - X2

Sa.

~1

n1

IC':=::.:=::::.:: ;iara uma rea na


o o teste bilateral

+ 1
n2

onde:

.X\ : mdia da amostra 1;


X2 : mdia da amostra 2; e
s a: desvio padro agregado (raiz quadrada da varincia agregada).

ExEMplo ll.8 Queremos verificar, em alunos do ensino mdio que j


experimentaram algum tipo de droga, se a idade com que o fizeram pela
primeira vez diferente entre homens e mulheres. 5 Em especial, queremos
testar as hipteses:
Ho: 1 =2

e H 1: 1*2

sendo 1 e 2 definidos na populao de pessoas que j experimentaram


droga, como:
~

os dados no com--::--=-- :natemtica. Ex.i ste


:::e:enas observadas

1 : mdia de idade em que os homens experimentam droga; e


2 : mdia de idade em que as mulheres experimentam droga.

A pesquisa foi feita com 56 alunos (32 do sexo masculino e 24 do


sexo feminino) que j experimentaram droga. Amostras e clculos:

Este trabalho foi realizado pelas alunas Ktia Vieira e Roseana Rotta na disciplina de
Estatistica, semestre 1999/ 1, Curso de Psicologia da UFSC. A populao foi definida
como sendo os alunos das escolas municipais de So Jos - se.

214

Esr11rsricA 11plic11d11 s CiNCiAs Soci11is

pela l a vez

Mdia

Varincia

13 09 13
08 08 08
14 08

10,625

6,371

14 15 08 13 16 12 14 17 14 10 13
12 13 14 10 15 12 17 16 12 15 13
14 14

13,458

4,781

1 Idade em que experimentou


09 12 10 12 11 09 08 12
Masc. 08 17 09 09 08 09 08 14
08 13 10 10 15 13 13 12
Sexo

Fem.

Como j disc-.:
da anlise estatis:i:..
computador. Exis<e:::.. -
estatstica (SAS, 5-?SS.
mtodos discutidos :=2:
as planilhas elerr::r.:i:::e:s
Na Figura 11. 10 ~aplicao do teste -

Graus de liberdade: gl = n1 + 'l.i - 2 = 24 + 31 - 2 = 54


Varincia agregada das duas amostras:
S2

(n1 - 1) s 12

gl

CAprulo li - Tcsm dE co~:.:

Tesre r:

(n2 -1) S 2 2 = (31) (6,371) + (23) (4,781) = 694


5
54

Desvio padro agregado: S = ~5,694

'

..J

Mdia
V~

= 2,386

Ob sen a

;r.es.

Estatstica do teste :
t

:X1 - :X2
Sa

= 10,625 - 13,458
l
(2,386) + 24
32

-2,833
(2,386). (0,270) = - 4,40

Estar t

Como a Tabela 5 relaciona valores positivos de tcom reas na cauda


superior da curva e, tambm, a distribuio t simtrica em tomo de
zero, devemos procurar a rea relacionada com t = 4,40, como mostra o
esquema a seguir:

- 4,4 0

4 ,40

Entrando na tabela com gl = 60 (o mais prximo do gl verdadeiro,


igual a 54) e valor de t = 4,40, verificamos pela Tabela 5 que a rea na
cauda superior inferior a 0,0005. Como o teste bilateral, temos que o
valor p inferior a 0,001 (o dobro da rea na cauda superior). Assim, o
teste rejeita H 0 ao nvel de significncia de 0,05, pois, p < 0,001 < 0,05 = a .
Conclumos, e nto, que na populao em estudo, os homens tendem a
experimentar drogas com menor idade do que as mulheres.

As trs primei:-c.s ~
de cada amostra e . ::.a
amostras. A "hip:es=
indica que a hiptese - Na sexta e stima ~-""' ="""
t. Os resultados a;r-~~
estamos fazendo ~
Como no nosso exe=~
linhas. Em "P(T<={l - r~
e em "tcritico" daeco - !l
significncia de 5c b T
(atravs do valor pi. ca:;;=i

=-

No MicrosoftExcel, \"::::?=
"ferramentas", "suplez:?e:::;:s"

em "ferramentasn e

~~

para amostras ind~


equivalentes". Na janea :z!
(duas amostras),~ '

,...

~dA s CihciAs SociAis

CAprulo

li - Tcs1L; dE C0\1p,\RAO Ei\TRE dt-AS A\tOSTRA<;

215

Varincia

UsANdo o coMpUTAdon

- 625

6,371

.3 .!58

4,781

Como j discutimos anteriormente, hoje em dia a parte de clculos


da anlise estatstica to rnou -se muito simples com o auxlio do
computador. Existem, no mercado, diversos pacotes computacionais de
estatstica (SAS, SPSS, STATISTICA, S-PLUS, etc .) que fazem os diversos
mtodos discutidos na literatura, com uma interface amigvel. At mesmo
as planilhas eletrnicas esto incorporando tcnicas bsicas de estatstica.
Na Figura 11. l O apresentada uma sada do Microsoft Exce~, com a
aplicao do teste t aos dados do Exemplo 11.8. 6

Vdia

-.:: = 54

-2.E.33
'J,270)

Teste t: duas amostras presumindo varincias equivalentes


Meninos
Meninas
10,62500 13,45833
Mdia
Varincia
6,37097
4,78080
Observaes
32
24
Varincia agrupada
5,69367
Hiptese da diferena de mdia
o
54
gl
-4,39732
Estat t
P(T<=t) unicaudal
0,000026
1,67357
t critico unicaudal
P(T<=t) bicaudal
0,000052
t crtico bicaudal
2,00488

-4,40

Figura 11.10 Teste t realizado pelo Excel (Exemplo 11.8).

o do gl verdadeiro,
- .a 5 que a rea na
-.....areral, temos que o
s .... perior) . Assim, o
p < 0,001 < 0,05 = a.
!:Omens tendem a

As trs primeiras linhas da tabela de sada so medidas descritivas


de cada amostra e, na quarta linha, tem-se a varincia agregada das duas
amostras. A "hiptese da diferena de mdias" igual a zero (quinta linha)
indica que a hiptese nula do teste afirma que as duas mdias so iguais.
Na sexta e stima linhas, tm-se os graus de liberdade e o valor da estatstica
t. Os resultados apresentados nas ltimas quatro linhas dependem se
estamos fazendo um teste unilateral (unicaudaij ou bilateral (bicaudaij .
Como no nosso exemplo o teste bilateral, leremos apenas as duas ltimas
linhas. Em "P(T<=t)" dada a probabilidade de significncia (p = 0,000052)
e em "t critico" dado o menor valor de t para o teste rejeitar H0 , ao nvel de
significncia de 5% . Usando a abordagem que vnhamos trabalhando
(atravs do valor p) , concluimos que o teste rejeita H0
6

No Mkrosojt Excel, vrias tcnicas est.atisticas podem ser feitas acionando no menu principal
"ferramentas", "suplementos" e solicitando que se instalem as "ferramentas de anlise". Clicar
em "ferramentas" e "anlise de dados". Para realizar o teste t discutido nesta seo (teste t
para amostras independentes), escolher "Teste t: duas amostras presumindo varincias
equivalentes". Na janela que se abre, preencher os dados de entrada das duas variveis
(duas amostras), arrastando o cursor sobre as posies da planilha onde esto os dados.

E~TAr~rirn Aplit.Adi\

216

As CitN<.i1\> Sor.iAi>

C:Aprulo li - Trm~ df

Centre

Exrnccios

CTC

CSE
8)

Com a finalidade de verificar se o nvel nutricional da me afeta o peso do


recm-nascido, foram observadas duas amostras de nascimemos. A primeira
foi extrada de uma maternidade particular (Localidade 1), onde as mes so,
em geral, bem nutridas. A outra amostra foi tirada de uma maternidade
pblica, numa regio extremamente pobre (Localidade 2), onde se acredita
que as mes no so bem nutridas.
diferena sig:r-Use a = O,Ol -

Resultados dos pesos, em kg, de recm-nascidos, em duas localidades


Localidade Tamanho da amostra Mdia (kg)
Desvio padro (kg)
1
50
3,1
1,6
2
50
2,7
1,4

Localidade

a ) Os dados mostram evidncia suficiente de que as crian as da Localidade


1 nascem, em mdia, com peso superior do que as crianas da Localidade
2? Use a = 0,05.
b) Podemos afirmar com segurana que esta dife rena no peso mdio dos
recm-nascidos realmente devida ao nvel nutricional da me?
9)

Com o objetivo de comparar duas dietas para engordar frangos, realizou-se


um experimento, em que 19 frangos, todos com um ms de vida, foram
divididos aleatoriamente em dois grupos. No primeiro grupo, com 12 frangos,
foi usada a dieta A, enquanto no segundo grupo, os 7 fran gos fo ram
tratados com a dieta B. No final de um ms, foram encontrados os seguintes
resultados de ganho de peso, em gramas:
Grupo
1

N2 de frangos

Mdia [g)

Desvio padro (g)

12

110
100

21
20

Os dados mostram evidncia suficiente para se afirmar que as dietas


produzem efeitos diferentes? Com que probabilidade de s ignificncia?
10) O objetivo verificar se existe diferena significativa entre alunos bolsistas
e no bolsistas, com respeito ao tempo mdio para a concluso dos crditos.
Para isto, foi extrada uma amostra aleatria de cada grupo de alunos e
observados os tempos para concluso dos crditos, em meses:
Bolsistas

62 24 30 34 54

No bolsistas
56 34 60 62 42 63
69 66 44 54 50 6 1

Monte Ve.d.e
Pq. da Figue:=.

Encosta do

1~

ll. 5
No planejaqual o tamanho -:r

questo, vamos.:!:.~
o teste rejeita G. --. ,
que existem diie:==-..
o chamado Erro -

comum usar :: =
ocorrer o cha.rr!.2.~::. ~diferena real e::-
probabilidade ~ se:.a

Faa o teste com a = 0,05.


11) Numa pesquisa sobre clima organizacional nos departamentos d a UFSC,
professores respondem a um questionrio, em que, num dos itens, o respondente atribui uma nota de 1 (um) a 5 (cinco) sobre a clareza organizacional de
seu departamento. A tabela seguinte apresenta algumas estatsticas desta
varivel para os centros: Tecnolgico (CTC) e Scio-Econmico (CSE).

duas amostras ~~
Seo 11.4 . Sejam _
7

Para realizar a co:::;:e:!t.....


apropriadas, conl:!ec:=:.
Reis e Bornia ( 198:

c~pTulo

:ne afeta o peso do


.sci.mentos. A primeira
---.-. : . onde a s mes so,
e u ma maternidade
e 2 , onde se acredita

li -

TESTES

217

df CO\IP~RAO E'-TRE dt-~ ~\10STRAS

Centro
CTC
CSE

Tamanho da amostra
79
49

Mdia
2,67
2,81

Desvio padro
1,06
1,24

!:-".

Os dados m ostram evidncia suficiente para sugerir que os n veis m dios


da clareza organizacional dos departamentos so diferentes para os dois
centros de ensino?
12) Num levantamento por amostragem, verificou-se o nvel de renda familiar em
trs localidades de um certo bairro (anexo do Capitulo 4). Testar se existe
diferena significativa entre essas localidades, comparando-as duas a duas. 7
Use a = 0,01. A tabela seguinte mostra alguns resultados intermedirios.
Algumas medidas descritivas da distribuio de renda de uma amostra de
famlias do Bairro Saco Grande II, F'lorianpolis - SC, 1988
N2 de familias
Mdia
Desvio padro
L-Ocalidade
na amostra
(sal. min.)
(sal. min.)
Monte Verde
40
8,10
4,28
Pq. da Figueira
42
5,83
2,57
Encosta do Morro
37
5,02
4,52

.a no peso mdio dos


r.a..l da me?
~----~ frangos, realizou-se
;.== :ns de vida, foram

is;:-..:po, com 12 frangos,


os 7 frangos foram
m:rados os seguintes

as dietas

~cluso

dos crditos.
grupo de alunos e

63
61

11. 5 TAMAN~O

dAs AMOSTRAS

No planejamento de um estudo comparativo, surge a questo de


qual o tamanho n da amostra em cada grupo . Para responder a esta
questo, vamos relembrar alguns conceitos de testes estatsticos. Quando
o teste rejeita a hiptese de igualdade entre os grupos (H0), concluindo
que existem diferenas significativas entre eles, podemos estar cometendo
o chamado Erro Tipo 1: rejeitar H0 quando verdadeira. Os testes so
construdos com a probabilidade deste erro fixada num nvel bastante
baixo, designada por ex (nvel de significncia do teste) . Nas cincias sociais,
comum usar a = 0,05. Por outro lado, quando o teste aceita H0 , pode
ocorrer o chamado Erro Tipo II: aceitar H0 quando falsa. A probabilidade
de se cometer este erro designada por ~- desejvel que, quando a
diferena real entre os grupos for grande em termos prticos, a
probabilidade ~ seja pequena; e para que isto acontea, a quantidade n
de elementos em cada grupo deve ser suficientemente grande.
A discusso que segue restringe-se a um teste bilateral para comparar
duas amostras independentes em termos de mdias, conforme discutido na
Seo 11 .4. Sejam 1 e 2 as mdias das duas populaes em estudo e seja:
7

Para realizar a comparao entre mais de dois grupos, existem tcnicas estatsticas mais
apropriadas, conhecidas pelo nome de Anlise de varidncia. Veja, por exemplo, em Barbetta,
Reis e Bornia (1981).

218

Es1Arsri,, ,,plcAdA s Ci,ci"s SociAis

Exrnccios
()

13) Com o obje_

experimenro

A quantidade a diferena de magnitude entre as verdadeiras


mdias em unidades de desvios padres (<>) das populaes em estudo.
Supomos aqui que as duas populaes tenham o mesmo desvio padro.
Para avaliar mos o nmero n de elementos em cada grupo, o
pesquisador precisa ser capaz de fornecer o valor mnimo de S que leva a
consequncias pr ticas. Em geral, o pesquisador tem maior facilidade
de raciocinar em termos da unidade em que se est medindo a vari vel
em nlise, mas, neste caso, necessrio termos uma avaliao de cr.

A Figura 11 . 11 indica o mnimo n para que uma diferena S s eja


detectada pelo teste estatstico, com probabilidade 0,80 (~ = 0,20) e com
probabilidade 0,90 (~ = 0,10).
70

p = 0,20
o
2O>

60

Q.

50

<.>

40

;;;
o

30

'O

20

~I\ ~'0,10
r-..

.,.,E

2e

.,
E

\.
'\

"'
~

11.6

' """

Na Seo -

'\.

' ' " ................

'

-........

10

0.5 0,6

0,7

0.8

0,9

1.0

r-.
......_
!'-.

1,1

1.2

-- --

1,3

1.4

-- - -

1-

1.5

....

1.6

1.7

1.8

1.9

2.0

Oiferena absOluta entre as mdias, por unidade de desvio padro

Figura 11.11 Tamanho mnimo da amostra, n, em cada grupo, em funo


da distncia = IJ.Li o- que se deseja detectar no teste estatstico.

COME' - !,-

JJ.il/

Como exemplo, seja o problema de comparar dois mtodos de ensinar


matemtica para crianas. Dois grupos de crianas devem ser formados, a
fim de que os dois mtodos sejam aplicados (um mtodo em cada grupo). No
final do estudo, o aprendizado de cada criana ser avaliado numa escala de
O a 10. Suponha que os pesquisadores consideram relevante uma diferena
de 1,5 pontos entre as mdias e, com base em estudos anteriores, o desvio
padro nesta escala no deve passar de duas unidades. Logo, S = 1512 = 0,75.
Pelo grfico da Figura 11.11, o nmero mnimo de crianas em cada grupo
deve ser de, aproximadamente, n = 37 para P= 0,10, ou n = 28 para P= 0,20.

pares, tem-se consequente~~

no problema e :;e
na sola de tr!!s
um grupo de C:::.
grupo usa tnis
decid imos por s:o:;::
de algum tem?C
experimento e e:;::::
t para amost:rc.S ::de tnis com os~
direito e esque_~
d o experimenw

Co.prulo 11 - TFsrFs dt

COMPA~O ENTRE

duAs

219

A~IOSTRAS

Exrnccios

11!1:----;..

e::rre as verdadeiras
em estudo.

-~W.aes
=-~o
~--s

..

desvio padro.

e:n cada grupo, o

;:no de que leva a


maior facilidade

13) Com o objetivo de comparar dois mtodos de ensino, planeja-se um


experimento com dois grupos de crianas (divididas aleatoriamente), sendo
que em cada um dos grupos ser aplicado um mtodo de ensino. Quantas
crianas devem ter em cada grupo, para garantir que um teste t bilateral
para amostras independentes, ao nvel de significncia de 5%, detecte uma
diferena de um desvio padro, com 90% de probabilidade? Supondo
distribuio normal , a diferena mnima que se quer detectar est
representada na figura a seguir:

,._-'-"--_~_ ;::e:n

....::ia diferena seja


...---- - 30 (~ = 0,20) e com

11.6 CoMENTRios AdicioNAis

-~

ser formados, a

: em cada grupo). No

numa escala de
::?ante uma diferena
~--~ .:.:iteriores, o desvio
1
-..-.:o..-=:... :.ogo, = ~ =0,75.
_,,:::s;as em cada grupo
- -= 28 para~ - 0,20.
-;;:-::: ado

Na Seo 11.3 descrevemos o teste tpara dados pareados, e na Seo


11 .4 o teste t para amostras independentes. A escolha do teste depende
do planejamento da pesquisa, o qual pode gerar duas amostras de
observaes pareadas ou duas amostras de observaes independentes.
Mas o planejamento da pesquisa deve ser realizado da maneira mais
adequada para o problema em questo. Em geral, quando possvel formar
pares, tem- se maior controle sobre a variabilidade aleatria e,
consequentemente, tem-se um projeto de pesquisa melhor. Por exemplo,
no problema de se comparar dois tipos de materiais em termos do desgaste
na sola de tnis de criana. Podemos planejar um experimento em que
um grupo de crianas usa tnis com solas feitas com o material A e outro
grupo usa tnis com solas feitas com o material B. Para cada criana,
decidimos por sorteio qual material vai ser usado (aleatorizao). Depois
de algum tempo, medimos o desgaste das solas de todas as crianas do
experimento e comparamos as mdias das duas amostras atravs do teste
t para amostras independentes.
Um projeto experimental alternativo fabricar, para o estudo, pares
de tnis com os diferentes tipos de sola, isto , com um dos ps (alternando
direito e esquerdo) com material A e o outro p com material B. As crianas
do experimento usam os dois tipos de materiais, fazendo com que a

220

Es1.usricA 11plicAd11 s Cii\CiA'> Soci11is

comparao seja feita em cada criana, destacando uma possvel diferena


entre os tipos de materiais. Neste segundo planejamento, a comparao
entre os materiais deve ser feita pelo teste tpara dados pareados. A Figura
11.12 ilustra a diferena entre usar pares e usar duas amostras
independentes na anlise dos dados.
oesgaste

o
o

C9
o

Desgaste
o

uma diferena
uma diferena que -

Material A
o Material B

o o
3

5 ...

Criana
Figura 11.12

podem existir cf~


micas, hbitos C:e
possivelmente dife:e-~ -

CAp1ulo li - TesrEs OE m

Um conjunto de dados visto de forma pareada ( direita) e de

forma independente ( esquerda).

Analisando a Figura 11.12, fica evidente que, ao olhar os dados de


forma pareada, tem-se mais informao sobre uma possvel diferena entre
os dois tipos de material. Observando as amostras de forma independente,
as diferenas entre os dois tipos de material ficam ofuscadas pelas
diferenas entre as crianas.
A aplicao de testes t pode ser feita em estudos experimentais ou em
estudos de levantamento. No exemplo p recedente, temos um estudo experimental, pois o pesquisador determina o material a ser aplicado em cada p
da criana, seja no primeiro ou no segundo caso . Se o teste rejeitar H 0 ,
alm de concluirmos que existe diferena significativa entre os dois grupos
de valores, tambm conclumos que esta diferena deve-se ao material
usado na sola do tnis (o nico fator agindo sistematicamente e de forma
diferenciada nos dois grupos). Assim, a aplicao de testes estatsticos em
estudos experimentais permite verificar hipteses de causa e efeito.
Por outro lado, se quisermos comparar o peso de recm-nascidos
em duas localidades, podemos fazer um levantamento por amostragem,
analisando os nascimentos nessas localidades. Neste caso, as duas
amostras j esto naturalmente divididas pela localidade em que reside a
me da criana. Com a a plicao do teste t, podemos detectar uma
diferena significativa entre as duas localidades. Mas a inferncia sobre
a causa da diferena mais dificil do que num estudo experimental, pois

comparao em::-e :::


t por serem os ma; s
desses testes pode:::
procurar tcnicas ~ _;._ ~

paramtricos, qt!c: -
probabilidades co:=..:o : ,
de teste no para::::_s_ ~no captulo seg: JT-~

O Quadro

~-

Quadro 11.1 Algu:::.s


Amostras
Pareadas

Independentes

Exrnccios coMplE.,.a--:.~

~ ... ~s Ci\CiAs SociAis

a comparao
~ pareados. A Figura
=s.::: duas amostras
e:!tO,

18.rerial A
!aierial B

a: olhar os dados de
- . el diferena entre
~a independente,
ofuscadas pelas

CAprdo li - TcsrEs de CO\tPARAO rwRl ch.. AS

221

Mto~rRAs

podem existir diversos fatores, tais como etnia , condies socioeconm icas, hbitos de alimentao, etc. , agindo de forma interativa e
possivelmente diferenciada nas duas localidades (veja o Exerccio 8).
Outro aspecto que merece comentrios a implicao prtica de
uma diferena estatisticamente significativa. Uma diferena significativa
uma diferena que no deve ter ocorrido meramente por acaso, mas no,
necessariamente, uma diferena relevante em termos prticos. Quando
se analisam amostras grandes, os testes podem concluir que pequenas
diferenas so significativas. Resta a anlise prtica para verificar se essas
diferenas, estimadas pelos dados, so relevantes.
Existe uma grande quantidade de te stes estat s t icos para
comparao entre duas amostras. Neste captulo, demos nfase aos testes
tpor serem os mais usados. Contudo, em muitas situaes, as suposies
desses testes podem estar sendo violadas. Quando isto ocorrer, devemos
procurar tcnicas alternativas, em especial os chamados testes no
paramtricos, que no supem uma determinada distribuio de
probabilidades como geradora dos dados. 8 O teste dos sinais um exemplo
de teste no paramtrico, assim como o qui-quadrado, que ser estudado
no captulo seguinte.
O Quadro 11.1 mostra alguns testes para comparao de duas
amostras, segundo o tipo de varivel e condio das amostras.
Quadro 11.1 Alguns testes para comparao de duas amostras
Amostras
Pareadas

Independentes

Varivel

Qualitativa
Teste dos sinais
(Seo 11.2)
Teste qui-quadrado

(Seo 12.1)

Quantitativa
Teste t pareado

(Seo 11.3)
Teste t amostras independentes
(Seo 11.4)

Exenccios coMplEMENTARES

C.e recm-nascidos
-:..:; por amostragem,
~te caso, as duas
...a..e em que reside a
-::!os detectar uma
- a inferncia sobre

14) Uma cervejaria estuda a possibilidade de alterar o rtulo de uma de suas

marcas, usando formas e cores mais vivas. Para avaliar se existe vantagem
em alterar o rtulo, a empresa levou a cabo uma pesquisa de marketing.
Enlatou a cerveja com o rtulo tradicional e com o rtulo novo. A pesquisa foi

feila em oito estabelecimentos comerciais. Em quatro deles, extrados por


8

Os te::.tes t supem que os dados provenham de distribuies normais e as populaes


tenham, aproximadamente, a mesma varincia

222

EsrArsricA AplicAdA s CiNCii\S Socii\is

sorteio, colocou-se o produto com o rtulo novo e, nos outros quatro, mantevese o produto com o rtulo tradicional. Aps um ms, avaliou-se a quantidade
vendida em cada estabelecimento. Os estabelecimentos que usaram o rtulo
tradicional tiveram os seguintes resultados nas vendas (em milhares de
unidades): 6 , 5 , 2, 2 . Os estabelecimenlos que usaram o rtulo novo tiveram
os seguintes resultados nas vendas (em milhares de unidades): 4 , 9, 5 , 6 . Os
dados mostram evidncia suficiente de que a mdia de vendas superior
com o rtulo novo? Aplique um teste estatstico apropriado, ao nvel de
significncia de 5% .
15) Para o mesmo problema da questo anterior, outro instituto de pesquisa,

que tem uma equipe com melhor preparao em estatstica, elaborou um


projeto um pouco diferente. Com seis estabelecimentos comerciais dispostos
a colaborar com a pesquisa, colocaram-se as duas embalagens (de rtulo
tradicional e de rtulo novo) da mesma cerveja. Tomou-se o cuidado para que
em cada estabelecimento, a apresentao das duas embalagens do produto
fosse feita de forma idntica. Os resultados das vendas mensais (em milhares
de unidades), foram os seguintes:
Estabelecimento:
1
Rtulo tradicional: 16
Rtulo novo:
20

4
2
3
5
6
32
19
25
28
12
40
11
33
31
21
Os d ados mostram evidncia suficiente de que a mdia de vendas superior
com o rtulo novo? Use nvel de significncia de 5%.
16) Com respeito questo anterior, suponha que os gerentes dos

estabelecimentos comerciais se recusaram a fornecer os valores das vendas,


mas informaram com qual rtulo as vendas fo r a m maiores. No s
estabelecimentos 1, 3, 4, 5 e 6 as vendas foram maiores com o rtulo novo, e
no estabelecimento dois as vendas foram maiores com o rtulo tradicional.
Esses dados so suficientes para afirmar que a maioria dos estabelecimentos
vende mais cerveja com o rtulo novo? Use nvel de significncia de 5%.
17) Com o objetivo de avaliar o efeito de uma merenda escolar reforada, foi realizado

um estudo com dois grupos de crianas que tinham princpios de desnutrio.


Fizeram parte do estudo sete pares de crianas. Em cada par, as crianas
tinham peso e idade similares. As crianas de cada par foram divididas em
dois grupos, sendo um tratado com merenda "reforada" (Grupo A) e o outro
com merenda convencional (Grupo B). Os dados a seguir apresentam o ganho
de peso, em kg, durante seis meses.
Grupo
A

1
6
2

2
5
4

Par de

cri an~as

r-4.. ,

6
4

-1

7
4

Esses d a dos mostram evidncia suficiente para garantir que crianas tratadas
com a m erenda reforada ganham, em mdia, mais peso do qu e crianas
tratadas com merenda convencional? Justifique sua resposta atravs de um
teste estatstico adequado, ao nvel de significncia de 10%.

CApfru lo li -

Tcsrcs dE

~e_~--

Dept de Ar~:e padro de 5 ,9 ?.!" e:


Dept de Psico~~?=-
de 5,4 pontos.
Esses dados ~
social com o <ie;E:
de Arquiteru_-a ,e
19) Para avaliar o

s- ~

lisou duas~ c;;;:-stra aleatria de ~

.., ~

. ~d' s C iCNciAs Soci Ai ~

CApr ulo

11 -

TESH~

dt

co:vipARAo ENTR C d uAs A\lO~l RAS

18) Um estudo sobre a identidade social dos professores com o departamento


a que pertencem, mostrou os seguintes resultados (quanto maior o escore
maior identidade social com o departamento) :
Dept de Arquitetura: amostra de 24 professores, mdia de 40,8 e desvio
padro de 5,9 pontos.
cie vendas superior
-:opriado, ao nvel de

.=srituto de pesquisa,
es::c.stica , elaborou um
...__..;;;._~-:: comerciais dispostos
e.;:;ibalagens (de rtulo
~o cuidado para que
e=::>alagens do produto
- =ensais (em milhares

~- e

o s gerentes dos
'ralores das vendas,
- :-arn maiores. Nos

-~~-.s

6
.=

U:::=:=:::-::: ~e crianas tratadas


:rso do que crianas
~ta

::)%.

atravs de um

Dept de Psicologia: amostra de 19 professores, mdia de 42,5 e desvio padro


de 5,4 pontos.
Esses dados mostram evidncia suficiente de que, em mdia, a identidade
social com o departamento diferente quando comparamos os departamentos
de Arquitetura e Psicologia? Explique.
19) Para avaliar o governo perante os empresrios, um instituto de pesquisa realisou duas pesquisas: a primeira, logo aps a posse do governo, com uma amostra aleatria de 200 empresrios, em que a nota mdia foi de 7,0 pontos, com
desvio padro de 2,0 pontos; a segunda, aps seis meses, com outra amostra
aleatria de 200 empresrios, que mostrou aprovao mdia de 6,0 pontos,
com desvio padro de 3,0 pontos. Os dados mostram evidncia suficiente
para afirmar que, na populao de empresrios, houve reduo na aprovao
ao governo? Use ex = 0,01.

PARTE

RElAO ENTRE VARVES

COMO MEdiR ETESTAR A siqNificNCA dA ASSOCiAO ENTRE duAS VARiVEiSQUAliTATiVAS


COMO ESTUdAR A CORRElAO ENTRE duAS VARVES QUANTiTATVAS
CoMo CONSTRU iR MOdElos PARA o RElAcioNAMENTO ENTRE duAs VARivEis

( ApTulo

12
ANlisE dE dAdos CATEqoRizAdos

rande parte das variveis estudadas nas Cincias Humanas e Sociais


no mensurada numericamente, mas somente permitem alocar cada
elemento em categorias preestabelecidas. A observao dos elementos da
amostra resulta em dados categoriz.ados. Por exemplo, ao observar a varivel
sexo (gnero), cada indivduo pesquisado deve ser alocado na categoria
masculino ou na categoria feminino. Lembramos que as variveis devem
estar bem definidas, de maneira que cada elemento pesquisado se encaixe
em uma (e apenas em uma) categoria.

CoMpAnAo ENTRE AMOSTRAS

O teste qui-quadrado, que ser e studado neste captulo, poder


ser usado em problemas de pesquisas com amostras independentes,
anlogos aos discutidos no captulo anterior, porm com. a varivel
resposta qualitativa (categrica), como, por exemplo, na comparao de
mtodos de ensino para vestibulandos, em que a varivel resposta o
resultado no vestibular (para cada aluno: aprovado ou reprovado). Outro
exemplo: na comparao das populae s de homens e mulheres quanto
ao tabagismo (fumante ou no .filmante) .
ANliSE dE ASSOciAO

Um dos grandes propsitos em pesquisas nas Cincias Sociais


verificar se duas ou mais variveis se apresentam associadas.
Existe associao entre duas variveis se o conhecimento de uma altera a probabilidade
de algum resultado da outra.

228

Esr1\TsricA AplicAdA s CifNCiAS Soci/\is

Podemos dizer que existe associao entre o clima e a propenso de


uma pessoa ir praia, porque maior a probabilidade de a pessoa ir
praia num dia quente e ensolarado do que num dia frio e chuvoso. Ou
seja, o conhecimento do clima altera a probabilidade de a pessoa ir
praia, o que caracteriza uma associao. 1
Neste captulo, estudaremos como testaruma possvel associao entre
duas variveis qualitativas, com base numa amostra de observaes. Veremos, tambm, maneiras de medir o grau de associao descrito pela amostra.

12.1

o TSTE dE ASSOCiAO o ui.-QuAdRAdo

O teste qui-quadrado o teste estatstico mais antigo e um dos mais


usados em pesquisa social. um mtodo que permite testar a significncia
da associao entre duas variveis qualitativas, como tambm comparar
(no sentido de teste de significncia) duas ou mais amostras, quando os
resultados da varivel resposta esto dispostos em categorias .

Agora, consu:.~
um pouco diferen~ ~

Ho: nh = ;r_

onde nh a propo~~
fumantes, nas po~Descon s ide:G::..duas populaes,. s;:. ~
qualquer conheci::;.~
Neste contexto . a ti;

H,:

ExEMplo 12.1 Para estudar a associao entre sexo (masculino ou feminino)


e tabagismo (fumante ou no fumante), numa certa populao, foi
observada uma amostra aleatria de 300 pessoas adultas dessa populao,
fazendo-se a classificao segundo o sexo e tabagismo. Os dados esto
apresentados na Tabela 12.1.

Tabela 12.1 Distribuio de 300 pessoas, classificadas segundo o sexo e


tabagismo
Tabagismo
Fumante (%)
l\o fumante (%)
Total [%)

Sexo

Masculino
92 (46 ,0 )
108 (54,01
200 (100,0)

Fe minino
38 (38,0)
6 2 (62,01
100 1100,01

Total
130 (43,3)
170 (56,71
300 (100,01

A Tabela 12. l uma tabela de contingncia, de dimenso 2x2,


mostrando os resultados de uma amostra de 300 individuas, classificados ,
simultaneamente, com respeito s variveis sexo e tabagismo. O objetivo
verificar se os dados da amostra mostram evidncia suficiente para afirmarmos que, na populao em estudo, existe associao entre sexo e tabagismo.

ExEMplo 12.2 Com o


em termos do nz. ei1 ~
sificao segundo o~ na Tabela 12.2.
Tabela 12.2 Dis ..._:=-.:.:-.--a localidade da res:.: ....-r==

Para o problema espect5a::


tesr.e Z de diferena e:-~:!__

A existencia de associao entre X e Y no implica, n ecessariamente, que X causa Y, ou


que Y causa X.

e permite a aborcl.agc;;. e:: ==--""'


(1981, p. 282) ou T~

229

CAprulo 12 - ANlisE dE dAdos CATF(jORi ZAdos

:a e a propenso de
- - -""'--e d e a pessoa ir
-

-G.

::-:o e chuvoso. Ou
d e a pessoa ir

!"--"":_....-~-e

:::i::ssre! associao entre

Agora, considere que o projeto de obteno de dados tivesse sido


um pouco diferente: duas populaes (a de homens e a de mulheres) e
uma nica varivel resposta: tabagismo (fumante ou no fumante) .
Poderamos ter interesse em testar se existe diferena significativa entre
a proporo de homens fumantes e a proporo de mulheres fumantes.
Formalmente, teramos as seguintes hipteses:

:.~ observaes.

Vere~"'SCrito pela amostra.

-=.:igo e um dos mais

onde nh a proporo de homens fumantes e rrrn a proporo de mulheres


fumante s, nas populaes em estudo.2
Desconsiderando a questo do planejamento da pesquisa (uma ou
duas populaes), se nh = n"', ento o conhecimento do sexo no fornece
qualquer conhecimento sobre o fato de o indivduo ser ou no fumante.
Neste contexto, a hiptese nula pode ser escrita como:

- :smr a significncia
:ambm comparar
-==.ostras, quando os

-:=sn1lino ou feminino)
:.::-_a populao, foi
;2S dessa populao,
-...,,,,.. . . .._-n_ Os dados esto

Total
130 (43,3)
170 56,7
300 100 o

...-:-===!!::lte. que X causa Y, ou

H 0 : Sexo e tabagismo so variveis independentes, na populao

em estudo.

Por outro lado, se rrh =F nm, ento o conhecimento do sexo aumenta


(ou diminui) a chance de o indivduo ser fumante. Logo,
H,: Existe associao entre as variveis sexo e tabagismo, na
populao em estudo.

ExEMplo 12.2 Com o objetivo de verificar se trs localidades so diferentes


em termos do nvel de instruo, foram selecionadas amostras 8.J.eatrias
de indivduos adultos nessas localidades, fazendo-se a classificao segundo o nvel de instruo. Os resultados esto apresentados
na Tabela 12.2.
Tabela 12.2 Distribuio de frequncias do nvel de instruo, segundo

a localidade da residncia.
Nvel de instruo
Nenhum(%)
Fundamental (%)
Mdio ou superior (%)
Total(%)
2

Monte Verde
6 (15,0)
11 (27 ,5)
23 (57,5)
40 (100,0)

Localidade
Parque da
Figueira
14 (32,6)
14 (32,6)
15 (34,8)
43 (100,0)

Encosta do
Morro
18 (48,7)
13 (35 ,1)
6 (1 6 ,2)
37 (100,0)

Para o pr oblema especfico de testar duas propores, tambm pode ser aplicado o chamado
teste Z de diferena entre duas propores, o qual usa a distribuio normal como referencia
e permite a abordagem wlllateral. Para maiores detalhes, ver, por exemplo, Stevenson
(1981, p. 282) ou Triola (2005, p. 336).

270

EsTATSTiCA Apl icAdA i\s C iNc:i11s Soc:i11is

Aprendemos, no Captulo 4, a interpretar uma tabela em termos


descritivos, ou seja, t irar informaes dos dados tabulados, sem se
preocupar com generalizaes. Contudo, se os dados so de amostras,
podemos testar se as diferenas so significativas, isto , se os dados
mostram evidncia suficiente para inferirmos que existem diferenas
tambm nas populaes de onde eles foram extrados. Formalmente,
podemos testar as seguintes hipteses:

0.pfrulo 12 - ANlisE

e.~

independentes cP-; ~ - .~ -;=


se mantenham, ta:::.3=:

Como foram obse_";-a<--s:


43,3% de 200

56,7% de 200 r.,

--

De forma z- ~".--:~
estrato das m ufue:-;:::5..

H 0 : As distribuies de frequncias do nvel de instruo so iguais

H 1:

nas trs localidades;


As distribuies de frequncias do nvel de instruo no so
iguais nas trs localidades.

Se considerarmos que as trs localidades formam categorias da


varivel localidade da resi.dncia, podemos colocar as hipteses em termos
de independncia (H0 ) e associao (HJ 3

Dadas duas variveis qualitativas, as hipteses do teste qui-quadrado podem ser


formuladas como:
H0 : As duas variveis so independentes.
H,: Existe associao entre as duas variveis.

EsTATsTicA

do TESTE

Chamaremos de clula a cada cruzamento de linha e coluna de


uma tabela de contingncia.
A estatstica do teste, que designaremos por x2 (qui-quadrado), uma
espcie de medida de distncia entre as frequncias observadas e as
frequncias que esperariamos encontrar em cada clula, na suposio de as
variveis serem independentes (H0 verdadeira). Ilustraremos a obteno das
frequncias esperadas e da estatstica x2 , usando os dados da Tabela 12.1.

O clculo ;;;;;: ... - ':!!...-=-=


aplicao da seg:"- :=.
contingncia:
=-----

A estatstica .:: -

onde: a soma se es"""-~ - O represe=::.:::..: .


E represe:::::a e

ExEMplo 12.1 (corni'r':~Ta bagismo


Fumante

No fumante
Total

Clculo

ExEMplo 12.1 (coNTNUAO) Para obter as frequncias esperadas, seja a distribuio percentual de fumantes e no fumantes em toda a amostra (43,3%
de fumantes e 56,7% de n o fumantes). Se tabagismo e sexo forem variveis

Tabagismo
Fumante

Muitos autores preferem considerar a presente situao como um teste de homogeneidade


entre as amostras das diferentes localidades, j que no presente contexto a localidade da
residncia no propriamente uma varivel, m as sim uma referncia s populaes (ou
aos subgrupos da populao) em estudo. Porm, o teste qui-quadrado pode s er aplicado da
mesm a maneira.

No fumante

das ~

CAphulo 12 -

- s :a.bulados, sem se
-=-:..-s so de amostras,
--.~-- :.Sto , se os dados

existem diferenas
::s dos. Formalmente,

A NlisE

271

dE dAdos C>\TEGORIZAdos

independentes (H0 verdadeira), devemos esperar que estas percentagens


se mantenham, tanto no estrato dos homens, como no estrato das mulheres.
Como foram observados 200 homens, devemos esperar em tomo de:
43,3% de 200 homens fumantes [(0,433)x(200) = 86,6)) e
56,7% de 200 homens no fumantes [(0,567)x(200) = 113,4).

De forma anloga, podemos obter as frequncias esperadas no


estrato das mulheres.

::..= :.::Struo so iguais

-:: :nsrruo no so

O clculo das frequndas esperadas pode ser simplificado com a


aplicao da seguinte frmula, aplicada a cada clula da tabela de
contingncia:

.:.;:,

~::preses

E= (total da linha) x (total da coluna)


(total geral)

em termos

A estatstica do teste qui-quadrado definida por

x2= I (o-:)2

-:;.arado podem ser

onde: a soma se estende a todas as clulas da tabela de contingncia;


O representa a frequncia observada na clula; e
E representa a frequncia esperada na clula.

ExEMplo 12.1

-= !inha e

coluna de

(CONTNUAO) Clculo das frequncias esperadas:

Tabagismo

Sexo
Masculino

No fumante

130 x200 -86,67


E=
300
170x200
E=
113,33
300

Total

200

Fumante

Total

Feminino
130X100
E=
300
170xl00
E=
300

43,33

130

56,67

170

100

300

Clculo das parcelas da estatstica qui-quadrado:


__.,~as,

seja a distri-

~a amostra

(43,3%
~ sexo forem variveis

Tabagismo

Sexo
masculino

feminino

Fumante

(92 - 86,67r = 0 328


86,67
,

(38- 4 3,33)" - o656


43,33
,

No fumante

(108-113,331 = 0251
113,33
'

(62 - 56,671
56,67

0,501

2~2

EsrArsricA AplicAdA s CiNCiAs SociAis

verdadeira, os poSS:

Assim, temos o valor da estatstica qui-quadrado :

x2 = o,328 + o,656 + 0,251 + o,so1

CArulo 12 - ANliSE dE e

1,74

Quando as variveis so independentes (H 0 verdadeir a), as


frequncias observadas tendem a ficar perto das frequncias esperadas:
apenas variaes casuais! Neste caso, o valor de x2 deve s er pequeno. Em
outras palavras, um valor pequ eno de x2 sugere que as variveis podem
ser independentes. Por outro lado, um valor grande na estatstica x2 ,
sinaliza que as diferenas entre as frequncias observadas e frequncias
esperadas no devem ser meramente casuais, ou seja, deve haver
associao e ntre as duas variveis.

distribuio qui~~
distribuio qui-qra..;- .:.:......
cresce o nmero de ~
4

f(x)

gl = :

o
Figura 12.1 Distribuie5 ::.--c=- -

Disrnibuio dE rlErnNCiA
Precisamos de uma distribuio de referncia que permita j ulgar
se um determinado valor da estatstica x..2 pode ser considerado grande o
suficiente para rejeitar H 0 , em favor de H 1. Suposies bsicas para usar
a chamada distribuio qui-quadrado como referncia:
1) que os dados estejam dispostos numa tabela de contingncia propriamente dita, isto , cada elemento observado alocado
numa e apenas numa clula; e

Supondo que as ~ =- .
probabilidade de a ~
valor do r2 , calcula&: :::::;:::

2) que as amostras sejam grandes.


A verificao da adequao dos tamanhos das amostras

usualmente feita em termos das frequncias esperadas. A maioria dos


autores considera adequada a aplicao d o teste qui-quadrado quando
todas as frequ ncias esperadas forem maiores ou iguais a 5 (cinco). 4 No
exemplo em discusso, as frequncias esperadas foram: 86,67, 43,33,
11 3,33 e 56,67. Portanto, todas superiores a 5, o que permite a realizao
do teste qui-quadrado.

Amos::-a

Supondo H0 verdadeira e as condies (1) e (2), ento os possveis valores da estatstica

x2 seguem a chamada distribuio qui-quadrado com g l =(.e - 1) (c - 1) graus de liberdade,


onde e o nmero de linhas e c o nmero de colunas da tabela.

No Exemplo 12.l, ambas as variveis tm duas categorias (tabela


2x2), ent o e=2, c = 2 e, portanto, gl = (2 - 1) (2 - 1) = 1. Logo, se H0 for
4

Quando ocorrer alguma frequncia esperada m enor do que cinco, pode-se aplicar o chamado
teste exato de Fisher. Veja, por exem plo, Levin (1985, p. 221).

Quando os daf-s
valor p pequeno), o~=
os dados observados __
valor p grande), o t.es-...e - =
condizente com a ~
construda luz de E

a. JIP[iCAdA s Ci~NCiAs Soc iAis

-- : = ::. ,74

~.s

H 0 ve rdadeira), as
esperadas:
- eve ser pequeno . Em
- - :e a s variveis podem

verdadeira, os possveis valores da estatstica x.2 devem seguir uma


distribuio qui-quadrado com gl = 1 grau de liberdade . A forma da
distribuio qui-quadrado torna-se menos assimtrica medida que
cresce o nmero de graus de liberdade (veja a Figura 12. 1) .
4

f(xj

~ncias

"'""-~d e

na estatstica

277

C Apru lo 12 - ANl isc dE dAd os CATEt;ORir Ados

0,2

gl = 1

0,1

x2 ,

-s.=rra das e frequ ncias


~u sej a, deve haver

gl = 4

f(x)

Figura 12.1 Distribuies qui-quadrado com gl

1 e gl

4.

--=--:::.:.. que permita julgar


r - - considerado gran de o
:::::....;:::es bsicas para usar
~ de
~------

contingncia pro".lbservado alocado

~---o s

das amostras
~radas . A maioria dos
~ qui-quadrado quando
=- :guais a 5 (cinco) .4 No
::;.:;:..;;..s foram: 86,67, 43,33,
- - ~e permite a realizao

Supondo que as duas variveis sejam independentes (H 0 verdadeira), o valor p a


probabilidade de a estatstica qui-quadrado acusar um valor maior ou igual do que o
valor do z2 , calculado com base na amostra (ver Figura 12.2).

f(x

valor p

Amostra~ X.
-::SS:.eis valores da estatstica
= -: (c-1) graus de liberdade,
~~la.

~~

cuas categorias (tabela


.: - 1) = 1 . Logo, se H0 fo r

Figura 12.2 A probabilidade de significncia (valor p) como


uma rea sob a curva da distribuio qui-quadrado.

Quando os dados levam a um x2 grande (e, em consequncia, um


valor p pequeno), o teste rejeita H 0 , em favor de H 1 . Por outro lado, quando
. os da dos observados levam a um x2 pequeno (e, em consequncia, um
valor p grande), o teste no rejeita H0 , porque o valor calculado de 7_2 est
condizente com a distribuio dos possveis valores de qui-quadrado,
construda luz de H0 .

2}4

EsTATs1icA AplicAdA ~ Cii\ciAs SociAis

Conforme apresentado no Captulo 10, adotado um nvel de


significncia a, a deciso do teste estatstico :
p>a

p ~a ~

CAp1 ulo

12 - /\i\lisE dE

esperada en tre 5 ""


continuidade de !":res.
absolutas entre a- l
tabelas de com:ing~-

aceita H0
rejeita H0 , em favor de H 1

TAbElAdAdisrnibuio oui--ouAdRAdo
Depois de calculado o valor da e statstica c 2 , podemos obter a
probabilidade de significnciap, usando uma tabela da distribuio quiquadrado (Tabela 6 do apndice). A continuao do Exemplo 12.1 ilustra
o uso dessa tabela.

ExEMplo 12.1 (CONTNUAO) Usando a Tabela 6 do apndice, entramos na linha


correspondente a gl = l. Verificamos que o valor calculado x2 = 1,74 est
entre os valores 1,32 e 2,71 da tabela, os quais esto associados s reas
na cauda superior iguais a 0,25 e 0,10, respec tivamente, conforme ilustra
o seguinte esquema:

gl

x2 = 1,74

Fumante

No fumante

Amostra

Tabagismo

erior
0,010

0,25
3,84

5,02

6,63

gl = 1

Logo, para o valor calculado x2 = 1,74, temos o valor p entre 0,10 e


0,25. Usando o nvel usual de significncia de 5% (a = 0,05), o teste
aceita H 0 (pois, p > a). Conclumos , ento, que os dados no mostram
evidncia de associao entre sexo e tabagismo, na populao em estudo.
Em outras palavras, a diferena verificada na amostra entre a proporo
de homens fumantes e a proporo de mulheres fumante s pode ser
explicada, m eramente, por variaes casuais da amostragem.

CORREO dE CONTiNuidAdE EMTAbElAs 2 X 2


J comentamos que a distribuio qui-quadrado, usada como
distribuio de referncia para a estatstica x2 , s vlida para amostras
grandes. Em tabelas de dimenso 2 x 2, especialmente quando as amostras
no forem muito grandes (por exemplo, quando existir alguma frequncia

Quando as . ,. ,_-- de continuidade ~


Exerccio 1). jus - .

UMA

fR -

podemos calcula:- a s eguinte forma:


a

a +c

b --

:..o.dA <; C iNciAs Socil\is

~cotado

um nvel de

esperada entre 5 e 10), recomendamos aplicar a chamada correo de


continuidade de Yates, que consiste em reduzir 0,5 unidade nas diferenas
absolutas e ntre as frequncias observadas e esperadas. Assim, para
tabelas de contingncia 2 x 2,
2_ "

X-L.J
~-

podemos obter a
z.::oz da distribuio qui-=:xemplo 12.1 ilustra

::..-::::;::::::.::e
- , entramos na linha
~clado x2 = 1,74 est

- associados s reas
~~:e. conforme ilustra

2~5

CAphulo 12 - A 'Il isc dE dAdos CATEGORi Li\dO~

Qo-EJ-o,s) 2
E

Ou seja, em cada clula, depois de calcular a diferena entre O e E,


devemos desprezar o sinal (+ ou -) e reduzir 0,5 unidade. Em seguida,
elevamos ao quadrado, e dividimos pela frequncia esperada da clula.
Vamos refazer o clculo do x2 do Exemplo 12.1, usando a correo
de continuidade. Primeiramente, faremos o clculo das parcelas do x?,
referentes a cada clula:
Sexo

Tabagismo

Masculino

Feminino

Fumante

~92 - 86,671- o.sr = o 269

No fumante

~108 - 113,331- o.s r - o 206

86,67

43,33

113,33

~38 - 43,331- o,s

= o 538

'

~62- 56,67[ - o,51 = 0 412


56,67

'

0,0 10

Resultando em: x2 = 0,269 + 0,538 + 0,206 + 0,412 = 1,43.

6,63

Usando a Tabela 6 com gl = l, encontramos a probabilidade de


significncia na m esma faixa do caso anterior, isto , 0,10 < p < 0,25.

~or

p entre 0,10 e
a = 0,05), o teste
Carlos no mostram
:::xg-.llao em estudo.
--~<.-e enrre a proporo
- - ~~antes pode ser

~.::-ado,

usada como
e 1ida para amostras
...,. ~Jando as amostras
:.:: alguma frequncia

Quando as amostras no forem muito grandes, o u so da correo


de continuidade pode levar a resultados bastante diferentes (veja o
Exerccio 1) . justamente neste caso que a correo mais reeomendada.

UMA fRMulA MAis npidA pAnA o clculo do X,2 EM TAbEIAs 2 x 2


Em tabelas 2 x 2, representadas segundo o esqu ema abaixo,
podemos calcular a estatstica x2 , com correo de continuidade, da
seguinte forma:
a
e

a+b

c+d

a +c

b+d

n {lad -

bel -%

z 2 = (a+b)(c+d).(a+c) (b+d)

2"76

Es1A1b1lcA AplicAdA S CitNCiAs SoclAls

Vamos ilustrar o u so desta formula com os dados da Tabela 12.1:


a = 92

b = 38

a + b = 130

e = 108

e+d

a+ e= 200

62

b +d = 100

(centro), frequnc'~.
(canto inferior esq~:::,:-

170

Recuperao
funcional

n = 300

Nenhuma

Assim,
2

3001)
2

(1

300 X 92X62 - 38X108 - -

= 300 X IJ.600 -

150]2
442.000.000

130X170X200X 100

Parcial

= 300 X (2.102 .500) = l


442.000.000

'

43

Para calcular a estatstica x sem a correo de continuidade, basta


excluir a frao n/2 do numerador.
2

Completa
Total

ApliCAo do TESTE Qui~QuAdRAdo EM rAbEIAs dE GRANdEdiMENSo

Somando os-E

ExEMplo 12J (BOX; HUNTER; HUNTER, 1978, p . 145.) Num estudo


exploratrio est se examinando a recuperao funcional de pacientes s ubmetidos a um certo ato cirrgico, em cinco hospitais de uma
cidade. Os hospitais A, B, C e D s o hospitais comuns, enquanto o
Hospital E um hospital de referncia, o qual recebe os casos mais graves. A Tabela 12.3 mostra os resultados de um levantamento por
amostragem, realizado nos cinco hospitais.
Tabela 12.3 Resultados (frequncias e percentagens) da recuperao
funcional de pacientes, submetidos a um certo procedimento cirrgico,
em cinco hospitais.

com

Pela Tabela '5

recuperao fu.ncicc.:::;;.
palavras, o teste ~.!5.-,:
diferentes quanto ;:---- ~

Hospital

Recuperao
funcional
Nenhuma(%}

A
13 (27,7)

5 (16,1)

8 (10,1)

D
21 (16,4)

43 (52,4)

Parcial (%)

18 (38,3)

10 (32,3)

36 (45,6)

56 (43,8)

29 (35,4)

Completa (%)

16 (34,0)

16 (51 ,6)

35 (44 ,3)

51 (39,8)

10 (12,2)

melhor uma eve nn:<L


grupos de categori..as ~
estudar separadame.=.:::

ExEMplo 12J (coNrhv..:;


Com o objetivo d e verificar se realmente existe associao entre
hospital e recuperao d o paciente, vamos realizar o teste qui-quadrado. A
Tabela 12.4 mostra as frequncias esperadas e as parcelas de cada clula
no clculo da estatstica x2

das clulas da Tabela :.2do Hospital E que ":!.=


Podemos, ento, fazu ~
foi em razo de difere:= .-:10
somente entre os ho~-.. >

olic~dA As CiEN.iA~ SociAis

CAprulo 12 - N-1,\lisr

d e dAdos Co\ 1ECjORi7-Ados

Tabela 12.4 Resultados do procedimento cirrgico: frequncias obsexvadas

(centro), frequncias esperadas (canto superior direito) e parcelas do


(canto inferior esquerdo).
Recuperao
funcional
Nenhuma

_ 3:00x(2.102.soo)
-

442.000.000

::;;e

Parcial

= 1 43

continuidade, basta

Completa

Total

Hospital
B
e
D
E
11 ,53
7,60
19,37
31,39
20,11
13
21
43
5
8
0,19
0,89
6,67
3,44
26,05
19 ,08
32,07
51,94
33,39
1 2.~9
18
10
36
56
29
0,06
o 53
0,48
0,31
0,55
16,39
10,81
27,55
44,64
28,60
51
16
16
35
10
0 ,01
2 49
2,02
0 ,91
12,10
47
79
31
128
82
A

Somando os valores das parcelas do

x2

Total
90
149

128
367

x2 , temos:

x2 = 56,7
: ~5. )

Num estudo

com
gl

- os casos mais gra-

..::=: :evantamento por

- .;:;.s, da recuperao
-ceimento cirrgico,
::>

--'

16,4)

43 (52 ,4)

56

~3 ,8)

29 (35,4)

;;;;: 39,8)

10 (12,2)

=(e - 1). (e - 1) = (3 - 1). (s - 1) = 8

Pela Tabela 6 do apndice, verificamos que a probabilidade de


significncia p inferior a 0,0005. Ento, para qualquer nvel usual de
significncia (por exemplo, a = 0,05) , o teste detecta associao entre
recuperao funcional de pacientes e hospital (pois, p < a). Em outras
palavras, o teste qui-quadrado mostrou que os hospitais em estudo so
diferentes quanto recuperao funcional de seus pacientes.

Muitas vezes, ao analisar uma tabela de grande dimenso, temos


tambm o interesse em estudar partes desta tabela para entendermos
melhor uma eventual associao entre duas variveis. Podemos comparar
grupos de categorias agregadas segundo algum critrio e, posteriormente,
estudar separadamente as categorias que estavam agrupadas.

ExEMplo 12J (CONTiNUAO)

associao entre
-s:e qui-quadrado. A
-.:e:as de cada clula

!!:l:S:=

Observando as parcelas do X2 (canto inferior esquerdo


das clulas da Tabela 12.4), verificamos que as maiores contribuies partiram
do Hospital E que um hospital de referncia e recebe os casos mais graves.
Podemos, ento, fazer uma anlise estatstica para verificar se a significncia
foi em razo de diferenas entre os hospitais comuns e o hospital de referncia,
somente entre os hospitais comuns, ou ambos os casos.

278

EsrArisricA Aplic,~d.>. :. CiFNCiA:. SociAis

A Tabela 12.5 agrega todos os hospitais comuns (A, B, C e D) para


confrontar com o hospital de referncia E. O valor da s fre quncias
observadas na coluna dos hospitais comuns corresponde soma das
frequncias observadas dos hos pitais A, B, C e D da Tabela 12.3. As
frequn cias esperadas e as parcelas do x2 foram calculadas novamente.

significativa en::-e

Tabela 12.5 Comp arao do hospital de refer n cia com os demais.


Frequncias observadas (centro), frequncias esperadas (canto superior
direito) e parcelas do x2 (canto inferior esquerdo) .
Hospitais
comuns
(A + B + C +D)

Recuperao
fun conal

associao s ig-: -

Hospital de
referncia

Total

fE)

programas de

a:::

pacote compuraC:==

69,89

Nenhuma

20,11

47

43

7,50

26,05
llb,71

Parcial

120

33,29

99,40
3,48

Programa de
alimentao
popular
Total

28,60

118

10

128

82

367

Temos: x2 = 49,8 e gl = 2. Usando a Tabela 6, verificamos que p <


0,001, mostrando ha ver diferena significativa entre os hospitais comun s
e o hospital de referncia. Finalmente, a Tabela 12.6 analisa os hospitais
comuns entre si. As frequncias observadas dessa tabela corresponde m
s frequncias observadas da Tabela 12.3, eliminando o Hospital E.

Hospital

A
7,75

Linear-by-~

Associa;r::;N of Vax ~

o cells

0,00

10

0,16

0,61

Total

32,71

Com os daos t::::


teste qui-quadrac ~
com os resultados :- =:.
12.3), mostrando n.:: .

53,00

35
0,16

31

120

0,08

12,84

16
0,78

47

56

0,23

19,46

16

Completa

,.~

47

Figura 12.3 Tabela C

53,89

36

0,71

Nominal by No;;:

0,00
33,26

13,05

18

Parcial

21

1,94

19,79

t:zi

N of Valid Cases

21 ,1 1

~~

Total

D
13,03

3,55

5, 11

13

Nenhuma

...sa

Likelihooc =-a=

Tabela 12.6 Comparao entr e os hospitais comuns. Frequncias


observadas (centro), frequncia s esperadas (canto superior direito) e
parcelas do x2 (canto inferior esquerdo).
Recuperao
funcional

-k

12, 10
285

Total

149

29

o 55

0,16
Completa

Prog rar.a ~:::

90

51

118

128

285

0,08

79

'

Ver www.spss.com

Z-59

CApfi ulo 12 - ANlisE dE dAdos c111tc;0Ri1Ados

Temos: x2 = 8,4, gl= 6 e, portanto, 0,10 < p < 0,25. Considerando o


nvel de significncia de 5% (a = 0,05), ou at mesmo de 10% (a= 0,10),
o teste no detecta associao. Assim, podemos dizer que no h diferena
significativa entre os hospitais comuns.

Uso do c0Mpu1Adon

Total

-.:1 1

Con s iderando o anexo do Captulo 4, vamos verificar se existe


associao significativa e n tre o local da residncia e a utilizao de
programas de alimentao popular. A Figura 12.3 mostra uma sada do
pacote computacional SPSS.5
Programa de alimentao popular Local da residncia Crosstabulation

90
149

Programa de
alimentao
popular
Total

128

no usa
usa

367

que p <
comuns
<Walisa os hospitais
~:>ela correspondem
_ ___ ;:; o Hospital E.

Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases

~ :iospitais

Total

21

31

25

78

43

37

120

Value

df

2,81611
2,791

2
2

Asymp. Sig.
12-sided)
0,245
0,248

1,388

0,239

120

Symmetric Measures
Nominal by Nominal

N of Valid Cases

21, 11

22
40

O cells (,0%) have expected count less than 5. The minimum expected count 1s 12,95.

-=.::ns. Frequncias
s::.perior direito) e

Total
42

Morro
12

Chi-Square Tests

~:i.ficamo s

Local da residncia
Parque da
Monte Verde
Ficiueira
18
12

Cramer's V

Value
0,153

Approx. Sici.
0,245

Contingency Coefficient

0,151

0,245

120

47

Figura 12.3 Tabela de contingncia, teste qui-quadrado e medidas de associao pelo SPSS.

120

Com os dados brutos construda u m a tabela de contingncia. O


teste qui-quadrado (Pearson Chi-square) apresentado na segunda tabela
com os resultados x2 = 2 ,816, gl = 2 e p = O,245 (segunda tabela da Figura
12.3) , mostrando no haver associao (aceitando H0 ) . Tambm so

53,89

56
53,00

51

118

128

285

Ver www.spss.com

ESTATSTICA AplicAdA s CibciAs SociAi~

240

mostrados os resultados de outras abordagens do teste qui-quadrado, que


no sero discutidos neste texto. No rodap desta segunda tabela, diz-se
que no h frequncia esperada inferior a cinco, condio para a v_a lidade
do teste. Finalmente, a terceira tabela apresenta algumas medidas de
associao, que sero discutidas na prxima seo.

Exrnccios
1) Seja a seguinte amostra:

CAprulo 12 - A,[isc de

12.2 MEdidSc1~
existe associao
observaes. :u::.
para se tirar co11d
Em muitas s im- adequadame nte---

Classificao de uma amostra de 38 indivduos,


quanto ansiedade e tabagismo

Fumante
sim
no

Ansioso
sim
15

no
7

10

a) Calcule a estatstica x2 sem usar a correo de continuidade.


b) Calcule a estatstica x2 usando a correo de continuidade.
e) Voc pode dizer que existe associao entre tabagismo e ansiedade, ao
nvel de significncia de 10%?
2) (LEVIN, 1985, p. 266) Dois grupos de estudantes fizeram exames finais de
estatstica. Somente um grupo recebeu preparao formal para o exame; o
outro leu o texto recome ndado, mas nunca compareceu s aulas. Enquanto
22 dos 30 membros do primeiro grupo (os frequentadores) passaram no exame,
apenas 10 dos 28 do segundo grupo (os ausentes) lograram aprovao. Os
dados mostram evidncia suficiente para afirmar que existe associao entre
.frequncia s aulas e aprovao no exame final? Use a = 0,05.
3) a) Faa um teste qui-quadrado com os dados da Tabela 12.2 para verificar

se existe diferena significativa entre as distribuies do nvel de instruo


nas trs localidades. Use a = 0,01.
b) Verifique se existe diferena significativa na distribuio do nvel de
instruo entre a Encosta do Morro e os conjuntos residenciais Monte
Verde e Pq. da Figueira (agregados).
e) Verifique se existe diferena significativa na distribuio do nvel de
instruo entre os dois conjuntos residenciais.
4)

objetivo medu a
Enfatizamos qe '
aos dados obse.:-

o sexo (homem
Tabagismo

fumante
no fuman te
Total

Na

Usando os dados do anexo do Capitulo 4, verifique se existe associao entre:


a) uso de programas de alimentao popular e localidade da residncia;
b) uso de programas de alimentao popular e nvel de instruo do chefe
da casa. 6
Como j comentamos, a presena de associao entre duas variveis no implica a existncia
de uma relao de causa e efeito entre elas. No Exerccio 4.b, por exemplo, se houver
associao entre uso de programas de alimentao popular e nvel de instruo do chefe da
casa, ento esta pode ser devida a uma terceira varivel: re nda familiar, que por estar
associada s duas variveis em estudo, pode induzir uma associao entre elas.

numrico que

desrr~

independncia ou d~ .___
os dados das duas rc...-:-;:.-._

"'!'ID. .>.plicAdA s CifNCiAs SociAis

-=:este qui-quadrado, que


~segunda tabela, diz-se
- :::n::idio para a validade
:a algumas medidas de
~.

241

C Aprulo 12 - ANiise d e dAd os cAm;oRiZAd os

12.2 MEdidAs dE AssociAO


Como vimos, a a plicao do teste qui-quadrado permite verificar se
existe associao entre duas variveis, com base em um conjunto de
observaes. um processo de inferncia, em que se parte dos dados
para se tirar concluses sobre o universo de onde os dados foram extrados.
Em muitas situaes, porm, o interesse est restrito em descrever
adequadamente a amostra, sem extrapolar para um universo maior. Neste
contexto, ao in vs de um teste estatstico, mais interessante estudar o
nvel de associao descrito pela prpria amostra.
Nesta seo, apresentaremos alguns coeficientes que tm por
objetivo medir a fora da associao entre duas variveis categorizadas.
Enfatizamos que essas medidas so descritivas, isto , referem-se apenas
aos dados observados. Porm, o clculo dos coeficie ntes de associao
tambm pode ser realizado aps a aplicao de um teste estatstico, s e
este detecta associao. Neste caso, um coeficiente de associao fornece
uma estimativa do grau de associao entre as duas variveis.

ionnal para o exame; o

_::ceu s aulas. Enquanto


-::-e.s) passaram no exame,

ExEMplo 12.4 Vamos contrapor duas amostras (A e B), classificadas segundo


o sexo (homem ou mulhe1] e tabagismo (fumante ou no fumante).

Jograram aprovao. Os

--= existe associao entre


-~a =

0 ,05.

:-3ela 12.2 para verificar


..:=.es do nvel de instruo

::.;stribu io do nvel de

-:Os residenciais Monte


::::.suibuio do nve l de
existe associao entre:
--=5.:ade da residncia;
---e:.. de instruo do chefe
Y

':t::a:==i~is n o implica a

existncia

- - por exemplo, se houver


ei de instrno do chefe da
-~familiar, que por estar
.EDXiao entre elas.

Tabagismo
fumante
no fumante
Total

Amostra A
Sexo
homem
1
mulher
80 (40%)
120 (60%1
200 (100% )

40 (40%)
60 (60%1
100 (100%)

Tabagismo

Amostra B
Sexo
homem
mu lher
1

fumante
200 (100%)
o IQ%,l
no fumante
Total
200 11 OO'Yol

0(0%)
100 (100%)
100 (100%)

Na amostra A, os dados indicam uma situao de completa


independncia, pois o conhecimento do sexo do respondente. no fornece
qualquer informao sobre a varivel tabagismo (veja que a percentagem
de homens fumantes igual percentagem de mulheres fumantes) . Por
outro lado, a amostra B ilustra u m caso de associao perfeita, j que os
fumantes so todos homens e todos os no fumantes so mulhe re s.

Um coeficiente de associao, aplicado a uma tabela de contingncia, produz um valor


numrico que descreve se os dados se aproximam mais de uma situao de
independncia ou de uma situao de associao perfeita. Ou seja, descreve o quamo
os dados das duas variveis se mostram associados.

242

Es1A1s1icA Apl icAdA s Cif'-CiAS SociAis

A prpria estatstica x,2, desenvolvida na seo anterior, pode ser usada


como uma medida de associao . Efetuando o clculo desta estatstica
sobre os dados das amostras A e B, sem a correo de continuidade ,
encontramos os seguintes valores: x2 = O (amostra A) e x2 = 300 (amostra
B). Mas a interpretao da esta tstica x2 como um coeficiente de associao
no muito s imples, pois o seu valor mximo (associao perfeita} varia de
acordo com a dimenso da tabela e o nmero de elementos observados.

CAprulo

12 -

Al\4~

dE-

Temos na a=::s
C "' =

CoEficiENTE dE coNTiNGNCiA
Um coeficiente muito usado para medir o grau de associao em
uma tabela de contingncia o chamado coeficiente de contingncia,
definido com base na estats tica x2 e do nmero n de eleme ntos, da
seguinte forma :7
C=

Mas o valor mximo de C tambm depende da dimenso da tabela.


Para facilitara interpretao, usaremos uma modificao deste coeficiente.
Chamaremos de k o me nor valor entre ,e (nme ro de linh as da tabela) e e
(nmero de colunas da tabela). Por exemplo, numa tabela de dimenso
2x2, temos k = 2. Numa tabela 3x5, temos k = 3. O chamado coeficiente de
contingncia modificado dado por:
C* =

kx
(k-1) (n

Logo, concf
e n tre hospital e

O coeficie::i: =
propostas de coejch amado coefic:e~

+z2 )

O valor de C*sempre estar no intervalo de O (zero) a 1 (um). Ser O


somente quando houver in dependncia. Ser 1 somente quando houve r
associao perfeita. Valores de C * p rximos de 1 d escreve m u ma
associaoforte, enquanto valores de C* prximos de O indicam associao
fraca. Os valores d e C* em torno de 0,5 podem ser interpretados como

Uma generaliza':c::::.;
o chamado V de (:,.=-=:-

associao moderada.

onde k o menor.....:o
colunas da tabela. --=-

ExEMplo 12.4 (coNTiNUAO) Temos na amostra A: n = 300, k = 2 e x,2 = O. Ento:


C*=

(2) (O)

(2 -1 ) . (O+ 300) = O ~ Independncia!

Para calcular o coeficiente de contingncia conveniente calcular o 'l.'2 sem a correo de


continuidade.

Muitas vezes.~
ordenao (crescer::e
seguintes itens de::=
esto numa orde~ ~

.\ ~s CiCl\CIAs SociAi~

w.X>r, pode ser usada


"c0 desta estatstica

CAprulo 12 - ANlisE dE dAdos CATFQORl1Ado~

Temos na amostra B: n = 300, k


C"=

= 2 e x2 = 300.

(2). (300)
=1
(2 _ 1) . (300 + 300)

Ento:

-+ Associao perfeita!

EXEMplo 12.5 Vamos medir o grau de associao entre hospital e


recuperao funcional de pacientes, descrito pelos dados da Tabela 12.4.
Foram observados n = 367 pacientes, classificados numa tabela 3x5.
Assim, k = 3 e , como vimos anteriormente, x2 = 56,7. Ento:
,..

::e associao em

-e de

ce

conting~ncia,

elementos, da

C* =

3(56,7)
=O 45
2. (367 + 56,7)
'

Logo, conclumos que a amostra descreve uma associao moderada


entre hospital e recuperao funcional de pacientes.

Oumos coEficiENTES dE AssociAO

._:::enso da tabela.
......~"""""!,...-......
~ deste coeficiente.
-'.las da tabela) e e
~la de dimenso
.=-2do coeficiente de
"'&

'"'=::e quando houver


- _ descrevem uma
_ r-..f.]cam associao
~ ~~rpretados como

O coeficiente de contingncia apenas uma opo dentre vrias


propostas de coeficientes de associao. Em tabelas 2x2, usual o
chamado coeficiente phi:

O coeficiente phi tem a vantagem de ser bastante simples e seu


resultado sempre estar entre O e 1, permitindo interpretao similar ao
coeficiente de contingncia modificado. Mas especfico para tabelas 2x2.
Uma generalizao do coeficiente phi para tabelas de dimenso maiores
o chamado V de Cramr, definido por:
V=

I ;/

~n (k-1)

onde k o menor valor entre ( (nmero de linhas da tabela) e e (nmero de


colunas da tabela). Ver sada computacional apresentada na seo anterior.

-= 2 e X2 =o. Ento:

DAdos ondiNAis CATEGOnizAdos

...=e -:_ 2 sem a correo de

Muitas vezes, as categorias de uma varivel qualitativa formam uma


ordenao (crescente ou decrescente). Isto ocorre, por exemplo, nos dois
seguintes itens de um questionrio (em ambos os itens as categorias
esto numa ordem crescente):

244

EsrArsricA ApliCA<lA c, CieNci<>.s SociAi~

a) Qual o seu nivel de instruo?


) nenhum
) fundamental

CA1 ulo 12 -

outro ladc

) mdio
) superior
b) Qual a sua opinio sobre o novo projeto educacional de seu municipio?
) totalmente contrrio
) contrrio
) indiferente ou sem opinio
) favorvel
) completamente favorvel

Ao estudarmos a associao entre duas variveis ordinais, podemos


no s ter interesse no grau de associao, mas tambm no seu sentido
(positiva ou negativa). Preferimos, neste contexto, usar o termo correlao
no lugar de associao. Dizemos que existe correlao positiva quando,
na medida em que o nvel de uma varivel aumenta, cresce a chance de
ocorrer nveis mais elevados na outra varivel; correlao negativa ocorre
quando, ao aumentar o nvel de uma varivel, diminui a chance de ocorrer
nveis mais elevados na outra varivel.
O coeficiente de correlao que apresentaremos aqui se baseia nos
conceitos de concordncia e discord.ncia. Dizemos que dois indivduos
so concordantes se eles se posicionam em posies concordantes nas
duas variveis. So discordantes, se eles trocam de posio ao mudar de
varivel. Veja a seguinte situao:

Tabela 12-

Nvel de-

baixo
mdio
alto
Fonte :~

Co.::=-

dispostas~

passamos
d iscord.::.!

Joo alto e pesado;


Maria baixa e leve

Podemos dizer que Joo e Maria formam um par concordante, pois,


ao mudar de Joo para Maria, ambas as variveis mudam para nveis
inferiores (estatura: alta --+ baixa; peso: pesado --+ leve). E de Maria para
Joo, ambas as variveis mudam para nveis superiores (estatura: baixa
--+ alta; peso: leve--+ pesado) . J na situao seguinte:
Pedro baixo e pesado;
Jos alto e leve

temos um par discordante, pois, ao passar do Pedro para o Jos, a estatura


aumenta, enquanto que o peso diminui (estatura: baixa --+ alta; peso:
pesado --+ leve).
Um conjunto de dados que tem, relativamente, muitos pares
concordantes pode ser interpretado como tendo correlao positiva. Por

209
X

1 125

X 1 2'
=209-(1~:-

151

21

+ 151.

a:

i 'f.X:

'2~c .:.c.

Portante:

- .d.\

~~

CiNciAs SociAis

247

CAprulo 12 - ANiise de dAdos CArec;ORiZAdos

outro lado, um conjunto de dados que tem, relativamente, muitos pares


discordantes, pode ser interpretado como tendo correlao negativa.
Vejamos, atravs de um exemplo, como contar o nmero nc de pares
concordantes e o nmero nd de pares discordantes, num conjunto de
observaes de duas variveis ordinais, apresentado numa tabela de
contingncia. O procedimento que apresentaremos vale para tabelas de
qualquer dimenso, desde que as categorias das duas vari veis estejam
dispostas numa mesma ordem (crescente ou decrescente).

ExEMplo 12.6.Estudo da correlao entre nvel de instruo e posio com


relao ao aborto (Tabela 12.7) .
~ais,

podemos
n o seu sentido
~ '::: :e rmo correlao
- ;>ositiva quando,
=-esce a chance de

~~

Tabela 12.7 Classificao de 1.425 indivduos, segundo o nvel de instruo


e a posio a respeito do aborto.
Posio com relao ao aborto
aprova
desaprova
1
indiferente
1

Nvel de instruo

209
151
16

baixo
mdio
alto

237
426
138

101
126
21

Fonte: Agresti (1 984, p. l57).

G.q'..li s e baseia nos


-- ~

dois indivduos
: ::o:icordantes nas
~.:::o ao mudar de

Como as categorias das du as vari veis da Tabela 12.7 j esto


dispostas numa mesma ordem (ambas esto em ordem crescente),
passamos a contar o nmero d e concordncias e o nmero de
discordncias, conforme o esque ma a seguir:
~mero

Nmero de pares concordant es: 7!c =


~ :::oncordante,

pois,
.=.....dam para nveis
e - 'S de Maria para
=s estatura: baixa

bZxa

---'?

a esta tura

11d =

209

101

237

10 1

126

426

426

151

126

151

21

138

138

16

21

16

=209(126+426+21+138) + 101(426+138) +

~oJos,

de pares discordantes:

=237(151+126+16+21) + 101(151+16) +

151

126

426

126

21

138

138

16

21

16

alta; peso:
+ 151 (21+138)

..-::e. muitos pares


---= ,..,...qio p ositiva. Por

Portanto:

+ 126 (1 38)

nc = 246.960

+ 426 (16+21)
Tld

+ 126 (1 6)

= 109.063

?46

EsTATsricA AplicAdA s Ci\CiAs SociAis

CAphulo 12 - A'\AlisE CE

CoEficiENTE 'Y dE GoodMAN E KRuskAl


O coeficiente y definido por:
y = nc '

nc +

nd

Classes

nc1

de renda

O valor de y estar sempre entre -1 e + 1. Ser+ 1 quando s houver


concordncias, e ser -1 quando s houver discordncias. Quando y estiver
em tomo de zero, indica que o nmero de concordncias e o nmero de
discordncias so aproximadamente iguais (ausncia de correlao). Quanto
mais prximo de + 1 estiver y, mais o nmero de concordncias estar
superando o nmero de discordncias (correlao positiva forte). Simetricamente, quanto mais prximo de - 1 estiver y, mais o nmero de discordncias
estar superando o nmero de concordncias (correlao n egativa forte).

at 4.9 S..

-:

de5a S~~" -

10ou~::Z'.l-

Total

ExEMplo 12.6 (coNTiNUAO) Calculamos nc = 246.960 e n" = 109.063. Assim,

= 246.960 y

109.063
246.960+109.063

=o 39
'

Conclumos, ento, que a amostra apresenta uma correlao positiva


moderada entre nvel de instruo e aceitao do aborto. Ou seja, em termos
dos indivduos observados, existe uma leve tendncia de quanto maior o
nvel de instruo, maior a aceitao do aborto.

Uso do coMpuTAdoR

Ordinal by Ordina
N ofValid Cases

Considerando o anexo do Captulo 4, buscou-se verificar uma


possvel associao entre o nvel de instruo e a renda familiar. A Figura
12.4 mostra uma saida do pacote computacional SPSS.
O resultado do teste qui-quadrado de Pearson (x2 = 16,28, gl = 4 e
p = 0,003) leva rejeio de H0 , isto , mostra haver associao entre
renda e nvel de instruo. O coeficiente y, em torno de 0,5, indica uma
correlao positiva moderada entre essas variveis. Embora neste texto
no comentamos a respeito de inferncias sobre o coeficiente y, podemos
notar que a ltima tabela mostra o resultado de um teste estatstico (H0 :
correlao nula na populao e H 1: correlao no nula na populao).
Como o valor p menor que um milsimo (ltima coluna), podemos
concluir que o teste detecta a existncia de correlao na populao de
onde foram extrados os dados .

Cabe obserra:- ~
a anlise foi realizada o:::=

Exrnccios
5) Sejam os dados e..:. T,;
a) o coeficiente de
b) o coeficiente pni.

_-::ti

.\d., s

Ci~NCiA~ SoclAis

247

CAprulo 12 - ANlisE dE dAdos CATE(jORIZAdos

Classes de renda * Nlvel de Instruo Crosstabulation


Nvel de instruco

Classes
de renda

- : quando s houver
-==aas. Quando y estiver
----"__z-r ..as e o nmero de
11::..:=:::::::::.t:i:'= mrre lao). Quanto
_::ccordncias estar
-a forte) . Simetrica-e-o de discordncias
-.....-=:c-0 negativa forte).

at 4,9 sal. mln.

Count

o/o withn Nlvel


de instruao
de 5 a 9,9 sal. mn.

Count

o/o within Nlvel


de instruao
10 ou mais sal. mn.

Count

% within Nivel
de instruao
Total

Count

% within Nlvel
de instruo

nenhum

ensino
fundamental

ensino
mdio

Total

24

18

10

52

64,9%

47,4%

22,7%

43,7%

11

14

22

47

29,7%

36,8%

50,0%

39,5%

12

20

5,4%

15,8%

27,3%

16,8%

37

38

44

119

100,0%

100,0%

100,0%

100,0%

- = 109.063. Assim,
Chi-Square Tests

-=a correlao positiva


Ou seja, em termos
_:;:_.'-JOG.-

Value

df

Asymp. Sig. (2-sided)

Pearson Chi-Square

16,282(a)

0,003

Likelihood Ratio

17,302

0,002

Linear-by-Linear Association

15,473

N of Valid Cases

119

de quanto maior o

'O cells (.0%) have expected count less than 5. The minimum expected count is 6,22 .

Symmetric Measures
Value
Ordinal by Ordinal
N of Valid Cases

--se verificar uma

Gamma

Asymp. Std. Error<> 1 Approx. r Cl>>

0,495

0,101

119

4,556

Approx. Sig.
0,000

1
1

Not assuming the null hypothesis.


b Using the asymptotic standard error assumlng lhe null hypothes1s.

Figura 12.4 Sada do pacote computacional SPSS.

.- = 16,28,gl=4e
--=-associao entre
C.e 0,5, indica uma
===.oora neste texto

Cabe observar que houve um caso invlido (falta de resposta), ou seja,


a anlise foi realizada com 119 famlias e no com as 120 familias amostradas.

EXERCCiOS

5) Sejam os dados da Tabela 12.1 , calcule e interprete:


a) o coeficiente de contingncia modificado;
b) o coeficiente phL

248

F<;TATf<;ricA AplicAdA s CitNCiAS SociAis

6)

Para os dados da Tabela 12.2, calcule e interprete:


a) o coeficiente de contingncia modificado;
b) o coeficiente V de Cramr.
7) Noventa crianas foram classificadas segundo suas habilidades em
matemtica e msica, resultando nos seguintes dados.
Habilidade para msical

alta
mdia
baixa

Construa uma c.L=


escola e resultad.
dupla entrada Os
estatstico ProF12) Para verificar se

= "'""

reas de estudo

Habilidade par~ ~atemtica


alta
1 media 1 baixa
20
10
7
12
10
8
6
7
10

Calcule ? coeficiente y e interprete.


8) Considere os dados do anexo do Captulo 4.
a) Calcule o coeficiente C* para as variveis localidade da residncia e uso
de programas de alimentao popular. Interprete.
b) As localidades Monte Verde, Parque da Figueira e Encosta do Morro esto
em ordem decrescente, em termos da qualidade das construes
habitacionais. Usando esta infonnao, calcule o coeficiente y entre localidade
da residncia e uso de programas de alimentao popular. Interprete.
9) Considerando os dados do anexo do Capitulo 2, calcule o coeficiente y entre
satisf~o com a didtica dos professores e satisfao geral com o curso. Interprete.

a)
Ex ERCcios coMpLEMENTARES

b)

10) A tabela que segue apresenta uma classificao de pessoas segundo o nvel

c) verificar se
cliente.

de instruo e colaborao com a coleta seletiva de lixo. 8 Verifique se existe


associao significativa entre estas duas variveis.
Colabora com a coleta seletiva de lixo
sim
1
no
22
13
33
34
39
36

Nvel de instruo
nenhum ou fundamental
mdio
SU_Qerior

11} Os dados abaixo se referem ao tipo de escola em que o aluno realizou o


ensino mdio (O = pblica e l = particular) e o resultado no vestibular (O = no
passou e 1 =passou).
aluno 1 escola 1vestib.
1

2
3
4

5
6
7
8
9
10
8

1
1
1

o
o
1

o
1
1

1
1

o
o

aluno 1 escola 1vestib.


11

12
13

14
15

16

o
1
o
o

17
18

19
20

o
o
o
o

o
1
o

1
1

o
1
o
o

o
o
1
o
o

aluno 1 escola 1vestib.

21
22
23
24
25
26
27
28
29
30

o
o
o
1

o
o
1

o
1

o
o
o
o
o
o
o
1
1
1

E parte de uma pesquisa realizada em Florianpolis - SC, em 1999, pelos acadmicos


Joo Fveri e ngela Queiroz, do Curso de Psicologia da UFSC, semestre 1999 / 1.

;-~

,.._

-!"li

~' i\s C ieNciAs Socil\is

habilidades em

CApfru lo 12 - AN1\llsE dE dAclos CAlE(iORIZAdos

249

Construa uma distribuio de frequncias conjunta para as variveis tipo de


escola e resultado n.o vestibular. Apresente essa distribuio numa tabela de
dupla entrada. Os dados sugerem associao? Explique atravs de um teste
estats tico apropriado com ex = O, 10.
12) Para verificar se em estudantes universitrios existe associao entre trs
reas d e estudo (humanas, biolgicas ou exatas) e a aprova o em relao ao
exame de fmal de curso proposto pelo governo (favorvel ou contrrio), foram
observados 120 estudantes aleatoriamente. Dos 40 e studantes da rea de
humanas, 10 d isseram ser favorveis (e os restantes, contrrios). Dos 30
estudantes da rea biolgica, 10 eram favorveis (e os restantes, contrrios).
E dos 50 da rea de exatas, 20 eram favorveis (e os restantes, contrrios).
Pode-se dizer que existe associao entre essas duas variveis? Faa um
teste estatstico apropriado ao nvel de significncia de 5% .
13) Considere que voc tenha um conjunto de dados de seus clientes, contendo

== o coeficiente y entre
a.-zo curso. Interprete.

as seguintes caractersticas:
Sexo (masculino ou feminino) ;
Local da residncia (na prpria cidade ou em outra cidade);
Nve l de satisfao (escala de O a 10) e
- Valor mensal das compras (mdia dos ltimos 3 m eses, em R$).
Que tcnicas estatsticas voc usaria para:
a) verificar se existe relao entre sexo e local da residncia do cliente;
b) verificar se o valor das compras tende a ser diferente para homens e
mulheres;
e) verificar se h relao do nvel de satisfao com o local de residncia do
cliente.

3
.]..;

36
~

o aluno realizou o
n.o

::..:> vestibular (O =
~

o
o
o
l

vestib.

o
o
o
o
o

o
!

o
1
1

CoRRElAo E REqREsso

este captulo, vamos dar sequncia ao estudo de associao entre duas


variveis, mas agora, supondo que ambas sejam mensuradas quantitativamente. Usaremos, neste caso, o termo correlao no lugar de associao.

VARivEis coRREIAcioNAdAs
Dizemos que duas variveis, X e Y, so positivamente correlacionadas
quando elas caminham num mesmo sentido, ou seja, elementos com valores
pequenos de X tendem a ter valores pequenos de Y, e elementos com valores
grandes de X tendem a ter valores grandes de Y. So negativamente
correlacionadas quando elas caminham em sentidos opostos, ou seja,
elementos com valores pequenos de X tendem a ter valores grandes de Y, e
elementos com valores grandes de X tendem a ter valores pequenos de Y.
As variveis peso e altura apresentam-se, em geral, correlacionadas
positivamente, pois os indivduos altos tendem a ser mais pesados,
enquanto a maioria dos indivduos baixos leve. Por outro lado, no
Brasil, as variveis renda familiar e nmero de elementos da famlia
costumam apresentar-se correlacionadas negativamente, pois as familias
de baixa renda, em geral, tendem a ter mais filhos do que as de alta renda.
Ilustraremos o estudo de correlaes entre duas variveis, usando
os dado.s da Tabela 13 .1, relativos a alguns indicadores sociais de uma
amostra de municpios brasileiros. 1

Estamos usando uma amostra bastante pequena para ilustrar as tcnicas. Um estudo
dessas variveis pode ser feito com toda a populao de municpios, j que esses d ados
esto disponiveis no Censo Demogrfico de 2000 ou no Atlas de Desenvolvimento Humano,
(www.pnud.org. br / atlas).

252

EsrATi~TiCA AplicAdA s CiNCiAS SociAiS

Tabela 13. l Alguns dados, baseados no Censo Demogrfico de 2000, de


uma amos tra aleatria de m unicpios brasileiros
Municpio
Araruna (PR)
Nova Red en o (BA)
Mono (MA)
Porto Rico d o Maranho (MA)
Camp o Er (SC)
Lagoa d o Pia u (PI)
S o Jos d a s Palmeiras (PR)
Paraba do Sul (RJ)
Malhada dos Bois (SE)
J andara (BA)
Vespasiano (MG)
Ipa ba (MG)

DistCap EspVid a Mortln f Alfab Renda


23,19 86,23 188 ,2 9
365
67,99
5 6,56 63,00
74,79
278
61,19
150
5 9 ,58
63,32 63,6 4
66,96
65,34
78
58,96
6 6 ,05 79,33
468
68, 10
31 ,7 1 83,38 173 ,38
6 0,00
47,08 6 5,81
40
63,65
4 86
7 1,01
16,62 77,54 150 ,67
83
71,36
15,69 89,28 2 64 ,55
44, 18 69,95
65
64,46
80,69
175
62,4 5
51,57 59,72
58,68
14
68,68
32,8 1 9 0,43 196,51
167
6 7,4 2
37,04 8 1,82 125~75

Fonte: Atlas de Desenvolvimento Hu mano (www.pnud .org.br/ a tlas).


Descrio das variveis:
DistCap: distncia capital da respectiva Unidade da Federao.
EspVida : espera na de vida ao na scer
Mortlnf: mortalidade (n mero mdio de mortes em 1.000) a t um ano de idade .
Alfab:
taxa de al fabetiza o (percen tagem da populao a du lta a lfabetizada).
Renda: renda per capita do m un icpio (R$).

17 - CORR(l.\.O

CApTulo

A Figura 13._

cruzamentos de a:g-.ca da par de obser"


seja, a anlise bas"'
~ 90
o

1(1)

~
.!::! 80

J!1

!
X

as

1- 60

sei

50

~~
N

2
$

(1)

70

'O

1(1)

oor
80

.,

(ij

17.1

'O

iA(1RAMAS dE dispERSO

<G
X

"]

...
I&

60

Uma maneira de visualizarmos se duas variveis apre sen tam-se


correlacionadas a travs do diagrama de disperso, n o qual os valores
das variveis so representados por pon tos, num sistema cartes iano. Esta
repre se n tao feita sob forma de pares ordenados (x, y) , onde x um
valor de uma varivel e y o correspondente valor da outra varivel. A
Figura 13. 1 ilu stra a construo de u m diagrama de disperso.

69 "

365

67,9 9

67"

278

61,19

150 1 59,58

~
61 " ~

59 - 100 150

200

250

300

350

400 X

Figura 13.1 Construo de um diagrama de disperso. Representao das


trs primeiras observaes de X ~ distncia da capital e Y '" esperana de
vida ao nascer, referente aos dados da Tabela 13. l

15

25
l5
Taxa de mor-.a. :a::ie

O diagrama a:;
positiva, porque os
ascendente. Em ge;z.

Os d iagramas
ambos os casos, os
des cendente. Valores
n a outra. Em (b) os?~
desce ndente do qu e e=.

257

CAprulo I~ - C oRRCIAo E REGRCS!>~O

A Figura 13.2 mostra quatro diagramas de disperso, relativos aos


Alfab

56.56
:::3.32
-5,05
.l:.71

- -.os
:6,62
_5,69
~.:8

~:.57

.l2.81
: - .04

86,23
63,00
63,64
79,33
83,38
65,81
77,54
89,28
69,95
59,72
90,43
81,82

Renda
188,29
74,79
66,96
65,34
173,38
60,00
150,67
264,55
80,69
58,68
196,51
125,75

cruzamentos de algumas vari veis da Tabela 13 .1. O leitor deve notar que
cada par de observaes refere-se ao mesmo elemento (municpio), ou
seja, a anlise baseia-se em dados pareados.
~

aj
~ 90o

1(1!

<..>-

.~ 80-

]l

(1)

'O

"'
Oi
"'Eo
"'

:Q

(1)

.,...=.~~~~~~~~~--.---'

so

65-

5545-

35-

'O

~ 60-

.s
Q)

70 -

'0

e:
J!!

1So

25-

1560

250

Renda percapita (R$)

7o

65

Esperana de l.ida ao nascer

e)
~
o

<>O)
N

:NJ!?

90-

<11

80-

90-

(ij
Q)

'O
(1)

70-

-zeis apresentam-se
=:i. !lo qual os valores
:ema cartesiano. Esta
-s x, y), onde x um
- da outra varivel. A

601

15

~ ao

1ij

25
35
45
55
Taxa de mortalidade infantil

65

70 -

60 -.,_~-r-~~~~--.-~~~~~
o
100
200 300 4O 500
Dist"lcia da ~tal (lrn)

Figura 13.2 Alguns diagramas de disperso, construdos com os dados da Tabela 13. l

O diagrama (a) da Figura 13.1 mostra uma situao de correlao


positiva, porque os pontos esto em torno de uma linha imaginria
ascendente. Em geral, valores pequenos de uma varivel so tambm

p equenos na outra, o mesmo acontecendo para valores grandes.

.i50

400 X

-=-~ntao

das

esperana de

Os diagramas (b) e (c) mostram correlaes negativas, porque, em


ambos os casos, os pontos esto em tomo de uma linha imaginria
descendente. Valores pequenos de uma varivel so, em geral, grandes
n a outra . Em (b) os pontos apresentam-se mais prximos de uma linha
descendente do que em (e), o que caracteriza uma correlao mais forte.

Os dados de distncia da capital e taxa de alfabetizao, diagrama


(d), no se apre sentam correlacionados, pois valores pequenos (ou
grandes) de uma varivel esto associados tanto a valores pequenos

254

EsrArsricA AplicAdA s Ci~NCiA~ SociAiS

CAphulo I~ - CoRREIAO =: ~-

quanto a valores grandes da outra. Os pontos no se posicionam em


tomo de alguma linha ascendente ou descendente .
A Figura 13.3 mostra um conjunto de pontos aproximando-se mais
de uma parbola do que de uma reta, ilustrando um caso de correlao
no linear. As correlaes no lineares so mais difceis de serem
interpretadas e no sero abordadas neste livro.

variveis peso e a :-- ':'::!~


se o peso for med!Co .==: .---.....
centmetros.

..

x=z

.. ..
-

onde:
x ': um valor pa~
x: um valor da~

Figura 13.3 Diagrama de disperso de um


exemplo hipottico de correlao no linear

X.: mdia dos~. ~.

s,: desvio pad:::


importante ressaltar que o conceito de correlao refere-se a uma
associao numrica entre duas variveis, no implicando,
necessariamente , uma relao de causa e efeito, ou mesmo numa estrutura
com interesses prticos. Se observarmos, por exemplo, as variveis
populao da Argentina e venda de cerveja no Brasl ao longo dos ltimos
anos, elas devem se apresentar correlacionadas positivamente, pois ambas
esto aumentando com o tempo. Contudo, em termos prticos, esta
correlao espria, no trazendo qualquer informao relevante.

O coeficiente
seguinte expres~

~=

'=""'""' ~ ~

onde:

A anlise de dados para verificar correlaes usualmente feita em

termos exploratrios, em que a verificao de uma correlao serve como


um elemento auxiliar na anlise do problema em estudo. Ou seja, o estudo
da correlao numrica entre as observaes de duas variveis
geralmente um passo intermedirio na anlise de um problema.

17.2

o coEficiENTE dE CORRElAO liNEAR dE PEARSON

No captulo anterior, estudamos o coeficiente de contingncia, que


descreve, atravs de um nico nmero, o grau de associao dos dados
de duas variveis categorizadas. Nesta seo, apresentaremos o chamado
coeficiente de correlao (linear) de Pearson, apropriado para descrever a
correlao linear dos dados de duas variveis quantitativas.

Os exemplos :. 3'" I e
mede a correlao. C
e o segundo um case ~

ExEMplo U.1 Clculo cn...<: ~


de Pearson de um ro_; _ _
(ver Tabela 13. 2).

CAprulo 1; - CoR1~e!Ao e Rec;Ress\o

- o se posicionam em

:=s aproximando-se mais


-

- :lill

;-;:;~s

caso de correlao
difceis de serem

255

YAloRES pAdRoNiZAdos Eo coEficiENTE R


O valor do coeficiente de correlao no deve depender da unidade
de medida dos dados. Por exemplo, o coeficiente de correlao entre as
variveis peso e altura deve acusar o mesmo valor, independentemente
se o peso for medido em gramas ou quilogramas, e a altura em metros ou

centmetros.

Para evitar o efeito da unidade de medida, os dados devem ser


padronizados da seguinte forma:
x' =

- y
y'= Y

x - X

Sy

Sx
onde:

y ': um valor padronizado;


y: um valor da varivel Y;
y : mdia dos dados da varivel Y e
S!J: desvio padro dos dados de Y.

x': um valor padronizado;


x: um valor da varivel X;
mdia dos dados da varivel X;
S,,: desvio padro dos dados de X;

X:

--lao refere-se a uma


- s. no implicando,

- =--,:mplo, as variveis
::- __::;;;:2.0 longo dos ltimos
~ente, pois ambas
~::no s prticos, esta
~,;:o relevante.
~ c::J:Telao

serve como
s::.:o. Ou seja, o estudo
~--'""'- ::e duas variveis
:..__ ~ problema.

- :::
2

E..\RSON

e contingncia, que

=QSSOCiao dos dados


~:aremosochamado

_ :;;ado para descrever a


-

civas.

O coeficiente de correlao linear de Pearson, r, definido pela


seguinte expresso em termos dos valores padronizados:
r=

2:(x'. y')
n -1

onde:
n

o tamanho da amostra, isto , o nmero de pares (x, y) e

(x' y') a soma dos produtos x' y' dos pares de valores padronizados,
isto , para cada par (x', y), fazemos o produto x'y'e, depois,
somamos os resultados desses produtos.

Os exemplos 13.1 e 13.2 procuram justificar como a expresso der


mede a correlao. O primeiro ilustra uma situao de correlao positiva,
e o segundo um caso de correlao negativa.

ExEMplo 17.1 Clculo dos valores padronizados e do coeficiente de correlao


de Pearson de um conjunto de dados hipotticos com correlao positiva
(ver Tabela 13.2) .

256

EsTATSTiCA AplicAdA s CiNciAs SociAis

CN>1ulo

1' - CoRREIAo ::

Tabela 13.2 Clculos intermedirios para se obter r (Exemplo 13.1).

Valores originais

Soma:
Mdia:
Desvio padro:

Valores padronizados

Produtos

X'

Y'

X 'Y'

2
3
4
5
5
6
7
8
40
5,00
2,00

4
7
9
10
11

- 1,50
- 1,00
-0,50
0 ,00
0,00
0,50
1,00
1,50
0,00
0,00
1,00

-1 ,75
-0,88
-0,29
0,00
0,29
0,29
0,88
1,46
0,00
0,00
1,00

2,63
0,88
0,15
0,00
0,00
0,15
0,88
2,19
6,87

11

13
15
80
10,00
3,42

Tabela 13.3 Clculo-s.,...... -

12

o
o

x'

.2

Figura 13.4 Diagrama de disperso dos valores originais e dos valores padronizados do Exemplo 13. 1

Complemen.7"c-;--''-:

Neste exem;>::&J ~ - - tiveram, em gera:=~


longe da origem '~:.:. - .::-~
resultarem em vai~ -,.
r negativo. A Fig-...::-2
concentrao de JXC
trocados), acarreta::::.:
16 J y

Quando estamos trabalhando com dados correlacionados positivamente, como no exemplo precedente, os pares (x', y) tendem a ter o mesmo
sinal (+ ou-), especialmente para aqueles pontos longe da origem. Assim,
a maioria dos produtos x'y,resulta em valores positivos (ver Figura 13.4).
Em consequncia, o coeficiente r ser positivo. Concluindo os clculos
da Tabela 13.2, temos:

r= ~Jx'. y') = 6,87 = 0,981


n -1

5.:_
~adro:

-= -=--o

Soma:
Mdia:
Desvio

1Y'

o o

10

Observe que calculamos a mdia e o desvio padro dos valores das


variveis X e Y. De cada valor, diminumos a mdia e dividimos pelo desvio
padro. Por exemplo, para o primeiro valor de X, x = 2, calculamos o valor
padronizado J = (x - 5)/2 = (2 - 5) /2 = - 1,5. Veja a mudana de escala
com a padronizao na Figura 13. 4.
14

de Pearson de um oo~
(Tabela 13.3).

12

10

~l

14

Figura 13.5 Diagraiu.

Exemplo 13 .2.

257

CApin.. lo l~ - CoRREIAo E REGRESSO

ExEMplo U.2 Clculo dos valores padronizados e do coeficiente de correlao

r 'Exemplo 13.1).
Produtos
Y'
-:,75
-0,88
-0,29
0,00
0.29
0.29

X'Y'
2,63
0,88
0,15

de Pearson de um conjunto de dados hipotticos com correlao negativa


(Tabela 13.3).
Tabela 13.3 Clculos intermedirios para se obter
Valores originais
y
X
2
16
3
13
4
11
5
10
5
9
6
9
7
7
8
5
40
80
5,00
10,00
2,00
3,42

0,00
0,15
0,88
2 19
6,87

0,88

:.46
0.00

0.00

:.oo

padro dos valores das


- e G...~idimos pelo desvio
.1:= : . calculamos o valor

Soma:
Mdia:
Desvio padro:

r (Exemplo 13.2).

Valores padronizados
X'

Y'

- 1,50
-1,00
-0,50

1,75
0,88
0,29

Produtos
X'-Y'
-2,63
-0,88
-0,15
0,00
0,00
-0,15
-0,88
-2,19
-6,87

0,00
0,50
1,00
1 50
0,00
0,00
1,00

-0,29
-0,29
-0 ,88
-1 ,46
0,00
0,00
1,00

- , a mudana de escala

Complementando os clculos da Tabela 13.3, temos o coeficiente:

r = ~)x'. y') = - 687 = -0,981

y'

n -1
o

Neste exemplo o coeficiente negativo, porque os pares (x', Y1


tiveram, e m geral, sinais trocados, especialmente para aqueles pontos
longe da origem (veja Figura 13.5). Isto tende a levar os produtos x'y' a
resultarem em valores negativos e, em consequncia, gerar um coeficiente
r negativo . A Figura 13.5 ilustra esta situao. Verificamos maior
concentrao de pontos nos quadrantes II e IV (onde x' e y' tm sinais
trocados), acarretando num valor negativo para r.

o
8

16

:-:-elacionados positiva:endem a ter o mesmo


~ge da origem. Assim,
....: -us (ver Figura 13.4).
=-~cluindo os clculos

y'

14

12

10 -

8~

o o

61

4-

li>

1
1

o
o

x'

o
o

X
-2

Figura 13.5 Diagrama de disperso dos valores originais e dos valores padronizados do
Exemplo 13.2.

258

F~TATl~rirn AplicAdA s CiNciAs SociAi~

Dos exemplos 13.1e13.2, verificamos que o sinal da somados produtos dos valores padronizados,
(x'y'), far com que o coeficiente rtenha
sinal compatvel com o que vimos nos diagramas de disperso (veja tambm
a Figura 13.6). Para dados correlacionados positivamente, os pontos se
cone.entraro nos quadrantes 1 e III, com x' e y' de mesmo sinal (produtos
positivos) . Para dados correlacionados negativamente, os pontos ficaro
nos quadrantes li e IV, fazendo com que x' e y' tenham sinais trocados
(produtos negativos). Se os dados forem no correlacionados, os pontos se
espalharo de forma aproximadamente igual em todos os quadrantes,
fazendo com que tenhamos produtos positivos e nega tivos , acarretando
numa soma prxima de zero.

C .. p1ulO

l~

CORRE~-

O clculo de
inconveniente de=--~.,.._
os valores da r:::=:
sugerimos usar i.
observaes ori~
<i%'

r=

y'

Quadrante II
I (x..y')< o

Quadrante I
I (x-y)> o

x'
Quadrante III

Quadrante IV
L (x'-y')<O

I <xy') >o

sorna
Figura 13.6 Jusficativa do sinal de r.

Para ilus-.::r-c:: 13. l. A Tabela :3 ~


Para qualquer conjunto de dados, o valor do coeficiente de correla o
de Pearson, r, estar no intervalo de -1 a 1. Ser to mais prximo de 1
(ou - 1) quanto mais forte for a correlao nos dados observados . Teremos
r = + 1 se os pontos estiverem exatamente sobre uma reta ascendente
(correlao positiva perfeita). Por outro lado, teremos r = - 1 se os pontos
e stiverem exatamente sobre uma reta descendente (correlao negativa
perfeita). Quando no houver correlao nos dados , r acusar um valor
prximo de O (zero). Veja a Figura 13.7.

+1

----- ------------------ -------- Forte


Positiva

Fraca

- - - - -- - - - - ----- - - Ausncia

.:;

;::

5
I

Soma:

Moderada

-1

Forte

Figu.ra 13.7 Sentido e fora da correlao em funo do valor de r.

40

Sendo
r=

Fraca
Negativa

ca.c-..:::
X

~~
-- -- -- ----- -- - --- -- ------------ Moderada

Tabela 13.4

temos,
r=

CAprulo I> -

somados produ-:..:: o coeficiente r tenha


~ ~perso (veja tambm
a:nente, os pontos se
- =....."'"Smo sinal (produtos
~~ . os pontos ficaro
~-~am sinais trocados
~nadas, os pontos se
e=! :::xios os quadrantes,
=garivos, acarretando

CORRclAo

259

RE<;RViSO

- :a' da

Glculo dE n
O clculo de r pela expresso apresentada no tpico anterior tem o
inconveniente de incorporar erros de arredondamentos, pois normalmente
os valores da mdia e desvio padro no so inteiros. Neste contexto,
su gerimos usar a seguinte frmula alternativa, a qual baseada nas
observaes originais:

r=r===n==L.~(x==Y~)~
- ~~=X=)~(~L.~Y)~==
~n L. X2 - (L:x)2 ~n L.y2 - (L.Y)2
Para obter os somatrios, procedemos da seguinte maneira.

x'
_ _e;;:::.:e N
'

!. < 0

:n:Sci.ente de correlao
~ mais prximo de 1
a oservados. Teremos

L:(X Y): fazemos os produtos X y, referentes a cada par de observaes,


e, depois, efetuamos a soma;
LX: somamos os valores da varivel X;
L:Y: somamos os valores da varivel Y;
LX2: elevamos ao quadrado cada valor de X e, depois, efetuamos a
soma; e
IY2: elevamos ao quadrado cada valor de Ye, depois, efetuamos a
soma .
Para ilustrar o uso da ltima expresso, vamos refazer o Exemplo
13. l. A Tabela 13.4 apresenta alguns clculos intermedirios.
Tabela 13.4 Clculos intermedirios para a obteno de r
Valores originais

~ r=

-1 se os pontos

Clculos intermedirios
X2
Y2
X.Y

correlao negativa

acusar um valor

4
5

4
9
16

10

25

81
100

5
6

11
11

25

121

55

36

121

66

7
8

13
15

49
64

169
225

91
120

40

80

228

882

447

~ r

Fora

Moderada

Soma:

16
49

Sendo

r=r=====n=L.=(X==Y~)=--(~L.=X~)=
~=Y=)====
~n L:X 2

Moderada

(L:X)2 ~nL.Y 2

(I Y)2

ternos,
8 . (447) - 40 . (80)

r=r=================-r==============
~8 . (228) - (40) ~8. (882) - (80 )
2

8
21
36
50

260

EsrArsriCA AplicAdA s CiNCiAs SociAis

3.576 - 3.200
.J1824 - 1.600 J7.056 - 6.400
376
.J224 .J555

376
383,33 = 0,981

CAp1 ulo

I~

- CoRRcl.\!o... _

Temos, ento,
etria de 8 a 1O ar-5
estudo:
Ho:

Encontramos o mesmo resultado obtido no tpico anterior, o que


era de se esperar, pois as frmulas so matematicamente equivalentes.

H I:

TESTE dE siGNificNCiA sobnE n


Criana

Quando os dados so provenientes de uma populao, alm de


mensurar o grau de correlao observado nos dados, muitas vezes temos
interesse em testar a existncia de correlao entre duas variveis, X e Y,
na populao . Isso feito com base em uma amostra de observaes
pareadas (x, y). As hipteses so:

2
3
4

5
6

H0 : as variveis X e Y so no correlacionadas;
H 1 : as variveis X e Y so correlacionadas;
podendo, ainda, a hiptese alternativa indicar o sentido da correlao
(teste unilateral), tal como,
H/: X e Y so correlacionadas positivamente ou
H 1": X e Y so correlacionadas negativamente.

verificamos que. a:::


r para a correlao s:::valor encontradc 't:' =

O teste unilateral aplicado nos casos em que j se espera que o


coeficiente de correlao tenha determinado sinal(+ ou-) .
Restringiremo-nos verificao de correlao linear e vamos supor
que os dados de X e de Y provenham de distribuies normais. 2 Podemos
realizar o teste com auxilio da Tabela 7 do apndice, que apresenta o valor
absoluto mnimo de r para ser significativo (rejeitar H0 ) , para cada n.

A Tabela - := e
probabilidade de s=-:--=-t
verificar que o r-~:::
tabelados para ~ = __
que estivssemos

ExEMplo 17.7 Com o objetivo de verificar se existe correlao positiva entre

"::>-:rr:;:

teste ainda aceiu:.:-..a.

aptido em matemtica e aptido em msica, foi selecionado um grupo de

crianas de 8 a 10 anos de idade, que foram submetidas a dois testes de


aptido: um de matemtica e outro de msica. A ordem da aplicao dos
testes em cada criana foi aleatria.
linha e primeira co__._,.
~

Para se verificarem as suposies do teste de correlao, sugerimos construir: (1) um


diagrama de pontos para os dados de cada varivel para verificar se no existe forte
evidncia de desvio da distribuio normal; e (2) um diagrama de disperso para verificar
se os dados sugerem uma relao no linear.

Observe que o

~octe::::'.2

correlao JX>SC'.!1G enc~

estatsticas !~ ~
que os tesres de~

261

C11prulo 17 - CoRRFIAO E RtGREssi\o

Temos, ento, as seguintes hipteses, relativas s crianas da faixa


etria de 8 a 10 anos, similares ao grupo de crianas que participaram do
estudo:
H 0 : no existe correlao entre aptido em matemtica e aptido em
msica.
H 1 : a aptido em matemtica. e a aptido em msica so correlacionadas positivamente. 3

- pico anterior, o que


t---- -....~~,ente equivalentes.

Os resultados dos testes de aptido foram os seguintes:


Valores de aptido em
Valores de aptido em
Criana matemtica m sica Criana matemtica msica
7
48
79
1
60
80
62
72
88
2
58
8
54
73
70
75
3
9
4
83
10
83
82
51
64
54
62
11
62
5
12
52
6
75
92
69

::nuitas vezes temos


::.:as variveis, X e Y,
s tra de observaes

-e j se espera que o

- ou -)-

-:ear e vamos supor

- s rwnnais. 2 Podemos
r--~..._,q ...e apresenta o valor
~ . para cada n.
::=e.ao positiva entre
c-_._.~"nado um grupo de
--- - ::das a dois testes de
::,em da aplicao dos

Efetuando-se o clculo do coeficiente de correlao de Pearson,


conforme visto anteriormente, temos: r = 0,17. Pela Tabela 7 do apndice,
verificamos que, ao nvel de significncia usual de 5%, o valor mnimo de
r para a correlao ser significativa de 0,497 (teste unilateral). Como o
valor encontrado (r = O, 17) menor que o valor tabelado (0,497), o teste
aceita H 0 . Em outras palavras, a correlao positiva fraca (r= 0,17), descrita
pelos dados da amostra, no suficiente para afirmarmos a existncia de
correlao positiva entre as duas variveis, na populao em estudo.
A Tabela 7 tambm pode ser usada para se ter uma avaliao da
probabilidade de significncia (valor p) . No exemplo em questo, podemos
verificar que o valor encontrado (r = 0,17) inferior a todos os valores
tabelados para n = 12, ou seja, p > 0,10 (teste unilateral). Assim, mesmo

que estivssemos fazendo o teste ao nvel de significncia de a


teste ainda aceitaria H 0 .

10%, o

Uso do coMpuTAdoR
A maioria dos pacotes computacionais de Estatstica a presenta os
resultados de uma anlise de correlaes em forma matricial. Na primeira
linha e primeira coluna, so apresentadas as variveis. Em cada cruza-

n.::nos construir: ( 1) um
,,___c-car se no existe forte

...--~--..

ctisperso para verificar

Observe que o problema sugere um teste unilaceral (hiptese alternativa afirmando


correlao positiva e no somente existf!nca de correlao). Cabe observar que as hipteses
estatsticas levam em conta o instrumento de mensurao das variveis, isto , supe-se
que os testes de aptido estejam realmente medindo aquilo que se propem,

262

fa1ArsricA AplicAdA .l.s

Ci~NCiAs

SociAis

menta, o coeficiente de correlao r do correspondente par de variveis.


Alguns pacotes apresentam tambm o nmero nde pares usado no clculo
de r e o valor p do teste bilateral sobre o correspondente coeficiente de
correlao populacional. A Tabela 13.5 mostra uma sada computadonal
do SPSS relativa aos dados da Tabela 13.1. Vemos, por exemplo, que o
coeficiente de correlao entre DISTCAP e ESPVIDA 0,337 (positiva fraca).
Observando o correspondente valor p = 0,284, verificamos que no se
pode dizer que existe correlao entre essas duas variveis na populao
de municpios brasileiros.

CAprulo 17 - CoRRE~.io

de r entre duas ~ a=
(fumante tem maJO:-

menor chance de :='r


ausncia). Mas .... ~
anteriormente, po-c::.....:
aproximadamen:e r:====
Quando O e.

Tabela 13.5 Sada computacional de uma anlise de correlao pelo SPSS


DISTCAP
DISTCAP

MORTINF

0,337

-0,400

0,087

0,205

0,284

0,198

0,788

0,523

12

12

12

12

12

Pearson Correlation

0,337

-0,983(*')

0,718(-)

0,865(-)

Sig. (2-tailed)

0,284

0,009

12

12

-0,684(")

-0,860(-)

0,014

Pearson Correlation

Sig. (2-tailed)
N
ESPVIDA

N
MORTINF

Pearson Correlation
Sig. (2-tailed)
N

ALF

12

-0,400

-0,983(**)

0,198

12

RENDA

12

12

12
1

0,863(..)

0,718("")

-0,684(*)

Sig. (2-tailed)

0,788

0,009

0,014

12

12

12

12

12

Pearson Correlation

0,205

0,865(**)

-0,860(*")

0,863(**)

Sig. (2-tailed)

0,523

0,000

12

12

12

0,000

12

CRRE b.!~ -

12

0,087

17.7

12

Pearson Correlation

N
RENDA

12

ALF

verificar sua sign=.:::2

ESPVIDA

12

** Correlarion is significant at the O.O1 levei (2-tailed).


* Corrclation is significant at the 0.05 level (2-taled) .

VAnivEis iNdicAdonAs
Algumas vezes, temos variveis codificadas com 1 e O, indicando a

presena ou ausencia de algum atributo, respectivamente. Por exemplo,


a varivel X pode ser indicadora de indivduos fumantes (X = 1 para
fumantes e X = O para no fumantes) e a varivel Y indicadora de uma
certa doena (Y = 1 para indivduos doentes e Y = O para sadios). O clculo

Sejam os daCb:s
entre aptido E?T":. _,..,...,_.............~
de aptido em ma;----~
cada varivel, so a.-.Z:::
valor atribudo o ?JS
Quando ocorre .5....:=
que isto tenha oc:o=.
atribumos postos se
dos postos dos ~-a::::r:s
matemtica, temos as

CApirulo 1;; - C:oRREIAO te ~ECjREssi\o

2M

de r entre duas variveis deste tipo pode ind ica r correlao positiva
(fumante tem maior ch ance de ter a doena) ou negativa (fumante te m
m e nor chance de ter a doena), alm do grau (forte, moderada, fra ca ou
a u sn cia ). Mas n o faz sentido o teste de significncia discutido
anteriormente , porque ele s vlido para variveis com distribuio
aproximadamente normal.
~~...Scamos

que no se
.._-:veis na populao

correlao pelo SPSS


ALF

RENDA

0,087

0,205

0,788

0,523

.. '"l

12

12

718(**)

0,865(**)

::xi

0,009

12

-0,684(*)

-0,860(*)

0.014

--

12

12

12

o,asw>
0,000
12

12

0,863")
0,000

12

12

Quando O e 1 representam apenas rtulos de uma varivel (por


exe mplo, O para feminino e 1 para masculino), melhor considerar o
coeficiente r s em sinal, indicando apenas o grau de assoei.ao descrita
pe los da dos. O coeficiente r para variveis 0-1, em valor a bs oluto, o
coeficiente de associao phi, definido no captulo anterior. Da, para
verificar su a s ignificncia, realizamos um teste qui-quadra do.

17.7

Co RRElAO POR POSTOS

Quando os da dos de alguma das variveis e m estudo mostram-s e


com d istribuio muito assimtrica ou com valores discrepantes, a anlise
da correlao atravs do coeficiente r pode fi car comprometida. Uma
alternativa aplicar a abordagem no p aram trica do coeficiente de
correla o rs de Spearman, o qual se u t iliza apenas da orden a o dos
valores.
Sejam os dados da Tabela 13.6, relativos a um e s tudo correlaciona!
entre aptido em matemtica e aptido em msica. Para facilitar, os valores
de aptido em matemticaj esto ordenados em ordem crescente. Para
cada varivel, so atribudos postos (ranks) da seguinte maneira: ao menor
valor atribu do o posto l; ao segundo menor, posto 2; e assim por diante.
Quando ocorre algum empate (repetio de algum valor), cons ideramos
que isto tenha acontecido por deficincia do instrumento de medida e
a tribumos postos sequenciais, mas, em seguida, calculamos a mdia
dos p ostos dos valores empatados. Por exemplo, na varive l aptido em
matemtica, te mos as crianas 6 e 9 com valores e mpatados em 75.
Preliminarmente, uma recebe posto 10 e a outra , posto 11; depois ,
alocamos posto 10,5 (mdia entre 10 e 11) para ambas.

264

Es1A1s1icA .-'l plicAdA

CH'.:-,ciAs

Socii>.i~

para

Tabela 13.6 Alocao de postos para o clculo de rs de Spearman.


Criana

Aptido em
matemtica

Posto de Aptido em Posto de


y
X
msica

(X)

(Yl

48

4
12
5
2
1
11
8
3
6
9
10

51

Notas:

t1
121

1
2
3

52
54
58
60
62
72
73
75
75
83

5
6
7
8
9
10,5!1l
10,5!1)
12

79
83
69
62
62
80
64
88
70
92
54
82

[}l

36
64

-6
-8
-2
1,5
2,5
-2
3
-3
3

12

-1 ,5

9,5

9
9
9
2 ,2 5
90,25

Soma

245

10
5

2,5!2 l
2,5121
8
4
11

CAphdo

r~

n = 12 e n\'"e1 C.e .......,9 ,___

2 ,25
6,25
4

Exrnccios
1)

2)

apresentados a >

Mdia dos postos '.2 e 3, referentes ao valor empatado 62.

A sexta coluna da Tabela 13.6 apresenta as diferenas entre postos:

D = Posto de X - Posto de Y
Na ltima coluna temos as diferenas qu adrticas entre postos,
cuja soma denotamos por
D2 O coeficiente de correlao de Spearman
4
definido por:

a)

rs = 1- 6 -LD2
n . (n2 -1)

e)

r = 1s

6 " D
LI2

n(n -1)

= 1-

245. E o coeficiente rs

1- O 86 =O 14
'
'

indicando uma correlao positiva muito fraca nos dados observados. 5


Em funo do tamanho

39

65

57
34

9-2
56

40

70

b)
d)

ID

6 ( 245 )
.
12(122 -1)

Co111<d'-~

de 0,503 (teste n:-r~


que o valor tabelad:
que existe correla:;:;
msica, na popula.~

Mdia dos postos 10 e 11, referentes ao valor empatado 75.

Com os dados da Tabela 13.6, temos:


de Spearman:

coeficiente r. ,-_...Interprete.
e) Calcule o coe::_
nvel de sig- '"' c.::r
3) Sejam os dados C,n
os dados das ~-
do ahmo. InteI?=C~
4 ) Sejam os dados

n da amostra e do nvel de significncia ex

adotado, a Tabela 8 do apndice apresenta os valores absolutos mnimos


de rs para que esse seja significativo . Em termos do exemplo em questo,

O coeficiente r. o prprio coeficiente de correlao de Pearson, r, calculado sobre os


postos de X e Y.

Assim como o r de Pearson, o r, de Speannan varia entre - 1 e + 1, com a m esma interpretao.


Porm, os resultados de r e r. no so matematicamente iguais por usarem metodologias
diferentes de clculo.

C,n

Morro, faa um e

"~ +-=

Y = nmero de '""'
5)

6) Considerando as -::::i;
(Tabela 13. 1), ca...--=e
a) o coeficieme de ~ -'-b)

265

C11prulo 17 - CoRRelAo r RCGREsso

~e ,
D

::;
::;_

_,;;;,-

-6
-8
-2
1,5
2,5

-2
3

vi
36

64

para n = 12 e nvel de significncia de 5 %, temos o valor mnimo tabelado


de 0,503 (teste unilateral). Como o valor encontrado (rs = 0,14) menor
que o valor tabelado , o teste no acusa significncia. No possvel dizer
que existe correlao positiva entre aptido em matemtica e aptido em
msica, na populao de onde os dados foram extrados.

2,25
6,25
4

Exrnccios
1)

- 1,5
9,5
3

9
9
9
2,25

Considerando os dados da Tabela 13. 1, construir um diagrama de disperso


para as variveis renda per capita e esperana de vida ao nascer. Quais as
informaes observadas no grfico?

90,25

2)

Soma

245

Sejam X= nota na prova do vestibular de matemtica e Y = nota final na


disciplina de clculo. Estas variveis foram observadas em 20 alunos, ao
final do primeiro perodo letivo de um curso de engenharia. Os dados so
apresentados a seguir.

-3

:.!.5. E o coeficiente r s

-::,56 = 0,14

39
57
34

65
92

78
89

40

70

43
47
52
70

21
28
35
80

52
73
50
90

64
75
30
32

82
98
50
58

56

75
50

X
65
47
28
67

88
71
52
88

a) Construa um diagrama de dispers o e verifique se existe correlao entre


os dados dessas duas variveis.
b) Existe algum aluno que foge ao comportamen to geral dos demais (ponto
discrepante)?
e) Calcule o coeficiente r.
d) Retire o valor discrepante detectado no item (b) e calcule novamente o
coeficiente r. Verifique se significativo ao nvel de significncia de 5% .
Interprete.
e) Calcule o coeficiente r. com todos os valores e verifique se significativo ao
nvel de signficncia de 5% .

<kicas entre postos,


::-e.iao deSpearman

3)

Sejam os dados do anexo do Captulo 2. Faa um diagrama de disperso com


os dados das variveis: X = satisfa..o do aluno com o curso e Y = desempenho
do aluno. Interprete.

4)

Sejam os dados do anexo do Capitulo 4. Considerando apenas a Encosta do

--e: de significncia a

Morro, faa um diagrama de disperso com os dados de: X= renda.familiar e


Y = nmero de moradores no domiclio. Interprete.

=-s absolutos mnimos


5)

Faa o clculo do coeficiente r com os dados do Exemplo 13.3 e confira o


resultado encontrado.

6)

Con sid~rando as variveis taxa de alfabetizao e taxa de mortalidade infantil,


(Tabela 13.1), calcule:
a) o coeficiente de correlao de Pearson. Interprete o resultado obtido.
b) o coeficiente de correlao de Spearman e verifique se significativo ao
nvel de significncia de 5%.

266

EsrArsricA AplicAdA s CiNCiAs SociAis

7) Com respeito aos 23 alunos de uma turma de estatstica, foram observadas as


variveis: nmero de faltas e nota final na disciplina. Esses dados levaram
seguinte correlao, descrita pelo coeficiente de correlao de Pearson: r =-0,56.
Comente as seguintes frases relativas turma em estudo e ao coeficiente obtido.
a) Como r = -0 ,56 (correlao negativa moderada), nenhum aluno com grande
nmero de faltas tirou nota alta.
b) Como as duas variveis so correlacionadas, bastaria usar uma delas
como critrio de avaliao, pois uma acarreta a outra.
c) Os dados mostraram uma leve tendncia de que a nota final se relaciona
inve rsamente com o nmero de faltas; ento, os alunos frequentadores
tiveram, em geral, melhores desempenhos nas avaliaes do que os alunos
que fltaram muito.
8) Numa amostra aleatria de n = 212 livros da Biblioteca Central da UFSC,
encontramos r = 0,207 para as variveis: idade da edio e nmero de pginas

CAprulo 13 -

CORRE~::

A Figura :3_S
diagrama de dispe~
se esperar. Supon.~
entr e X e Y, a Figu..-:;. \c_

iguais altura ~::...Z.


Galton, a qual po~-2
alturas inferiores ; pais baixos teria=""'---

do livro.
a) O que se pode dizer com base no valor deste coeficiente de correlao?
b) Esta correlao pode ser explicada meramente por fatores casuais? Faa
um teste estatstico apropriado, ao nvel de significncia de 5%.

<

17.4 REqREsso liNEAR siMplEs


O termo regressD surgiu com os trabalhos de Galton no final do sculo
XIX. Esses trabalhos procuravam explicar certas caractersticas de um
indivduo a partir das caractersticas de seus pais. Galton acreditava que os
filhos de pais excepcionais, com respeito determinada caracteristica,
tambm possuam essa caracterstica, mas, em geral, numa intensidade
menor do que a mdia de seus pais. Seus estudos baseavam-se em
observaes empricas. Em um desses trabalhos ele relacionou centenas de
alturas de indivduos com as respectivas alturas mdias de seus pais.

ExEMplo l~.4 Vamos considerar uma parte dos dados coletados por Galton,
por volta de 1885 (Tabela 13.7).

164
166
169
171
173
176

166
171
171
171
171
173

164
166
169
171
173
176

168
173
173
173
176
176

166
169
171
171
173
178

Fon te: Stigler (1986, p. 286), com adaptaes.

A anlisederegress2:l~r

alguma relao roam--;--~

Tabela 13.7 Alturas de indivduos (Y) e alturas mdias de seus pais (X),
medidas em centmetros.
X

O Exemplo ~.3 . ~
re lao de causa-if.;;,;
matemtica. es:a. ~
u ma anlise de re:s- : --:

166
166
166
176
178
176

166
169
17 1
173
176
178

168
168
168
168
171
178

o
mais simples, rela~
ou resposta , com ~
independe nte. Veja;:;

267

CApiTulo 17 - CoRRclAo e RE<:;RESSO

foram observadas as
Ssses dados levaram
~ de Pearson: r = -0,56.
e ao coeficiente obtido.
':um aluno com grande

__.;..J.. ." '

_r;a
- :wta final se relaciona

alunos frequentadores
-..;.....:
~~
- es

do que os alunos

:.eca Central da UFSC,


:.:O e nmero de pginas

A Figura 13.8 representa as observaes da Tabela 13.7 num


diagrama de disperso, indicando uma correlao positiva , como era de
se esperar. Supondo que os dados flutuem em tomo de alguma relao
entre X e Y, a Figura 13.8 tambm ilustra dois modelos matemticos para
essa estrutura. A reta (A) : y = xindicaque , em mdia, os filho s tm alturas
iguais altura mdia de seus pais; a reta (B) representa a hiptese de
Galton, a qual postulava uma tendncia de que filhos de pais altos teriam
alturas inferiores s alturas mdias de seus pais, enquanto os filhos de
pais baixos teriam alturas superiores s alturas mdias de seus pais.
o
)..

-.::ente de correlao?
... :-atores casuais? Faa
:::=":cncia de 5% .

(A)

180

-=~

.g
3"'

176

(B)

o
o

1n

168
164
160
160

164

168

172

176

180

Altura media dos pais (X )

Figura 13.8 Diagrama de disperso dos dados da


Tabela 13.7 e ilustrao de dois modelos
matemticos relacionando X e Y.

-a...""acteristicas de um
- LDn acreditava que os
.- .- -:iada caracteristica,
-=---.,_ numa intensidade
;::os baseavam-se em
e.acionou centenas de
:=:!"'" a s de seus pais.
:oletados por Galton,

166

168

169
171

168
168
168

173
176
178

171
178

O Exemplo 13.4 se distingue dos exemplos anteriores por supor uma


relao de causalidade entre X e Y, descrita em termos de uma equao
matemtica. esta a diferena bsica de um estudo de correlaes e
uma anlise de regresso.
Aanlise de regresso gerahneme feita sob um referencial terico que justifique a adoo de
alguma relao matemtica de causalidade.

o Moddo dA REGRESSO liNEAR SiMplEs


.O modelo estatstico-matemtico de regresso, em sua formulao
mais simples, relaciona uma varivel Y, chamada de varivel dependente
ou resposta, com uma varivel X, denominada varivel explicativa ou
independente. Veja o quadro 13. 1.

268

EsrArsriCA 11pl1c11d11 ~ CiNcia.s SociAiS

Quadro 13.1 Aplicaes do modelo de regresso linear simples.

Consumo (R$)
Nmero de defeitos nos produtos
Tempo de resposta do sistema

Renda
Gasto com o controle da qualidade (R$)
Memria RAM do computador (Gb)

A ideia b s
supostamente li:-eGI
dos pontos obse:-:

(segundos)
rea construda do imvel (m2

Preo do imvel (R$

Assim como num estudo de correlaes, a anlise de regresso


tambm toma por base um conjunto de observaes pareadas (x, y),
relativas s variveis X e Y. Diremos que um dado valor y depende, em
parte, do correspondente valor x. Por exemplo, a altura de um indivduo
(y) depende , em parte, da altura mdia de seus pais (x). Simplificaremos
essa dependncia por uma relao linear entre x e y, tal como:

e a chamaremos
fi'igura 13.10.
e::~.

,_
~

~ -

<

y =a+ J3x

~~ -

;:;

Fixando valore s para a e 13, a equao y =a+ J3x a equao de uma


reta. Por exemplo, se a = 1 e 13 = 2 , a equao y = 1 + 2x uma certa reta,
num par de eixos cartesianos. Para desenhar esta reta basta atribuir dois
valores para X e calcular os correspondentes
valores de Y. Digamos: x = O => y = 1 + 2x0 = 3f}f____ _
1 e x = 1 => y = 1 + 2 x 1 = 3. Com estes dois
pontos, podemos traar a reta da Figura 13 .9 .
Ao observarmos um conj unto de
observaes (x, y), verificamos que, em geral,
os pontos no esto exatamente sobre uma
reta, mas flutuam em tomo de alguma reta
imaginria. Ento, um modelo para um par
de observaes pode ser:

--

0
1
X
Figura 13.9 Representao grfica
da equao y = 1 + 2x.

y = a + /Jx + &
onde e representa o erro aleatrio, isto , o
efeito de uma infinidade de fatores que esto afetando a observao y de
forma aleatria. Por exemplo, a altura de um indivduo (y) no depende
somen te da a ltura mdia de seus pais (x), mas, tambm, de sua
alimentao, do gentipo de seus ancestrais e de uma infinidade de outros
fatores, tudo representado no modelo por e.
No modelo y = a + J3x + e, chamaremos de parte estrutural parcela
de y determinada por x, isto , a + J3x. E o procedimento inicial da anlise
de regresso encontrar estimativas para a e 0, com base em uma amostra
de observaes (x, y).

O chamaC.~
expresses para G..

onde:

Z:(X-YJ

CApTulo 17 - CoRRclA;o

769

RECiREsso

Esri111ArivAs dos PARMETROS a E ~


A ide ia bsica da construo d a parte estrutural do modelo,
supostamente linear, encontrar a reta que passe mais prximo possvel
dos pontos observados. Representaremos esta reta por:

y =a+bx
:::.::..lise de regresso
..:.es pareadas (x, y),
-a:or y depende, em
:a de um indivduo
~. Simplificaremos
tal como:

e a chamaremos de reta de regresso ou equao de regresso. Veja a


Figura 13.10 .

>..
o

=
.g

<=

,_

<

180
176
172

168

164
160
160

e a equao de uma
- 2x uma certa reta,
-:a basta a tribuir dois

164

168

172

176

180

Altura m dia dos pais ( x )

Figura 13.10 Representao da equao de regresso do Exemplo 13.4.

O chamado mtodo de mnimos quadrados forne ce as seguintes

expresses para a equao de regresso: 6

b = n L:(X Y) - (L:X) (IY)


n L:x 2 - (L:x}
a=

::t9 Representao grfica


y

1 + 2x.

IY - bL:X
n

onde :
n o nmero de pares (x, y) observados (tamanho da amostra);
L(X Y) somatrio dos produtos xy (primeiramente fazemos os
produtos xy, relativos a todos os pares observados e , depois,
efetuamos a soma);
LX a soma dos valores de X;
L:Y soma dos valores de Y; e

o a o bservao y de
-o (y) no depende
... tam bm, de sua
.:ifinidade de outros

L:X2 soma dos quadrados dos valores de X (primeiro elevamos os


valores de X ao quadrado e , depois, efetuamos a soma).

"' PstJutural parcela

--:o inicial da anlise

A obteno da equao de regresso, p elo m todo de mnimos quadrados, consiste em


fazer com que a soma quadrtica dos efeitos aleatrios, ::2 , seja a menor possvel. A
soluo deste problema matemtico gera as expresses de a e b. Veja, por exemplo,
Wonnacott e Wonnacott (1991, p. 287) .

270

EsrArsricA Ar>l icAciA S CitNCiAs SociAis

ExEMplo l;.7 Ilustraremos a construo da equao de regresso com


parte das observaes da altura mdia dos pais (X) e altura do filho (Y),
extradas da Tabela 13.7. A Tabela 13.8 mostra os clculos dos somatrios.

CApf rulo I~ - CORRE~ e.

Com a equa?"""'
indivduo (Y }, co;::: ~
com uma altura~~
altura do filho de ; = .:_. -

Tabela 13.8 Parte das observaes da Tabela 13.7 e clculos intermedirios

para a construo da reta de regresso.


Dados

Clculos intermedirios

)(2

XY

164
-166
169
169
171
173
173
176
17 8
IX = 1.539

166
166
171
166
171
171
178
173
178
L:Y= 1.540

26.896
27.556
28.561
28.561
29.241
29.929
29.929
30.976
31.684
L:X2 = 263 .333

27.224
27.556
28.899
28.054
29.241
29.583
30.794
30.448
31.684
L:(X. Y) = 263.483

b = 9. (263.483) - (1.539}. (l.~40) = 1.287 = 0,872


9. (263 .333) - (l.539 )~
1.476
a = 1.540 - (0,872).(1.539} =

22 00
'

Assim, temos a reta de regresso: y = 22 + (0,872)x. Para traar a


reta no plano formado pelos eixos X e Y, basta atribuir dois valores para
X e calcular os correspondentes valores de y, pois, por dois pontos passa
uma e apenas uma reta. 7 Veja a Figura 13.11 .

provocada pela c.:indica o sentido ..?OS'


b = 0,872. Ento. a

interessados em -e....~.....
Y, podem ser e:::.::..,..,.,....segundo o mode:o ::::5,_te_:._

Para cada~
correspondente ~~~
temos tambm o :
oitavo indivduo C.2.2-==:=::-::=.
(y = 173}. J o ua:.;p:--=-=...=-=d
y = 175,47 (ver?:;
valor predito pe:c -__...__,_
estrutural do moC.":"

y
176

Ya=175,47 ----

--

y 8= 173 ______.,:;;..
172

y = 22 + (0,872)x
168

164I--~~~~~~~~~~~~~~~-

164

168

172

176

Figura 13.11 Diagrama de disperso dos dados da Tabela


13.8 e a reta de regresso ajustada aos dados.
1

Por ~emplo, para um dado valor x = 164 => = 22 + (0,872)(164) = 165,0 e para x = 178
= 22 + (0,872)(178) = 177,2. Marcamos os pontos (164; 165) e (178; 177,2) no plano
formado pelos eixos X e Y, e traamos a reta que passa por estes dois pontos.

=> y

Figura 13.12 \'~

X
11

A equao de regresso ;,'"' sentido de que sua 2:::x:L:-=::i


provando a sua teo:-'...a.p;
diferena da reta~=
casual. Para dar~ e
sobre os parmeLIOS :l

o~ ~ O'l\ CiA~

SociAls

de regresso com

=altura do filho ( Y),


-'los dos somatrios.

CAprulo 17 -

271

CORRELAO F RE<;RESsiio

Com a equao de regresso, pode mos predizer a altura de um


indivduo (y), com base na altura mdia de seus pais (x) . Por exemplo,
com uma altura mdia dos pais de x = 175 cm, temos uma predio da
altura do filho de y = 22 + (0,872)(175) = 174 cm.

XY
27.224
27.556
28.899

I(X Y)

28.054
2 9.241
29.583
30.794
30.448
31.684
263.483

~=0,872

...,

3 - 2)x. Para traar a


__...._=- dois valores para
~dois pontos passa

O coeficiente b fornece uma estimativa da variao esperada de Y


provocada pela variao de uma u nidade em X. O sinal desse coeficie nte
indica o sentido (positivo ou negativo) da relao. No Exemplo 13.5, temos
b = 0,872 . Ento, a cada centmetro a mais na altura mdia dos pais,
esperamos um acrscimo de 0,872 cm n a altura do filho. 8

YAniAO ExplicAdA ENO ExplicAdA


Ao ajustar uma equao de regresso aos dados, podemos estar
interessados em verificar o quanto as variaes da varivel dependente,
Y, podem ser explicadas por variaes da varivel independente, X,
s egundo o modelo especificado e para os dados da amostra.
Par a cada valor x observado (ou estabelecido), temos o
correspondente valor de Y, representado por y. Com o ajuste do m odelo,
temos tambm o valor predito por este: [J = a+ bx . Por exemplo, para o
oitavo indivduo da amos tra, temos x = 176 e o correspondente valor de Y
(y= 173). J o valor predito pela equao de regresso = 22 + (0,872)(176)
y= 175,47 (ver Figura 13.12). A diferen a entre o valor observado e o
valor predito pelo modelo chamada de resduo - aquilo que a parte
estrutural do modelo no consegue explicar.
y
178

.---- - ---- - - ----------- --- - -- -:} Resduo associado ao oitavo

Ys = 175,47 Ys = 173 --

........ -112

------- - -- ------ - -- ---- -~


:
:

elemento d a amostra .

- .....872)x

188

16" '-164

- -- -- -- - - '' - - 168
172
178
X

Figura 13.12 Valores observado e predito para x = 176 (oitavo elemento da amostra).
8

~
~:='e

165,0 e para x = 178


178; 177,2) no plano
=dois pontos.

A equao de regresso
= 22 + (0,872)x est compatvel com a teoria de Galton, no
sentido de que sua inclinao inferior da reta y x. Contudo, os dados no esto
provando a sua teoria, j que estamos analisando uma amostra extremamente pequena. A
diferena da reta construda com base nos dados e a reta terica, y =x, pode ser roeram ente
casual. Para dar maior embasamento a essa discusso, pode ser feito um teste estatstico
sobre os parmetros do modelo. Ver, por exemplo, Chatterjee, Hadi e Price (2000).

272

EsrA1b ricA Apl icAdA s C iNciAs Soc iAis

CAp1ulo r~

CoRREL.\

Se desconsiderannos a relao entre X e Y, ento podemos predizer


valores de Y, simplesmente, pela mdia aritmtica de suas observaes
(y ). Naturalmente, nas situaes em que X afeta Y, os resduos em relao
mdia aritmtica vo ser, em geral, maiores do que em relao equao
de regresso (Figura 13.13).
y

1761

1
1
1
1
1
1
1
1

1761

172l

1721
1
1
1

161

[J

164

16'!

1681

=22+(0,872)x

172

176

'

~
16

1
1
1
1
1
1
1

1
1

Esta med1c;, e
melhor o ajus-,__e::.

~
168

172

176

Figura 13.13 Resduos em relao ao modelo de regresso (y-y ), e resduos em relao mdia
aritmtica ( y -y ), com os dados do Exemplo 13.5.

A soma de quadrados dos resduos o numerador de uma estimativa


para a varincia da parte aleatria do modelo. Se a parte estrutural for
avaliada apenas pela mdia aritmtica, sem levar em conta qualquer
relao entre Y e X, temos a soma de quadrados total:
SQT

Outra mecFr;
aleatria, cujo des--:-

1
1
1
1
1

164

1
1
1
1
1

ExEMplo 17.5
quadrados.

Tabela 13.9 Ck::


dos desvios (daeos
~!~_.:z

164

L (y - Y)2

Se a parte estrutural levar em conta os diferentes valores de X pela


equao de regresso, resta apenas aquilo que a equao de regresso
no consegue explicar. a chamada soma de quadrados devida ao erro
aleatrio, dada por:
SQE =

(co~,,__

L (y - y)1

166
169
169
171
173
173
176

166
166
171
166
171
171
178
173

178

178

Soma:

A Tabela

Observe na Figura 13.13 que SQEdeve ser menor que SQT, especialmente quando a relao entre X e Yfor forte . A diferena das duas somas
de quadrados:

::.3.::._

SQR = SQT - SQE

conhecida como soma de quadrados da regresso e pode ser interpretada


como a parte da variao de Y que a equao de regresso consegue
explicar a mais do que simplesmente a mdia aritmtica de Y.
O chamado coe.fidente de determinao, dado por:

R 2 = SQR = variao explicada


SQT
variao total

Variao total
9

O subndice e pz;:. .,...-:

"'d"' s CINCiAs SociAi!>


--.;m podemos predizer

ce suas observaes

.::; :esduos em relao


~relao equao

"

1
1

1
1

112

Outra medida usada para avaliar o modelo a variabilidade da parte


aleatria , cujo desvio padro pode ser estimado por:9

17

"

y=l71,11

pode ser interpretado como uma medida descritiva da proporo da variao


de Y que pode ser explicada por X, segundo o modelo especificado. Em se
tratando de regresso linear simples, pode-se mostrar, matematicamente,
que o coeficiente de determinao W o quadrado do coeficiente de
correlao rde Pearson, estudado na Seo 13.2.

'

275

CAphulo 17 - Cor<Rc!Ao E RECiREsso

=:S::uos em relao md.ia

_."V:" de

uma estimativa
.;:. ?ffii:e estrutural for
..:: e~ conta qualquer

ExEMplo 17.7

(CONTNUAO) A Tabela 13.9 mostra o clculo das somas de

quadrados.
Tabela 13.9 Clcu lo dos valores preditos, resduos e somas de quadrados
dos desvios (dados do Exemplo 13.5) .
X

164
166
169
169
171
173
173
176
178

'-adas devida ao erro

y
166
166
171
166
171
171
178
173
178

Mdia
g
17 1, 11

Soma:
SQT, especial=-==-?i das duas somas

n-2

Esta medida usada para comparar modelos (quanto menor S,,,


melhor o ajuste do modelo aos dados) .

_::.:es valores de X pela


-:;:"-ao de regresso

~~que

=~ SQE

Preditos

y- y

(y-fj)2

-5,11
-5,1 1
-0,11
-5,11
-0,11
-0,11
6,89
1,89
6,89

26,11
26,11
0,01
26,11
0,01
0,01
47,47
3,57
47,47
177

165,01
166,75
169,37
169,37
171,11
172,86
172,86
175,47
177,22

Resduos

y-y

(y - y)2

0,992
-0,752
1,632
-3,368
-0,112
-1,856
5,144
-2 ,472
0,784

0,98
0,56
2,66
11,36
0,01
3,46
26,42
6,10
0,61
52

A Tabela 13.10 apresenta as somas de quadrados , sendo que SQTe


SQE foram obtidas da Tabela 13.9, e SQR pela diferena das duas.
Tabela 13.10 Decomposio da variao de Y.

-egresso consegue
=::ica de Y.

Fonte de variao

Somas de quadrados

ExpliCa da por X pelo modelo de regresso (variao


explicada)
Devida ao erro aleatrio (variao nao explicada)

SQR = 125

Variao total

SQT = 177

SQE = 52

O subndice e para enfatizar que esta medida se refere ao erro aleatrio.

274

Esr.ufsrio AplicAdA s Cil!\CiAS SociAis

Q\p1ulo 1;; - CoRRE!A'4> E

A pri meira~
em particular, o :e- I P:_-

Com os dados da Tabela 13. 10,


R 2 = S QR = 125 = 0 706
S QT 177
'

Ou seja, dentre os nove indivduos em estudo, as variaes de suas


alturas so explicadas, em parte, pela variao das alturas de seus pais
(Rl:::.70% de explicao); e outra.parte (1 - R2 :::.30%) em razo deoutrosfatores.

O desvio padro da parte ale atria (aquela que no pode ser


explicada por variaes das alturas dos pais) :
S =
"

~ SQE

n-2

{52 = 2 73

f7

'

ExEMplo U.6 O anexo deste captulo contm dados relativos a cinquenta


a partamentos da cidade de Cricima - SC. Com o objetivo de construir
um modelo para subs idiar a atualizao dos va lore s dos tributos
municipais, vamos realizar uma regresso entre valor ( Y), em milhares de
reais, e rea privativa (X), em m 2 Usando o Excel, obtivemos os resu ltados
apresentados na Figura 13.14: 10
Estatsticas da refl!_ess o

R mltiplo
R-quadrado
R-quadrado ajustado
Desvio padro
Observaes

0,88 1
0,777
O, 772
43,3
50

ANOVA

fl.l

SQ

313.285,6
90.082,0
403.368,6

48

49

Ho:

H1:

Uso do coMpurAdon

Regresso
Resduo
Total

de S., = 43,3 ID.h ;e~


coeficien te de co:-:-1
independente, o

MQ.

313.285,6
1.876, 7

166,93

Valor p_
0,0000

com corresponce:-
pequeno, o tes.:e e
apartamento (X e~
coluna apresen~
equao de regres:

ou seja, tendo a ..-ea preo do imve~ ;


100 m 2 tem seu - '

ou seja, R$ 102.-3:

Interseo

-64,57

14,66

-4,40

Intervalo de confiana
(95,0%)
0,000
-94,0
-35, 1

Valor novo

1,67

0, 13

12,92

0,000

Erro
Coeficientes ~adro Estat. t Valor p

1,4

rea, estima-se que

1,9

Figura 13.14 Resultados de uma anlise de regresso pelo Excel (Exemplo 13.6).
10

Para realizar a anlise, no menu principal do Excel, clicar em Ferramentas, Anlise de


Dados e Regresso. Se, ao clicar em Ferramentas, no aparecer Anlise de Dados, clique
em Suplementos e assinale Ferramentas de Anlise. Quanto aos resultados, os termos
foram adequados lngua portuguesa e aos termos tcnicos deste livro. Os valores foram
formatados como nmeros.

se afastarem da :::::ca e:::

mo delo podem p:tC::::!:e:


efetivameme \e=C!!o..

. .,

C<>.prulo 17 -

---~ ~

variaes de suas
=:uras de seus pais

::z:m de outros fatores.


- que no pode ser

-e.ativos a cinquenta
- .:ietivo de construir
"'-o::-es dos tributos
- :), em milhares de
._.....:. emos os resultados

CoRR~IAO ( REGRESSO

275

A primeira tabela da Figura 13.14 mostra algumas estatsticas e,


em particular, o R2 (R-quadrado) igual a 0,777. Este resultado indica que
na amostra, cerca de 78% da variao do valor de venda do apartamento
pode ser explicada por uma relao linear com a rea privativa. Os demais
22% so a parcela da variao provocada por outros fatores no includos
no modelo de regresso. Essa parte aleatria tem desvio padro estimado
de S., = 43,3 mil reais. 11 Na primeira linha da tabela, tem-se o chamado
coeficiente de correlao mltiplo, que, no caso de apenas uma varivel
independente, o coeficiente rde Pearson (Seo 13.2).
A segunda tabela apresenta a anlise de varincia (ANOVA) do
modelo. A coluna SQ apresenta as somas de quadrados. Mas o mais
importante so os resultados de u m teste estatstico para as hipteses:
H0 : no existe relao linear entre X e Y; e
H 1 : a relao linear entre Xe Y significativa (no mero resultado
do acaso).
O teste, conhecido como teste Fdo modelo, resultou em F = 166,93,
com correspondente valor p = 0,0000. Como o valor p extremamente
pequeno, o teste estatstico rejeita H0 , indicando que a rea privativa do
apartamento (X) significativa para explicar o seu preo (Y) .
A terceira tabela fornece vrias informaes relevantes. A primeira
coluna apresenta as estimativas dos coeficientes, de onde extramos a
equao de regresso:

y =- 64,57 + (1,67)x
ou seja, tendo a rea privativa (x) podemos obter uma previso para o
preo do imvel (fJ ). Por exemplo, um apartamento com rea privativa de
100 m 2 tem seu valor predito pelo modelo de :

Valor p

y = - 64,57 + (1,67). (100) = 102,43


ou seja, R$ 102.430,00.

-35, l
1,9

Interpretando o coeficiente de x, temos que, a cada m 2 a mais de


rea, estima-se que o valor do apartamento aumenta em b = 1,67 mil reais.
A ltima tabela fornece os resultados de testes estatsticos sobre
cada um dos parmetros do modelo . Em particular, na regresso simples,
11

Observe que, embora o R2 indique um ajuste razovel, o desvio padro mostra que este
modelo ainda no adequado na prtica, pois, p ela distribuio normal, natural valores
se afastarem da mdia em at dois desvios padres. Ou seja, as predies baseadas n o
modelo podem predizer valores de venda com m ais de 86 mil reais de diferena do valor
efetivamente vendido.

276

Esr A1sricA Apl icAdA ~ Citi\ CiAS SoclAb

o teste sobre o parmetro b (inclinao) equivalente ao teste Fda anlise


de varincia sobre o modelo. As duas ltimas colunas dessa tabela
apresentam um intervalo de 95% de confiana para os dois parmetros
do modelo (o intercepto a e a inclinao 13), com a mesma interpretao
dos intervalos de confiana discutidos no Captulo 9.

CA1ulo r~

CoRREI~ ~

17.5 ANlisE dos


Na seo an::e_- -observaes (x, y , ::=:.

Exrnccio
9) Sejam os dados de nmero de faltas e nota na prova d e uma turma de
Estatstica:
Nmero de faltas
Nota na prova

8
7

2
10

5
6

o
10

1
8

4
5

10
2

2
8

a) Qual deve ser a varivel dependente, e qual a independente? (Escolha a


que lhe faz mais sentido.)
Estabelea a equao de regresso.
Faa um grfico com os pontos observados e a reta de regresso.
Calcule o coeficiente R2 .
Calcule Se.
f) Quais so as principais informa es que podem ser obtidas pela presente
anlise?

b)
c)
d)
e)

10) Na dcada de 1970, em vrias regies, houve um movimento migra trio que
fez crescer bastante a populao urbana nos municpios mdios e grandes.
Neste contexto, vamos tentar explicar o crescimento demogrfico de um
municpio em funo de sua populao urbana, considerando dados de doze
importantes municpios catarinenses, no perodo em discusso .
105

Um primei.-.:. s- _
o diagrama de Cis;c~
grfico, podemos~~
a forma e strutu~e::. -

Aps a esti .. ,==


resduos do mode~
observao, e de5~
valor predito y. Ot!

68_ 219 122_ 42

~2.1

a)
b)
e)
d)

supor que as obse_


tenha distribuic "'"=-constante . Aprese-..::::::.
suposies pode= se:~ ~
adequar o mode:o.

Qual deve ser a varivel dependente, e qual a independente?


Estabelea a equao de regresso.
Faa um grfico com os pontos observados e a reta de regresso.
Qual a taxa de crescimento demogrfico, predita p e la equao de
regresso, para um municpio de 300 mil habitantes?
e) Calcule o coeficiente R2
f) Quais so as principais informa es que podem ser obtidas pela presente
a nlise?
11} (Fazer com o auxilio do computador.) Considerando que a satisfao de um
aluno com um curso universitrio (Y) pode ser afetada p elo seu desempenho
no curso (X), faa uma anlise de regresso usando os dados do anexo do
Capitulo 2 . Interprete os resultados.

Um grfico

e.._ - ."'""'"

avaliao do mode:.;:; !...


y

Figura 13.15

G.~

.\d~ S Ci ~NCiA> S OCi1\ iS

TI.:ta s dessa tabela


--==.. :JS dois parmetros
~Silla interpre tao

C Ap rulo

17.5

r:; -

277

CRRrlAO L lf"illt~~O

ANlisE dos REsduos ETRANsfORMAES

Na seo anterior, estabelecemos um modelo para um conjunto de


observaes (x, y), relativo s variveis X e Y, da forma

y = o.,+

-==:a de uma turma de


~o

--~ndente?

(Escolha a

ce regresso .

~X+ f:

onde <X e ~ so parmetros a serem estimados com os dados e t: representa


o erro aleatrio. Ou seja, estamos assumindo que X causa Y atravs de
uma relao linear, e toda variao em torno dessa relao deve -se ao
efeito do e rro a leatrio. Alm disso , para a validade dos intervalos de
confiana e testes estatsticos discutidos no Exemplo 13.6, necessrio
supor que as observaes de Y sejam independentes, e o termo de erro
tenha distribuio aproximadamente normal com mdia nula e varincia
constante. Apresentaremos um processo grfico para verificar se estas
suposies podem ser vlidas e, caso contrrio, o que pode ser feito para
adequar o modelo .
Um primeiro grfico pode ser feito antes da anlise de regresso.
o diagrama de disperso, conforme discutido na Seo 13.1. Por esse
grfico, podemos verificar se a funo linear adequada para representar
a forma estrutural entre X e Y. Veja o grfico esqu e rda da Figura 13.15.
Aps a es timao dos parmetros do modelo, podemos calcular os
resduos do modelo ajustado aos dados. O resduo calculado para cada
observao, e definido como a diferena entre o valor observado y e o
valor predito y. Ou seja,

68 219 129

42

2.7

12

~;:,

3 1

3 1

e;ie:::iden te?

resduo

'E!;'

~~-

p ela equao de

=3das pela presente

y-

fJ

Um grfico a presentando os pares (x , resduo) bastante til na


avaliao do modelo de regresso. Veja o grfico direita da Figura 13.15.

- ....... e regresso.
-:::;~

resduo

.. .. .

..

..

....;: a satisfao de 1.Un


~lo

..

o 1----.....___--::-:----~~

seu desempenho

cs dados do anexo do
X

Figura 13.15 Grficos para verificar a adequao do modelo.

278

EsrArs1icA AplicAdA s ClNciAs SocJAis

Os grficos da Figura 13.15 indicam uma situao em que as


suposies do modelo es to aparenteme nte satisfeitas, pois os resduos
apresentam-se distribudos de forma aleatria e razoavelmente simetrica
em tomo da reta de regresso. No grfico dos resduos, a reta de regresso
corresponde linha horizontal sobre o valor zero.
A Figura 13.16 apresenta uma situao em que temos um ponto
discrepante. Esse ponto visvel nos dois grficos, mas no grfico dos
resduos ele aparece mais nitidamente. Seja:

resduo padronizado = y - y

se

Supostamen te, os resduos padronizados devem seguir uma


distribuio normal padro, pelo menos aproximadamente. Ento, em
torno de 95%, os valores devem estar entre 2 ou -2 (Captulo 8). Fora
deste intervalo, so casos suspeitos de serem discrepantes. Assim, o uso
de resduos padronizados melhor para detectar pontos discrepantes.

CAp1ulo Jj - CoRREL~~

Em estudos e-~
sendo comum oc:c:-:...exemplo, conside~
consumo ( Y) de i::l
renda baixa e, co::::.~
distribuies ~7conforme mostra a ~' =
Frequncia

Resduo
padronizado

y
2

--- ~ -------------------

o
-1

..

-------------- --~---- -- X

-2
X

Figura 13.16 Grficos indicando a presena de um valor discrepante.

A Figura 13.16 mostra como um ponto discrepante pode foraruma


inclinao na reta, sug~rindo uma tendncia no compatvel com as
demais observaes. Esse problema surge, principalmente, quando se
tem uma amostra pequena, e o ponto discrepante estiver numa das
extremidades do intervalo de observao de X. prudente, neste caso,
buscar a razo da existncia desse ponto discrepante. Se a sua causa for
algum erro, alguma falha no experimento ou, ainda, puder ser considerada
uma situao atpica, devemos efetuar nova anlise sem a obse rvao
discrepante.
Quando se trata de um estudo experimental, a varivel X costuma
ser estabelecida. Por exemplo, num estu do para verificar a relao entre
o tempo de cozimento (X) e a maciez ( Y) de um alimento, podemos
estabelecer diferentes tempos de cozimento e observar os resultados de

de Y ser maior pe:::a.

determinao da intt=:
da transformao:~-~---...
Y, estabelecendo o se_

mesmo propsito a

= ._ ..

em que a inadequa2!:! '5


13.17. Obserra:::.os .c ;:r
valores so posiu ros.

-'.dA ~ CiNciAs SociAis

~::iao

em que as
pois os resduos
t elmente simtrica
s.. a reta de regresso

- - ;:;s,

:;;:.e temos um ponto


_......_... ::::!aS no grfico dos

CApfrulo r~

279

CoRRElAo E RE<:;RESSO

Y. Recomendamos variar X uniformemente sobre o intervalo de estudo.


Por exemplo, se pretendemos fazer a anlise entre 20 e 30 minutos de
cozimento, podemos fazer ensaios com os tempos de cozimentos de 20,
21, 22, ... , 30 minutos.

Em estudos de levantamento, normalmente X e Y so observadas,


sendo comum ocorrer uma distribuio assimtrica de valores de X. Por
exemplo, considere o problema de se a valiar a relao entre renda (.x) e
consumo (Y) de indivduos de certa regio. A maioria dos indivduos tem
renda baixa e, consequentemente, tendem a consumir pouco, provocando
distribuies assimtricas para X e Y. Assim, os dados devem se distribuir
conforme mostra a Figura 13. 17.

- =:e'\'"e m seguir uma


xa:nente. Ento, em
-..= Captulo 8). Fora
=~tes. Assim, o uso
-,,--=-~s discrepantes.

Frequncia

Frequncia

=----------------

Resduo

-- -- - - __ __ x

~----- -- --------

.. ...

Figura 13.17 Grficos indicando distribuies assimtricas de X e Y, alm da varincia


de Y ser maior para valores maiores de X e Y.

...-~e pode forar uma


;:ompatvel com as

= - ..:d.ente, neste caso,


-------; Se a sua causa for
-:;;::C.er ser considerada
-~ sem a observao

......_._......_;: -arivel X costuma


~..sarr a relao entre
== ~jm e nto, podemos
--a:- os resultados de

-=

Nesta situao, os valores grandes de X vo ter mais peso na


determinao da inclinao da reta. Nes te caso, recomendamos a aplicao
da transformao logartmica, tanto nos valores de X como nos valores de
Y, estabelecendo o seguinte modelo: 12
log(y) = ex. +
12

~ log(x)

comum usar o logaritmo natural ou na base 10. Outra transformao que se presta ao
mesmo propsit o a raiz quadrada. Esta segunda transformao usada nas situaes
em que a inadequao do modelo no aparece de forma to forte como vis to na Figura
13 . 17. Observamos que estas transformaes so passiveis somente quando todos os
valores so positivos.

280

EsrArsricA AplicAdA s Ci~ciAs SociAis

A transformao logartmica aumenta as distncias entre os valores


pequenos e reduz as distncias entre os valores grandes, torn.a ndo
distribuies assimtricas de cauda longa direita em distribuies mais
simtricas. Com isso, temos uma situao mais adequada para estabelecer
a reta de regresso. Em termos computacionais, devemos:

CAprulo 17 - CoRR~!.o

JL

transformao loga:modelo aos dados:

Para ajustar o - -

a) calcular o logaritmo natural de cada valor x e de cada valor y;

a) calcular o ;.

b) aplicar a anlise de regresso linear sobre os dados transformados

b) aplicar a

[log(x), log(y)]; e

e)

c) construir novamente o grfico de resduos para verificar a


adequao das suposies neste novo modelo.
A Figura 13.18 apresenta uma situao que sugere relao no
linear, com Y crescendo rapidamente para valores pequenos de X, e
crescendo lentamente para valores grandes de X. uma situao em que
recomendamos uma transformao logartmica (ou raiz quadrada) somente
nos valores da varivel X, ou seja, passamos a considerar o seguinte
modelo para os dados:

y =a +

~ log(x)

a) calcular o logaritmo de cada valor x;


b) aplicar a anlise de regresso linear sobre os dados [log(x), y]; e
c) construir novamente o grfico de resduos para verificar a
adequao das suposies nesse novo modelo.
Residuo

..

..- ....

novo mocc
y

+ i::

Note que esse modelo pode ser considerado linear em termos das
variveis log(x) e y (no mais entre x e y) . Em termos computacionais,
devemos:

a-~

..... . ... ...

..

Figura 13.19 G:fi::s -~_.


- e varincia ::u

Ousode ~
'"'
mais adequado pa:::2.
regresso linear. A ~
interpretao prtica;;-de mesma magnimC= e:::
um aumento a bsO::-::= muito diferente pe:=. _
1.000,00. Por isso. de salrios. Um au--10,00 para quem g1::~ ~--
ganha R$ 1.000,0G. ~2
Por esta razo, co=--=
variveis econmicas : :

Figura 13.18 Grficos indicando uma relao no linear, aparentemente logartmica.

A Figura 13.19 apresenta uma situao com os seguintes


problemas: (1) relao no linearparaa parte estrutural do modelo e (2)
aumento da varincia medida que X aumenta. Recomendamos uma

ExEMplo 17.6 (coNTi:-L!,:valor de um imvel : j o:=:


uma amostra de c;-!!.=,...
captulo. A Figura ~3- ~
resduos desse mo.e;-

=-

.1 l~

Ci\CiAs SociAis

grandes, tornando
distribuies mais
:;;;;:..;:.a para estabelecer

CApfrulo Jj -

CoRREIAo

281

RFGRFss~o

transformao logaritmica nos valores da varivel Y, ajustando o seguinte


modelo aos dados :
log(y)

+ ~x + s

Para ajustar o modelo, devemos:

- s para verificar a
- sugere relao no
pequenos de X, e
- =::la s ituao em que
==::: ..iadrada) somente
siderar o seguinte

a ) calcular o logaritmo de cada valor y ;


b) aplicar a anlise de regresso linear sobre os dados [x, log(y)J; e
c) construir novamente o grfico de resduos para verificar se o
novo modelo mais adequado aos dados.
Resduo

........

.... . . .
..

-ear em termos das


-s computacionais,

__ dados [log(x), y]; e

...

:-:::=:::!!::lrnrnte logartmica.

om os segu int es
:-a1 do modelo e (2)
romendamos uma

Figura 13.19 Grficos indicando uma relao no linear - aparentemente exponencial


- e varincia no constante.

O uso de transfonnaes auxilia o pesquisador a encontrar um modelo


mais adequado para os dados, ainda que utilizando as expresses da
regresso linear. A transformao logartmica muito usada por ter uma
interpretao prtica interessante, j que transforma variaes percentuais
de mesma magnitude em variaes constantes. Por exemplo, se considerar
um aumento absoluto no salrio de R$ 100,00, o seu significado vai ser
muito diferente para quem ganha R$ 100,00 e para quem .ganha R$
1.000,00. Por isso, mais comum ouvir falar em aumentos percentuais
de salrios. Um aumento de 10% no salrio representa um ganho de R$
10,00 para quem ganha R$ 100,00 e um ganho de R$ 100,00 para quem
ganha R$ 1.000,00. Na escala logartmica, esses incrementes so iguais.
Por esta razo, comum usar a escala (ou transformao) logaritmica em
variveis econmicas ou medidas de tamanho em geral.

ExEMplo l>.6 (CONTNUAO)

Na seo anterior foi realizada uma regresso do


valor de u m imvel ( Y') com relao a sua rea privativa (X), considerando
uma amostra de cinquenta apartamentos, apresentada n o anexo deste
captulo . A Figura 13.20 aprese nta a reta de regresso e o grfico dos
resduos desse modelo.

282

E~rArsriCJ\

1CD

::>

&
3::!

ApliCAdA ;\-, Cil'.eiAs Soci1\is

.. .. . . .

..

I:!>

CoRRFIA.io

o ----rllf-r::+.,-.-----:--------------7""-... i.

Para prediz.er o ""'"'


devemos, primeira::ies=:==

.~

....

~ : .-. ,.:..-:: "

Cl\piulo

-1CD

O ~--,,--~~~~-r~~~~~T

150

50

250

. 50

Pfi!f3

rea

Figura 13.20 Grficos de disperso e dos resduos (Exemplo 13.6).

Observamos na Figura 13.20 uma predominncia de valores


pequenos com respeito s duas variveis. Isto era esperado porque so
mais comuns apartamentos pequenos (rea e preo pequenos) do que
apartamentos grandes (rea e preo grandes). Tambm podemos observar
maior variabilidade nos apartamentos mais caros. Essas condies
sugerem tentarmos uma transformao logartmica em X e em Y. Assim,
foi aplicado o logaritmo natural em cada um dos cinquenta valores de X e
Y. Por exemplo, o primeiro apartamento da amostra tem x = 96 m 2 e y =
69 mil reais. Aplicando o logaritmo natural, encontramos:
log(x)

= log(96) = 4,56

e log(y)

17.6

INTROdL

= log(69) = 4,23

A anlise com os dados transformados produziu os grficos de


disperso e de resduos apresentados na Figura 13.21.
6-1

0,5

l5 5 -

.. :"......
...

..

..

-0,5

3 -<,-~~~~~~~~~~~.,.,

3,5

_____: _________ _
.. ..........
.
..

0,0 -, - -~- -~---- -----~~~:

_, 4 -

4,5
LogAtea

5.5

3,5

4.s

~.5

LogArea

Figura 13.21 Grficos de disperso e dos resduos (Exemplo 13.6), aps transformaes nas
variveis.

X1 = altura do pai e:::.;


X2 = altura da me ,=,
X3 = sexo ( 1 = home::::;.. e
X1 =renda (R$)

X:i = poupana (RS


Verificamos pela Figura 13.21 que, aps as transformaes, as
condies bsicas do modelo esto aparentemente satisfeitas. A equao
de regresso, obtida com apoio de um sistema computacional para anlise
estatstica :
Predio de log(y} = -1,58 + (1,33) log(x)

X3 = taxa de juros
X1 = rea construida e
X2 = idade (anos)
XJ = localizao
X1 = memria R.\:

X2 =sistema op~
XJ = tipo de pr~

.0:0..>. s CitNciAs S0ciAis

CApTulo IJ - CoRRFIAo F RFCjR Ess\o

com R2 = 0,813 e Se = 0,294. Observar que o poder explicativo deste modelo


melhor que o anterior (8 1,3% contra 77,7% ). J o Se no comparvel
devido a transformao de escala.
-e-~:-=--'-------------------

Para predizer o valor de um apartamento com rea privativa de 100 m 2 ,


devemos, primeiramente, transformar este valor na escala logaritmica:
x

100

log(x) = 4,605

250

Aplicar o modelo de regresso:


Predio de log(y)

= - 1,58 + (1,33) (4,605) = 4,545

Efetuar a transformao inversa do logaritmo:


-

-:icia de valores
~:ado porque so
-- ;>equenos) do que

y = exp{4,545} = 94,15
Assim, por este novo modelo, o apartamento valeria R$ 94.150,00.

3ssas condies
e--: X e em Y. Assim,
_e:::ta valores de X e

- =..;,23

. .

. ..

----L- -------~ - -- - --

17.6 INrnoduo REqREsso MlTiplA


Em geral, uma varivel dependente (ou resposta) Y depende de vrias
variveis independentes ou explicativas (Xl' ~, .. ., X k) . Na anlise de
regresso mltipla, vamos construir um modelo estatstico-matemtico
para se estudar, objetivamente, a relao entre as variveis independentes
e a varivel dependente e, com o modelo construdo, conhecer a influncia
de cada varivel independente, como tambm predizer a varivel
dependnte em funo do conhecimento das variveis independentes. O
Quadro 13.2 ilustra alguns exemplos .

.. ...... .
Quadro 13.2 Aplicaes do modelo de regresso mltipla.
.5

::ransformaes nas

=-a:isformaes, as

s;:.::s:eitas. A equao
=:a::ional para anlise

X1 = altura do pai (cm)


X2 = altura da me (cm)
X3 = sexo Q = homem, O = mulher)
X1 = renda (R$)
X2 = poupana (R$)
Xi = taxa de juros{%)
X1 =rea construida do imvel (m2)
X2 = idade (anos)
X3 = localizao
X1 = memria RAM {Gb)
X2 = sistema operacional
Xi = ti o de rocessador

Y = altura de um indivduo (cm)


Y

Consumo (R$)

Y = preo do imvel (R$)

Y = tempo de resposta do sistema


computacional (segundos)

284

EsrArsricA Apl icAdA s CiNCiAs SociAis

Para estabelecer o modelo clssico de regresso mltipla,


consideraremos que Y seja uma varivel quantitativa contnua e XP Xi,
... , Xk sejam variveis quantitativas ou indicadoras de certos atribu tos. A
varivel indicada deve ter valor 1 quando o atributo est presente; e O
quando no est presente . Por exemplo, a varivel .x_, = localizao do
imvel pode ter valor 1 quando o imvel estiver numa rea valorizada, e O
quando estiver numa rea pouco valorizada. Tambm ser considerado
que Y uma varivel aleatria, isto , somente ser conhecida aps a
observao do elemento (indivduo, imvel, etc.}, enquanto Xl' ~ ... , ~
tambm podem provir de observao ou serem estabelecidas a priori.
A anlise de regresso mltipla parte de um conjunto de observaes
(xi' ~, ..., .x;., y), relativas s variveis X i> Xi . ... , )\,e Y. Diremos que um
dado valor ydepende dos correspondentes valores xi'~, ... , .xj., mas tambm
de uma infinidade de outros fatores no includos no modelo, que sero
representados por i:: (erro aleatrio). Mais especificamente, supomos o
seguinte modelo para as observaes:
y = a + l\ x 1 + 132 X:i + .. . + 13"x" + i::

onde a, 13 1 , 132 , ... , 13" so parmetros a serem estimados com os dados e


i:: representa o erro aleatrio, cujo desvio padro tambm pode ser estimado
pelos dados. As suposies so anlogas s suposie s da regresso
simples, acrescentando que as variveis independentes X1, X2 , . . . , Xk n o
devem ter correlaes altas entre si.

ExEMplo 1).7 Voltando questo de construir um modelo para o valor de


um apartamento (Y) com os dados do anexo deste captulo. Sejam as
variveis independentes:

xi = rea comum do apartamento (m2 );


~ =

x_, =
X~ =

idade (anos);
consumo de energia eltrica do morador (Kw / ms) e
localizao (1 = rea valorizada; O= rea pouco valorizada).

Como discutimos no Exemplo 13.6, as variveis Y e X1 sero


analisadas na escala logartmica. A varivel )(_1 est sendo usada como
uma proxi. do padro de vida do morador do apartamento e, por sua vez, da
qualidade do apartamento . Temos o seguinte modelo terico para os dados:
log(y) = a + 13 1 log(x1) + 132 X:i + 133 JS + 134 x4 +e
Usando o Excel, obtivemos os resultados apresentados na Figura
13.22. 13
13

Nos r esultados, os t ermos foram adequados lngua portuguesa e aos t ermos tcnicos
deste livro. Os valores foram formatados como n meros.

CAprulo 1} - Co RREIA.o ~

ANOVA

Regresso
Resduo
Total
Cot"'.

interseo
LogArea
Idade

Observamos. ~
quadrado) igual a: s::
Exemplo 13.6 (R~ = : ~
incluso das vari-r...s:.
valor 'R2 = 0,889 , L~c..::E
de um apartamen~o
o logaritmo da rea c:c-do morador (.}J e cos
A segunda rabe~ _ .._
da seguinte hiptese
Ho: 131= 132 = ~" =

ou seja, por esta hip:esc


no tem poder expba.r:=t::c
como teste F d o ~:_
correspondente valo:- _?e:c::::::::: - :::::1
Assim, o teste estas:i::c
escolhidas so sign.Qc.c.;;:::::
A terceira tabe'i:. =:..intervalos de confia:::;-::a
primeira coluna ap:-es~....:::
podemos extrair a seg-~

Cabe observar que o ~....,.. ::J1


amostra muito pequ=.a.. ?""'=

285

CAprulo 17 - CoRRFIAO e RE<;REss:>.o

~gres so

mltipla,

Estatsticas da regresso

::z--a contnua e X1, Xi.

R mltiplo
R-quaclrado
R-quaclrado ajustado
Desvio padro
Observaes

certos atributos. A
-~est presente; e O

~-..-.e.=

~ ~ =

localizao do

- - rea valorizada, e O

0,943
0,889
0,879
0,234
50

ANOVA
fi..l

Regresso
Resduo
Total

4
45
49

SQ
19,702
2,467
22, 169

MO

4,926
0,055

89,863

e.

Valor
0,000

Erro
Intervalo de confiana
Estat. t Valor p
(95,0%)
Eaclro
-1 ,208
-1,966
-0,4~0
Interseo
0,376 -3,210 0,002
1, 195
0,084 14,242 0,000
1,026
1,364
LogArea
-0,025
0,005 -4,623 0,000
-0,036
-0,014
Idade
Energia
0,0024
0,0016 1,5214 0,135
-0,001
0,0057
0,076
Local
0,076 1,0 10 0,318
-0,076
0,229
Figura 13.22 Resultados de uma anlise de regresso pelo Exceli (Exemplo 13.7).
Coeficientes

__;:mto de observaes
~

:'. Diremos que um


i:_ ..., Xk mas tambm
,....___ -:::: !Ilodelo, que sero

Observamos, na primeira tabela da Figura 13.22, o valor de R2 (Rs. = 0,234. Comparando com os resultados do
2
Exemplo 13.6 (R = 0,813 e S, = 0,294), vemos melhora no modelo com a
incluso das variveis: idade, gasto de energia eltrica e localizao. O
valor R2 = 0,889, indica que quase 90% da variao do logaritmo do valor
de um apartamento pode ser explicado por uma relao linear que envolve
o logaritmo da rea comum (X1}, idade (X), consumo de energia eltrica
do morador (X3 ) e dois nveis de localizao (X4 ).

quadrado) igual a 0,889 e

~::i

pode ser estimado


- s2es da regresso
- -.:es xi' :>; .. ., x,. no

- celo para o valor de


captulo. Sejam as

A segunda tabela(ANOVA) fornece o resultado de um teste estatstico


da seguinte hiptese nula:
Ho: ~1 = ~2 = ~3 = ~4 = O

:~\-f ms)

~uco

valorizada).

-..veis Y e X , sero
""'" sendo usada como

ou seja, por esta hiptese, o conjunto de variveis independentes em estudo


no tem poder explicatvosobre a varivel dependente. 14 Este teste, conhecido
como teste F do modelo, resultou na estatstica F = 89 ,863, com
correspondente valor p extremamente pequeno (menor que um milsimo).
Assim, o teste estatstico rejeita H0 , indicando que as variveis independentes
escolhidas so significativas para explicar a varivel dependente.
A terceira tabela fornece as estimativas dos coeficientes, incluindo
intervalos de confiana e testes estatsticos para cada coeficiente. A
primeira coluna apresenta as estimativas dos coeficientes, de onde
podemos extrair a seguinte equao:
14

Cabe observar que o teste estatstico refere-se populao, ou seja, quando se tem mna
amostra muito pequena, podemos obter um valor alto de R2 e o teste aceitar l-1 0

286

EsrAr sr icA AplcAdA s Ci'lCiAS SociA~

CAprulo 17 - CORREW:~ E

Predio de log(y) =-1,208 + 1,195 - log(xi) - 0,025x2 + 0,0024x 3 + 0,076xq

o bserva.ran:-se

e os respeetr_

Assim, te ndo a rea do apartamento (x1), a idade (x.i). o consumo de


energia eltrica (~) e a localizao (x4 ) podemos obter uma predi o de seu
valor. Por exemplo, um apartamento com 100 m2 , que tenha 5 anos de
uso, morador consumindo 200 Kw e localizao em rea valorizada, temos:

b) Para avallirr "


indivduos,

~ez-se

Prediode log(y) = -1,208 + 1,195 log(l 00)-(0,025) 5 + (0,0024) 200 + (0,076) 1

ou: Predio de log(y) = 4,726. Portanto:

y = exp(4,726) =112,84

c)

ou, seja, valor estimado de R$ 112.840,00.


Devemos observar que os sinais do s coeficientes d o m odelo
construdo es to coerentes. Coeficiente de X1 positivo, isto , quanto maior
o apartamento, maior dever ser o seu valor; coeficiente de ~ negativo
(quanto mais velho, menor o valor); coeficiente de ~ positivo (quanto
maior o consumo de energia do morador, maior o valor); e coeficiente de
X4 positivo (em rea valorizada, maior o valor) .
A ltima ta bela tambm fornece os resultados de testes es tatsticos
para cada varivel. Pelos valores p, verificamos que as variveis energia e
local so no significativas e, portanto, poderiam ser excludas do modelo
sem que os indicadores de qualidade do ajuste (.R2 e Se) piorem
demasiadamente . Isso no significa que a localizao no seja relevante
para explicar o valor do imvel, mas seu efeito j pode estar parcialmente
includo nas outras variveis independentes.

enqu anto, tios


14) Com o obje\-o e

de escolaridade

se uma amosrra
anos que estes
o nmero mcilo ~
em escolas reg'.;._;__-::s

--

a) Calcule o

b)

e)

d)

Para verificar a adequao de um modelo de regresso mltipla,


podemos calcular os resduos e, com base neles, fazer uma anlise grfica
similar a que foi feita em regres so simples.

E xERCcios c oMplEMENTARES

12) Para verificar se existe correlao entre X - tamanho da ninhada e Y = nmero


de brincadeiras filhote-me, em hamsters dourados, observaram- se o
relacionamento de um filhote com sua me, em cada uma das 20 ninhadas
de mesmo tempo de vida, durante uma hora. Anotaram-se, para cada ninhada,
os valores das variveis X e Y e calculou-se o valor do coeficiente r nessa
amostra: r = - 0,20. Podemos concluir que realmente existe correlao entre
X e Y, ao nvel de significncia de 5%?
13) Para cada um dos itens abaixo, calcule um coeficiente de associao (ou de
correlao) e interprete. Escolha o coeficiente de acordo com a forma de medida
das variveis.
a) Para avaliar o rela cionamento entre renda familiar (em unidades de salrios
mnimos) e nmero de filhos nas seis famlias de uma pequela localidade,

da tem pera~'"a.'.>
16) A tabela, a seg-~.
rendimento de co=:_._..___

a)
b)
c)

dA s CieNciA~ SociAis

~4X3

+ 0,076x4

-d~,r X-_i) , o consumo de


---'1:Ila predio de seu
;:::e tenha 5 anos de

CAprulo 17 -

Cor~RElAi>.o

observaram-se os seguintes valores de renda familiar: 1, 2, 4, 8, 12 e 20;


e os respectivos nmeros de filhos: 4, 5 , 5, 3, 2 e 2.
b) Para avaliar o relacionamento entre peso e al.tura de um grupo de 10
indivduos, fez-se a classificao cruzada, apresentada na tabela abaixo:

=~ientes

do mode lo
_ isto , quanto maior
- C -:ente de x2 negativo
- ~ -~ positivo (quanto
~or); e coeficiente de

'ce testes estatsticos


;

~ >ariveis

energia e

~ :::x:cludas

do modelo
$:.:= !W e S~) piorem
o :io seja relevante
- ~ estar parcialmente

....:: =-egresso mltipla,


grfica

~:una anlise

,;.;, ~.inhada e Y

nmero

- - se. para cada ninhada,


::;;> coeficiente r nessa
- =riste correlao entre

_ _ _ de a ssociao (ou de
.::om a forma de medida

-='=unidades de salrios

==a pequela localidade,

altura

peso

baixa
2

baixo

-_ =~4) 200+(0,076)1
- -.=6) =112,84

287

e RCCjRCSSO

mediano
alto

mediana 1
l

alta
1

c) Para avaliar o relacionamento entre sexo e altura, num grupo de 100 pessoas
adultas, observou-se que das 40 mulheres , 30 eram baixas e 10 eram altas,
enquanto, dos 60 homens, observaram-se 40 altos e 20 baixos.
14) Com o objetivo de verificar se numa certa regio existe correlao entre o nvel
de escolaridade mdio dos pais e o nvel de escolaridade dos filhos, observouse u ma amostra aleatria de 8 indivduos adultos, verificando o nmero de
anos que estes frequentaram (e tiveram aprovao) em escolas regulares (Y) e
o nmero mdio de anos que os seus pais frequentaram (e tiveram aprovao)
em escolas regulares (X). Os resultados da amostra so apresentados abaixo:
X

5
8

15

a ) Calcule o coeficiente de correlao de Pearson.


b) Em termos do resultado do item (a), o que se pode dizer sobre a correlao
entre o nmero de anos que os 8 indivduos frequentaram escolas regulares
(}')e o nmero mdio de anos que os seus pais frequentaram escolas regulares?
c) Estabelea a reta de regresso de Y em relao a X.
d) Apresente o diagrama de disperso acompanhado da reta de regresso .
15) Um administrador de uma grande sorveteria anotou por um longo perodo de
tempo a temperatura mdia diria, em C (X), e o volume de vendas diria de
sorvete, em kg (Y) . Com os dados , estabeleceu uma equao de regresso,
resultando em:
y = 0,5 + 1,8x, com R 2 = 0,80
Pergunta-se:
a) Qu al o consumo esperado de sorvete num dia de 27C?
b) Qual o incremento esperado nas vendas de sorvete a cada 1c de aumento
da temperatura?
16) A tabela, a seguir, relaciona os pesos (em centenas d e kg) e as taxas de
rendimento de combustvel em rodovia (km / litro), numa amostra de 10 carros de passeio novos.
Peso
Rendimento

12 13 14 14 16 18 19 22 24 26
16 14 14 13 11 12 09 09 08 06

a ) Calcule o coeficiente de correlao de Pearson.


b) Considerando o resultado do item (a), como voc avalia o relacionamento
entre peso e rendimento, na amostra?
c) Para estabelecer uma equao de regresso, qual deve ser a varivel
dependente e qual deve ser a varivel independente? Justifique a sua resposla

288

EsTArsricA AplicAd/\ s Ci~'\CiAs Soc:iAiS

d) Estabelea a equao de regresso, considerando a resposta do item (c).


e) Apresente o diagrama de disperso e a reta de regresso obtida em (d).
f) Voc considera adequado o ajuste do modelo de regresso do item (d)? D
uma medida d esta adequao interpretando-a.
g) Qual o rendimento esperado para um carro de 2.000 kg? Use o modelo do
item (d). Lembrete: os dados d e peso na tabela esto em centenas de kg.
h) Voc considera seu estudo capaz de predizer o rendimento esperado de um
veculo com peso de 7 .000 kg? Justifique sua resposta.

ANEXO
Dados de apartamentos de Cricima- SC. Variveis: valor (em milhares
de reais), rea privativa (m2 ), idade (anos), consumo mensal de energia eltrica
(Kw) e local (1 = regio mais valorizada; O= regio menos valorizada).
Valo

69
176
195
80
390
360
80
45
153
66
90
114
165
101
150
75
38
68
90
60
55
92
84
92

rea Idade

96

145
175
101
233
201
104
64
100
112
90
187
147
102
185
102
35
94
llO

86
74
98
90
94

14
8
2
4
2
6
2
14
2
17
2
28
4
2
8
6
6
28
14
6
10
4
4
12

Energia Local Valor

170
144
147
160
220
228
160
118
174
181
144
146
183
160
144
180
144
146
158
146
147
160
147
187

1
1
1

1
1
1

o
1
1
1

o
o
1
1

o
1

o
o
o
o
1

98
120
51
90
65
90
219
167
63
150
36
139
39
24
84
96
65
30
41
476
43
27
44
44

rea

114
101
80
115
55
98
161
101
85
123
61
153
51
37
83
67
82
42
66
240
64
57
65
73

BARBETIA, P. A.; xZTEngenharia e lnformtr:zr:.. ....

Idade Energia Local

4
4
14
2
2
12
6

4
12
4
12
8
18
14
16
2
4
2
12
2
18
14
12
12

170
192
170
128
118
143
175
192
172
154
163
144
135
163
147
118
147
160
154
183
184
143
147
128

1
1
1

BOLFARINE, H.; Bl:SS---'


Edgard Blcher , 20C5

o
o

BLALOCK,H. M.Soa::::

1
1
1

o
1

BOX, G. E. P.; HID_ .:. ~


Canad: John Wiley, :BUSSAB, W. O. ; MO~..,_......-.Saraiva, 2002.

CHATIERJEE, S.; .h...l2J


3. ed. USA: John W:ey" _

COCHRAN, W. G. Sa-;-

o
o
o
1

o
o
o
o

LEACH, C. Introductia-:
sciences. USA: John WL ...
LEVIN, J . Estatstica CJ1
Harbra, 1985.
T

Fonte: Amos tra extrada dos dados da dissertao de mes trado ZANCAN, Evelise C .
Metodologia para AualiaO em Massa de Imveis para Efeito de Cobrana de Tributos
Municipais - Caso de Apartamentos da Cidade de Cricima, Santa Catarina. UFSC,
Florianpolis, 1995. Com adaptaes.

r."' 1"1 1'. T r."

kg? Use o modelo do


e=: centenas d e kg.

REfERNCAS

~s:

valor (em milhares


-.-Sal de energia eltrica
--=-:-OS valorizada) .

..

"

Energia

Local

170

192

170
128
118
143
175
192
172

154

163
144
135
163
147
118
147
160
154
183
184
143

147

128

o
o
1
1

AGRESTI, A. Analysis of ordinal categorical data. USA : John Wiley, 1984.


BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatstica para cursos de
Engenharia e Informtica. So Paulo: Atlas, 2004.
BOLFARINE, H. ; BUSSAB, W. O. Elementos de amostragem. So Paulo:
Edgard Blcher, 2005.
BLALOCK, H. M. Social statistics. USA: Me. Graw-Hill, 1960.
BOX, G. E. P.; HUNTER, W. G.; HUNTER, J. S. Statisticsforexperimenters.
Canad: John Wiley, 1978.

o
1
1

o
o

o
1

o
o
o
o

BUSSAB, W. O.; MORETTIN, P. A. Estatstica bsica. 5.ed. So Paulo:


Saraiva, 2002.
CHATTERJEE, S.; HAD!, A. S.; PRICE, B. Regression analysis by examples.
3. ed. USA: John Wiley, 2000.
COCHRAN, W. G. Sampling techniques. 3. ed. USA: John Wiley, 1977.
FISHER, R. A. The design ofexperiments. 6. ed. Edinburgo: Oliver and Boyd,
1951.
LEACH, C. Introduction to statistics: a nonparametric approach for the social
sciences. USA: John Wiley, 1979.
LEVIN, J. Estatstica aplicada s cincias humanas. 2. ed. So Paulo:
Harbra," 1985.
LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatstica: teoria e aplicaes
usando o Excel. Rio d e Janeiro: LTC, 2000.

290

EsrAr sricA AplicAdA s CiNciAs Soc:iAls

MAGALHES, A. N.; LIMA, A. C. P. Noes de probabilidade e estatstica. 4. ed.


So Paulo: EDUSP, 2002.
MENDENHALL, N. Probabilidade e estatstica, v. 1 e 2. Rio de Janeiro:
Campos, 1985.
NOETHER, G. F. Introduo Estatstica: uma abordagem no paramtrica.
2. ed. Rio deJaneiro: Guanabara Dois, 1983.
SELLTIZ, G. l.; WRIGHTSMAN, L. S.; COOK, S. W. Mtodosdepesquisanas
relaes sociais. 4 . ed. So Paulo: EPU, 1987.
SIEGEL, S. Estatstica no paramtrica aplicada s cincias do comportamento.
Rio de Janeiro: Me. Graw Hill, 1975.

59 58 48 36 47

STIGLER, S. M. The history of statistics: the measurement of uncertainty before


1900. USA: Harward, 1986.

53
07
92
90

50
58
56
58

21
67
36
96

STEVENSON, W. J. Estatstica aplicada administrao. So Paulo:


Harbra, 1981.

24 26 56 02
20 09 49 50
22 74 50 39
10 45 36 09

33

04
55
66
96

50
30

TEXEIRA, E.; MEINERT, E. M.; BARBETTA, P. A. Anlise sensorial de alimentos.


Florianpolis: Editora da UFSC, 1987.
TRIOLA, M. F. Introduo Estatstica. 9. ed. Rio de Janeiro: LTC, 2005.
WONNACOTT, T. H.; WONNACOTT, R. J. Estatstica aplicada conomia e
~dministrao. Rio de Janeiro: Livros Tcnicos e Cientificos, 1981.

26
02
87
57

21
16
67
05

27
12

86
09 82 11 18 29

63 02 45
93 05 63
15 07 64
31 72 41
07 10 58 83

38

94
63

04 47 64 02 49

56 24 53 31 96
98 15 27 91 71
36 96 23 77 26
66 01 53 03 67

-18 07 09 48 65
95 44 86 84 32
91 73 15 42 46
08 35 79 86 83
37 20 97 09 96

79 14 72 97 40
58 55 07 49 26

77 93 74 07 34
91 82 56 78 91
53 66 43 91 44
91 03 23 35 58
70 35 43 62 20
93 85 01 86 56
75 40 86 33 31

37 15 68 73 37
35 88 34 83 04

73 06 78 79 97
94 70 05 36 32
09 65 41 62 93
12 39 50 50 09
Nota: Os espaos ~ os ~
lidos com a quann~ : ,,,

w1

_ - _de Janeiro:

ApNdicE
__.... --o.s de pesquisa nas

Tabela 1 Nmeros aleatrios

of uncertainty before

--=e sensorial de alimentos.

05
85
93
16
68

08
52
87
88
15

65
86
84
16
87

47
86
31
17
28

41
34
78
09
76

05
37
60
99
89

10
69
59
86
94

75
85
90
17
60

59
25
24
20
94

75
03
22
95
48

99
78
07
93
76

17
50
74
01
92

28
26
43
46
93

97
18
43
77
49

99
25
56
18
13

91

75
85
03
31
96 19 12

5~

59
38
98
47

04
39
78
41
26

96 28 85 78
02 25 60 56
85 56 78 41
98 17 56 93
26 01 14 78

11
26
44
84
55

54
01
26
16
33

01 92
11 24
04 12
01 48
11 13

86
44
13
99
56

36
15
50
36
95

65
58
38
44
68

19
00
15
61
66

45
54
61
71
57

97
54
02
69
90

79
09
51
67
33

50
30
38
94
63

61
40
16
47
35

91 02
os 51
44 52
03 44
47 34

14
03
26
73
05

07
31
42
77
38

57
68
34
96
92

36
15
65
17
26

29
33
99
02
05

12
85
71
97
33

74
87
63
50
40

89
94
87
26
91

47
80
22
67
23

84
24
04
60
43

89 69
96 62
62 15
63 57
68 72

13
31
76
66
29

85
38
94
81
74

22
95
00
92
60

66
35
00
03
67

83
38
77
20
01

02
31
91
77
03

49
96
71
26
67

10
65
24
79
92

52
42
15
74
27

21 00 80
28 61 91
28 12 16
27 17 54

40
23
83
08
31

56
30
49
88
23

68
61
05
07
30

97
34
82
28
42

32
18
54
71
83

43
56
53
45
85

46
59
59
43
78

70
23
30
40
21

65
69
25
07
68

08
27
19
66
34

96
83
36
11
86

52
66
31
26
33

25
60
31
38
77

29
03
56
51
84

44
12
58
87
40

09
86
15
79
97

48
84
42
86
09

65
32
46
83
96

92
09
72
06
86

33
03
21
89
34

41
56
07
37
77

97
46
34
82
09

63
96
li
12
31

48
64
92
81
04

97
51
70
14
38

19
33
89
08
18

86
75
58
82
79

81
10
54
04
61

10
29
11
91
68

85
00
30
88
66

42
99
93
04
47

84
23
38
86
40

49
82
29
36
35

03
92
00
18
40

82
31
53
10
16

OI
77
93
09
50

82
08
14
78
22

88
17
09
99
54

14
55
93
82
66

72
07
74
56
43

97
49
07
78
91

40
26
34
91
44

90
08
23
47
19

98
02
49
22
05

64
70
25
60
53

42
20
23
09
26

25
14
87
32
31

72
57
43
67
89

95 89 98 59
17 20 89 16
93 35 93 02
02 21 71 61
52 31 98 20

03
07
80
12
03

73
86
94
83
70

02
05
57
08
03

95
38
16
40
61

47
61
22
00
07

34
Q9
73
52
52

85
48
67
23
79

74
78
28
47
97

60
18
75
46
75

90
62
37
58
92

03
35
85
40
15

23
43
01
86
68

35
62
86
33
73

58
20
56
31
37

48
81
78
96
31

22
20
48
06
76

68
95
74
26
55

98
72
55
53
39

07
99
63
07
13

12
80
62
41
49

20
91
09
58
61

19
26
08
17
53

00
71
70
71
47

56
79
04
66
54

88
23
66
60
53

74
17
86
72
52

96
01
08
07
80

71
25
91
18
30

20
48
83
47
40

52
07
42
73
35

46
82
94
75
21

59
53
07
92
90

"8
26
02
87
57

48
21
16
67

36
50
58
56
os 58

47
21
67
36
96

92
37
05
58
84

85
93
32
58
33

24
20
22
10
09

26
09
74
45
82

56
49
50
36

02
50
39
09
11 18

33
27
12
86
29

33
33
83
07

21
86
91
68

04
55
66
96
07

63
93
15
31
10

02
05
07
72
58

45
63
64
41
83

04
56
98
36
66

47
24
15
96
01

64
53
27
23
53

48
95
91
08
37

07
44
73
35
20

79
58
77
91
53
91
70
93
75
37

3 5 88 34 83 04
73 06 78 79 97
94 70 05 36 32
09 65 4 1 62 93
1239505009

53 27 78

71 67 75
28 86 29
3/l 44 59
63 28 60
227054

40 83
45 91
60 OI
59 28
7538

49
22
30
83
18

10
75
62
52
08

88
40
64
96
13

41
17
35
29
83

89
51
47
23

90

99 97 96 83 32
76 44 64 99 81
13 74 03 30 33
29 08 69 81 67
7856792662

16 04 27 99 31
33 95 06 94 26
24 79 77 71 8 7
60 57 53 64 28
7937ll33392

75
10
91
11

49 80 34 34 95
85 78 57 43 12
41 57 07 96 68
12 24 35 23 49
3330614190

Nota: Os espaos entre os nmeros so apenas para facilitar a leitura, mas os nmeros podem ser
lidos com a quantidade de algarismos que se queira.

292

[srA1STiCA Aplic:AdA ~ Ci~NCiAs SociAls

Apt;-,<lict

Tabela 2 Distribuio binomial: probabilidade de cada valor x em funo


de n e n
n

o
1

o
1
2

o
1
2
3

o
1
2
3

4
5

o
1
2
3

4
5
6

o
1
2
3

4
5
6
7

o
1

2
3

4
5
6

7
8

o
l

2
3
4
5

6
7
8

1t

. 0,5

0,5500
0,4500

0,5000
0,5000

0,4225 0,3600
0,4550 0,4800
0,1225 0,1600

0,3025
0,4950
0,2025

0,2500
0,5000
0,2500

0,3430
0,4410
0,1890
0,0270

0,2746
0 ,4436
0,2389
0,0429

0,2160
0 ,4320
0,2880
0,0640

0,1664
0,4084
0 ,3341
0,0911

0,1250
0,3750
0,3750
0,1250

0,3164
0,4219
0,2109
0,0469
0,0039

0,2401
0,4116
0.2646
0,07560,0081

0,1785
0,3845
0,3105
0,1115
0,0150

0,1296
0,3456
0,3456
0,1536
0,0256

0,0915 0,0625
0,2995 0,2500
0,3675 0,3750
0,2005 0,2500
0,0410 0,0625

0,3277
0,4096
0,2048
0,0512
0,0064
0,0003

0 ,2373
0,3955
0,2637
0,0879
0,0146
0 ,0010

0,1681
0,3602
0,3087
0,1323
0,0284
0,0024

0,1160 0,0778
0,3124 0,2592
0,3364 0,3456
0,1811 0,2304
0,0488 0,0768
0 ,0053 0,0102

0 ,0503
0,2059
0,3369
0,2757
0,1128
0,0185

0,0313
0,1563
0,3125
0,3125
0,1563
0,0313

0,2621
0,3932
0,2458
0,0819
0,0154
0,0015
0,0001

0,1780
0,3560
0,2966
0,131'8
0,0330
0 ,0044
0,0002

O, 1176
0,3025
0,3241
0, 1852
0,0595
0,0102
0,0007

0,0754 0,0467
0,2437 0, 1866
0,3280 0,31 10
0,2355 0 ,2765
0 ,0951 0, 1382
0,0205 0,0369
0,0018 0 ,0041

0,0277
0, 1359
0,2780
0,3032
0,1861
0,0609
0 ,0083

0,0 156
0,0938
0,2344
0,3125
0,2344
0 ,0938
0,0156

0,2097
0,3670
0,2753
0,1147
0,0287
0,0043
0,0004

0,1335
0,3115
0,3115
0 , 1730
0,0577
0,0115
0,0013
0,0001

0,0824
0,2471
0,3177
0,2269
0,0972
0,0250
0,0036
0 ,0002

0.0490
0,1848
0,2985
0,2679
0 , 1442
0,0466
0 ,0084
0_,0006

0,0280
0,1306
0,2613
0,2903
0 , 1935
0,0774
0,0172
0 ,0016

0,0152
0,0872
0,2140
0,2918
0,2388
0, 1172
0,0320
0,003 7

0,0078
0,0547
0,1641
0 ,2734
0 ,2734
0 ,1641
0,0547
0,0078

0,1001
0,2670
0,3115
0,2076
0,0865
0,0231
0,0038
0,0004

0,0576
0,1977
0,2965
0,2541
0,1361
0,0467
0,0100
0,0012
0,0001

0,0319 0,0168
0,1373 0,0896
0,2587 0,2090
0,2786 0,2787
0,1875 0,2322
0,0808 0 ,1239
0,0217 0 ,04 13
0,0033 0,0079
0 ,0002 0,0007

0,0084
0,0548
0,1569
0,2568
0,2627
0,1719
0,0703
0,01 64
0,0017

0,0039
0,0313
0,1094
0,2188
0,2734
0,2 188
0 ,1 094
0,0313
0,003_1)_

0,05

0,1

0,15

0,2

0,25

0,3

0,9500
0 ,0500

0,9000
0,1000

0,8500
0,1500

0,8000
0,2000

0,7500
0,2500

0,7000
0,3000

0,6500 0,6000
0,3500 0,4000

0 ,9025
0,0950
0,0025

0,8100
0,1800
0,0100

0.7225
0,2550
0 ,0225

0.6400
0,3200
0,0400

0,5625
0,3750
0,0625

0,4900
0,4200
0,0900

0,8574
0,1354
0,0071
0 ,0001

0,7290
0,2430
0 ,0270
0,0010

0,614 1
0,3251
0 ,0574
0,0034

0,5120
0 ,3840
0,0960
0,0080

0,4219
0,4219
0,1406
0,0156

0,8145
0,1715
0,0135
0,0005
0,0000

0,6561
0,2916
0,0486
0,0036
0,0001

0,5220
0,3685
0,0975
0,0115
0,0005

0,4096
0,4096
0,1536
0,0256
0,0016

0,7738
0,2036
0,0214
O,OOll
0,0000

0,5905
0,3281
0,0729
0,0081
0,0005

0,4437
0,3915
0,1382
0,0244
0,0022
0,0001
0 ,3771
0,3993
0,1762
0,0415
0,0055
0,0004

0,5314

0,7351
0,2321
0 ,0305
0 ,0021
0,0001

0,6983

0,3543
0,0984
0,0146
0,0012
0,0001
0,0000

0,2573
0,0406
0,0036
0,0002
0,0000
0,0000
0,0000

0,4783
0,3720
O, 1240
0,0230
0,0026
0,0002
0,0000
0,0000

0,3206
0,3960
0,2097
0,0617
0,0109
0,0012
0,0001
0 ,0000

0,6634
0 .2793
0,0515
0,0054
0.0004
0,0000
0 ,0000
0,0000
0.0000

0,4305 0,2725
0,3826 0,3847
0,1488 0,2376
0,0331 0,0839
0,0046 0,0185
0,0004 0 ,0026
0,0000 0,0002
0,0000 0,0000
0.0000 0,()000

0,1678
0,3355
0,2936
0,1468
0,0459
0,0092
0,0011
0,0001

0,35

0,4

0,45

o
1

o
1
2

o
l
2
3

o,ss
0,4500
0,5500
0,2025
0,495C
0,3025
0,09 1:
0,33.: !
o.~
0.1~

o,c.-~

1
2
3
4

0,2005
0,36 - 5 0,2995
0,0915

0,0185
0,1128
0,2150,3369
0 .2059
0,0503

1
2
3
4
5

o
l

2
3

4
5
6

0,0083
0,0609
0,1861
0,303'.!
0,2780
0,1359
0,0277

0,0037
0,0320
0,1172
0,2388
0 ,2918
0,2 14-0
0,0872
0,0152

0,001;

1
2
3

4
5
6

1
2
3

4
5

6
7
8

0 ,01~

0,0703
0,1719
0,2627
0,2568
0,1569
0 ,0548
0.008-;

=..o.dA s CiNciA~ Soci1\is

=~a valor x em funo

Tabela 2 Distribuio binomial: probabilidade de cada valor x em funo


de n e n (continuao)
n

0,5000
0,5000

0 ,3025
0,4950
0,2025

0,2500
0,5000
0,2500

0,2160
0,4320
0 ,2880
0 .0640

0,1664
0,4084
0,3341
0,09 11

0;1250
0,3750
0 ,3750
0,1 250

0 .1296
0 .3456
= G.3456
5 0 . 1536
0.0256

0,09 15
0 ,2995
0,3675
0,2005
0 ,0410

0 ,0625
0,2500
0,3750
0,2500
0 ,0625

0.0778
0 2 592
::l,3456
0 ,,2304
G.0768
0.0 102

0,0503
0,2059
0,3369
0,2757
O, 1128
0,0185

0,0313
0, 1563
0,3125
0,3 125
0,1563
0 ,03 13

0.0467

0 ,0277

0,0156

--=

0,4

0,45

0.6000
0 .4000

0,5500
0,4500

0 .3600
0 -4800
0, 1600

1-

0,5

- '.]_;866 0, 1359 0,0938

2
3

o
1

2
3
4
5

o
1

0,0152
0 ,0872
0,2140
0,29 18
0 ,2388
0, 1172
0,0320
0,0037

0,0078
0,0547
0 ,1 64 1
0 ,2734
0,2734
0,1641
0 ,0547
0,0078

~.0 168

0 ,0084
0,0548
0, 1569
0,2568
0,2627
0 , 1719
0,0703
0,0164
0,00 17

0,0039
0 ,0313
0,1094
0 ,2188
0,2734
0,2 188
0,1094
0,0313
0 ,0039

::>,0079
: 0007

o
1
2
3
4

0.0280
'J.1306
32613
G,2903
').1935
'.J.0774
n.0112
..001 6

~ .04 1 3

o
1

ll.1 382
0,0369
'),0041

0.0896
- ,.2090
'J.2787
: .2322
c..1 239

o
1

0,2344
0,3125
0,2344
0,0938
0.0156

~.2765

0 ,2780
0,3032
0,1861
0,0609
0,0083

0.3110

293

ApNdicc

2
3
4
6
6

o
1
2
3
4
5
6
7

o
1

2
3
4
6
6

7
8

1t

0,55

0,6

0,65

0,7

0,75

0,8

0,85

0,9

0,95

0,4500
0,5500

0,4000
0,6000

0,3500
0 ,6500

0 ,3000
0 ,7000

0 ,2500
0 ,7500

0 ,2000
0,8000

0, 1500
0 ,8500

0,1000
0,9000

0,0500
0,9500

0,2025
0,4950
0,3025

0,1600
0,4800
0,3600

0, 1225
0,4550
0,4225

0 ,0900
0 ,4200
0,4900

0,0625
0,3750
0,5625

0,0400
0,3200
0,6400

0 ,0225
0 ,2550
0,7225

0 ,0100
0,1800
0 ,8100

0,0025
0,0950
0,9025

0 ,0911
0,3341
0 ,4084
0, 1664

0,0640
0,2880
0 ,4320
0,2160

0,0429
0,2389
0,4436
0,2746

0,0270
0,1 890
0 ,4410
0,3430

0 ,0 156
0, 1406
0,4 219
0 ,4219

0,0080
0,0960
0,3840
0,5 120

0,0034
0,0574
0,3251
0,6 141

0,0010
0,0270
0,2430
0 ,7290

0,0001
0,0071
0, 1354
0,8574

0,041 0 0,0256
0,2005 0,1536
0,3675 . 0 ,3456
0,2995 0.3456
0,0915 0, 1296

0 ,0150
0 , 1115
0,31 05
0,3845
0 ,1785

0,0081
0,0756
0,2646
0 ,4116
0,2401

0 ,0039
0,0469
0 ,2 109
0,4219
0 ,3164

0,0016
0,0256
0 ,1536
0 ,4096
0,4096

0 ,0005
0,0 115
0 ,0975
0,3685
0,5220

0,0001
0,0036
0 ,0486
0,29 16
0,6561

0,0000
0 ,0005
0 ,0135
0,1715
0 ,8145

0,0185
0, 1128
0,2 757
0 ,3369
0 ,2059
0,0503

0,0102
0,0768
0,2304
0,3456
0 ,2592
0,0778

0,0053
0,0488
o, 18 11
0,3364
0,3124
0 ,J 160

0,0024
0 ,0284
0,1323
0,3087
0,3602
0,1 68 1

0 ,0010
0 ,01 46
0,0879
0.2637
0,3955
0 ,2373

0 ,0003
0,0064
0,05 12
0 ,2048
0,4096
0 ,3277

0,0001
0 ,0022
0,0244
o . 1382
0,3915
0,4437

0 ,0000
0,0005
0,008 1
0,0729
0,328 1
0,5905

0,0000
0,0000
0 ,00 11
0,02 14
0 ,2036
0,7738

0,0083
0,0609
0 ,186 1
0,3032
0,2780
0, 1359
0,0277

0,0041
0 ,0369
0,1 382
0,2765
0,3110
0, 1866
0,0467

0,0018
0,0205
0,0951
0,2355
0 ,3280
0,2437
0,0754

0,0007
0,0102
0,0595
0,1852
0 ,324 1
0,302 5
0 , 1176

0,0002
0,0044
0,0330
0,1318
0 ,2966
0,3560
0,1780

0,0001
0,0015
0,0154
0,0819
0,24 58
0,3932
0,2621

0,0000
0 ,0004
0,0055
0,0415
0,1 762
0,3993
0,377 1

0,0000
0,000 1
0,00 12
0,0 146
0,0984
0,3543
0 ,531 4

0,0000
0,0000
0,00 01
0 ,0021
0 ,0305
0 ,232 1
0 ,7351

0,0037
0,0320
0, 1172
0,2388
0,2918
0,21 40
0,0872
0,0 152

0,00 16
0,0172
0 ,0774
0,1935
0,2903
0,26 13
0, 1306
0 ,0280

0,0006
0 ,0084
0,0466
0, 1442
0,2679
0,2985
0,1848
0 ,0490

0,0002
0,0036
0,0250
0,0972
0,2269
0,3 177
0,247 1
0,0824

0 ,000 1
0,00 13
0,0 115
0,0577
0, 1730
0,3 115
0,3 115
0,1335

0,0000
0,0004
0,0043
0,0287
0 , 1147
0,2753
0,3670
0,2097

0,0000
0,000 1
0,00 12
0,0 109
0,061 7
0 ,2097
0 ,3960
0,3206

0 ,0000
0 ,0000
0 ,0002
0,0026
0 ,0230
0, 1240
0 ,3720
0,4783

0,0000
0,0000
0,0000
0 ,0002
0,0036
0,0406
0 ,2573
0,6983

0,00 17
0,0 164
0,0703
0, 17 19
0,2627
0 ,2568
0, 1569
0,0548
0 .0084

0,0007
0,0079
0 ,0413
O, 1239
0 ,2322
0 ,2787
0,2090
0,0896
0,0168

0,0002
0,0033
0,02 17
0,0808
0 ,1875
0 ,2786
0,2587
0, 1373
0,03 19

0 ,0001
0 ,0012
0 ,0100
0 ,0467
0,1361
0,2541
0,2965
0 ,1977
o 0576

0,0000
0,0004
0,0038
0,0231
0,0865
0,2076
0,3 115
0,2670
o 1001

0,0000
0,000 1
0,0011
0,0092
0 ,0459
0 ,1468
0 ,2936
0,3355
0 ,1678

0,0000
0,0000
0,0002
0,0026
0,0185
0,0839
0,2376
0,3847
0,2725

0 ,0000
0,0000
0,0000
0 ,0004
0,004 6
0,033 1
0,1488
0 ,3826
0,4305

0,0000
0,0000
0,0000
0,0000
0,0004
0,0054
0,0515
0,2793
0 ,6634

294

EsrArsricl\ l\plicMiA s CiNCiAS SociAis

Tabela 2 Distribuio binomial: probabilidade de cada valor xem funo


de n e 1T (continuao)
n ix
9

o
1
2
3
4
5
6

7
8
9

10

o
1
2
3
4
5

6
7
8
9

10
11

o
1
2
3
4
5

6
7
8
9

10
11

12

o
1
2
3
4
5

6
7

8
9

10
11

12

ApN diCE

Tabela 2 Distrib.i2:;
de n e n (continua:'.

1t

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0,45

0,5

0,6302
0,2985
0,0629
0,0077
0,0006
0,0000
0,0000
0,0000
0,0000
0,0000

0,3874
0,3874
0,1722
0,0446
0,0074
0,0008
0,0001
0,0000
0,0000
0,0000

0,2316
0,3679
0,2597
0,1069
0,0283
0,0050
0,0006
0,0000
0,0000
0,0000

0,1342
0,3020
0,3020
0,1762
0,066 1
0,0165
0,0028
0,0003
0,0000

0,0751
0,2253
0,3003
0,2336
0,1168
0,0389
0,0087
0,0012
0,0001
0,0000

0,0404
0,1556
0,2668
0,2668
0,1715
0,0735
0,0210
0,0039
0,0004
0,0000

0,0207
0,1004
0,2162
0,2716
0,2194
0,1181
0,0424
0,0098
0,0013
0,0001

0,0101
0,0605
0,1612
0,2508
0,2508
0,1672
0,0743
0,0212
0,0035
0,0003

0,0046
0,0339
0, 1110
0,2119
0,2600
0 ,2 128
0,1160
0,0407
0,0083
0,0008

0,0020
0,0176
0,0703
0,1641
0,2461
0,2461
0,1641
0,0703
0,0176
0,0020

0,5987
0,3151
0,0746
0.0105
0,0010
0,0001

0,3487
0,3874
0,1937
0,0574
0,0112
0,0015
0,0001
0,0000

0,1969

0,0563
0,1877
0,2816
0,2503
0,1460
0,0584
0,0162
0,0031
0,0004
0,0000

0,0282
0,1211
0,2335
0,2668
0,2001
0,1029
0,0368
0,0090
0,0014
0,0001
0,0000

0,0135
0,0725
0,1757
0,2522
0,2377
0,1536
0,0689
0 ,0212
0,0043
0,0005

0,0060
0,0403
0,1209
0,2150
0,2508
0,2007
0,1115
0,0425
0,0106
0,0016
0,0001

0,0025
0,0207
0,0763
0,1665
0,2384
0,2340
0, 1596
0,0746
0,0229
0,0042
0,0003

0 ,0010
0,0098
0,0439
0,1172
0,2051
0,2461
0,2051
0,1172
0,0439
0,0098
0,0010

0,0198
0,2362 0,1549 0,0932
0,2953 0,2581 0,1998
0,2215 0,2581 0,2568
0,1107 0,1721 0,2201
0,0388 0,0803 0,1321
0,0097 0,0268 0,0566
0,0017 0,0064 0 ,0173
0,0002 0,00ll 0,0037
0,0001 0,0005
0,0000 0,0000 0,0000
0,0000 0,0000

0,0088
0,0518
0,1395
0,2254
0,2428
0,1830
0,0985
0,0379
0,0102
0,0018
0 ,0002
0,0000

0,0036 0,0014 0,0005


0,0266 0,0125 0,0054
0,0887 0,0513 0,0269
0,1774 0,1259 0,0806
0.2365 0,2060 0,1611
0,2207 0,2360 0,2256
0.1471 0,1931 0,2256
0.0701 0,1128 0,1611
0 ,0234 0,0462 0,0806
0,0052 0,0126 0,0269
0,0007 0,0021 0,0054
0,0000 0,0002 0,0005

0,0317
0,1267
0,2323
0,2581
0,1936
0,1032
0,0401
0,0115
0,0024
0,0004
0,0000
0,0000
0,0000 0,0000

0,0057
0,0368
0,1088
0,1954
0,2367
0,2039
0,1281
0,0591
0,0199
0,0048
0,0008
0,0001

0,0022
0,0174
0,0639
0,1419
0,2128
0,2270
0,1766
0,1009
0,0420
0,0125
0,0025
0,0003
0,0000

0,0000
0,0000
0,0000
0.0000
0,5688
0.3293
0,0867
0,0137
0.0014
0,0001

0,0000
0,0000
0,0000
0,0000
0,0000
0,5404
0,3413
0,0988
0,0173
0,0021
0,0002

0.0000
0,0000
0.0000
0,0000
0.0000
0.0000

0,0000
0,0000

0,3138
0,3835
0,2131
0,0710
0,0158
0,0025
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,2824
0,3766
0,2301
0,0852
0,0213
0,0038
0,0005
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0.3~74

0,2759
0,1298
0,0401
0,0085
0,0012
0,0001
0,0000
0,0000
0,0000
0,1673
0,3248
0,2866
0,1517
0,0536
0,0132
0,0023
0,0003
0,0000
0,0000

0,1074
0,2684
0,3020
0,2013
0,0881
0,0264
0 ,0055
0,0008
0,0001


0,0859 0,0422


0,1422 0,0687

0,3012
0,2924
0,1720
0,0683
0,0193
0,0040
0,0006
0,0001

0,2062
0,2835
0,2362
0,1329
0,0532
0,0155
0,0033
0,0005
0,0001
0,0000

0,0000

0,0138
0 ,0712
0,1678
0,2397
0,2311
0,1 585
0,0792
0,0291
0,0078
0,0015
0,0002

0,0000

0,0008
0,0075
0,0339
0,0923
0,1700
0,2225
0,2124
0,1489
0,0762
0,0277
0,0068
0,0010
0,0001

0,0002
0,0029
0,0161
0,0537
0,1208
0,1934
0,2256
0,1934
0,1208
0,0537
0,0161
0,0029
0,0002

to;ss"

n 1X
9-

,_

0,0008
0,0083
0,0407
0 ,1160
0,21 28
0 ,2600
0,2119
0,1110
0,0339
0,0046

1
2
3

4
5

L_
10

8
9

o
1
2

l_

e
L.
11

3
4
5

6
7
8
9

10

o
1
2

L. a

~5

c_: i

-8

9
10

i--:-::_11
12

0,0003
0,0042
0,0229
0,0746
0,1596
0,2340
0,2364
0 .1665
0,0763
0,0207
0,0025
0,0002
0,0021
0,0126
0,0462
0,1128
0,1931
0,2360
0,2060
0,1259
0 ,05 13
0 ,0 125
0 ,0014

OJOOOl
0,0010
0,0068
L_
0,0277
3
4 - Q_,0762
5
0,1489
0,2124
c_6
7
0,2225
c.:__s 0,1700
9
0,0923
- _io 0,0339
11 0 ,0075
12 0,0008
1
2

er

"'d~ s CIl\CIAs SoclAls

295

Ap~NdicE

Tabela 2 Distribuio binomial: proba bilidade de cad a valor x em funo


de n e n (contin u ao)

0,0020
0,0176
0,0703
0,1641
0,2461
0,2461
0, 1641
0,0703
0,0176
0.0020

0,0025
0 ,0207
0,0763
0,1665
0,2384
0,2340
0,1596
0,0746
0.0229
0,0042
0,0003

0,0010
0,0098
0,0439
0,1172
0,2051
0,2461
0,2051
0,1172
0.0439
0,0098
0,0010

10

0036
;)266
:.0887
!774
-.2365
2207
1471
a101
- :>234
::052
.0007

0,0005
0,0054
0,0269
0,0806
O, 1611
0,2256
0,2256
0,1611
0,0806
0,0269
0 ,0054
0,0005

11

cooo

0,0014
0,0 125
0,05 13
0 , 1259
0 ,2060
0,2360
0, 1931
0,1128
0,0462
0,0126
0,0021
0,0002

0022
o 0174
0039
,:.ll9
2128
'...2270
. :-66
: :009
- :J420
0125
1025
::0003
'.)()()0

0,0008
0,0075
0,0339
0,0923
0,1700
0,2225
0,2124
0,1489
0,0762
0,0277
0,0068
0,0010
0,0001

0,0002
0,0029
0,0161
0,0537
0,1208
0,1934
0,2256
0,1934
0,1208
0,0537
0,0161
0.0029
0,0002

12

0,4

0,45

0 ,5

.::no1
:;.0605
:. 1612
:'.:.2508
- 2508
D 1672
0743

0,0046
0,0339
0,1110
0,2119
0,2600
0,2128
0,1160
0,0407
0,0083
0,0008

~.0212

::>035
0003

2007
1115
0425

0106
0016
0001

2
3

4
5
6
7
8
9

1t

0,55

0,6

0 ,65

0 ,7

0,75

0,8

0,85

0,9

0 ,95

OJ0008
0,0083
0,0407
0 ,1160
0,2 128
0,2600
Q,2 119
0,1110
0,0339
0,0046

0,0003
0,0 03 5
0,0212
0 ,0743
0, 1672
0,2508
0,2508
0,1612
0,0605
0,0101

0 ,000 1
0,0013
0,0098
0,0424
0,1181
0,2194
0,2716
0,2162
0,1004
0,0207

0,0000
0,0004
0,0039
0,0210
0,0735
0,1715
0,2668
0,2668
0,1556
0 ,0404

0 ,0000
0,0001
0,00 12
0,0087
0,0389
0,1168
0,2336
0,3003
0,2253
0,0751

J
0,0000
0,0003
0,0028
0,0165
0,066 1
OJ17 62
0,3020
0,3020
0,1342

0,0000
0,0000
0,0000
0,0006
0 ,0050
0,0283
0, 1069
0,2597
0 ,3679
0,2316

0,0000
0,0000
0, 0000
0 ,0001
0, 0008
0,0074
0,0446
0,1 722
0 ,3874
0,3874

0,0000
0,0000
0,0000

0, 0000
0,0006
0,0077
0,0629
0,2985
0,6302

0,0003
0,0042
0,0229
00746
0,159.Q
0 ,2349

0,0001
0,0016
0,0106
0,0425
0,ll 15
0,2007

0,0000
0,0001
0,0014
0,0090
0,0368
0,1029
0,2001
0,2668
0,2335
0,1211
0,0282

0,0000
0,0004
0,0031
0,0162
0,0584
0 ,1460
0,2503
0,2816
0,1877
0,0563

0,0000
0,0000
0,0001
0,0008
0,0055
0,0264
0,0881
0,2013
0,3020
0,2684
0,1074

0,0000
0,0000

0,0001
0,0012
0,0085
0,0401
0,1298
0,2 759
0 ,3474
0,1969

0,0000
0,9000
0,0000
Q,0000
0,0001
0,9015
0,0112
0 0 574
0,1937
03874
0,3487

0,0000
0,0000
. 0,0000
0,0000

0,0001
0,0010
0,0105
0,0746
0 ,31 51
0,5987


0 ,0000
0,0000
0,0000

o 0003
0 ,0025
0,0158
0,07 10
o 2 13 1
0 ,3835
..Qd 138

0 ,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,000 1
0,001 4
0,0 137
0,0867
0,3293
o 5688

0 ,0000
0,0000
o 0000
0,0000
o 0000
0,0000
0 ,0005
0,0038
0,02 13
0,0852
0 ,2301
0,3766
0 ,2824

0,0000

0,0000
0 ,0000
0,0000

0,0000
0,0002
0,002 1
0,0173
0,0988
0,3413
0 ,5404

0,~384

0,2508-'

0 ,1665
0,0763
0, 0207
0,0025

0 ,2 150
0,1209
0,0403
0,0060


0,0005
0,0043
0,0212
0,0689
0,1536
0,2377
0,2522
0,1757
0,0725
0,0 135

0,0002
0 ,002 1
0,0126
0,0462
0 ,1128
0,1931
0 ,2360
0 ,2060
0,1259
0,0 513
0,0 125
0 ,0014

0 ,0000
0,0007
0,0052
0,0234
0,0701
0, 147 1
0,2207
0 ,2365
0, 1774
0 ,0887
0,0266
0 ,0036

0,0002
0,0018
0,0102
0,0379
0,0985
0,1830
0,2428
0,2254
0,1395
0,0518
0,0088

0,0000
0,0005
0 ,0037
0,0 173
0 ,0566
0,1321
0,2201
0,2568
0,1998
0,0932
0,0198

0,0000
0,0000
0,000 1
0,0011
0,0064
0,0268
0,0803
o, 172 1
0,2581
0,2581
0,1549
0,0422

0 ,0000
0,0000
0 ,0000
0,0002
0 ,0017
0,0097
0,0388
0, 1107
0,22 15
0,2953
0,2362
0 ,0859

0,0001
0,0010
2
0, 0068
0,0277
3
4
0,0762
0,148 9
5
6 .Q,2124
0 ,2225
7
8
0 , 1700
9
0,0923
10 OJ0339
11 0,0075
12 0 ,0008

0 ,0000
0,0003
0 ,0025
0,0125
0,0420
0,1009
0 , 1766
0,2270
0,2128
0,1419
0 ,0639
0,0174
0 ,0022

0,0000
0,0001
0,0008
0,0048
0,0199
0,0591
0,1281
0,2039
0,2367
0,1954
0,1088
0,0368
0,0057

0,0000

0,0002
0,0015
0,0078
0,0291
0,0792
0,1585
0,2311
0,2397
0,1678
0,0712
0,0138

0,0000
0,0004
0,0024
0 ,0115
0,0401
0,1032
0,1936
0,2581
0,2323
0,1267
0,0317

0,0000
0,0000
0,0000
0,0001
0,0005
0,0033
0,0155
0,0532
0,1329
0,2362
0,2835
0,2062
0,068 7

1
2
3

4
5
6
7
8

10

o
1
2

3
4
5
6
7

8
9
10
11

o
1

0,0000
0,0000
o 0000
0,0000
0,0001
0,0006
OJ0040
0,0193
0,0683
0,1720
0,2924
0,301 2
0,1422

296

EsrArisricA Aplic.o.dA s CiNCiAs SociAis

Tabela 2 Distribuio binomial: probabilidade de cada valor x em funo


de n e n (continuao)
1t

n I

13

1 0,05 1 0,1

1
2
3

1
5
6
7

8
9
10
11
12
13
14

o
1
2
3
4
5

6
7

8
9
10
11
12
13
14
15

o
1
2
3
4

5
6
7

8
9
10
11

12
13
14
15

1 0,15 1 0,2

1 0,25 1 0,3

1 0,35 1 0,4

0,45

0,5

ApNdice

Tabela 2 Distri1J':-.__:,;, .
de n e n (continua~.....-::;"

nlxh:ss

0,5133
0,3512
0, 11 09
0,02 14
0,0028
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0, 0000
0 ,0000

0,2542
0,3672
0,2448
0,0997
0,0277
0 ,0055
0,0008
0,0001
0,0000
0,0000
0,0000
0,0000
0, 0000
0 ,0000

0,1209
0,2774
0,2937
0,1900
0,0838
0,0266
0,0063
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000
0 ,0000

0,0550
0,1787
0,2680
0,2457
0,1535
0,069 1
0,0230
0,0058
0,0011
0,0001
0,0000
0,0000
0,0000
0,0000

0,0238 0 ,0097
0 , 1029 0,0540
0,2059 0,1388
0,2517 0,2181
0,2097 0,2337
0,1258 0,1803
0,0559 0,1030
0,0186 0 ,0442
0,0047 0,0142
0,0009 0,0034
0,0001 0,0006
0,0000 0,0001
0,0000 0,0000
0,0000 0,0000

0 ,0037
0 ,0259
0,0836
0,1651
0,2222
0,2154
0 , 1546
0,0833
0,0336
0,0 10 1
0,0022
0,0003
0,0000
0,0000

0,0013
0,0 113
0,0453
0,1107
o, 1845
0,2214
0 ,1968
0, 13 12
0,0656
0,0243
0,0065
0 ,0012
0,0001
0 ,0000

0,0004
0,0045
0,0220
0,0660
0,1350
0,1989
0,2 169
0, 1775
0,1089
0,0495
0,0162
0,0036
0,0005
0,0000

0,0001
0,0016
0,0095
0,0349
0,0873
0,1571
0,2095
0 ,2095
o, 1571
0,0873
0,0349
0,0095
0,0016
0,000 1

13

0,4877
0,3593
0,1229
0,0259
0,0037
0,0004
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

0,2288
0,3559
0,2570
0,1142
0 ,0349
0,007 8
0,0013
0,0002
0,0000
0,0000
0,0000
0,0000
0 ,0000
0,0000
0,0000

0, 1028
0,2539
0,2912
0 ,2056
0 ,0998
0,0352
0 ,0093
0,0019
0,0003
0,0000
0,0000
0,0000
0 ,0000
0,0000
0,0000

0,0440
0,1539
0,2501
0,2501
0,1720
0,0860
0,0322
0,0092
0,0020
0,0003
0,0000
0,0000
0,0000
0,0000
0,0000

0,0178 0,0068
0,0832 0,0407
0,1802 0,11 34
0_,2402 0 ,1943
0 ,2202 0,2290
0, 1468 0, 1963
0 ,0734 0, 1262
0,0280 0,0618
0,0082 0,0232
0,0018 0,0066
0,0003 0,0014
0,0000 0,0002
0 ,0000 0,0000
0,0000 0,0000
0,0000 0,0000

0,0024
0,0181
0,0634
0, 1366
0 ,2022
0 ,2178
0 ,1759
0 ,1082
0 ,0510
0,0183
0,0049
0,0010
0 ,0001
0,0000
0,0000

0,0008
0 ,0073
0,0317
0,0845
0,1549
0,2066
0 ,2066
0,1574
0,0918
0,0408
0,0 136
0,0033
0,0005
0,0001
0,0000

0,0002
0,0027
0,0141
0 ,0462
0,1040
0,1701
0,2088
0,1952
0,1398
0,0762
0,03 12
0,0093
0,00 19
0 ,0002
0,0000

0,0001
0,0009
0 ,0056
0 ,0222
0,0611
0,1222
0,1833
0,20950 , 1833
0 ,1 222
0 ,0611
0,0222
0,0056
0 ,0009
0,0001

14

0,4633 0,2059 0,0874


0,3658 0,3432 0,2312
0, 1348 0,2669 0,2856
0,0307 0 ,1285 0,2 184
0,0049 0,0428 0, 11 56
0,0006 0,0105 0,0449
0,0000 0,0019 0 ,01 32
0,0000 0,0003 0,0030
0,0000 0,0000 0 ,0005
0,0000 0,0000 0,0001
0,0000 0,0000 0,0000
0, 0000 0,0000 0,0000
0,0000 0,0000 0,0000
0,0000 0,0000 0,0000
0,0000 0,0000 0,0000
0,0000 0,0000 0,0000

0,0352
0,1319
0,2309
0,2501
0,1876
0,1032
0,0430
0,0138
0,0035
0,0007
0 ,0001
0 ,0000
0,0000
0,0000
0,0000
0,0000

0,0134
0,0668
0, 1559
0 ,2252
0,2252
0,1651
0 ,0917
0,0393
0,0131
0,0034
0,0007
0,0001
0,0000
0,0000
0,0000
0,0000

0 ,0016
0,0 126
0,0476
0,ll 10
0,1792
0,2123
0_1906
O, 1319
0 ,0710
0,0298
0,0096
0,0024
0,0004
0,0001
0,0000
0,0000

0,0005
0,0047
0,0219
0,0634
0,1268
0,1 859
0,2066
0,1771
0,1181
0,0612
0 ,0245
0,0074
0,0016
0,0003
0,0000
0,0000

0,0001
0,0016
0,0090
0,0318
0,0780
0,1404
0,1914
0,2013
0,1647
0,1048
0,0515
0 ,0 19 1
0 ,0052
0,0010
0,0001
0 ,0000

0 ,0000
0,0005
0,0032
0,0139
0 ,0417
0,0916
0, 1527
0,1964
0 ,1964
0,1527
0,0916
0,0417
0,0139
0,0032
0,0005
0,0000

o_,oooo

0,0000

0 ,0047
0,0305
0,0916
0,1 700
0,2186
0,2061
0, 1472
0,0811
0,0348
0,0116
0,0030
0,0006
0,0001
0,0000
0,0000
0,0000

o
1
2
3

4
5

7
8
9
10
11

12
13

0,0~5

0,0000
0,0002
0,0019
0 ,0093
0,0312
0,076 2
0, 1398
0,1952
0,2088
0,1 70:
0 ,1040
0,0462
0,0 14:
0,002;
0,0002

1
2

3
4
5
6
7

8
9
10
11
12
13
14
15

0,0000
0,0005
0,0036
0,0 162
0,0495
0,1089
0 ,1775
0,2169
0 , 1989
0,1 350
0,0660
0,0220

o
1
2
3
4
5
6
7

8
9
10
11

12
13
14
15

o.o~

0,0 000
O,OOOl
O,OOiO
0 ,0052
0 ,019 :
0,0515
0,1 048
0,16~-

0,20 13
0 , 191<;
0 , 14().!
0 ,0780
0,03 18
0,0090
0,0016

o.ooo:

-- -

....

,_

~!:li

~ ~ CifNcii>.~ Soc iAis

~ alor

0,4

x em funo

0,0001
0 ,0016
0,0095
0 ,0349
0,0873
0 , 1571
0,2095
0,2095
0,1571
0,0873
0,0349
0 ,0095
0 ,0016
0 ,0001

13

0,0002
0,0027
0.0141
0,0462
0,1040
0,1701
0,2088
0, 1952
0,1398
0,0762
0 ,0312
0,0093
0 ,00 19
0 ,0002
0,0000

0 ,0001
0,0009
0.0056
0,0222
0,0611
0,1222
0, 1833
0 ,2095
0, 1833
0,1222
0,0611
0,0222
0 ,0056
0 ,0009
0,0001

14

0,0001
0 ,00 16
0,0090
0,0318
0,0780
0,1404
0 , 1914
0,2013
0,1647
0, 1048
0 ,0515
0,0191
0 ,0052
0,0010
0 ,0001
0,0000

15

0,0005
0 ,0032
0,0139
0 ,0417
0,0916
0, 1527
0,1964
0 , 1964
0 , 1527
0 ,0916
0,0417
0 ,0139
0 ,0032
0 ,0005

05

0.0000

0,0004
0,0045
0,0220
0,0660
0,1350
0, 1989
0,2169
0,1775
0,1089
0 ,0495
0 ,0162
0 ,0036
0 ,0005
0,0000

(, 0008
- J073
: 03 17
_ 0845
:},1549
-.2066
:!.2066
- :574
::.0918
0408
::: 0 136
::;0033
J.0005
0001
0.0000
0.0005
v,0047
0.0219

0065
,001 2

...001

0.0634

!l.1268
'::1859
0 .2066
.-.1771
0.1181

0.0612

0.0245
"0074
0.0016
0,0003
0.0000
0 ,0000

Tabela 2 Distribuio binomial: probabilidade de cada valor xem funo


de n e rc (continuao)
n

0,45

29/

ApNdiCE

1
2

3
4
5
6

7
8

9
10
11

12
13

o
1
2
3

4
5
6

7
8
9

10
11
12
13

14

o
1
2
3

4
5
6
7

8
9

10
11
12
13

14
15

1t

0,55

0 ,6

0 ,65

0,7

0 ,75

0 ,8

0,85

0,9

0,95

0,0000
0,0005
0,0036
0,0162
0,0495
0,1089
0, 1775
0,2169
0,1989
0,1350
0,0660
0,0220
0,0045
0,0004

0,0000
0,0001
0,0012
0,0065
0,0243
0,0656
0,1312
0,1968
0,2214
0,1845
0 , 1107
0,0453
0,0113
0,0013

0,0000
0,0000
0,0003
0,0022
0,0101
0,0336
0,0833
0, 1546
0,2154
0 ,2222
0,1651
0 ,0836
0,0259
0,0037

0,0000
0,0000
0,0001
0 ,0006
0,0034
0,0142
0,0442
0,1030
0, 1803
0,2337
0,2181
0 ,1388
0,0540
0 ,0097

0,0000
0,0000
0,0000
0,0001
0,0009
0,0047
0,0186
0,0559
0,1258
0,2097
0 ,2517
0 ,2059
0 , 1029
0,0238

0,0000
0,0000

0,0000
0,0000
0,0000
0 ,0000
0,0000
0,0001
0,0011
0,0063
0,0266
0,0838
0,1900
0,2937
0,2774
0,1209

0 ,0000
0,0000
0,0000

0,0000
0,0000
0,0000

0,0000
0,0002
0,0019
0,0093
0 ,0312
0,0762
0,1398
0,1952
0 ,2088
0,170 1
0, 1040
0,0462
0 ,0 141
0,0027
0 ,0002

0,0001
0,0005
0,0033
0,0136
0,0408
0,0918
0 ,1574
0,2066
0 ,2066
0,1549
0,0845
0,03 17
0,0073
0,0008

0,2022
0,1366
0,0634
0,0 181
0,0024

0,2290
0,1943
0, 1134
0 ,040 7
0,0068

0,2202
0,2402
0 ,1802
0,0832
0,0178

0,1720
0,250 1
0,2501
0, 1539
0 ,0440

0,0000
0,0001
0,0010
0,0052
0,0191
0,0515
0,1048
0,1647
0,2013
0,1914
O, 1404
0,0780
0,0318
0,0090
0,0016
0,0001

0,0000
0,0000
0,0003
0,0016
0,0074
0,0245
0,0612
o, 118 l
0,1771
0,2066
0, 1859
0,1268
0 ,0634
0,0219
0,0047
0,0005

0 ,0000
0,0000
0,0001
0,0004
0,0024
0,0096
0,0298
0,0710
0,1319
0,1906
0,2123
0,1792
0,1110
0,0476
0,0126
0,0016

0,0000
0,0000
0 ,0000
0,0001
0,0006
0,0030
0 ,0116
0,0348
0 ,0811
0 , 1472
0,2061
0,2186
0 , 1700
0 ,0916
0,0305
0,0047

0,0000
0,0000
0,0000
0,0000
0 ,0001
0,0007
0,0034
0,0131
0 ,0393
0,0917
0, 1651
0,2252
0 ,2252
0, 1559
0,0668
0.0134

0,0000
0,0000
0,0000

0,0000
0,0000 0,0000

0,0001
0,0011
0,0058
0,0230
0,0691
0,1535
0,2457
0,2680
0,1787
0,0550

0,0000

0,0000

0,0001
0,0008
0,0000

0,0000

0,0055
0,0277
0,0997
0,2448
0,3672
0,2542

0,0003
0,0028
0,0214
0, 1109
0.3512
0,5133

0 ,0000
0,0000
0,0000

0,0000
0,0000
0,0000
0,0000

0,0001 0
,0000

0,0010 0,0002 0,0000


0,0000
0,0000
0,0000
0,0049 0,0014 0,0003
0,0000

0,0183 0,0066 0,0018 0,0003


0,0000
0,0000

0,0510 0,0232 0,0082 0 ,0020 0,0003



0,1082 0,0618 0,0280 0 ,0092 0,0019 0,0002

0,1759 0 , 1262 0,0734 0,0322 0,0093 0,00 13


0,0000
0,2178 0,1963 0,1468 0,0860 0,0352
0 ,0998
0,2056
0,29 12
0,2539
0, 1028

0,0000

0,0001
0,0007
0,0035
0,0138
0,0430
0 , 1032
0, 1876
0 ,250 1
0,2309
0, 1319
0,0352

0,0000
0,0001
0,0005
0,0030
0,0132
0,0449
0 , 1156
0,2184
0,2856
0,2312
0,0874

0,0078
0,0349
0, 1142
0,2570
0,3559
0,2288

0,0004
0,0037
0,0259
0, 1229
0,3593
0 ,4877

0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0003
0,0019
0,0105
0 ,0428
0, 1285
0,2669
0,343 2
0,2059

0,0000
0,0000
0,0000
0.0000
0,0000
0.0000
0.0000
0.0000
0.0000
0,0000
0,0006
0,0049
0,0307
0, 1348
0,3658
0,4633

298

E~rArsricA

AplicAdA As CiNCiAs SociAis

Tabela 4

Tabela 3 Coeficientes binomi<Us


n

(~)

1
1

(;) (;) (;) (:) (~) (:) (;) (;)

(~)

3
6

1
4

5
6
7
8
9

10
15
21
28
36

10
20
35
56
84

5
15
35
70
126

6
21
56
126

1
7
28
84

1
8
36

1
9

10

12
13
14

45
55
66
78
91

120
165
220
286
364

210
330
495
715
1001

252
462
792
1287
2002

210
462
924
1716
3003

120
330
792
1716
3432

45
165
495
1287
3003

10
55
220
7 15
2002

1
11
66
286
1001

1
1
1
1
1

15
16
17
18
19

105 455
120 560
136 680
153 816
171 969

1365 3003 5005


1820 4368 8008
2380 6188 12376
3060 8568 18564
3876 11628 27132

6435
11440
19448
31824
50338

6435
12870
243 10
43758
75582

5005
11440
243 10
48620
92378

3003
8008
19448
43758
92378

20 1 1

20

190 1140 4845 15504 38760

77520

125970 167960

184756

3
4

5
6
7
8
9

1
1

10

1
1
1

11

12
13
14

1
1

11

Distrib~l

(1~)

1
2
3
4

ApNdiCE

0,0
0,1
0,2
0,3
0,4

0,5000 0.0,4602
0,4207 o~
o,3821 e >:
0,3446 o*

0,5
0,6
0,7
0,8
0,9

0,3085
0,2143
0,2420
0,2119
O, 1841

o
:
e

cc __

O !S.-

1,0
-1,1
1,2

15
16
17
18
19

1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1

,~

2 ,2
2,3

2,4
2,5
2,6

2,7
2,8
2,9
3,0
3,5
4,0
4,5
5,0

0,00135

ooo .;so.ooo
233 0,000 031
003 .!{;

~ 3.s CiNciAs SociAis

299

Ap Ndic E

Tabela 4 Distribuio normal padro

Ar e a
tabu lad a

fn)
\9

10
55
2 20
7 15
2002

11
66
286
1001

50 05
11 440
243 10
48620
92378

3003
8008
19448
43758
92378

167960

184756

2
0 ,4920
0,4522
0,4 129
0,374 5
0,3372

segunda decimal de z
3
4
5
6
0 ,4880 0,4840 0,480 1 0,4761
0,4483 0, 4443 0,4404 0,4364
0,4090 0,4052 0,4013 0,3974
0,3707 0,3669 0,3632 0,3594
0 ,3336 0,3300 0,3264 0,3228

7
0,4721
0 ,4325
0,3936
0,3557
0,3192

0,5000
0,4602
0,4207
0,3821
0,3446

1
0,4960
0,4 562
0,4168
0,3783
0,3409

0,4681
0,4 286
0,3897
0,3520
0 ,3156

0 ,4641
0,4247
0,3859
0,3483
0,3 121

0,5
0,6
0 ,7
0,8
0,9

0,3085
0,2743
0,2420
0,2119
0, 184 1

0,3050
0,2709
0,2389
0,2090
0,1814

0,3015
0, 2676
0,2358
0,206 1
0, 1788

0,298 1
0,2643
0,2327
0,2033
0, 1762

0 ,2946
0,261 1
0 ,2296
0,2005
0,1736

0 ,2912
0,2578
0,2266
0,1977
0, 171 ]

0,2877
0,2546
0,2236
0, 194 9
0,1685

0,2842
0,2514
0 ,2206
0,1922
0,1660

0,2810
0,2483
0,2177
0, 1894
0 ,1635

0,2776
0,2451
0,2148
0,1867
0, 1611

1,0
1,1
1,2
1,3
1,4

0 , 1587
0,1357
0,1151
0,0968
0,0808

0,1562
0,1335
0,1131
0,0951
0,0793

0 , 1539
0, 1314
0,1 112
0,0934
0,0778

0,1515
0 , 1292
0,1093
0,0918
0,0764

0 ,1492
0,1271
0, 1075
0,0901
0 ,074 9

0, 1469
0, 125 1
0, 1056
0,0885
0 ,0735

0, 1446
0, 1230
0,1038
0,0869
0,0722

0 ,1423
0,1210
0,1020
0,0853
0,0 708

0,1401
0,1190
0,1003
0,0838
0,0694

0,1379
0,1170
0,0985
0,0823
0,0681

1,5
1,6
1,7
1,8
1,9

0,0668
0,0548
0,0446
0 ,0359
0,0287

0,0655
0,0537
0,043 6
0,0352
0,0281

0,064 3
0,0526
0,0427
0 ,0344
0,0274

0,0630
0,0516
0,0418
0,0336
0,0268

0 ,0618
0,0505
0,0409
0,0329
0,0262

0 ,0606
0,0495
0,040 1
0,0322
0 ,0256

0,0594
0,0485
0 ,0392
0,03 14
0,0250

0 ,0582
0,0475
0,0384
0,0307
0,0244

0,0571
0,0465
0 ,0375
0,0301
0,0239

0,0559
0 ,0455
0,0367
0,0294
0,0233

2,0
2,1
2, 2
2,3
2,4

0,0228
0,0179
0,0139
0,0107
0,0082

0,0222
0,0174
0,0136
0,0104
0,0080

0,0217
0,017 0
0,0132
0 ,0102
0,0078

0,02 12
0,0166
0,0 129
0 ,0099
0,0075

0,0207
0,0162
0 ,0125
0,0096
0,0073

0,0202
0,0158
0 ,0122
0,0094
0,007 1

0,0197
0,0154
0,0119
0,0091
0,0069

0,0192
0,0150
0,0116
0,0089
0,0068

0 ,0188
0,0 146
0,0113
0,0087
0,0066

0 ,0183
0,0143
0,0110
0,0084
0,0064

2 ,5
2,6
2 ,7
2,8
2,9

0 ,0062
0,0047
0,0035
0,0026
0,0019

0,0060
0,0045
0,0034
0,0025
0,0018

0,0059
0,0044
0,0 033
0,0024
0,0017

0,0057
0, 0043
0,0032
0,0023
0,00 17

0,0055
0, 0041
0,0031
0,0023
0,0016

0,0054
0,0040
0,0030
0,0022
0 ,0016

0,0052
0,0039
0,0029
0,0021
0,0015

0,0051
0,0038
0 ,0028
0,0021
0 ,0015

0,0049
0,0037
0,0027
0,0020
0,00 14

0,0048
0,0036
0,0026
0 ,00 19
0 ,0014

3,0
3,5
4,0
4,5
5,0

0,00135
0,000 233
0,000 031 7
0,000 003 40
0,000 000 287

z
0,0
0,1
0,2
0,3
0,4

700

EsTA1b 1icA AplicAdA s Cir-.ciAs SociAis

Tabela 5 Distribuio t de Student

Tabela 6 Distri!:n'" i.:::

0,25

0,10

0,05

1
2
3
4
5
6
7
8
9
10

1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,682
0,681
0,680
0,679
0,674

3,078
1,886
1,638
1,533
1,476
1,440
1,4 15
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,306
1,303
1,301
1,299
1,282

6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,690
1,684
1,679
1,676
1,645

11

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
z

r (V11lor u.bulado)

rea na cauda su erior


0,01
0,005
0,025
12,71
31,82 63,66
4,303
6,965 9,925
3,182
4,541
5,841
2,776
3,747 4,604
r 2,511 3,365 4,032
2,447
3,143 3,707
1 2,365
2,998 3,499
2,306
2,896 3,355
3,250
2,262 1 2,821
2,228
2,764 3,169
1 2,201 2,718 3,106
2,179
2,681 3,055
1 2,160 2,650 3,012
2,145
2,624
2,977
1 2,131 ~ 2,602 2,947
2,120
2,583
2,921
2.110 ~ 2,567
2,898
2,101
2,552
2,878
2,093 i 2,539
2,861
2,845
2,086
2,528
1 2,080 1 2,518 2,831
2,074
2,508 2,819
2,069 1 2,500 2,807
2,064
2,492 2,797
2,060 1 2,485 2,787
2,056
2,479
2,779
2,052
2,473
2,771
2,467
2,763
2,048
2,045
2,462
2,756
2,042
2,457
2,750
1 2,030 2,438 2,724
2,021
2,423 2,704
1 2,014 2,412 2,690
2,009
2,403 2,678
1,960 2,326 2,576

l
l

Nota: A coluna em destaque a mais usada.

ApeNdlcc

0,0025

0,00 1

0,0005

gl

127,3
14,09
7,453
5,598
4,773
4,317
4,029
3,833
3,690
3,581
3,497
3,428
3,372
3,326
3,286
3,252
3,222
3,197
3,174
3,153
3,135
3,119
3,104
3,091
3,078
3,067
3,057
3,047
3,038
3,030
2,996
2,971
2,952
2,937
2,807

318,3
22,33
10,21
7,173
5,894
5,208
4,785
4,501
4,297
4,144
4,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,340
3,307
3,281
3,261
3,090

636,6
31,60
12,92
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4 ,0 15
3,965
3,922
3,883
3,850
3,8 19
3,792
3,768
3,745
3,725
3,707
3,689
3,674
3,660
3,646
3,591
3,551
3,520
3,496
3,291

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
100

1 0,25
1,32
2,77
4,11
5,39
6,63
7,84
9,04
10,22
11,39
12,55
13,70
14,85
15,98
17,12
18,25
19,37
20,49
21,60
22,72
23,83
24,93
26,04
27,14
28,24
29,34
30,43
31,53
32,62
33,71
34,80
40,22
45,62
50,98
56,33
109,l

.c.\CIA s CiNCiAs So c iAis

JOI

ApNdic E

Tabela 6 Distribuio qui-quadrado


rea indicada

./
0 ,00 1 10,0005

:: 598

--;3
- 3: 7
-.'.;29
&33
: 590

- 581
-~97

- - 28

.:..3:-2
: :.26

:.286
..:52
.222

:97
- :14

: 53
- :35
- :~9
- i.04

- -91
- :'78
~7

- -57

- :~7
- :138
- _,3()

_ 996
_ 9; 1

2..952
937
.:..807

318,3
22,33
10,21
7,173
5,894
5,208
4,785
4,501
4,297
4, 144
4,025
3 ,930
3,852
3,787
3,7 33
3 ,686
3,646
3,6 10
3 ,579
3,552
3 ,527
3,505
3,485
3,467
3,450
3,435
3,421
3 ,408
3,396
3,385
3,340
3,307
3,281
3,261
3,090

636,6
31,60
12 ,92
8,610
6,869
5,959
5,408
5,041
4,78 1
4,587
4,437
4,3 18
4,221
4, 140
4,073
4,0 15
3,965
3,922
3 ,883
3,850
3 ,819
3 ,792
3,768
3,745
3,725
3 ,707
3,689
3,674
3 ,660
3,646
3,59 1
3,55 1
3,520
3,496
3,291

J'.' (Valor tabulado)

rea na cauda su erio:


gl

0 ,25

0,1 0

0,05

0,025

0,0 1

0,005

0,0025

0,001

0,0005

1
2
3
4
5
6
7
8
9
10

1,32
2,77
4,11
5 ,39
6,63
7 ,84
9,04
. 10,22
11,39
12 ,55
13,70
14 ,85
15,98
17,12
18,25
19,37
20, 49
2 1,60
22,72
23,83
24 ,93
26,04
27,14
28,24
29,34
30, 43
31,53
32,62
33,71
34,80
40, 22
45,62
50,98
56,33
109,l

2,71
4,6 1
6,25
7 ,78
9,24
10,64
12 ,02
13,36
14,68
15,99
17, 28
18,55
19,81
2 1,06
22,31
23,54
24,77
25,99
27,20
28,41
29,62
30 ,8 1
32,01
33,20
34,38
35,56
36,74
37,9 2
39,09
40,26
46,06
51,81
57,5 1
63,17
11 8,5

3,84
5,99
7,81
9 ,49
11,07
12,59
14,07
15,51
16,92
18,31
19,68
21 ,03
22,36
23,68
25,00
26,30
27 ,59
28,87
30,14
31,41
32,67
33,92
35, 17
36,42
37,65
38,89
40, 11
41,34
42, 56
43,77
49,80
55,76
6 1,66
67,50
124,3

5,02
7,38
9,35
11, 14
12,83
14,45
16,01
17,53
19,02
20,48
21,92
23,34
24,74
26,12
27,49
28,85
30,19
31,53
32,85
34 ,17
3 5,48
36,78
38,08
39,36
40,65
41,92
43,19
44, 46
45,72
46,98
53,20
59,34
65, 41
71,42
129,6

6,63
9 ,21
11,34
13,2 8
15,09
16,8 1
18,48
20,09
21,67
23,21
24 ,73
2 6,22
27,69
29, 14
30,58
32,00
33,4 1
34,81
36, 19
37,57
38,93
40,29
4 1,64
42,98
44,31
45 ,64
46,96
48,28
49,59
50,89
57,34
63,69
69,96
76, 15
135,8

7 ,88
10,60
12,84
14,86
16,75
18,55
20,28
2 1,95
23,59
25, 19
26,76
2 8,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
4 1,40
42,80
44, 18
45, 56
46,93
48, 29
49,65
50,99
52,34
53,67
60,27
66,77
73,17
79,49
140 ,2

9 , 14
11 ,98
14,32
16,42
18,39
20, 25
22,04
23,77
25,46
27, 11
28,73
30,32
3 1,88
33,43
34,95
36, 46
37,95
39,42
40,88
42,34
43,77
45,20
46,62
48,03
49,44
50,83
52,22
53,59
54,97
56,33
63,08
69,70
76, 22
82,66
144,3

10,83
13,82
16,27
18, 47
20,5 1
22, 46
24,32
26, 12
27,88
29,59
3 1,26
32,91
34,53
36, 12
37,70
39,25
40,79
42,3 1
43 ,82
45,3 1
46,80
48,27
49 ,73
51, 18
52,62
5 4,05
55,48
56,89
58,30
59,70
66,62
73 ,40
80,08
86,66
149,4

12, 12
15,20
17,73
20,00
22, 11
24, 10
26,02
27,87
29,67
31,42
33,14
34,82
36, 48
38, 11
39,72
4 1,31
42,88
44,43
45,97
47,50
49,01
50,51
52,00
53,48
54,95
56,41
57,86
59,30
60,73
62,16
69,20
76, 10
82,87
89,56
153,2

11

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
100

Nota: A coluna em destaque a mais usada.

~02

EsrArsricA AplicAdA s Ci~'ciA<> SocAis

ApNdiCE

Tabela 7 Valor absoluto minimo para o coeficiente de correlao r de


Pearson ser significativo

Tabela

Nvel de significncia, a., num teste unilateral


0,100

0,050

0,200
0,687
.0,608
0,551
0,507
0,472
0,443
0,419
0,398
0,380
0,365
0,35 1
0,338
0,327
0,317
0,308
0,299
0,29 1
0,284
0,277
0,271
0,265
0,260
0,255
0,250
0,245
0,241
0,222
0,207
0,195
0,184
0,168
0,155
0,145
0,136
0, 129

0,100
0,805
0,729
0,669
0,621
0,582
0,549
0,521
0,497
0,476
0,458
0,441
0,426
0,412
0,400
0,389
0,378
0,369
0,360
0,352
0,344
0,337
0,330
0,323
0,317
0,311
0,306
0,283
0,264
0,248
0,235
0,214
0, 198
0,185
0, 174
0,1 65

0,025

0 ,010

0,0 0 5

0,100

0,0 01

Nvel de significncia, a , num teste bilateral

n
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

0,050
0,878
0,811
0,754
0,707
0,666
0,632
0,602
0,576
0,553
0,532
0,514
0,497
0,482
0,468
0,456
0,444
0,433
0,423
0,413
0,404
0,396
0,388
0,381
0,374
0,367
0,361
0,334
0,3 12
0 ,294
0,279
0,254
0,235
0,220
0,207
0,197

0,020
0,934
0,882
0,833
0,789
0,750
0,715
0,685 .
0,658
0 ,634
0,612
0,592
0,574
0,5 58
0,543
0,529
0,516
0,503
0,492
0,482
0,472
0,462
0,453
0,44 5
0,437
0,430
0,423
0,392
0 ,367
0,346
0,328
0,300
0,278
0,260
0,245
0,232

0,010
0,959
0,917
0,875
0,834
0,798
0,765
0,735
0,708
0,684
0,661
0,641
0,623
0,606
0,590
0,5 75
0,5 61
0,5 49
0,537
0,526
0,515
0,505
0,496
0,487
0,479
0,471
0,463
0,430
0,403
0,380
0,361
0,330
0,306
0,286
0,270
0,256

0,002
0,986
0,963
0,935
0,905
0,875
0,847
0,820
0,795
0,772
0,750
0,730
0,711
0 ,694
0,678
0,662
0,648
0,635
0,622
0,610
0,599
0,588
0 ,578
0,568
0 ,559
0,550
0,541
0 ,504
0,474
0,449
0,427
0 ,391
0,363
0,340
0,322
0,305

23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

- r2

que tem distribwo t de Student com gl = n - 2, sob as suposies de os dados terem distribuio
normal e a correlao ser linear.
(2l A coluna em destaque a mais usada.

o.:::::;

Notas: (1) Os

r.~

~1

e..5-- 0.5- 0.5.:.-:

22

Notas: : Tabela construda com base na estatstica

t=

0,.20C
0,80:'

5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

'

0,255

o.~5'0.2~5
o'.'-'.

0.2::..'0
0,2:5

valores~

exata. Para n > 30, a ~:>..,,....,


suposio de correlao ::_.;;.:
(2) A coluna em desrar~ ~

" ~d"" s CiNcil\S Socil\is

ce correlao

==:.ateral
0,005
:::::a.tera!
0,010
0,959
:>,917
0,875
....834
0,798
C.765
0,735
;'.;,708
0,684
:;,661
0,641
..,.623
0.606
~.590

0,575
:'.;,561
0,549
:.537
0,526
....515
0,505
:i,496
0,487
0.479
0,471
:i.463
0,430
':l,403
0.380
u,361
0,330
':i,306
0,286
'.i.270
0.256

r de

Tabela 8 Valor absoluto mnimo para o coeficiente de correlao por


postos, rs de Spearman, ser significativo

o 001
0,0 02
0,986
0,963
0,935
0,905
0,875
0,847
0 ,820
0,795
0,772
0,750
0,730
0,711
0,694
0,678
0,662
0,648
0,635
0,622
0,610
0,599
0,588
0,578
0,568
0,559
0,550
0,541
0,504
0,474
0,449
0,427
0,391
0,363
0,340
0,322
0 ,305

~07

Ap11.d iCE

n
5
6
7
8
9
10
11

12
13
1:4
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100

si~ificncia,

o., num teste unilateral

0 1 100

Nvel de
0 1050

0 ,200
0,800
0,657
0,571
0,524
0,483
0,455
0,427
0,406
0,385
0,367
0,354
0,341
0,328
0,317
0,309
0,299
0,292
0,284
0,278
0,271
0 ,265
0,259
0 ,255
0 ,250
0,245
0 ,240
0,220
0 ,205
0,193
0,183
0,167
0,154
0,144
0,136
0,129

Nvel de significncia, u, num teste bilateral


0 ,100
0 ,050
0 ,020
0,010
1,000
1,000
0,900
0,829
0,886
0,943
1,000
0,714
0,786
0,893
0,929
0,643
0,738
0,833
0,881
0,783
0,833
0,600
0,700
0,564
0,648
0,745
0,794
0,709
0,755
0,536
0,618
0,503
0,587
0,678
0,727
0 ,703
0,484
0,560
0,648
0,464
0,538
0,626
0,679
0,446
0,521
0,604
0,657
0,429
0,503
0,585
0,635
0,618
0,414
0,488
0 ,566
0,401
0,474
0,550
0,600
0 ,391
0,460
0,535
0,584
0,447
0,522
0,570
0,380
0,436
0,509
0,556
0,370
0,361
0,425
0,497
0,544
0,353
0,416
0,486
0,532
0,344
0,407
0,476
0,521
0,337
0,398
0,466
0,511
0,457
0,331
0,390
0,50 1
0,324
0,383
0,449
0 ,492
0,318
0,375
0,441
0,483
0,433
0,475
0,312
0,369
0,362
0,426
0,467
0,306
0,282
0,336
0,399
0,442
0,263
0,314
0,373
0,412
0,351
0 ,388
0,248
0,295
0,235
0,280
0,332
0,368
0,2 14
0,255
0,303
0,335
0,198
0,236
0,280
0,310
0,221
0,262
0,290
0,185
0 , 174
0,208
0,247
0,273
0,165
197
0,234
0,259

0 1025

0 1010

0 1005

0 ,001
0 ,002

1,000
0,952
0,917
0,879
0,845
0,818
0,791
0,771
0,750
0,729
0,711
0,692
0,675
0,660
0,647
0,633
0,620
0,608
0,597
0,586
0,576
0,567
0,557
0,548
0,530
0,495
0,466
0,441
0,402
0,372
0,348
0,328
0,3 11

Notas: (1) Os valores para n S 30 foram extrados de Leach (1979) e baseiam-se na distribuio
exata. Para n > 30, a tabela foi construida com base na estatstica z = r5 .r;;::l, que, sob a
suposio de correlao linear, tem distribuio aproximadamente normal padro.
(2) A coluna em destaque a mais usada
ados terem distribuio

REsposTAs dE AlquNs EXERCcios

CApwlo 2
2)

Pesquisa de levantamento, pois numa pesquisa eleitoral procura-se obter


as preferncias dos eleitores quanto aos candidatos, sem que o entrevistador
interfira no processo, ou seja, procura-se levantar os dados naturalmente,
como eles se apresentam no momento da pesquisa.

4)

a) altura em centmetros (quantitativa); d) sexo, possveis respostas:


masculino e feminino (qualitativa).

6)

Quando um respondente depara com um questionrio muito longo, este se


cansa de responder e pode deixar parte do questionrio em branco, ou
responder apressadamente, comprometendo as respostas.

CAprnlo 3
1) posefa, Joana, Joaquim, Jos de Souza, Arnaldo, Getlio, Hercilio, Carlito
Anastcia, Cardoso}
2) {1, 2, 22, 2, 2, 2 10, 3, 5 , 16}
3) {G, U, X, J} (alfabeto conforme acordo ortogrfico de 1990; 26 letras)
4)

No , basta extrair 100 nmeros da tabela, com quatro algarismos,


pertencentes ao conjunto {1650, 1651, .. ., 8840}, sem repetio.
11) n = 2.500

12) n= 286

706

EsTATSTiCA Apl icAdA s CiNCiAs Soci11is

CAprulo 4

d E AlGL '\S EX:lil.:::=-

RESPOSTAS

a)

5)

Cl asses
1,0 1- l.~
1.41- 1,8
l,8 j- 2.2
2,2 1- 2.6
2,6 j- 3.C
3,0 l- 3A
3,4 [- 3.8
Total

2) Tabela de frequncias mltipla: Distribuio de uma amostra de famlias


quanto ao uso de programas de alimentao popular, por localidade da
residncia. Bairro Saco Grande II, Florianpolis - SC, 1988.
Uso de programas de
alimentao popular
.o
sim
Tot al

Localidade
Pq. da Figueira
12 (27, 9%)
31 (72, 1%)
43 (100,0%)

Monte Verde
18 (45,0%)
22 (55,0%)
40 (100,0%1

Encosta do Morro
12 (32,4%)
25 (67, 6%)
37 (100,0%)

8)
3) Tabela de frequncias: O principal ponto positivo do Curso de Cincias da Computao - UFSC, na opinio dos alunos das trs ltimas fases, semestre 91. 1.
1 rofessores 1atualizao1 abrangncia 1prtica 1 currculo 1 outros
1 13 (26%JI 6 (12%) 1
7 (14%) 1 4 (8%J 5 (10%)1 15 (30%)

frequncia

1
1
2
2
3

3
5678899
00000 11 l : :..1_ _

55566 66

5555555666~
001 1122~

NOTA: Dez alunos no responderam este item. As percentagens foram calculadas sobre os 50
respondentes.

6) Tabela de frequncias: Distribuio de uma amostra de famlias quanto ao


uso de programas de alimentao popular, por faixa de renda. Bairro Saco
Grande II, Florianpolis, 1988.
Uso de programas de
alimentao popular
no
sim

Total

Renda familiar
at 5 sal. mn.
mas de 5 sal. mn.
15 (27, 3%)
27 (42,2%)
40 (72,7%)
37 (57,8%)
55 (100,0%)
641100,0%)

2)

Mdia

4)

Mdia= 7 ,6 e C.=

5)

Mdia = 4,3 e

7 e Cesri::
C-'"':5e:~

6)
12

NOTA. Houve uma no resposta na amostra de 120 famlias.

8)

a) Analisando a Tabela 1, observamos haver associao entre grau de instruo


e uso de programas de alimentao popular, pois, enquanto no estrato das
famlias de nvel de instruo baixo 70% delas usam os programas, nas
familias de nvel de instruo alto este percentual cai para 40%.
b) Se separarmos a nossa populao por nvel de renda familiar (Tabela 2),
observamos uma completa independncia entre grau de instruo e uso
de programas de alimentao popular. As grandes diferenas quanto ao
uso ou no dos programas fica entre os dois nveis de renda familiar
considerados. Isto nos leva a crer que a associao observada na Tabela 1
, na verdade, induzida pela varivel renda familiar.

10 1

:~

:~"'

"

"

-~

mdia = 76,7: ~

a) Mdia = 2 ,3: ~

professores ;t:
(didtica)
Mdia 1
2,77
DP
0,62

ra

7)
8)

CAprulo 5
1)

Pode mos d izer que o mais tpico so residncias com quatro ou cinco
moradores. No parece haver residncia com nmero de moradores muito
diferente das demais (casos discrepantes).

2)

a)

Nvel de satisfac o 1 Frequncia


2
6
3
33
4
17

Total

60

10,00
55,00
28,33
6,67
100,00

b)

35

10) a) Md = 15; Q1 = :G.5-

30

.<; 2S

"
J:"

'"
C'

b) Md = 15, ;

2(l

15
10
5

11)
3

Nivcl de sa tisfa~~o

M,1 =

12) Mc1

4;

O:=:::::

O;= 3,5 e _ = O:= 1. :: e-

2,45;

;,<,;.;

.\s

CIFNCIA~ SoclAI~

5) a)
~

~ostra

~07

Rt!>pOSTAS dE Alc;u'll~ FXFRCC:ios

Classes
1,01- 1,4
1, 41- 1,8
1,8 I- 2,2
2,2 1- 2,6
2,6 1- 3,0
3,0 l- 3,4
3,41-3,8
Total

de familias
da

r:.icosta do Morro
12 (32,4%)
25 67,6%
37 ( 100,0%

%
3,3
5,0
25,0
30,0
11,7
11,7
13,3
100,0

Freq.
2
3
15
18
6
8
8
60

16

~ 12

!.
:2

1,6

2.D

2 14

2,8

3,2

J ,S

IAA

8)

1
2
2
3
3

5678899
00000 11111122233333444
55555556667999
00111224
5556666

CAphulo 6
2)

Mdia = 7 e desvio padro = O

4)

Mdia = 7,6 e desvio padro = 2,37

5)

Mdia= 4,3 e desvio padro = 1,45

6)
12

5-0

40

60

70
iu

80

100

~ax...'1 df' :\.1(1tbt"tixaAo

mdia = 76, 71 _./

7) a) M dia = 2,311 e desvio padro= 1,206


8)

cinco

-~
:

Tabela: Medidas descritivas de algumas caractersticas do Curso Cincias


da Computao - UFSC, na viso dos alunos das trs ltimas fases.

Caracteristicas do Curso
professores professores bibliografia recursos contedo currculo satisfao
em geral
(conhec.) disponvel materiais das disc.
(didcal
3,40
3,35
3,32
2,77
3,23
2,20
2,30
Mdia
0,90
0,75
0,62
0,67
0,94
1,05
0,69
DP

10) a) Md

15; Qr = 10,5 e Qs= 19,5

b) Md

15,5; Q1 = 10,5 e Os= 19,5

11) Md = 4; Qi = 3,5 e Q"

:-lvel de sat!sfa.o

=5

12) Md = 2,45; Or= 2,10 e Qs= 2,97

.508

EsrArsricA ADliCAdA s CiNCiAs SociAis

ResposrAs dr AlG'-'s

o, 1646

b)

16) No, para se ter a taxa de alfabetizao da Unidade da Federao, p recisa-se


calcular a mdia ponderada pela populao adulta de cada municpio.

17) a) 0,7082

b)

18) 8/ 15
19) a) 0,6553

b:

CApwlo 7

20) a) 0,3284

b'

21) a) 0,3874

b'. b'

13) Ei = 1;

1) a)

0; =2; Md = 4; Q, = 5 e

Resultados
Probabilidades

1l
0, 1

16) a)

E, - 12

10

22) a) 0 ,3125

0, 1

0,1

0,1

0,1

0,1

o,1

0,1

0,1

0,1

23) 0,0781

<\r.--o,

b) A = {2, 4, 6, 8, 10}; B = {l, 3, 5, 7 , 9} e C = {l, 2}.


e) P(A) = 1/ 2; P(B) = 1/2 e P(q = 1 /5.

2)

3)

a)

Resultados

homem

mulher

Probabilidades

1/ 3

2/3

Resultad os
Prob abilidades

1 0,30

1)

branco ou nulo

0,50

0,20

a) 78/ 120
f) 25/ 44

c) 76/120

d) 25/120

e) 53/120

5) 0,4225
6)

a ) binomial com n = 3 e

it

= 5/ 8.

b) No binomial. Os ensaios no so independentes.


e) binomial com n = 20 e it = proporo de mulheres na populao, na
poca da p esquisa.
d) binomial com n = 500 e 7t - proporo de pessoas favorveis em se, na
poca da pesquisa.
e) No binomial. O parmetro n no constante ao longo dos ensaios;
f) binomial com n = 100 e ;r = proporo de recm-nascidos em se com
menos de 2 kg, na poca da pesquisa.
g) No binomial. A caracterstica em estudo no pode ser identificada em
apenas dois resultados, em cada ensaio.
7) a ) 0 ,312 5
b) 0,500
8)

a ) 1,33

4)

a ) 0 ,0495

5)

b) 44/120
g) 25/78

b)

3)

f)

b) 0 ,80

4)

a) 2

: ..5

2) 0,50
b' . -

a) 0,0228

6)

a) 0,0228

7)

Ambos os

8)

a)

e\"e--~

o, 1719

t-

9) 0,6255

10) 0 ,0968
11) 0 ,985

12) 6,68%
13) a) 0, 1056
14) a) 0,6826 (usa::..
normal)
15) a) 0,0781
~-

16) 85,36 minutos

0,3770

9 ) Binomial com n = 5 e n = 0,40; ou seja:

1)

a) 43/90

4)

a) 60,0% 4 ,0C

b' ...

d) 80,0% 3.9"
Obs.: Nvel de m::.::.- .. ..-

5)
6)

30,0% 6 ,4'u

RESDQSTAS

_ ?eeerao, precisa-se
....: caia municpio.

dE

709

AICjU'-S EXERCCiOs

16) a) 0,1646

b) 0,1317

c) 0,7901

17) a) 0,7082

b) 0,0027

c) 0,2918
c) 0,7379

18) 8/ 15
19) a) 0,6553

b) 0,2458

20) a) 0,3284

b) 0,6219

21) a) 0,3874

b) 0 ,0702
b) 0,3437

10

22) a) 0,3125

0.1

0,1

0,1

23) 0,0781

CApwlo 8
1)

a) 2

b) 1,5

c) O

d) -0,5

2) 0,50
3) a) 1,33

b) 75

4) a) 0,0495

c) 0,6826
h) 2,58

d) 0,9544

g) 1,65

5 ) a) 0,0228

b) 0,9544

e) O, 1587

d) 95,44%

b) 68,26%

f)
e) 53/120

b) 0,9505

e) 0,9974

6)

a) 0,0228

7)

Ambos os eventos tm a mesma probabilidade (igual a 0,1056).

8)

a )0,1719

9)

0 ,6255

b)0,1711

10) 0,0968
11) 0,985
12) 6,68%
13) a) O, 1056
-:go dos ensaios;
- -..ascidos em se com

14) a) 0 ,6826 (usando a distribuio binomial) b) 0,9032 (usando a distribuio


normal)
15) a ) 0,0781

- ser identificada em

b) 0,3085

b) ""O

16) 8 5 ,36 minutos (ou 85 minutos e 22 segundos)

CApwlo 9
5
- 0102

::;_g

1,0

- <::768

0,0102

1)

a) 43/90

4)

a) 60,0% 4,0%
b) 60,0% :z: 2,5%
c) 20,0% 3,9%
d) 80,0% 3,9%
e) 50,0% 4,9%
Obs.: Nvel de confiana de 95% usando o valor aproximado z = 2 .

5) 30,0%
6)

b) 5,99

6,4%

a) Na amostra: 30,0% . Na populao: com 95% de confian a o intervalo


30,0% 4,5% contm a referida proporo .
b) Nada. A amostragem n o foi aleatria.

}10

EsrArfsricA AplicAdA s C i1'CiAs SociAis

7)

35,0% 12,4%

8)

65,0% 8,6%

9)

a) 55,0% 15 ,7%

RESPOSTAS dE Al(4l \S Exscc.::::

contm a pe. e
b) 72,1% 13,7%

10) a ) 16,00 minutos


b) 3, 11 minutos
d) 16,00 1,80 minutos

C) 67,6%

15,2%

e) 0 ,83 minutos

23) a) 3 ,50 = O,&:.


24) a )
b)
e)

clcu~os abaixo, usamos o valor aproximado t - 2 (pois as amostras eram


razoavelmente grandes).

11) Nos

Renda mdia familiar mensal (em salrios mnimos!


Localidade
Monte Verde
8, 1 1, 4
5,8 0,8
Pq. da Figueira
Encosta do Morro
5,0 1.5
Interpretao: A renda mdia familiar dos moradores do Mon te Verde de 8, 1 salrios
mnimos mensais, com um erro amostral mximo (95% de confiana ) de 1,4 salrios
mnimos. Interpretaes anlogas para Parque da Pigueira e Encosta do Morro.
Note que com estes resultados, podemos afirmar (com pelo menos 95%, de confiana), que a
renda mdia familiar dos moradores do Monte Verde maior do que nas duas outras localidades
em estudo. Mas a diferena da renda mdia do Parque da Figueira e Encosta do Morro pode
ser merament e casual, resultante da sorte (ou azar) das amostras extradas, pois os in tervalos
de confiana tm uma rea de sobreposio.

12) a) R$255,00 R$135,00

b) Valor, em real, que o fiscal deixa de cobrar, em mdia, por empresa que
ele possa fazer a auditoria.
c) Com 9 5% de confiana, o intervalo R$255,00 R$135,00 contm o
desconhecido valor .
15) 33,3 % 7,3%

= 64 (usando z = 2)
18) n = 306 (usando z = 2)
17) n

19) a) populao: conjumo de todos os alunos do curso;


amostra: os 80 alunos selecionados;

parmetro: proporo de alunos do Curso favorveis eliminao da


disciplina de estatstica;
estatstica: proporo de alunos favorveis eliminao da disciplina de
estats tica dentre os 80 da amostra.
b) populao: pessoas obesas da cidade;
amos tra: as 20 pessoas obesas selecionadas para o estudo;
parmetro: perda esperada de peso de uma pessoa que faa o curso;
estatstica: perda mdia de peso das 20 pessoas selecionadas para o estudo.
c) populao: pessoas fumantes da cidade;
amostra: as 100 pessoas selecionadas para o estudo;
parmetro: proporo de fumantes da cidade que largaram o vcio aps a
campanha.
estatistica: proporo de fumantes que largaram o vcio aps a campanha
dentre as 100 pessoas selecionadas para o estudo.
20) a) 40%

b) Com 95% de confiana, o intervalo 40,0 % 3 ,4% contm a percentagem


dos habitantes da cidade que apoiam a administrao da prefeitura.

22) 13,6% 2 .6~

24) a)
e)

d)
26) 6,0%,

l)

5,6~o

e 5: _

a) 0,0062

2)
3)

oc
n
4)

a) bilateral

5)

a) 0 ,0031

6)

a) 0,0094

8)
9)

de

treiname n~o (7'

11) a ) Decide-se po:- :--

adotado. O risco =:~


que estamos cow-'=
b) Decide-se po:- H.
normalmente ao.:a::.
informao sob:'e
e) Quanto

:ne~=

-e~

>.s Ci@NclAs SociAis

REsposr.o.s d E Ak;ur-.~ txrncco-;

21) a) n = 664 b) 30, 1% 4,6% . Com 99% de confiana, o intervalo 30,1% 4,6%
contm a percentagem de pessoas que passariam a usar o produto.
22) 13,6% 2,6%

= _5.2%

23) a) 3,50 0,64

b) n = 98 (foram usados t ~ 2,201 e N = 500)

24) a) mdia = - 3,900 kg, d .p. - 8,373 kg e mediana = - 3,5 kg

=_

:r--.s as amostras eram

\ "e-de de 8, 1 salrios
-Gana) de 1,4 salrios
.-::...--osta do Morro.
,,5"~ de confiana), que a
= C!.las outras localidades
~ 7 .,costa do Morro pode
~==~;:ail:la:s, pois os intervalos

b) -3,900 kg 5 ,989 kg
c) No, pois o intervalo de confiana apresenta, tambm, valores positivos, ou
seja, o valor esperado da variao de peso pode ser positivo (ganho de peso).
24) a) n = 192
b) 5,30 0,46
e ) No, pois o intervalo onde deve estar a verdadeira mdia abrange, tambm,
valores menores que cinco.
d ) 62,5% 5 ,5%
26) 6,0%, 5 ,6% e 5,8%, respectivamente .

CApTulo 10
1) a) 0 ,0062

= XS135,00

---co da disciplina de

-:o::tm a percentagem
jc::::::::3=.,.,'"o da prefeitura.

c) 0,0062

a) Rejeita H0 b) Aceita H 0

3)

possvel. Por exemplo, se no teste para verificar se uma moeda honesta


ocorrer Y = 2 caras em n - 12 lanamentos, temos p = 0,0384, que rejeita ao
nvel de 5%, mas ace ita ao nvel de 1% . O inverso nunca acontece.

contm o

_!s eliminao da

b) 0,3874

2)

c) Rejeita H0

4 ) a) bilateral

b) unilateral c) bilateral

5)
6)

a) 0,0031

b) 0,1937

c) 0,6127

a) 0,0094

b ) 0,3844

c) 0 ,0094

8)

Sim (rejeita H0 ao nvel de 5%), pois p = 0,0222 (teste unilateral).

9)

Sim (rejeita H0 ao nvel de 5%), pois p = 0,0014 (teste unilateral).

10) a ) H0 : Em mdia, a produtividade com treinamento igual produtividade


sem treinamento. H 1 : Em mdia, a produtividade com treinamento maior
do que a produtividade sem treinamento (teste unilateral).
b) H0 : Em mdia, a velocidade igual ao valor anunciado. H 1 : Em mdia, a
velocidade menor do que o valor anunciado (teste unilateral).
e) H 0 : As produtividades mdias so iguais para os dois mtodos de
treinamento. H 1 : As produtividades mdias so diferentes para os dois mtodos
de treinamento (teste bilateral).
11) a) Decide-se por H 1, pois o valor p menor do que o nivel de significncia
adotado. O risco de ele estar tomando a deciso errada de 0,0001 . ( claro
que estamos considerando apenas os aspectos estatsticos).
b) Decide-se por H0 , pois o valor p maior do que os nveis de significncia
normalmente adotados. Quando se aceita H0 , o valor p no oferece qualquer
informao sobre o risco de se estar tomando a deciso errada.
e) Quanto menor o valor p, existe maior evidncia para a rejeio de H0 (e
consequente aceitao de H 1) .

} 12

EsrArsrir.A Aplir.AdA s CiNCiAs SociAis

f~ESPOSTAS dE A!Gt::>.S ""'~-

12) a ) Aceita H0 : a moeda hone sta (p = 0,2892) .


.
b) Rej eita H0 , isto , d ecide -se que a moeda viciad a (p ::::: 0 ,0000068, uso da
aproximao normal).

Monte Verde :it IC";rr=;;


-+ 0,002 < p < ~
Pq. da Figu~....:a x
t=0 , 99 -+ C~<

13) Hiptese s: H 0 : n = 0,5 e H 1 : n > 0 ,5 (n - probabilidade d a criana acertar uma


dada questo). Deciso: rejeita H 0 , isto , h evidncia d e que a criana tem
algum conhecimento s obre o assunto (p = 0 ,0031).
14) a) H 0 : lt =0,25 e H 1: 1t > 0 ,25;
b) = 3
e) p = 0,1576
d ) Aceita H 0 N o h evidncia de que a criana tem algum conhecimento
sobre o assunto.
15 ) Deciso: rej eita H 0 , isto , h evidncia de que o sistem a "inteligente" adquiriu
algum conhecimento sobre o assunto (p = 0,0071, uso da a proximao normal).

16) No. Usanco

18) No. Teste r z

Portanto, a~
pelo acaso.

CAPTULO 11

19) Sim. Tesre >


1)

3)

a) H 0 : no h d iferen a entre a percentagem de ouvintes que a valia m


positivamen te e a percentagem de ou vintes que avaliam negat iva mente a
ap re s e nta o d o candid a to; H 1 : a maior parte dos ouvintes avalia
positivamente a apresentao do candidato.
b) p = 0, 1 134. Portanto, a o nvel d e significncia de 5%, n o h evidn cia de
que houve melh ora (Aceita H 0 ) .
c) p::::: O. Portanto, ao nvel de significncia de 5%, h evidncia d e melhora
(Rejeita H 0) .
d) p "" 0,00135. Portanto, ao nvel de significncia de 5% , h evidncia de
melhora (Rejeita H0 ) .
a) H 0 : em mdia, o curso no produz e feito n o peso; H 1 : em m dia, as pessoas
que fazem o curso reduzem mais o peso do que as que no fazem o curso.
b) Ao n ve l d e s ignificncia de 5%, rejeita H 0 , isto , podemos afirmar qu e o
cu rso produz e feito no sentido desejado (0,01 < p < 0,025).

1) a) 3,53
2) Sim, p ois 1.= = ':' ._,
3) a) Sim (reje~-=::::.
b) Sim (rejei:.a ~
e) No (acer...a ?
4)

Adotando a; =
b) Sim (reje:= -

5) a)
b)

e = o.::r
~ =

0,076.
sexo e~

b) Rejeita H 0 ao nvel de 5% , pois t= 2,70 -+ 0,01 < p < 0,025 (teste unila teral).

6)

a) C*

5 ) a ) Rej eita H 0 ao n vel de 5% , pois, t= 3 ,04 -+ 0,005 < p < 0,010 (teste unilateral).

7)

y = 0,3356.

4)

6)

Sim, rejeita H 0 ao nvel de 1%,, pois, t = 6,4 -+ p < 0 ,000 5 (teste unilateral).

7)

Sim, rejeita H0 ao nve l de l %, pois, t 3 ,09

8)

a) No (aceita H 0 ao nvel de 5%), pois t = 1,33 ~ 0 ,05< p <O,10 (teste u n ilateral).


b) ~esmo que o teste rejeitas se H 0 , apon tando d iferen a s ignificativa entre
os dois grupos , no poderamos garantir que esta diferena sej a devida ao
nvel nui:ricional da me, pois n ada garante que os dois grupos se difiram
somente com respeito a este fator, j que no uma pesquisa exp erimental.

9)

No (aceita H 0 ao n vel d e significncia de 5%), pois t = 1,0 18


0 ,50 (teste bilareral).

0,001 < p < 0 ,005 (teste bilateral).

-+

0 ,20

<

0 ,05 (teste bilateral).


=

2,92

= o,~ 13

8) a) 0,214
9)

0,665

10) No. ('x2

= 1,1. e>

<

10) Sim (rej eita H 0 a o nvel de sign ificncia de 5% ), pois t= -2, 16 ~ 0,02 < p <

12) Trs testes bila terais, a dmitindo et = 0,01 para cada tes te:
Monte Verde x Pq . da Figueira: existe diferena significativa , pois t
p"" 0,005.

provao), ao
12) No.

(c2

~-:-e~~ ~

= 2.25,;: > c:,...::.-

13) a) Teste Q1!!~"'..; =-b) Teste < ?L~ .::.


-~"'--
e) Teste r pa=:=.
2

====

- ~'I :.~ Ci:r-.r.iA~ SociAi~

RESPOSTAS dE A[qur-.s EXERCCiOS

Monte Verde x Encosta do Morro: existe diferena s ignifica tiva, pois t = 3,07
-+ 0 ,002 < p < 0,005.
Pq. da Figueira x encosta do Morro: no existe d iferena significativa, pois,
t = 0 ,99 -+ 0 ,20 < p <0,50.

ce que a criana tem

13) 23 (usando o grfico da Figura 11.11).


14) N o. Usa n do teste t unilateral para amostras indep endentes: t = 1,51 (0,05 <
p < 0 ,10)
15) Sim. Usando teste t unilateral para dados pareados: t = 3, 1O (0,0 1 < p < 0,025)

-~-='""

-:;;ireligente" adquiriu
- :.;roximao normal).

:::-r_:it es que avaliam


--"'-""-'""
-'-' negativamente a
::.,s ouvintes avalia

16) N o. Usando o teste unilateral dos sinais, p = 0,1094.


17) Sim. Teste t unilateral para dados pareados: t = 1,62 (0,05 < p < O, 10).
18) No. Teste t bilateral para amostras independentes: t = 0,97 (0,20 < p < 0,50).
Portanto, a diferena entre as mdias amostrais pode ser explicada meramente
pelo acaso.
19) Sim. Teste t unilateral para amostras independentes: t

2)

o, h

evidncia de

md ia, as pessoas
':":!< no fazem o curso.
........~~os afirmar que o

<: 0 25).

::s (teste unilateral).


.., :o (reste unilateral).
_:.5 teste unilateral).

;<: :o (teste unilateral).


--== significativa entre
-.:..~na seja devida ao
- :.s grupos se difiram
~..iisa experimental.

-=-

I.018

-+ 0 ,20 < p

<

-2,1 6

-+ 0,02

<

<

a) 3,53

c) No (0,10 < p < 0,25)

b) 2,40

Sim, pois

6,84 0,005 < p < 0,01

3) a) Sim (rejeita H 0 ), pois Y.,2 = 16,25 .+ 0,0025 < p < 0,005.


b) Sim (rejeita H 0 ), pois x2 = 11, 18 .+ 0,0025 < p < 0,005.
c) No (aceita H0 ), pois x2 = 5, 14 .+ 0,05 < p < O, 10.
4)

Adotando <l = 0,05 . a) No (aceita H0 ), pois Y.,2 = 2,82 .+ O, 10 < p < 0 ,25.
b) Sim (rejeita H0 ), pois x2 ~ 6,72 .+ 0,0025 < p < 0,05.

5)

a) C* = O, 107 .
b) 4> = 0,076. Os dados observados apresentam uma fraca associao entre

sexo e tabagismo.
6) a) C*
7) y

0,423

b) V 0,260

0,3356.

8) a) 0,214

- : ')()5 (teste bilateral).

3,92 (p < 0,0005).

CAprulo 12
1)

- ... 5

b) -0, 185

9) 0,665
10) No. (X.2 = 1,77, p > 0 ,25)

11) Sim, conforme o teste qui-quadrado com Tpo de


rovao no vestibular
corre o de Yates (Y.2 2 ,99, 0 ,05 < p < escola
no
sim
O, 10), existe associao significativa entre pblica
13 (72%)
4 (33% )
o tipo de escola (pblica ou particular) e o ....car::::...::ti:.::cul
= ar
==--1---'5::....i.::2:..:::
8:..:..
%::.L-_ ....:8::....i.:6:...:.7....:.
o/c=i.o_
Total --'--'-'---'----'--18 100%
12--'---'-'--'100%
resultado no vestibular (aprovao ou re- -'--""'--prova o), ao nivel de significncia de 10% .
12) No. (c2

2,25 , p > 0,25)

13) a ) Teste qui-quadrado com correo de Yates.


b) Teste t p ara amostras independentes.
c) Teste t para amostras independentes.

faTAT<>TiCA AplicAd A ~ ogNCiAS SociAiS

714

R t'JlU~IA~

CAprulo 13

b)

2) a) Sugere correlao positiva b) Ponto discrepante: nona observa o (70, 50)

e)

.. .....
. .' .
~

"
E

~b

.
..

.,

. ti

10

;;,

e) 0,69
d) 0,86. Correla o positiva e significativa (teste bilateral, a = 0,05).
e) 0,66. s ignificativa (teste bilateral, a = 0,05)

6) a) r = -0 ,68 4. Em termos d os doze municpios pesquisados, e na poca de


observao dos dados, verificou-se uma correlao negativa moderada
entre ta.xa de alfabetizao e taxa de mortalidade infantil. Ent o, p a ra n veis
maiores de alfabetizao, temos uma leve tendncia de reduo na taxa
de mortalidade infantil.
b) r. = -0,678. Significativo ao nvel de significncia de 5% (teste bilateral);
assim, podemos dizer que existe correlao (e negativa) entre essas duas
variveis, nos municpios brasileiros.
a) Varivel dependente: nota; varivel independente: nmero de faltas;
b) fJ = 9,51 - 0 ,63x
d) R2 = 0,68
e) Se = 1,64
10) a) Varivel dependente: taxa de crescimento demogrfico; e varivel
independente: populao urbana
b) (taxadecresc. dem.) = 1,758 + (0,01253).(pop. urbana). Obs.: Populao urbana est em unidades de 1.000 habitantes.

9)

S ~ taxa de crescimento
demogrfico

:[ .. ~
2

E~

15) a) 49,l kg
16) a) r = -0,96

Nob no v e$tlbular e m m;temitica

e)

AIGV\ S

14)a) r=0,925
b) Correlao ..uS(Tabela 7
c) y = 1,19 - ! --

.1

dt

o ~o~......-.
so~-10~0,--1~
5~
0--=200,.--2~5~0___,,3...,..,oo
7

populao urbana (x 1000)

d) Predio: raxa de crescimento de 5,52 .


e) R2 = 48%
12) No. Pela tabela 7 o valor absoluto de r deveria ser no mnimo igual a 0,444
para ser significativo.
13) a) r = -0,85. Para as seis famlias pesquisadas, tem-se uma correlao
negativa forte entre renda familiar e nmero de filhos.

c)

d)

'

e)

.i,,: ! ~~ ~
s

10

10

- -~,~ -

Sim, verifica-se
adequar-se 3:::::::
de detenn-F=
g) 9,85 km

h)
portanto. a

=~

- d~ s CINCIAS SoclAls

}15

RESPOSTAS dE Al(iUNS FXERCCiOS

b) y = 0,33. Em relao aos dez indivduos pesquisados, verifica-se uma


correlao positiva fraca.
c) C* = 0,09. Em relao aos cem indivduos pesquisados, praticamente no
existe associao entre altura e sexo.
14) a) r = 0,925
b) Correlao positiva forte. tambm significativamente diferente de zero
(Tabela 7)
e) y = 1, 19 + 1,70 X
15) a) 49,1 kg

b) 1,8 kg

16) a) r = -0,96

b) Correlao negativa forte

c) Varivel dependente: consumo; e varivel independente: peso


d ) (consumo) = 22,25 - 0,62 (peso)
e)

tS -

(consumo)

=22,25 -

0 ,62 (peso)

to

15

20

25

30

pe<O (100 kg)

Sim, verifica-se pelo grfico do item (e) que uma relao linear parece
adequar-se bem ao presente problema. Alm disso, tem-se um coeficiente
de determinao prximo d e 1 (.R2 = 0,92).
g) 9,85 km/ l.
h) No, pois os veculos estudados estavam na faixa de 1.200 a 2.600 kg e,
portanto, a equao de regresso deve ser usada apenas nesta faixa.
f)

:.=~grfico;

e varivel

Coleo Didt ica


A in terpretao de imagens area'
Algoritmos numricos - sequenciais e paralelos
,\ nlise senso rial de alim entos
Anatomia sistmica - uma abordagem d ireta para
o estudante
,\ nomal ias larngeas congnitas
Assistncia social: do discurso cio Estado prtica <lo Servio Social
Auto(:\ D 2000 - guia prtico para desenhos
em 2D
, \ utoC. \D 2004 - guia prtico para desenhos
em 21)
,\utoC\D R14 - guia prtico para de~enhos em

2D
.-\utoC\D R14 - guia prtico para dc>cohos cm
31)

:\valiao nutricional de coletividades


Clculo 1
Clculo _-\
Clculo C
Clculo <le indutncia e de fora em circuitos
cl[ricos
Clculo e .\lgcbra Linear com Derive
C ncer - o que voc precisa saber
Carto grafia - (t:presentao, comun icao e
vis uafuao de dados espaciais
Centro cirrgico: aspectos fundamcnr:ais para
E nfermagem
Classificao D ecimal Universal - CDU
Co nstr uindo em alvenaria es trutural
D esenho geomtrico
D esenho tcnico mecnico
Diagnscic.o do meio fisico de bacias hidrogrficas
Elementos bsicos <le fotogrametria e sua utilizao prtica
Eletromagnetismo e clculo de campos
Eletroma&rnetismo para Engenharia: escicica e
quase esr ri e.a
Eletrnica bsica: um enfoque \'Oh:ado Informtica
Engenharia de prorocolos com LOTO / l O
Estastica aplicada s Cincias Sociais
1'en:amentas de corte T
Ferramentas de corte 11
Filtros seletores <le sinais
F undamentos de Carrografia
1'undamentos de sistemas hid rul icos
Gt:rao de vapor
C ramtica bsica <lo J,atim
Identificao de sistemas dinmicos lineares
lfluocia aoriana no Portugus do Brasil

lntcligncia Artificial
Tn teligncia t\ rtilicial: ferram entas e teorias
Tntro<lU<,:o E ngen haria
i ntroduo E nge nharia: conceitos, ft:rramen ta~
e comportamen to~
Tntro<luo Ht<ica Nuclear e de Partculas
1-:lcmentares
Introduo l\fatemtica
Introduo Qum ica Inorgnica Expcrimenral
Introduo Teoria dos Grnfos
lntrodu.'io Topologia Geral
Tntroduco ao l .aboratrio de Fsica
Latim para o portlJbrus - !,rramtica, lngua e
literatura
1.e Francais Parl, pratique de la prononciation
du 1'ranais
.\Iacroesculrura dental
.\[anual bsico de Deenho Tcnico
J\laple \ '
Matemtica - 100 exercios de grupos
Matemtica 1'inanceirn atravs da Hl'-12C
Matrizes e sistemas de equaes lineares
i\bcrobiologia - manual de aulas prticas
]\fonitoramento global integrado de propricda<lcs rurais
Natao: ensine a nadar
Noes bsicas <le Geome tria D escri tiva
O papel da esco la na co nstruo de uma sociedade democrtica
<':> leos e gordurns vegetais - processamenco e
a nlise
Prindpios de combusto aplicada
Promenades - textes et cxercises pour la classe
de 1'ranais
Propriedades qumicas e tecnolgicas do amido
de mandioca e do polvilho azedo
Qumica R$ica - teoria e experimentos
Redao
Redao oficial
Redes de Petri
Taguchi e a melhoria da qualidade: uma releirura
crtica
Tcaching in a dever way - tarefas comunicativas
para professores de Lngua Inglesa do 1o grau
Tecnologia <lc grupo e o rganizao da mru1ufa
tura
Teoria fndan1ental do m otor de induo
Topografia conte mpornea - Planimetria
Trnnsmisso de energia eltrica
Unidades de informao: conceitos e competncias
Ventilao imlustrial

'I'

F.sce livro foi cdicorado cm


Korinna l3c e Amo Pro.
Miolo cm papel offur 7Sg;
capa cm carto supremo 250g.
Impresso na Grfica e Edirora Copiart
cm sisccma de impresso offi~1.

A Coleo Didtica da ~ditora da UFSC procura


estabelecer uma li