Вы находитесь на странице: 1из 4

Mestrado Integrado em Medicina

BioMatemtica 2008/09 Folha Prtica n 3


ANLISE EXPLORATRIA DE DADOS
Muitas vezes, o investigador salta para a anlise inferencial sem primeiro olhar para os dados, dando ateno a
toda informao fornecida por eles: Qual o comportamento dos dados (identificar modelos), se eistem valores
etremos ou anormais (a!errantes), avaliar a varia!ilidade e eplic"la, ### $ssim, o primeiro passo % descrever os
dados de forma apropriada e concisa#
Para descrever os dados usando indicadores numricos ou tabelas,
e eventualmente algum grfico, utiliza-se o menu do SPSS Analyse
> Descriptive Statistics > ....
. !tilize o fic"eiro t2_1.sav referente ao peso # nascen$a %g& de '( recm-nascidos num "ospital
privado de San Diego, durante semana. Descreva a varivel em causa, usando a op$)o
*+plore, referindo,
a. -. de casos ////// -. de missings /////
b. 0edidas de tend1ncia central, 0dia ///// 0ediana ///// 0oda /////
c. 0edidas de 2ocaliza$)o, 3 ///// 34 ///// P5 ///// P65 /////
d. 0edidas de Dispers)o,
i. *rro-padr)o ///// Desvio-padr)o /////
ii. Amplitude de varia$)o ////////// Amplitude inter7uartil //////////
iii. 8oeficiente de varia$)o /////
e. A varivel parece ter uma distribui$)o simtrica9
f. Avalie a e+ist1ncia de outliers.
-:;A, Algumas das 7uest<es anteriores podem ser respondidas usando a op$)o Descriprive
statistics ou =re7uencies, e complementadas com grficos.
'. !tilize agora os dados de Aula1.sav. !sando as op$<es convenientes, responda,
a. A maioria dos in7uiridos era de 7ue gnero9 8omo pode e+plicar este facto9
b. 3ual a ta+a de in7uiridos no >nterior do pa?s9
c. 3uantas fam?lias t1m, pelo menos, @ fil"os9
d. 3ual a ta+a de fam?lias numerosas %com pelo menos 4 fil"os& encontrada nesta amostra9
e. 0ais de metade dos in7uiridos tem, pelo menos, o '. ano9

Mestrado Integrado em Medicina


BioMatemtica 2008/09 Folha Prtica n 3
f. *m mdia. :s in7uiridos t1m mais de ' anos de escolaridade9
g. 3ual o n. m+imo de irm)os9
". :s in7uiridos s)o, na generalidade, felizes9
i. 3ual a ta+a de indiv?duos 7ue se espera 7ue, na popula$)o, ten"a uma vida aborrecida9
A. '5B dos in7uiridos n)o t1m fil"os9
4. >ndi7ue se a idade mdia parece ser id1ntica consoante a regi)o de resid1ncia,
a. usando a op$)o *+plore
b. usando Data > Split =ile > :rganize output by groups based on reiao, seguido de Analize >
Descriptive Statistics > Descriptive > i!a!e.
-:;A, Colte ao menu Data > Split =ile > e escol"a Analyse all cases, do not create groups.
@. -esta amostra, indi7ue, usando a op$)o 8rosstabs,
a. *ntre os in7uiridos, 7ual a ta+a de mul"eres com vida rotineira9
b. -o gnero feminino, mais fre7uente encontrar mul"eres com uma vida aborrecida ou
e+citante9
c. *ntre a7ueles 7ue t1m uma vida e+citante, 7ual o gnero com maior preval1ncia9
5. Seleccione a op$)o Datio para determinar a raz)o mdia e mediana %Statistics& de >dadeE-. de
=il"os, globalmente, e em cada gnero %se"o - group&. -)o precisa das medidas de dispers)o.
Sabendo 7ue ( anos antes o rcio global era de (.(, indi7ue uma raz)o plausivel para os
valores actuais.
F. *+porte os resultados do seu output para um fic"eiro compat?vel com o Gord. Cerifi7ue 7ue
pode tambm e+portar os resultados para fic"eiros tipo H.+ls, Hppt ou H."tml.
'
Mestrado Integrado em Medicina
BioMatemtica 2008/09 Folha Prtica n 3
AED - GRFIOS
:s grficos s)o normalmente usados para perceber Itend1nciasJ nos
dados e n)o s)o t)o prticos 7uanto as tabelas para anlise de valores
numricos estruturados.
Para fazer grficos, seleccione a op$)o Krap"s > >nteractive > ...
!se o fic"eiro 1991 #$ %eneral $ocial $urve&.sav para os grficos 7ue
se seguem. : fic"eiro Aula.sav apenas uma pe7uena amostra retirada deste.
Descri!"o dos dados
. =a$a um grfico
a. de barras %bars& da varivel rei'o
i. =a$a agora um grfico de barras da rei'o por se"o. Analise as op$<es &olorE't(le,
&luster)'tac*, +anel varia!les, ,-"coordinate.
b. =a$a um diagrama circular %pie ou I7ueiAoJ& da varivel vi!a. *scol"a um grfico 4D, de B.
c. =a$a um grfico 'D e um grfico 4D de Area da varivel (eli) segundo rei'o
d. =a$a um grfico de lin"as %2ine& e escol"a a varivel ae, com contagem do n. de casos.
Diagn#stico e E$%&ora!"o
'. Seleccione Lo+plot e seleccione,
a. ae por se". Analise as op$<es !oes, titles e options.
b. ae por illeal !rus . =a$a este grfico na "orizontal. *+istem outliers9
c. ae por chil!s, fazendo clusters por se"o.
4. Seleccione Scatterplot e escol"a os pares e!uc-*ae!uc e e!uc-mae!uc. Parece-l"e 7ue o grau
de escolaridade dos fil"os est relacionado com o grau de escolaridade do pai, ou da m)e9
4
Mestrado Integrado em Medicina
BioMatemtica 2008/09 Folha Prtica n 3
F'n!(es de distri)'i!"o
@. Seleccione Mistogram e escol"a a varivel ae, com display normal curve.
a. Parece-l"e 7ue a idade segue uma distribui$)o normal9
b. Depresente tambm graficamente as fre7u1ncias acumuladas deta varivel.
5. ;ransforme a varivel ae em ln_ae %fol"a & e fa$a agora
a. o "istograma desta varivel.
b. !m grfico 3-3 usando Analyse > Descriptive Statistics > 3-3
F. ;ransforme a varivel ae em s+rt_ae %fol"a & e fa$a agora
a. o "istograma desta varivel.
b. !m grfico P-P usando Analyse > Descriptive Statistics > P-P
N. 3ual a diferen$a entre os grficos P-P e 3-39
O. Seleccione *rror Lar para a varivel ae segundo illeal !rus. *scol"a a op$)o .rror !ars
represent,
a. Standard deviation of t"e mean, multiplier
b. Standard error of t"e mean, multiplier '
c. 8onfidence interval for t"e mean, level 65B
6. 8onsidera 7ue os grupos s)o "omogneos, na idade, relativamente ao consumo de drogas
ilegais9
@

Вам также может понравиться