ANLISE EXPLORATRIA DE DADOS Muitas vezes, o investigador salta para a anlise inferencial sem primeiro olhar para os dados, dando ateno a toda informao fornecida por eles: Qual o comportamento dos dados (identificar modelos), se eistem valores etremos ou anormais (a!errantes), avaliar a varia!ilidade e eplic"la, ### $ssim, o primeiro passo % descrever os dados de forma apropriada e concisa# Para descrever os dados usando indicadores numricos ou tabelas, e eventualmente algum grfico, utiliza-se o menu do SPSS Analyse > Descriptive Statistics > .... . !tilize o fic"eiro t2_1.sav referente ao peso # nascen$a %g& de '( recm-nascidos num "ospital privado de San Diego, durante semana. Descreva a varivel em causa, usando a op$)o *+plore, referindo, a. -. de casos ////// -. de missings ///// b. 0edidas de tend1ncia central, 0dia ///// 0ediana ///// 0oda ///// c. 0edidas de 2ocaliza$)o, 3 ///// 34 ///// P5 ///// P65 ///// d. 0edidas de Dispers)o, i. *rro-padr)o ///// Desvio-padr)o ///// ii. Amplitude de varia$)o ////////// Amplitude inter7uartil ////////// iii. 8oeficiente de varia$)o ///// e. A varivel parece ter uma distribui$)o simtrica9 f. Avalie a e+ist1ncia de outliers. -:;A, Algumas das 7uest<es anteriores podem ser respondidas usando a op$)o Descriprive statistics ou =re7uencies, e complementadas com grficos. '. !tilize agora os dados de Aula1.sav. !sando as op$<es convenientes, responda, a. A maioria dos in7uiridos era de 7ue gnero9 8omo pode e+plicar este facto9 b. 3ual a ta+a de in7uiridos no >nterior do pa?s9 c. 3uantas fam?lias t1m, pelo menos, @ fil"os9 d. 3ual a ta+a de fam?lias numerosas %com pelo menos 4 fil"os& encontrada nesta amostra9 e. 0ais de metade dos in7uiridos tem, pelo menos, o '. ano9
Mestrado Integrado em Medicina
BioMatemtica 2008/09 Folha Prtica n 3 f. *m mdia. :s in7uiridos t1m mais de ' anos de escolaridade9 g. 3ual o n. m+imo de irm)os9 ". :s in7uiridos s)o, na generalidade, felizes9 i. 3ual a ta+a de indiv?duos 7ue se espera 7ue, na popula$)o, ten"a uma vida aborrecida9 A. '5B dos in7uiridos n)o t1m fil"os9 4. >ndi7ue se a idade mdia parece ser id1ntica consoante a regi)o de resid1ncia, a. usando a op$)o *+plore b. usando Data > Split =ile > :rganize output by groups based on reiao, seguido de Analize > Descriptive Statistics > Descriptive > i!a!e. -:;A, Colte ao menu Data > Split =ile > e escol"a Analyse all cases, do not create groups. @. -esta amostra, indi7ue, usando a op$)o 8rosstabs, a. *ntre os in7uiridos, 7ual a ta+a de mul"eres com vida rotineira9 b. -o gnero feminino, mais fre7uente encontrar mul"eres com uma vida aborrecida ou e+citante9 c. *ntre a7ueles 7ue t1m uma vida e+citante, 7ual o gnero com maior preval1ncia9 5. Seleccione a op$)o Datio para determinar a raz)o mdia e mediana %Statistics& de >dadeE-. de =il"os, globalmente, e em cada gnero %se"o - group&. -)o precisa das medidas de dispers)o. Sabendo 7ue ( anos antes o rcio global era de (.(, indi7ue uma raz)o plausivel para os valores actuais. F. *+porte os resultados do seu output para um fic"eiro compat?vel com o Gord. Cerifi7ue 7ue pode tambm e+portar os resultados para fic"eiros tipo H.+ls, Hppt ou H."tml. ' Mestrado Integrado em Medicina BioMatemtica 2008/09 Folha Prtica n 3 AED - GRFIOS :s grficos s)o normalmente usados para perceber Itend1nciasJ nos dados e n)o s)o t)o prticos 7uanto as tabelas para anlise de valores numricos estruturados. Para fazer grficos, seleccione a op$)o Krap"s > >nteractive > ... !se o fic"eiro 1991 #$ %eneral $ocial $urve&.sav para os grficos 7ue se seguem. : fic"eiro Aula.sav apenas uma pe7uena amostra retirada deste. Descri!"o dos dados . =a$a um grfico a. de barras %bars& da varivel rei'o i. =a$a agora um grfico de barras da rei'o por se"o. Analise as op$<es &olorE't(le, &luster)'tac*, +anel varia!les, ,-"coordinate. b. =a$a um diagrama circular %pie ou I7ueiAoJ& da varivel vi!a. *scol"a um grfico 4D, de B. c. =a$a um grfico 'D e um grfico 4D de Area da varivel (eli) segundo rei'o d. =a$a um grfico de lin"as %2ine& e escol"a a varivel ae, com contagem do n. de casos. Diagn#stico e E$%&ora!"o '. Seleccione Lo+plot e seleccione, a. ae por se". Analise as op$<es !oes, titles e options. b. ae por illeal !rus . =a$a este grfico na "orizontal. *+istem outliers9 c. ae por chil!s, fazendo clusters por se"o. 4. Seleccione Scatterplot e escol"a os pares e!uc-*ae!uc e e!uc-mae!uc. Parece-l"e 7ue o grau de escolaridade dos fil"os est relacionado com o grau de escolaridade do pai, ou da m)e9 4 Mestrado Integrado em Medicina BioMatemtica 2008/09 Folha Prtica n 3 F'n!(es de distri)'i!"o @. Seleccione Mistogram e escol"a a varivel ae, com display normal curve. a. Parece-l"e 7ue a idade segue uma distribui$)o normal9 b. Depresente tambm graficamente as fre7u1ncias acumuladas deta varivel. 5. ;ransforme a varivel ae em ln_ae %fol"a & e fa$a agora a. o "istograma desta varivel. b. !m grfico 3-3 usando Analyse > Descriptive Statistics > 3-3 F. ;ransforme a varivel ae em s+rt_ae %fol"a & e fa$a agora a. o "istograma desta varivel. b. !m grfico P-P usando Analyse > Descriptive Statistics > P-P N. 3ual a diferen$a entre os grficos P-P e 3-39 O. Seleccione *rror Lar para a varivel ae segundo illeal !rus. *scol"a a op$)o .rror !ars represent, a. Standard deviation of t"e mean, multiplier b. Standard error of t"e mean, multiplier ' c. 8onfidence interval for t"e mean, level 65B 6. 8onsidera 7ue os grupos s)o "omogneos, na idade, relativamente ao consumo de drogas ilegais9 @