Вы находитесь на странице: 1из 16

Determinao de medidas de localizao, disperso e forma

(s para var quantitativas)

No Rcmdr:
STATISTICS > SUMMARIES > NUMERICAL SUMMARIES > No separador Statistics escolher todas as opes para obter toda a informao No separador Data escolher a varivel (ex: income) Se escolher SUMMARIZE BY GROUPS > VARIABLE (ex:gender) obtm-se as estatsticas para as diferentes classes da varivel escolhida (ex: homens e mulheres separadamente)

Agrupamento de dados de uma varivel quantitativa em classes


(obtm-se nova varivel qualitativa ordinal)

ex: Agrupar os dados da varivel income (demo.sav) nas classes: <20, [20 ,40[, [40 ,60[, [60 ,80[, 80, criando a nova varivel inccat2. Escrever na Sript Window do Rcmdr: limites<-c(0,20,40,60,80, 1117) demo$inccat2<-cut(demo$income, limites, right=FALSE)
Data set nova var (ordinal) Data set var inicial limites (quantitativa) TRUE ] , ] FALSE [ , [

(# define os limites)

A nova varivel ser adicionada ltima coluna do data set (View data set). Proceder sua anlise como indicado para var qualitativas ordinais (Tabela de frequncias, grfico de barras/sectorial).

Nota 3:
Poderia recorrer-se ao menu para realizar o agrupamento dos dados

No Rcmdr:
DATA > MANAGE VARIABLES IN ACTIVE DATA SET > BIN NUMERICAL VARIABLE > VARIABLE income > NEW VARIABLE NAME income_cat > NUMBER OF BINS 5 > LEVEL NAME ranges > BINNING METHOD natural breaks Mas no muito til pois, no permite definir exactamente os intervalos pretendidos.

Com o objectivo de estudar o efeito de uma dieta na reduo de peso e melhoria do estado de sade dos seus utentes, a clnica de nutrio MenosPeso recolheu o conjunto de dados do ficheiro Ex1_Dieta, relativos a uma amostra de 16 indivduos, antes e depois de os submeter a um novo regime alimentar. 1.1 Como caracteriza esta amostra quanto ao gnero? 1.2 Quanto idade, compare a mdia e a mediana? O que pode concluir sobre a forma distribuio? Justifique 1.3 Em mdia, qual a diferena de peso verificada no final da dieta? 1.4 Apresente um grfico que represente a diferena de peso em funo do peso inicial e avalie o grau de correlao de ambas as variveis.

No Rcmdr: Clculos com variveis


DATA > MANAGE VARIABLES IN ACTIVEDATA SET > COMPUTE NEW VARIABLE Atribuir nome varivel. Introduzir expresso , seleccionando as variveis envolvidas com double-click.
A nova varivel ser adicionada ltima coluna do data set (View data set) Proceder sua anlise como indicado para var quantitativas (medidas descritivas, histograma/boxplot).

Grficos xy plot
GRAPHS > XY CONDITIONING PLOT
explanatory variable

Selecionar x e y tal que y=f(x)


response variable

Anlise Bivariada
Cruzamento e associao de variveis / Correlao

Relao entre variveis

Dependncia total (dependncia funcional)

Independncia

Quantificar a intensidade e a direo da associao entre duas variveis:


Qualitativas (nominais/ordinais):

Cruzamentos e Medidas de associao Coeficientes de correlao


(No indicam uma relao causal)

Qualitativas ordinais e Quantitativas:

Cruzamento de variveis (var Qualitativas)


Tabelas de contingncia (ou dupla entrada)
Freq. Observadas
Masculino Feminino Total No Rcmdr: STATISTICS > CONTINGENCY TABLES > TWO WAY TABLE

Turma A
O11 O21 C1

Turma B
O12 O22 C2

Total
R1 R2 n Frequncias abs. marginais

(DATA: escolher variveis para linhas e colunas; STATISTICS: escolher tipo de clculo das %)

Medidas de associao (var Qualitativas)


No R:
Instalar primeiro o package vcd (Visualizing Categorical Data)
PACKAGES > INSTALL PACKAGES > seleccionar CRAN mirror Portugal e procurar vcd
Comprehensive R Archive Network

Carregar o package vcd


PACKAGES > LOAD PACKAGES > seleccionar vcd

Medidas de associao (var Qualitativas)


No Rcmdr:

1 Criar tabela de contingncia (vcd requer tabela como input)


STATISTICS > CONTINGENCY TABLES > TWO-WAY TABLE >
(Ex: Data: Row variable - gender , Column variable - inccat Statistics: no selecionar testes de hipteses nem percentagens) Por defeito, o Rcmdr , aps apresentar a Tabela, elimina-a com remove(.Table).

Copiar e submeter os scripts que criam e mostram a tabela .Table <- xtabs(~gender+inccat, data=demo) (#cria novamente a tabela) .Table (# mostra a tabela) var1 var2 data set 2 Aplicar a funo assocstats() tabela assocstats(.Table)
(# calcula as medidas de associao)

Neste caso, qual o coeficiente que interessa analisar?

Coeficientes de correlao (var Qualitativas ordinais e var quantitativas)


Correlao: relao entre duas variveis (X var independente, Y var

dependente). X e Y podem variar no mesmo sentido ou em sentido inverso.

Coeficiente de correlao: Mede o grau e a direco da relao linear


entre duas variveis -1 < coeficiente < 1 (quanto mais prximo de -1 ou 1 mais forte a associao ) Coeficiente >0, associao direta Coeficiente <0, associao inversa

coeficiente

<0.3 fraca 0.3-0.7 moderada >0.7 forte

Coeficientes de correlao (var Qualitativas ordinais e var Quantitativas)


Coeficiente de correlao (linear) de Pearson (r)
Covarincia

Medida de associao paramtrica, de tipo linear, entre var quantitativas normalmente distribudas.

Desv. Pads.

S XY s X sY

S XY
Coeficiente de correlao de Spearman ()

1 n (xi x )( yi y ) n i 1

Medida de associao no paramtrica entre duas var ordinais ou quantitativas (no necessitam de satisfazer o pressuposto da normalidade).
(Alternativa a r quando as caractersticas das var quantitativas condicionam a sua utilizao. + Abrangente)
ATENO: Nas aulas, o coef. corr. Spearman aplicado apenas em variveis quantitativas, uma vez que o Rcmdr no permite (por defeito) estimar para variveis ordinais.

No Rcmdr:
1 STATISTICS > SUMMARIES > CORRELATION MATRIX

2 Escolher 2 var com CTRL


3 Escolher tipo de correlao (PEARSON / SPEARMAN)
(Opo PAIRWISE P-VALUES para avaliar o significado estatstico)

Para estudar o grau de satisfao dos clientes de um conjunto de farmcias de uma regio foi efectuado um inqurito a 660 indivduos. As respostas a estas questes no ficheiro Ex2_InqFarma.sav. 2.1. Caracterize a amostra quanto ao gnero e faixas etrias.

2.2. Dos 660 inquiridos, cerca de 73% desloca-se pelo menos 1 km para visitar a sua farmcia. Verdadeiro ou Falso?
2.3. Indique se existe uma relao entre a frequncia de visitas farmcia e o grau de satisfao global. O que conclui?