Академический Документы
Профессиональный Документы
Культура Документы
ario
1 Leitura de dados usando copiar colar.
2 Recursos gr
aficos
12
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
14
14
14
14
14
15
15
15
15
15
16
18
5 Fun
c
ao densidade probabilidade fdp
18
6 Matem
atica
19
7 Tabela da ANOVA
19
7.1 Distribuic
ao Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
7.2 BoxPlot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
8 Multivariada
22
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
23
25
25
25
25
27
39
10 Ler fun
c
ao externa
10.1 Dados Multinacional . . . .
10.2 Gr
afico Lattice . . . . . . .
10.3 ScottKnott, o TukeyC . . .
10.4 TukeyC . . . . . . . . . . .
10.5 UsingR . . . . . . . . . . .
10.6 Regress
ao linear . . . . . .
10.7 Experimentac
ao . . . . . . .
10.8 Estatstica n
ao parametrica
10.9 Regress
ao logistica . . . . .
10.10Sturges . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
42
47
60
64
66
75
79
83
84
85
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Neste t
opico ilustrei tres formas de um arquivo para dentro do R apenas com copiar e colar. Depois de
selecionar seus dados Ctrl+C em seu editor use read.table dentro do R.
1. dados<-read.table(clipboard,header=TRUE)
dados
2 1 2 39.85
2 1 3 40.15
2 2 1 40.13
2 2 2 40.13
2 2 3 39.56
2 3 1 39.63
2. dados2<-scan()
1 2 1 40.81
1 2 2 40.74
1 2 3 40.69
1 3 1 40.43
1 3 2 40.86
dados2
1 2 1 40.81
1 2 2 40.74
1 2 3 40.69
1 3 1 40.43
1 3 2 40.86
3. dados <-scan()
1 1 1 40.03
1 1 2 40.33
1 1 3 40.53
1 2 1 40.81
1 2 2 40.74
1 2 3 40.69
1 3 1 40.43
1 3 2 40.86
1 3 3 40.77
2 1 1 40.96
2 1 2 39.85
2 1 3 40.15
2 2 1 40.13
2 2 2 40.13
2 2 3 39.56
2 3 1 39.63
2 3 2 39.52
A
Gradua
ca
o
2 3 3 39.45
dados2<-matrix(dados,nc=4,nr=18,byrow=T)
colnames(dados2)<-c(dia, amostra,replicata,resposta)
dados2
dia amostra replicata resposta
1 1 1 40.03
1 1 2 40.33
1 1 3 40.53
1 2 1 40.81
1 2 2 40.74
1 2 3 40.69
1 3 1 40.43
1 3 2 40.86
1 3 3 40.77
2 1 1 40.96
2 1 2 39.85
2 1 3 40.15
2 2 1 40.13
2 2 2 40.13
2 2 3 39.56
2 3 1 39.63
2 3 2 39.52
2 3 3 39.45
4. sexo=scan(what= as.character)
feminino
masculino
feminino
feminino
feminino
feminino
feminino
feminino
feminino
feminino
feminino
masculino
masculino
feminino
masculino
masculino
feminino
feminino
feminino
masculino
masculino
masculino
feminino
masculino
feminino
Recursos gr
aficos
Muitas vezes e de interesse que em um histograma ter os proporcoes em %. Isto pode ser obtido desta forma.
> rf<-c(540,510,200,0,0,150,356,400,357,510,600,400,600,950,800,1000,600)
> h <- hist(rf, plot = FALSE)
> hist(rf, prob = TRUE, main="",xlab="Classes",ylab="Propor
c~
ao",col="limegreen",labels = sprintf("%s%%",
0.0015
40%
26.67%
0.0010
Proporo
13.33%
0.0005
13.33%
0.0000
6.67%
200
400
600
800
1000
Classes
100
60
40
20
Degradabilidade
80
Tratamento 1
Tratamento 2
>
>
>
>
>
20
40
60
80
100
Tempo (horas)
120
0.0010
0.0000
0.0005
Densidade
0.0015
> plot(density(rf),xlab="x",ylab="Densidade",main="",col=2,lty=2)
500
1000
> hist(rnorm(500,mean=2,sd=sqrt(4)),freq=FALSE,main="X~N(2,4)",xlab="",ylab="Densidade")
> curve(dnorm(x,mean=2,sd=sqrt(4)),col=2,lty=2,lwd=2,add=TRUE)
0.10
0.05
0.00
Densidade
0.15
0.20
X~N(2,4)
0.10
0.00
0.05
Frequncia
0.15
0.20
par(mfrow=c(2,1))
x <- rchisq(100, df = 4)
hist(x,prob=T, ylim = c(0, 0.2),main="",ylab="Frequ^
encia",xlab="Classes",col="lightgreen")
curve(dchisq(x, df = 4), col = 2, lty = 2, lwd = 2, add = TRUE)
BMI<-rnorm(n=1000, m=24.2, sd=2.2)
hist(BMI,prob=T, xlab="Classes", main="", col="lightgreen", xlim=c(15,35), ylim=c(0, .20),ylab="Frequ
curve(dnorm(x, mean=mean(BMI), sd=sd(BMI)), add=TRUE, lty=2, col = 2)
10
12
14
0.10
0.05
Frequencia
0.15
0.20
Classes
0.00
>
>
>
>
>
>
>
15
20
25
Classes
Figura 5: Curvas
30
35
par(mfrow=c(2,3))
BMI<-rnorm(n=1000, m=24.2, sd=2.2)
histinfo<-hist(BMI)
hist(BMI, breaks=20, main="Breaks=20")
hist(BMI, breaks=5, main="Breaks=5")
hist(BMI,breaks = "Sturges", main="Sturges")
hist(BMI, freq=FALSE, main="Density plot")
hist(BMI, freq=FALSE, xlab="Body Mass Index", main="Distribution of Body Mass Index", col="lightgreen"
curve(dnorm(x, mean=mean(BMI), sd=sd(BMI)), add=TRUE, col="darkblue", lwd=2)
Breaks=20
Breaks=5
20
25
30
300
0
100
50
50
200
Frequency
100
Frequency
100
Frequency
400
500
150
150
600
Histogram of BMI
20
25
30
15
20
25
30
BMI
BMI
Sturges
Density plot
35
25
BMI
30
0.05
0.00
0.00
20
0.10
Density
0.10
0.05
Density
100
50
Frequency
0.15
150
0.15
0.20
BMI
>
>
>
>
>
>
>
>
>
20
25
BMI
Figura 6: curvas
30
15
20
25
Body Mass Index
30
35
150000
100000
50000
Frequency
200000
250000
300000
x=rnorm(999900,70,6)
y=rnorm(999900,12,2)
z=rnorm(999900,30,1)
hist(x,xlim=range(x,y,z),main="")
hist(y,add=TRUE, border='blue')
hist(z,add=TRUE, border='red')
>
>
>
>
>
>
20
40
60
80
100
par(mfrow=c(1,2))
curve(dnorm(x,mean=1,sd=sqrt(2)),lwd=2,from=-6,to=17,ylab="Densidade")
curve(dnorm(x,mean=10,sd=sqrt(2)),col=2,lwd=2,add=T)
legend('topright',legend=c(expression(mu==1),expression(mu==10)),text.col=c(1,2),cex=1.5,bty="n")
title("Comparando a distribui
c~
ao normal com m
edias diferentes")
curve(dnorm(x,mean=4,sd=sqrt(3)),lwd=2,from=-15,to=25,ylab="Densidade")
curve(dnorm(x,mean=4,sd=sqrt(20)),col=2,lwd=2,add=T)
legend('topright',legend=c(expression(sigma^2==3),expression(sigma^2==20)),text.col=c(1,2),cex=1.5,bty
title("Comparando a distribui
c~
ao normal com vari^
ancias diferentes")
Comparando a distribuio normal com mdias diferentes
=1
= 10
0.10
Densidade
0.15
0.05
0.10
0.00
0.05
Densidade
0.15
0.20
0.20
0.25
2 = 3
2 = 20
0.00
>
>
>
>
>
>
>
>
>
10
15
10
10
x
20
Frequncia
require(agricolae)
data(growth)
attach(growth)
h1<-hist(height,col="green",xlim=c(6,16),main="",ylab="Frequ^
encia",xlab="Classes")
normal.freq(h1,col="blue")
>
>
>
>
>
10
12
Classes
10
14
16
>
>
>
>
>
TCF=seq(68,80)
RG=seq(32,37)
f1=function(x,y)3696.046+62.183*x-33.414*y
PCS=outer(TCF,RG,f1)
persp(TCF,RG,PCS,theta=-50,phi=-0,shade=2,ticktype = "simple",box=T,border=T,r = sqrt(20), d = 1,col="
PCS
TCF
RG
Figura 10: 3D
11
>
>
>
>
>
>
>
+
+
+
+
>
require(lattice)
b0 <- 10; b1 <- .5; b2 <- .3; int12 <- .2
g <- expand.grid(x = 1:20, y = 1:20)
g$z <- b0 + b1*g$x + b2*g$y + int12*g$x*g$y
i <- 45
rgb.palette <- colorRampPalette(c("yellow", "green4", "blue"), space = "rgb")
wireframe(z~x*y, data=g,
main="Em breve aqui estar
a o logotipo da [R-br]",
sub="Voc^
e tem sugest~
oes? Em breve uma enquete.",
screen=list(z=i, x=-60),
drape=TRUE, col.regions=rgb.palette(90))
Em breve aqui estar o logotipo da [Rbr]
100
80
z
60
40
x
20
Figura 11: 3d
Algumas vezes necessitamos filtrar um banco de dados o que pode ser feito assim.
> test<-cbind(c(rep(c("a","b"),5),rep(c("c"),3)),rnorm(13,5))
> test
[,1] [,2]
[1,] "a" "6.73639601703966"
[2,] "b" "4.08931250781133"
[3,] "a" "4.6219843334702"
[4,] "b" "5.10199927530805"
[5,] "a" "4.28784778823526"
[6,] "b" "5.3458819717746"
[7,] "a" "3.55664508814877"
[8,] "b" "5.90286217355144"
[9,] "a" "6.71059636804312"
[10,] "b" "6.37526460075227"
12
Ao usar R ambiente Linux para sair do manual R basta teclar Q e para terminar a execucao de determinado
processo Ctrl+C alem de quando precisar do caminho de algum arquivo no linux basta um Ctrl+L e a
compilac
ao de arquivos no Linux e feita por R CMD Sweave meu arquivo.rnw e para extrair apenas
o c
odigo R R CMD Stangle meu arquivo.rnw . Dois plugins especiais para o gedit com finalidade de
integrac
ao entre com R.s
ao:
1. Gedit-latex-plugin que pode ser instalado com;
sudo aptitude purge gedit-latex-plugin via terminal do Linux.
2. Rgedit que integra R com Gedit.
http://www.stattler.com/article/using-gedit-or-rgedit-r
http://sourceforge.net/projects/rgedit/
A melhor altenativa de IDE/livre e o Rstudio interface multiplataforma que tem perfeita integracao com R e
em 4 janelas pre definidas, perimite atuliazar pacotes e instalar pacotes de forma interativa. Pode ser baixada
em http://www.rstudio.org/
1. R+LATEX+ SWEAVE
2. R+LATEX+Knitr
3. R+HTML+Markdown
13
4.1
Sweave linux
4.2
knitr no linux
Gerac
ao de relat
orios din
amicos elegante, flexvel e rapida com R. O pacote foi projetado para ser um mecanismo de transparencia para a gerac
ao de relatorios dinamicos com R, resolver alguns problemas de longa
data em Sweave. knitr tem mesmo prop
osito do sweave. Instale o pacote knitr e crie seu arquivo .rnw install.packages(knitr, dep=T) n
ao e necesario carregar nenhum pacote no .rnw nem mesmo a biblioteca
knitr precisa ser carregada. A complilac
ao no RStudio e feita direta no menu compilacao desde que modifique
o tipo de arquivo .rnw na configurac
ao do RStudio.
4.3
4.4
http://ridiculas.wordpress.com
http://www.leg.ufpr.br/~paulojus/embrapa/Rembrapa
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
www.leg.ufpr.br/ce223
http://cran.r-project.org/web/views/
http://www.leg.ufpr.br/doku.php/pessoais:walmes
4.5
A mudanca de diret
orio
A mudanca de diret
orio pode ser feita da seguinte forma.
> getwd() # Area de trabalho atual
[1] "/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2"
> setwd("/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2") # Mudan
ca de diret
orio
14
4.6
Configuraco
es b
asicas para Linux
Para ler diretamente um banco de dados direto no formato .xls uma alternativa no Linux e o pacote gdata. Que
deve ser instalado inicialmente com o comando direto no terminal R install.packages(gdata, dep=T) ou
R CMD INSTALL nome do pacote .tar.gz para instalar um pacote ja baixado assim como a atualizac
ao de
um pacote especfico pode ser feita por update.packages(ask=gdata) e update.packages(ask= ) ou
update.packages(ask=F) para atualizar as bibliotecas ja instaladas. Para ver os banco de dados instalados
e disponveis no R data(). A edic
ao de um banco de dados pode ser feita com o comando fix(dados) ou
edit(dados) sendo que o ideal e configurar o editor de dados primeiramente options(editor=gedit).
Instalar um arquivo tar.gz basta install.packages(caminho/PACOTE.tar.gz,repos=NULL) a vers
ao de
cada pacote pode ser feita require(pacote) e depois veja as informacoes dessa sessao com sessionInfo(). Para
saber se est
a instalado e onde est
a find.package(NomeDoPacote) a descricao completa do pacote packageDescription(NomeDoPacote) para ver apenas a versao packageDescription(NomeDoPacote)$Version.
Para carregar um pacote de oculto (silencioso) require(xtable, quietly = TRUE) e instalar mais de um
pacote ao mesmo tempo install.packages(c(knitr, xtable), dependencies = TRUE). Os pacotes
carregados em uma sec
ao do R podem ser vistos com search()
4.7
Ajuda e demostrac
oes
4.8
Interface amig
avel para R
O pacote Rcmdr foi desenvolvido por John Fox visando atender a esta demanda. Para utilizar este pacote basta
instal
a-lo e carregar com o comando require(Rcmdr) e o menu se abrira automaticamente. Atencao: Note que
o Rcmdr n
ao prove acesso a toda funcionalidade do R mas simplesmente a alguns procedimentos estatsticos
mais usuais.
> install.packages("Rcmdr",dep=T)
> requre(Rcmdr)
4.9
Adicionando reposit
orios
4.10
http://www.tablesgenerator.com/
15
4.11
Manipulac
ao de diret
orios
> getwd()
[1] "/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2"
> setwd("/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2")
> require(xtable)
> require(gdata)
> dad<-read.xls("fungo.xls", encoding = "latin1") # Lendo banco de dados .xls
> str(dad)
# Imprimindo caracter
sticas de banco de dados dad
'data.frame':
198 obs. of 6 variables:
$ fruta : Factor w/ 3 levels "Abric
c","Batata",..: 3 3 3 3 3 3 3 3 3 3 ...
$ situa : Factor w/ 2 levels "Agitac","estac": 2 2 2 2 2 2 2 2 2 2 ...
$ cond : Factor w/ 2 levels "ci","si": 2 2 2 2 2 2 2 2 2 2 ...
$ tempo : Factor w/ 11 levels "10D","12D","14D",..: 8 9 10 11 1 2 3 4 5 6 ...
$ qtde : Factor w/ 3 levels "e0","e100","e200": 1 1 1 1 1 1 1 1 1 1 ...
$ medida: num 1.99 0.9 0.89 1.92 1.93 1.93 1.93 1.93 2.04 2.04 ...
> attach(dad) # Reconhecendo as vari
aveis do banco de dados dad
> detach(dad) # Deixando de reconhecer as vari
aveis do banco de dados dad
> summary(dad) # Estat
sticas descritivas do banco de dados dad
fruta
situa
cond
tempo
qtde
medida
Abric
c :66
Agitac:99
ci:132
10D
:18
e0 :66
Min.
:0.530
Batata :66
estac :99
si: 66
12D
:18
e100:66
1st Qu.:1.440
Cupua
cu:66
14D
:18
e200:66
Median :1.950
16D
:18
Mean
:1.838
18D
:18
3rd Qu.:2.098
20D
:18
Max.
:3.160
(Other):90
> head(dad) # seis primeiras linhas do banco de dados
fruta situa cond tempo qtde medida
1 Cupua
cu estac
si
2D
e0
1.99
2 Cupua
cu estac
si
4D
e0
0.90
3 Cupua
cu estac
si
6D
e0
0.89
4 Cupua
cu estac
si
8D
e0
1.92
5 Cupua
cu estac
si
10D
e0
1.93
6 Cupua
cu estac
si
12D
e0
1.93
> dad2<-read.xls("fungo.xls", encoding = "latin1") # Ou encoding="utf-8" para ler acentos
> head(dad2)
fruta situa cond tempo qtde medida
1 Cupua
cu estac
si
2D
e0
1.99
2 Cupua
cu estac
si
4D
e0
0.90
3 Cupua
cu estac
si
6D
e0
0.89
4 Cupua
cu estac
si
8D
e0
1.92
5 Cupua
cu estac
si
10D
e0
1.93
6 Cupua
cu estac
si
12D
e0
1.93
> dados4<-read.xls("teste.xlsx") #
Lendo banco de dados .xlsx
> dados4
x y z
1 2 3 3
2 3 6 4
3 4 7 5
4 5 8 6
5 6 9 8
6 5 0 9
> library(XLConnect)
> teste1<- readWorksheet(loadWorkbook("teste.xlsx"),sheet=1)
> teste1
x y z
1 2 3 3
2 3 6 4
16
3
4
5
6
>
>
4 7 5
5 8 6
6 9 8
5 0 9
teste2<- readWorksheet(loadWorkbook("fungo.xls"),sheet=1)
head(teste2)
fruta situa cond tempo qtde medida
1 Cupua
cu estac
si
2D
e0
1.99
2 Cupua
cu estac
si
4D
e0
0.90
3 Cupua
cu estac
si
6D
e0
0.89
4 Cupua
cu estac
si
8D
e0
1.92
5 Cupua
cu estac
si
10D
e0
1.93
6 Cupua
cu estac
si
12D
e0
1.93
> require(xlsx)
> setwd("/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2")
> dados=read.xlsx("teste.xlsx",sheetIndex=1)
> str(dados)
'data.frame':
6 obs. of 3 variables:
$ x: num 2 3 4 5 6 5
$ y: num 3 6 7 8 9 0
$ z: num 3 4 5 6 8 9
> summary(dados)
x
y
z
Min.
:2.000
Min.
:0.00
Min.
:3.000
1st Qu.:3.250
1st Qu.:3.75
1st Qu.:4.250
Median :4.500
Median :6.50
Median :5.500
Mean
:4.167
Mean
:5.50
Mean
:5.833
3rd Qu.:5.000
3rd Qu.:7.75
3rd Qu.:7.500
Max.
:6.000
Max.
:9.00
Max.
:9.000
> dados3<-read.csv2("dbc.csv", h = T)
> dados3
Tra.Bloco.Y
1
a,A,83
2
a,B,63
3
a,C,55
4
b,A,86
5
b,B,69
6
b,C,61
7
c,A,103
8
c,B,79
9
c,C,79
10
d,A,116
11
d,B,81
12
d,C,79
13
e,A,132
14
e,B,98
15
e,C,91
> setwd("/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2") # Nova
area de trabalho
An
alise descritiva de algumas vari
aveis do banco de dados dad.
> attach(dad)
> summary(medida) # Resumo descritivo da vari
avel medida
Min. 1st Qu. Median
Mean 3rd Qu.
Max.
0.530
1.440
1.950
1.838
2.098
3.160
17
4.12
par(mfrow=c(1,2))
hist(medida,xlab="Medidas",ylab="Densidade",main="",col="limegreen")
boxplot(medida~fruta,col="blue",main="")
points(1:nlevels(fruta), tapply(medida,fruta, mean),pch=19,col="red")
2.5
2.0
40
1.5
30
0
0.5
10
1.0
20
Densidade
50
3.0
60
>
>
>
>
0.5
1.0
1.5
2.0
2.5
3.0
3.5
Abric
Batata
Cupuau
Medidas
Fun
c
ao densidade probabilidade fdp
0.0
0.1
0.2
f(x)
0.3
0.4
0.5
> plot(x,y,type="l",ylab="f(x)")
> f1<-function(x) {
+ ret<-x/2*(x>=0 & x<1) + 1/2*(x>=1 & x<2)+ ((3-x)/2)*(x>=2
+ &x<3)+0
18
+
+
>
1
ret
}
integrate(f1,-1,5) # Integra
c~
ao da fun
c~
ao f(x) entre -1 e 5
with absolute error < 7.4e-05
Matem
atica
Determinac
ao dos divisores de um n
umero natural
> require(divisors)
> divisors(131)
$num
[1] 2
$divs
[1]
1 131
A resoluc
ao de uma equac
ao pode ser feita assim. Considere f (x) = 3 4.x + x2
> polyroot(c(3, -4, 1))
[1] 1+0i 3+0i
O Resto da divis
ao de a por b e dado por
> 150 %% 13
[1] 7
C49,6 =
49!
6!(496)!
> factorial(49)/(factorial(6)*factorial(49-6))
[1] 13983816
> y=c(1,2,3,4,4,5,6,7,8,0,9)
> y
[1] 1 2 3 4 4 5 6 7 8 0 9
> as.integer(y >= 3) # Maiores iguais a 3 coloque 1 menores que tr^
es coloque 0
[1] 0 0 1 1 1 1 1 1 1 0 1
Tabela da ANOVA
As func
oes lm, aov e Anova (pacote car) s
ao as mais comuns para imprimir a tabela da ANOVA. Apenas para
fins de ilustrac
ao ser
a construido 3 modelos, cada um com uma das funcoes para fins de comparacao.
> setwd("/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2")
> require(gdata)
> dad2<-read.xls("dbc.xls")
> attach(dad2)
> require(car)
> fit1=lm(Y~Tra+Bloco)
> options(scipen=5)
> summary(fit1)
Call:
lm(formula = Y ~ Tra + Bloco)
Residuals:
Min
1Q Median
-5.0
-3.0
-1.0
3Q
3.5
Max
6.0
19
Coefficients:
Estimate Std. Error t value
(Intercept)
86.000
3.276 26.250
Trab
5.000
3.916
1.277
Trac
20.000
3.916
5.108
Trad
25.000
3.916
6.384
Trae
40.000
3.916 10.215
BlocoB
-26.000
3.033 -8.572
BlocoC
-31.000
3.033 -10.220
--Signif. codes: 0 *** 0.001 ** 0.01
Pr(>|t|)
0.00000000477
0.237456
0.000921
0.000213
0.00000723969
0.00002647667
0.00000721153
***
***
***
***
***
***
* 0.05 . 0.1 1
0.9467
require(xtable)
a=anova(fit1)
x=xtable(a,caption ="Tabela ANOVA",align="llllll")
print(x,caption.placement='top',table.placement="H")
Tra
Bloco
Residuals
Df
4
2
8
Pr(>F)
0.0000
0.0000
> u=Anova(fit1)
> xtable(u)
Tra
Bloco
Residuals
Sum Sq
3090.00
2770.00
184.00
(Intercept)
Tra
Bloco
Residuals
Sum Sq
15848.57
3090.00
2770.00
184.00
Df
4
2
8
F value
33.59
60.22
Pr(>F)
0.0000
0.0000
> p=Anova(fit1,type="III")
> xtable(p)
Df
1
4
2
8
20
F value
689.07
33.59
60.22
Pr(>F)
0.0000
0.0000
0.0000
7.1
par(mfrow=c(2,2))
p<-0.4
n<-10
x<-0:n
px<-choose(n,x)*p^x*(1-p)^(n-x)
barplot(px,names=as.character(x))
plot(0:8,choose(8,0:8),type="h",main="Coeficiente binomial")
barplot(dbinom(0:4,4,0.1),names=as.character(0:4),xlab="x",ylab="f(x)")
plot(dbinom(0:16, 16, 0.3), type = "h", xlab = "Numeros de f^
emeas",ylab = "Probabilidade")
50
20
0
0.00
0.15
choose(8, 0:8)
Coeficiente binomial
10
0.20
0.10
0.00
0.0
0.3
Probabilidade
0.6
0:8
f(x)
>
>
>
>
>
>
>
>
>
>
Distribuic
ao Binomial
10
Numeros de fmeas
21
15
7.2
0
1
2
par(mfrow=c(1,2))
x=rnorm(33)
boxplot(x)
boxplot(x,notch=T)
>
>
>
>
BoxPlot
Multivariada
Uma func
ao que pode ajudar nas an
alises e manova
> tear <- c(6.5, 6.2, 5.8, 6.5, 6.5, 6.9, 7.2, 6.9, 6.1, 6.3,
+
6.7, 6.6, 7.2, 7.1, 6.8, 7.1, 7.0, 7.2, 7.5, 7.6)
> gloss <- c(9.5, 9.9, 9.6, 9.6, 9.2, 9.1, 10.0, 9.9, 9.5, 9.4,
+
9.1, 9.3, 8.3, 8.4, 8.5, 9.2, 8.8, 9.7, 10.1, 9.2)
> opacity <- c(4.4, 6.4, 3.0, 4.1, 0.8, 5.7, 2.0, 3.9, 1.9, 5.7,
+
2.8, 4.1, 3.8, 1.6, 3.4, 8.4, 5.2, 6.9, 2.7, 1.9)
> Y <- cbind(tear, gloss, opacity)
> rate <- factor(gl(2,10), labels=c("Low", "High"))
> additive <- factor(gl(2, 5, length=20), labels=c("Low", "High"))
> fit <- manova(Y ~ rate*additive)
> summary.aov(fit)
# Tabela de anova univariadas
Response tear :
Df Sum Sq Mean Sq F value
Pr(>F)
rate
1 1.7405 1.74050 15.7868 0.001092 **
additive
1 0.7605 0.76050 6.8980 0.018330 *
rate:additive 1 0.0005 0.00050 0.0045 0.947143
Residuals
16 1.7640 0.11025
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Response gloss :
Df Sum Sq
rate
1 1.3005
additive
1 0.6125
rate:additive 1 0.5445
Residuals
16 2.6280
---
22
Signif. codes:
Response opacity :
Df Sum Sq Mean Sq F value Pr(>F)
rate
1 0.421 0.4205 0.1036 0.7517
additive
1 4.901 4.9005 1.2077 0.2881
rate:additive 1 3.960 3.9605 0.9760 0.3379
Residuals
16 64.924 4.0578
> summary(fit)
# Tabela manova
Df Pillai approx F num Df den Df
Pr(>F)
rate
1 0.61814
7.5543
3
14 0.003034 **
additive
1 0.47697
4.2556
3
14 0.024745 *
rate:additive 1 0.22289
1.3385
3
14 0.301782
Residuals
16
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
A extrac
ao de elementos necess
arios podem ser feito por fit$Eigenvalues ou fit$SS
> summary(fit1)
Call:
glm(formula = counts ~ outcome + treatment, family = poisson())
Deviance Residuals:
1
2
3
-0.67125
0.96272 -0.16965
9
-0.96656
4
-0.21999
5
-0.95552
6
1.04939
7
0.84715
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.045e+00 1.709e-01 17.815
<2e-16 ***
outcome2
-4.543e-01 2.022e-01 -2.247
0.0246 *
outcome3
-2.930e-01 1.927e-01 -1.520
0.1285
treatment2 -1.305e-15 2.000e-01
0.000
1.0000
treatment3 -1.865e-15 2.000e-01
0.000
1.0000
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 10.5814
Residual deviance: 5.1291
AIC: 56.761
on 8
on 4
degrees of freedom
degrees of freedom
- treatment
<none>
- outcome
Df Deviance
AIC
2
5.1291 52.761
5.1291 56.761
2 10.5814 58.214
Step: AIC=52.76
counts ~ outcome
<none>
- outcome
Df Deviance
AIC
5.1291 52.761
2 10.5814 54.214
Call:
glm(formula = counts ~ outcome, family = poisson())
Deviance Residuals:
Min
1Q
Median
-0.9666 -0.6713 -0.1696
3Q
0.8471
Max
1.0494
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept)
3.0445
0.1260 24.165
<2e-16 ***
outcome2
-0.4543
0.2022 -2.247
0.0246 *
outcome3
-0.2930
0.1927 -1.520
0.1285
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Dispersion parameter for poisson family taken to be 1)
24
8
-0.09167
on 8
on 6
degrees of freedom
degrees of freedom
Call:
glm(formula = counts ~ outcome + treatment, family = poisson())
Deviance Residuals:
1
2
3
-0.67125
0.96272 -0.16965
9
-0.96656
4
-0.21999
5
-0.95552
6
1.04939
7
0.84715
8
-0.09167
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.045e+00 1.709e-01 17.815
<2e-16 ***
outcome2
-4.543e-01 2.022e-01 -2.247
0.0246 *
outcome3
-2.930e-01 1.927e-01 -1.520
0.1285
treatment2 -1.305e-15 2.000e-01
0.000
1.0000
treatment3 -1.865e-15 2.000e-01
0.000
1.0000
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 10.5814
Residual deviance: 5.1291
AIC: 56.761
on 8
on 4
degrees of freedom
degrees of freedom
9.1
Redefinic
ao de nveis de refer
encia
9.2
Contrates em GLM
9.3
Func
ao de m
axima verossimilhanca penalizada
9.4
Teste estatsticos
25
> rownames(matriz)<-c("Exposed","Unexposed")
> matriz
Disease Control
Exposed
156
9421
Unexposed
1531
14797
Teste em tabelas de contingencia Teste de quiquadrado e Fisher.
26
Admit
Gender
Admitted Rejected
Male
1198
1493
Female
557
1278
9.5
Estatstica Descritivas
>
>
>
>
>
require(fdth)
x<-rnorm(n=100,mean=5,sd=1)
fdt(x)
d=fdt(x)
d
27
Class limits
[2.99,3.6)
[3.6,4.21)
[4.21,4.81)
[4.81,5.42)
[5.42,6.03)
[6.03,6.64)
[6.64,7.24)
[7.24,7.85)
f
6
15
18
31
15
11
3
1
rf rf(%) cf cf(%)
0.06
6
6
6
0.15
15 21
21
0.18
18 39
39
0.31
31 70
70
0.15
15 85
85
0.11
11 96
96
0.03
3 99
99
0.01
1 100
100
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
empresa
idad filhos
26
0
32
1
36
2
20
0
40
1
28
1
41
0
43
0
34
1
23
0
33
2
27
0
37
0
44
3
30
0
38
3
31
1
39
2
25
1
37
0
30
1
34
2
41
4
26
0
32
2
35
2
46
0
29
2
40
5
35
2
31
3
36
1
43
3
33
4
48
2
42
3
> fit=lm(sal~esc+sexo)
> xtable(anova(fit))
esc
sexo
Residuals
Df
2
1
32
Sum Sq
307.82
10.47
415.49
Mean Sq
153.91
10.47
12.98
F value
11.85
0.81
Pr(>F)
0.0001
0.3759
> xtable(summary(fit))
(Intercept)
esc2 grau
escsuperior
sexomasculino
Estimate
7.0698
3.9540
8.8557
1.0990
Std. Error
1.3221
1.3583
1.8132
1.2240
> require(fdth)
> tab1=fdt(idad, start=20,h=6,end=50)
> tab1
29
t value
5.35
2.91
4.88
0.90
Pr(>|t|)
0.0000
0.0065
0.0000
0.3759
Class limits f
rf rf(%) cf cf(%)
[20,26) 3 0.08 8.33 3
8.33
[26,32) 9 0.25 25.00 12 33.33
[32,38) 12 0.33 33.33 24 66.67
[38,44) 9 0.25 25.00 33 91.67
[44,50) 3 0.08 8.33 36 100.00
> tab2=fdt(idad,breaks="Sturges")
> tab2
Class limits f
rf rf(%) cf cf(%)
[19.8,23.9) 2 0.06 5.56 2
5.56
[23.9,28) 4 0.11 11.11 6 16.67
[28,32.1) 8 0.22 22.22 14 38.89
[32.1,36.2) 8 0.22 22.22 22 61.11
[36.2,40.3) 6 0.17 16.67 28 77.78
[40.3,44.4) 6 0.17 16.67 34 94.44
[44.4,48.5) 2 0.06 5.56 36 100.00
> dados=cbind(rnorm(8000),rnorm(8000))
> tab3=fdt(dados,breaks="Sturges")
> tab3
Column:1
Class limits
f
rf rf(%)
cf cf(%)
[-3.5,-2.95)
13 0.00 0.16
13
0.16
[-2.95,-2.4)
56 0.01 0.70
69
0.86
[-2.4,-1.85) 174 0.02 2.17 243
3.04
[-1.85,-1.3) 507 0.06 6.34 750
9.38
[-1.3,-0.753) 1094 0.14 13.68 1844 23.05
[-0.753,-0.205) 1545 0.19 19.31 3389 42.36
[-0.205,0.344) 1800 0.22 22.50 5189 64.86
[0.344,0.892) 1388 0.17 17.35 6577 82.21
[0.892,1.44) 875 0.11 10.94 7452 93.15
[1.44,1.99) 381 0.05 4.76 7833 97.91
[1.99,2.54) 122 0.02 1.52 7955 99.44
[2.54,3.09)
37 0.00 0.46 7992 99.90
[3.09,3.64)
5 0.00 0.06 7997 99.96
[3.64,4.18)
3 0.00 0.04 8000 100.00
Column:2
Class limits
[-4.02,-3.47)
[-3.47,-2.92)
[-2.92,-2.37)
[-2.37,-1.82)
[-1.82,-1.27)
[-1.27,-0.723)
[-0.723,-0.174)
[-0.174,0.375)
[0.375,0.924)
[0.924,1.47)
[1.47,2.02)
[2.02,2.57)
[2.57,3.12)
[3.12,3.67)
f
2
15
66
209
538
1043
1528
1732
1411
884
390
147
30
5
rf
0.00
0.00
0.01
0.03
0.07
0.13
0.19
0.22
0.18
0.11
0.05
0.02
0.00
0.00
rf(%)
0.02
0.19
0.82
2.61
6.73
13.04
19.10
21.65
17.64
11.05
4.88
1.84
0.38
0.06
cf cf(%)
2
0.02
17
0.21
83
1.04
292
3.65
830 10.38
1873 23.41
3401 42.51
5133 64.16
6544 81.80
7428 92.85
7818 97.73
7965 99.56
7995 99.94
8000 100.00
30
14
12
10
8
6
0
Frequencia
20
26
32
38
44
50
1000
0
Frequencia
Column:1
3.50
2.40
1.30
0.20
0.89
1.99
3.09
4.18
1.47
2.57
3.67
1000 2000
0
Frequencia
Column:2
4.02
2.92
1.82
0.72
0.38
> median(sal)
[1] 10.165
> dad2=subset(dad, sexo == "masculino ")
> dad2
sexo
esc
sal idad filhos
1 masculino
1 grau 4.00
26
0
2 masculino
1 grau 4.56
32
1
4 masculino
2 grau 5.73
20
0
6 masculino
1 grau 6.66
28
1
8 masculino
1 grau 7.39
43
0
10 masculino
2 grau 7.84
23
0
12 masculino
1 grau 8.46
27
0
14 masculino
1 grau 8.95
44
3
16 masculino
2 grau 9.35
38
3
18 masculino
1 grau 9.80
39
2
20 masculino
2 grau 10.76
37
0
22 masculino
1 grau 11.59
34
2
24 masculino superior 12.79
26
0
26 masculino
2 grau 13.60
35
2
28 masculino
2 grau 14.69
29
2
29 masculino
2 grau 14.71
40
5
30 masculino
2 grau 15.99
35
2
31
32 masculino
2 grau 16.61
34 masculino superior 18.75
36 masculino superior 23.30
> summary(dad2)
sexo
esc
feminino : 0
1 grau :8
masculino :20
2 grau :9
superior:3
36
33
42
1
4
3
sal
Min.
: 4.000
1st Qu.: 7.728
Median :10.280
Mean
:11.277
3rd Qu.:14.695
Max.
:23.300
idad
Min.
:20.00
1st Qu.:27.75
Median :34.50
Mean
:33.35
3rd Qu.:38.25
Max.
:44.00
filhos
Min.
:0.00
1st Qu.:0.00
Median :1.50
Mean
:1.55
3rd Qu.:2.25
Max.
:5.00
> library(doBy)
> summaryBy(sal~sexo,dad,FUN=c(mean))
sexo sal.mean
1 feminino 10.95438
2 masculino 11.27650
> summaryBy(sal~esc,dad,FUN=c(mean,sd))
esc sal.mean
sal.sd
1
1 grau 7.80250 2.905913
2
2 grau 11.57333 3.691888
3 superior 16.47500 4.502438
> fit=aov(sal~sexo)
> popMeans(fit, effect="sexo")
beta0 Estimate Std.Error
t.value DF Pr(>|t|)
Lower
Upper
sexo
1
0 10.95437 1.160672 9.437963 34
0 8.595607 13.31314 feminino
2
0 11.27650 1.038136 10.862255 34
0 9.166753 13.38625 masculino
> TukeyHSD(fit)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = sal ~ sexo)
$sexo
masculino -feminino
diff
lwr
upr
p adj
0.322125 -2.842495 3.486745 0.8373522
32
> require(epicalc)
> xtabs(sal~sexo, dad) # Soma salario por sexo
sexo
feminino masculino
175.27
225.53
> xtabs(sal~esc, dad) # Soma salario por escolaridade
esc
1 grau
2 grau superior
93.63
208.32
98.85
> addmargins(xtabs(sal~esc, dad)) # Adiciona total marginal na tabela
esc
1 grau
2 grau superior
Sum
93.63
208.32
98.85
400.80
> summ(sal,box=T,main="Distribui
c~
ao da vari
avel resposta",ylab="")
obs. mean
median s.d.
min.
max.
36
11.133 10.165 4.58
4
23.3
> table(sexo)
sexo
feminino masculino
16
20
> prop.table(table(sexo))
sexo
feminino masculino
0.4444444 0.5555556
> addmargins(table(sexo),FUN = mean)
sexo
feminino masculino
mean
16
20
18
Distribuio da varivel resposta
10
15
33
20
0.500
0.500
0.167
0.188
0.150
0.083
0.083
-----------------------------------------Total
16
20
36
0.444
0.556
==========================================
> require(descr)
> CrossTable(sexo)
Conte
udo das c
elulas
|-------------------------|
|
N |
|
N / Total da linha |
|-------------------------|
| feminino | masculino |
|------------|------------|
|
16 |
20 |
|
0.444 |
0.556 |
|------------|------------|
> CrossTable(sal)
Conte
udo das c
elulas
|-------------------------|
|
N |
|
N / Total da linha |
|-------------------------|
|
4 | 4.56 | 5.25 | 5.73 | 6.26 | 6.66 | 6.86 | 7.39 | 7.59 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
| 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
| 7.84 | 8.12 | 8.46 | 8.74 | 8.95 | 9.13 | 9.35 | 9.77 |
9.8 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
| 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
| 10.53 | 10.76 | 11.06 | 11.59 |
12 | 12.79 | 13.23 | 13.6 | 13.85 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
| 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
| 14.69 | 14.71 | 15.99 | 16.22 | 16.61 | 17.26 | 18.75 | 19.4 | 23.3 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
| 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 | 0.028 |
|-------|-------|-------|-------|-------|-------|-------|-------|-------|
> CrossTable(esc)
Conte
udo das c
elulas
|-------------------------|
|
N |
|
N / Total da linha |
|-------------------------|
|
1 grau |
2 grau | superior |
|----------|----------|----------|
|
12 |
18 |
6 |
35
|
0.333 |
0.500 |
0.167 |
|----------|----------|----------|
> CrossTable(filhos)
Conte
udo das c
elulas
|-------------------------|
|
N |
|
N / Total da linha |
|-------------------------|
|
0 |
1 |
2 |
3 |
4 |
5 |
|--------|--------|--------|--------|--------|--------|
|
11 |
8 |
9 |
5 |
2 |
1 |
| 0.306 | 0.222 | 0.250 | 0.139 | 0.056 | 0.028 |
|--------|--------|--------|--------|--------|--------|
> require(descr)
> descr(sexo)
feminino masculino
16
20
> descr(sal)
Min. 1st Qu. Median
Mean 3rd Qu.
Max.
4.000
7.778 10.160 11.130 14.060 23.300
> compmeans(sal,sexo)
Valor m
edio de "sal" segundo "sexo"
M
edia N Desv. Pd.
feminino
10.95438 16 4.114950
masculino 11.27650 20 5.020285
Total
11.13333 36 4.578760
> crosstab(sexo,esc)
# Otimo para cruzar duas vari
aveis categ
oricas
Conte
udo das c
elulas
|-------------------------|
|
Contagem |
|-------------------------|
================================================
esc
sexo
1 grau
2 grau
superior
Total
-----------------------------------------------feminino
4
9
3
16
-----------------------------------------------masculino
8
9
3
20
-----------------------------------------------Total
12
18
6
36
================================================
> table(sexo,esc)
# Otimo para cruzar duas vari
aveis categ
oricas
esc
sexo
1 grau 2 grau superior
feminino
4
9
3
masculino
8
9
3
> table(sexo,esc,filhos) # Otimo para cruzar duas vari
aveis categ
oricas
, , filhos = 0
sexo
feminino
masculino
esc
1 grau 2 grau superior
2
2
0
3
3
1
, , filhos = 1
esc
36
sexo
feminino
masculino
, , filhos = 2
sexo
feminino
masculino
esc
1 grau 2 grau superior
1
3
0
2
3
0
, , filhos = 3
sexo
feminino
masculino
esc
1 grau 2 grau superior
0
0
2
1
1
1
, , filhos = 4
sexo
feminino
masculino
esc
1 grau 2 grau superior
0
1
0
0
0
1
, , filhos = 5
esc
sexo
1 grau 2 grau superior
feminino
0
0
0
masculino
0
1
0
> require(gregmisc)
> CrossTable(esc, format = "SPSS")
Conte
udo das c
elulas
|-------------------------|
|
Contagem |
|
Percentual por linha |
|-------------------------|
|
1 grau |
2 grau | superior |
|----------|----------|----------|
|
12 |
18 |
6 |
|
33.333 |
50.000 |
16.667 |
|----------|----------|----------|
> CrossTable(esc, format = "SAS")
Conte
udo das c
elulas
|-------------------------|
|
N |
|
N / Total da linha |
|-------------------------|
|
1 grau |
2 grau | superior |
|----------|----------|----------|
|
12 |
18 |
6 |
|
0.333 |
0.500 |
0.167 |
|----------|----------|----------|
> # Estat
sticas descritivas
> library(fBasics)
> basicStats(sal)
37
sal
nobs
36.000000
NAs
0.000000
Minimum
4.000000
Maximum
23.300000
1. Quartile
7.777500
3. Quartile 14.060000
Mean
11.133333
Median
10.165000
Sum
400.800000
SE Mean
0.763127
LCL Mean
9.584104
UCL Mean
12.682563
Variance
20.965046
Stdev
4.578760
Skewness
0.600356
Kurtosis
-0.318921
> require(AdequacyModel)
> hist(sal)
> descriptive(sal)
$mean
[1] 11.13333
$median
[1] 10.165
$mode
[1] 9
$variance
[1] 20.96505
$Skewness
[1] 0.62627
$Kurtosis
[1] -0.16353
$minimum
[1] 4
$maximum
[1] 23.3
$n
[1] 36
> ftable(sexo)
sexo feminino masculino
16
20
> require(psych)
> describe(sal)
var n mean
sd median trimmed mad min max range skew kurtosis
se
1
1 36 11.13 4.58 10.16
10.85 4.72
4 23.3 19.3 0.6
-0.32 0.76
> require(Hmisc)
> describe(sal)
> require(epicalc)
> shapiro.qqnorm(sal)
38
15
10
5
Sample Quantiles
20
Theoretical Quantiles
> require(fBasics)
> qqnormPlot(sal)
0
1
NORM QQ PLOT
0
Normal Quantiles
9.6
Biblioteca ExpDes
A biblioteca para an
alise numa u
nica rodada pode ser encontrada no site do autor https://sites.google.
com/site/ericbferreira/home neste caso baixei a versao ExpDes.pt para linux e compilei via terminal.
R CMD INSTALL ExpDes.pt_1.1.2.tar.gz
ou instale via install.packages(ExpDes.pt, dep=T) nos repositorios estao mantidas as duas versoes em portugues e ingles.
> require(ExpDes.pt) # vers~
ao portugu^
es
> dic(esc, sal, quali = TRUE, mcomp = "tukey", sigT = 0.05, sigF = 0.05)
-----------------------------------------------------------------------Quadro da analise de variancia
-----------------------------------------------------------------------GL
SQ
QM
Fc
Pr>Fc
Tratamento 2 307.82 153.909 11.924 0.00012669
Residuo
33 425.96 12.908
Total
35 733.78
-----------------------------------------------------------------------CV = 32.27 %
39
40
As func
oes disponveis no pacote ExpDes (nomes em portugues) podem ser aplicadas aos seguintes tipos de
delineamentos experimentais, sempre considerando fatores de efeito fixo:
fun
c
ao
descri
c
ao
dic() Delineamento Inteiramente Casualizado balanceado com um so fator.
dbc() Delineamento em Blocos Casualizados balanceado com um so fator.
dql() Delineamento em Quadrado Latino balanceado com um so fator.
fat2.dic() Delineamento Inteiramente Casualizado balanceado em fatorial duplo.
fat2.dbc() Delineamento em Blocos Casualizados balanceado em fatorial duplo.
fat2.ad.dic() Delineamento Inteiramente Casualizado balanceado em fatorial duplo com um tratamento adicional.
fat2.ad.dbc() Delineamento em Blocos Casualizados balanceado em fatorial duplo com um tratamento adicional.
fat3.dic() Delineamento Inteiramente Casualizado balanceado em fatorial triplo.
fat3.dbc() Delineamento em Blocos Casualizados balanceado em fatorial triplo.
fat3.ad.dic() Delineamento Inteiramente Casualizado balanceado em fatorial triplo com um tratamento adicional.
fat3.ad.dbc() Delineamento em Blocos Casualizados balanceado em fatorial triplo com um tratamento adicional.
psub2.dic() Delineamento Inteiramente Casualizado balanceado em esquema de parcelas subdivididas.
psub2.dbc() Delineamento em Blocos Casualizados balanceado em esquema de parcelas subdivididas.
10
Ler fun
c
ao externa
41
1.0
0.0
0.2
0.4
0.6
0.8
1.0
0.8
0.6
y
0.4
0.2
0.0
10
20
40
60
80
100
Time
0.6
y
0.0
0.0
0.2
0.2
0.4
0.4
0.6
0.8
1.0
Time
200
400
600
800
1000
500
Time
10.1
1000
1500
2000
Time
Dados Multinacional
42
Residuals
46
1561
33.9
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
> library(doBy)
> summaryBy(salario~sexo,dados,FUN=c(mean,sd))
sexo salario.mean salario.sd
1
Feminino
24.13889
8.248789
2
Masculino
24.61250
8.436356
> summaryBy(salario~escolaridade,dados,FUN=c(mean,sd))
escolaridade salario.mean salario.sd
1
m
edio
11.45000
3.370905
2
p
os-gradua
c~
ao
32.60000
7.354998
3
superior
24.08485
5.642535
> library(fBasics)
> basicStats(salario)
salario
nobs
50.000000
NAs
0.000000
Minimum
6.500000
Maximum
41.000000
1. Quartile
19.300000
3. Quartile
29.750000
Mean
24.442000
Median
23.300000
Sum
1222.100000
SE Mean
1.172063
LCL Mean
22.086652
UCL Mean
26.797348
Variance
68.686567
Stdev
8.287736
Skewness
0.205725
Kurtosis
-0.492068
> require(descr)
> crosstab(sexo,escolaridade) #
otimo cruzar duas vari
aveis
Conte
udo das c
elulas
|-------------------------|
|
Contagem |
|-------------------------|
=============================================================
escolaridade
sexo
m
edio
p
os-gradua
ca
~o
superior
Total
------------------------------------------------------------Feminino
2
6
10
18
------------------------------------------------------------Masculino
4
5
23
32
------------------------------------------------------------Total
6
11
33
50
=============================================================
> require(gmodels)
> CrossTable(sexo,escolaridade, expected = TRUE)
Conte
udo das c
elulas
|-------------------------|
|
N |
|
N esperado |
| Contribui
c~
ao para Qui2 |
|
N / Total da linha |
|
N / Total da coluna |
|
N / Total da tabela |
43
|-------------------------|
=============================================================
escolaridade
sexo
m
edio
p
os-gradua
ca
~o
superior
Total
------------------------------------------------------------Feminino
2
6
10
18
2.2
4.0
11.9
0.012
1.051
0.298
0.111
0.333
0.556
0.360
0.333
0.545
0.303
0.040
0.120
0.200
------------------------------------------------------------Masculino
4
5
23
32
3.8
7.0
21.1
0.007
0.591
0.167
0.125
0.156
0.719
0.640
0.667
0.455
0.697
0.080
0.100
0.460
------------------------------------------------------------Total
6
11
33
50
0.120
0.220
0.660
=============================================================
> boxplot(salario~sexo)
> boxplot(salario~escolaridade)
44
10
15
20
Mdia
25
30
35
mdio
psgraduao
Escolaridade
45
superior
15
20
medias
25
30
35
setwd("/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2")
require(gdata)
dados<-read.xls("multinacional.xls", encoding = "latin1")
extratifica
c~
ao<-split(salario, escolaridade)
medias<-sapply(extratifica
c~
ao, mean)
desviopadr~
ao<-sqrt(sapply(extratifica
c~
ao,var))
n<-sapply(extratifica
c~
ao,length)
erro<- qt(0.975,n)*desviopadr~
ao/sqrt(n)
require(gplots)
plotCI(x=medias, uiw=erro)
10
>
>
>
>
>
>
>
>
>
>
1.0
1.5
2.0
2.5
46
3.0
10.2
Gr
afico Lattice
40
salario
30
20
10
Feminino
Masculino
sexo
48
40
salario
30
20
10
mdio
psgraduao
superior
escolaridade
> library(doBy)
> require(lattice)
> summaryBy(salario~escolaridade|sexo,dados,FUN=c(mean))
escolaridade
sexo salario.mean
1
m
edio
Feminino
12.80000
2
m
edio
Masculino
10.77500
3
p
os-gradua
c~
ao
Feminino
32.03333
4
p
os-gradua
c~
ao
Masculino
33.28000
5
superior
Feminino
21.67000
6
superior
Masculino
25.13478
> aggregate(salario~sexo+escolaridade, data=dados,mean)
sexo
escolaridade salario
1
Feminino
m
edio 12.80000
2
Masculino
m
edio 10.77500
3
Feminino
p
os-gradua
c~
ao 32.03333
4
Masculino
p
os-gradua
c~
ao 33.28000
5
Feminino
superior 21.67000
6
Masculino
superior 25.13478
> summaryBy(salario~escolaridade,dados,FUN=c(mean))
escolaridade salario.mean
1
m
edio
11.45000
2
p
os-gradua
c~
ao
32.60000
3
superior
24.08485
> fit=aov(salario~escolaridade)
> popMeans(fit, effect="escolaridade")
beta0 Estimate Std.Error
t.value DF Pr(>|t|)
Lower
Upper
1
0 11.45000 2.394288 4.782215 47 0.0000175 6.633314 16.26669
2
0 32.60000 1.768299 18.435798 47 0.0000000 29.042642 36.15736
3
0 24.08485 1.020928 23.591137 47 0.0000000 22.031007 26.13869
escolaridade
1
m
edio
2
p
os-gradua
c~
ao
3
superior
> fit2=aov(salario~sexo+escolaridade)
> popMeans(fit2, c("sexo", "escolaridade"))
beta0 Estimate Std.Error
t.value DF Pr(>|t|)
Lower
Upper
1
0 9.948168 2.649797 3.754314 46 0.0004869 4.614404 15.28193
2
0 12.200916 2.448708 4.982593 46 0.0000093 7.271922 17.12991
3
0 31.576024 1.928657 16.372030 46 0.0000000 27.693840 35.45821
4
0 33.828771 1.999833 16.915802 46 0.0000000 29.803317 37.85423
5
0 22.514752 1.588136 14.176839 46 0.0000000 19.318000 25.71150
6
0 24.767499 1.144777 21.635212 46 0.0000000 22.463182 27.07182
sexo
escolaridade
1
Feminino
m
edio
2
Masculino
m
edio
3
Feminino
p
os-gradua
c~
ao
4
Masculino
p
os-gradua
c~
ao
5
Feminino
superior
6
Masculino
superior
> fit3=lmBy(salario~escolaridade|sexo, data=dados)
> summary(fit3)
Call:
lm(formula = salario ~ escolaridade, data = wd)
Residuals:
Min
1Q Median
-9.835 -4.020 -1.235
3Q
Max
4.905 12.865
Coefficients:
50
0.4871
Call:
lm(formula = salario ~ escolaridade, data = wd)
Residuals:
Min
1Q
-11.6333 -2.2950
Median
-0.0017
3Q
3.2300
Max
8.5667
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
12.800
3.936
3.252 0.005358 **
escolaridade p
os-gradua
c~
ao
19.233
4.545
4.232 0.000724 ***
escolaridade superior
8.870
4.311
2.057 0.057472 .
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 5.566 on 15 degrees of freedom
Multiple R-squared: 0.5983,
Adjusted R-squared: 0.5447
F-statistic: 11.17 on 2 and 15 DF, p-value: 0.00107
> require(lsmeans)
> fit4 <- lm(salario~escolaridade)
> lsmeans(fit4, pairwise~escolaridade)
$`escolaridade lsmeans`
escolaridade
lsmean
SE df lower.CL upper.CL
m
edio 11.45000 2.394288 47 6.633314 16.26669
p
os-gradua
c~
ao 32.60000 1.768299 47 29.042642 36.15736
superior 24.08485 1.020928 47 22.031007 26.13869
$`escolaridade pairwise differences`
estimate
SE
m
edio p
os-gradua
c~
ao
-21.150000 2.976491
m
edio superior
-12.634848 2.602865
p
os-gradua
c~
ao superior
8.515152 2.041856
p values are adjusted using the tukey method
51
df t.ratio
47 -7.10568
47 -4.85421
47 4.17030
for 3 means
p.value
0.00000
0.00004
0.00038
psgraduao
superior
40
salario
30
20
10
Feminino
Masculino
Feminino
Masculino
52
Feminino
Masculino
10
Feminino
Masculino
0.06
Densidade
0.04
0.02
0.00
10
20
20
30
40
50
salario
53
30
40
50
> histogram(~salario|sexo)
10
Feminino
Percent of Total
30
20
10
20
30
Masculino
40
10
20
30
40
salario
54
40
mdio
20
30
40
psgraduao
superior
50
40
Percent of Total
30
20
10
10
20
30
40
10
salario
55
20
30
40
> cloud(salario~filhos*escolaridade)
salario
escolaridade
filhos
56
mdio
Masculino
psgraduao
superior
40
salario
30
20
10
Feminino
Masculino
Feminino
sexo
57
Masculino
Masculino
40
salario
30
20
10
mdio
psgraduao
superior
mdio
58
psgraduao
superior
mdio
psgraduao
superior
40
salario
30
20
10
qnorm
59
40
salario
30
20
10
Feminino
Masculino
10.3
ScottKnott, o TukeyC
> require(laercio)
> result=aov(salario~escolaridade)
> LTukey(result,"escolaridade",conf.level=0.95)
TUKEY TEST TO COMPARE MEANS
Confidence level: 0.95
Dependent variable: salario
Variation Coefficient: 23.9947 %
Independent variable: escolaridade
Factors
Means
p
os-gradua
c~
ao 32.6
a
superior
24.0848484848485 b
m
edio
11.45
c
> LDuncan(result,"escolaridade",conf.level = 0.95)
DUNCAN TEST TO COMPARE MEANS
Confidence Level: 0.95
Dependent Variable: salario
Variation Coefficient: 23.9947 %
1
2
3
FACTORS
MEANS
p
os-gradua
c~
ao 32.60000 A
superior 24.08485 A
m
edio 11.45000 A
11
D
2
10
12
D
3
4
> library(doBy)
> summaryBy(respo~trata,dad,FUN=c(mean,sd))
trata respo.mean respo.sd
1
A
8 5.291503
2
B
9 1.000000
3
C
35 33.451457
4
D
5 4.582576
>
>
>
>
require(ScottKnott)
sk1<-SK(dad,y=respo,model="respo~trata",which="trata")
summary(sk1)
plot(sk1, title = "Treatamentos", col = rainbow(3))
62
>
>
>
>
1
2
3
4
5
6
>
1
2
3
4
5
6
filhos, sexo
library(doBy)
require(lattice)
barchart(table(sexo,escolaridade))
summaryBy(salario~sexo|escolaridade,dados,FUN=c(mean))
sexo
escolaridade salario.mean
Feminino
m
edio
12.80000
Feminino
p
os-gradua
c~
ao
32.03333
Feminino
superior
21.67000
Masculino
m
edio
10.77500
Masculino
p
os-gradua
c~
ao
33.28000
Masculino
superior
25.13478
aggregate(salario~sexo+escolaridade, data=dados,mean)
sexo
escolaridade salario
Feminino
m
edio 12.80000
Masculino
m
edio 10.77500
Feminino
p
os-gradua
c~
ao 32.03333
Masculino
p
os-gradua
c~
ao 33.28000
Feminino
superior 21.67000
Masculino
superior 25.13478
Masculino
63
Feminino
10.4
>
>
>
>
>
>
>
>
>
>
TukeyC
setwd("/media/Meus arquivos/Pendrive/KINGSTON/sweave/apostilaR2")
library(TukeyC)
require(gdata)
dad_b<-read.xls("TukeyC.xls", encoding = "latin1")
str(dad_b)
av <- aov(pro ~ tra,data=dad_b)
summary(av)
tk_b <- TukeyC(av)
summary(tk_b)
plot(tk_b)
64
65
10.5
UsingR
10
15
10
20
20
25
30
30
40
35
50
40
filhos, sexo
require(UsingR)
par(mfrow=c(2,2))
boxplot(salario~sexo,col = c("palevioletred1","royalblue2"))
simple.violinplot(salario~sexo,col="brown")
simple.densityplot(salario~sexo)
boxplot(salario~sexo,,notch=T)
Masculino
Feminino
Masculino
Feminino
Masculino
0.05
35
0.06
40
0.07
Feminino
66
10
0.01
15
0.02
20
0.03
25
0.04
30
Feminino
Masculino
0.00
>
>
>
>
>
>
10
20
30
40
50
>
>
>
>
>
>
par(mfrow=c(1,2))
require(UsingR)
x=rnorm(200)
y=x+rnorm(200)
simple.scatterplot(x,y,col=3)
simple.hist.and.boxplot(x, main="")
67
par(fig=c(0,0.8,0,0.8), new=TRUE)
x=rnorm(330)
y=x+rnorm(330)
plot(x, y, xlab="Teste",ylab="Teste")
par(fig=c(0,0.8,0.55,1), new=TRUE)
boxplot(x, horizontal=TRUE, axes=FALSE)
par(fig=c(0.65,1,0,0.8),new=TRUE)
boxplot(y,axes=FALSE)
mtext("Teste", side=3, outer=TRUE, line=-3)
0
2
Teste
Teste
>
>
>
>
>
>
>
>
>
Teste
68
0.2
0.0
0.1
Densidade
0.3
0.4
x=rnorm(3000)
layout(matrix(c(1,1,2,3), 2, 2, byrow = TRUE))
hist(x,main="",ylab="Densidade",prob=T)
hist(x,main="",ylab="Densidade",prob=T)
hist(x,main="",ylab="Densidade",prob=T)
0.4
0.3
0.2
Densidade
0.0
0.1
0.2
0.1
Densidade
0.3
0.4
0.0
>
>
>
>
>
0
x
69
0.2
0.0
0.1
Densidade
0.3
0.4
x=rnorm(3000)
layout(matrix(c(1,1,2,3), 2, 2, byrow = TRUE),widths=c(3,1), heights=c(1,2))
hist(x,main="",ylab="Densidade",prob=T)
hist(x,main="",ylab="Densidade",prob=T)
hist(x,main="",ylab="Densidade",prob=T)
0.4
0.3
0.2
Densidade
0.0
0.1
0.2
0.1
Densidade
0.3
0.4
0.0
>
>
>
>
>
0
x
70
25
10
0.01
15
0.02
20
Sample Quantiles
0.03
Frequncia
30
0.04
35
0.05
40
Normal QQ Plot
0.00
>
>
>
>
+
>
>
10
15
20
25
Salrio
30
35
40
10
20
30
40
50
60
Salrio
71
Figura 37: Histograma Box plot
0
Theoretical Quantiles
par(mfrow=c(2,2))
means<-tapply(salario,escolaridade,mean)
barplot(means,xlab="Escolaridade",ylab="M
edia por escolaridade",col=c("red","blue","pink"))
barplot(tapply(salario,list(sexo,escolaridade),mean),beside=T,ylim=c(0,30),
col=c("forestgreen", "palegreen"),ylab="M
edia por escolaridade sexo")
legend("topleft", ncol=2, legend=c("Feminino", "Masculino"),fill=c("forestgreen", "palegreen"),bty="n"
barplot(table(sexo,escolaridade),beside=TRUE,col=c("forestgreen", "palegreen"))
legend("topleft", ncol=2, legend=c("Feminino", "Masculino"),fill=c("forestgreen", "palegreen"),bty="n"
barplot(table(sexo,escolaridade),col=c("forestgreen", "palegreen"))
legend("topleft", ncol=2, legend=c("Feminino", "Masculino"),fill=c("forestgreen", "palegreen"),bty="n"
30
>
>
>
>
+
>
>
>
>
>
Masculino
20
15
0
10
20
15
10
25
25
30
Feminino
mdio
psgraduao
superior
mdio
psgraduao
superior
Escolaridade
Masculino
Feminino
Masculino
10
10
15
20
15
25
20
30
Feminino
mdio
psgraduao
superior
mdio
psgraduao
superior
10
15
20
25
30
Masculino
Feminino
mdio
psgraduao
72
superior
>
>
>
>
par(mfrow=c(1,3))
interaction.plot(sexo,escolaridade, salario)
interaction.plot(escolaridade,sexo, salario)
interaction.plot(escolaridade,sexo, salario,fun = mean, ylab ="M
edias")
sexo
escolaridade
sexo
Feminino
Masculino
25
10
15
20
Mdias
mean of salario
20
15
10
10
15
20
mean of salario
25
30
Masculino
Feminino
30
Masculino
Feminino
25
30
psgraduao
superior
mdio
mdio
sexo
psgraduao
superior
mdio
psgraduao
escolaridade
superior
escolaridade
par(mfrow=c(1,3))
plot.design(salario~sexo)
plot.design(salario~escolaridade)
plot.design(salario~escolaridade+sexo)
psgraduao
psgraduao
30
25
25
24.5
30
24.6
Masculino
Masculino
superior
Feminino
mean of salario
20
mean of salario
15
15
24.3
20
mean of salario
24.4
superior
24.2
>
>
>
>
Feminino
mdio
mdio
sexo
escolaridade
Factors
Factors
73
escolaridade
sexo
Factors
> coplot(salario~escolaridade|sexo,panel=panel.smooth)
Given : sexo
Masculino
Feminino
sprr
25
20
15
10
salario
30
35
40
md
md
escolaridade
74
sprr
10.6
Regress
ao linear
Median
0.01407
3Q
0.07451
Max
0.19325
Coefficients:
Estimate Std. Error t value
(Intercept)
-30.04554
2.94812 -10.19
poly(x, 2, raw = TRUE)1 13.24450
0.93021
14.24
poly(x, 2, raw = TRUE)2 -1.04782
0.07211 -14.53
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
0.1 1
7 degrees of freedom
Adjusted R-squared: 0.9627
p-value: 0.000004143
Ajuste fun
c~
ao segundo grau (modelo quadratico)
(-1.047822*x^2),add=T) # Curva ajustada
10.0
10.5
11.0
11.5
12.0
Pr(>|t|)
0.00001888 ***
0.00000200 ***
0.00000174 ***
5.0
5.5
6.0
6.5
x
75
7.0
7.5
> fert<-c(10,20,30,40,50,60,70,80,90,100)
> pro<-c(42,61,81,94,98,96,83,79,59,43)
> reg<-lm(pro~fert+I(fert^2)) # Modelo quadratico
> summary(reg)
Call:
lm(formula = pro ~ fert + I(fert^2))
Residuals:
Min
1Q Median
-6.441 -2.100 0.775
3Q
2.194
Max
3.650
Coefficients:
Estimate Std. Error t value
Pr(>|t|)
(Intercept) 15.516667
4.222243
3.675
0.00791
fert
2.957197
0.176339 16.770 0.000000656
I(fert^2)
-0.027159
0.001562 -17.384 0.000000513
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 .
**
***
***
0.1 1
0.9709
Response: pro
Df Sum Sq Mean Sq F value
Pr(>F)
fert
1
7.6
7.6
0.5878
0.4683
I(fert^2) 1 3894.6 3894.6 302.2072 0.0000005126 ***
Residuals 7
90.2
12.9
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
> confint(reg) # 95% confidence intervals (defaults to 95%)
2.5 %
97.5 %
(Intercept) 5.53264900 25.50068433
fert
2.54022230 3.37417164
I(fert^2)
-0.03085333 -0.02346485
> library(QuantPsyc)
> lm.beta(reg) # standardised coefficients
fert I(fert^2)
4.250991 -4.406664
> library(car)
> durbinWatsonTest(reg)
lag Autocorrelation D-W Statistic p-value
1
-0.08364433
2.041007
0.388
Alternative hypothesis: rho != 0
> library(MASS)
> studres(reg) # studentised_residuals
1
2
3
4
5
6
7
-0.1558789 -0.9055686 0.3489720 1.1614545 0.7742317 0.2425253 -2.8293712
8
9
10
0.2078615 -0.8613471 1.7062744
> shapiro.test(reg$residuals) # teste do Shapiro-Wilk normalidade
Shapiro-Wilk normality test
data: reg$residuals
W = 0.9231, p-value = 0.3833
> ks.test(reg$residuals,"pnorm",mean(reg$residuals),sd(reg$residuals))#teste do Kolmogorov-Smirnov
76
77
> x<-c(10,15,20,25,30)
> y<-c(1003,1005,1010,1011,1014)
> result<-lm(y~x)
> anova(result)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value
Pr(>F)
x
1
78.4 78.400
84 0.002746 **
Residuals 3
2.8
0.933
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
> summary(result)
Call:
lm(formula = y ~ x)
Residuals:
1
2
-9.008e-14 -8.000e-01
3
4
5
1.400e+00 -4.000e-01 -2.000e-01
Coefficients:
Estimate Std. Error t value
Pr(>|t|)
(Intercept) 997.4000
1.2961 769.511 0.00000000484 ***
x
0.5600
0.0611
9.165
0.00275 **
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
0.954
1004
1006
1008
1010
1012
1014
10
15
20
25
78
30
>
>
>
>
>
+
+
N(
0,0
.7)
N(0
,1)
10.7
Experimentac
ao
79
3Q
2.087
Max
10.870
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 142.802
2.826 50.540 < 2e-16 ***
VarB
-4.777
3.996 -1.196 0.25042
VarC
-4.060
3.996 -1.016 0.32572
VarD
-2.792
3.996 -0.699 0.49535
VarE
12.318
3.996
3.083 0.00758 **
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Dispersion parameter for gaussian family taken to be 31.93483)
80
on 19
on 15
degrees of freedom
degrees of freedom
81
units
~units
3Q
-0.5970
Max
1.9434
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.3598919 0.4054454 -3.354 0.000796 ***
altura
-0.0006935 0.0040469 -0.171 0.863941
comprimento -0.0030105 0.0064799 -0.465 0.642221
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 370.98
Residual deviance: 370.72
AIC: 376.72
on 399
on 397
degrees of freedom
degrees of freedom
10.8
Estatstica n
ao param
etrica
> library(agricolae)
> data(corn)
> attach(corn)
83
> str(corn)
> comparison<-kruskal(observation,method,group=TRUE)
10.9
Regress
ao logistica
C
alculo do R2 semelhante a regress
ao linear para regressao logistica.
> tr <- gl(3,4) # n
veis de tratamento
> ds <- runif(length(tr), 1, 1.2) # densidade do solo
> y <- rbinom(length(tr), prob=0.5, size=50) # germina
c~
ao
> # tr
e categ
orica, ds
e n
umerica
>
> m0 <- glm(cbind(y, 50-y)~tr*ds, family=binomial)
> summary(m0)
Call:
glm(formula = cbind(y, 50 - y) ~ tr * ds, family = binomial)
Deviance Residuals:
Min
1Q
-0.89549 -0.41782
Median
0.07459
3Q
0.35284
Max
0.75704
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept)
-4.443
3.482 -1.276
0.202
tr2
2.246
7.667
0.293
0.770
tr3
4.916
4.208
1.168
0.243
ds
4.000
3.063
1.306
0.192
tr2:ds
-1.674
7.201 -0.232
0.816
tr3:ds
-4.247
3.733 -1.138
0.255
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 5.1929
Residual deviance: 2.8114
AIC: 67.094
on 11
on 6
degrees of freedom
degrees of freedom
> library(epicalc)
> logistic.display(m0, simplified=TRUE)
OR
lower95ci
upper95ci
tr2
9.44810184 0.0000028104006 31762955.25002
tr3
136.50062313 0.0357409509504
521318.53290
ds
54.58825536 0.1349115307182
22087.64223
tr2:ds
0.18758473 0.0000001393244
252561.85561
tr3:ds
0.01431254 0.0000095071002
21.54692
10.10
Sturges
> x=c(3,34,5,6,7,8,9)
> nclass.Sturges(x)
[1] 4
85
Pr(>|Z|)
0.7695979
0.2426888
0.1915729
0.8162162
0.2553121
Indice Remissivo
importar, 2
knitr, 14
Sweave, 13
86
Lista de Figuras
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
Porcentagem no histograma . . . . . . . . .
Adicionar curvas . . . . . . . . . . . . . . .
Plotar densidade . . . . . . . . . . . . . . .
Curva normal . . . . . . . . . . . . . . . .
Curvas . . . . . . . . . . . . . . . . . . . .
curvas . . . . . . . . . . . . . . . . . . . . .
Adicionar novo histograma num j
a existente
Curva normal . . . . . . . . . . . . . . . . .
Curva ao histograma . . . . . . . . . . . . .
3D . . . . . . . . . . . . . . . . . . . . . . .
3d . . . . . . . . . . . . . . . . . . . . . . .
Estatsticas descritivas . . . . . . . . . . . .
Func
ao densidade probabilidade fdp . . . .
Distribuic
ao de probabilidade binomial . . .
Boxplot . . . . . . . . . . . . . . . . . . . .
dist . . . . . . . . . . . . . . . . . . . . . . .
Intervalo de confianca para media I . . . . .
Intervalo de confianca para media II . . . .
Intervalo de confianca para media III . . . .
Gr
aficos Lattice I . . . . . . . . . . . . . .
Gr
aficos Lattice II . . . . . . . . . . . . . .
Gr
aficos Lattice . . . . . . . . . . . . . . .
Gr
aficos Lattice VI . . . . . . . . . . . . . .
Gr
aficos Lattice VI . . . . . . . . . . . . . .
Gr
aficos Lattice VI . . . . . . . . . . . . . .
Gr
aficos Lattice VI . . . . . . . . . . . . . .
Gr
aficos Lattice III . . . . . . . . . . . . .
Gr
aficos Lattice IV . . . . . . . . . . . . .
Normalidade por grupo . . . . . . . . . . .
Gr
aficos Lattice V . . . . . . . . . . . . . .
Plotar cruzamento de vari
aveis . . . . . . .
Func
ao UsingR . . . . . . . . . . . . . . . .
Histograma marginal . . . . . . . . . . . . .
Box plot marginal . . . . . . . . . . . . . .
Tres gr
aficos em em mesma janela . . . . .
Tres gr
aficos em em mesma janela . . . . .
Histograma Box plot . . . . . . . . . . . . .
Media por fator . . . . . . . . . . . . . . . .
Media por fator . . . . . . . . . . . . . . . .
Interac
ao . . . . . . . . . . . . . . . . . . .
Design . . . . . . . . . . . . . . . . . . . . .
Coplot . . . . . . . . . . . . . . . . . . . . .
Regress
ao . . . . . . . . . . . . . . . . . . .
Regress
ao simples . . . . . . . . . . . . . . .
Multivariada . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
4
5
5
6
7
8
9
10
11
12
18
18
21
22
33
45
46
47
48
49
52
53
54
55
56
57
58
59
60
63
66
67
68
69
70
71
72
72
73
73
74
75
78
79
Lista de Tabelas
1
2
Tabela ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Tabela de frequencia empresa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
87