Академический Документы
Профессиональный Документы
Культура Документы
Anlisis Multivariado
Profesor. Leonardo Araujo
TAREA 2
EJERCICIO 5.1
Evale T2 para probar H0: =[7,11]
Cdigo
x<- matrix(c(2,8,6,8,12,9,9,10),4,2);x
n=4
p=2
xbar<- colMeans(x); xbar
s<- cov(x); s
si<-solve(s); si
alfa=0.05
mu <- matrix(c(7,11),1,2); mu
difx<- xbar-mu; difx
T2 <- n%*%difx%*%si%*%t(difx); T2
((n-1)*p)/(n-p)
F<-qf(1-alfa,p,n-p);F
R<-((n-1)*p*F)/(n-p);R
Resultados
#(a)T2=13.64
#(b)Distribucin 3 F2-2
#(c)13.64<57 ... No se debe rechazar H0 en favor de H1 al 5% de nivel
de significancia
EJERCICIO 5.2
Cdigo
#original
x<- matrix(c(6,10,8,9,6,3),3,2); x
xbar<- colMeans(x); xbar
s<- cov(x);s
sinv <- solve(s); sinv
mu<- matrix(c(9,5),1,2); mu
difx<- xbar-mu; difx
T2 <- 3%*%difx%*%sinv%*%t(difx); T2
#modificado
x<- matrix(c(6-9,10-6,8-3,6+9,10+6,8+3),3,2); x
xbar<- colMeans(x); xbar
s<- cov(x);s
sinv <- solve(s); sinv
mu<- matrix(c(9-5,5+9),1,2); mu
difx<- xbar-mu; difx
T2 <- 3%*%difx%*%sinv%*%t(difx); T2
Resultados
# T2original=T2modificado
#0.77778 = 0.77778 Se comprueba la igualdad
EJERCICIO 5.4
B) Construye qqplot para las observaciones de sweat, de
contenido de sodio y de potasio. Construye las 3 posibles
graficas. parece que la distribucin normal multivariada se
justifica?
Cdigo
sweat <- read.csv("Sweat Data.csv", header=T); sweat
hist(sweat[,1], col='skyblue')
qqnorm(sweat[,1], pch=2); qqline(sweat[,1],col='blue')
hist(sweat[,2], col='lightpink')
qqnorm(sweat[,2], pch=3); qqline(sweat[,2], col='pink')
hist(sweat[,3], col='beige')
qqnorm(sweat[,3], pch=9); qqline(sweat[,3], col='orange')
mshapiro.test(t(sweat[,1]))
mshapiro.test(t(sweat[,2]))
mshapiro.test(t(sweat[,3]))
Resultados
##PARA 1
#Histograma, QQ plot
EJERCICIO 5.5
Prueba de hiptesis y elipse de confianza
Cdigo
rad <- read.csv("rad.csv", header=T)
xb<- colMeans(rad)
S<- cov(rad)
xbar<- matrix(c(.564,.603),1,2); xbar
s<- matrix(c(.0144,.0117,.0117,.0146),2,2); s
si<-matrix(c(203.018,-163.391,-163.391,200.228),2,2); si
n=42
p=2
alfa=0.05
mu <- matrix(c(.55,.60),1,2); mu
difx<- xbar-mu; difx
T2 <- n%*%difx%*%si%*%t(difx); T2
F<-qf(1-alfa,2,40);F
R<-((n-1)*2*F)/(n-p);R
library("mixtools")
plot(rad, pch=4, col="blue"); ellipse(mu=xb, sigma=S, alpha = alfa,
npoints = 2000, col="pink"); points (.562,.589)
Resultados
EJERCICIO 5.7
T2 intervalos simultneos
Cdigo
Bonferroni
Cdigo
T<-qt(1-(a/(2*p)),(n-1)); T
I1<- c(xbar[1]-(T*sqrt(S[1,1]/n)), xbar[1]+(T*sqrt(S[1,1]/n))); I1
I2<- c(xbar[2]-(T*sqrt(S[2,2]/n)), xbar[2]+(T*sqrt(S[2,2]/n))); I2
I3<- c(xbar[3]-(T*sqrt(S[3,3]/n)), xbar[3]+(T*sqrt(S[3,3]/n))); I3
Resultados
# Para x1 hay un 95% de confianza de que el intervalo de Bonferroni
(3.64,5.64) contenga a "0"
# Para x2 hay un 95% de confianza de que el intervalo de Bonferroni
(37.10,53.70) contenga a "0"
# Para x3 hay un 95% de confianza de que el intervalo de Bonferroni
(8.85,11.08) contenga a "0"
Los intervalos simultneos abarcan mayor rango que los Bonferroni, esto es
ocasionado por la necesidad de acertar en las medias de las 3 variables a la
vez.
EJERCICIO 5.9
(a)Intervalo simultneo para muestras grandes
Cdigo
xbar<- matrix(c(95.52, 164.38, 55.69, 93.39, 17.98, 31.13 )); xbar
S<- matrix(c(3266.46, 1343.97, 731.54, 1175.50, 162.68, 238.37,
1343.97, 721.91, 324.25, 537.35, 80.17, 117.73, 731.54, 324.25,
179.28, 281.17, 39.15, 56.80, 1175.50, 537.35, 281.17, 474.98, 63.73,
94.85, 162.68, 80.17, 39.15, 63.73, 9.95, 13.88, 238.37, 117.73, 56.80,
94.85, 13.88, 21.26),6,6); S
n=61
p=6
a=0.05
X2<- qchisq(1-a, df=p);X2
Ix1<-c(xbar[1]-sqrt((X2*S[1,1])/n), xbar[1]+sqrt((X2*S[1,1])/n)); Ix1
Ix2<- c(xbar[2]-sqrt((X2*S[2,2])/n), xbar[2]+sqrt((X2*S[2,2])/n)); Ix2
Ix3<- c(xbar[3]-sqrt((X2*S[3,3])/n), xbar[3]+sqrt((X2*S[3,3])/n));Ix3
Ix4<- c(xbar[4]-sqrt((X2*S[4,4])/n), xbar[4]+sqrt((X2*S[4,4])/n));Ix4
Ix5<- c(xbar[5]-sqrt((X2*S[5,5])/n), xbar[5]+sqrt((X2*S[5,5])/n));Ix5
Ix6<- c(xbar[6]-sqrt((X2*S[6,6])/n), xbar[6]+sqrt((X2*S[6,6])/n));Ix6
Resultados
s<-matrix(c(3266.46,1175.5,1175.5,474.98),2,2);s
library(mixtools)
ellipse(c(xbar[1],xbar[4]),s, 0.05, npoints = 2000, newplot = TRUE, draw
= TRUE)
Resultados
(c) Bonferroni
Cdigo
z<-qnorm(1-(0.025/p));z 2.638257
B1<- c(xbar[1]-(z*sqrt(s[1]/n)), xbar[1]+(z*sqrt(s[1]/n)));
B2<- c(xbar[2]-(z*sqrt(s[2]/n)), xbar[2]+(z*sqrt(s[2]/n)));
B3<- c(xbar[3]-(z*sqrt(s[3]/n)), xbar[3]+(z*sqrt(s[3]/n)));
B4<- c(xbar[4]-(z*sqrt(s[4]/n)), xbar[4]+(z*sqrt(s[4]/n)));
B5<- c(xbar[5]-(z*sqrt(s[5]/n)), xbar[5]+(z*sqrt(s[5]/n)));
B6<- c(xbar[6]-(z*sqrt(s[6]/n)), xbar[6]+(z*sqrt(s[6]/n)));
Resultados
B1
B2
B3
B4
B5
B6
el intervalo de Bonferroni
el intervalo de Bonferroni
el intervalo de Bonferroni
el intervalo de Bonferroni
el intervalo de Bonferroni
el intervalo de Bonferroni
t<-qt((.05/(2*6)),n-1);t -2.728552
B1<-(xbar[1])+(t*(sqrt(s[1]/n)));B1
B2<-(xbar[1])-(t*(sqrt(s[1]/n)));B2
B7<-(xbar[4])+(t*(sqrt(s[4]/n)));B7
B8<-(xbar[4])-(t*(sqrt(s[4]/n)));B8
ellipse(c(xbar[1],xbar[4]),s, 0.05, npoints = 2000, newplot = TRUE, draw
= TRUE)
points(B1,B7, newplot=FALSE, draw=TRUE, col="red", pch='*')
points(B1,B8, newplot=FALSE, draw=TRUE, col="red", pch='*')
Cdigo
n=61
p=7
xe<- xbar[6]-xbar[5]; xe
snew<- S[6,6]-(2*S[5,6])+S[5,5]; snew
T<-qt(1-(a/(2*p)),(n-1)); T
Ie<- c(xe-(T*sqrt(snew/n)), xe+(T*sqrt(snew/n))); Ie
Resultados
EJERCICIO 5.11
Para los anlisis de minerales en 9 cabellos antiguos, los
resultados de Cr(x1) y Sr(x2) se presentan en la tabla. Se
sabe que la presencia de .100ppm o menos de cromo sugiere
diabetes, mientras el estroncio revela consumo animal.
(a)elipse de confianza para 90% suponiendo muestra
aleatoria
Cdigo
x<-matrix(c(0.48, 40.53, 2.19, 0.55, 0.74, 0.66, 0.93, 0.37, 0.22, 12.57,
73.68, 11.13, 20.03, 20.29, 0.78, 4.64, 0.43, 1.08),9,2); x
xbar<-colMeans(x); xbar
s<- cov(x); s
si<- solve(s); si
alfa=0.10
n=9
p=2
library("mixtools")
plot(x, ypch=4, xlim=c(-25,50), ylim=c(-50,80), col="purple")
ellipse(mu=xbar, sigma=s, alpha = alfa, npoints = 2000, col="red")
Resultados
Resultado
#I1(-6.881, 17.252), I2(-4.827, 36.967) para una confianza del 90%, de
manera simultnea, las medias se deberan encontrar dentro de estos
intervalos.
#los valores medios 0.30,10 son un valor posible, ya que ambos se
encuentran simultneamente dentro de los intervalos correspondientes.
#PARA X2
#
Shapiro-Wilk normality test
#data: Z
#W = 0.68941, p-value = 0.001067
#tanto en los histogramas, como en las grficas QQ y la prueba de
Shapiro se puede notar que las variables esn lejos de presentar una
distribucin normal bivariada, por lo que se rechaza la hiptesis de
normalidad bivariada a una significancia de 0.01.
EJERCICIO 5.19
#(a)CONSTRUYE LA ELIPSE DE 95% DE CONFIANZA PARA LAS
MEDIAS(x1,x2) DE LA MATRIZ
Cdigo
a<-read.csv("lumber.csv",header=T);a
n<-30;p<-2
F<-qf(.95,df1=p,df2=n-p);F
xbar<-colMeans(a);xbar
s<-cov(a);s
ellipse(c(xbar[1],xbar[2]),s, 0.05, npoints = 2000, newplot = TRUE, draw
= TRUE)
RESULTADO
Cdigo
RESULTADO
Cdigo
shapiro.test(a[,1]);shapiro.test(a[,2])
qqnorm(a[,1]); qqline(a[,1])
qqnorm(a[,2]);qqline(a[,2])
mshapiro.test(t(a))
RESULTADO
Shapiro-Wilk normality test
data: a[, 1]
W = 0.9749, p-value = 0.6798
Shapiro-Wilk normality test
data: a[, 2]
W = 0.97552, p-value = 0.6979
Con esta prueba el p-valor es mayor a .05 por lo que si se cumple que es
normal.
Observando las graficas qqplot:
EJERCICIO 5.22
Q-Q PLOTS
Cdigo
#Graficos y pruebas de normalidad
M <- read.csv("5.22.csv", header=T); M
hist(M[,1], col='skyblue')
qqnorm(M[,1], pch=2)
qqline(M[,1],col='blue')
hist(M[,2], col='pink')
qqnorm(M[,2], pch=1)
qqline(M[,2],col='pink')
hist(M[,3], col='green')
qqnorm(M[,3], pch=3)
qqline(M[,3],col='green')
shapiro.test(M[,1])
shapiro.test(M[,2])
shapiro.test(M[,3])
MSO <- read.csv("5.22 sin outliers.csv", header=T); MSO
qqnorm(MSO[,1], pch=2)
qqline(MSO[,1],col='blue')
qqnorm(MSO[,2], pch=1)
qqline(MSO[,2],col='pink')
qqnorm(MSO[,3], pch=3)
qqline(MSO[,3],col='green')
shapiro.test(MSO[,1])
shapiro.test(MSO[,2])
shapiro.test(MSO[,3])
Resultados
Variable 1: Fuel
Variable 2: Repair
Variable 3: Capital
Variable 2: repair
Variable 3:
B)
Bonferroni
Cdigo
n<-25
p<-3
a<-0.05
xbar<- colMeans(M); xbar
S<- cov(M);S
F<-qf((1-a), p, n-p); F
T<-qt(1-(a/(2*p)),(n-1)); T
I1<- c(xbar[1]-(T*sqrt(S[1,1]/n)), xbar[1]+(T*sqrt(S[1,1]/n))); I1
I2<- c(xbar[2]-(T*sqrt(S[2,2]/n)), xbar[2]+(T*sqrt(S[2,2]/n))); I2
I3<- c(xbar[3]-(T*sqrt(S[3,3]/n)), xbar[3]+(T*sqrt(S[3,3]/n))); I3
Resultados
# Para x1 (fuel) hay un 95% de confianza de que el intervalo de Bonferroni
(9.789733,15.330267) contenga a "0"
# Para x2 (repair) hay un 95% de confianza de que el intervalo de Bonferroni
(5.777122, 10.545278) contenga a "0"
# Para x3 (capital) hay un 95% de confianza de que el intervalo de Bonferroni
(8.646243, 12.442557) contenga a "0"
Intervalos T^2
Cdigo
n<-25
p<-3
a<-0.05
xbar<- colMeans(M); xbar
S<- cov(M);S
F<-qf((1-a), p, n-p); F
Ix1<- c(xbar[1]-sqrt(((p*(n-1))/(n*(n-p)))*F*S[1,1]), xbar[1]+sqrt(((p*(n1))/(n*(n-p)))*F*S[1,1])); Ix1
Ix2<- c(xbar[2]-sqrt(((p*(n-1))/(n*(n-p)))*F*S[2,2]), xbar[2]+sqrt(((p*(n1))/(n*(n-p)))*F*S[2,2])); Ix2
Ix3<- c(xbar[3]-sqrt(((p*(n-1))/(n*(n-p)))*F*S[3,3]), xbar[3]+sqrt(((p*(n1))/(n*(n-p)))*F*S[3,3])); Ix3
Resultados
# Para x1 (fuel) hay un 95% de confianza de que el intervalo de T^2
(9.159708,15.960292) contenga a "0"
# Para x2 (repair) hay un 95% de confianza de que el intervalo de T^2
(5.234926,11.087474) contenga a "0"
# Para x3 (capital) hay un 95% de confianza de que el intervalo de T^2
(8.214557 12.874243) contenga a "0"
Resumen: los dos tipos intervalos son muy parecidos, el cambio entre ellos son
tan solo decimales.