Maestría de Estadística

Maestría de Estadística
Curso: Estadística Computacional

Profesor: Jorge Luis Bazán
Pontificia Universidad Católica del Perú
Solucionario Lista 1 de Ejercicios

Alumnos:
César Correa Genaro Requena

ccorrea@pucp.edu.pe genaro.requena@pucp.edu.pe
26 de abril de 2008
I. Capítulo 2
 Una v.a. en toda la recta, se distribuyen en forma logística con parámetro de localización µ y
escala  si:
(𝑥 −𝜇 )
𝑒 𝜎
𝑓(𝑥) = 2
𝑥 −𝜇
𝜎 1+𝑒 𝜎
1. Derive la función de distribución acumulada para la Logística.

2. Escriba una función que pueda calcular la función de densidad de la Logística para valores
dados del dominio de x.
3. Escriba una función que pueda calcular la función de distribución acumulada para la
Logística.
4. Grafique la función de densidad y la acumulada para valores deµ = -1; 0; 1 y  = 1; 2.
Solución:
La función de distribución acumulada para la distribución Logística es la siguiente:
1
𝐹 𝑥 = 𝑥−𝜇
1 + 𝑒− 𝜎
Desarrollando la función de densidad y la función de distribución acumulada para la Logística en

R tenemos:
#1,2,3
x=seq(-10,10,0.01)
u=0
s=1
z=(x-u)/s
pdfx=exp(z)/(s*(1+exp(z))^2)
cdfx=1/(1+exp(-z))
par(mfrow=c(1,2))
plot(x,pdfx,type="l",xlab="X",ylab="f(x)",col="blue")
title('Probability Density Function u=0,s=1')
plot(x,cdfx,type="l",xlab="X",ylab="F(x)",col="red")
title('Cumulative Distribution Function u=0,s=1')
Graficando en R la función de densidad y la distribución acumulada de la Logística tenemos:
#(1.4)
x=seq(-10,10,0.01)
u=-1;s1=1;s2=2
z1=(x-u)/s1;z2=(x-u)/s2
pdfx1=exp(z1)/(s1*(1+exp(z1))^2)
cdfx1=1/(1+exp(-z1))
par(mfrow=c(3,2))
plot(x,pdfx1,type="l",xlab="X",ylab="f(x)",col="blue",lwd=2)
lines(x,pdfx2,type="l",xlab="X",ylab="f(x)",col="cyan",lwd=2)
title('Probability Density Function u=-1,s=1,2')
plot(x,cdfx1,type="l",xlab="X",ylab="F(x)",col="red",lwd=2)
lines(x,cdfx2,type="l",xlab="X",ylab="F(x)",col="orange",lwd=2)
title('Cumulative Distribution Function u=-1,s=1,2')
u=0;s1=1;s2=2
z1=(x-u)/s1;z2=(x-u)/s2
#par(mfrow=c(1,2))
title('Probability Density Function u=0,s=1,2')
title('Cumulative Distribution Function u=0,s=1,2')
u=1;s1=1;s2=2
z1=(x-u)/s1;z2=(x-u)/s2
#par(mfrow=c(1,2))
title('Probability Density Function u=1,s=1,2')
title('Cumulative Distribution Function u=1,s=1,2')
Obtenemos el siguiente gráfico
Observamos que se trata de una distribución simétrica. Asimismo, notamos que el parámetro µ
nos indica la posición de la función Logística; y el parámetro  determina la forma de la curva, a
medida que aumenta la función se ensancha para los costados y se achata en el centro.
 Suponga que existe 50 % de chance de que un adulto americano sufra de un desorden

psiquiátrico. Elegimos aleatoriamente una muestra de 6 adultos americanos. Si X representa el
número de personas que tienen un desorden psiquiátrico, entonces X es una variable aleatoria
Binomial con parámetros (6,0.5).
Estamos interesados en la probabilidad de que a lo más 3 de las personas seleccionadas tengan
algún desorden.. Cuál es la forma de la Distribución?. Elabore gráficos.
Solución:
Podemos usar la función pbinom de R para determinar P(X ≤ 3)
prob = pbinom(3,6,0.5)
> prob
[1] 0.65625
Por lo tanto la probabilidad de que a lo más 3 de las personas seleccionadas tengan algún
desorden es del 65.6%.
Para graficar usamos la siguiente secuencia de comandos:
#Graficando la Distribución de Probabilidad

x=0:6
pdfx=dbinom(x,6,0.5)
cdfx=pbinom(x,6,0.5)
par(mfrow=c(1,2))
plot(x,pdfx,type="h",xlab="X",ylab="P(x)",col="blue",lwd=10)
title('Probability Density Function n=6,p=0.5')
plot(x,cdfx,type="h",xlab="X",ylab="PA(x)",col="red",lwd=10)
title('Cumulative Distribution Function n=6,p=0.5')
Observamos que la distribución binomial con parámetros n=6 y p=0.5 se distribuye de forma
simétrica con respecto a la media. Y el valor esperado de personas con algún desorden
psiquiátrico es 3.
 Encuentre la altura de la curva para la función de densidad normal en x = µ, para  = 0.5; 1; 2.

Qué sucede para la altura de la curva cuando  crece?. Las alturas cambian para diferentes
valores de µ?. Elabore gráficos.
Solución:
Graficamos la función de densidad normal en R mediante la ejecución de los comandos
siguientes:
x=seq(-5,5,0.1)
u=-1
s1=0.5;s2=1;s3=2
pdfx1=dnorm(x,u,s1);pdfx2=dnorm(x,u,s2);pdfx3=dnorm(x,u,s3)
h1=dnorm(u,u,s1);h1
h2=dnorm(u,u,s2);h2
h3=dnorm(u,u,s3);h3
par(mfrow=c(1,3))
lines(x,pdfx2,type="l",xlab="X",ylab="f(x)",col="red",lwd=2)
lines(x,pdfx3,type="l",xlab="X",ylab="f(x)",col="orange",lwd=2)
title('Probability Density Function u=-1,s=0.5,1,2')
u=0
h1=dnorm(u,u,s1);h1
h2=dnorm(u,u,s2);h2
h3=dnorm(u,u,s3);h3
title('Probability Density Function u=0,s=0.5,1,2')
u=1
h1=dnorm(u,u,s1);h1
h2=dnorm(u,u,s2);h2
h3=dnorm(u,u,s3);h3
title('Probability Density Function u=1,s=0.5,1,2')
De esta forma obtenemos el gráfico siguiente:
Para µ = -1, =0.5,1,2 Para µ = 0, =0.5,1,2 Para µ = 1, =0.5,1,2

> h1 (=0.5) > h1 (=0.5) > h1 (=0.5)
[1] 0.7978846 [1] 0.7978846 [1] 0.7978846
> h2 (=1) > h2 (=1) > h2 (=1)
[1] 0.3989423 [1] 0.3989423 [1] 0.3989423
> h3 (=2) > h3 (=2) > h3 (=2)
[1] 0.1994711 [1] 0.1994711 [1] 0.1994711
En donde podemos observar que a medida que  crece la altura de x en µ disminuye. Mientras
que si varía la media µ y se mantiene constante  la altura de x en µ sigue siendo siempre la
misma. Por lo tanto las alturas no cambian para los diferentes valores de µ.
 Cree una secuencia de función de densidad de la t de student para diferentes grados de libertad
gl = 5; 15; 25; 35 usando las funciones correspondientes del programa que use. Compare
entonces con la distribución normal estándar. Use gráficos y medidas estadísticas.
Solución:
x=seq(-5,5,0.1)
gl1=5;gl2=15;gl3=25;gl4=35
pdftx1=dt(x,gl1);pdftx2=dt(x,gl2);pdftx3=dt(x,gl3);pdftx4=dt(x,gl4)
pdfzx=dnorm(x,0,1)
par(mfrow=c(2,2))
plot(x,pdftx1,type="l",xlab="X",ylab="f(x)",col="blue",lwd=2)
lines(x,pdfzx ,type="l",col="red",lwd=2)
title('Probability Density Function t(5),z(0,1)')
Observamos que a medida que aumentan los grados de libertad de la función de densidad de
probabilidades de la T de Student se asemeja más a la distribución normal estándar.
II. Capítulo 3
 Generate 500 random samples from the standard normal distribution for sample sizes of n = 2,
15, and 45. At each sample size, calculate the sample mean for all 500 samples. How are the
means distributed as n gets large? Look at a histogram of the sample means to help answer this
question. What is the mean and variance of the sample means for each n? Is this what you would
expect from the Central Limit Theorem?
Solución:
Construimos una función en R para tomar gran cantidad de muestras y almacenar sus resultados.
zsamples=function(n) {
i=1
xhats=seq(1:500)
for (i in 1:500) {
x=rnorm(n,0,1)
xhats[i]=mean(x)
i=i+1}
return(xhats)
}
n1=2;n2=15;n3=45
xhat1=mean(zsamples(n1));xhat1
par(mfrow=c(1,3))
hist(zsamples(n1),xlab="Xbar (n=2)",col="red",
main="Histograma de medias, 500 muestras")
hist(zsamples(n2),xlab="Xbar (n=15)",col="orange",
hist(zsamples(n3),xlab="Xbar (n=45)",col="skyblue",
Obtenemos el siguiente gráfico en R:
Media=0.02604 Media=0.02065 Media=0.00609

Var=0.504511/2 Var=0.064971/15 Var=0.025331/45
Se observa claramente que a medida que el tamaño de las muestras se incrementa el valor del
promedio de todas las medias muestrales se aproxima más a cero. De igual forma, la variancia se
aproxima al valor teórico 2/n según el Teorema del Límite Central.
 En este ejemplo, generamos una muestra aleatoria de una distribución normal estándar. Use la
función correspondiente para generar sus muestras. Que sucede con el coeficiente de asimetría y
curtosis cuando el tamaño de muestra crece?.
Solución:
Extraemos las muestras en R y calculamos el coeficiente de asimetría y curtosis:
#Cambiar los valores de n=50,500,2500

n=50
x=rnorm(n)
u=mean(x)
# Cálculo de la Asimetría
num= (1/n)*sum((x-u)^3)
den = (1/n)*sum((x-u)^2)
gam1 = num/den^(3/2)
gam1
# Cálculo de la curtosis
num=(1/n)*sum((x-u)^4)
den = (1/n)*sum((x-u)^2)
gam2 = num/den^2
gam2
Para n = 50 Para n = 500 Para n = 2500

> gam1 (Asimetría) > gam1 (Asimetría) > gam1 (Asimetría)
[1] 0.03878445 [1] -0.01942143 [1] 0.03381787
> gam2 (Curtosis) > gam2 (Curtosis) > gam2 (Curtosis)
[1] 2.779587 [1] 2.915729 [1] 3.010912
Según la teoría de la distribución normal estándar, la simetría debe ser cero y la curtosis igual a 3.
En este ejercicio se puede notar que a medida que aumenta el tamaño de muestra, los valores de
la asimetría y la curtosis se aproximan mejor a los valores teóricos.
 Compare los valores obtenidos para los cuartiles estimados en el ejemplo 3.6 con las cantidades
teóricas. Incremente el tamaño de muestra a n = 1000. Los estimados mejoran?.
Solución:
Requerimos de las siguientes sentencias en R:
require(signal)
x=rnorm(500)
xs=sort(x)
# Now get the observed values for the abscissa (X_obs).
n=length(x)
phat=((1:n)-0.5)/n
# We want to get the quartiles.
p=c(0.25, 0.5, 0.75)
# The following provides the estimates of the quartiles
# using linear interpolation.
qhat1=interp1(phat,xs,p,method = "linear");qhat1
qhat2=interp1(phat,xs,p,method = "nearest");qhat2
qhat3=interp1(phat,xs,p,method = "pchip");qhat3
qhat4=interp1(phat,xs,p,method = "pchip");qhat4
qhat5=interp1(phat,xs,p,method = "cubic");qhat5
qhat6=interp1(phat,xs,p,method = "spline");qhat6
#Cuartiles Teóricos
qhat=qnorm(p,0,1);qhat
> qhat1=interp1(phat,xs,p,method = "linear");qhat1

[1] -0.68217757 -0.03240299 0.55007140
> qhat2=interp1(phat,xs,p,method = "nearest");qhat2
[1] -0.68703510 -0.03506697 0.54945158
> qhat3=interp1(phat,xs,p,method = "pchip");qhat3
[1] -0.68194682 -0.03178649 0.54991874
[1] -0.68194682 -0.03178649 0.54991874
> qhat5=interp1(phat,xs,p,method = "cubic");qhat5
[1] -0.68207137 -0.03208029 0.54965416
> qhat6=interp1(phat,xs,p,method = "spline");qhat6
[1] -0.68187931 -0.03186702 0.54909862
> #Cuartiles Teóricos
> qhat=qnorm(p,0,1);qhat
[1] -0.6744898 0.0000000 0.6744898
Para una muestra de n=1000

> qhat1=interp1(phat,xs,p,method = "linear");qhat1
[1] -0.662325751 0.004279495 0.657811465
> qhat2=interp1(phat,xs,p,method = "nearest");qhat2
[1] -0.662428880 0.004273785 0.657521812
[1] -0.662324627 0.004278377 0.657748923
[1] -0.662324627 0.004278377 0.657748923
> qhat5=interp1(phat,xs,p,method = "cubic");qhat5
[1] -0.66232310 0.00424571 0.65776904
> qhat6=interp1(phat,xs,p,method = "spline");qhat6
[1] -0.662324499 0.004222492 0.657745997
> #Cuartiles Teóricos
> qhat=qnorm(p,0,1);qhat
[1] -0.6744898 0.0000000 0.6744898
Podemos apreciar que la estimación de los cuartiles cuando n=1000 es la que más se aproxima a
los valores teóricos, por lo tanto se vuelven más precisos a medida que aumenta el tamaño de
muestra.
 Investigate the bias in the maximum likelihood estimate of the variance that is given in Equation
3.28. Generate a random sample from the standard normal distribution. Calculate 2 using
Equation 3.28 and record the value in a vector. Repeat this process (generate a random sample
from the standard normal distribution, estimate the variance, save the value) many times. Once
you are done with this procedure, you should have many estimates for the variance.
Take the mean of these estimates to get an estimate of the expected value of 2 . How does this
compare with the known value of 2=1? Does this indicate that the maximum likelihood estimate
for the variance is biased? What is the estimated bias from this procedure?
Solución:
El estimador de máxima verosimilitud para la variancia es como sigue:

𝑛
2
1
𝜎 = (𝑥𝑖 − 𝑥)2
𝑛
𝑖=1
Escribimos un programa en R para tomar varias muestras de tamaño n=300:
#creando una función para tomar n muestras

#de la Distribución Normal Estándar
zsamples=function(n) {
i=1
shats=seq(1:300)
for (i in 1:500) {
x=rnorm(n,0,1)
shats[i]=(sum((x-mean(x))^2)/n)
i=i+1
}
return(shats)
}
n=100
shat=mean(zsamples(n))
shat
bias=1-shat
bias
Salida del R:
> shat=mean(zsamples(n))
> shat
[1] 0.9880203
> bias=1-shat
> bias
[1] 0.01197965
Lo que nos indica que existe un sesgo de 0.01198 para dicho estimador de la variancia, obtenido
por el método de máxima verosimilitud.

Maestría de Estadística - Solucionario Capítulo 2 y 3

Загружено:

Сведения о документе

Исходное описание:

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Maestría de Estadística - Solucionario Capítulo 2 y 3

Загружено:

Авторское право:

Доступные форматы

Curso: Estadística Computacional

Solucionario Lista 1 de Ejercicios

César Correa Genaro Requena

1. Derive la función de distribución acumulada para la Logística.

Desarrollando la función de densidad y la función de distribución acumulada para la Logística en

Graficando en R la función de densidad y la distribución acumulada de la Logística tenemos:

Obtenemos el siguiente gráfico

 Suponga que existe 50 % de chance de que un adulto americano sufra de un desorden

Podemos usar la función pbinom de R para determinar P(X ≤ 3)

Para graficar usamos la siguiente secuencia de comandos:

#Graficando la Distribución de Probabilidad

 Encuentre la altura de la curva para la función de densidad normal en x = µ, para  = 0.5; 1; 2.

De esta forma obtenemos el gráfico siguiente:

Para µ = -1, =0.5,1,2 Para µ = 0, =0.5,1,2 Para µ = 1, =0.5,1,2

Obtenemos el siguiente gráfico en R:

Media=0.02604 Media=0.02065 Media=0.00609

Extraemos las muestras en R y calculamos el coeficiente de asimetría y curtosis:

#Cambiar los valores de n=50,500,2500

Para n = 50 Para n = 500 Para n = 2500

Requerimos de las siguientes sentencias en R:

> qhat1=interp1(phat,xs,p,method = "linear");qhat1

Para una muestra de n=1000

El estimador de máxima verosimilitud para la variancia es como sigue:

Escribimos un programa en R para tomar varias muestras de tamaño n=300:

#creando una función para tomar n muestras

Вам также может понравиться