Академический Документы
Профессиональный Документы
Культура Документы
m
o
2
Ejemplo 2.-Calcular para una distribucion Normal -de media 7 y desviacin standard 2 -, a) El valor de la funcin densidad y de la
funcin de distribucin para x=5, b) asimetria y c) curtosis. La forma de utilizar estas funciones es similar a la de las
distribuciones discretas, se proceder como sigue:
Nota: Para calcular la densidad de probabilidad y la Distribucion (acumulada) de probabilidad se utiliza, respectivamente PDF y CDF, cuyo significado es facil
obtener directamente de la ayuda
PDF[NormalDistribution[3, 2], 5] // N
CDF[NormalDistribution[3, 2], 5] // N
Skewness[NormalDistribution[3, 2]]
Kurtosis[NormalDistribution[3, 2]]
0.120985
0.841345
0
3
La representacin grfica de la funcin de densidad se puede hacer facilmente
2 guillermo Sanchez Dist ribucionesCont inuas. nb
ht t p: / / web.usal. es/ guillermo
Plot[PDF[NormalDistribution[3, 2], x], {x, -10, 13}]
-10 -5 5 10
0.05
0.10
0.15
0.20
Aproximacin de las distribucin Binomial y de Poisson a la Normal
Para valores grandes de n, con np10, p1/2, la distribucin binomial se puede aproximar por una normal de
media np y varianza np(1-p). Asimismo una distribucin de Poisson se puede aproximar a una normal cuando la
media l15, siendo mejor mientras mas alto es l.
Distribucion Exponencial
Esta funcin se utiliza fundamentalmente para estimar el tiempo de fallo de un equipo o un componente.
? ExponentialDistribution
ExponentialDistribution[l] represents an exponential distribution with scale inversely proportional to parameter l.
PDF[ExponentialDistribution[X], x]
CDF[ExponentialDistribution[X], x]
Mean[ExponentialDistribution[X]]
Variance[ExponentialDistribution[X]]
c
-x `
` x ~ 0
0 True
1 - c
-x `
x ~ 0
0 True
1
`
1
`
2
Ejemplo 3.- La tasa de fallo de una lampara electrica es de 10
-4
h
-1
. Cual es la duracin media estimada?.
En este caso l=10
-4
y por tanto
Dist ribucionesCont inuas. nb 3
Mean]ExponentialDistribution]10
-4
(+en horas+)
10000
La probabilicad de fallo en funcn del tiempo , para un periodo [0,T], con T =100000, podemos representarla
como sigue:
Plot]CDF]ExponentialDistribution]10
-4
, t, {t, 0, 100000}
20000 40000 60000 80000 100000
0.6
0.7
0.8
0.9
1.0
Distribucion Gamma
Esta funcin se utiliza especialmente para estimar la probabilidad de fallo en sistemas redundantes. las caracteristi-
cas fundamentales son:
Information["GammaDistribution", LongForm - False]
GammaDistribution[a, b] represents a gamma distribution with shape parameter a and scale parameter b.
GammaDistribution[a, b, g, m] represents a generalized gamma
distribution with shape parameters a and g, scale parameter b, and location parameter m.
PDF[GammaDistribution[o, p], x]
CDF[GammaDistribution[o, p], x]
Mean[GammaDistribution[o, p]]
Variance[GammaDistribution[o, p]]
c
-
x
/
x
-1+c
/
-c
Gamma[c]
x > 0
0 True
GammaRegularizedc, 0,
x
/
x > 0
0 True
c /
c /
2
Ejemplo 4.-Consideremos un sistema de alimentacin de corriente electrica esta formado por dos generadores diesel reduntes
conectados en paralelo (un equipo esta desconectado pero listo para funcionar en caso de fallo del otro). La tasa de fallo de cada
4 guillermo Sanchez Dist ribucionesCont inuas. nb
ht t p: / / web.usal. es/ guillermo
equipo esta dado por una distribucin exponencial con una tasa de fallo de 10
-4
h
-1
. El conjunto ser una distribucin gamma
con a=2, y b=1/l=10
4
. El tiempo medio de fallo esperado para el conjunto es:
Mean]GammaDistribution]2, 10
4
20000
Distribucion Weibull
Esta funcin es muy versatil pues una apropiada eleccin de los parametros alfa y beta permite ajustar datos
experimentales a esta funcin.
Information["WeibullDistribution", LongForm - False]
WeibullDistribution[a, b] represents a Weibull distribution with shape parameter a and scale parameter b.
WeibullDistribution[a, b, m] represents a Weibull
distribution with shape parameter a, scale parameter b, and location parameter m.
PDF[WeibullDistribution[o, p], x]
CDF[WeibullDistribution[o, p], x]
Mean[WeibullDistribution[o, p]]
Variance[WeibullDistribution[o, p]]
c
-
x
/
c
c
x
/
-1+c
/
x > 0
0 True
1 - c
-
x
/
c
x > 0
0 True
/ Gamma1 +
1
c
/
2
-Gamma1 +
1
c
2
+ Gamma1 +
2
c
Ejemplo 5.- El tiempo de fallo de un computador central satisface una funcin de Weibull con a= 1/2 y b =1000 h. El tiempo medio
de fallo esperado es:
Mean[WeibullDistribution[1 / 2, 1000]]
2000
Distribucion _
2
(ji-cuadrado)
Esta funcin es util para estimar o
2
a partir de una muestra aleatoria formada por n valores x
i
, i=1,...,n en una
poblacin normal verificandose que _
2
~(n-1)
S
2
o
2
.
? ChiSquareDistribution
ChiSquareDistribution[n] represents a c
2
distribution with n degrees of freedom.
Dist ribucionesCont inuas. nb 5
PDF[ChiSquareDistribution[n], x]
CDF[ChiSquareDistribution[n], x]
Mean[ChiSquareDistribution[n]]
Variance[ChiSquareDistribution[n]]
2
-n/2
c
-x/2
x
-1+
n
2
Gamma
n
2
x > 0
0 True
GammaRegularized
n
2
, 0,
x
2
x > 0
0 True
n
2 n
Distribucion t-student
Esta funcin es util en muestreo cuando el nmero de valores es pequeo.
? StudentTDistribution
StudentTDistribution[n] represents a Student t distribution with n degrees of freedom.
StudentTDistribution[m, s, n] represents a Student t
distribution with location parameter m, scale parameter s, and n degrees of freedom.
PDF[StudentTDistribution[n], x]
CDF[StudentTDistribution[n], x]
Mean[StudentTDistribution[n]]
Variance[StudentTDistribution[n]]
n
n+x
2
,
1+n
2
n Beta
n
2
,
1
2
1
2
n Beta
n
2
,
1
2
+ x Hypergeometric2F1
1
2
,
1 + n
2
,
3
2
, -
x
2
n
, n Beta
n
2
,
1
2
0 n > 1
Indeterminate True
n
-2+n
n > 2
Indeterminate True
Distribucion F
Esta funcin se emplea entre otras cosas para comparar las varianzas muestrales S
1
2
y S
2
2
de dos poblaciones
N(,
1
, o
1
2
) N(,
2
, o
2
2
) . Tiene la propiedad F
n
1
-1, n
2
-1
~
S
1
2
o
1
2
S
2
2
o
2
2
6 guillermo Sanchez Dist ribucionesCont inuas. nb
ht t p: / / web.usal. es/ guillermo
? FRatioDistribution
FRatioDistribution[n, m] represents an F-ratio distribution with n numerator and m denominator degrees of freedom.
PDF[FRatioDistribution[n
1
, n
2
], x]
CDF[FRatioDistribution[n
1
, n
2
], x]
Mean[FRatioDistribution[n
1
, n
2
]]
Variance[FRatioDistribution[n
1
, n
2
]]
x
-1+
n
1
2 n
1
n
1
2
n
2
n
2
2
(x n
1
+ n
2
)
1
2
(-n1-n2)
, Beta
n1
2
,
n2
2
x > 0
0 True
BetaRegularized
x n1
x n1+n2
,
n1
2
,
n2
2
x > 0
0 True
n2
-2+n2
n
2
> 2
Indeterminate True
2 n
2
2
(-2+n1+n2)
n1 (-4+n2) (-2+n2)
2
n
2
> 4
Indeterminate True
Determinacin de intervalos estadsticos para la media en
poblaciones normales
Introduccin
Un problema frecuente en medidas de variables estadsticas ( inspeccin, intercomparaciones, validaciones, etc) es
el establecimiento de intervalos de confianza, tolerancia y de prediccin.
Aqu vamos a mostrar como se pueden estimar los intervalos de confianza en el caso de poblaciones normales
cuando se desea garantizar que una proporcin de la poblacin este entre determinados lmites con un probabili-
dad determinada.
Vamos a utiliza el programa Mathematica, del que vamos a necesitar el siguiente paquete. Ejecuta la celda
Dist ribucionesCont inuas. nb 7
BeginPackage["Estadistica`Intervalos`"]
(+v1 desarrollado por Guillermo Sanchez +)
K1exacto::usage = "Calcula la K unilateral por un metodo exacto";
g1::usage = "Calcula la K unilateral";
g2::usage = "Calcula la K bilateral";
K1::usage = "Muestra la K unilateral";
K2::usage = "Muestra la K bilateral";
limiteBilateral::usage = "Muestra los limites superior en inferior del intervalo";
limiteUnilateral::usage = "Muestra los limites superior en inferior del intervalo";
z1::usage = "Calcula los intervalos de confianza de la media, varianza conocida, para el
t1::usage = "Calcula los intervalos de confianza de la media , varianza desconocida, par
p1::usage = "Calcula si se acepta o rechaza una muestra ";
Begin["`Private`"]
g1[n_, alfa_, p_] := Module[{zp, za, a, b}, zp = Quantile[NormalDistribution[0, 1], p];
za = Quantile[NormalDistribution[0, 1], 1 - alfa]; a = 1 - za^2/(2+(n - 1));
b = zp^2 - za^2/n; K1[n, 1 - alfa, p] -> (zp + Sqrt[zp^2 - a+b])/a];
g2[n_, alfa_, p_] := Module[{z, ji2}, z = Quantile[NormalDistribution[0, 1], (1 + p)/2];
ji2 = Quantile[ChiSquareDistribution[n - 1], alfa];
K2[n, 1 - alfa, p] -> z+Sqrt[(n - 1)/ji2]+(1 + 1/(2+n))];
limiteBilateral[media_, sd_, n_, alfa_, p_] = {"LS"-> media + g2[n, alfa, p][[2]]+sd,
"LI"-> media - g2[n, alfa, p][[2]]+sd};
limiteUnilateral[media_, sd_, n_, alfa_, p_] = {"LS"-> media + g1[n, alfa, p][[2]]+sd, "
z1[media_, sd_, n_, alfa_] :=
Module[{za, zb}, za = Quantile[NormalDistribution[0, 1], 1 - alfa];
zb = Quantile[NormalDistribution[0, 1], 1 - alfa/2];
{"unilateral:", {"LS" -> media + za+sd/Sqrt[n], "LI" -> media - za+sd/Sqrt[n]}, "bilater
t1[media_,sd_,n_,alfa_]:=
Module[{za,zb},za=Quantile[StudentTDistribution[n-1],1-alfa];
zb=Quantile[StudentTDistribution[n-1],1-alfa/2];
{"unilateral:",{"LS"->media+za+sd/Sqrt[n],"LI"->media-za+sd/Sqrt[n]},
"bilateral:",{"LS"->media+zb+sd/Sqrt[n],"LI"->media-zb+sd/Sqrt[n]}}];
p1[mean_, sigma_, size_, alfa_, p_, uL_, lL_] :=
Module[{pLS, pLI}, pLS = FindRoot[g1[size, alfa, pS][[2]] == (uL - mean)/sigma,
{pS, 0.5, 0.99}, MaxIterations -> 50][[1,2]];
pLI = FindRoot[g1[size, alfa, 1 - pI][[2]] == (mean - lL)/sigma,
{pI, 0.01, 0.2}, MaxIterations -> 50][[1,2]]; pLS - pLI >= p];
End[]
EndPackage[]
Estadistica`Intervalos`
Estadistica`Intervalos`Private`
Estadistica`Intervalos`Private`
Lo conveniente es que salve la celda anterior como paquete en un directorio que llamara Estadistica, entonces
copie ese directorio en Mathematica Application, entonces podr llamar al paquete que siempre que lo necesite:
8 guillermo Sanchez Dist ribucionesCont inuas. nb
ht t p: / / web.usal. es/ guillermo
Needs["Estadistica`Intervalos`"]
? "Estadistica`Intervalos`+"
Estadistica`Intervalos`
g1 K1 K2 limiteUnilateral t1
g2 K1exacto limiteBilateral p1 z1
Notacin
m, s= Valores verdaderos de la media y desviacin estandar de la poblacin.
y , s = Estimadores de la media y desviacin estandar muestral.
z(a) = El percentil a de la distribucin normal estndar N(0,1). Ejemplo: el valor de z para una normal N(0,1) por
debajo del cual se encuentra el 95% de la poblacin es z(0.95) = 1.64.
t(m; a) = El percentil a de la t Student con m grados de libertad. Ejemplo: el valor de t para a = 95% y m = 5 es
t(5 ; 0.95) = 2.01.
t ' (m, d; a) = El percentil a de la t Student no central con m grados de libertad y un parametro de descentraliza-
cion d . Su interpretacin es mas compleja que en los casos anteriores.
T-Student No central
Vamos a necesitar la T-Student No central. La informacin disponible en al ayuda es la siguiente:
? NoncentralStudentTDistribution
NoncentralStudentTDistribution[n, d] represents a noncentral
Student t distribution with n degrees of freedom and noncentrality parameter d.
La funcin de densidad de esta distribucin es
PDF[NoncentralStudentTDistribution[n, 5], x]
1
.
2
n
c
-
2
2 n
1+
n
2 n + x
2
,
1
2
(-1-n)
Gamma
1 + n
2
HermiteH-1 - n, -
x
2 n + x
2
x > 0
0 True
La funcin gamma se define como F (z) =
0
t
z-1
e
-t
d t
En al fig. se representa la fdd de c
n
2
para distintos valores de n.
Plot[{PDF[ChiSquareDistribution[5], x], PDF[ChiSquareDistribution[10], x],
PDF[ChiSquareDistribution[25], x]}, {x, 0, 60}, PlotRange - All]
10 20 30 40 50 60
0.05
0.10
0.15
De una muestra normal N(m,s) tomamos una muestra aleatoria {X
1
, X
2
..., X
n
}. Si a cada valor X
i
le restamos la
media m y lo dividimos entre la varianza s y lo elevamos al cuadrado obtendremos (2) que es una distribucin de
Dist ribucionesCont inuas. nb 15
las mismas caracteristicas que (1), es decir tendremos una distribucin c
n
2
Y =
X
1
- ,
o
2
+
X
2
- ,
o
2
+ ... +
X
n
- ,
o
2
= _
i=1
n
X
i
- ,
o
2
_
n
2
Fijado un coef. de confianza g podemos encontrar dos numeros a y b de forma que P|a c
n
2
b] = g, donde a =
c
2
n, (1-g)f2
y b = c
2
n, (1+g)f2
para lo que proceemos como sigue:
, = P a
1
o
2
_
i=1
n
(X
i
- ,)
2
b =
P
1
b
_
i=1
n
(X
i
- ,)
2
o
2
1
a
_
i=1
n
(X
i
- ,)
2
Sustituimos a y b por sus valores y reagruparmos los terminos para obtener el intervalo de confianza para o
2
1
_
2
n, (1+,)/2
_
i=1
n
(X
i
- ,)
2
o
2
1
_
2
n, (1-,)/2
_
i=1
n
(X
i
- ,)
2
=
n s
2
_
2
n, (1+,)/2
o
2
n s
2
_
2
n, (1-,)/2
En el caso en que la media m sea desconocida se tiene en cuenta que de acuerdo al teorema de Fisher (n - 1) s
c
2
/o
2
es una distribucin c
n-1
2
y se procedede forma similar al caso anterior obteniendose
(n - 1) s
c
2
_
2
n, (1+,)/2
o
2
(n - 1) s
c
2
_
2
n, (1-,)/2
Determinacin del intervalo de confianza de s de varias poblaciones normales que tienen en
comn la misma varianza
Sean varias poblaciones N(x
1
, s), N(x
2
, s), ..., N(x
g
, s), ..., N(x
m
, s), de cada una de las cuales se toma una
muestra de tamao n con la que se determina la desviacin estndar de dicha muestra. Un ejemplo de este tipo es
el caso de un proceso productivo del que vamos tomando periodicamente muestras aleatorias independientes del
que medimos un parametro p. Para dicho parametro de cada muestra tenemos su media y varianza x
g
, s
g
2
.
Pasado un tiempo tendremos las varianzas {s
1
2
,..., s
m
2
}de m muestras que asumimos tomadas con el proceso bajo
control. Nuestro objetivo es calcular la dispersin natural s del proceso, que suponemos desconocida, con un
determinado intervalo de confianza. A los lmites de dicho intervalos les denominamos Lmite Superior de Control
(LSC
s
) y Lmite Inferior de Control (LIC
s
). Para cualquier muestra que tomemos con posterioridad mediremos su
desviacin tpica, s
m
, si s
m
est comprendido en el intervalo (LSC
s
, LIC
s
) consideramos que dicha muestra se ha
tomado con el proceso est bajo control, en caso contrario consideraremos que est desajustado.
Para determianar el intervalo de confianza para s hemos de calcular la esperanza matematica E[s] y su dispersin
D[s]
Esperanza matematica de s, E[s]
Recordemos que la esperanza matematica para funciones continuas se define como
E[z] =
-
z f
z
(z) oz
En nuestro caso z es s. Para determinar la fdd f
z
(z)tenemos en cuenta que n
s
2
s
2
sigue una distribucin c
n-1
2
y
hacemos la transformacin n
s
2
s
2
= n
y
s
2
= x. De esta forma obtnemos la fdd de s
2
16 guillermo Sanchez Dist ribucionesCont inuas. nb
ht t p: / / web.usal. es/ guillermo
f
s
2 (y) = f
_
n-1
2 (x)
dx
dy
= f
_
n-1
2 (x[y])
n
o
2
fs2 = PDF[ChiSquareDistribution[n - 1], x]
n
o
2
/. x -
n
o
2
y
1
o
2
n
2
1-n
2 c
-
n y
2 o
2
n y
o
2
,
-1+
1
2
(-1+n)
, Gamma
1
2
(-1 + n)
n y
o
2
> 0
0 True
Como s = s
2
para obtener la fdd (PDF) de s hacemos el cambio de variable z = y
f
s
(z) = f
s
2 (y)
dy
dz
= f
s
2 (y[z]) 2 z
f[z_] = fs2 2 z /. y - z
2
1
o
2
2 n z
2
1-n
2 c
-
n z
2
2 o
2
n z
2
o
2
-1+
1
2
(-1+n)
, Gamma
1
2
(-1 + n)
n z
2
o
2
> 0
0 True
Para calcular la esperanza matemtica sustituimos en (6)
Integrate_z f[z], {z, 0, =}, Assumptions - Re[n] > 0 && Re_
n
o
2
_ > 0_ // FullSimplify
- 2 o Gamma
n
2
, n Gamma
1
2
(-1 + n) n > 0 && o 0
2 o Gamma
n
2
, n Gamma
1
2
(-1 + n) n > 0 && o > 0
0 True
por tanto
E[s] = c
2
o
con
c2[n_] =
2 Gamma]
n
2
n Gamma]
1
2
(-1 + n)
;
Dispersin de s, D[s]
La dispersin esta dada por
D[s] = Es
2
- (E[s])
2
como
Es
2
=
n - 1
n
o
2
y E[s] = c
2
o
resulta
D[s] = c
3
o
con
Dist ribucionesCont inuas. nb 17
c3[n_] =
n - 1
n
- c2[n]
2
// FullSimplify
_
1 -
1
n
-
2 Gamma
n
2
2
n Gamma
1
2
(-1 + n)
2
Determinacin del intervalo de confianza
El intervalo de confianza para s se puede determinar a) Utilizando el criterio habitual que se emplea en la construc-
cion de cartas de control que consiste en calcularlo para 3 s o b) fijando el nivel de confianza a
Intervalo de confianza para 3 s
Se calcula como sigue
E[s]- k D[s]sE[s]+ k D[s]
a) Para s conocida
LSC
s
= B
2
s con B
2
= c
2
+ 3 c
3
B2[n_] = c2[n] + 3 c3[n] // FullSimplify
2 Gamma
n
2
n Gamma
1
2
(-1 + n)
+ 3 _ 1 -
1
n
- 2 Gamma
n
2
2
, n Gamma
1
2
(-1 + n)
2
LIC
s
= B
1
s B
1
= c
2
- 3 c
3
B1[n_] = c2[n] - 3 c3[n] // FullSimplify
2 Gamma
n
2
n Gamma
1
2
(-1 + n)
- 3 _ 1 -
1
n
- 2 Gamma
n
2
2
, n Gamma
1
2
(-1 + n)
2
a) Para s desconocida
LSC
s
= B
4
s con B
4
=
c
2
+3 c
3
c
2
LIC
s
= B
3
s con B
3
=
c
2
-3 c
3
c
2
B4[n_] =
c2[n] + 3 c3[n]
c2[n]
// FullSimplify
1 + 3 n Gamma
1
2
(-1 + n) _ 1 -
1
n
- 2 Gamma
n
2
2
, n Gamma
1
2
(-1 + n)
2
,
2 Gamma
n
2
2
, n Gamma
1
2
(-1 + n)
2
,
2 Gamma
n
2