Вы находитесь на странице: 1из 51

UNIDAD IV

Distribuciones de probabilidad de variables aleatorias


continuas

Variables aleatorias Continuas


Las variables aleatorias continuas pueden asumir valores sobre
una escala continua. Los resultados de un experimento se pueden
representar mediante puntos sobre un segmento de línea. La
variable aleatoria se establece al asignar de manera adecuada un
número a cada punto mediante alguna regla o ecuación.

En general, se escribe 𝑃(𝑎 𝑋 𝑏) para indicar la probabilidad


asociada con los puntos del espacio muestral, cuyo valor de la
variable aleatoria cae en el intervalo de 𝑎 − 𝑏.

El problema de establecer probabilidades que relacionan los


espacios muestrales continuos y variables aleatorias continuas
conlleva algunas complicaciones.

Por ejemplo, suponga que se desea saber la probabilidad de que,


si hay un accidente en una autopista cuya longitud es de 200
millas, esta ocurrirá en algún punto dado, o bien, en algún tramo
específico de la carretera. Los resultados de este experimento
pueden considerarse como un espacio continuo de puntos; dentro
del intervalo continuo de 0 a 200 millas.

Entonces la probabilidad de que el accidente ocurra en algún


intervalo de longitud 𝐿/200, con 𝐿 medida en millas. Nótese que
esta asignación arbitraria de probabilidad es consistente con los
axiomas 1 y 2, pues la probabilidad es mayor o igual a 0 y menor
200
o igual a 1, para el caso seguro de 𝑃(𝑆) = = 1.
200

1
En este ejemplo, solo se han considerado eventos representados
por intervalos que forman parte del segmento de línea de 0 a 200.
Al usar el axioma 3, también se obtienen las probabilidades
mediante la unión de intervalos finitos o contables. Por ende, para
dos intervalos que no se traslapan, de longitudes L1 y L2, se tiene
L +L
una probabilidad de 1 2 y para una secuencia infinita de
200
intervalos que no se traslapan de longitudes L1 , L2 , L3 , …, hay una
probabilidad de

𝐿1 + 𝐿2 + 𝐿3 + ⋯
200

Observe que la probabilidad de que el accidente ocurra en algún


punto puede ser igual a cero, cuando el punto considerado está en
un intervalo de longitud cero. Sin embargo, la probabilidad de que
el accidente ocurra en un intervalo muy corto es mayor que cero;
por ejemplo, para un intervalo de 1 pie de longitud, la
1⁄
5280
probabilidad es = 9.4696𝑥10−7
200

La forma en que se asignaron las probabilidades para el ejemplo


anterior es muy especial; es de naturaleza similar a la forma de
asignar probabilidades iguales a las seis caras de un dado, águila
y sol de una moneda, o bien para las 52 cartas en un mazo
estándar, entre otras.

Sin embargo, para tratar el problema de asociar probabilidades


con variables aleatorias continuas de manera general, puede
suponer que está interesado en la probabilidad de que la variable
aleatoria tome un valor en el intervalo de 𝑎 − 𝑏, donde 𝑎 y 𝑏 son
constantes, y con 𝑎 ≤ 𝑏. Además, suponga que el intervalo de 𝑎 −
𝑏 se divide en 𝑚 subintervalos iguales de ancho ∆𝑥 que contienen
a los puntos 𝑥1 , 𝑥2 , … , 𝑥m respectivamente, donde la
probabilidad de que la variable aleatoria tome un valor en el

2
subintervalo que contiene 𝑥i está dada por 𝑓(𝑥𝑖 )∆𝑥. Entonces, la
probabilidad de que la variable aleatoria de interés tome un valor
en el intervalo de 𝑎 − 𝑏 está dada por
𝑚

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∑ 𝑓(𝑥𝑖 )∆𝑥


𝑖=1

Donde 𝑓(𝑥) es una función integrable definida para todos los


valores de la variable aleatoria, entonces se podrá establecer la
probabilidad de que el valor de la variable aleatoria caiga entre
𝑎 𝑦 𝑏 al hacer ∆𝑥 → 0, mediante la siguiente integral

𝑏
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎

Como se ilustra en la figura siguiente,

La probabilidad está dada como el área bajo la curva de 𝑓(𝑥)

Esta definición de probabilidad para el caso continuo presupone


la existencia de una función 𝑓(𝑥) adecuada que, al integrarla
desde cualquier constante a hasta cualquier constante b (con a ≤
b), y da como resultado la probabilidad de que la variable
aleatoria correspondiente tome un valor en el intervalo de a - b.

Observe que el valor 𝑓(𝑥) no da la probabilidad de que la variable


aleatoria correspondiente tome el valor 𝑥.

3
En el caso continuo, las probabilidades están dadas por integrales
y no por los valores 𝑓(𝑥).

Para calcular la probabilidad de una variable aleatoria que toma


un valor 𝑥, primero se calcula la probabilidad para un intervalo
entre (𝑥 − ∆𝑥 ) y (𝑥 + ∆𝑥), y luego se considera que ∆𝑥 → 0. Sin
embargo, si realmente se hiciera esto, entonces es evidente que el
resultado siempre será cero.

La definición de probabilidad para el caso continuo ofrece un


modelo excelente para analizar eventos que involucren
mediciones u observaciones.

Es importante hacer notar que, cuando se dice que hay cero


probabilidades de que una variable aleatoria tome algún valor
dado x, esto no significa que sea imposible que la variable
aleatoria tome el valor x.

En el caso continuo, una probabilidad de cero no implica una


imposibilidad lógica, sino más bien el asunto es principalmente
académico, debido a las limitaciones en la habilidad de medir y
observar, ya que siempre se está interesado en las probabilidades
relacionadas con intervalos y no con puntos aislados.

Como consecuencia, en caso continuo donde las probabilidades


asociadas con puntos individuales son siempre cero, entonces la
probabilidad asociada con el intervalo de 𝑎 − 𝑏, no importa si se
incluye o no al punto extremo. De manera simbólica.

𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝑃(𝑎 ≤ 𝑋 < 𝑏) = 𝑃(𝑎 < 𝑋 ≤ 𝑏) = 𝑃(𝑎 < 𝑋 < 𝑏)

La definición de probabilidad para los casos continuos, a las


funciones 𝑓(𝑥) se les llama funciones de densidad de probabilidad,
o simplemente densidades de probabilidad. Por otro lado, si se
integra la función 𝑓(𝑥), entonces se obtiene la probabilidad.

4
Se seguirá la práctica común de llamar 𝑓(𝑥) a la función de
densidad de probabilidad, en el entendido de que se hace
referencia a la función 𝑓 que asigna el valor 𝑓(𝑥) a 𝑥, para cada 𝑥
que es un valor posible de la variable aleatoria 𝑋.

Puesto que una función de densidad de probabilidad, integrada


entre los límites 𝑎 y 𝑏, da como resultado la probabilidad de que
una variable aleatoria adquiera un valor entre dichos límites.

Una función de densidad de probabilidad deberá satisfacer las


siguientes condiciones:

𝑓 (𝑥 ) ≥ 0 ∀ 𝑥

∫ 𝑓(𝑥 )𝑑𝑥 = 1
−∞

Como en el caso discreto, se denotará 𝐹 (𝑥 ) como la probabilidad


de que una variable aleatoria con una densidad de probabilidad
𝑓(𝑥) tome un valor menor que o igual a 𝑥, de nuevo se hace
referencia a la correspondiente función 𝐹 como la función de
distribución acumulada o tan solo la función de distribución
de la variable aleatoria. Por lo tanto, para cualquier valor 𝑥,
𝐹 (𝑥 ) = 𝑃(𝑋 = 𝑥) es el área bajo la función de densidad de
probabilidad sobre el intervalo −∞ a 𝑥. En la notación usual del
cálculo para la integral,
𝑥
𝐹 (𝑥 ) = ∫ 𝑓(𝑡)𝑑𝑡
−∞

En consecuencia, la probabilidad de que la variable aleatoria tome


un valor en el intervalo de 𝑎 − 𝑏 es el resultado de realizar 𝐹 (𝑏) −
𝐹(𝑎), de acuerdo con el teorema fundamental del cálculo integral,
el cual establece que

5
𝑑𝐹(𝑥)
= 𝑓(𝑥)
𝑑𝑥

Siempre que exista esta derivada.

EJEMPLO.

Cálculo de probabilidades a partir de la función de densidad de


probabilidad.

Si una variable aleatoria tiene la densidad de probabilidad 𝑓(𝑥 )

−2𝑥 𝑝𝑎𝑟𝑎 𝑥 > 0


𝑓(𝑥 ) = {2𝑒
0 𝑝𝑎𝑟𝑎 𝑥 ≤ 0

Nótese, que el dominio de 𝑓(𝑥 ) incluye todos los números reales,


aun cuando la probabilidad es cero, para cuando x toma valores
negativos. Esta es una práctica común que se sigue con las
funciones de densidad de probabilidad

Encuentre la probabilidad de que tome un valor

a) entre 1 y 3;
b) mayor que 0.5

Solución
Al evaluar las integrales necesarias, se obtiene
3
∫ 2𝑒 −2𝑥 𝑑𝑥 = −𝑒 −2𝑥 |13 = 𝑒 −2 − 𝑒 −6 = 0.1333
1


∫ 2𝑒 −2𝑥 𝑑𝑥 = −𝑒 −2𝑥 |∞
0.5 = −0 + 𝑒
−1
= 0.368
0.5

6
En la gráfica de esta función se observa que tiene una
discontinuidad en 𝑥 = 0; de hecho, una densidad de probabilidad
no necesita ser continua en todas partes, mientras pueda ser
integrada entre dos límites 𝑎 𝑦 𝑏 cualesquiera (con 𝑎 < 𝑏) y
cumpla con las propiedades de una función de densidad de
probabilidades.

Gráfica de densidad de probabilidad de la 𝑓(𝑥 ) = 2𝑒 −2𝑥 , 𝑥 > 0

Obtención de una función de distribución de probabilidad a


partir de su función de densidad

Con respecto al ejemplo anterior, encuentre la función de


distribución y utilícela para calcular la probabilidad de que la
variable aleatoria tome un valor de 𝑥 ≤ 1.

La función de distribución de probabilidad puede ser


representado de la siguiente manera

0 𝑝𝑎𝑟𝑎 𝑥 ≤ 0
𝑥
𝐹 (𝑥 ) = {
∫ 2𝑒 −2𝑥 𝑑𝑡 = −𝑒 −2𝑥 |0𝑥 = −𝑒 −2𝑥 + 1 𝑝𝑎𝑟𝑎 𝑥 > 0
0

al sustituir 𝑥 = 1 en 𝐹 (𝑥 ), se tiene como resultado

𝐹 (1) = −𝑒 −2 + 1 = 0.8646

7
Observe que la función de distribución 𝐹 (𝑥 ) es creciente, además
se comprueba que 𝐹 (−∞) = 0 y 𝐹 (∞) = 1.

Una función de densidad de probabilidad asigna


probabilidad 1 para el intervalo (–∞, ∞)

Encuentre una constante 𝑘 de modo que 𝑓(𝑥 ) sea una expresión


válida como densidad de probabilidad de una variable aleatoria:

0 𝑝𝑎𝑟𝑎 𝑥 ≤ 0
𝑓 (𝑥 ) = { 2
𝑘𝑥𝑒 −4𝑥 𝑝𝑎𝑟𝑎 𝑥 > 0

𝑘 tiene que ser no negativa, y para satisfacer la segunda condición


se debe cumplir

∞ ∞ ∞
−4𝑥 2
𝑘 𝑘 2
∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑘𝑥𝑒 𝑑𝑥 = ∫ − 𝑒 𝑢 𝑑𝑢 = − 𝑒 −4𝑥 |∞
0
−∞ 0 0 8 8
𝑘
= −0 + = 1; 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑘 = 8
8

Las medidas estadísticas que se utilizan para describir


densidades de probabilidad son muy similares a las utilizadas en
las distribuciones de probabilidad. Por ejemplo, al sustituir las
sumatorias por integrales, se obtiene el k-ésimo momento con
respecto al origen, esto es

𝜇𝑘′ = ∫ 𝑥 𝑘 𝑓(𝑥)𝑑𝑥
−∞

El primer momento con respecto al origen nuevamente se conoce


como media, y se denota con 𝜇. También se le llama valor esperado

8
𝐸(𝑋) de una variable aleatoria, la cual tiene una densidad de
probabilidad 𝑓(𝑥).

𝐸(𝑋) = 𝜇 = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞

También se puede obtener el k-ésimo momento con respecto a la


media, dada por

𝜇𝑘 = ∫ (𝑥 − 𝜇)𝑘 𝑓(𝑥)𝑑𝑥
−∞

En particular, al segundo momento con respecto a la media


nuevamente se le conoce como varianza y se expresa con 𝜎 2 ; esta
mide la dispersión de una densidad de probabilidad, debido a que
da el valor esperado de la desviación al cuadrado a partir de la
media.


𝑉 (𝑋) = 𝜎 = ∫ (𝑥 − 𝜇 )2 𝑓(𝑥 )𝑑𝑥 = 𝐸 (𝑋 2 ) − [𝐸 (𝑋)]2
2
−∞

Nuevamente a 𝜎 se le conoce como la desviación estándar.

Obtención de la media y la varianza usando la función de


densidad de probabilidad

Sea 𝑓(𝑥 ) = 2𝑒 −2𝑥 , encuentre la media y la varianza de la densidad


de probabilidad dada.

Al realizar las integraciones necesarias, usando la integración por


partes, se obtiene

9
∞ ∞ ∞
−2𝑥
𝜇 = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑥2𝑒 𝑑𝑥 = 2 ∫ 𝑥𝑒 −2𝑥 𝑑𝑥
−∞ 0 0

∫ 𝑓 𝑑𝑔 = 𝑓𝑔 − ∫ 𝑔 𝑑𝑓
𝑓 = 𝑥; 𝑑𝑔 = 𝑒 −2𝑥
1
𝑑𝑓 = 𝑑𝑥; 𝑔 = − 𝑒 −2𝑥
2

−2𝑥
1 −2𝑥 ∞ ∞
1 −2𝑥
2 ∫ 𝑥𝑒 𝑑𝑥 = 2 (−𝑥 𝑒 )] + 2 ∫ 𝑒 𝑑𝑥
0 2 0 0 2


1 −2𝑥 ∞ 1 1
2 ∫ 𝑥𝑒 −2𝑥 𝑑𝑥 = −𝑥𝑒 −2𝑥 ]∞
0 − 𝑒 ] = −0 + 0 − 0 + =
0 2 0 2 2

2

2
1 2 −2𝑥
∞ ∞
−2𝑥
1 2
𝜎 = ∫ (𝑥 − 𝜇) 𝑓(𝑥)𝑑𝑥 = ∫ (𝑥 − ) 2𝑒 𝑑𝑥 = 2 ∫ 𝑒 (𝑥 − ) 𝑑𝑥
−∞ 0 2 0 2


1 2 ∞
1 ∞
1
2 ∫ 𝑒 −2𝑥 (𝑥 − ) 𝑑𝑥 = 2 ∫ 𝑒 −2𝑥 (𝑥 2 − 𝑥 + ) 𝑑𝑥 = 2 ∫ (𝑥 2 𝑒 −2𝑥 − 𝑥𝑒 −2𝑥 + 𝑒 −2𝑥 ) 𝑑𝑥
0 2 0 4 0 4
1
𝜎2 =
4

DISTRIBUCIÓN DE PROBABILIDAD UNIFORME


Se dice que una variable aleatoria 𝑋 sigue una distribución
continua uniforme cuando su función de densidad 𝑓(𝑥 ) toma
valores constantes en el intervalo [𝛼, 𝛽 ]. Para calcular esa
constante 𝐾, se utiliza la condición de normalización de la función
de densidad, tal que

∞ 𝛽 𝛽
1 = ∫ 𝑓 (𝑥 )𝑑𝑥 = ∫ 𝑓(𝑥 )𝑑𝑥 = ∫ 𝐾𝑑𝑥 = 𝐾(𝛽 − 𝛼)
−∞ 𝛼 𝛼

1
Entonces 𝐾 = , para satisfacer que el área total sea 1
(𝛽−𝛼)

Por lo tanto, la función de densidad de probabilidad tiene la forma

10
1
𝑝𝑎𝑟𝑎 𝛼 < 𝑥 < 𝛽
𝑓(𝑥 ) = { 𝛽 − 𝛼
0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥

Gráfica de densidad de probabilidad uniforme

Observe que todos los valores de 𝑥, desde 𝛼 hasta 𝛽, son


“igualmente probables”. Entonces la probabilidad de que x se
encuentre en un intervalo de ancho ∆𝑥, el cual está contenido en
∆𝑥
el intervalo de 𝛼 a 𝛽, es igual a sin importar la ubicación
𝛽−𝛼
exacta dentro del intervalo.

Se puede calcular la función de distribución 𝐹 (𝑥 ). Cuando 𝑥 esté


en el intervalo [𝛼, 𝛽 ]
𝑥 x
1 𝑥−α
𝐹 (𝑥 ) = 𝑃(𝑋 < 𝑥 ) = ∫ 𝑓(𝑡)𝑑𝑡 = ∫ 𝑑𝑡 =
−∞ α 𝛽−𝛼 𝛽−𝛼

De manera general

𝑥−α
𝑝𝑎𝑟𝑎 𝛼 < 𝑥 < 𝛽
𝐹 (𝑥 ) = { 𝛽 − 𝛼
0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥

11
Para ilustrar cómo una situación física origina una distribución
uniforme, suponga que una rueda de locomotora tiene el radio 𝑟,
𝑥 es la ubicación en algún punto en su circunferencia, medida a lo
largo de la circunferencia a partir de cierto punto de referencia 0.
Cuando se aplican los frenos, algún punto hará contacto
deslizante con el riel, y en dicho punto habrá un fuerte desgaste.
Entonces en una aplicación repetida de los frenos, es razonable
suponer que 𝑥 es un valor de una variable aleatoria que tiene la
distribución uniforme con 𝛼 = 0 y 𝛽 = 2𝜋𝑟.

Para determinar la media y la varianza de la distribución


uniforme, evalúe primero las dos integrales.
𝛽 𝛽
1 1 𝑥2 𝛽2 − 𝛼 2 (𝛽 − 𝛼)(𝛽 + 𝛼)
𝜇=∫ 𝑥 𝑑𝑥 = [ ] = =
𝛼 𝛽−𝛼 𝛽 − 𝛼 2 𝛼 2(𝛽 − 𝛼) 2(𝛽 − 𝛼)

(𝛽 + 𝛼)
𝐸(𝑋) = 𝜇 =
2

Por otra parte, la varianza puede calcularse como



𝑉 (𝑋) = 𝜎 = ∫ (𝑥 − 𝜇 )2 𝑓(𝑥 )𝑑𝑥 = 𝐸 (𝑋 2 ) − [𝐸 (𝑋)]2
2
−∞

Desarrollando se llega a la expresión para la varianza y la


desviación típica

𝛽 2
1 (𝛽 + 𝛼 )
𝑉 (𝑋 ) = 𝜎 2 = ∫ 𝑥 2 𝑑𝑥 − [ ]
𝛼 𝛽 − 𝛼 2

𝛽 2
1 𝑥3 (𝛽 + 𝛼 )
= [ ] −[ ]
𝛽−𝛼 3 𝛼 2
2
1 𝛽3 − 𝛼 3 (𝛽 + 𝛼 )
= ( )−[ ]
3 𝛽−𝛼 2

12
1 (𝛽 − 𝛼)(𝛽 2 + 𝛽𝛼 + 𝛼 2 ) (𝛽 + 𝛼) 2
= ( )−[ ]
3 𝛽−𝛼 2

𝛽 2 + 𝛽𝛼 + 𝛼 2 𝛽 2 + 2𝛽𝛼 + 𝛼 2
=( )−( )
3 4

4𝛽 2 − 3𝛽 2 + 4𝛽𝛼 − 6𝛽𝛼 + 4𝛼 2 − 3𝛼 2
=( )
12
𝛽 2 − 2𝛽𝛼 + 𝛼 2 (𝛽 − 𝛼)2
=( )=
12 12

2
(𝛽 − 𝛼)2
𝜎 =
12

𝛽−𝛼
𝜎=
√12

13
LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL
La densidad de probabilidad normal, es la más importante o la más
utilizada. Se estudió por primera vez en el siglo xviii, cuando los
científicos observaron un sorprendente grado de regularidad en
los errores de las mediciones. Descubrieron que los patrones (de
distribuciones) que observaron se aproximaban cercanamente
mediante una distribución continua, a la que se refirieron como
la “curva normal de errores” y se la atribuyeron a las leyes del
azar. La ecuación de la densidad de probabilidad normal, está
dada por la función

1 (𝑥−𝜇)2
2) −
𝑓(𝑥; 𝜇, 𝜎 = 𝑒 2𝜎2 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞
𝜎√2𝜋

La gráfica correspondiente (como la sección transversal de una


campana), se ilustra en la figura siguiente.

Distribución de probabilidad normal

Una vez que se especifican los valores de μ y 𝜎 2 , puede


comprobarse que esta distribución de probabilidad cumple la
condición de obtener un área total igual a 1.

14

1 ∞ (𝑥−𝜇)2 ∞
1 𝑧2
− −
𝐹 (𝑥 ) = ∫ 𝑓 (𝑥 )𝑑𝑥 = ∫ 𝑒 2𝜎 2 𝑑𝑥 =∫ 𝑒 2 𝑑𝑧
−∞ 𝜎√2𝜋 −∞ −∞ √2𝜋
1
= √2𝜋 = 1
√2𝜋
𝑥−𝜇
Se realiza un cambio de variable 𝑧 = , esto es 𝑑𝑥 = 𝜎𝑑𝑧,
𝜎
Por otro lado, si a la distribución normal se le asigna 𝜇 = 0 y 𝜎 =
1, entonces la función de densidad 𝑓(𝑥 ) se transforma a la que se
conoce como función de densidad normal estándar
1 (𝑥−𝜇)2 1 −𝑧 2

𝑓 (𝑥 ) = 𝑒 2𝜎 => 𝑓(𝑧) =
2
𝑒 2
𝜎√2𝜋 √2𝜋

De esta manera se obtiene la función de distribución normal


estándar;
𝑧 𝑡2
1 −
𝐹 (𝑧) = ∫ 𝑒 2 𝑑𝑡
√2𝜋 −∞

Para valores positivos o negativos z = 0.00, 0.01, 0.02, …, 3.49, y,


también, z = 3.50, z = 4.00 y z =5.00. Las probabilidades
acumuladas 𝐹 (𝑧) corresponden al área bajo la función de densidad
normal estándar a la izquierda de 𝑧, como lo indica el área
sombreada de la figura siguiente.

La probabilidad normal estándar 𝐹 (𝑧) = 𝑃(𝑍 = 𝑧)

15
16
Para calcular la probabilidad de que una variable aleatoria tome
un valor entre 𝑎 y 𝑏, sabiendo que tiene una distribución normal
estándar, se evalúa la siguiente ecuación

𝑃(𝑎 < 𝑍 < 𝑏) = 𝐹 (𝑏) − 𝐹(𝑎)

El área sombreada de la figura siguiente muestra esta


probabilidad.

La probabilidad normal estándar 𝐹 (𝑏) − 𝐹 (𝑎) = 𝑃(𝑎 < 𝑍 < 𝑏)

En ocasiones también se usa la identidad 𝐹 (−𝑧) = 1 − 𝐹 (𝑧), esto


es válido para todas las distribuciones simétricas con centro
alrededor de 0.

Ejemplo

Realice el cálculo de algunas probabilidades normales estándares

Determine la probabilidad de que una variable aleatoria que tiene


la distribución normal estándar tomará un valor

a) entre 0.87 y 1.28;


b) entre −0.34 y 0.62;
c) mayor que 0.85;
d) mayor que −0.65.

Es útil indicar primero el área de interés en una gráfica como se


muestra en la figura

17
𝑃(0.87 < 𝑍 < 1.28)

Al buscar los valores necesarios en la tabla 3, para el inciso a) se


obtiene F(1.28) − F(0.87) = 0.8997 − 0.8078 = 0.0919

Como se indica en la siguiente figura para el inciso b),


F(0.62) − F(−0.34) = 0.7324 –(1-0.6331)=0.7324-0.3669 = 0.3655

Como se indica en la siguiente figura para el inciso c),

1 − F(0.85) = 1 − 0.8023 = 0.1977

Como se indica en la figura 5.9 para el inciso d)


Mayor que F(−0.65) =1 - (1 − F(0.65) )= 1 − 0.2578 = 0.7422

18
También existen problemas en los cuales se dan probabilidades
relacionadas con las distribuciones normales estándares y se pide
encontrar los valores correspondientes de z.

Sea 𝑧𝛼 tal que la probabilidad es 𝛼 de que se superará por una


variable aleatoria que tenga la distribución normal estándar. Esto
es: 𝛼 = P(Z>𝑧𝛼 ) como se ilustra en la siguiente figura

EJEMPLO
Dos valores importantes para 𝑧𝛼

Calcule a) z0.01; b) z0.05.

a) Puesto que F(z0.01) = 1-F(z0.01) = 0.99, se busca en la tabla 3 la


probabilidad que esté más cerca a 0.99 y se obtiene 0.9901, que
corresponde a z = 2.33. Por consiguiente, z0.01 = 2.33.

b) Puesto que F(z0.05) = 1-F(z0.05)=0.95, se busca en la tabla 3 la


probabilidad que esté más cerca a 0.95 y se obtienen 0.9495 y

19
0.9505, que corresponden a z = 1.64 y z = 1.65. Por lo tanto, por
interpolación, z0.05 = 1.645.

Para utilizar la tabla 3 en conexión con una variable aleatoria X


que tenga una distribución normal con media 𝜇 y varianza 𝜎 2 ,
remítase a la correspondiente variable aleatoria estandarizada

𝑋−𝜇
𝑍=
𝜎
Es posible demostrar que se tiene la distribución normal
estándar. Por lo tanto, para encontrar la probabilidad de que la
variable aleatoria original tomará un valor menor que o igual a a,
en la tabla 3 se busca

𝑎−𝜇
𝐹( )
𝜎

Además, si se requiere encontrar la probabilidad de que una


variable aleatoria que tenga la distribución normal con la media
μ y la varianza 𝜎 2 tomará un valor entre a y b, tan solo se debe
calcular la probabilidad de que una variable aleatoria con la
distribución normal estándar tomará un valor entre

𝑎−𝜇 𝑏−𝜇
𝑦
𝜎 𝜎

Esto es, para encontrar probabilidades concernientes a X,


convierta su valor a puntuaciones z es mediante

𝑋−𝜇
𝑍=
𝜎

Siempre y cuando X tenga la distribución normal con media 𝜇 y


desviación estándar 𝜎. (probabilidades normales)

20
𝑏−𝜇 𝑎−𝜇
𝑃(𝑎 < 𝑋 < b) = 𝐹 ( ) − 𝐹( )
𝜎 𝜎

EJEMPLO

Cálculo de probabilidades usando una distribución normal

Con el objetivo del mejorar del desempeño de un proceso,


ingenieros industriales estudian la capacidad de los escáneres
para leer los códigos de barras de varios productos alimenticios y
para el hogar. La máxima reducción en potencia, justo antes de
que el escáner no pueda leer el código de barras a una distancia
fija, se conoce como atenuación máxima. Esta cantidad, medida en
decibeles, varía de un producto a otro. Después de recolectar
datos considerables, los ingenieros deciden modelar la variación
en atenuación máximo como una distribución normal con media
𝜇 = 10.1 𝑑𝐵 y desviación estándar 𝜎 = 2.7𝑑𝐵

a) Para el siguiente alimento o producto, ¿cuál es la probabilidad


de que su atenuación máxima esté entre 8.5 dB y 13.0 dB?
b) De acuerdo con el modelo normal, ¿qué proporción de los
productos tienen la atenuación máxima entre 8.5 dB y 13.0 dB?
c) ¿Qué proporción de los productos tienen atenuación máxima
mayor que 15.1 dB?

Solución
a) La atenuación máxima del siguiente producto, X, se trata como
una selección aleatoria para la distribución normal con 𝜇 = 10.1
y 𝜎 = 2.7 En consecuencia, Z = (X − 10.1)/2.7 y, de la tabla 3, se
obtiene

13.0 − 10.1 8.5 − 10.1


𝐹( ) − 𝐹( ) = 𝐹 (1.07) − 𝐹 (−0.59)
2.7 2.7

21
=0.8577 - 0.2776
=0.5801

que corresponde al área sombreada de la figura 5.11

b) La proporción de productos que tienen atenuación máxima


entre 8.5 y 13.0 dB corresponde a la probabilidad del inciso a).
Cuando se considera la población infinita incluso más grande
de todos los productos existentes y los que podrían haberse
fabricado, entonces a la probabilidad de 0.5801 todavía se le
refiere como la proporción con atenuación máxima entre 8.5 y
13.0 dB.

c) A l buscar el valor necesario en la tabla 3,

15.1 − 10.1
1−𝐹( ) = 1 − 𝐹 (1.85) = 1 − 0.9678 = 0.0322
2.1

que corresponde al área sombreada de la figura 5.12,

22
EJEMPLO

Uso de probabilidades normales para determinar la media del


llenado de frascos

La cantidad real de café instantáneo que una máquina llenadora


pone en frascos de “4 onzas” puede considerarse como una
variable aleatoria, cuya distribución normal tiene 𝜎 = 0.04 onzas.
Si tan solo 2% de los frascos contendrá menos de 4 onzas, ¿cuál
debería ser la media de llenado de dichos frascos?

Para encontrar 𝜇 tal que


4−𝜇
𝐹( ) = 0.02
0.04

se busca la entrada en la tabla 3 más cercana a 0.02, (que se


determina como 1-0.98, pero en tablas corresponde a 1-0.9798)
y se obtiene 0.0202, que corresponde a z = −2.05 (debido a que
F(-2.05)=1-F(2.05). Como se indica en la figura 5.13,

4−𝜇
( ) = −2.05, entonces − 𝜇 = −(2.05 ∗ 0.04) − 4
0.04
𝜇 = (2.05 ∗ 0.04) + 4 = 4.082

Así determina que 𝜇 = 4.082 onzas

DISTRIBUCIÓN DE PROBABILIDADES GAMMA

23
Muchas densidades de probabilidad cuyas aplicaciones se
estudiarán más adelante, son casos especiales de la distribución
gamma. Esta distribución tiene la densidad de probabilidad dado
por

1
𝛼
𝑥 𝛼−1 𝑒 −𝑥/𝛽 𝑝𝑎𝑟𝑎 𝑥 > 0, 𝛼 > 0, 𝛽 > 0
𝑓 (𝑥 ) = {𝛽 Γ(𝛼)
0 𝑝𝑎𝑟𝑎 𝑥 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟

1
Sea 𝜆 el promedio de fracasos, entonces 𝛽 = , que representa el
𝜆
tiempo promedio hasta que ocurra la primara falla.

donde Γ(𝛼) es un valor de la función gamma, definida por



Γ(𝛼) = ∫ 𝑥 𝛼−1 𝑒 −𝑥 𝑑𝑥
0

La integración por partes indica que

Γ(𝛼) = (𝛼 − 1)Γ(𝛼 − 1)

1
Γ ( ) = √π = 1.7724
2
De manera general, para valores impares de 𝑛 se tiene:
𝑛 𝑛!
Γ ( + 1) = √π ∗ (𝑛+1)/2
2 2

para cualquier 𝛼 > 1 y, por lo tanto, que Γ(𝛼) = (𝛼 − 1)! cuando


𝛼 es un entero positivo. En la figura se muestran gráficas de varias
distribuciones gamma que ilustran el hecho de que dichas
distribuciones tienen sesgo positivo. En efecto, el sesgo
disminuye conforme 𝛼 aumenta para cualquier valor fijo de 𝛽.

24
La media y la varianza de la distribución gamma pueden
obtenerse al usar la función gamma y sus propiedades especiales
mencionadas anteriormente. Para la media, se tiene
∞ 1 ∞
𝛼−1 −𝑥
𝜇 = ∫ 𝑥 𝑓(𝑥)𝑑𝑥 = 𝛼 ∫ 𝑥𝑥 𝑒 𝛽𝑑𝑥
−∞ 𝛽 Γ(𝛼) 0
∞ ∞
1 𝛼 −1 −𝑥/𝛽
1
= 𝛼 ∫ 𝑥𝑥 𝑥 𝑒 𝑑𝑥 = 𝛼 ∫ 𝑥 𝛼 𝑒 −𝑥/𝛽 𝑑𝑥
𝛽 Γ(𝛼) 0 𝛽 Γ(𝛼) 0

después de hacer que 𝑦 = x/𝛽, esto es 𝑥 = 𝛽𝑦 y también 𝛽 = x/y



1
𝜇= ∫ 𝑥 𝛼 𝑒 −𝑦 𝛽𝑑𝑦
𝑥𝛼
Γ(𝛼) 0
y𝛼

𝛽 𝛽Γ(𝛼 + 1)
𝜇= ∫ 𝑦 𝛼 𝑒 −𝑦 𝑑𝑦 =
Γ(𝛼) 0 Γ(𝛼)

Entonces, al emplear la identidad Γ(𝛼 + 1) = 𝛼 Γ(𝛼) se llega al


resultado de que media de distribución gamma

𝛽𝛼 Γ(𝛼)
𝜇=
Γ(𝛼)

𝜇 = 𝛼𝛽

25
Al usar métodos similares, también se puede demostrar que la
varianza de la distribución gamma está dada por

𝜎 2 = 𝛼𝛽 2
EJEMPLO
Los ingenieros que diseñan la próxima generación de
trasbordadores espaciales planean incluir dos bombas de
combustible, una activa y la otra en reserva.
Si la bomba principal falla, la segunda se coloca automáticamente.
Se considera que en una misión típica se requiere bombear
combustible durante un máximo de 50 horas. De acuerdo con las
especificaciones del fabricante, se espera que las bombas fallen
una vez cada 100 horas. ¿Cuáles son las posibilidades de que
dicho sistema de bombeo de combustible no permanezca
funcionando durante las todas 50 horas?

Considere 𝛽 = 100, y 𝛼 = 2

50
1 𝑥
−100
𝐹 (𝑋) = 𝑃(𝑋 < 50) = ∫ 𝑥𝑒 𝑑𝑥 = 0.0902
10000 0

DISTRIBUCIÓN DE PROBABILIDADES EXPONENCIAL

Este es un caso especial de la distribución Gamma, donde α = 1,


además Γ(1) = (1 − 1)! = 1 se tiene la distribución exponencial,
La distribución exponencial es útil para modelar la distribución
de tiempos de vida o tiempos para un evento, cuya densidad de
probabilidad es, por lo tanto,

1 1−1 −𝑥/𝛽
1 −𝑥/𝛽
𝑥 𝑒 𝑒 𝑝𝑎𝑟𝑎 𝑥 > 0, 𝛽 > 0
𝑓(𝑥 ) = {𝛽1 Γ(1) = {𝛽
0 0 𝑥≤0

26
Y cuya media y varianza son 𝜇=𝛽 y
𝜎 = 𝛽2.
2

Cuya función de distribución de probabilidad acumulada es

𝐹 (𝑥 ) = 1 − 𝑒 −𝑥/𝛽

EJEMPLO

Cálculo de probabilidad usando la distribución exponencial.

En un lugar donde en promedio tres camiones llegan por hora


para descargar en un almacén, ¿cuáles son las probabilidades de
que el tiempo entre la llegada de camiones sucesivos será a)
menor a 5 minutos? b) al menos de 45 minutos?

Suponiendo que las llegadas siguen un proceso de Poisson con α


= 3, entonces 𝛽 = 1/3

Solución
a)
1/12 1
−3𝑥 −4
∫ 3𝑒 𝑑𝑥 = 1 − 𝑒 = 0.221
0
O también
𝐹 (𝑥 ) = 1 − 𝑒 −(1/12)/(1/3)
1
−4
𝐹 (𝑥 ) = 1 − 𝑒 = 0.221

b)
∞ 9
−3𝑥 −4
∫ 3𝑒 𝑑𝑥 = 0 + 𝑒 = 0.105
3/4
9 9
−4 −4
𝐹 (𝑥 ) = 1 − (1 − 𝑒 )=𝑒 = 0.105

27
EJEMPLO
Los estudiantes llegan a un bar y de acuerdo con una
aproximación de Poisson se proceso a una velocidad promedio de
30 estudiantes por hora. ¿Cuál es la probabilidad de que el
estudiante tenga que esperar más de 3 minutos para atender al
próximo alumno?

Solución.
Si es X igual al número de estudiantes, entonces la media de
Poisson λ es de 30 estudiantes por 60 minutos, esto es 1/2
estudiante por minuto. Ahora, si W denote el tiempo (de espera)
entre los estudiantes, podemos esperar que haya, en promedio,
1
𝛽 = = 2 minutos entre los estudiantes que llegan. Como W (se
λ
supone que está) distribuido exponencialmente con una media
𝜇 = 𝛽 = 2, su función de densidad de probabilidad es:

1 −𝑥/2 3
𝑃(𝑋 > 3) = ∫ 𝑒 𝑑𝑥 = 0 + 𝑒 −2 = 0.2231
3 2
3
−𝑥/2 −2
𝐹 (𝑥 ) = 1 − (1 − 𝑒 )=𝑒 = 0.2231

LA DISTRIBUCIÓN BETA

Cuando una variable aleatoria toma valores en el intervalo de 0 a


1. La distribución beta se usa comúnmente para modelar
variación en la proporción o porcentaje de una cantidad
ocurriendo en diferentes muestras. La función de densidad de
probabilidad es

28
Γ(𝛼 + 𝛽)
𝑥 𝛼−1 (1 − 𝑥)𝛽−1 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 𝛼 > 0, 𝛽 > 0
𝑓(𝑥 ) {Γ(𝛼 ) ∗ Γ(𝛽)
0 𝑝𝑎𝑟𝑎 𝑥 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟

La media y la varianza de esta distribución están dadas por

𝛼 𝛼𝛽
𝜇= 𝑦 𝜎2 =
𝛼+𝛽 (𝛼 + 𝛽 )2 (𝛼 + 𝛽 + 1))

Note que para 𝛼 = 1 y 𝛽 = 1 se obtiene como caso especial la


distribución uniforme, definida en el intervalo de 0 a 1. El
siguiente ejemplo, que pertenece a una proporción, ilustra una
aplicación común de la distribución beta.

1 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1


𝑓 (𝑥 ) = {
0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥

EJEMPLO
Cálculos de probabilidad usando una distribución beta

En cierto país, la proporción de secciones de autopista que


requieren reparaciones en algún año dado, es una variable
aleatoria, que tiene la distribución beta con α = 3 y β = 2 (que se
muestran en la figura siguiente

a) En promedio, ¿qué porcentaje de las secciones de autopista


requieren reparaciones en un año dado?
b) Encuentre la probabilidad de que cuando mucho la mitad de
las secciones de autopista requerirán reparaciones en algún año
dado.

Solución
a)

29
3
𝜇= = 0.6
3+2

que significa que, en promedio, 60% de las secciones de la


autopista requieren reparaciones en algún año dado.

b) Al sustituir 𝛼 = 3 y 𝛽 = 2 en la fórmula para la distribución


beta y usar el hecho de que Γ(5) = 4! = 24, Γ(3) = 2! = 2, Γ(2) =
1! = 1,

se obtiene

Γ(5)
𝑥 2 (1 − 𝑥 ) = 12 𝑥 2 (1 − 𝑥 ) 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 𝛼 > 0, 𝛽 > 0
𝑓(𝑥 ) {Γ(3) ∗ Γ(2)
0 𝑝𝑎𝑟𝑎 𝑥 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟

Por ende, la probabilidad deseada está dada por

1
2
∫ 12 𝑥 2 (1 − 𝑥 )𝑑𝑥
0

30
1/2 1/2
=∫ 12 𝑥 2 𝑑𝑥 − ∫ 12 𝑥 3 𝑑𝑥 = 4 𝑥 3 − 3𝑥 4 = 0.3125
0 0

Siendo realistas, en la mayoría de las situaciones complejas, las


probabilidades relacionadas

La distribución de probabilidad Weibull

Esta distribución está estrechamente vinculada con la


distribución exponencial, y su densidad de probabilidad está
dada por

𝛽−1 −𝛼𝑥 𝛽
( )
𝑓 𝑥 ={ 𝛼 𝛽𝑥 𝑒 𝑝𝑎𝑟𝑎 𝑥 > 0, 𝛼 > 0, 𝛽 > 0
0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥

La función de distribución acumulada se establece como


𝛽
𝐹 (𝑥 ) = P(a < x < b) = 1 − 𝑒 −𝛼𝑥

Para demostrar esta relación, se evalúa la probabilidad de que


una variable aleatoria que tiene la distribución de Weibull tomará
un valor menor que a, es decir, la integral
𝑎
𝛽
∫ 𝛼 𝛽𝑥 𝛽−1 𝑒 −𝛼𝑋 𝑑𝑥
0

Al hacer el cambio de variable 𝑦 = 𝑥 𝛽 se obtiene, derivando en


𝑑𝑦
ambos lados 𝑑𝑦 = 𝛽𝑥 𝛽−1 𝑑𝑥, esto es 𝑑𝑥 = 𝛽−1 y finalmente
𝛽𝑥
sustituyendo

𝑋𝛽 𝑋 𝛽
−𝛼𝑋 𝛽
𝑑𝑦 −𝛼𝑋 𝛽
∫ 𝛼 𝛽𝑥 𝛽−1 𝑒 = ∫ 𝛼 𝑒 𝑑𝑦
0 𝛽𝑥 𝛽−1 0

31
𝑋𝛽 𝑋𝛽
𝛼𝑒 −𝛼y 𝛽 𝛽
∫ 𝛼𝑒 −𝛼y
𝑑𝑦 = [ ] = [−𝑒 −𝛼y ]0𝑋 = −𝑒 −𝛼𝑥 + 1
0 −𝛼 0

y se observa que y es un valor de una variable aleatoria que tiene


una distribución exponencial.

Las gráficas de varias distribuciones de Weibull con α = 1 y β =


1/3, 1 y 2 se presentan en la figura siguiente

La media de la distribución de Weibull considerando los


parámetros α y β puede obtenerse al evaluar la integral

𝛽
𝜇 = ∫ 𝑥 𝛼𝛽 𝑥 𝛽−1 𝑒 −𝛼𝑥 𝑑𝑥
0

Al hacer el cambio de variable 𝑢 = 𝛼𝑥 𝛽



−1/𝛽
𝜇=𝛼 ∫ 𝑢1/𝛽 𝑒 −𝑢 𝑑𝑢
0

32
1
y la integral se puede representar como Γ (1 + ),
𝛽

Así como un valor de la función gamma que se definió


𝑥
previamente, Γ(𝛼) = ∫0 𝑥 𝛼−1 𝑒 −𝑥 𝑑𝑥

Se encuentra que la media de la distribución de Weibull está dada


por
1
𝜇 = 𝛼 −1/𝛽 Γ (1 + )
𝛽
1 1
Γ (1 + ) Γ (1 + )
𝛽 1/𝛽 𝛽
𝜇= 𝑜 𝑏𝑖𝑒𝑛 𝛼 =
𝛼 1/𝛽 𝜇

1 𝛽 1 𝛽
Γ (1 + ) Γ (1 + )
1/𝛽 𝛽 𝛽 𝛽
(𝛼 ) = ( ) 𝑒𝑠𝑡𝑜 𝑒𝑠 𝛼 = ( )
𝜇 𝜇

Con el uso de un método similar para determinar primero 𝜇2′ se


obtiene que la varianza de esta distribución está dada por

2 −2/𝛽
2 1 2
𝜎 =𝛼 { Γ (1 + ) − [Γ (1 + )] }
𝛽 𝛽

EJEMPLO
Cálculo de probabilidad usando una distribución de Weibull

Suponga que la vida de cierto tipo de batería de respaldo para


emergencia (en horas) es una variable aleatoria X que tiene la
distribución de Weibull con α = 0.1 y β = 0.5. Determine

a) la vida media de dichas baterías;


b) la probabilidad de que tal batería durará más de 300 horas.
Solución

33
a)
(3 − 1)!
𝜇 = 0.1−2 Γ(1 + 2) = = 200 ℎ𝑟𝑠
0.12
b)

0.5 0.5
∫ 0.1 ∗ 0.5 𝑥 −0.5 𝑒 −0.1𝑥 𝑑𝑥 = 𝑒 −0.1(300) = 0.1777
300

EJEMPLO

Las llantas de un camión tienen una vida media de 20000 millas.


Un propietario conservativo decide reemplazar las llantas cada
15000 millas para disminuir los riesgos de fallas. ¿Cuál es la
probabilidad de que las llantas fallen antes de reemplazarse?
Considere que la vida de las llantas tiene una distribución Weibull
con β = 2.

Esta distribución tiene un significado especial para los expertos


en confiabilidad, sin embargo, este también puede ser útil para
modelar otros fenómenos.

El parámetro β afecta la forma de la distribución, el parámetro α


afecta la localización de la distribución. A medida que β se
incrementa y si la media se deja constante, entonces la variancia
decrece y la distribución se convierte a una distribución
simétrica.
Solución
1 2
Γ (1 + )
𝛼=( 2 )
20
Y recordando que

𝑛 1! √π
Γ (1 + ) = √π ∗ 1+1 =
2 2
2 2
Entonces

34
2
√π
𝛼 = ( 2 ) = 0.00196349
20
15
2
𝐹(𝑋) = ∫ 0.00196349(2) 𝑥 1 𝑒 −0.0019634𝑥 𝑑𝑥
0

2 15
𝐹 (𝑋) = [−𝑒 −0.001963𝑥 ]0 = (−0.642958 + 1) = 0.3570

Distribución chi-cuadrado ( 𝒙𝟐 (𝒏))

La distribución de probabilidad chi-cuadrado con n grados de


libertad (𝒙𝟐 (𝒏)) es una variable aleatoria que se obtiene como
suma de los cuadrados de n variables independientes con
distribución N(0,1).
Sea 𝑋1 , 𝑋2 , 𝑋3 , …, 𝑋𝑛 , variables aleatorias que se distribuyen
como normales N(0,1), y se define una nueva variable 𝑋 = 𝑋12 +
𝑋22 + 𝑋32 + ⋯ . 𝑋𝑛2 entonces se dice que X se distribuye como una
Chi-Cuadrado o Ji-cuadrado con n grados de libertad, donde n es
el número de variables aleatorias normales independientes
elevadas al cuadrado que se han sumado. Esta se representa como
𝑋 → 𝑋𝑛2
Y su función de densidad es de la forma

2−n/2 (n/2)−1 −x/2 1


x 𝑒 = x (n/2)−1 𝑒 −x/2 𝑝𝑎𝑟𝑎 𝑥 > 0
𝑓(𝑥) = {Γ(n/2) Γ(n/2)2n/2

0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥

Se observa que esta distribución es un caso especial de la


distribución Gamma con 𝛽 = 2 𝑦 𝛼 = 𝑛/2, donde n es un entero
positivo

donde Γ(𝛼) es un valor de la función gamma, definida por

35

Γ(𝛼) = ∫ 𝑥 𝛼−1 𝑒 −𝑥 𝑑𝑥
0

Por tanto, esta distribución sólo toma valores positivos y además


su función de densidad es muy compleja. En el siguiente gráfico
aparecen representadas las funciones de densidad de una
(𝒙𝟐 (𝟑)) (línea continua con tres grados de libertad) y una
(𝒙𝟐 (𝟓)) (línea discontinua con cinco grados de libertad):

Propiedades:
• Es una función asimétrica.
• E(x)= n
• V(x)=2n.
• Sean dos variables aleatorias chi-cuadrado que se distribuyen
𝑋1 → 𝑋𝑛2 y 𝑋2 → 𝑋𝑚 2
, se define una nueva variable de la forma
𝑌 = 𝑋1 + 𝑋2 , entonces esta nueva variable se distribuye como:
2
𝑌 → 𝑋𝑛+𝑚

36
• Cuando el número de variables aleatorias es muy grande, es
decir, cuando 𝑛 → ∞, la variable se puede aproximar por una
función normal.

Sea X una variable aleatoria Chi cuadrada con n = 3 de libertad,


calcule la siguiente probabilidad P(0.35 <X<7.81)

Solución
De tablas V (Javier Gorgas García)
P(0.35 <X<7.81)= P(0.35)-P(7.81)
P(0.35 <X<7.81)= 0.950- 0.050=0.90

Apéndice IV (serie Schaum)


P(0.35 <X<7.81)= P(7.81)-P(0.35)
P(0.35 <X<7.81)= 0.95- 0.05=0.90

Distribución t de Student (t(n))


La distribución t student es una familia de curvas que depende de
un solo parámetro n (grados de libertad)
Sea X una variable aleatoria que se distribuye como
𝑋 → 𝑁(0,1) y sea Y otra variable aleatoria que se distribuye como
𝑌 → 𝑋𝑛2 , tal que X e Y son independientes, entonces podemos
definir otra variable aleatoria
𝑋
𝑇=
√𝑌/𝑛

se dice que esta se distribuye como una t-Student con n grados de


libertad y su función de densidad viene dada por:

𝑛+1
Γ( )
2 − ∞ < 𝑥 < +∞
ℎ(𝑥 ) = 𝑛 𝑡2
(𝑛+1)/2
√𝑛𝜋 ∗ Γ (2) ∗ (1 + 𝑛 )
{
Donde

37
x
Γ(p) = ∫ 𝑥 𝑝−1 𝑒 −𝑥 𝑑𝑥
0
𝑥̃ − 𝜇
𝑡=
𝑠/√𝑛
Además 𝜇 es la media de la población, 𝑥̃ es la media de una
muestra, 𝑠 representa la desviación para una población, obtenida
de varianza (𝜎 2 ). La distribución t student, se define como una
variable aleatoria t, la cual es muy holgada, el “mejor” cuando no
se conoce 𝑠.
Esta distribución es muy utilizada, que se construye a partir de
una normal y un chi-cuadrado. Veamos una gráfica comparativa
con una distribución normal y algunas de las propiedades que
verifica (a)

(a) (b)
En el gráfico (b) aparecen representadas las función de densidad
de una t(4) :

Propiedades:
• Es simétrica, está centrada en el punto (0,0)
• Mo = Me =0
• E [T] = 0 si n>1
𝑛
• V [T] = si n>2.
𝑛−2

38
• Cuando el número de variables aleatorias es muy grande, es
decir, cuando 𝑛 → ∞, la variable se puede aproximar por una
normal.

Ejemplo de calibración
Se desea saber si un instrumento de medición está calibrado,
desde el punto de vista de la exactitud. Para ello se consigue un
valor patrón y se mide 10 veces (por ejemplo: una pesa patrón
para una balanza, un suero control para un método clínico, etc.).
Suponiendo que el resultado de estas mediciones arroja una
media de 52.9 y una desviación de 3, usando un patrón de valor
50, se desea determinar si el instrumento está calibrado y la
estimación de su error sistemático, si es que se prueba su
existencia (no se establecen unidades para generalizar este
ejemplo). H0: μ= 50 el instrumento está calibrado en exactitud
H1:μ≠50 no está calibrado. Hay un error sistemático

Se trata de un ensayo de dos colas donde hay k=10–1=9 grados


de libertad.

De la Tabla t-Student se obtienen los valores críticos para el 95%


de t0,05,9=2,262, para el 99% de t 0,01,9 =3,25 y para un nivel

39
del 99,9% es t0,001,9 =4,781. Lo que permite establecer las
zonas de aceptación y rechazo:

𝑥̃ − 𝜇 52.9 − 50.0
𝑡= = =3
𝑠/√𝑛 3/√10
Mirando las zonas con los valores críticos, el valor de t cae en la
de rechazo para el 95% y no alcanza para las otras. La conclusión
es que se ha probado la existencia de un error sistemático con una
confianza del 95%

𝑠 3
𝜇 = 𝑥̃ ± 𝑡 = 52.9 ± 3 = 52.9 ± 2.8
√𝑛 √10

EJEMPLO
Suponga que T tiene una distribución t con r = 8 grados de
libertad ¿Cuál es la probabilidad de que el valor absoluto de T sea
menor que 2.306?

Solución. El cálculo de probabilidad es bastante similar a un


cálculo que tendríamos que hacer para una variable aleatoria
normal. Primero, reescribiendo la probabilidad en términos de T
en lugar del valor absoluto de T, obtenemos:

40
P (| T | <2.306) = P (-2.306 <T <2.306)

Luego, tenemos que reescribir la probabilidad en términos de


probabilidades acumulativas que podamos encontrar, es decir:

P (| T | <2.306) = P (T <2.306) - P (T > 2.306)

Pictóricamente, la probabilidad que estamos buscando se parece


a esto:

P (T <2.306)=0.975

P (T <-2.306)=1- P (T <2.306)=1-0.975=0.025

P (| T | <2.306)= 0.975-0.025=0.25

41
DISTRIBUCIÓN DE F DE FISHER-SNEDECOR

Es una distribución continua que surge en la prueba de si dos


muestras observadas tienen la misma varianza. Sea 𝑋𝑚 2
y 𝑋𝑛2
variables independientes distribuidas como chi-cuadrado con m
y n grados de libertad.

Una variable aleatoria X sigue una distribución F de Fisher


Snedecor con n grados de libertad (F m,n) si y solo, si su función
de densidad de probabilidad esta dada por:
𝑚 𝑛 𝑚+𝑛
𝑚 2 𝑛2 𝛤 ( ) 𝑚 𝑚+𝑛
2 𝑥2 −1 −
(𝑛 + 𝑚𝑥) 2 𝑥>0
𝑚 𝑛
𝛤( )𝛤( )
𝑓 (𝑥 ) = 2 2

0 𝑝𝑎𝑟𝑎 𝑥 ≤ 0
{

Propiedades de la distribución F
 Está sesgado positivamente y su asimetría disminuye con el
aumento en n y m
 El valor de la distribución F siempre será positio o cero, dada
que sus varianzas están al cuadrado. Así que sus valores
caen entre 0 y ∞.
 La media y la varianza de la distribución F es

𝑛
𝜇= 𝑝𝑎𝑟𝑎 𝑛 > 2
𝑛−2
2𝑛2 (𝑚+𝑛−2)
𝜎2 = 𝑝𝑎𝑟𝑎 𝑛 > 4
𝑚(𝑛−2)2 (𝑛−4)

A continuación se representa la función de densidad de la Fm,n


para diversos valores de m y n :

42
Si X es una variable aleatoria con distribución
Xm2
e Y es otra variable aleatoria independiente de la anterior y
con distribución X n2 , puede probarse que la variable:
X/m
U=
Y/n
sigue una distribución F de Fisher-Snedecor con m y n grados de
libertad.
Entonces se puede establecer una función estadística Fm,n como
la relación de dispersiones de las dos distribuciones
2
𝑋𝑚 /m
≈ Fm,n
𝑋𝑛2 /n
Aquí también es válida la siguiente propiedad de la distribución
F:
1
Si X ≈ Fm,n → ≈ Fn,m
X

Prueba de hipótesis para igualdad de dos varianzas


Esto está basado en la varianza de dos muestras independientes,
seleccionadas al azar y obtenidas de dos poblaciones normales.
 Hipótesis nula 𝐻𝑜 : 𝜎12 = 𝜎22
𝑠12 /𝜎12 𝑠12
 F= , el cual se reduce a F=
𝑠22 /𝜎22 𝑠22
 Los grados de libertad de 𝑚 y 𝑛
 Si los valores calculados de F, exceden a los valores de la
tabla F, la hipótesis nula es rechazada.

43
En la práctica, la distribución F aparece en problemas de
inferencia estadística en los que a partir de una información
muestral es necesario decidir sobre sobre la igualdad o no de dos
varianzas de poblaciones desconocidas.

EJEMPLO
Dos fuentes de materias primas están bajo estudio por una
compañía. Ambas fuentes parecen tener características similares,
pero la compañía no está segura de su respectiva uniformidad.
Si se toma una muestra de 10 lotes de la fuente A, produce una
varianza de 225 y cuando se toma una muestra de 11 lotes de la
fuente B produce una varianza de 200. Es probable que la
varianza de la fuente A es significativamente mayor que la
varianza de la fuente B, con un nivel de significancia de 𝛼 = 0.01.

Solución.
La hipótesis de nulidad 𝐻𝑜 : 𝜎12 = 𝜎22 , es decir, la varianza de la
fuente A y fuente B son las mismas. La estadística de la
distribución F puede ser usado , de la siguiente manera
𝑠12 225
F= 2 , donde 𝑠12 = 225 y 𝑠22 = 200, entonces F= = 1.1,
𝑠2 200
El valor para n=9, y m=10 en el nivel del 1% de significancia es
4.49 (Tabla VII Javier Gorgas García). Dado que el valor calculado
de F es menor que F, entonces la hipótesis de nulidad es aceptada.
Aquí la varianza de las dos poblaciones son las mismas.

EJEMPLO
Con la idea de probar la verdad de los ingresos por jóvenes
graduados que muestran mucho mayor variabilidad de los
ingresos de aquellos jóvenes que no atendieron el colegio. Se
toma una muestra de 21 jóvenes graduados y su desviación
estándar para la muestra 𝑠1 = √17000 para la segunda muestra
se toman 25 jóvenes que no fueron al colegio, se obtiene una
desviación estándar 𝑠2 = √7500

44
Solución.
La hipótesis nula 𝐻𝑜 : 𝜎12 = 𝜎22
Una hipótesis alterna es 𝐻𝑜 : 𝜎12 > 𝜎22
Nivel de significancia 𝛼 = 0.01

𝑠2 17000
F= 12 , donde 𝑠12 = 17000 y 𝑠22 = 7500, entonces F= = 5.14,
𝑠2 7500
(valor calculado)
El valor para n=20, y m=24 en el nivel del 1% de significancia es
2.74 (valor de tablas). Dado que el valor calculado de F es mayor
que F de las tablas, entonces la hipótesis nula es rechazada.

45
VARIABLES ALEATORIAS CONJUNTAS CONTINUAS
En muchos estudios los espacios muestrales están restringido a
una sola dimensión, en los que se registran resultados de un
experimento como valores dados por una única variable
aleatoria. Sin embargo, habrá situaciones donde sea preferible
registrar los resultados simultáneos de varias variables
aleatorias. Para el caso particular de dos variables aleatorias,
éstas se denominan variables aleatorias conjuntas.
Definición.
Si X y Y son dos variables aleatorias, la distribución de
probabilidad de sus ocurrencias simultáneas puede
representarse por una función F(x,y) para cualquier par de
valores (x, y) dentro del rango de las variables aleatorias; a esto
se le denomina distribución de probabilidad conjunta.

Propiedades caso continuo.

para cualquier región en el plano A

Probabilidades marginales.
Se les llama probabilidades marginales cuando a partir de una
función conjunta se margina a una de las variables aleatorias. Es
el equivalente a la probabilidad total de las funciones de una sola
variable.

46
Probabilidad condicional.

Por otra parte, si se desea encontrar la probabilidad de que la


variable aleatoria continua X esté entre a y b cuando se sabe que
la variable aleatoria Y=y se obtiene:

Ejemplo.
Dada la función:

a) Determinar si se trata de una distribución de probabilidad


conjunta.

47
b) Encuentre la probabilidad de.

c) Obtener la probabilidad marginal para la variable x.

d) Obtener la probabilidad marginal para la variable y.

48
Ejemplo.
Suponga que la fracción X de atletas hombres y la fracción Y de
atletas mujeres que terminan la carrera del maratón puede
describirse por la función de densidad conjunta.

Encuentre las probabilidades marginales F(X/Y), F(Y/X) y


determine la probabilidad de que menos de un octavo de las
mujeres que se inscribieron para un maratón en particular lo
finalicen si se sabe que exactamente un medio de los atletas
hombres lo terminaron.

49
Ejemplo. Para la función de distribución de probabilidad
conjunta de dos variables:

a) Obtener las distribuciones marginales g(x), h(y)

1 1
𝑥(1 + 3𝑦 2 ) 𝑥𝑦 𝑥𝑦 3 𝑥 𝑥 𝑥
g(x) = ∫ 𝑑𝑦 = [ + ] = + =
0 4 4 4 0 4 4 2

2 2
𝑥(1 + 3𝑦 2 ) 𝑥 2 (1 + 3𝑦 2 ) 1 + 3𝑦 2
h(y) = ∫ 𝑑𝑥 = [ ] =
0 4 8 0
8

50
𝑥(1 + 3𝑦 2 )
𝐹𝑥𝑦 (𝑋 |𝑌) 4
𝐹 (𝑋 |𝑌) = = = 2𝑥
h(y) 1 + 3𝑦 2
8
𝑥(1 + 3𝑦 2 )
𝐹𝑥𝑦 (𝑋|𝑌) 4 (1 + 3𝑦 2 )
𝐹 (𝑌 |𝑋) = = 𝑥 =
g(x) 2
2
1 1 1
b) Encontrar la probabilidad de 𝑃 ( < 𝑋 < |𝑌 = )
4 2 3

1 1
1 1 3
=∫ 2𝑥𝑑𝑥 = [𝑥
1
2 2 ]2
1 = − =
4 16 16
4 4

Valores esperados y momentos para las funciones


bivariadas.

Sean X y Y dos variables aleatorias conjuntas, el valor esperado de


la función se define como:
∞ ∞
𝐸{(𝑋 − 𝜇𝑥 )(𝑌 − 𝜇𝑦 )} = ∫ ∫ (𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 )𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥
−∞ −∞

𝑠
𝐸{(𝑋 − 𝜇𝑥 )𝑟 (𝑌 − 𝜇𝑦 ) }
∞ ∞
𝑠
=∫ ∫ (𝑥 − 𝜇𝑥 )𝑟 (𝑦 − 𝜇𝑦 ) 𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥
−∞ −∞

Para el caso r = s = 1, el momento alrededor de la media: Se tiene


el valor esperado 𝐸{(𝑋 − 𝜇𝑥 )(𝑌 − 𝜇𝑦 )}

51

Вам также может понравиться