Академический Документы
Профессиональный Документы
Культура Документы
1
En este ejemplo, solo se han considerado eventos representados
por intervalos que forman parte del segmento de línea de 0 a 200.
Al usar el axioma 3, también se obtienen las probabilidades
mediante la unión de intervalos finitos o contables. Por ende, para
dos intervalos que no se traslapan, de longitudes L1 y L2, se tiene
L +L
una probabilidad de 1 2 y para una secuencia infinita de
200
intervalos que no se traslapan de longitudes L1 , L2 , L3 , …, hay una
probabilidad de
𝐿1 + 𝐿2 + 𝐿3 + ⋯
200
2
subintervalo que contiene 𝑥i está dada por 𝑓(𝑥𝑖 )∆𝑥. Entonces, la
probabilidad de que la variable aleatoria de interés tome un valor
en el intervalo de 𝑎 − 𝑏 está dada por
𝑚
𝑏
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = ∫ 𝑓(𝑥)𝑑𝑥
𝑎
3
En el caso continuo, las probabilidades están dadas por integrales
y no por los valores 𝑓(𝑥).
4
Se seguirá la práctica común de llamar 𝑓(𝑥) a la función de
densidad de probabilidad, en el entendido de que se hace
referencia a la función 𝑓 que asigna el valor 𝑓(𝑥) a 𝑥, para cada 𝑥
que es un valor posible de la variable aleatoria 𝑋.
𝑓 (𝑥 ) ≥ 0 ∀ 𝑥
∞
∫ 𝑓(𝑥 )𝑑𝑥 = 1
−∞
5
𝑑𝐹(𝑥)
= 𝑓(𝑥)
𝑑𝑥
EJEMPLO.
a) entre 1 y 3;
b) mayor que 0.5
Solución
Al evaluar las integrales necesarias, se obtiene
3
∫ 2𝑒 −2𝑥 𝑑𝑥 = −𝑒 −2𝑥 |13 = 𝑒 −2 − 𝑒 −6 = 0.1333
1
∞
∫ 2𝑒 −2𝑥 𝑑𝑥 = −𝑒 −2𝑥 |∞
0.5 = −0 + 𝑒
−1
= 0.368
0.5
6
En la gráfica de esta función se observa que tiene una
discontinuidad en 𝑥 = 0; de hecho, una densidad de probabilidad
no necesita ser continua en todas partes, mientras pueda ser
integrada entre dos límites 𝑎 𝑦 𝑏 cualesquiera (con 𝑎 < 𝑏) y
cumpla con las propiedades de una función de densidad de
probabilidades.
0 𝑝𝑎𝑟𝑎 𝑥 ≤ 0
𝑥
𝐹 (𝑥 ) = {
∫ 2𝑒 −2𝑥 𝑑𝑡 = −𝑒 −2𝑥 |0𝑥 = −𝑒 −2𝑥 + 1 𝑝𝑎𝑟𝑎 𝑥 > 0
0
𝐹 (1) = −𝑒 −2 + 1 = 0.8646
7
Observe que la función de distribución 𝐹 (𝑥 ) es creciente, además
se comprueba que 𝐹 (−∞) = 0 y 𝐹 (∞) = 1.
0 𝑝𝑎𝑟𝑎 𝑥 ≤ 0
𝑓 (𝑥 ) = { 2
𝑘𝑥𝑒 −4𝑥 𝑝𝑎𝑟𝑎 𝑥 > 0
∞ ∞ ∞
−4𝑥 2
𝑘 𝑘 2
∫ 𝑓(𝑥)𝑑𝑥 = ∫ 𝑘𝑥𝑒 𝑑𝑥 = ∫ − 𝑒 𝑢 𝑑𝑢 = − 𝑒 −4𝑥 |∞
0
−∞ 0 0 8 8
𝑘
= −0 + = 1; 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑘 = 8
8
8
𝐸(𝑋) de una variable aleatoria, la cual tiene una densidad de
probabilidad 𝑓(𝑥).
∞
𝐸(𝑋) = 𝜇 = ∫ 𝑥𝑓(𝑥)𝑑𝑥
−∞
∞
𝑉 (𝑋) = 𝜎 = ∫ (𝑥 − 𝜇 )2 𝑓(𝑥 )𝑑𝑥 = 𝐸 (𝑋 2 ) − [𝐸 (𝑋)]2
2
−∞
9
∞ ∞ ∞
−2𝑥
𝜇 = ∫ 𝑥𝑓(𝑥)𝑑𝑥 = ∫ 𝑥2𝑒 𝑑𝑥 = 2 ∫ 𝑥𝑒 −2𝑥 𝑑𝑥
−∞ 0 0
∫ 𝑓 𝑑𝑔 = 𝑓𝑔 − ∫ 𝑔 𝑑𝑓
𝑓 = 𝑥; 𝑑𝑔 = 𝑒 −2𝑥
1
𝑑𝑓 = 𝑑𝑥; 𝑔 = − 𝑒 −2𝑥
2
∞
−2𝑥
1 −2𝑥 ∞ ∞
1 −2𝑥
2 ∫ 𝑥𝑒 𝑑𝑥 = 2 (−𝑥 𝑒 )] + 2 ∫ 𝑒 𝑑𝑥
0 2 0 0 2
∞
1 −2𝑥 ∞ 1 1
2 ∫ 𝑥𝑒 −2𝑥 𝑑𝑥 = −𝑥𝑒 −2𝑥 ]∞
0 − 𝑒 ] = −0 + 0 − 0 + =
0 2 0 2 2
2
∞
2
1 2 −2𝑥
∞ ∞
−2𝑥
1 2
𝜎 = ∫ (𝑥 − 𝜇) 𝑓(𝑥)𝑑𝑥 = ∫ (𝑥 − ) 2𝑒 𝑑𝑥 = 2 ∫ 𝑒 (𝑥 − ) 𝑑𝑥
−∞ 0 2 0 2
∞
1 2 ∞
1 ∞
1
2 ∫ 𝑒 −2𝑥 (𝑥 − ) 𝑑𝑥 = 2 ∫ 𝑒 −2𝑥 (𝑥 2 − 𝑥 + ) 𝑑𝑥 = 2 ∫ (𝑥 2 𝑒 −2𝑥 − 𝑥𝑒 −2𝑥 + 𝑒 −2𝑥 ) 𝑑𝑥
0 2 0 4 0 4
1
𝜎2 =
4
∞ 𝛽 𝛽
1 = ∫ 𝑓 (𝑥 )𝑑𝑥 = ∫ 𝑓(𝑥 )𝑑𝑥 = ∫ 𝐾𝑑𝑥 = 𝐾(𝛽 − 𝛼)
−∞ 𝛼 𝛼
1
Entonces 𝐾 = , para satisfacer que el área total sea 1
(𝛽−𝛼)
10
1
𝑝𝑎𝑟𝑎 𝛼 < 𝑥 < 𝛽
𝑓(𝑥 ) = { 𝛽 − 𝛼
0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥
De manera general
𝑥−α
𝑝𝑎𝑟𝑎 𝛼 < 𝑥 < 𝛽
𝐹 (𝑥 ) = { 𝛽 − 𝛼
0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥
11
Para ilustrar cómo una situación física origina una distribución
uniforme, suponga que una rueda de locomotora tiene el radio 𝑟,
𝑥 es la ubicación en algún punto en su circunferencia, medida a lo
largo de la circunferencia a partir de cierto punto de referencia 0.
Cuando se aplican los frenos, algún punto hará contacto
deslizante con el riel, y en dicho punto habrá un fuerte desgaste.
Entonces en una aplicación repetida de los frenos, es razonable
suponer que 𝑥 es un valor de una variable aleatoria que tiene la
distribución uniforme con 𝛼 = 0 y 𝛽 = 2𝜋𝑟.
(𝛽 + 𝛼)
𝐸(𝑋) = 𝜇 =
2
𝛽 2
1 (𝛽 + 𝛼 )
𝑉 (𝑋 ) = 𝜎 2 = ∫ 𝑥 2 𝑑𝑥 − [ ]
𝛼 𝛽 − 𝛼 2
𝛽 2
1 𝑥3 (𝛽 + 𝛼 )
= [ ] −[ ]
𝛽−𝛼 3 𝛼 2
2
1 𝛽3 − 𝛼 3 (𝛽 + 𝛼 )
= ( )−[ ]
3 𝛽−𝛼 2
12
1 (𝛽 − 𝛼)(𝛽 2 + 𝛽𝛼 + 𝛼 2 ) (𝛽 + 𝛼) 2
= ( )−[ ]
3 𝛽−𝛼 2
𝛽 2 + 𝛽𝛼 + 𝛼 2 𝛽 2 + 2𝛽𝛼 + 𝛼 2
=( )−( )
3 4
4𝛽 2 − 3𝛽 2 + 4𝛽𝛼 − 6𝛽𝛼 + 4𝛼 2 − 3𝛼 2
=( )
12
𝛽 2 − 2𝛽𝛼 + 𝛼 2 (𝛽 − 𝛼)2
=( )=
12 12
2
(𝛽 − 𝛼)2
𝜎 =
12
𝛽−𝛼
𝜎=
√12
13
LA DISTRIBUCIÓN DE PROBABILIDAD NORMAL
La densidad de probabilidad normal, es la más importante o la más
utilizada. Se estudió por primera vez en el siglo xviii, cuando los
científicos observaron un sorprendente grado de regularidad en
los errores de las mediciones. Descubrieron que los patrones (de
distribuciones) que observaron se aproximaban cercanamente
mediante una distribución continua, a la que se refirieron como
la “curva normal de errores” y se la atribuyeron a las leyes del
azar. La ecuación de la densidad de probabilidad normal, está
dada por la función
1 (𝑥−𝜇)2
2) −
𝑓(𝑥; 𝜇, 𝜎 = 𝑒 2𝜎2 𝑝𝑎𝑟𝑎 − ∞ < 𝑥 < ∞
𝜎√2𝜋
14
∞
1 ∞ (𝑥−𝜇)2 ∞
1 𝑧2
− −
𝐹 (𝑥 ) = ∫ 𝑓 (𝑥 )𝑑𝑥 = ∫ 𝑒 2𝜎 2 𝑑𝑥 =∫ 𝑒 2 𝑑𝑧
−∞ 𝜎√2𝜋 −∞ −∞ √2𝜋
1
= √2𝜋 = 1
√2𝜋
𝑥−𝜇
Se realiza un cambio de variable 𝑧 = , esto es 𝑑𝑥 = 𝜎𝑑𝑧,
𝜎
Por otro lado, si a la distribución normal se le asigna 𝜇 = 0 y 𝜎 =
1, entonces la función de densidad 𝑓(𝑥 ) se transforma a la que se
conoce como función de densidad normal estándar
1 (𝑥−𝜇)2 1 −𝑧 2
−
𝑓 (𝑥 ) = 𝑒 2𝜎 => 𝑓(𝑧) =
2
𝑒 2
𝜎√2𝜋 √2𝜋
15
16
Para calcular la probabilidad de que una variable aleatoria tome
un valor entre 𝑎 y 𝑏, sabiendo que tiene una distribución normal
estándar, se evalúa la siguiente ecuación
Ejemplo
17
𝑃(0.87 < 𝑍 < 1.28)
18
También existen problemas en los cuales se dan probabilidades
relacionadas con las distribuciones normales estándares y se pide
encontrar los valores correspondientes de z.
EJEMPLO
Dos valores importantes para 𝑧𝛼
19
0.9505, que corresponden a z = 1.64 y z = 1.65. Por lo tanto, por
interpolación, z0.05 = 1.645.
𝑋−𝜇
𝑍=
𝜎
Es posible demostrar que se tiene la distribución normal
estándar. Por lo tanto, para encontrar la probabilidad de que la
variable aleatoria original tomará un valor menor que o igual a a,
en la tabla 3 se busca
𝑎−𝜇
𝐹( )
𝜎
𝑎−𝜇 𝑏−𝜇
𝑦
𝜎 𝜎
𝑋−𝜇
𝑍=
𝜎
20
𝑏−𝜇 𝑎−𝜇
𝑃(𝑎 < 𝑋 < b) = 𝐹 ( ) − 𝐹( )
𝜎 𝜎
EJEMPLO
Solución
a) La atenuación máxima del siguiente producto, X, se trata como
una selección aleatoria para la distribución normal con 𝜇 = 10.1
y 𝜎 = 2.7 En consecuencia, Z = (X − 10.1)/2.7 y, de la tabla 3, se
obtiene
21
=0.8577 - 0.2776
=0.5801
15.1 − 10.1
1−𝐹( ) = 1 − 𝐹 (1.85) = 1 − 0.9678 = 0.0322
2.1
22
EJEMPLO
4−𝜇
( ) = −2.05, entonces − 𝜇 = −(2.05 ∗ 0.04) − 4
0.04
𝜇 = (2.05 ∗ 0.04) + 4 = 4.082
23
Muchas densidades de probabilidad cuyas aplicaciones se
estudiarán más adelante, son casos especiales de la distribución
gamma. Esta distribución tiene la densidad de probabilidad dado
por
1
𝛼
𝑥 𝛼−1 𝑒 −𝑥/𝛽 𝑝𝑎𝑟𝑎 𝑥 > 0, 𝛼 > 0, 𝛽 > 0
𝑓 (𝑥 ) = {𝛽 Γ(𝛼)
0 𝑝𝑎𝑟𝑎 𝑥 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟
1
Sea 𝜆 el promedio de fracasos, entonces 𝛽 = , que representa el
𝜆
tiempo promedio hasta que ocurra la primara falla.
Γ(𝛼) = (𝛼 − 1)Γ(𝛼 − 1)
1
Γ ( ) = √π = 1.7724
2
De manera general, para valores impares de 𝑛 se tiene:
𝑛 𝑛!
Γ ( + 1) = √π ∗ (𝑛+1)/2
2 2
24
La media y la varianza de la distribución gamma pueden
obtenerse al usar la función gamma y sus propiedades especiales
mencionadas anteriormente. Para la media, se tiene
∞ 1 ∞
𝛼−1 −𝑥
𝜇 = ∫ 𝑥 𝑓(𝑥)𝑑𝑥 = 𝛼 ∫ 𝑥𝑥 𝑒 𝛽𝑑𝑥
−∞ 𝛽 Γ(𝛼) 0
∞ ∞
1 𝛼 −1 −𝑥/𝛽
1
= 𝛼 ∫ 𝑥𝑥 𝑥 𝑒 𝑑𝑥 = 𝛼 ∫ 𝑥 𝛼 𝑒 −𝑥/𝛽 𝑑𝑥
𝛽 Γ(𝛼) 0 𝛽 Γ(𝛼) 0
𝛽𝛼 Γ(𝛼)
𝜇=
Γ(𝛼)
𝜇 = 𝛼𝛽
25
Al usar métodos similares, también se puede demostrar que la
varianza de la distribución gamma está dada por
𝜎 2 = 𝛼𝛽 2
EJEMPLO
Los ingenieros que diseñan la próxima generación de
trasbordadores espaciales planean incluir dos bombas de
combustible, una activa y la otra en reserva.
Si la bomba principal falla, la segunda se coloca automáticamente.
Se considera que en una misión típica se requiere bombear
combustible durante un máximo de 50 horas. De acuerdo con las
especificaciones del fabricante, se espera que las bombas fallen
una vez cada 100 horas. ¿Cuáles son las posibilidades de que
dicho sistema de bombeo de combustible no permanezca
funcionando durante las todas 50 horas?
Considere 𝛽 = 100, y 𝛼 = 2
50
1 𝑥
−100
𝐹 (𝑋) = 𝑃(𝑋 < 50) = ∫ 𝑥𝑒 𝑑𝑥 = 0.0902
10000 0
1 1−1 −𝑥/𝛽
1 −𝑥/𝛽
𝑥 𝑒 𝑒 𝑝𝑎𝑟𝑎 𝑥 > 0, 𝛽 > 0
𝑓(𝑥 ) = {𝛽1 Γ(1) = {𝛽
0 0 𝑥≤0
26
Y cuya media y varianza son 𝜇=𝛽 y
𝜎 = 𝛽2.
2
𝐹 (𝑥 ) = 1 − 𝑒 −𝑥/𝛽
EJEMPLO
Solución
a)
1/12 1
−3𝑥 −4
∫ 3𝑒 𝑑𝑥 = 1 − 𝑒 = 0.221
0
O también
𝐹 (𝑥 ) = 1 − 𝑒 −(1/12)/(1/3)
1
−4
𝐹 (𝑥 ) = 1 − 𝑒 = 0.221
b)
∞ 9
−3𝑥 −4
∫ 3𝑒 𝑑𝑥 = 0 + 𝑒 = 0.105
3/4
9 9
−4 −4
𝐹 (𝑥 ) = 1 − (1 − 𝑒 )=𝑒 = 0.105
27
EJEMPLO
Los estudiantes llegan a un bar y de acuerdo con una
aproximación de Poisson se proceso a una velocidad promedio de
30 estudiantes por hora. ¿Cuál es la probabilidad de que el
estudiante tenga que esperar más de 3 minutos para atender al
próximo alumno?
Solución.
Si es X igual al número de estudiantes, entonces la media de
Poisson λ es de 30 estudiantes por 60 minutos, esto es 1/2
estudiante por minuto. Ahora, si W denote el tiempo (de espera)
entre los estudiantes, podemos esperar que haya, en promedio,
1
𝛽 = = 2 minutos entre los estudiantes que llegan. Como W (se
λ
supone que está) distribuido exponencialmente con una media
𝜇 = 𝛽 = 2, su función de densidad de probabilidad es:
∞
1 −𝑥/2 3
𝑃(𝑋 > 3) = ∫ 𝑒 𝑑𝑥 = 0 + 𝑒 −2 = 0.2231
3 2
3
−𝑥/2 −2
𝐹 (𝑥 ) = 1 − (1 − 𝑒 )=𝑒 = 0.2231
LA DISTRIBUCIÓN BETA
28
Γ(𝛼 + 𝛽)
𝑥 𝛼−1 (1 − 𝑥)𝛽−1 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 𝛼 > 0, 𝛽 > 0
𝑓(𝑥 ) {Γ(𝛼 ) ∗ Γ(𝛽)
0 𝑝𝑎𝑟𝑎 𝑥 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟
𝛼 𝛼𝛽
𝜇= 𝑦 𝜎2 =
𝛼+𝛽 (𝛼 + 𝛽 )2 (𝛼 + 𝛽 + 1))
EJEMPLO
Cálculos de probabilidad usando una distribución beta
Solución
a)
29
3
𝜇= = 0.6
3+2
se obtiene
Γ(5)
𝑥 2 (1 − 𝑥 ) = 12 𝑥 2 (1 − 𝑥 ) 𝑝𝑎𝑟𝑎 0 < 𝑥 < 1, 𝛼 > 0, 𝛽 > 0
𝑓(𝑥 ) {Γ(3) ∗ Γ(2)
0 𝑝𝑎𝑟𝑎 𝑥 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟
1
2
∫ 12 𝑥 2 (1 − 𝑥 )𝑑𝑥
0
30
1/2 1/2
=∫ 12 𝑥 2 𝑑𝑥 − ∫ 12 𝑥 3 𝑑𝑥 = 4 𝑥 3 − 3𝑥 4 = 0.3125
0 0
𝛽−1 −𝛼𝑥 𝛽
( )
𝑓 𝑥 ={ 𝛼 𝛽𝑥 𝑒 𝑝𝑎𝑟𝑎 𝑥 > 0, 𝛼 > 0, 𝛽 > 0
0 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑥
𝑋𝛽 𝑋 𝛽
−𝛼𝑋 𝛽
𝑑𝑦 −𝛼𝑋 𝛽
∫ 𝛼 𝛽𝑥 𝛽−1 𝑒 = ∫ 𝛼 𝑒 𝑑𝑦
0 𝛽𝑥 𝛽−1 0
31
𝑋𝛽 𝑋𝛽
𝛼𝑒 −𝛼y 𝛽 𝛽
∫ 𝛼𝑒 −𝛼y
𝑑𝑦 = [ ] = [−𝑒 −𝛼y ]0𝑋 = −𝑒 −𝛼𝑥 + 1
0 −𝛼 0
32
1
y la integral se puede representar como Γ (1 + ),
𝛽
1 𝛽 1 𝛽
Γ (1 + ) Γ (1 + )
1/𝛽 𝛽 𝛽 𝛽
(𝛼 ) = ( ) 𝑒𝑠𝑡𝑜 𝑒𝑠 𝛼 = ( )
𝜇 𝜇
2 −2/𝛽
2 1 2
𝜎 =𝛼 { Γ (1 + ) − [Γ (1 + )] }
𝛽 𝛽
EJEMPLO
Cálculo de probabilidad usando una distribución de Weibull
33
a)
(3 − 1)!
𝜇 = 0.1−2 Γ(1 + 2) = = 200 ℎ𝑟𝑠
0.12
b)
∞
0.5 0.5
∫ 0.1 ∗ 0.5 𝑥 −0.5 𝑒 −0.1𝑥 𝑑𝑥 = 𝑒 −0.1(300) = 0.1777
300
EJEMPLO
𝑛 1! √π
Γ (1 + ) = √π ∗ 1+1 =
2 2
2 2
Entonces
34
2
√π
𝛼 = ( 2 ) = 0.00196349
20
15
2
𝐹(𝑋) = ∫ 0.00196349(2) 𝑥 1 𝑒 −0.0019634𝑥 𝑑𝑥
0
2 15
𝐹 (𝑋) = [−𝑒 −0.001963𝑥 ]0 = (−0.642958 + 1) = 0.3570
35
∞
Γ(𝛼) = ∫ 𝑥 𝛼−1 𝑒 −𝑥 𝑑𝑥
0
Propiedades:
• Es una función asimétrica.
• E(x)= n
• V(x)=2n.
• Sean dos variables aleatorias chi-cuadrado que se distribuyen
𝑋1 → 𝑋𝑛2 y 𝑋2 → 𝑋𝑚 2
, se define una nueva variable de la forma
𝑌 = 𝑋1 + 𝑋2 , entonces esta nueva variable se distribuye como:
2
𝑌 → 𝑋𝑛+𝑚
36
• Cuando el número de variables aleatorias es muy grande, es
decir, cuando 𝑛 → ∞, la variable se puede aproximar por una
función normal.
Solución
De tablas V (Javier Gorgas García)
P(0.35 <X<7.81)= P(0.35)-P(7.81)
P(0.35 <X<7.81)= 0.950- 0.050=0.90
𝑛+1
Γ( )
2 − ∞ < 𝑥 < +∞
ℎ(𝑥 ) = 𝑛 𝑡2
(𝑛+1)/2
√𝑛𝜋 ∗ Γ (2) ∗ (1 + 𝑛 )
{
Donde
37
x
Γ(p) = ∫ 𝑥 𝑝−1 𝑒 −𝑥 𝑑𝑥
0
𝑥̃ − 𝜇
𝑡=
𝑠/√𝑛
Además 𝜇 es la media de la población, 𝑥̃ es la media de una
muestra, 𝑠 representa la desviación para una población, obtenida
de varianza (𝜎 2 ). La distribución t student, se define como una
variable aleatoria t, la cual es muy holgada, el “mejor” cuando no
se conoce 𝑠.
Esta distribución es muy utilizada, que se construye a partir de
una normal y un chi-cuadrado. Veamos una gráfica comparativa
con una distribución normal y algunas de las propiedades que
verifica (a)
(a) (b)
En el gráfico (b) aparecen representadas las función de densidad
de una t(4) :
Propiedades:
• Es simétrica, está centrada en el punto (0,0)
• Mo = Me =0
• E [T] = 0 si n>1
𝑛
• V [T] = si n>2.
𝑛−2
38
• Cuando el número de variables aleatorias es muy grande, es
decir, cuando 𝑛 → ∞, la variable se puede aproximar por una
normal.
Ejemplo de calibración
Se desea saber si un instrumento de medición está calibrado,
desde el punto de vista de la exactitud. Para ello se consigue un
valor patrón y se mide 10 veces (por ejemplo: una pesa patrón
para una balanza, un suero control para un método clínico, etc.).
Suponiendo que el resultado de estas mediciones arroja una
media de 52.9 y una desviación de 3, usando un patrón de valor
50, se desea determinar si el instrumento está calibrado y la
estimación de su error sistemático, si es que se prueba su
existencia (no se establecen unidades para generalizar este
ejemplo). H0: μ= 50 el instrumento está calibrado en exactitud
H1:μ≠50 no está calibrado. Hay un error sistemático
39
del 99,9% es t0,001,9 =4,781. Lo que permite establecer las
zonas de aceptación y rechazo:
𝑥̃ − 𝜇 52.9 − 50.0
𝑡= = =3
𝑠/√𝑛 3/√10
Mirando las zonas con los valores críticos, el valor de t cae en la
de rechazo para el 95% y no alcanza para las otras. La conclusión
es que se ha probado la existencia de un error sistemático con una
confianza del 95%
𝑠 3
𝜇 = 𝑥̃ ± 𝑡 = 52.9 ± 3 = 52.9 ± 2.8
√𝑛 √10
EJEMPLO
Suponga que T tiene una distribución t con r = 8 grados de
libertad ¿Cuál es la probabilidad de que el valor absoluto de T sea
menor que 2.306?
40
P (| T | <2.306) = P (-2.306 <T <2.306)
P (T <2.306)=0.975
P (T <-2.306)=1- P (T <2.306)=1-0.975=0.025
P (| T | <2.306)= 0.975-0.025=0.25
41
DISTRIBUCIÓN DE F DE FISHER-SNEDECOR
0 𝑝𝑎𝑟𝑎 𝑥 ≤ 0
{
Propiedades de la distribución F
Está sesgado positivamente y su asimetría disminuye con el
aumento en n y m
El valor de la distribución F siempre será positio o cero, dada
que sus varianzas están al cuadrado. Así que sus valores
caen entre 0 y ∞.
La media y la varianza de la distribución F es
𝑛
𝜇= 𝑝𝑎𝑟𝑎 𝑛 > 2
𝑛−2
2𝑛2 (𝑚+𝑛−2)
𝜎2 = 𝑝𝑎𝑟𝑎 𝑛 > 4
𝑚(𝑛−2)2 (𝑛−4)
42
Si X es una variable aleatoria con distribución
Xm2
e Y es otra variable aleatoria independiente de la anterior y
con distribución X n2 , puede probarse que la variable:
X/m
U=
Y/n
sigue una distribución F de Fisher-Snedecor con m y n grados de
libertad.
Entonces se puede establecer una función estadística Fm,n como
la relación de dispersiones de las dos distribuciones
2
𝑋𝑚 /m
≈ Fm,n
𝑋𝑛2 /n
Aquí también es válida la siguiente propiedad de la distribución
F:
1
Si X ≈ Fm,n → ≈ Fn,m
X
43
En la práctica, la distribución F aparece en problemas de
inferencia estadística en los que a partir de una información
muestral es necesario decidir sobre sobre la igualdad o no de dos
varianzas de poblaciones desconocidas.
EJEMPLO
Dos fuentes de materias primas están bajo estudio por una
compañía. Ambas fuentes parecen tener características similares,
pero la compañía no está segura de su respectiva uniformidad.
Si se toma una muestra de 10 lotes de la fuente A, produce una
varianza de 225 y cuando se toma una muestra de 11 lotes de la
fuente B produce una varianza de 200. Es probable que la
varianza de la fuente A es significativamente mayor que la
varianza de la fuente B, con un nivel de significancia de 𝛼 = 0.01.
Solución.
La hipótesis de nulidad 𝐻𝑜 : 𝜎12 = 𝜎22 , es decir, la varianza de la
fuente A y fuente B son las mismas. La estadística de la
distribución F puede ser usado , de la siguiente manera
𝑠12 225
F= 2 , donde 𝑠12 = 225 y 𝑠22 = 200, entonces F= = 1.1,
𝑠2 200
El valor para n=9, y m=10 en el nivel del 1% de significancia es
4.49 (Tabla VII Javier Gorgas García). Dado que el valor calculado
de F es menor que F, entonces la hipótesis de nulidad es aceptada.
Aquí la varianza de las dos poblaciones son las mismas.
EJEMPLO
Con la idea de probar la verdad de los ingresos por jóvenes
graduados que muestran mucho mayor variabilidad de los
ingresos de aquellos jóvenes que no atendieron el colegio. Se
toma una muestra de 21 jóvenes graduados y su desviación
estándar para la muestra 𝑠1 = √17000 para la segunda muestra
se toman 25 jóvenes que no fueron al colegio, se obtiene una
desviación estándar 𝑠2 = √7500
44
Solución.
La hipótesis nula 𝐻𝑜 : 𝜎12 = 𝜎22
Una hipótesis alterna es 𝐻𝑜 : 𝜎12 > 𝜎22
Nivel de significancia 𝛼 = 0.01
𝑠2 17000
F= 12 , donde 𝑠12 = 17000 y 𝑠22 = 7500, entonces F= = 5.14,
𝑠2 7500
(valor calculado)
El valor para n=20, y m=24 en el nivel del 1% de significancia es
2.74 (valor de tablas). Dado que el valor calculado de F es mayor
que F de las tablas, entonces la hipótesis nula es rechazada.
45
VARIABLES ALEATORIAS CONJUNTAS CONTINUAS
En muchos estudios los espacios muestrales están restringido a
una sola dimensión, en los que se registran resultados de un
experimento como valores dados por una única variable
aleatoria. Sin embargo, habrá situaciones donde sea preferible
registrar los resultados simultáneos de varias variables
aleatorias. Para el caso particular de dos variables aleatorias,
éstas se denominan variables aleatorias conjuntas.
Definición.
Si X y Y son dos variables aleatorias, la distribución de
probabilidad de sus ocurrencias simultáneas puede
representarse por una función F(x,y) para cualquier par de
valores (x, y) dentro del rango de las variables aleatorias; a esto
se le denomina distribución de probabilidad conjunta.
Probabilidades marginales.
Se les llama probabilidades marginales cuando a partir de una
función conjunta se margina a una de las variables aleatorias. Es
el equivalente a la probabilidad total de las funciones de una sola
variable.
46
Probabilidad condicional.
Ejemplo.
Dada la función:
47
b) Encuentre la probabilidad de.
48
Ejemplo.
Suponga que la fracción X de atletas hombres y la fracción Y de
atletas mujeres que terminan la carrera del maratón puede
describirse por la función de densidad conjunta.
49
Ejemplo. Para la función de distribución de probabilidad
conjunta de dos variables:
1 1
𝑥(1 + 3𝑦 2 ) 𝑥𝑦 𝑥𝑦 3 𝑥 𝑥 𝑥
g(x) = ∫ 𝑑𝑦 = [ + ] = + =
0 4 4 4 0 4 4 2
2 2
𝑥(1 + 3𝑦 2 ) 𝑥 2 (1 + 3𝑦 2 ) 1 + 3𝑦 2
h(y) = ∫ 𝑑𝑥 = [ ] =
0 4 8 0
8
50
𝑥(1 + 3𝑦 2 )
𝐹𝑥𝑦 (𝑋 |𝑌) 4
𝐹 (𝑋 |𝑌) = = = 2𝑥
h(y) 1 + 3𝑦 2
8
𝑥(1 + 3𝑦 2 )
𝐹𝑥𝑦 (𝑋|𝑌) 4 (1 + 3𝑦 2 )
𝐹 (𝑌 |𝑋) = = 𝑥 =
g(x) 2
2
1 1 1
b) Encontrar la probabilidad de 𝑃 ( < 𝑋 < |𝑌 = )
4 2 3
1 1
1 1 3
=∫ 2𝑥𝑑𝑥 = [𝑥
1
2 2 ]2
1 = − =
4 16 16
4 4
𝑠
𝐸{(𝑋 − 𝜇𝑥 )𝑟 (𝑌 − 𝜇𝑦 ) }
∞ ∞
𝑠
=∫ ∫ (𝑥 − 𝜇𝑥 )𝑟 (𝑦 − 𝜇𝑦 ) 𝑓(𝑥, 𝑦)𝑑𝑦𝑑𝑥
−∞ −∞
51