Академический Документы
Профессиональный Документы
Культура Документы
Asignatura
Estadística II
Unidad 1
Distribución de frecuencias
2
Índice de contenidos
Conclusión.............................................................................................................................. 46
Bibliografía ............................................................................................................................. 47
Introducción a la unidad 1
Para iniciar este aprendizaje se deben repasar conceptos básicos del curso de
Estadística I, especialmente de las unidades 1 ,3 y 4.
1. Distribución de frecuencias
Concepto importante
Para entender esta definición se debe tener claro que todo espacio muestral está definido por un
modelo o una ley de probabilidad. La ley de probabilidad es la correspondencia entre cada uno de
los valores de la variable aleatoria y la probabilidad de ocurrencia de los mismos.
Ejemplo:
En el experimento siguiente:
“Se tira 2 veces una moneda” Ω = *𝒄𝒄, 𝒄𝒔, 𝒔𝒄, 𝒔𝒔+, se puede definir la
variable aleatoria 𝑿 = 𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒂𝒓𝒂𝒔.
Una variable aleatoria es discreta (𝑿𝒊 ), cuando dado un espacio de probabilidad, su rango es finito,
es decir, entre dos valores cualesquiera de la variable hay un número finito de valores posibles1.
Ejemplo:
- Número de hijos.
- Número de cigarrillos fumados por día.
- Número de cajas en el estante.
El modelo de probabilidad de cualquier variable aleatoria discreta está definido por dos funciones,
la función de probabilidad y la función de distribución. A continuación se presentan ambos
conceptos:
a) Función de probabilidad: Una variable aleatoria discreta tiene una distribución de valores a los
que se les asigna 𝒙𝒊 , estos pueden ser 𝒙𝟏 , 𝒙𝟐 , 𝒙𝟑 … 𝒙𝒏 . Las probabilidades de que aparezcan se
expresan como 𝒑𝒊 , y se nominan como 𝒑𝟏 , 𝒑𝟐 , 𝒑𝟑 … 𝒑𝒌 . Estas cantidades se definen como:
𝒇(𝒙𝒊 ) = 𝒑(𝑿 = 𝒙𝒊 )
1
Guàrdia Olmos, J. y otros. (2008). Análisis de datos en psicología. Madrid, España: Delta, publicaciones
universitarias. Recuperado de https://books.google.cl/books?id=KnvzOlV_k9IC&pg=PA70&lpg=PA70&dq=#v=onepage&q&f=false
Escuela de Comercio de Santiago
6
Ejercicio:
Se lanza una moneda al aire tres veces. ¿Cuál es la cantidad de caras que aparecen?
Calcular la función probabilidad.
Resolución:
Paso 2: Determinar cuántas caras pueden salir, es decir la variable aleatoria designada por 𝒙𝒊
No salga cara 𝑿 = 𝟎
Salga una cara 𝑿 = 𝟏
Salgan dos caras 𝑿 = 𝟐
Salgan tres caras 𝑿 = 𝟑
Función de probabilidad
0,4
0,35
0,3
0,25
0,2
p(x)
0,15
0,1
0,05
0
0 1 2 3
ii. ¿Cuál es la probabilidad de que el número de caras esté entre 1 y 2, incluidos ambos?
i. 𝒑𝒊 = 𝑷*𝒙 = 𝒙𝒊 + ≥ 𝟎
𝒌 𝒌
ii. 𝒊=𝟏 𝒑𝒊 = 𝒊=𝟏 𝑷*𝒙 = 𝒙𝒊 + = 𝟏
iii. La probabilidad de que una variable aleatoria 𝒙 tome un valor entre dos cantidades 𝒂 y 𝒃 será:
𝒃
Ejercicio:
función de función de
probabilidad distribución
𝒙 𝒑(𝒙) 𝑭(𝒙)
0 0,125 0,125
1 0,375 0,5
2 0,375 0,875
3 0,125 1
Fuente: Elaboración propia.
Función de distribución
1,2
0,8
0,6
F(x)
0,4
0,2
0
0 1 2 3
Ejemplo:
Peso.
Edad.
Tiempo de reacción.
Al igual que la variable aleatoria discreta, la variable aleatoria continua está definida por dos
funciones: función de densidad y función de distribución.
𝒃
𝒇(𝒙𝒊 ) = 𝒂
𝒇(𝒙) ∗ 𝒅𝒙 = 𝒑(𝒂 ≤ 𝒙 ≤ 𝒃) 3
2
Guàrdia Olmos, J. y otros. (2008). Análisis de datos en psicología. Madrid, España: Delta, publicaciones
universitarias. Recuperado de https://books.google.cl/books?id=KnvzOlV_k9IC&pg=PA70&lpg=PA70&dq=#v=onepage&q&f=false
3
La función integral pertenece a Cálculo, permite obtener áreas bajo una curva que, en este caso, se traduce a
valores de probabilidad. Solamente se usará para introducir el tema, ya que posteriormente serán utilizadas otro
tipo de herramientas.
Escuela de Comercio de Santiago
11
Obsérvese la fórmula, en este caso se aplica la integral del intervalo de valores (𝒂, 𝒃) , lo cual
implica el cálculo de un trozo de área de la función.
𝒙
𝒇(𝒙𝒊 ) = 𝒇(𝒙) ∗ 𝒅𝒙 = 𝒑(𝑿 ≤ 𝒙𝒊 )
−∞
i. 𝑭(𝒙𝒊 ) ≥ 𝟎
∞
ii. −∞
𝒇(𝒙)𝒅𝒙 =𝟏
𝒃
iii. 𝑷(𝒂 ≤ 𝒙 ≤ 𝒃) = 𝒂
𝒇(𝒙)𝒅𝒙 = 𝑭(𝒃) − 𝑭(𝒂)
Ejercicio:
Se requiere realizar el cálculo de la venta diaria de kilos de té. Ésta es una variable aleatoria
continua, donde la cantidad vendida está definida por la función 𝒙/𝟑. Si la cantidad vendida en
kilos diarios es entre 𝟎 a 𝟒 kilos, en otro caso sería 𝟎. Esto queda definido de la siguiente forma:
𝒙/𝟑 𝟎≤𝒙≤𝟒
𝒇(𝒙) = 2 3
𝟎 𝒆𝒏 𝒐𝒕𝒓𝒐 𝒄𝒂𝒔𝒐
+∞ 𝒙
𝑭(𝒙𝒊 ) = 𝒇(𝒙) ∗ 𝒅𝒙 = 𝒇(𝒙) ∗ 𝒅𝒙
−∞ −∞
𝒙𝒏+𝟏
Nota: para calcular la integral se debe utilizar la fórmula 𝒙𝒏 = 𝒏+𝟏
+ 𝑪 𝒏 ≠ −𝟏
𝟐 𝟐
𝟐 𝟐 𝒙𝟐+𝟏 𝒙𝟑 𝟐𝟑 𝟏𝟑 𝟕
Ejemplo: 𝟏
𝒙 𝒅𝒙 = = = − =
𝟐+𝟏 𝟏 𝟑 𝟏 𝟑 𝟑 𝟑
𝟒 𝟒 𝟒
𝒙 𝒙𝟏+𝟏 𝒙𝟐
𝒅𝒙 = =
𝟎 𝟑 𝟑(𝟏 + 𝟏) 𝟎
𝟔 𝟏
𝒙𝟐
𝑭(𝒙) = 𝟔 𝟎≤𝒙≤𝟒
𝟏 𝒙>𝟒
Las variables aleatorias discretas y continuas son explicadas a partir de la función de probabilidad
(variable discreta) y función de densidad (variable continua). Ambas variables se definen por la
función de distribución o acumulada, pero además, por dos parámetros: la esperanza matemática y
la varianza, que explicamos a continuación.
𝑬(𝒙) = 𝝁𝒙 = 𝒙𝒊 𝒑𝒊
𝒊=𝟏
Ejercicios resueltos:
1. Supóngase que 𝒙 es la variable aleatoria, de los resultados posibles al lanzar un dado. Calcular:
a) Función de probabilidad
𝟏
𝒑𝟏 = 𝐏*𝐱 = 𝟏+ = = 𝟎, 𝟏𝟔𝟔𝟕
𝟔
𝟏
𝒑𝟐 = 𝐏*𝐱 = 𝟐+ = = 𝟎, 𝟏𝟔𝟔𝟕
𝟔
𝟏
𝒑𝟑 = 𝐏*𝐱 = 𝟑+ = = 𝟎, 𝟏𝟔𝟔𝟕
𝟔
⋮
𝟏
𝒑𝟔 = 𝐏*𝐱 = 𝟔+ = = 𝟎, 𝟏𝟔𝟔𝟕
𝟔
b) Función de distribución
función de función de
probabilidad distribución
𝒙 𝒑(𝒙) 𝑭(𝒙)
1
1 6
=0,1667 0,1667
1
2 6
=0,1667 0,3333
1
3 6
=0,1667 0,5000
1
4 6
=0,1667 0,6667
1
5 6
=0,1667 0,8333
1
6 6
=0,1667 1,0000
+∞
𝑬(𝒙) = 𝝁𝒙 = 𝒙𝒑(𝒙)𝒅𝒙
−∞
2. La producción de cierto producto sigue una variable aleatoria con función densidad:
𝒙
𝒑(𝒙) = ; 𝟎≤𝒙≤𝟐
𝟐
+∞ 𝟐 𝟐 𝟐 𝟐
𝒙 𝒙𝟐 𝟏 𝟐
𝒙𝟐+𝟏 𝟏 𝒙𝟑 𝒙𝟑
𝑬(𝒙) = 𝝁𝒙 = 𝒙𝒑(𝒙)𝒅𝒙 = 𝒙 . / 𝒅𝒙 = = = =
−∞ 𝟎 𝟐 𝟎 𝟐 𝟐 𝟎 (𝟐 + 𝟏) 𝟐 𝟑 𝟎
𝟔 𝟎
𝟐𝟑 𝟎𝟑 𝟖 𝟖 𝟒
Se evalúa 𝒙 = 𝟐 𝒚 𝒙 = 𝟎 → − = −𝟎 = =
𝟔 𝟔 𝟔 𝟔 𝟑
Para las variables aleatorias discretas y continuas se cumplen las siguientes propiedades:
𝝁𝒙+𝒚 = 𝝁𝒙 + 𝝁𝒚
𝝁𝒂𝒙+𝒃 = 𝒂𝝁𝒙 + 𝒃
Una línea aérea ha vendido 205 pasajes para su vuelo 1234 con destino a Buenos Aires saliendo
desde Santiago. El vuelo tiene una capacidad de 200 pasajeros. Si la variable aleatoria “𝒙”,
corresponde al número de pasajeros que llegan al aeropuerto a tomar el vuelo 1234, la distribución
de los 8 últimos boletos vendidos es la siguiente:
Ejercicio:
i. ¿Cuál es la probabilidad de que todos los pasajeros que van al aeropuerto tengan asientos?:
La probabilidad de que los últimos pasajeros que lleguen al aeropuerto para el vuelo 1234, tengan
asientos disponibles es de un 29%.
ii. ¿Cuál es la probabilidad de que alguno de los pasajeros que va al aeropuerto quede sin asiento?
𝑷*𝒙 > 𝟐𝟎𝟎+ = 𝑷*𝒙 = 𝟐𝟎𝟏+ + 𝑷*𝒙 = 𝟐𝟎𝟐+ + 𝑷*𝒙 = 𝟐𝟎𝟑+ + 𝑷*𝒙 = 𝟐𝟎𝟒+ + 𝑷*𝒙 = 𝟐𝟎𝟓+
= 𝟎, 𝟐 + 𝟎, 𝟐𝟑 + 𝟎, 𝟏𝟕 + 𝟎, 𝟎𝟗 + 𝟎, 𝟎𝟐
= 𝟎, 𝟕𝟏
La probabilidad de que alguno de los últimos pasajeros que llegue al aeropuerto, se quede sin
asiento para el vuelo 1234 es del 71%.
iii. Calcular el N° esperado de pasajeros que llega al aeropuerto a tomar el vuelo 1234.
𝒌
La esperanza de los pasajeros que lleguen al aeropuerto y puedan tomar el vuelo 1234 es de 201
pasajeros.
Para una variable discreta, el cálculo de la varianza es un número positivo, y se calcula con la
siguiente fórmula:
𝑽𝒂𝒓(𝒙) = 𝑬(𝑿 − 𝝁)𝟐 𝒑𝒊
Ejercicios resueltos
1. A partir de la información del ejercicio del lanzamiento del dado: Determinar la varianza y la
desviación standard. La esperanza en dicho ejercicio era de 𝟑, 𝟓 y la probabilidad de 𝟎, 𝟏𝟔𝟔𝟕.
Para una variable aleatoria continua, donde la función de densidad es 𝒇(𝒙), entonces la varianza
está dada por:
+∞
𝑽𝒂𝒓(𝒙) = 𝑬(𝑿 − 𝝁)𝟐 𝒇(𝒙) = (𝑿 − 𝝁)𝟐 𝒇(𝒙) 𝒅𝒙
−∞
+∞ 𝟐 𝟐 𝟐
𝟐
𝟒 𝟒 𝒙 𝟐
𝑽𝒂𝒓(𝒙) = 𝑬(𝑿 − 𝝁) 𝒇(𝒙) = 𝑿− 𝒇(𝒙) 𝒅𝒙 = 𝑿− . / 𝒅𝒙 =
−∞ 𝟑 𝟎 𝟑 𝟐 𝟗
𝟐
La desviación estándar es 𝟗
= 𝟎, 𝟒𝟕𝟏𝟒
1. Sea 𝒙 una variable aleatoria que expresa el número de personas que viven en un departamento
elegido al azar. La distribución de probabilidad de 𝒙 es la siguiente:
𝒙𝒊 1 2 3 4 5 6 7 8
Para determinar esto, se debe cumplir que la suma de las probabilidades sea 1, y que todas las
probabilidades sean mayores o iguales a 0.
Ejercicio: En la bolsa de comercio de Santiago se ofrece un negocio, para el cual se debe invertir
M$100. Las probabilidades de éxito o fracaso son las siguientes:
La esperanza del retorno de la inversión es de M$160, lo cual es mayor que la inversión de M$100,
por lo tanto el negocio parece conveniente.
Nota 1 2 3 4 5 6 7
Número de veces que ha
1 4 10 40 30 12 3
obtenido la nota
Nota (𝒙) 1 2 3 4 5 6 7
𝑷(𝒙) 0,01 0,04 0,1 0,4 0,3 0,12 0,03
b) Si este estudiante se enfrenta a una nueva prueba de matemática ¿Qué nota se espera que
obtenga? ¿Cuál es la desviación?
𝑬(𝒙) = 𝟎, 𝟎𝟏 ∙ 𝟏 + 𝟎, 𝟎𝟒 ∙ 𝟐 + +𝟎, 𝟏 ∙ 𝟑 + 𝟎, 𝟒 ∙ 𝟒 + 𝟎, 𝟑 ∙ 𝟓 + 𝟎, 𝟏𝟐 ∙ 𝟔 + 𝟎, 𝟎𝟑 ∙ 𝟕 = 𝟒, 𝟒𝟐
𝑽𝒂𝒓(𝒙) = 𝑬(𝑿 − 𝝁)𝟐 𝒑𝒊 = (𝟏 − 𝟒, 𝟒𝟐)𝟐 ∙ 𝟎, 𝟎𝟏 + (𝟐 − 𝟒, 𝟒𝟐)𝟐 ∙ 𝟎, 𝟎𝟒
+ (𝟑 − 𝟒, 𝟒𝟐)𝟐 ∙ 𝟎, 𝟏 + (𝟒 − 𝟒, 𝟒𝟐)𝟐 ∙ 𝟎, 𝟒
+ (𝟓 − 𝟒, 𝟒𝟐)𝟐 ∙ 𝟎, 𝟑 + (𝟔 − 𝟒, 𝟒𝟐)𝟐 ∙ 𝟎, 𝟏𝟐
+(𝟕 − 𝟒, 𝟒𝟐)𝟐 ∙ 𝟎, 𝟎𝟑 = 𝟏, 𝟐𝟐
𝝈𝒙 = 𝑽𝒂𝒓(𝒙) = 𝟏, 𝟐𝟐 = 𝟏, 𝟎𝟒
La nota más probable que puede obtener el estudiante en la prueba es de un 𝟒, 𝟒𝟐, con una
desviación de 𝟏, 𝟎𝟒, es decir su nota puede estar entre 𝟑, 𝟑𝟖 (nota más baja que puede obtener) y
𝟓, 𝟒𝟔 (nota más alta que puede obtener).
Un modelo de probabilidad establece la correspondencia entre cada valor de una variable aleatoria
y las probabilidades de que se produzcan esos valores. En consecuencia, cada modelo queda
definido por una función determinada (Función de probabilidad o densidad y de distribución). En
algunos casos, los datos se ajustan a un modelo de probabilidad teórico conocido como:
1) Distribución binomial.
o
2) Distribución normal.
El modelo de la ley binomial se puede aplicar si se trabaja con variables aleatorias discretas
generadas a partir de una variable cualitativa. Para utilizar este modelo se deben cumplir las
siguientes condiciones4:
Una forma básica de esta prueba es el conocido experimento de Bernoulli (Jacob Bernoulli 1654-
1705), quien plantea que existen dos posibles resultados. Esto se conoce como variable
dicotómica.
Ejemplo:
Al lanzar una moneda existen dos resultados posibles, cara y cruz. Estos
posibles resultados tienen una probabilidad de ocurrencia, que se denomina
probabilidad a priori, que es constante a través del tiempo:
¿Qué sucede si el experimento se repite varias veces? ¿Se podría ocupar el experimento de
Bernoulli?
4
Guàrdia Olmos, J. y otros. (2008). Análisis de datos en psicología. Madrid, España: Delta, publicaciones
universitarias. Recuperado de https://books.google.cl/books?id=KnvzOlV_k9IC&pg=PA70&lpg=PA70&dq=#v=onepage&q&f=false
Escuela de Comercio de Santiago
22
Sí, en este caso si se repite el experimento de Bernoulli 𝒏 veces, dado que los experimentos son
independientes, el valor de no se altera de experimento a experimento. Lo que sucede es que se
genera una variable aleatoria discreta con 𝒏 + 𝟏 valores posibles (𝟎, 𝟏, 𝟐 … . 𝒏). Esto se conoce
como distribución binomial. A continuación se presenta un ejemplo, que ayudará con la
comprensión de este concepto:
Ejemplo:
𝒏
𝑷(𝑿 = 𝒓) = . / 𝒑𝒓 (𝟏 − 𝒑)𝒏−𝒓
𝒓
Donde:
Para analizar…
Recordar
Ejemplo:
En una sala hay 4 sillas disponibles para sentarse. Si llegan 10 personas ¿De
cuántas formas distintas se pueden sentar?
1. Primero se identifica 𝒏 = 𝟏𝟎 y 𝒓 = 𝟒
Las expresiones para el cálculo de la esperanza matemática y la varianza de una variable aleatoria
discreta, que siguen la distribución binomial, quedan reducidas a las siguientes fórmulas:
𝑽𝒂𝒓(𝑿) = 𝒏𝒓 (𝟏 − 𝒓) (𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂)
Esta distribución es muy importante en finanzas, ya que muchas veces un experimento o inversión,
se reduce a dos posibles situaciones: se gana (éxito) o se pierde (fracaso). Esta distribución se
caracteriza porque tiende a ser asimétrica para los valores bajos de 𝒑 y 𝒏, pero es simétrica si 𝒑 y
𝒏 son altos.
Ejemplo:
Datos:
𝒏 = 𝟏𝟎
𝒓=𝟑
𝒑 = 𝟎, 𝟐
𝒏
𝑷(𝑿 = 𝒓) = . / 𝒑𝒓 (𝟏 − 𝒑)𝒏−𝒓
𝒓
𝟏𝟎
𝑷(𝑿 = 𝟑) = . / 𝟎, 𝟐𝟑 (𝟏 − 𝟎, 𝟐)𝟏𝟎−𝟑 = 𝟎, 𝟐𝟎𝟏𝟑
𝟑
Ejercicios resueltos:
1. De acuerdo con cierto estudio, el 40% de los estudiantes de educación superior trabaja durante
el verano para ganar dinero y poder financiar sus estudios. Si se seleccionan 7 estudiantes de
manera aleatoria ¿Cuál es la probabilidad de que…
a. …5 trabajen en verano?
b. …Ninguno trabaje en verano?
c. …Todos trabajen en verano?
Solución:
𝒏=𝟕
𝒓=𝟓 𝟕
a. 𝒑 = 𝟎, 𝟒 𝑷(𝑿 = 𝟓) = . / 𝟎, 𝟒𝟓 ∙ 𝟎, 𝟔𝟐 = 𝟎, 𝟎𝟕𝟕𝟒
𝟓
𝒒 = 𝟎, 𝟔
𝒏=𝟕
𝒓=𝟎 𝟕
b. 𝒑 = 𝟎, 𝟒 𝑷(𝑿 = 𝟎) = . / 𝟎, 𝟒𝟎 ∙ 𝟎, 𝟔𝟕 = 𝟎, 𝟎𝟐𝟕𝟗
𝟎
𝒒 = 𝟎, 𝟔
𝒏=𝟕
𝒓=𝟕 𝟕
c. 𝒑 = 𝟎, 𝟒 𝑷(𝑿 = 𝟕) = . / 𝟎, 𝟒𝟕 ∙ 𝟎, 𝟔𝟎 = 𝟎, 𝟎𝟎𝟏𝟔
𝟕
𝒒 = 𝟎, 𝟔
2. Se sabe que el 35% de los vehículos que circulan en Santiago contaminan. Se toma una muestra
de 5 vehículos, ¿Cuál es la probabilidad de que…
a. …A lo más 2 contaminen?
b. …Al menos 2 contaminen?
c. …Solo 2 contaminen?
Solución:
𝟓
c. 𝑷(𝑿 = 𝟐) = . / 𝟎, 𝟑𝟓𝟐 ∙ 𝟎, 𝟔𝟓𝟑 = 𝟎, 𝟑𝟑𝟔𝟒
𝟐
3. En una gran empresa comercial, el 70% de los empleados son hombres. Se elige al azar a 2
representantes para cierto cargo ¿Cuál es la probabilidad de que ninguno sea hombre?
Solución:
𝒏=𝟐
𝒓=𝟎 𝟐
𝒑 = 𝟎, 𝟕 𝑷(𝑿 = 𝟎) = . / 𝟎, 𝟕𝟎 ∙ 𝟎, 𝟑𝟐 = 𝟎, 𝟎𝟗
𝟎
𝒒 = 𝟎, 𝟑
La distribución normal para las variables aleatorias continuas es la más importante en el campo de
la estadística. Su gráfica recibe el nombre de campana de Gauss – Laplace, pero se conoce como
curva normal. La siguiente gráfica muestra este tipo de curva:
Fuente: http://trucosycursos.es/la-distribucion-normal-o-campana-de-gauss-en-excel/
Importante
Las características que definen una distribución normal, son las siguientes:
𝟐
1) Está definida por dos parámetros: la media (µ) y la varianza ( ).
𝟐
2) La variable 𝑿 sigue la distribución normal con media (µ) y la varianza ( ), lo que se expresa
𝟐
como 𝑿 𝑵(µ, ).
3) Tiene un máximo en (µ), donde coinciden el valor de la media, la moda y la mediana.
4) Es simétrica respecto al eje de la ordenada y este se sitúa en (µ).
5) Es asintótica respecto al eje de las abscisas, por lo cual los valores fluctúan entre −∞ 𝒚 + ∞
6) El área bajo la curva 𝒚 sobre el eje 𝒙 es 1.
𝟐
a) Función de densidad: En los casos de distribución normal con media y varianza , se calcula
de la siguiente manera:
𝟏 𝑿−𝝁 𝟐
𝟏 − . /
𝒇(𝑿) = ∙𝒆 𝟐 𝝁 −∞ < 𝒙 < ∞
𝟐𝝅∙𝝈
Para expresar que una variable continua 𝑿, tiene una distribución normal de media 𝝁 y desviación
típica 𝝈, se escribe:
𝑿~𝑵(𝝁, 𝝈𝟐 )
𝒇(𝒙)
𝝁−𝝈 𝝁 𝝁+𝝈 𝒙
Fuente: https://www.matematicasonline.es/BachilleratoCCSS/segundo/archivos/distribucion_normal/DISTRIBUCION%20NORMAL.htm
b) Función de distribución:
𝒙
𝟏 𝟏 𝒙−𝝁 𝟐
0 10 1
𝑭(𝒙) = 𝒆𝟐 𝝈 𝒅𝒙
𝝈 𝟐𝝅 −∞
Recuerda
Importante
𝟐
Si 𝑿 𝑵(µ, )
𝑿−𝝁
𝒁= ~𝑵(𝟎, 𝟏)
𝝈
Las puntuaciones 𝒁 siguen una distribución normal con media 0 y desviación típica 1, es decir,
𝑵(𝟎, 𝟏). Corresponde a una distribución normal.
Existen tablas que permiten calcular probabilidades en distribuciones normales. Por ello es
aconsejable transformar cualquier variable aleatoria 𝑿 que sigue una distribución 𝑵(𝝁, 𝝈) en otra
variable 𝒁 que siga una distribución 𝑵(𝟎, 𝟏).
a) 𝒑(𝒁 ≤ 𝟏, 𝟐𝟑)
La probabilidad buscada se encuentra directamente en las tablas. Basta buscar 1,2 en la columna y
0,03 en la fila. Su intersección da la probabilidad.
𝑃(𝒛 ≤ 𝟏, 𝟐𝟑)
𝟏, 𝟐𝟑
Fuente: https://www.uam.es/personal_pdi/ciencias/dfaraco/docencia/ambientalesmat1/Normal.htm
b) 𝒑(𝒁 ≥ 𝟏, 𝟐𝟒)
𝑃(𝒛 ≤ 𝟏, 𝟐𝟒)
𝑃(𝒛 ≥ 𝟏, 𝟐𝟒)
𝟏, 𝟐𝟒
Fuente: https://www.uam.es/personal_pdi/ciencias/dfaraco/docencia/ambientalesmat1/Normal.htm
En este caso la probabilidad buscada no está en la tabla. Sin embargo, si se tiene en cuenta que el
área total bajo la gráfica ha de ser 1, se deduce entonces que:
Como la gráfica es simétrica respecto al eje de ordenadas, 𝒑(𝒁 ≤ −𝟎, 𝟕𝟐) = 𝒑(𝒁 ≥ 𝟎, 𝟕𝟐).
−𝟎, 𝟕𝟐 𝟎, 𝟕𝟐
Fuente: https://www.uam.es/personal_pdi/ciencias/dfaraco/docencia/ambientalesmat1/Normal.htm
La tabla no da la probabilidad solicitada, pero sabiendo que la gráfica es simétrica y el valor total
del área es 1, en este caso la probabilidad de 𝒑(𝒁 ≤ −𝟎, 𝟕𝟐) va a ser igual a 𝟏 – 𝟎, 𝟕𝟔𝟒𝟐, es decir
𝟎, 𝟐𝟑𝟓𝟖.
d) 𝒑(𝟎, 𝟓 ≤ 𝒁 ≤ 𝟏, 𝟕𝟔)
𝑷(𝟎, 𝟓 ≤ 𝒁 ≤ 𝟏, 𝟕𝟔)
𝟎, 𝟓 𝟏, 𝟕𝟔
Fuente: https://www.uam.es/personal_pdi/ciencias/dfaraco/docencia/ambientalesmat1/Normal.htm
Ejercicios resueltos:
1. El peso de los individuos de una población se distribuye normalmente con una media de 70 Kg. y
desviación típica de 6 Kg. En una población de 2000 personas, ¿Cuántas tendrán un peso
comprendido entre 64 y 76 Kg?5
Solución:
5
Sánchez, F. (S.F). Variable aleatoria continua. Distribución normal (Guía). Recuperado de:
https://matesap.wikispaces.com/file/view/Variable+aleatoria+continua_1y2.pdf
Escuela de Comercio de Santiago
35
𝟔𝟒 − 𝟕𝟎 𝟕𝟔 − 𝟕𝟎
𝒑(𝟔𝟒 ≤ 𝑿 ≤ 𝟕𝟔) = 𝒑 ≤𝒁≤ = 𝒑(−𝟏 ≤ 𝒁 ≤ 𝟏) = 𝒑(𝒁 ≤ 𝟏) − 𝒑(𝒁 ≤ −𝟏)
𝟔 𝟔
Como hay 2000 personas, se calcula el 68,26% de 2000, esto da como resultado 1365 personas.
2. La duración media de una lavadora es de 15 años y su desviación típica es 0,5. Sabiendo que su
vida útil se distribuye normalmente, ¿cuál es la probabilidad de que al adquirir una lavadora,
ésta dure más de 15 años?
Solución:
Es una distribución normal de media 15 y desviación típica 0,5, es decir, 𝑵(𝟏𝟓; 𝟎, 𝟓).
𝟏𝟓 − 𝟏𝟓
𝒑(𝑿 ≥ 𝟏𝟓) = 𝒑 𝒁 ≥ = 𝒑(𝒁 ≥ 𝟎) = 𝒑(𝒁 ≤ 𝟎) = 𝟎, 𝟓
𝟎, 𝟓
3. La nota media de las pruebas de admisión correspondientes a los estudiantes que querían
ingresar en una escuela era 5,8 y la desviación típica 1,75. Fueron admitidos los de nota superior
a 6 ¿Cuál fue el porcentaje de admitidos si la distribución es normal?6
Solución:
𝟔 − 𝟓, 𝟖
𝒑(𝑿 > 𝟔) = 𝒑 𝒁 > = 𝒑(𝒁 > 𝟎, 𝟏𝟏) = 𝟏 − 𝒑(𝒁 ≤ 𝟎, 𝟏𝟏)
𝟏, 𝟕𝟓
= 𝟏 − 𝟎, 𝟓𝟒𝟑𝟖 = 𝟎, 𝟒𝟓𝟔𝟐 ≈ 𝟒𝟓, 𝟔𝟐%
Ejemplo:
𝟏
En este caso se tiene 𝑩(𝒏, 𝒑) = 𝑩 .𝟐𝟎𝟎, 𝟔/ y piden calcular 𝒑(𝟐𝟎 ≤ 𝑿 ≤ 𝟑𝟓)
Resolver este planteamiento se hace inviable por el cálculo de distribución binomial. Entonces,
¿cómo resolver el problema?
6
IES de MOS. (S.F). Boletin: Distribuciones de probabilidad. Métodos estadísticos y numéricos. Galicia,
España. Recuperado de: http://www.edu.xunta.gal/centros/iesmos/system/files/Bol_Distribuciones+Probabilidad.pdf
Escuela de Comercio de Santiago
37
En este tipo de casos se utiliza el Teorema Central del Límite, que consiste en que la distribución
binomial 𝑩(𝒏, 𝒑) se aproxima a la curva normal. A continuación se presentan los pasos a seguir
para hacer esta transformación:
𝝁 = 𝒏𝒑
𝝈= 𝒏𝒑(𝟏 − 𝒑)
𝑿 − 𝒏𝒑
𝒁=
𝒏𝒑(𝟏 − 𝒑)
En caso de que se cumplan las tres condiciones, se debe considerar que se está llevando una
variable discreta (distribución binomial) a una variable continua (distribución normal), por lo cual se
debe realizar un ajuste, que se conoce como corrección por continuidad. Este ajuste consiste en
realizar aproximaciones para ser lo más preciso en el cálculo, y se debe a que, como en una
distribución continua todas las probabilidades valen 0, la corrección por continuidad toma un
intervalo con longitud 1 alrededor de 𝝁 (Es el valor que se mueve x).
¿Cómo se realiza esta corrección de continuidad? Se debe sumar y restar 0,5 según sea el caso:
𝒑(𝝁𝟏 ≤ 𝒙 ≤ 𝝁𝟐 ) = 𝒑(𝝁𝟏 − 𝟎, 𝟓 ≤ 𝒙 ≤ 𝝁𝟐 + 𝟎, 𝟓)
Ejercicio:
En una clase de 40 estudiantes, la probabilidad de que una persona utilice gafas es 0,25 ¿Cuál es la
probabilidad de que menos de 10 estudiantes utilicen lentes?
𝝁 = 𝒏𝒑
Solución:
Este es un ejercicio de distribución binomial, pero con muchos datos, por lo cual se debe
transformar a distribución normal.
Paso 3: Interpretación.
La probabilidad de que menos de 10 estudiantes utilicen gafas es de 42,86%
La distribución T–Student fue desarrollada por un científico llamado William Gosset, quien publicó
sus investigaciones bajo el seudónimo Student. Esta distribución es de mucha utilidad, cuando el
tamaño de la muestra es pequeño, y cuando se desconoce la varianza. Si bien es utilizada por
variables continuas, y es generada a partir de la distribución normal, es una de las distribuciones
más importantes en la práctica. A continuación se presentan algunos conceptos que se deben
manejar para aplicar la distribución T-Student:
Grados de libertad: Son los valores que tiene una muestra, y que permiten encontrar el valor de un
parámetro. También se les puede definir como el número de mediciones de una muestra. En el
caso de distribución T-Student se expresa así:
Ejemplo:
𝝂 = 𝒏 − 𝟏 = 𝟏𝟓 − 𝟏 = 𝟏𝟒
Nivel de confianza: Es el porcentaje que determina entre qué valores se incluirá el parámetro de la
población, y con cuánta precisión se realizó la medición. Los valores comunes que expresan el nivel
de confianza son:
95%: significa que funciona adecuadamente y que de la muestra recogida, formada por 100
individuos, 95 se incluyen en el parámetro de la población y un 5% se excluye del
parámetro (error posible). Se indica como 𝟏 − 𝜶 y habitualmente se da en porcentaje
(𝟏 − 𝜶)%.
Otros valores son 99% o 99,9%. Entre mayor sea el nivel de confianza, mayor precisión
tiene el estudio.
Una variable aleatoria continua se distribuye por distribución T-Student con 𝒌 grados de libertad,
donde 𝒌 es un número positivo, si la función densidad es:
𝒌+𝟏 (𝒌+𝟏
𝒓. / −
𝒕𝟐 𝟐 ∞ −𝒙 𝒑−𝟏
𝒉𝒌 (𝒕) = 𝒌
𝟐
.𝟏 + 𝒌
/ −∞ < 𝒕 < ∞, Donde 𝒓(𝒑) = 𝟎
𝒆 𝒙 𝒅𝒙
𝒓. / 𝝅𝒌
𝟐
La distribución T-Student tiene una función densidad simétrica, similar a la distribución normal. Se
diferencia en que existe independencia del valor 𝒌 en el caso de la T-Student, y además tiene colas
más amplias. En la medida que los grados de libertad tiendan al infinito, la distribución T-Student
tiende a la distribución normal.
∞ 𝒌+𝟏
∞ (𝒌+𝟏
𝒓. / 𝟐 − 𝟐
𝟐 𝒕
𝑬(𝑻) = 𝝁 = 𝒕 … 𝒉𝒌 (𝒕) ∙ 𝒅𝒕 = 𝒕∙ 4𝟏 + 5 𝒅𝒕 = . . . = 𝟎
𝒌 𝒌
−∞ −∞ 𝒓 .𝟐/ 𝝅𝒌
Si 𝒌 > 𝟑
∞ ∞ 𝒌+𝟏 (𝒌+𝟏
𝟐 − 𝟐
𝒓. / 𝒕 𝒌
𝑽𝒂𝒓(𝑻) = 𝝈𝟐 = 𝑬 (𝑻 − 𝝁)𝟐 = (𝒕 − 𝝁)𝟐 ∙ 𝒉𝒌 (𝒕) ∙ 𝒅𝒕 = 𝒕∙ 𝟐 4𝟏 + 5 𝒅𝒕 =
𝒌 𝒌 𝒌 − 𝟐
−∞ −∞ 𝒓 . / 𝝅𝒌
𝟐
𝑬,𝒕𝒏 - = 𝟎
Varianza
𝒏
𝑽𝒂𝒓,𝒕𝒏 - =
𝒏−𝟐
Propiedades T-Student7
a) Nivel de confianza (𝟏 − 𝜶)
b) Grados de libertad (𝝂)
7
Reyes, L. (S.F.). Distribución de t Student (Guía). México: Universidad Interamericana para el Desarrollo.
Recuperado de: http://moodle2.unid.edu.mx/dts_cursos_mdl/lic/AE/E/AM/12/Distribucion_tStudent.pdf
Escuela de Comercio de Santiago
42
Ejemplo:
Entonces:
Nivel de confianza: (𝟏 − 𝜶) = 𝟎, 𝟗𝟓
Grados de libertad: 𝝂 = (𝒏 − 𝟏) = 𝟏𝟎 − 𝟏 = 𝟗
𝒕𝟏−𝜶 = −𝒕𝜶
Esto significa que el valor 𝒕 deja un área de 𝟏 − 𝜶 a la derecha y a la izquierda un área 𝜶, que es la
cola de la derecha.
𝒕𝟎,𝟗𝟓 = −𝒕𝟎,𝟎𝟓
a) Cola unilateral:
Ejercicio:
Se tienen los siguientes datos de una muestra de 7 individuos. Se debe encontrar el valor de 𝒕, para
que el área sombreada sea 2,5% a la izquierda.
Solución:
𝑮𝒓𝒂𝒅𝒐𝒔 𝒅𝒆 𝒍𝒊𝒃𝒆𝒓𝒕𝒂𝒅 = 𝝂 = 𝒏 − 𝟏 = 𝟕 − 𝟏 = 𝟔
𝑵𝒊𝒗𝒆𝒍 𝒅𝒆 𝒄𝒐𝒏𝒇𝒊𝒂𝒏𝒛𝒂 = 𝟗𝟕, 𝟓%
Á𝒓𝒆𝒂 𝒂 𝒍𝒂 𝒊𝒛𝒒𝒖𝒊𝒆𝒓𝒅𝒂 𝒆𝒔 𝒅𝒆 𝟐, 𝟓% = 𝟎, 𝟎𝟐𝟓
Á𝒓𝒆𝒂 𝒂 𝒍𝒂 𝒅𝒆𝒓𝒆𝒄𝒉𝒂 𝒆𝒔 𝒅𝒆 𝟗𝟕, 𝟓% = 𝟎, 𝟗𝟕𝟓
Aplicando…
𝒕𝟏−𝜶 = −𝒕𝜶
Se obtiene…
𝒕𝟎,𝟗𝟕𝟓 = −𝒕𝟎,𝟎𝟐𝟓
Grados
0,25 0,1 0,05 0,025 0,01
de libertad
1 1,0000 3,0777 6,3137 12,7062 31,8210
2 0,8165 1,8856 2,9200 4,3027 6,9645
3 0,7649 1,6377 2,3534 3,1824 4,5407
4 0,7407 1,5332 2,1318 2,7765 3,7469
5 0,7267 1,4759 2,0150 2,5706 3,3649
6 0,7176 1,4398 1,9432 2,4469 3,1427
7 0,7111 1,4149 1,8946 2,3646 2,9979
8 0,7064 1,3968 1,8595 2,3060 2,8965
9 0,7027 1,3830 1,8331 2,2622 2,8214
Fuente: Elaboración propia
𝒕𝟎,𝟗𝟕𝟓 = −𝒕𝟎,𝟎𝟐𝟓
𝜶 = 𝟎, 𝟎𝟐𝟓
b) Cola bilateral:
Ejercicio:
Se tienen los siguientes datos de una muestra de 15 individuos. ¿Cuál es la probabilidad de que el
área sombreada a la izquierda sea 2,5% y a la derecha 5%?
Solución:
𝑮𝒓𝒂𝒅𝒐𝒔 𝒅𝒆 𝒍𝒊𝒃𝒆𝒓𝒕𝒂𝒅 = 𝝂 = 𝒏 − 𝟏 = 𝟏𝟓 − 𝟏 = 𝟏𝟒
Á𝒓𝒆𝒂 𝒔𝒐𝒎𝒃𝒓𝒆𝒂𝒅𝒂 𝒂 𝒍𝒂 𝒊𝒛𝒒𝒖𝒊𝒆𝒓𝒅𝒂 𝒆𝒔 𝒅𝒆 𝟐, 𝟓% = 𝟎, 𝟎𝟐𝟓
Á𝒓𝒆𝒂 𝒔𝒐𝒎𝒃𝒓𝒆𝒂𝒅𝒂 𝒂 𝒍𝒂 𝒅𝒆𝒓𝒆𝒄𝒉𝒂 𝒆𝒔 𝒅𝒆 𝟓% = 𝟎, 𝟎𝟓
Aplicando…
𝜶 = 𝟎, 𝟎𝟓
𝜶 = 𝟎, 𝟎𝟐𝟓
Fuente: http://www.biorom.uma.es/contenido/UIB/bioinfo/imagenes/dt.gif
Conclusión
Una buena estimación y análisis de datos, permite que las personas inviertan
en acciones que les hagan incrementar sus recursos. Al contrario, si existe un
error de cálculo o de interpretación, es posible que todas las personas que
han depositado su confianza en las AFP, pierdan parte de sus recursos
destinados a las pensiones. Por estas y otras razones, un ingeniero o un
técnico debe estar preparado y tener las herramientas necesarias para
enfrentar estas situaciones.
Bibliografía