Вы находитесь на странице: 1из 6

Ejemplo de histograma

Vamos a considerar que, una empresa de búsqueda de empleo ha decidido hacer un estudio
del tiempo que se demoran sus asesores con cada usuario.

Paso 1: Para este estudio, se tomó el tiempo en minutos de asesoramiento con 50 usuarios.

Tiempo en minutos por usuario

Tiempo en minutos por usuario

Paso 2: Determinamos el rango. El valor más grande es 15,48 y el más pequeño es 8,58.

15,48-8,58=6,9

Paso 3: Calculamos el número de intervalos de clase (K). Lo hacemos con la fórmula de raíz
cuadrada del número de datos.raíz cuadrada ejemplo histograma

K=7,07
Lo redondeamos al entero más cercano: 7

Paso 4: Calculamos la amplitud o ancho del intervalo. Es la división del rango (paso 2) entre
el número de intervalos (paso 3)

El resultado es: 0,99. Bien podemos redondearlo a 1 o mantenernos en 0,99. Como el


ejemplo lo estoy elaborando con la plantilla de histograma en excel, lo dejaré en 0,99.

Paso 5 y paso 6:

Definimos las clases sumándole al valor más pequeño, el ancho del intervalo hasta que
obtenga 7 intervalos de clase, justo allí deberá estar el valor más grande de mis datos. A
continuación, agrupamos cada valor dentro del intervalo de clase, o dicho de otra forma,
determinamos la frecuencia. El resultado es el siguiente:

Intervalos de clase con frecuencia

Paso 7: Construimos el histograma.


Personalmente prefiero ubicar en el eje x la marca de clase y no los intervalos de clase. La
marca de clase es el resultado de sumar el límite superior e inferior del intervalo y dividirlos
por dos. El resultado no afecta la forma del histograma.

Además, me gusta junto al histograma trazar el polígono de frecuencias, que no es más que
conectar con rectas la parte superior de cada columna, justo en la mitad. Esto da una mejor
idea de la forma de distribución del histograma.

El resultado del ejercicio resuelto del histograma es el siguiente:

Ejemplo resuelto de histograma

Ejercicio resuelto de histograma

1. ¿Cuál es la probabilidad aproximada de que en un año nos hayan devuelto el dinero


al menos cincuenta veces? De hecho, debemos calcular la probabilidad P(X(365) >=
50). Si quisiéramos obtener el valor exacto de esta probabilidad, por el hecho de que
X(365) es una binomial de parámetros 365 y p = 0,1, deberíamos hacer el cálculo
siguiente:
P(X(365)>= 50) = 1 - P(X(365) < 50)
= 1 - P(X(365) = 0) - P(X(365) = 1) - P(X(365) = 2) - ... - P(X(365) = 49)
cada una de estas probabilidades se encontraría mediante la fórmula de la binomial que ya
conocemos, en nuestro caso:
365
P (X(365)> = k) = ( )(0.1)K(0,9)365-K
𝐾

si renunciamos a pedir que la probabilidad sea exacta y nos conformamos con una muy
buena aproximación, podemos utilizar el hecho de que la distribución de X(365) se puede
aproximar por una normal de parámetros m = 365 · 0,1 = 36,5 y s 2 = 365 · 0,09 = 32,85. Así:
𝑋(365)−36,5 50−36,5
P (X(365)>= 50) =P( >= )
√32.85 √32.85

Z a una variable aleatoria normal (0,1), esta probabilidad será aproximadamente:


50 − 36,5
𝑃(𝑍 ≥ ) = 𝑃(𝑍 ≥ 2,36) = 0.0091
√32.85
La probabilidad aproximada de que nos devuelvan el dinero cincuenta veces o más a lo largo
del año es únicamente del 0,0091. Observad que hemos calculado P(X(365)>= 50), pero que
esta cantidad es la misma que P(X(365) >= 49,5), ya que la variable sólo toma valores
naturales. Fijaos en que si la aproximamos por la normal, obtendremos:
𝑋(365) − 36,5 49.5 − 36,5
𝑃(𝑋(365) ≥ 49,5 = 𝑃 ( )≥ = 0 ,0119
√32.85 √32.85
Es una cantidad ligeramente diferente de la obtenida antes. Se dice que este valor se ha
obtenido haciendo una corrección de continuidad, ya que aproximamos una variable
discreta por una continua. Podemos considerar buenos los dos resultados.

2. El gasto mensual de la familia mexicana Robles sigue una distribución normal de


media de 3.000 pesos y varianza 500. Supongamos que el gasto de cada mes es
independiente del de los otros meses. Si el ingreso anual es de 37.000 pesos, ¿cuál
es la probabilidad de que no gasten más de lo que ganan? ¿Cuánto deberían ganar
para tener una seguridad del 99% de que no gastarán más de lo que han ganado?
Media 3.000
Desviación típica √500
12 · 3.000 = 36.000
√12* 500 = 77,4597
𝑋𝐴 − 36000
77,4547
𝑋𝐴−36000 37000−36000
P (X A < 37.000) = < = P (Z <12,00009)
77,4547 77,4547
Z es una distribución normal estándar. La probabilidad de que sea menor que 3 ya es 1. Por
tanto, la probabilidad es 1, es decir, se puede asegurar con casi un 100% de certeza que no
gastarán más de lo que ganan.
𝑋𝐴−36000 𝐺−36000
P (X A < G) = P ( < ) = 0.999
77,4547 77,4547

𝐺 − 36000
= 2.33
77,4547
Es preciso que G = 36.180,4811 para tener una seguridad del 99% de que esta familia no
gastará más de lo que gana.

3. La renta media de los habitantes de un país se distribuye uniformemente entre 4,0


millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al
azar a 100 personas la suma de sus rentas supere los 725 millones ptas. Cada renta
personal es una variable independiente que se distribuye según una función
uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar
el Teorema Central del Límite.

La media y varianza de cada variable individual es:

m = (4 + 10 ) / 2 = 7
s 2 = (10 - 4)^2 / 12 = 3

Por tanto, la suma de las 100 variables se distribuye según una normal
cuya media y varianza son:

Media: n * m = 100 * 7 = 700


Varianza: n * s2 = 100 * 3 = 300

Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones ptas,
comenzamos por calcular el valor equivalente de la variable normal tipificada:
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749

Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar
supere los 725 millones de pesetas es tan sólo del 7,49%