Вы находитесь на странице: 1из 29

Medidas Estadísticas

Estadística Inferencial

Mg. Marcela Gómez Melo


Distribuciones de Frecuencia
Variable Cuantitativa Continua
Para analizar este tipo de variables se recomienda agruparlas en intervalos, clases o categorías.
Por ejemplo: al clasificar a los habitantes de una región por su edad, se tendrá:
• grupos de bebes (edades hasta el año y medio)
• de niños (edades hasta los 10 o 12 años)
• de adolescentes (edades hasta los 18 o 21 años)
• jóvenes (edades hasta los 25 o 30 años)
• adultos (edades hasta los 50 años)
• mayores (edades hasta los 60 años)
• tercera edad (edades después de los 60)
Intervalos de clase:
Para construir una distribución de frecuencias para este tipo de variables, consideremos las siguientes
definiciones:
Rango o Recorrido: es la diferencia entre el Mayor Dato y en Menor Dato, el Rango lo Denotaremos con la letra R.

𝑹 = (𝑫𝒂𝒕𝒐 𝑴𝒂𝒚𝒐𝒓) − (𝑫𝒂𝒕𝒐 𝑴𝒆𝒏𝒐𝒓)

Numero de intervalos de clase: utilizaremos la Regla de Sturges

𝑵𝒊 = 𝟏 + 𝟑. 𝟑 𝑳𝒐𝒈 (𝑵)
Donde: 𝑁𝑖 = Número de Intervalos.
Log = Logaritmo Base 10
n = Número de Datos

Se debe hacer aproximación bien sea por defecto o por exceso debido a que el Número de Intervalos o Clases debe
ser un Número Entero.

Amplitud del intervalo: se calcula con la siguiente formula


𝑪 = 𝑹/𝑵𝒊
Donde: C = Ancho de Clase
R = Rango.
𝑁𝑖 = Número de Intervalos
Se debe aproximar al entero mayor.
Construcción de Intervalos
El límite inferior (𝑳𝒊𝒏𝒇𝟏 ), del primer intervalo es el valor mínimo de los datos, y el límite superior del
primer intervalo (𝑳𝒔𝒖𝒑𝟏 ), se obtiene sumando al valor mínimo la amplitud. Este límite superior será el
límite inferior del segundo intervalo, de aquí en adelante el proceso se repite hasta formar el último
intervalo.
Supongamos que deseamos trabajar con 5 intervalos de amplitud 4 y que el valor mínimo de los datos es
de 23. Los intervalos se forman así:

Primer intervalo [23 , 23+ 4) = [23 , 27)


Segundo intervalo [27 , 27+ 4) = [27 , 31)
Tercer intervalo [31 , 31+ 4) = [31 , 35)
Cuarto intervalo [35 , 35+ 4) = [35 , 39)
Quinto intervalo [39 , 39+ 4) = [39 , 43)
Marca de clase: Son los puntos medios de cada intervalo y se calculan promediando el límite inferior y el
límite superior de cada intervalo.
𝑳𝒊𝒏𝒇𝒊 +𝑳𝒔𝒖𝒑𝒊
𝒙𝒊 =
𝟐
La distribución de frecuencias se construye así:

𝑳𝒊𝒏𝒇. 𝑳𝒔𝒖𝒑. 𝒙𝒊 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊
𝐿𝑖𝑛𝑓1 𝐿𝑠𝑢𝑝1 𝐿𝑖𝑛𝑓1 + 𝐿𝑠𝑢𝑝1 𝑓1 𝐹1 𝑓1 𝐻1 donde,
𝑥1 = ℎ1 =
2 𝑛 𝑳𝒊𝒏𝒇. : Límite inferior de cada intervalo

𝐿𝑖𝑛𝑓2 𝐿𝑠𝑢𝑝2 𝐿𝑖𝑛𝑓2 + 𝐿𝑠𝑢𝑝2 𝑓2 𝐹2 𝑓2 𝐻2 𝑳𝒔𝒖𝒑. : Límite superior de cada intervalo.


𝑥2 = ℎ2 =
2 𝑛 𝒙𝒊 : Marca de clase de cada intervalo.

𝐿𝑖𝑛𝑓3 𝐿𝑠𝑢𝑝3 𝐿𝑖𝑛𝑓3 + 𝐿𝑠𝑢𝑝3 𝑓3 𝐹3 𝑓3 𝐻3 𝒇𝒊 : Frecuencias absolutas.


𝑥3 = ℎ3 =
2 𝑛 𝑭𝒊 : Frecuencias absolutas
acumuladas.
. . . . . . .
. . . . . . . 𝒉𝒊 : Frecuencias relativas.

𝐿𝑖𝑛𝑓𝑚 𝐿𝑠𝑢𝑝𝑚 𝑥𝑚 𝑓𝑚 𝐹𝑚 = 𝑛 𝑓𝑚 𝐻𝑚 = 1 𝑯𝒊 : Frecuencias relativas acumuladas.


ℎ𝑚 = = 100%
𝐿𝑖𝑛𝑓𝑚 + 𝐿𝑠𝑢𝑝𝑚 𝑛
=
2
TOTAL 𝑁 1=100%
Ejemplo
La más grande empresa de Ipiales, tiene en su nómina a 40 empleados. Por leyes del gobierno toda
empresa debe dar un subsidio de educación a cada hijo de los trabajadores, como se mencionó y
analizó en el problema anterior. Suponga ahora que la empresa crea un programa nutricional para sus
empleados. Para lo cual toma datos del peso de los empleados (medidos en kilogramos). Los
especialistas en nutrición recogieron los siguientes datos.

60, 70, 78, 80, 66, 59, 86, 88, 97, 68, 46, 61, 76, 45, 77, 70, 62, 73, 64, 72, 102, 74, 75, 82, 89, 66, 52,
90, 84, 57, 76, 87, 62, 73, 93, 69, 55, 75, 94, 54

• Determinar población, muestra, variable y tipo de variable.


• Construir una distribución de frecuencias y un gráfico estadístico.
Solución
Con las definiciones y fórmulas correspondientes construimos la siguiente distribución de frecuencias

Peso(kg.) Marcas de # empleados


𝑳𝒊𝒏𝒇. 𝑳𝒔𝒖𝒑. clase 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊
𝒙𝒊
45 53,2 49,1 3 3 7,5% 7,5%
53,2 61,4 57,3 6 9 15% 22,5%
61,4 69,6 65,5 7 16 17,5% 40%
69,6 77,8 73,7 11 27 27,5% 67,5%
77,8 86 81,9 4 31 10% 77,5%
86 94,2 90,1 7 38 17,5% 95%
94,2 102,4 98,3 2 40 5% 100%
TOTAL 40 100%

7 de los empleados de la empresa, equivalentes al 17,5% tienen pesos entre los 61,4 Kg. y 69,6 Kg. Podríamos
decir que el peso promedio de estos siete trabajadores es aproximadamente de 65,5 Kg.
16 de los empleados de la empresa, equivalentes al 40% tienen pesos entre los 45 Kg. y 69,6 Kg.
Ejercicio
Se presenta la estatura en cm de un numero de niños pertenecientes a una Institución Educativa de la
ciudad de Ipiales.
Calcule intervalos de clase y construya la tabla de frecuencias y el histograma correspondientes.
Escriba conclusiones de los resultados.

107 107 110 110 107 108 108 111 108 118
108 112 108 109 113 109 109 109 118 109
114 115 114 115 114 115 114 116 118 116
116 113 116 113 117 113 117 113 117 113
117 119 117 119 117 112 119 111 119 119
110 118 134 118 118 120 118 120 120 122
134 119 111 112 121 133 121 121 121 121
118 134 121 125 109 121 110 121 123 123
135 126 127 128 119 129 130 130 131 132
135 110 133 135 123 111 122 112 110 122
Medidas Estadísticas
Medidas de Centralización
MEDIA Medidas de Posición
MEDIANA CUARTILES
MODA DECILES
PERCENTILES

Medidas de Dispersión
RECORRIDO
DESVIACIÓN MEDIA
DESVIACIÓN ESTÁNDAR
COEFICIENTE DE VARIACIÓN
Medidas de Centralización
Las medidas de tendencia central son valores que en una serie ordenada de datos “tienden” a
ubicarse en el centro. También, se las conoce con el nombre de promedios. Entre ellas tenemos:

 La media aritmética o promedio


aritmético.
 La media aritmética ponderada.
 La mediana.
 La moda
La media aritmética o promedio aritmético (ഥ
𝒙)
Es el cociente entre la suma de los datos y el número de datos (𝑛). Una ventaja de este promedio es que considera la
información de todos los datos, y una desventaja es que es muy sensible a valores extremos.
σ 𝒙𝒊 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + … + 𝒙𝒏
𝒙 = = , para datos NO agrupados.
𝒏 𝒏
σ 𝑥𝑖 ∗𝑓𝑖 𝑥1 ∗𝑓1 + 𝑥2 ∗𝑓2 + … + 𝑥𝑚 ∗𝑓𝑚
𝒙 = = , para datos agrupados.
𝑛 𝑛

Ejemplo (Datos no agrupados).

Un clientes de un local que vende accesorios para computador: una USB en 20.000 pesos, un mouse en 12.000 pesos,
un protector de pantalla 9.000 pesos y un teclado en 17.000 pesos. El precio promedio de los cuatro productos es de
14.500. Se calcula así:

σ 𝒙𝒊 𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + … + 𝒙𝑵
𝒙 = =
𝒏 𝒏
𝟐𝟎.𝟎𝟎𝟎+𝟏𝟐.𝟎𝟎𝟎+𝟗.𝟎𝟎𝟎 + 𝟏𝟕.𝟎𝟎𝟎 𝟓𝟖.𝟎𝟎𝟎
𝒙 = = = 14.500
𝟒 𝟒
Ejemplo (Datos Agrupados)
La siguiente tabla muestra la distribución de frecuencias reportada por una clínica de Pasto en relación
al número de enfermos atendidos en un fin de semana. Calcule en interprete el valor de la mediana.

Intervalos de clases Marca de Frecuencia de cada clase Frecuencia acumulada


(datos en años) clase (fi) (Fi)
10-19 15 8 8
20-29 25 20 28
30-39 35 14 42
40-49 45 8 50
50-59 55 2 52
60-69 65 2 54
70-79 75 1 55
Total 55 enfermos atendidos
Solución
Intervalos de clases Marca de (fi)
xi*fi
(datos en años) clase (xi)
10-19 15 8 120
20-29 25 20 500
30-39 35 14 490
40-49 45 8 360
50-59 55 2 110
60-69 65 2 130
70-79 75 1 75
Total 55 1785

σ 𝑥𝑖 ∗𝑓𝑖 1785
𝑥 = = = 32,45
𝑛 55

Con lo que se concluye que el promedio de las personas atendidas en un fin de semana por el
hospital tienen edades de 33 años aproximadamente.
Media aritmética ponderada (𝒙𝒑 )
se la utiliza cuando los datos tienen diferente importancia. Se denota y define así:
σ 𝒙𝒊 ∗𝒘𝒊 𝒙𝟏 ∗𝒘𝟏 +𝒙𝟐 ∗𝒘𝟐 + … + 𝒙𝒎 ∗𝒘𝒎
𝒙𝒑 = σ 𝒘𝒊
= ; donde las 𝒘𝒊 son las importancias de cada dato.
𝒘𝟏 + 𝒘𝟐 + 𝒘𝟑 +⋯ + 𝒘𝒎

Ejemplo.
La alcaldía de Pasto tiene una vacante para el cargo de director del área contable. Como requisitos se
exige: entrevista, examen de conocimientos y puntaje de la hoja de vida. Además, se conoce que la
entrevista se ponderará con un 10%, el examen de conocimientos con un 70% y la hoja de vida con un
20%. El mínimo aprobatorio es de 60 puntos en una escala de 0 a 100 puntos, el aspirante que obtenga el
más alto puntaje será el seleccionado, si se presentaron Roberto, Luis, José, Ana y Rosa y obtuvieron los
puntajes que se muestran en la siguiente tabla. ¿Quién fue el seleccionado?.
Aspirante Conocimientos Hoja de vida Entrevista
Roberto 68 72 80
Luis 75 64 78
José 67 71 78
Ana 72 69 73
Rosa 73 65 88
Solución
Para calcular el puntaje promedio ponderado que obtuvo Roberto debemos calcularlo así:
σ 𝒙𝒊 ∗𝒘𝒊 𝒙𝟏 ∗𝒘𝟏 +𝒙𝟐 ∗𝒘𝟐 + … + 𝒙𝒎 ∗𝒘𝒎 68∗0,70+72∗0,20+80∗0,10 70
𝒙𝒑 = σ 𝒘𝒊
= = = = 70 puntos.
𝒘𝟏 + 𝒘𝟐 + 𝒘𝟑 +⋯ + 𝒘𝒎 0,70+0,20+0,10 1

En la tabla se muestran los puntajes promedios ponderados (𝑥𝑝 ), para los demás aspirantes.

Nombre Conocimientos Hoja de vida Entrevista


𝒙𝒑 𝒙
aspirante (70%) (20%) (10%)
Roberto 68 72 80 70 73,3
Luis 75 64 78 73,1 72,3
José 67 71 78 68,9 72
Ana 72 69 73 71,5 71,3
Rosa 73 65 88 72,9 75,3
c i
o n
r c
r o
e r
c r
Por lo tanto, Luis es el seleccionado para el cargo director del área contable t
o
e
c
t
en la alcaldía de Pasto, con un puntaje promedio de 73,1 puntos. o
Mediana (Me)
La mediana de una serie de datos ordenados es el valor que se encuentra en el centro de los datos.
Otra forma es, un valor mayor al 50% de los datos y es menor que el otro 50%. La mediana se la
utiliza cuando existe un valor extremo o dato atípico, en inglés “outlier”.

Mediana para datos No agrupados:


Ejemplo (Datos No agrupados)
En internet publican los precios de cinco planes turísticos: 35, 37, 29, 31, 60 dólares. Calcular la
mediana.
Solución:
La serie de datos ordenados es: 29, 31, 35, 37, 60.
𝒏+𝟏 5+1
El lugar de la mediana es 𝑳𝑴𝒆 = = = 3. Esto indica que el tercer dato es la mediana. Es decir,
𝟐 2
la mediana es 35.

La interpretación de la mediana es: El 50% de los planes turísticos cuestan menos de 35 dólares y el otro
50% cuesta igual o más de 35 dólares.

Ejercicio: Los pesos de los instrumentos de seis científicos que inspeccionaron al Volcán Galeras son:
4530, 4510, 6000, 4700, 4600, 4490 gramos. Calcular y analizar la mediana.
Mediana para datos Agrupados:

𝑛
2
−𝐹𝑖 (𝑡−1)
Se calcula utilizando la fórmula: 𝑀𝑒 = 𝐿𝑖𝑛𝑓 + 𝐶
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

El intervalo donde se encuentra la mediana se conoce como intervalo mediano. Donde:

𝑳𝒊𝒏𝒇 : Límite inferior o frontera inferior de donde se halla la mediana, la forma de calcularlo es a través
𝑛
del caculo de la posición
2
𝑭𝒊 (𝒕 − 𝟏): Frecuencia acumulada anterior a la Frecuencia acumulada del intervalo mediano.

𝒇 𝒎𝒆𝒅𝒊𝒂𝒏𝒂: Frecuencia del intervalo mediano.


𝑪: Amplitud del intervalo en el que se encuentra la mediana.
Ejemplo (Datos Agrupados)
La siguiente tabla muestra la distribución de frecuencias reportada por una clínica de Pasto en relación
al número de enfermos atendidos en un fin de semana. Calcule en interprete el valor de la mediana.

Intervalos de clases Marca de Frecuencia de cada clase Frecuencia acumulada


(datos en años) clase (fi) (Fi)
10-19 15 8 8
20-29 25 20 28
30-39 35 14 42
40-49 45 8 50
50-59 55 2 52
60-69 65 2 54
70-79 75 1 55
Total 55 enfermos atendidos
Pasos para calcular la Mediana:
A) Encontrar la mitad del total de datos del que trata el problema.
En el presente ejemplo hay 55 datos. La mitad es:

𝑛 55
= = 27,5
2 2
B) Encontrar el intervalo o clase mediana.
Para encontrar la clase mediana se observa el valor más grande y más próximo al resultado del punto
A) en la columna de las Frecuencias acumuladas (Fi).
En este caso el intervalo mediano o la clase donde se encuentra la mediana es el segundo, puesto que
27.5 se aproxima al valor 28 descrito en la Fi.
En esta tabla los valores quedarían:

Linf = 20 F acumulada anterior (t - 1)= 8 f mediana = 20 C =10


se tiene:

𝑛
− 𝐹𝑖 𝑡 − 1
𝑀𝑒 = 𝐿𝑖𝑛𝑓 + 2 𝐶
𝑓 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

55
−8
= 20 + 2 10
20
= 29,75

Con lo que se concluye que el 50% de las personas atendidas en un fin de semana por el hospital tienen
una edad inferior a los 30 años aproximadamente.
Ejercicio (Datos Agrupados)
A un grupo de personas seleccionadas aleatoriamente se les preguntó ¿cuántos salarios mínimos invertirían
en tecnología en el año?. La información se resume en la siguiente tabla. Calcular y analizar la mediana,
la mediana y la moda.

Salarios mínimos que


se invertirían en tecnología Número de personas

1-3 5
3-5 7
5-7 12
7-9 2
La moda o modo (𝑴𝒐 )
La moda o modo se define como el dato de mayor frecuencia o el dato que más se repite. Si una serie de
datos tiene una moda se dice que es unimodal, si tiene dos modas se dice que es bimodal y si tiene más
de dos modas se dice que es multimodal.
Ejemplo (Datos No Agrupados)
Una aerolínea está planeando descuentos para los hijos de sus clientes. Se realizó un estudio a un grupo
de 40 clientes, en el cual la variable de interés fue el número de hijos por cliente. Se obtuvo la siguiente
información. Calcular la moda.

Número de hijos Número de clientes


Solución.
0 5
1 10
La moda es 𝑴𝒐 = 𝟐, ya que es el número de hijos que se
2 15 repite con mayor frecuencia, en este caso se presenta en 15
3 8
clientes.
4 2
Moda para datos Agrupados:

Se calcula mediante la siguiente fórmula:


𝑓𝑚 − 𝑓(𝑚−1)
𝑀𝑜 = 𝐿𝑖𝑛𝑓 + ∗𝐶
2𝑓𝑚 − 𝑓(𝑚−1) − 𝑓(𝑚+1)
Donde:

𝑳𝒊𝒏𝒇 : límite inferior del intervalo o clase modal.


𝒇𝒎 : frecuencia de la clase modal
𝒇(𝒎−𝟏) : frecuencia anterior a la frecuencia modal
𝒇(𝒎+𝟏) : frecuencia siguiente a la frecuencia modal
𝑪: amplitud.
Ejemplo (Datos Agrupados)
La siguiente tabla muestra la distribución de frecuencias reportada por una clínica de Pasto en relación
al número de enfermos atendidos en un fin de semana. Calcule en interprete el valor de la mediana.
encuentre e interprete la moda.
Clases Marca de clase Frecuencia de cada
(datos en años) clase (f)
10-19 15 8
20- 29 25 20
30-39 35 14
40-49 45 8
50 - 59 55 2
60-69 65 2
70-79 75 1
Total 55 enfermos
atendidos
Solución
En primer lugar se debe localizar la clase o intervalo modal la cual contiene la mayor densidad de
frecuencia por unidad de intervalo y luego se aplica la fórmula dada.
En nuestro caso la clase es 20 - 29 ya que contiene el mayor número de frecuencias (20 en total)

Clases Marca de clase Frecuencia de cada

(datos en años) clase (f)


𝑓 𝑚−1
10-19 15 8
20- 29 25 20 𝑓𝑚
30-39 35 14 𝑓(𝑚 + 1)
40-49 45 8
50 - 59 55 2
60-69 65 2
70-79 75 1
Total 55 enfermos
atendidos
Con lo cual se obtiene:
𝐿𝑖𝑛𝑓 = 20 𝑓𝑚 = 20 𝑓 𝑚−1 =8 𝑓 𝑚 + 1 = 14 C= 10
Sustituyendo en la fórmula se obtiene:
𝑓𝑚 − 𝑓 𝑚−1
𝑀𝑜 = 𝐿𝑖𝑛𝑓 + ∗𝐶
2𝑓𝑚 − 𝑓 𝑚−1 − 𝑓 𝑚+1

20 − 8
= 20 + ∗ 10
2 20 − 8 − 14

= 26,666
El valor de la moda es 27
Lo que significa que la edad de la mayoría de los enfermos que asisten al centro hospitalario durante
el fin de semana es de 27 años.
Ejercicio
Una empresa de turismo tiene en su nómina 60 empleados, clasificados por edad, como lo indica la
siguiente tabla. Calcular y analizar la media, la moda y la mediana.

Edad # de empleados
𝑳𝒊𝒏𝒇. 𝑳𝒔𝒖𝒑. 𝒇𝒊
20 25 5
25 30 12
30 35 18
35 40 15
40 45 10
REFERENCIAS
• WALPOLE R.E., MYERS R.H., MYERS S.L.: "Probabilidad y Estadística para
Ingenieros", Ed. Prentice Hall, 6 ed, 1998.
• MENDENHALL, William. Introducción a la Probabilidad y a la Estadística.
Wadsword International. Belmont California 1982.
• RODRÍGUEZ, Ojeda, L Probabilidad y estadística básica para ingenieros. ESPOL.
2014.
• MONTGOMERY, D. C., Runger, G. C., & Medal, E. G. U. Probabilidad y
estadística aplicadas a la ingeniería. McGraw Hill.1996.

Вам также может понравиться