Академический Документы
Профессиональный Документы
Культура Документы
Área: NEGOCIOS
Medidas de Resumen
Índice
Medidas de Resumen
Mapa de Contenido
Medidas Estadísticas
Medidas de Medidas de
Medidas de Posición
Tendencia Central Dispersión
Moda Percentiles
Desviación Coeficiente de
Estándar Variación
Medidas
Transversales
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 1
Medidas de Resumen
Resultado de Reconoce las medidas de resumen: posición, tendencia central y dispersión.
aprendizaje del Identifica y calcula las medidas de resumen.
módulo Calcula las medidas de resumen para tabla de distribución de frecuencia.
1. Introducción
La clasificación de datos y su posterior representación gráfica, forman parte de aquellas herramientas
estadísticas que permiten conocer el comportamiento de una distribución de frecuencias. Para ampliar la
información acerca de esta distribución y completar así el análisis descriptivo de una población o muestra, es
necesario recurrir a ciertos valores numéricos que permiten cuantificar ciertas características de la distribución.
Se les llama a estos valores Medidas Estadísticas de Resumen o Estadígrafos. Las de uso frecuente en un análisis
descriptivo son las medidas de localización, medidas de tendencia central y las medidas de dispersión.
Los números parecen disfrutar de la compañía de otros números y están propensos a reunirse alrededor de un
punto denominado medida de tendencia central. Una medida de tendencia central ubica e identifica el punto
alrededor del cual se centran los datos.
Además, las medidas de dispersión indican el punto hasta el cual las observaciones individuales se esparcen
alrededor de su punto central. Miden la dispersión o la variabilidad de los datos y reflejan la tendencia de las
observaciones individuales a desviarse de dicho punto central.
IMPORTANTE
Un conjunto grande de datos puede ser rápidamente descrito de manera sucinta con un solo número.
Si el profesor por ejemplo, dice que la nota promedio de la clase en la última solemne de estadística
empresarial fue de 6,5, esto indica algo. En cambio si el profesor dice que la nota promedio fue de 3,6, esto
indica algo totalmente diferente.
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 2
Medidas de Resumen
2. Medidas Estadísticas o Estadígrafos
Llamadas medidas estadísticas o estadígrafos describen y cuantifican en forma resumida las características de
la distribución de frecuencias de un conjunto de datos de una población o muestra.
IMPORTANTE
La letra griega Ʃ es el signo de sumatoria que indica que se suman todas las observaciones en su rango.
En este caso σ𝑛𝑖=1 𝑥𝑖 , se suman todas las observaciones de 1 a 𝑛.
Las 𝑥𝑖 denotan las observaciones individuales. La media de una muestra es un estadístico 𝑋ത (se lee 𝑋 −
barra).
a. Media Aritmética
También se puede denominar Media o Promedio (es el promedio común). Se obtiene dividiendo la suma de
todas las observaciones por la cantidad de observaciones.
IMPORTANTE
σ𝑛𝑖=1 𝑥𝑖 𝑥1 + 𝑥2 + … + 𝑥𝑛
𝑋ത = =
𝑛 𝑛
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 3
Medidas de Resumen
Por ejemplo…
56
67
52
45
67
Resultado:
El ingreso promedio de los cinco meses es 57,4 miles de dólares.
IMPORTANTE
𝑛𝑖 = 𝑛
𝑖=1
Entonces,
σ𝑘𝑖=1 𝑐𝑖 ∗ 𝑛𝑖
𝑋ത =
𝑛
Notación:
Clases (𝑐𝑖 ) : valores que toma la variable.
Tamaño de muestra (𝑛) : número total de casos de la variable.
Frecuencia Absoluta (𝑛𝑖 ): número de veces que cada valor de la clase 𝑐𝑖 se repite.
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 4
Medidas de Resumen
• Para datos agrupados en 𝒌 intervalos de clases
IMPORTANTE
Sean 𝑚1 , 𝑚2 , … , 𝑚𝑘 las marcas de clases de una distribución de frecuencias, con frecuencias absolutas
𝑛1 , 𝑛2 , … , 𝑛𝑘 , tal que
𝑘
𝑛𝑖 = 𝑛
𝑖=1
y
𝑙𝑖−1 + 𝑙𝑖
𝑚𝑖 =
2
Donde 𝑙𝑖−1 𝑦 𝑙𝑖 son los límites inferior y superior, respectivamente, del intervalo de clase i-ésimo.
Entonces,
σ𝑘𝑖=1 𝑚𝑖 ∗ 𝑛𝑖
𝑋ത =
𝑛
Observación:
En este caso, 𝑋ത es una aproximación del verdadero valor debido al uso de la marca de clase como valor
representativo del intervalo, sin embargo, si el tamaño de muestra el grande la aproximación es bastante
buena.
Notación:
Marca de clase (𝑚𝑖 ) : promedio entre límite inferior y límite superior del intervalo i-ésimo.
Tamaño de muestra (𝑛) : número total de casos de la variable.
Frecuencia Absoluta (𝑛𝑖 ): número de observaciones que caen en el intervalo de clases i-ésimo.
Por ejemplo…
Para la siguiente muestra, en donde se considera el ingreso mensual en miles de pesos, en datos agrupados en
intervalos de clase.
La tabla de distribución de frecuencias es la siguiente:
Medidas de Resumen
Así,
13.978.725
̅
X= = 349.468,13
40
Resultado:
En promedio, las personas en la muestra tienen un ingreso mensual de $349.468,13
b. Mediana
Denotada por Me, es el punto que divide a un conjunto de datos ordenados o a una distribución de frecuencias
en dos partes (cuartil dos Q 2 , o percentil 50 P50 ).
IMPORTANTE
Sea x1 , x2 , … , xn un conjunto de n datos individuales y sea x(1) , x(2) , … , x(n) el conjunto ordenado en forma
ascendente. Se define la posición de la mediana, denotada por Pos(Me), en la forma:
n+1
Pos(Me) =
2
x n +x n
ቀ ቁ ቀ +1ቁ
2 2
Si n es par se tiene que Me = 2
Por ejemplo…
56
67
52
45
67
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 6
Medidas de Resumen
Ingresos(M US$)
en 5 meses
67
Para calcular la Mediana debemos ordenar los datos de forma ascendente, 67
56
52
45
Luego como n = 5
5+1
Pos(Me) = =3
2
Resultado:
Como n = 5 es impar el valor de la mediana es Me = x3 = 56
Ahora n = 6 entonces
6+1
Pos(Me) = = 3,5
2
x 6 +x 6
ቀ ቁ
2
ቀ +1ቁ
2 x(3) + x(4) 52 + 56
Me = = = = 54
2 2 2
Resultado:
Esto significa que en la mitad de los meses las ventas estuvieron por debajo de 54.000 mil dólares, y en la mitad
de los meses los ingresos excedieron dicha suma.
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 7
Medidas de Resumen
• Para datos agrupados en 𝐤 clases individuales
IMPORTANTE
Se identifica el valor de la mediana como aquella clase donde la frecuencia acumulada Ni que supera
inmediatamente a
n+1
Pos(Me) =
2
Por ejemplo…
En el siguiente caso, en donde se tomaron los registros de cuántas personas viven en la casa habitación de 50
hogares, la segunda columna presenta la cantidad de integrantes de la casa, y en la tercera columna el recuento
de hogares en cada clase.
50+1
En este caso Pos(Me) = 2
= 25,5, así la frecuencia acumulada que supera a 25,5 es 33 por lo que la
mediana sería la clase con 3 integrantes de la familia.
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 8
Medidas de Resumen
• Para datos agrupados en intervalos de clase
IMPORTANTE
Primero se identifica el intervalo que contiene a la mediana, le llamaremos el intervalo mediano [li−1 ; li [,
el cual corresponde al que tiene la frecuencia absoluta acumulada que supera inmediatamente el valor
n+1
Pos(Me) = 2
, entonces:
n
− Ni−1
Me = li−1 + 2 ∗ ai
ni
Notación:
n
li−1: Límite inferior del intervalo que contiene a la mediana en el cual Ni ≥ 2
n : Tamaño muestral o cantidad de datos.
Ni−1: Frecuencia absoluta acumulada del intervalo anterior al intervalo que contiene a la mediana.
ni : Frecuencia absoluta del intervalo mediano.
ai : Amplitud del intervalo "mediano".
Por ejemplo…
40+1
Tenemos que Pos(Me) = = 20,5 y la Ni que la supera es N4 = 25, entonces el intervalo mediado es el
2
cuarto, es decir, [l3 ; l4 [ =[304.759; 382.514[. Luego:
40
− 16
Me = 304.759 + 2 ∗ 77.755 = 339.316,8
9
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 9
Medidas de Resumen
c. Moda
Denotada por Mo, se define como el valor más común o que más veces se repite (pudiendo no existir) en un
conjunto de datos, es decir, aquel valor con la más alta frecuencia absoluta.
IMPORTANTE
max൛np ൟ = ni , entonces Mo = ci
Por ejemplo…
Siguiendo el caso anterior, en donde se tomaron los registros de cuántas personas viven en la casa habitación
de 50 hogares, la segunda columna presenta la cantidad de integrantes de la casa, y en la tercera columna el
recuento de hogares en cada clase.
Medidas de Resumen
• Para datos agrupados en 𝐤 intervalos de clase
IMPORTANTE
Primero se identifica el intervalo que tiene la mayor frecuencia absoluta, llamado intervalo modal,
[li−1 ; li [, y se determina la moda de la siguiente forma:
ni+1
Mo = li−1 + ∗a
ni−1 + ni+1 i
Notación:
li−1: Límite inferior del intervalo modal.
ni−1 : Frecuencia absoluta del intervalo anterior al intervalo modal
ni+1 : Frecuencia absoluta del intervalo posterior al intervalo modal
ai : Amplitud del intervalo "mediano".
Por ejemplo…
Se tiene que max൛np ൟ = n3 } = 10, entonces el intervalo modal es el tercero, es decir, [l2 ; l3 [ =[227.004;
304.759[. Luego:
9
Mo = 227.004 + ∗ 77.755 = 276.989,6
5+9
Por ejemplo, supongamos que tenemos dos conjuntos de datos con los siguientes valores
Grupo 1 Grupo 2
0, 25, 50, 50, 75, 100 48, 49, 50, 50, 51, 52
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 11
Medidas de Resumen
En ambos grupos se tiene que xത = Me = Mo = 50 y observamos que los datos del primer grupo están mucho
más alejados de las Medidas de Tendencia Central que el segundo grupo, o sea, los datos del grupo 1 tienen
mayor variabilidad o dispersión que los datos del grupo 2, lo cual no es informado por las medidas antes
indicadas las cuales coinciden entre sí.
Las medidas estadísticas de variabilidad cuantifican la dispersión de los datos en torno a un valor central, que
generalmente corresponde a la media aritmética.
a. Rango o Recorrido
Es la medida de dispersión más simple (y menos útil) porque se calcula como la diferencia entre la observación
de mayor valor y la de menor valor.
Así el rango queda de la siguiente manera:
r = xmax − xmin
b. Varianza
Corresponde al promedio cuadrático de las desviaciones de los datos respecto a su media aritmética. Para una
variable X, se denota por V(X).
IMPORTANTE
Por ejemplo…
Medidas de Resumen
La Media se calcula así
56 + 67 + 52 + 45 + 67 287
̅=
X = = 57,4
5 5
sX2 = 92,3
IMPORTANTE
ni = n
i=1
Si la media aritmética es xത, entonces
Medidas de Resumen
• Para datos agrupados en 𝐤 intervalos de clases
IMPORTANTE
Sean m1 , m2 , … , mk las marcas de clases de una distribución de frecuencias, con frecuencias absolutas
n1 , n2 , … , nk , tal que
ni = n
i=1
y
li−1 + li
mi =
2
Donde li−1 y li son los límites inferior y superior, respectivamente, del intervalo de clase i-ésimo. Si la
media aritmética es xത, entonces
Por ejemplo…
Medidas de Resumen
Podemos realizar una partición mayor de la distribución de frecuencias dividiéndola en 4, 10 o 100 partes.
Llamamos a estas particiones cuantiles y según el número de divisiones obtenemos cuartiles, deciles o
percentiles.
a. Cuartiles
Particionan a una distribución de frecuencias en 4 partes mediante los puntos Q1 , Q 2 , Q 3 , llamados primer,
segundo y tercer cuartil, respectivamente.
IMPORTANTE
Notemos que:
Q 2 = 25 ∗ 2% = 50% = Me
Q 2 = Me
b. Deciles
Particionan a una distribución de frecuencias en 10 partes mediante los puntos D1 , D2 , … , D9 llamados primer
decil, segundo decil,... y noveno decil, respectivamente.
Se denomina recorrido interdecílico a D = D9 − D1
IMPORTANTE
Notemos que:
D5 = 10 ∗ 5% = 50% = Q 2 = 25 ∗ 2% = 50% = Me
D5 = Q 2 = Me
c. Percentiles
Particionan a una distribución de frecuencias en 100 partes mediante los puntos P1 , P2 , … , P99 llamados primer
percentil, segundo percentil,..., 99avo percentil, respectivamente.
Medidas de Resumen
IMPORTANTE
Notemos que:
D1 = P10
P50 = D5 = Q 2 = Me
P75 = Q 3
IMPORTANTE
n∗r
− Ni−1
Pr = li−1 + 100 ∗ ai
ni
Notación:
n : Tamaño muestral o cantidad de datos.
li−1: Límite inferior del intervalo cuantílico que es aquel cuya frecuencia acumulada Ni es supera
n∗r
inmediatamente al cuociente 100.
Por ejemplo…
Los promedios finales obtenidos por los 18 alumnos que participaron en una actividad de diplomado fueron
clasificados en 6 intervalos de clase, dando origen a la siguiente distribución de frecuencias:
Medidas de Resumen
Calcular los valores de Q1 , D8 , P40
Para Q1 (primer cuartil; r = 25)
n ∗ r 18 ∗ 25
= = 4,5
100 100
N3 = 9 ≥ 4,5 → i = 3
Por lo tanto,
18 ∗ 25 18 ∗ 25
100 − N2 −4
Q1 = P25 = l2 + ∗ a3 = 40 + 100 ∗ 15 = 41,5
n3 5
Es decir, el 25% de los alumnos tienen un promedio final de a lo más 40,5 puntos que constituye al 25% inferior
de la distribución de frecuencias.
N5 = 16 ≥ 14,4 → i = 5
Por lo tanto,
18 ∗ 80 18 ∗ 80
− N4 − 13
D8 = P80 = l4 + 100 ∗ a5 = 70 + 100 ∗ 15 = 77
n5 3
Es decir, el 80% de los alumnos tienen un promedio final de a lo más 70,5 puntos que constituye al 80% inferior
de la distribución de frecuencias.
N3 = 9 ≥ 7,2 → i = 3
Por lo tanto,
18 ∗ 40 18 ∗ 40
100 − N2 −4
P40 = l2 + ∗ a3 = 40 + 100 ∗ 15 = 49,6
n3 5
Es decir, el 40% de los alumnos tienen un promedio final de a lo más 49,6 puntos que constituye al 40% inferior
de la distribución de frecuencias.
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 17
Medidas de Resumen
2.4 Medidas Transversales
c. Desviación Estándar
De la definición de la varianza, podemos observar que su unidad de medida es el cuadrado de la unidad original
de los datos, por lo que resulta difícil comprender su significado. Por lo tanto, para obtener una medida de
variabilidad expresada en la misma unidad de los datos, podemos extraer la raíz cuadrada positiva a la varianza.
Llamaremos a esta nueva medida desviación estándar y que denotamos por sX .
sX = √sX2
Por ejemplo…
56
67
52
45
67
sX2 = 92,3
d. Coeficiente de Variación
Tanto para la varianza como la desviación estándar son medidas de variabilidad que dependen de la unidad de
medida de los datos, por lo que se verán afectada ante cambios producidos en esta unidad. Además, si se desea
comparar distribuciones, esto puede lograrse si ellas están expresadas en la misma unidad de medida.
Puede definirse una nueva medida de variabilidad que sea independiente de la unidad de medida en que están
expresados los datos, permitiendo con esto resolver los dos problemas mencionados anteriormente. Esto
corresponde al coeficiente de variación, denotado por CVX , definido por la expresión:
SX
CVX = ∗ 100%
̅
X
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA Pág. 18
Medidas de Resumen
El coeficiente de variación nos da una medida de dispersión de los datos expresada en forma porcentual con
respecto de la media aritmética de la distribución de frecuencias.
Una desventaja que presenta este coeficiente es que su valor se ve alterado ante un traslado de origen de los
datos manteniendo fija la variabilidad de éstos.
Por ejemplo…
Supongamos que tenemos los siguientes resultados para los conjuntos de datos X e Y:
Comparando ambos coeficientes, podemos concluir que la distribución de la variable X tiene menos
variabilidad que la correspondiente a la distribución de la variable Y.
APORTE A TU FORMACIÓN
Se estudiaron las medidas de resumen (Tendencia Central, Dispersión y Posición) que permiten
caracterizar de mejor forma la información ordenada en Tablas de Distribución de Frecuencias.
Área: NEGOCIOS M2
Curso: FUNDAMENTOS DE ESTADÍSTICA
Medidas de Resumen
Bibliografía
Obligatoria
Romero Ramos, Eva. (2016). Estadística para todos: análisis de datos: estadística descriptiva, teoría de la
probabilidad e inferencia. Madrid, ESPAÑA: Larousse - Ediciones Pirámide, 2016. ProQuest ebrary. Web. 21
September 2016. Cap. 3. 41 – 70.