Вы находитесь на странице: 1из 14

Medidas de tendencia central

De la tendencia central de la distribución, nos interesa calcular un valor central que


actúe como resumen numérico para representar al conjunto de datos. Estos
valores son las medidas o índices de tendencia central. Los índices de tendencia
central permiten representar la distribución con un único valor y facilitan la
comparación de otros conjuntos de puntuaciones de una variable.

Las medidas más utilizadas en el análisis de datos son:

La media aritmética

También se llama promedio o media es la medida de tendencia central más


conocida y usada en la práctica, por su sencillez de cálculo y es el fundamento de
un gran número de técnicas estadísticas. Indica la tendencia general de una
distribución de frecuencias de una variable y es el valor central de las
observaciones “centro de gravedad”. Sin embargo se limita para calcular variables
cuantitativas. La media aritmética de una variable X, denotada por X, se define:

X = ∑Xi / n

donde:

Xi es el valor que toma la variable u observación del sujeto i.

n es el número total de observaciones.

Cuando el número de observaciones es elevado, los datos se presentan en tablas


de distribución de frecuencias agrupados o no en intervalos; en este caso se
puede calcular a partir de:

1. Media aritmética a partir de una distribución de frecuencias absolutas:

X= ∑ni Xi / n

donde:

n es el número total de observaciones.

Xi es el valor i en la variable X i o el punto medio del intervalo.

ni es la frecuencia absoluta del valor o intervalo i.

2. Media aritmética a partir de una distribución de frecuencias relativas:

X = ∑pi Xi
donde:

pi es la frecuencia relativa o proporción de observaciones del valor o del intervalo


i.

La media aritmética aprovecha toda la información disponible en los datos, pues


requiere de todas las puntuaciones de los sujetos. Así, la media aritmética
presenta las siguientes propiedades:

 En una distribución, la suma de las desviaciones de cada valor con


respecto a su media es igual a cero.
o i=1∑n(Xi – X) = 0
 Si a los valores de la variable X les aplicamos la siguiente transformación
lineal Y = bX + a, la media de los nuevos valores Y será Y = bX + a.

A la hora de utilizar la media aritmética conviene tener en cuenta las siguientes


limitaciones:

 Cuando los datos están agrupados en intervalos, la media no se puede


calcular si el intervalo máximo no tiene límite superior y/o el mínimo no lo
tiene inferior.
 En distribuciones asimétricas no es recomendable su uso debido a que
afecta a su representatividad como valor central de la distribución. Estos
valores extremos pueden ser producto de errores en la recogida o
grabación de datos, o valores que aportan información relevante de la
variable. En el primer caso se eliminan estas observaciones, volviendo la
distribución más simétrica. Y en el caso dos, se recomienda aplicar otros
índices de tendencia central menos sensibles a los valores extremos como
la mediana.

La mediana

Es el índice empleado cuando la distribución es asimétrica y no es posible aplicar


la media aritmética. La mediana no se ve afectada por los valores extremos que
en su cálculo ocupan las posiciones centrales. Por lo tanto, la mediana es un valor
apropiado para representar la tendencia central de la distribución y se puede
obtener todo tipo de variables excepto en variables cualitativas. La mediana de
una variable X, representada por Md, se define como el valor de la variable que
divide la distribución de frecuencias en dos partes iguales, conteniendo cada una
el 50% de las observaciones.

Para el cálculo de la mediana con pocos casos se procede de la siguiente manera:

1. Se ordenan las n puntuaciones de menor a mayor.


2. Se observa si el número de observaciones n es impar o par. Si es impar, el
valor de la mediana es el de la observación que ocupa la posición central,
dentro de ese conjunto de observaciones ya ordenadas. Si es par, la
mediana es la media aritmética de los dos valores centrales de la
distribución.

Lo normal es que el número n de observaciones no sea pequeño; incluso


aparecerán repetidos y, por ello, los datos se presentarán en tablas de distribución
de frecuencias agrupados o no en intervalos.

Cuando los datos están en intervalos se denomina intervalo crítico y se


corresponde con el que la frecuencia absoluta acumulada na es igual o superior a
n/2.

Cuando los datos no están agrupados en intervalos, el cálculo es un caso


particular de la fórmula anterior en la que la amplitud de los intervalos es igual a
uno (I = 1).

La mediana se puede calcular en cualquier distribución excepto cuando los datos


están agrupados y existe uno abierto en el que se encuentra la mediana.

La moda

La moda es otro índice de tendencia central que se puede obtener tanto en


variables cualitativas como en cuantitativas. Se representa por Mo, y se define
como el valor o categoría de la variable con mayor frecuencia absoluta.

Si se da en una variable cuantitativa con los datos no agrupados en intervalos, la


moda es el valor con la mayor frecuencia absoluta.

Si se da en una distribución de una variable cuantitativa en intervalos, se localiza


el intervalo modal que es el intervalo con la frecuencia máxima y la moda es el
medio de dicho intervalo.

Una frecuencia es unimodal cuando existe un único valor con la frecuencia


máxima. Si presenta varios valores con la frecuencia más alta, ésta será bimodal,
trimodal, ...

Sus principales características son:

 es un índice de cálculo sencillo y de fácil interpretación.


 Es el único que, además de aplicarse a variables cuantitativas, se puede
calcular en variables cualitativas.
 Sólo se excluye su cálculo en el supuesto de que coincida con el intervalo
abierto.

La elección de una medida de tendencia central


Para seleccionar un valor que resuma adecuadamente la tendencia central de la
distribución de frecuencias,se recomienda como primera opción la media
aritmética, por que en ella basan su importancia muchos estadísticos. Únicamente
se desaconseja su uso con pocos valores extremos, cuando el nivel de medida de
la variable es nominal u ordinal y/o en datos agrupados en los que existen
intervalos abiertos en los extremos de la distribución.

Cuando la media no es aplicable, se recomienda la mediana. Y por último, si ésta


no es posible, se aconseja tomar la moda. Resaltar que si una variable cuantitativa
es simétrica y unimodal, coinciden todos los valores de la media, mediana y moda.

Medidas de posición
Las medidas o índices de posición, también llamados cuantiles, informan acerca
de la posición relativa de un sujeto con respecto a su grupo de referencia, dentro
de la distribución de frecuencias de la variable. Para ello debemos dividir la
distribución en un número de partes o secciones iguales entre sí en cuanto al
número de observaciones. Trataremos tres medidas de posición o cuantiles:

Percentiles

Los también llamados centiles, son los 99 valores de la variable que dividen en
100 la distribución de frecuencias. Representado por Pk , es un valor de la variable
de interés que deja por debajo de sí un porcentaje k de sujetos, donde k =
1,2....99- El cálculo de los percentiles se realiza utilizando una extensión del
método expuesto para la mediana. La diferencia está en que para la mediana se
traba de localizar la posición de n/2; mientras los percentiles se hace en base al
número n.k/100 . Este número es igual a n/2 cundo calculamos el percentil 50.
entonces si k = 50; n.50/100 = n/2.

Al igual que con la mediana, cuando en la distribución de frecuencias los datos no


están en intervalos, se aplica I = 1.

Sin embargo lo que queremos calcular es qué percentil ocupa un valor X debemos
de despejar k i para Xi.

A veces el resultado puede darnos un valor con decimales; en este caso, tomamos
la cantidad entera más próxima.

Cuartiles y deciles

Son medidas de posición en las que las secciones son muchas menos que en los
percentiles. Los cuartiles son tres valores de la distribución que se dividen en
cuatro partes. El primer cuartil se representa por Q1 , deja por debajo de sí el
25%, correspondiendo con el percentil 25. El segundo cuartil Q2 , deja por debajo
el 50%, equivalente al percentil 50 y a la mediana de la distribución. El tercero Q3 ,
deja por debajo de sí el 75%, equivalente al percentil 75.

Para calcular los cuartiles emplearemos las mismas fórmulas que para los
percentiles en su equivalencia.

Los deciles son nueve valores que dividen en diez partes iguales a la distribución.
Se representa por D i , donde i = 1,2,...9.

El primer decil, deja por debajo de sí al 10% de los sujetos, el segundo el 20% y
así hasta el 90%; pudiendo emplear nuevamente los percentiles correspondientes
para su cálculo.

-Medidas de tendencia central, de


posición y de dispersión.
MEDIDAS DE TENDENCIA CENTRAL

MEDIA: Media aritmética, es la que se obtiene sumando los datos y dividiéndolos por el número de ellos. Se a
promedio que se atiende en un turno. Otro ejemplo, es el número promedio de controles prenatales que tiene u

MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la población exactamente en dos. Po
es dos hijos. Otro ejemplo es el número mediana de atenciones por paciente en un consultorio.

MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución unimodal tiene una sola mo
resumen para las variables nominales. Por ejemplo, el color del uniforme quirúrgico en sala de operaciones es
quirúrgico.

MEDIDAS DE DISPERSIÓN

DESVIACIÓN ESTÁNDAR: Llamada también desviación típica; es una medida que informa sobre la media d
aritmética, expresada en las mismas unidades que la variable.

LA VARIANZA: Es el valor de la desviación estándar al cuadrado; su utilidad radica en que su valor es reque

ERROR TÍPICO: Llamado también error estándar de la media. Se refiere a una medida d variabilidad de la me
realizar un nuevo calculo.

Medidas de Tendencia Central


Definiciones:
Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados según
valores también conocidos como estadigrafos, la media aritmética, la mediana, la moda y al rango medio.

La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n valores de observaci
uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extre
la información de los datos.

La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de e
la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones ex

La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extrem

Rango Medio es la media de las observaciones menor y mayor. como intervienen solamente estas observacion
medida de posición, pero
ofrece un valor adecuado, rápido y sencillo para resumir al conjunto de datos.

Datos Discretos

No Agrupados

Analicemos para ello las edades que utilizamos cuando se vió la organización y presentación de datos discret

12 15 14 15 16
18 19 14 15 17
15 17 18 16 19
16 17 15 15 17
16 18 17 19 17
23 16 17 18 19

Estos fueron loa datos mostrados originalmente, no se han ordenado ni agrupado, determinemos ahora lo
recurramos a las fórmulas de estas medidas que resumimos en la siguiente tabla:

Medida Formula Observaciones


Media Donde xi se refiere a todo y cada
uno de los elementos de la
muestra y n es el numero total de
elementos en la muestra.
Mediana a) p = (n/2) Es la posición en donde se
encuentra la mediana.
Si n es impar, entonces es la
opción a, en caso contrario, la b.
b) p = (n/2) + 1 El valor de la mediana se obtiene
por observación
Moda Se obtiene el valor por
observación
Rango Medio (Valor máximo + Valor Mínimo) / 2

Aplicando, se obtienen los siguientes valores:

Para la media:

_ 12 + 15 + 14 + 15 + 16 + 18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16 + 17 + 15 + 15 + 17 + 16 + 18 + 17 + 19 + 17 + 23 + 1
X = ----------------------------------------------------------------------------------------------------------------------------- -------------------------------------------
30

_ 500
X = ------------ = 16.6667
30

Para la mediana debera ordenarse el grupo de datos, como n = 30, utilizaremos la posición p = (30/2) = 15, e

La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7

El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5

Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ord
embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los c
tabla:

Medida Valor Calculado Observaciones


Media 16.6667
Mediana 17 Se requirió el cálculo de la frecuencia acumulada
Moda 17
Rango Medio 17.5

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se nota
originales, sin embargo las formulas si se ven modificadas.
Agrupados

Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado utilizando:

Clase Repeticiones Total de Años de la clase


12 1 12
14 2 28
15 6 90
16 5 80
17 7 119
18 4 72
19 4 76
23 1 23
Total 30 500

En donde podemos observar la suma de las frecuencias y de los años multiplicados por la clase que agrupa a
se agruparon en la sección anterior, utilizando ahora las formulas de la siguiente tabla:

Medida Formula Observaciones


Media Donde xi se refiere a todo y cada uno
de los elementos de la muestra y n es
el número total de elementos en la
muestra y fi se refiere a la frecuencia
de la clase.
Es la posición en donde se encuentra la
mediana.
Se ubica en la tabla el primer valor de
Mediana p = (n/2) frecuencia acumulada mayor a la
posición calculada, si ese valor es
mayor, entonces la mediana es la clase
correspondiente al mismo. Si el valor
es igual a la posición, entonces se
suman el valor anterior más el valor
obtenido y se divide entre 2.
Moda Se obtiene el valor por observación de
la mayor frecuencia
Rango (Valor máximo + Valor Mínimo) / 2
Medio

Aplicando, se obtienen los siguientes valores:


Para la media:

_ 12 * 1 + 14 * 2 + 15 * 6 + 16 * 5 + 17 * 7 + 18 * 4 + 19 * 4 + 23 * 1 12 + 28 + 90 + 80 + 119 + 72 + 76 + 23
X = -------------------------------------------------------------------------------------------- = ---------------------------------------------------------------
30 30

_ 500
X = ------------ = 16.6667
30

Para la Mediana, utilizaremos la frecuencia acumulada:

Clase Frecuencia Frecuencia Acumulada


12 1 1
14 2 3
15 6 9
16 5 14
17 7 21
18 4 27
19 4 29
23 1 30
Total 30

Como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.

La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7

El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5

Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ord
embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los c
tabla:

Medida Valor Calculado Observaciones


Media 16.6667
Mediana 17 Se requirió el cálculo de la frecuencia acumulada
Moda 17
Rango Medio 17.5

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se nota
originales, sin embargo las formulas si se ven modificadas.
Datos Continuos

No agrupados

Las medidas de tendencia central para datos continuos no agrupados no tienen mayor significación, ya que
agrupados, por ello utilizaremos las mismas formúlas, pero ahora con los datos continuos del ejercicio de la s

1.25 1.2 1.28 1.29 1.2 1.24


1.27 1.21 1.32 1.27 1.18 1.29
1.2 1.23 1.25 1.28 1.24 1.28
1.27 1.25 1.24 1.25 1.27 1.28
1.29 1.18 1.21 1.24 1.2 1.23
1.25 1.27 1.28 1.24 1.29 1.21

Aplicando, se obtienen los siguientes valores:

Para la media, aplicando la formula de la media para datos no agrupados (vista en la sección de datos discret

_ 1.25 + 1.2 + 1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23 + 1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 + 1.28 + 1.29 + 1.28 + 1
X = ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
30
_ 44.93
X = ------------ = 1.24805556
30

Para la Mediana, como n = 36, es par, utilizaremos la posición p = (36/2) = 18


Por lo que la mediana se encontrará entre los valores que se ubiquen (de manera ordenada) entre las posici
y después también hay 17 valores), se encuentran 1.25 y 1.25, por lo que la mediana sería 1.25.

La moda estaría determinada por observación directa, y corresponderían a los valores 1.24, 1.25 y 1.27
característica según la moda es una muestra trimodal (normalmente se le conoce como multimodal).

El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25

Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que orden
embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los c
tabla:

Medida Valor Calculado Observaciones


Media 1.24805556
Mediana 1.25 Se requirió del ordenamiento de los datos
Moda 1.24,1.25, 1.27 Muestra multimodal
Rango Medio 1.25

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.

Agrupados

Retomando los cálculos realizados en la sección correspondiente a organización y presentación de datos con

Clases Li Ls Mc F fa
I 1.175 1.203 1.189 6 6
II 1.213 1.241 1.227 10 16
III 1.251 1.279 1.265 10 26
IV 1.289 1.317 1.303 9 35
V 1.327 1.355 1.341 1 36

En ella se pueden observar los límites superiores e inferiores de cada clase, lo que indica (de no conocer los
clase pueden ubicarse en cualquier valor del rango, pueden ser por ejemplo 1.17, 1.171, 1.20, 1.202, 1.18, 1.

Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos parametros como el
central, por ello se realizó el cálculo de la Mc (Marca de Clase) que en otras palabras es el rango medio de c
lo establecemos en la siguiente tabla de cálculo para las medidas de tendencia central:

Medida Formula Observaciones


Media Donde Mc se refiere a la marca de clase
de cada clase, n es el número total de
elementos en la muestra y fi se refiere a la
frecuencia de la clase.
Es la posición en donde se encuentra la
mediana.
Mediana p = (n/2) Se ubica en la tabla el primer valor de
frecuencia acumulada mayor a la posición
calculada.
El valor de la mediana se calcula tomando
la formula del 5to. Decil.
Moda Donde Li es el límite inferior de la clase
que tiene la mayor frecuencia.
fm es la frecuencia modal (aquella donde
se encuentra la frecuencia mayor)
f(m -1) es la frecuencia anterior a la
frecuencia modal, en caso de encontrarse
en la primera clase, este valor es cero.
F(m+1) es la frecuencia posterior a la
frecuencia modal, en caso de encontrarse
en la última clase, este valor es cero.
A es la amplitud de la clase modal.
Rango (Valor máximo + Valor Mínimo)
Medio /2

Aplicandolas para calcular la media y complementando la tabla anterior:

Clases Li Ls Mc F fa fc
I 1.175 1.203 1.189 6 6 30 16
II 1.213 1.241 1.227 10 16 20 27
III 1.251 1.279 1.265 10 26 10 27
IV 1.289 1.317 1.303 9 35 1 25
V 1.327 1.355 1.341 1 36 0 2
36

Con fundamento en la tabla podemos entonces obtener:

45.122
Media = ---------------- = 1.253388889
36

Para el cálculo de la mediana, se utiliza la formula del 5to. Decil (puede ser el 50tavo percentil), para e
(36/10)*5 = 3.6 * 5 = 18.

Con este valor recurrimos a la columna de la frecuencia acumulada y observarmos que el primer eleme
aplicando la fórmula obtenemos:

((36/10)*5 – 16) (18 – 16)


Mediana = 1.251 + (----------------------------) * 0.028 = 1.251 + (---------------) * 0.028
10 10

2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 + (0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
10

La moda se encontraría en las clases II y III, son las que mayores frecuencias manifiestan, por lo tant
multimodalida en la muestra, calculemos la primera moda (dejamos como actividad complementaria el cálc

( 10 – 6) 4
Mo = 1.213 + ( -------------------------) 0.028 = 1.213 + (--------) * 0.028 = 1.213 + 0.028
(2* 10 – 6 – 10) 4

Mo = 1.241

El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25

Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que orden
embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los c
tabla:

Medida Valor Calculado Observaciones


Media 1.253388889
Mediana 1.2566 Se requirió del uso de fórmulas del 5to decil, se
pudieron usar las de 50tavo centil.
Moda 1.241 Muestra multimodal, solo se calculó la primera
moda
Rango Medio 1.25

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.

Construyamos una tabla comparativa de resultados de cálculo de estas medidas;

Medida No agrupados Agrupados


Media 1.24805556 1.253388889
Mediana 1.25 1.2566
Moda 1.24,1.25, 1.27 1.241
Rango Medio 1.25 1.25

Puede en esta tabla observarse una diferencia marcada en los valores obtenidos por agrupamiento y no a
última, por observación en el caso de no agrupamiento nos presenta 3 modas, mientras que en el agrup
agrupar datos continuos se tiene una perdida de valores por la aproximación que se tiene al calcular por
medio de la misma.

Después de estos ejercicios que realizamos para la determinación de las medidas de tendencia central, para
agrupados, realicemos los ejercicios de evaluación de esta sección, para ello baja el documento correspondi
de Tendencia Central.pdf) , resuelve los ejercicios (de preferencia en excel o en un software estadí
leonardo.hernandez@gmai.com o sube tus respuestas en los archivos adjuntos de esta página.

Comentarios
Iniciar sesión|Actividad reciente del sitio|Notificar uso inadecuado|Imprimir página|Con

Вам также может понравиться