You are on page 1of 11

MEDIDAS DE CENTRAMIENTOS

Al describir grupos de observaciones, con frecuencia es conveniente resumir la


informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el
centro de la distribucin de datos se denomina medida o parmetro de tendencia central o
de centralizacin.
Que sirve para determinar valores centrales o medios de la distribucin.
MEDIDAS DE DISPERSIN
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la
variabilidad de una distribucin, indicando por medio de un nmero si las diferentes
puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese
valor, mayor ser la variabilidad, y cuanto menor sea, ms homognea ser a la media.
As se sabe si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la
media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la
suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias
para salvar este problema. Una es tomando las desviaciones en valor absoluto
(desviacin media) y otra es tomando las desviaciones al cuadrado (varianza).
Medidas de forma
Son medidas que determinan numricamente algunas caractersticas de la forma en que
estan distribuidos los datos. Entre estas medidas se tiene: el coeficiente de asimetra o o
coeficiente de sesgo y el coeficiente de curtosis.
Coeficiente de asimetra
Con frecuencia una distribucin no es simtrica alrededor de ningn valor, pero en lugar
de ello se tiene que los datos estan ms aglomerados o distribuidos hacia los extremos. Si
hay pocos datos distribuidos hacia el extremo derecho se dice que la distribucin
es sesgada a la derecha, mientras que si hay pocos datos distribuidos hacia la
izquierda , se dice que la distribucin es sesgada hacia la izquierda. Las medidas que
describen esta asimetra se denominan coeficiente de sesgo, o simplemento sesgo.
Una de dichas medidas es

donde
es un valor de la variable de estudio

es el valor de la media poblacional de la variable de estudio.


es el total de datos en la poblacional.
La medida

ser positiva o negativa si la distribucin es sesgada a la derecha o a la

izquierda, repectivamente. Para una distribucin simtrica,

Diagrama de Caja y Bigotes


Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin
visual que describe varias caractersticas importantes, al mismo tiempo, tales como la
dispersin y simetra.
Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de
los datos, sobre un rectngulo, alineado horizontal o verticalmente.

Construccin:

Comparar distribuciones

Diagrama de Caja a travs de Excel

Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos
muestran elrecorrido intercuartlico. Este rectngulo est dividido por un segmento
vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los
cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes.
Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier dato o caso
que no se encuentre dentro de este rango es marcado e identificado individualmente
EJEMPLO DISTRIBUCIN DE EDADES
Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la
edad de un colectivo de 20 personas.
36

25

37

24

39

39 24 29 23 41 40 33 24 34 40

20

36

45

31

31

ORDENAR LOS DATOS


Para calcular los parmetros estadstico, lo primero es ordenar la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como
N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el
siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la
variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la
mediana es la media aritmtica de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin.
En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de


La
primera
parte
de
la
caja
La
segunda
parte
de
la
caja
El bigote de la derecha viene dado por (Q3, Xmx).

edades ( Xmn,
a (Q1,
a (Q2,

Q1)
Q2),
Q 3)

INFORMACIN DEL DIAGRAMA


Podemos obtener abundante informacin de una distribucin a partir de estas
representaciones.
Veamos
alguna:

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que
las edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa
que entre el 50% y el 75%.

El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el


25% de los ms jvenes estn ms concentrados que el 25% de los mayores.

El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est


comprendido en 14,5 aos.

Seguro que t podrs obtener ms informacin (Utiliza la mediana!)


Comparar distribuciones
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o ms conjuntos de
datos.

Comparacin distribucin de edades

Comparacin entrenamientos de un corredor

Comparacin clasificacin liga

COMPARACIN DISTRIBUCIN DE EDADES


Anlogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante
estos diagramas, esta distribucin con la del otro ejemplo de distribucin de edades.
35

38

32

28

30

29

27

19

48

40

39 24 24 34 26 41 29 48 28 22

A partir de dicha comparacin puede obtenerse bastante informacin de ambas


distribuciones.
COMPARACIN ENTRENAMIENTOS DE UN CORREDOR

Un corredor entrena para una determinada carrera y se toman los tiempos que necesita
para recorrer los 200 m, durante 10 das consecutivos (cada da se toman varios tiempos
y se calculan mediana, cuartiles, valores mnimo y mximo)

Observamos que el desplazamiento de las grficas de caja hacia la izquierda indica que el
entrenamiento ha dado resultado, ya que se tardan menos segundos en recorrer la misma
distancia, siendo la diferencia entre el mximo y el mnimo menor, como as tambin la
diferencia intercuartlica.

COMPARACIN CLASIFICACIN LIGA


Las puntuacin de los equipos de la liga de futbol BBVA de las temporadas 10/110 y 11/12
se pueden comparar con un diagrama caja y bigotes, como aparece aqu,

Comparacin de tres ligas europeas de futbol de la temporada 11/12

La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado
entre el nmero total dedatos.
es el smbolo de la media aritmtica.

Ejemplo:
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Mediana
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados
de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar slo para variables cuantitativas.
Clculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin
central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5
3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me = 9.5
Moda
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.


Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5 Mo = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa
frecuencia es la mxima, ladistribucin es bimodal o multimodal, es decir, tiene varias
modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia
el promedio de las dos puntuaciones adyacentes.

mxima,

la moda es

0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Varianza
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la
media de una distribucin estadstica.
La varianza se representa por

Calcular la varianza de la distribucin:


9, 3, 8, 8, 9, 8, 9, 18

Rango (estadstica)

La diferencia entre el menor y el mayor


valor.
En {4, 6, 9, 3, 7} el menor valor es 3, y el
mayor es 9, entonces el rango es 9-3 igual a
6.
Rango puede significar tambin todos los
valores de resultado de una funcin.

Coeficiente de variacin
La asistencia de espectadores a las 4 salas de un cine un determinado da fue
de 200, 500, 300 y 1000 personas.
1. Calcular la dispersin del nmero de asistentes.
2. Calcular el coeficiente de variacin.
3. Si el da del espectador acuden 50 personas ms a cada sala, qu efecto
tendra sobre la dispersin?
Desviacin tpica

Coeficiente de variacin

Si todas las salas tienen un incremento de 50 personas, la media


aritmtica tambin se ve incrementada en50 personas.
La desviacin tpica no vara, ya que sumamos la misma cantidad a cada
dato de la serie.

Cmo calcular la curtosis y el sesgo


Cuando tienes una variable continua (como la edad, altura, peso o ndice de
inteligencia) recogida en una muestra, hay varias maneras de describir la
distribucin. Una distribucin es simplemente un trmino estadstico para
saber qu tan comunes son varias posibilidades. La media o promedio es una
medida de tendencia central, la desviacin estndar es una medida de
propagacin. Pero tambin hay medidas de forma. El sesgo mide si la cola de la
distribucin es ms larga hacia la derecha o la izquierda. Los ingresos, por
ejemplo, es un sesgo hacia la derecha, ya que tiene una cola derecha larga. La
curtosis es una medida de apuntamiento de la distribucin. Por ejemplo, la
distribucin uniforme es muy platicrtica (plana).
Paso 1
Introduce los datos. En Excel, introduce cada valor en una celda en la columna
A.
Paso 2
Ve a una celda vaca. Haz clic en Frmulas, luego en Ms funciones y, a
continuacin, Estadsticas, y por ltimo en Curtosis. En el primer cuadro,
selecciona las celdas que contienen tus datos y luego presiona "Enter". Esta es
la curtosis.
Paso 3
Ve a una celda vaca. Haz clic en Frmulas, luego en Ms funciones, luego en
Estadsticas y por ltimo en Sesgo. En el primer cuadro, selecciona las celdas
que contienen tus datos y luego presiona "Enter". Este es el sesgo.
Consejos y advertencias
o

Un sesgo de ms de 0 indica que el sesgo est hacia la derecha o una


cola ms larga hacia la derecha. El sesgo de menos de 0 indica un sesgo
hacia la izquierda o una cola ms larga hacia la izquierda.

Una curtosis menor que 0 indica playcurtosis (distribucin plana), una


curtosis de ms de 0 indica leptocurtosis (distribucin alcanzada en su
punto mximo).

La curtosis en Excel es en realidad curtosis - 3. Esto se hace en Excel (y


en algunos otros programas) de manera que una distribucin normal (la
curva en forma de campana) tendr curtosis de 0.