Вы находитесь на странице: 1из 12

MEDIDAS DE DEFORMACION DE LA CURVA

Las medidas de distribucin nos permiten identificar la forma en que se separan


o aglomeran los valores de acuerdo a su representacin grfica. Estas medidas
describen la manera como los datos tienden a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la informacin. Su utilidad radica en la
posibilidad de identificar las caractersticas de la distribucin sin necesidad de
generar el grfico. Sus principales medidas son la Asimetra y la Curtosis.
La asimetra y curtosis informan sobre la forma de la distribucin de una variable.
Estas medidas permiten saber las caractersticas de su asimetra y
homogeneidad sin necesidad de representarlos grficamente.
DEFINICION
Medidas de asimetra
Si la representacin grfica de un conjunto de valores es perfectamente
simtrica, coincidirn los valores de la media, la mediana y la moda (Monroy,
2008).
Una grfica de este estilo quedara de la siguiente forma:

Conforme la distribucin se aleja de la simetra los tres valores se alejarn entre


s, siendo la diferencia mayor la que se encuentra entre la media y la moda
(vase grficas a y b)

La asimetra es positiva o hacia la derecha, si la media es mayor a la mediana


(grfica a), y es negativa o hacia la izquierda si la mediana es mayor a la media
(grfica b). La forma para calcular la asimetra que ms se utiliza es el coeficiente
de asimetra, definido como: a3, que tambin se define como el tercer momento
con respecto a la media y se encuentra definida por la siguiente frmula para
cada tipo de serie:

Esta medida de la asimetra es un nmero relativo y, por lo tanto, puede utilizarse


con fines de comparacin. Para calcular a3, se obtiene primero la suma del cubo
de las diferencias con respecto a la media, luego se divide el resultado entre el
nmero de observaciones y el resultado que se obtiene se divide entre el cubo
de la desviacin estndar.
Los posibles resultados se interpretan de la siguiente forma: para una
distribucin simtrica, a3, es igual a cero. Los valores positivos de a3, indican
que la asimetra de la distribucin es positiva, en otras palabras, la distribucin
tiene un largo extremo (o cola), hacia la derecha. Los valores negativos de a3,
indican que la distribucin tiene una larga cola hacia la izquierda. Entre mayor
sea el valor de a3, mayor ser la asimetra de la muestra. Podemos resumir los
posibles resultados en el siguiente diagrama:

Ahora veamos un ejemplo para ver cmo se obtiene el coeficiente de asimetra


a partir de los siguientes datos de las edades de treinta personas elegidas al
azar.
La asimetra es la medida que indica la simetra de la distribucin de una variable
respecto a la media aritmtica, sin necesidad de hacer la representacin grfica.
Los coeficientes de asimetra indican si hay el mismo nmero de elementos a
izquierda y derecha de la media.
Existen tres tipos de curva de distribucin segn su asimetra:
Asimetra negativa: la cola de la distribucin se alarga para valores
inferiores a la media.
Simtrica: hay el mismo nmero de elementos a izquierda y derecha de la
media. En este caso, coinciden la media, la mediana y la moda. La distribucin
se adapta a la forma de la campana de Gauss, o distribucin normal.
Asimetra positiva: la cola de la distribucin se alarga para valores
superiores a la media.
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme
alrededor del punto central (Media aritmtica). La asimetra presenta tres
estados diferentes, cada uno de los cuales define de forma concisa como estn
distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es
positiva cuando la mayora de los datos se encuentran por encima del valor de
la media aritmtica, la curva es Simtrica cuando se distribuyen
aproximadamente la misma cantidad de valores en ambos lados de la media y
se conoce como asimetra negativa cuando la mayor cantidad de datos se
aglomeran en los valores menores que la media.

Figura. El Coeficiente de asimetra, se representa mediante la ecuacin


matemtica,

Ecuacin
Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los
valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los
resultados de esta ecuacin se interpretan:
(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media. Este
valor es difcil de conseguir por lo que se tiende a tomar los valores que son
cercanos ya sean positivos o negativos ( 0.5).
(g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden
a reunir ms en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden
a reunir ms en la parte derecha de la media.
Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la
distancia que separa la aglomeracin de los valores con respecto a la media.
Figura. Diagrama de puntos de los pesos correspondientes a los percentiles 3,
10, 25, 50, 75, 90 y 97 de las mujeres de 16 aos.

En la figura 19.4 se aprecia la mayor concentracin de los valores ms chicos,


por debajo de la mediana, en comparacin con los valores ms grandes. Por lo
tanto el peso es una variable no simtrica, con leve asimetra hacia la derecha.
(Kelmansky, 2015)

Grficas de caja.
Se ordenan las observaciones de la ms pequea a la ms grande y se separa
la mitad ms pequea de la ms grande; se incluye la mediana ~x en ambas
mitades si n es impar.
En tal caso el cuarto inferior es la mediana de la mitad ms pequea y el cuarto
superior es la mediana de la mitad ms grande. Una medida de dispersin que
es resistente a los valores apartados es la dispersin de los cuartos fs, dada por
fs = cuarto superior cuarto inferior
En general, la dispersin de los cuartos no se ve afectada por las posiciones de
las observaciones comprendidas en el 25% ms pequeo o el 25% ms grande
de los datos. Por consiguiente es resistente a valores apartados.
La grfica de caja ms simple se basa en el siguiente resumen de cinco nmeros:
xi ms pequeas cuarto inferior mediana cuarto superior xi ms grandes

Primero, se traza una escala de medicin horizontal. Luego se coloca un


rectngulo sobre este eje; el lado izquierdo del rectngulo est en el cuarto
inferior y el derecho en el cuarto superior (por lo que el ancho de la caja = fs.).
Se coloca un segmento de lnea vertical o algn otro smbolo dentro del
rectngulo en la ubicacin de la mediana; la posicin del smbolo de mediana
con respecto a los dos lados da informacin sobre asimetra en el 50% medio de
los datos. Por ltimo, se trazan bigotes hacia fuera de ambos extremos del
rectngulo hacia las observaciones ms pequeas y ms grandes. Tambin se
puede trazar una grfica de caja con orientacin vertical mediante
modificaciones obvias en el proceso de construccin. (Edici, 2008)
MEDIDAS DE ASIMETRIA.
Hasta ahora se han estudiado los parmetros de centralizacin y de dispersin
que son las medidas ms frecuentes que se calculan en cualquier estudio
estadstico.
Sin embargo existe tambin medidas que indican de la simetra o asimetra de la
distribucin y del achatamiento o no de la misma.
Empezando con la simetra, es lgico pensar que si la distribucin tiene una
nica moda y es simtrica, entonces las tres medidas de centralizacin
coinciden. Si no es simtrica, suele suceder que la mediana est comprendida
entre la moda y la media.
Medidas de simetra o asimetra. Miden la mayor o menor simetra de la
distribucin. Existen dos medidas de este tipo:
ndice de simetra de Pearson:

Coeficiente de asimetra de Fisher.


El coeficiente de asimetra de Fisher CAF evala la proximidad de los datos a su
media x. Cuanto mayor sea la suma (xix)3, mayor ser la asimetra. Sea el
conjunto X=(x1, x2,, xN), entonces la frmula de la asimetra de Fisher es:

Si CAF<0: la distribucin tiene una asimetra negativa y se alarga a


valores menores que la media.
Si CAF=0: la distribucin es simtrica.
Si CAF>0: la distribucin tiene una asimetra positiva y se alarga a valores
mayores que la media.
Existen tres coeficientes de asimetra:
Coeficiente de asimetra de Pearson
El coeficiente de asimetra de Pearson CAP mide la diferencia entre la mediay la
moda respecto a la dispersin del conjunto X=(x1, x2,, xN).
Este procedimiento, menos usado, lo emplearemos solamente en distribuciones
unimodales y poco asimtricas.

Si CAP<0: la distribucin tiene una asimetra negativa, puesto que la


mediaes menor que la moda.
Si CAP=0: la distribucin es simtrica.
Si CAP>0: la distribucin tiene una asimetra positiva, ya que la media es
mayor que la moda.
Coeficiente de asimetra de Bowley
El coeficiente de asimetra de Bowley CAB toma como referencia los
cuartilespara determinar si la distribucin es simtrica o no. Para aplicar este
coeficiente, se supone que el comportamiento de la distribucin en los extremos
es similar. Sea el conjunto X=(x1, x2,, xN), la asimetra de Bowley es:

Esta frmula viene de:

Recordemos que la mediana (Me) es lo mismo que el segundo cuartil (Q2).


Si CAB<0: la distribucin tiene una asimetra negativa, puesto que la
distancia de la mediana al primer cuartil es menor que al tercero.
Si CAB=0: la distribucin es simtrica, ya que el primer y tercer cuartil
estn a la misma distancia de la mediana.
Si CAB>0: la distribucin tiene una asimetra positiva, ya que la distancia
de la mediana al tercer cuartil es mayor que al primero.
Medidas de curtosis (una medida de las puntas)
Dos distribuciones pueden tener la misma media, la misma desviacin estndar
y ser perfectamente simtricas, pero siguen siendo diferentes si una es
"puntiaguda" y la otra "achatada". Las distribuciones puntiagudas y con extremos
relativamente anchos reciben el nombre de leptocrticas, en tanto que las que
tienden a ser chatas y con colas relativamente estrechadas se llaman
platocrticas(Monroy, 2008). Estas distribuciones, grficamente, tienen la
siguiente forma:
La curtosis (o apuntamiento) es una medida de forma que mide cun escarpada
o achatada est una curva o distribucin.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de
manera que a mayor grado de curtosis, ms escarpada (o apuntada) ser la
forma de la curva.

La manera formal para determinar la altura de una distribucin es calculando el


coeficiente de curtosis definido como a4 (alfa cuatro), que tambin se precisa
como el cuarto momento con respecto a la media, definido por la siguiente
frmula para cada tipo de serie:
Donde: S4 = Elevar a la cuarta potencia la desviacin estndar X - Media
aritmtica Y, = Valor de la marca de clase o punto medio de la clase.
Esta medida de la altura no depende de la ubicacin o varianza de la distribucin
y, por tanto, puede utilizarse con propsitos comparativos. La altura de la
distribucin "normal" es empleada comnmente como el estndar de la altura
que debe tener una distribucin. Para una distribucin normal, el valor del
coeficiente de a4 = 3. Si en otras pruebas el valor del coeficiente de curtosis es
mayor que 3, la distribucin es leptocrtica (en punta), mientras que si es menor
que 3, es platocrtica (achatada) (Monroy, 2008).

Figura 1. Momentos con respecto a la media

Fuente: (Monroy, 2008).


La curtosis se mide promediando la cuarta potencia de la diferencia entre cada
elemento del conjunto y la media, dividido entre la desviacin tpica elevada
tambin a la cuarta potencia. Sea el conjunto X=(x1, x2,, xN), entonces el
coeficiente de curtosis ser:

Esta medida determina el grado de concentracin que presentan los valores en


la regin central de la distribucin. Por medio del Coeficiente de Curtosis,
podemos identificar si existe una gran concentracin de valores (Leptocrtica),
una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

Figura. Para calcular el coeficiente de Curtosis se utiliza la ecuacin:

Ecuacion.
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, (
) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta
frmula se interpretan:
(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante
difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen
aceptar los valores cercanos ( 0.5 aprox.).
(g2 > 0) la distribucin es Leptocrtica
(g2 < 0) la distribucin es Platicrtica
Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 =
0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal.
Este criterio es de suma importancia ya que para la mayora de los
procedimientos de la estadstica de inferencia se requiere que los datos se
distribuyan normalmente.
Las definiciones plasmadas en este captulo han sido extradas de los libros
Estadstica para administradores escrito por Alan Wester de la editorial McGraw-
Hill y el libro Estadstica y Muestreo escrito por Ciro Martnez editorial Ecoe
editores (Octava edicin). No necesariamente tienes que guiarte por estos libros
ya que en las libreras encontraras una gran variedad de textos que pueden ser
de bastante utilidad en la introduccin a esta ciencia.

FORMULA
PROPIEDADES
VENTAJAS
DESVENTAJAS

DESVENTAJAS DE CURTIOSIS.

La principal ventaja de la distribucin normal radica en el supuesto que el 95%


de los valores se encuentra dentro de una distancia de dos desviaciones
estndar de la media aritmtica (Fig.5-3); es decir, si tomamos la media y le
sumamos dos veces la desviacin y despus le restamos a la media dos
desviaciones, el 95% de los casos se encontrara dentro del rango que
compongan estos valores.

Figura 5-3

Desde luego, los conceptos vistos hasta aqu, son slo una
pequea introduccin a las principales medidas de Estadstica Descriptiva; es
de gran importancia que los lectores profundicen en estos temas ya que
la principal dificultad del paquete SPSS radica en el desconocimiento de los
conceptos estadsticos. (Wester, 1989)
APLICABILIDAD

REFERENCIAS BIBLIOGRFICAS.
BENALCZAR, Marco, (2002), Unidades para Producir Medios Instruccionales
en Educacin, SUREZ, Mario Ed. Graficolor, Ibarra, Ecuador.
DAZA, Jorge, (2006), Estadstica Aplicada con Microsoft Excel, Grupo Editorial
Megabyte,
Lima, Per.
SUREZ, Mario, (2004), Interaprendizaje Holstico de Matemtica, Ed. Grficas
Planeta,
Ibarra, Ecuador.
SUREZ, Mario, (2011), Interaprendizaje de Estadstica Bsica
TAPIA, Fausto Ibarra, Ecuador.

Edici, P. (2008). Probabilidad y Estadistica para Ingenieria y Ciencias (Septima


Ed). Mexico: Learning.
Kelmansky, D. (2015). Estadistica para todos. PhD Proposal (Vol. 1).
https://doi.org/10.1017/CBO9781107415324.004
Monroy, S. (2008). Estadistica Descriptiva. (I. P. N. Luis, Ed.) (Primera Ed).
Mexico.

Вам также может понравиться