You are on page 1of 15

1.

ASIMETRA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.

Figura 5-1

El Coeficiente de asimetra, se representa mediante la ecuacin matemtica,

Ecuacin 5-9

Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:

(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). (g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media.

Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.

2. CURTOSIS
Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

Figura 5-2

Para calcular el coeficiente de Curtosis se utiliza la ecuacin:

Ecuacion 5-10

Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se interpretan:

(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (g2 > 0) la distribucin es Leptocrtica (g2 < 0) la distribucin es Platicrtica

Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente. La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviacin y despus le restamos a la media dos desviaciones, el 95% de los casos se encontrara dentro del rango que compongan estos valores.

Figura 5-3

Desde luego, los conceptos vistos hasta aqu, son slo una pequea introduccin a las principales medidas de Estadstica Descriptiva; es de gran importancia que los lectores profundicen en estos temas ya que la principal dificultad del paquete SPSS radica en el desconocimiento de los conceptos estadsticos. Las definiciones plasmadas en este captulo han sido extradas de los libros Estadstica para administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadstica y Muestreo escrito por Ciro Martnez editorial Ecoe editores (Octava edicin). No necesariamente tienes que guiarte por estos libros ya que en las libreras encontraras una gran variedad de textos que pueden ser de bastante utilidad en la introduccin a esta ciencia

Hasta ahora se han estudiado los parmetros de centralizacin y de dispersin que son las medidas ms frecuentes que se calculan en cualquier estudio estadstico. Sin embargo existe tambin medidas que indican de la simetra o asimetra de la distribucin y del achatamiento o no de la misma. Empezando con la simetra, es lgico pensar que si la distribucin tiene una nica moda y es simtrica, entonces las tres medidas de centralizacin coinciden. Si no es simtrica, suele suceder que la mediana est comprendida entre la moda y la media. Medidas de simetra o asimetra. Miden la mayor o menor simetra de la distribucin. Existen dos medidas de este tipo: ndice de simetra de Pearson:

ndice de simetra de Fisher:

Si la distribucin es simtrica, ambos ndices son iguales a 0; si es asimtrica a la derecha, ambos son positivos; y si es asimtrica a la izquierda, ambos ndices son negativos. Medidas de curtosis. Miden la mayor o menor concentracin de datos alrededor de la media. Se suele medir con el coeficiente de curtosis:

Si este coeficiente es nulo, la distribucin se dice normal (similar a la distribucin normal de Gauss) y recibe el nombre de mesocrtica. Si el coeficiente es positivo, la distribucin se llama leptocrtica, ms puntiaguda que la anterior. Hay una mayor concentracin de los

datos en torno a la media. Si el coeficiente es negativo, la distribucin se llama platicrtica y hay una menor concentracin de datos en torno a la media. sera ms achatada que la primera. asimetra El tercer momento respecto de la media mide la asimetra de la distribucin, es decir, si existen o no observaciones muy extremas en algn sentido con frecuencias razonablemente altas. Si la asimetra es negativa, la variable toma valores muy bajos con mayor frecuencia que valores muy altos y se dice que tiene una cola izquierda pesada o que es asimtrica hacia la izquierda. Si la asimetra es positiva, la variable toma valores muy altos con mayor frecuencia que valores muy bajos y se dice que tiene una cola derecha pesada o que es asimtrica hacia la derecha. Si la asimetra es cero, los valores bajos y altos de la variable tienen probabilidades iguales (el ejemplo ms tpico de variable simtrica es la variable normal) La asimetra tiene el mismo problema que la varianza y la covarianza en cuanto a sus unidades de medida y, por ello, normalmente se utiliza una medida adimensional de la asimetra que es el coeficiente de asimetra, g1, que se calcula como el cociente entre el tercer momento y el cubo de la desviacin tpica.

k=4

= curtosis

El cuarto momento respecto de la media mide la curtosis de la distribucin, es decir, la forma de la distribucin de probabilidad. Al

representar grficamente variables con curtosis pequea, platicrticas, se observan curvas o histogramas con colas cortas y aspecto aplanado o en meseta; si la variable tiene curtosis grande, es decir, si es leptocrtica, su grfica ser alta y estilizada, con colas largas y pesadas. La curtosis de una variable siempre es positiva y se mide en la unidades de la variable elevadas a potencia 4. Por tanto, nuevamente se nos plantean los problemas relacionados con las unidades de medida y las escalas y necesitamos una medida adimensional de la curtosis. Esta medida adimensional de la curtosis es el coeficiente de curtosis, g2, que se calcula como el cociente entre el cuarto momento y el cuadrado de la varianza, al que se le resta 3 unidades. Esta correccin se debe a que, sin ella, las variables normales tendran coeficiente de curtosis igual a 3; al restar 3 conseguimos que el coeficiente de curtosis de la variable normal sea 0 y que las variables platicrticas tengan coeficiente de curtosis negativo y la leptocrticas positivo, lo cual es ms mnemotcnico que la distincin entre curtosis pequea y grande.

g2 = 0

g2 > 0

g2 < 0

1.

2.

3. 4. 5.

Asimetra y curtosis En los dos temas anteriores hemos visto las medidas de tendencia central y las medidas de variabilidad. Si bien la obtencin de tales medidas es clave para describir una muestra y efectuar inferencias sobre la poblacin de origen, es tambin fundamental saber obtener una caracterizacin adecuada de los datos. Asimetra Si bien es fcil tener una idea de si la distribucin es simtrica o no tras ver la representacin grfica (p.e., un histograma o un diagrama de caja y bigotes), es importante cuantificar la posible asimetra de una distribucin. Recordemos que cuando la distribucin de los datos es simtrica, la media, la mediana y la moda coinciden. (Y la distribucin tiene la misma forma a la izquierda y la derecha del centro) Si bien muchas distribuciones psicolgicas se asume que tienden a ser simtricas y unimodales, en muchos casos la distribucin que encontramos es asimtrica (v.g., las distribuciones de los Tiempos de Reaccin en casi cualquier tarea es asimtrica positivo). Asimetra positiva Moda Mediana Media Asimetra negativa Media Mediana Moda Examen difcil Salarios Tiempos de Reaccin Examen fcil ndices de asimetra 1. ndice de asimetra de Pearson Muy sencillo de calcular. Est basado en la relacin entre la media y la moda en distribuciones simtricas y asimtricas: Si la distribucin es simtrica A s ser 0 Si la distribucin es asimtrica positiva, A s ser mayor que 0 Si la distribucin es asimtrica negativa, A s ser menor que 0 ndices de asimetra 2. ndice de asimetra de Fisher Est basado en la diferencia de los datos sobre la media, como la varianza, si bien esta vez se elevan los coeficientes al cubo Si la distribucin es simtrica A s ser 0 Si la distribucin es asimtrica positiva, A s ser mayor que 0 Si la distribucin es asimtrica negativa, A s ser menor que 0 Desventaja: Muy influida por puntuaciones atpicas (ya lo volveremos a comentar en el ltimo punto de este tema). Curtosis o apuntamiento Hace referencia al apuntamiento de la distribucin en relacin a un estndar, que es la distribucin normal. Este estndar es la distribucin normal: distribucin mesocrtica. Si la distribucin es ms apuntada que la distribucin normal tenemos una distribucin leptocrtica. Si la distribucin es ms achatada que la distribucin normal tenemos una distribucin platicrtica.

6.

7.

8. 9.

Curtosis o apuntamiento IMPORTANTE: Curtosis es independiente de la variabilidad (en el sentido de varianza). Es decir, no es que una distribucin leptocrtica tenga menos varianza y por eso es ms apuntada. Una distribucin leptocrtica es muy apuntada en el centro (ms que la normal), decae muy rpidamente en un primer momento, pero en los extremos es algo ms alta que la distribucin normal. Eso quiere decir que una distribucin leptocrtica es ms probable que ofrezca ms valores extremos que la distribucin normal. 10. Ejemplo de curtosis (dist. Mesocrtica) 11. ndice de curtosis (veremos un solo ndice) Para una distribucin normal (mesocrtica) sabemos que Y esta va a ser la referencia para el ndice de curtosis que vamos a emplear Si la distribucin es normal (mesocrtica), el ndice vale 0 Si la distribucin es leptocrtica, el ndice es superior a 0 Si la distribucin es platicrtica, el ndice es inferior a 0

Definicin
Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o asimetra) que presenta una distribucin de probabilidad de una variable aleatoria sin tener que hacer su representacin grfica. Como eje de simetra consideramos una recta paralela al eje de ordenadas que pasa por la media de la distribucin. Si una distribucin es simtrica, existe el mismo nmero de valores a la derecha que a la izquierda de la media, por tanto, el mismo nmero de desviaciones con signo positivo que con signo negativo. Decimos que hay asimetra positiva (o a la derecha) si la "cola" a la derecha de la media es ms larga que la de la izquierda, es decir, si hay valores ms separados de la media a la derecha. Diremos que hay asimetra negativa (o a la izquierda) si la "cola" a la izquierda de la media es ms

larga que la de la derecha, es decir, si hay valores ms separados de la media a la izquierda.

[editar] Medidas de asimetra


[editar] Coeficiente de asimetra de Fisher
En teora de la probabilidad y estadstica, la medida de asimetra ms utilizada parte del uso del tercer momento estndar. La razn de esto es que nos interesa mantener el signo de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren a la derecha de la media que las de la izquierda. Sin embargo, no es buena idea tomar el momento estndar con respecto a la media de orden 1 (Ya que una simple suma de todas las desviaciones siempre es cero!). Por ello, lo ms sencillo es tomar las desviaciones al cubo. El coeficiente de asimetra de Fisher, representado por 1, se define como:

donde 3 es el tercer momento en torno a la media y es la desviacin estndar. Si 1 = 0, la distribucin es simtrica. Si 1 > 0, la distribucin es asimtrica positiva o a la derecha. Si 1 < 0, la distribucin es asimtrica negativa o a la izquierda.

[editar] Coeficiente de asimetra de Pearson


Slo se puede utilizar en distribuciones uniformes, unimodales y moderadamente asimtricas. Se basa en que en distribuciones simtricas la media de la distribucin es igual a la moda.

Si la distribucin es simtrica, = moda y Ap = 0. Si la distribucin es asimtrica positiva la media se sita por encima de la moda y, por tanto, Ap > 0.

[editar] Coeficiente de asimetra de Bowley


Est basado en la posicin de los cuartiles y la mediana, y utiliza la siguiente expresin:

En una distribucin simtrica el tercer cuartil estar a la misma distancia de la mediana que el primer cuartil. Por tanto AB = 0. Si la distribucin es positiva o a la derecha, AB > 0.

[editar] Utilidad
La asimetra resulta til en muchos campos. Muchos modelos simplistas asumen una distribucin normal, esto es, simtrica en torno a la media. La distribucin normal tiene una asimetra cero. Pero en realidad, los valores no son nunca perfectamente simtricos y la asimetra de la distribucin proporciona una idea sobre si las desviaciones de la media son positivas o negativas. Una asimetra positiva implica que hay ms valores distintos a la derecha de la media. Las medidas de asimetra, sobre todo el coeficiente de asimetra de Fisher, junto con las medidas de apuntamiento o curtosis se utilizan para contrastar si se puede aceptar que una distribucin estadstica sigue la distribucin normal. Esto es necesario para realizar numerosos contrastes estadsticos en la teora de inferencia estadstica.

1) ASIMETRA
Es una medida de forma de una distribucin que permite identificar y describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin. Permite identificar las caractersticas de la distribucin de datos sin necesidad de generar el grfico. 1.1) TIPOS DE ASIMETRA La asimetra presenta las siguientes formas: Asimetra Negativa o a la Izquierda.- Se da cuando en una distribucin la minora de los datos est en la parte izquierda de la media. Este tipo de distribucin presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribucin de los datos tiene a la izquierda una cola ms larga que a la derecha. Tambin se dice que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando el valor de la media aritmtica es menor que la mediana y ste valor de la mediana a su vez es menor que la moda, en smbolos Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se aparta de la simetra. Simtrica.- Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmtica. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana llamada campana de Gauss (matemtico Alemn 1777-1855) o tambin conocida como de Laplace (1749-1827).Tambin se dice que una distribucin es simtrica cuando su media aritmtica, su mediana y su moda son iguales, en smbolos Md=Mo Asimetra Positiva o a la Derecha.- Se da cuando en una distribucin la minora de los datos est en la parte derecha de la media aritmtica. Este tipo de distribucin presenta un alargamiento o sesgo hacia la derecha, es decir, la distribucin de los datos tiene a la derecha una cola ms larga que a la izquierda. Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmtica es mayor que la mediana y ste a valor de la mediana a su vez es mayor que la moda, en smbolos

1.2) MEDIDAS DE ASIMETRA Coeficiente de Karl Pearson

Donde: = media aritmtica. Md = Mediana. s = desviacin tpica o estndar. Nota: El Coeficiente de Pearson vara entre -3 y 3 Si As < 0 ? la distribucin ser asimtrica negativa. Si As = 0 ? la distribucin ser simtrica. Si As > 0 ? la distribucin ser asimtrica positiva. Medida de Yule Bowley o Medida Cuartlica

Donde: = Cuartil uno; Nota: La Medida de Bowley vara entre -1 y 1 Si As < 0 ? la distribucin ser asimtrica negativa. Si As = 0 ? la distribucin ser simtrica. Si As > 0 ? la distribucin ser asimtrica positiva. Medida de Fisher Para datos sin agrupar se emplea la siguiente frmula: = Cuartil dos = Mediana; = Cuartil tres.

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde: = cada uno de los valores; n = nmero de datos; = media aritmtica; f = frecuencia absoluta = cubo de la desviacin estndar poblacional; xm = marca de clase Nota: Si As < 0 ?Indica que existe presencia de la minora de datos en la parte izquierda de la media, aunque en algunos casos no necesariamente indicar que la distribucin sea asimtrica negativa Si As = 0 ? la distribucin ser simtrica Si As > 0 ? Indica que existe presencia de la minora de datos en la parte derecha de la media, aunque en algunos casos no necesariamente indicar que la distribucin sea asimtrica positiva Ejemplo ilustrativo: Calcular el Coeficiente de Pearson, Medida Cuartlica y la Medida de Fisher dada la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17 Solucin: Calculando la media aritmtica se obtiene:

Para calcular los cuartiles se ordena los datos de menor a mayor


6 9 9 12 12 12 15 17

Calculando el cuartil uno se obtiene:

Calculando el cuartil dos se obtiene:

Calculando el cuartil tres se obtiene:

Calculando la desviacin estndar muestral se obtiene:

Calculando el Coeficiente de Pearson se obtiene:

Calculando la Medida de Bowley se obtiene

Calculando la desviacin estndar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene


Datos 6 9 9 12 12 12 15 17 Total -166,375 -15,625 -15,625 0,125 0,125 0,125 42,875 166,375 12

Los clculos en Excel se muestran en la siguiente figura:

Nota: El COEFICIENTE.ASIMETRIA(A2:A9) es un valor que tiene consideraciones semejantes a la Medida de Fisher

2) CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la distribucin normal, es decir, mide cun puntiaguda es una distribucin. 2.1) TIPOS DE CURTOSIS La curtosis determina el grado de concentracin que presentan los valores en la regin central de la distribucin. As puede ser: Leptocrtica.- Existe una gran concentracin. Mesocrtica.- Existe una concentracin normal. Platicrtica.- Existe una baja concentracin.

2.2) MEDIDAS DE CURTOSIS Medida de Fisher Para datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde: = cada uno de los valores; n = nmero de datos; = media aritmtica; desviacin estndar poblacional; f = frecuencia absoluta; xm = marca de clase Nota: Si a < 3 ? la distribucin es platictica Si a = 3 ? la distribucin es normal o mesocrtica Si a > 3 ? la distribucin es leptocrtica Medida basada en Cuartiles y Percentiles

= Cudruplo de la

(letra griega minscula kappa) = Coeficiente percentil de curtosis Nota: Si < 0,263 ? la distribucin es platicrtica Si = 0,263 ? la distribucin es normal o mesocrtica Si > 0,263 ? la distribucin es leptocrtica Esta medida no es muy utilizada. Ejemplo ilustrativo: Determinar qu tipo de curtosis tiene la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis. Solucin: Calculando la media aritmtica se obtiene

Calculando la desviacin estndar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene:


Datos 6 9 9 12 12 12 15 17 Total 915,0625 39,0625 39,0625 0,0625 0,0625 0,0625 150,0625 915,0625 2058,5

Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6 9 9 12 12 12 15 17

Calculando el cuartil uno se obtiene:

Calculando el cuartil tres se obtiene:

Calculando el percentil 90 se tiene:

Calculando el percentil 10 se tiene:

Calculando el coeficiente percentil de curtosis se obtiene:

Como a= 2,23 y

la distribucin es platicrtica

Los clculos en Excel se muestran en la siguiente figura: