Вы находитесь на странице: 1из 27

Universidad Católica de Norte

Estadística Descriptiva
¿Cómo resumir información numérica?

Alberto Mejía
04 de octubre, 2017
1. Formas de una distribución
• La asimetría y curtósis informan
sobre la forma de la distribución de
una variable.
• Estas medidas permiten saber las
características de su asimetría y
homogeneidad sin necesidad
de representarlos gráficamente.
1. Formas de una distribución
• Describe la forma en que la información está distribuida.

• Simétrica o Insesgada. (Tercer momento).


1.1 Coeficiente de asimetría de Fisher
• Datos sin Agrupar:

• Datos Agrupados:

• Si ASF = 0, la distribución es simétrica.

• Si ASF > 0, la distribución es asimétrica positiva; valores más separados de


la media a la derecha.
• Si ASF < 0, es asimétrica negativa, más separados de la media a la
izquierda.
1.2 Medidas de apuntalamiento o Curtósis.
(4º momento).
• Estudian la distribución de frecuencias en la zona central de la misma.

• La mayor o menor concentración de frecuencias alrededor de la


media, resulta en un distribución mas o menos apuntada.

• La curtósis se aplica a distribuciones campaniformes; o sea


unimodales simétricas o ligera asimetría.
1.2 Medidas de apuntalamiento o Curtósis.
(4º momento).
• Existen 3 tipos de distribución según su grado de curtósis:
1) Mesocúrtica: grado de concentración medio alrededor de los
valores centrales de la variable (como una normal).

2) Leptocúrtica: presenta elevado grado de concentración, alrededor


de los valores centrales de la variable.

3) Platicúrtica: reducido grado de concentración alrededor de los


valores centrales de la variable.
1.2 Medidas de apuntalamiento, gráficamente.
1.3 Coeficiente de curtósis
1.4 Media geométrica
• Se usa como una medida de tasa de cambio de una variable.

• Se utiliza para medir una inversión en el tiempo.

• Podría ser el promedio de una variación.


Ejemplo
• Una inversión en la bolsa de valores de $ 100,000 se elevó a 150,000
al finalizar el año y se incrementó en $ 180,000 al finalizar el año 2.
Ejemplo
• Utilizando una medida de los retornos del 1 año para obtener la
media y media geométrica.
1.5 Percentiles y Cuartiles
• Indican la posición de un valor relativo en el set de datos.

• Se usa para describir un gran conjunto de datos.

• Ejemplo: Un puntaje del Coeficiente intelectual (CI) en el percentil 90,


significa que el 10% de la población tiene un puntaje mayor de CI y el
90% tiene un puntaje CI menor.
1.5.1 Cuartiles
• Divide los datos rankeados (ordenados) en 4 segmentos con un número
igual de valores por segmento (no necesariamente del mismo tamaño).

25% 25% 25% 25%

Q1 Q2 Q3
Cada uno de ellos representa un cuartil, simbólicamente sería:
• Q1, es el valor en el que 25% de las observaciones son menores y 75%
son mayores.
• Q2: es la mediana (50% son pequeños y 50% grandes).
• Q3: Sólo el 25% de las observaciones son más grandes que el 3er
cuantil.
1.5.1 Cuartiles
• Se desea encontrar el cuartil de un valor determinado en una posición
apropiada en datos ordenados donde:

• Primer cuartil: Q1 = 0.25(n + 1)


• Segundo cuartil: Q2 = 0.50(n + 1)
• Tercer cuartil: Q3 = 0.75(n + 1)

n es el número de valores observados.


1.5.1 Cuartiles
• Ejemplo: Encontrar el primer cuartil.

La muestra de datos ordenados es la siguiente:


11 12 13 16 16 17 18 21 21, n = 9

Q1 = está en la 0.25(9 + 1) = 2.5 posición de los datos ordenados, el valor


medio entre el 2º y 3er valor.

Entonces: Q1 = 12,5
1.6 Resumen de las 5 números o descriptivos.
• Mínimo
• Primer cuartil
• Mediana
• Tercer cuartil
• Máximo

Mínimo < Q1 < Mediana < Q3 < Máximo.


2. Medidas de Variabilidad-Dispersión
2.1 Rango
• Medida de variación simple
• Diferencia entre las observaciones más grande y mas pequeña.
2.1.1 Desventajas del rango
• Ignora la distribución de los datos
2.2 Varianza Poblacional
• Promedio de las desviaciones al cuadrado de los valores respecto a la
media.
2.3 Varianza Muestral
• Promedio de las desviaciones al cuadrado de los valores con respecto
a la media.
2.4 Desviación Estándar Poblacional
• Más utilizada para medir variabilidad.
• Muestra las variaciones respecto a la media.

• Tiene las mismas unidades de los datos originales.


• Sí tiene interpretación.
2.5 Desviación Estándar Muestral
• Más utilizada para medir variabilidad.
• Variaciones, respecto a la media.

• Tiene las mismas unidades como los datos originales.


2.6 Rango Intercuartílico
• Puede servir para eliminar el problema de los datos atípicos.

• Elimina los valores más altos y más bajos (outliers extremos) y calcula
el rango del 50% de los datos.
2.7 Gráfico de caja y bigote
• Describe la forma de una distribución.

• Se crea desde el resumen de 5 estadísticos; valor mínimo, Q1, Mediana, Q3


y el máximo.

• Las cajas internas muestran el rango de Q1 a Q3 y una línea muestra la


mediana.

• Dos bigotes se extienden desde la caja.

• Un bigote es una línea desde el Q1, al valor mínimo, el otro es la línea


desde Q3 al valor máximo.
2.7.1 Box plot-Rango intercuartílico
Bibliografía
• Newbold, P., W. L. Carlson y B. Thorne (2008): Estadística para
administración y economía. 6ta edición. Madrid, Pearson Prentice
Hall.

• Webster, A. (2000): Estadística aplicada a los negocios y a la


economía, Madrid, McGraw Hill.

Вам также может понравиться