Академический Документы
Профессиональный Документы
Культура Документы
DESCRIPTIVO
Histograma: Gráfica en la que las clases se indican en el eje horizontal y las frecuencias
en el eje vertical. Las frecuencias de clase se representan por la altura de las barras, y
las barras se trazan adyacentes una a otra.
Medidas descriptivas
Son valores alrededor de que las observaciones tienden a agruparse, y permiten ubicar
lo que en algún sentido pudiera llamarse el “centro” de un conjunto de datos.
La media aritmética
Media poblacional:
x x 1 x 2 x3 x n
fx
N N N
Media muestral: X
x x 1 x 2 x3 x n
fx
n n n
Propiedades de la media
1. Todo conjunto de datos, de intervalo o de razón tiene una media.
2. Para calcular la media se toman todos los valores.
3. Un conjunto de datos solo tiene una media, es decir, la media es única.
4. La media es útil para comparar dos o más poblaciones.
5. La media aritmética es la única medida de posición en la que la suma de las
desviaciones de los valores con respecto a la media siempre será cero. Es decir;
x - x 0
Desventajas de la media aritmética
1. La media se ve afectada en exceso por valores demasiado grandes o demasiado
pequeños.
2. No se puede determinar la media de una distribución de frecuencia en la que hay
clases abiertas.
La mediana
Es la observación central de los valores una vez que éstos han sido ordenados desde el
más pequeño hasta el más grande, o desde el más grande hasta el más pequeño.
Propiedades de la mediana
1. La mediana es única, hay solo una mediana para cada conjunto de datos.
2. La mediana no se ve afectada por valores extremos (ni demasiado grandes, ni
demasiado pequeños), por esto es una valiosa medida de tendencia central cuando
hay presencia de éstos valores.
3. Se puede calcular para distribuciones de frecuencia con una clase abierta, siempre
que la media no se encuentre en una clase abierta.
4. Se puede calcular para datos de nivel ordinal, de intervalo y de razón. Es decir, se
puede terminar para datos de todos los niveles, excepto del nominal.
5. Acumula antes de su valor él %50 de las observaciones, y anti-acumula el %50
restante después de su valor. Es decir;
xmin ; x2 ;...; x j ;...; xn1 ; xmax
n 1
F
Mediana de datos agrupados: Mna Li 2 .w
f
Donde:
Li es el límite inferior del intervalo mediana
f es la frecuencia del intervalo mediana
F es el número de frecuencia acumulada del intervalo anterior al intervalo
mediana
w es la amplitud del intervalo mediana
El modo
Es el valor que se presente con más frecuencia, es decir, el valor con mayor frecuencia.
d1
Modo para datos agrupados: Mo Li w
d1 d 2
Donde:
Li es el límite inferior del intervalo modal
w es la amplitud del intervalo modal
d1 es la diferencia entre la frecuencia del intervalo modal y el anterior
d 2 es la frecuencia entre la frecuencia del intervalo modal y el posterior
Simetría
Media
Mediana
Modo Modo Modo Media
Media
Mediana Mediana
Cuartiles
Los cuartiles o cuartilos son las medidas de posición “no central” que se utilizan con
mayor frecuencia y se emplean sobre todo para resumir o describir las propiedades de
conjuntos grandes de datos numéricos. Son medidas descriptivas que parten los datos
ordenados en cuatro cuartos. Es decir;
xmin ;...; Q1;...; Q2 ;...; Q3 ;...; xmax
Cuartiles de orden:
n 1 n 1 n 1
Q1 Q2 Q3 3
4 2 4
Observación: Para obtener los valores de los cuartiles se utilizan ciertas reglas:
1. Si la posición obtenida es un número entero, se elige como cuartil la observación
numérica especificada en ese lugar.
2. Si la posición obtenida se encuentra justo en medio de dos enteros, se selecciona el
promedio de sus valores correspondiente.
3. Si la posición obtenida no es un número entero o el valor medio entre dos números
enteros, una regla sencilla para aproximar el cuartil específico consiste en
redondear hacia arriba o hacia abajo a la posición entera más cercana y elegir el
valor numérico de ésa posición.
n 1 n 1 n 1
F F 3 F
Q1 Li 4 .w Q2 Li 2 .w Q3 Li 2 .w
f f f
Medidas de dispersión
El rango
Es la medida de dispersión más simple. Es la diferencia entre el valor mayor y el menor.
Es decir; Rango xmax xmin
Desviación media
Es la media aritmética de los valores absolutos de las desviaciones de la media
aritmética.
DM
xx
n
Variancia (o Varianza)
La media aritmética de las desviaciones de la media elevadas al cuadrado.
Variancia poblacional: 2
(x ) 2
x 2
N 2
N N
x x x nx 2
2 2
Variancia muestral: S 2
n 1 n 1
x 2
N 2
N N
x x x nx 2
2 2
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil en un conjunto de datos.
RIQ Q3 Q1
Dispersión relativa
S
Coeficiente de variación poblacional: CV 100
x
Coeficiente de variación muestral: CV 100
Homogeneidad:
Más homogéneo
Menos homogéneo
Simetría:
Distribución
simétrica
Distribución asimétrica
Por izquierda
Distribución asimétrica
Por derecha
Consideraciones importantes