Вы находитесь на странице: 1из 6

ARMANDO SOTELO UBALDO

IT-301
PROBABILIDAD T ESTADISTICA
Medidas de dispersión
Medidas de dispersión. Medidas de dispersión
Parámetros estadísticos que
indican como se alejan los
datos respecto de la media
Concepto: Parámetros estadísticos que permiten
aritmética. Sirven como
conocer la dispersión de los datos.
indicador de la variabilidad de
los datos. Las medidas de
dispersión más utilizadas son el rango, la desviación estándar y la varianza.
Contenido
 1 Rango
 2 Desviación media
 3 Desviación estándar
 4 Varianza
 5 Coeficiente de Variación
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la diferencia
entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x(1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a
la media.

Donde:
xi: valores de la variable.
n: número total de datos
Desviación estándar
La desviación estándar mide el grado de disersión de los datos con respecto a la media, se
denota como s para una muestra o como σ para la población. Se define como la raíz
cuadrada de la varianza según la expresión:
ARMANDO SOTELO UBALDO
IT-301
PROBABILIDAD T ESTADISTICA
Error al crear miniatura: Falta archivo
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se divide
entre n; también existe la fórmula de desviación típica donde el denominador es n pero se
prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe
menor dispersión, el incremento de los valores de la desviación estándar indica una mayor
variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto
a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones
respecto a la media. Su expresión matemática es:

donde Xi es el dato i-ésimo y es la media de los N datos.


Coeficiente de Variación
Permite determinar la razón existente entre la desviación estándar (s) y la media. Se denota
como CV. El coeficiente de variación permite decidir con mayor claridad sobre la dispersión
de los datos.
También puede ser expresado en por ciento.

Distribución de frecuencias
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma
de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valoren un
estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se
representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que
se lee suma o sumatoria.
ARMANDO SOTELO UBALDO
IT-301
PROBABILIDAD T ESTADISTICA

Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado
valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.


Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31,
30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la
segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.

xi Recuento fi Fi ni Ni

27 I 1 1 0.032 0.032

28 II 2 3 0.065 0.097

29 6 9 0.194 0.290

30 7 16 0.226 0.516

31 8 24 0.258 0.774
ARMANDO SOTELO UBALDO
IT-301
PROBABILIDAD T ESTADISTICA
32 III 3 27 0.097 0.871

33 III 3 30 0.097 0.968

34 I 1 31 0.032 1

31 1

Este tipo de tablas de frecuencias se utiliza con variables discretas.


Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma
amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a
todo el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
ARMANDO SOTELO UBALDO
IT-301
PROBABILIDAD T ESTADISTICA
ci fi Fi ni Ni

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.275

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

40 1

Medidas de posición no central ( Cuantiles )


Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,
dividen a la distribución en partes, de tal manera que cada una de ellas contiene el mismo
número de frecuencias.
Los cuantiles más conocidos son:
 a) Cuartiles ( Qi ) Son valores de la variable que dividen a la distribución en 4 partes,
cada una de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente
forma: Q1 es el primer cuartil que deja a su izquierda el 25 % de los datos; Q2 es el
segundo cuartil que deja a su izquierda el 50% de los datos, y Q3 es el tercer cuartil
que deja a su izquierda el 75% de los datos. (Q2 = Me)
 b) Deciles ( Di) Son los valores de la variable que dividen a la distribución en las
partes iguales, cada una de las cuales engloba el 10 % de los datos. En total habrá
9 deciles. (Q2 = D5 = Me )
 c) Centiles o Percentiles ( Pi ) Son los valores que dividen a la distribución en 100
partes iguales, cada una de las cuales engloba el 1 % de las observaciones. En total
habrá 99 percentiles. (Q2 = D5 = Me = P50)
 Cálculo de los cuantiles en distribuciones no agrupadas en intervalos
ARMANDO SOTELO UBALDO
IT-301
PROBABILIDAD T ESTADISTICA
o Se calculan a través de la siguiente expresión: q rN , siendo : r = el orden del
cuantil correspondiente q = el número de intervalos con iguales frecuencias
u observaciones ( q = 4, 10, ó 100 ). N = número total de observaciones
o La anterior expresión nos indica que valor de la variable estudiada es el
cuantil que nos piden, que se corresponderá con el primer valor cuya
frecuencia acumulada sea mayor o igual a q rN Ejemplo: DISTRIBUCIONES
NO AGRUPADAS: En la siguiente distribución (ver tabla en formato doc).
 Calcular la mediana (Me); el primer y tercer cuartil (C1,C3); el 4º decil (D4) y el 90
percentil (P90) Mediana (Me) (VER TABLA EN FORMATO DOC).
o Primer cuartil (C1)
o Cuarto decil (D4) Nonagésimo percentil
o (P90) Nonagésimo percentil (P90)
 Cálculo de los cuantiles en distribuciones agrupadas en intervalos
o Este cálculo se resuelve de manera idéntica al de la mediana
o El intervalo donde se encuentra el cuantil i-esimo, es el primero que una vez
ordenados los datos de menor a mayor, tenga como frecuencia acumulada
( Ni ) un valor superior o igual a q rN.
o

REFERENCIAS
1. https://www.ditutor.com/estadistica/medidas_dispersion.html

2. https://www.ecured.cu/Medidas_de_dispersi%C3%B3n

3. https://www.vitutor.com/estadistica/descriptiva/a_3.html

4. http://www.eumed.net/cursecon/libreria/drm/1d.htm

Вам также может понравиться