Вы находитесь на странице: 1из 59

MEDIDAS DE DISPERSIÓN O

VARIABILIDAD

A B
MEDIDAS DE DISPERSIÓN

Miden qué tanto se dispersan las observaciones alrededor de su media.


Medidas de dispersión

Medidas de dispersión absolutas


Desviación media
Varianza, Desviación típica o estándar
Tipificación
Medidas de dispersión relativas
Dispersión

Varianza Desviación Estándar Coeficiente de


Variación
Alcance Varianza de Desviación
la Población Estándar de
la Población
Varianza de la
Muestra Desviación
Estándar de
Alcance Intercuartil la Muestra

Diapositiva 4
¿Es la media representativa?

Queremos cuantificar la separación de los


valores de la distribución respecto a la media.
Si todos los valores están cercanos al valor
medio, la media es representativa.
Medidas de dispersión absolutas
Rango

• Recorrido: Re  máx xi  mín xi

- la diferencia entre el mayor y el menor valor.

- Nota: ¡Muy sensible a valores extremos!


Alcance

• Diferencia entre la mayor y la menor de las


observaciones
Alcance = xmayor – xmenor

• No toma en cuenta la forma en que están


distribuidos los datos.

Alcance: 12 - 7 = 5 Alcance: 12 - 7 = 5

7 8 9 10 11 12 7 8 9 10 11 12

Diapositiva 7
Medidas de dispersión absolutas

• Recorrido intercuartílico: RI  Q3  Q1

- la diferencia entre el tercer cuartíl y el


primero.
- 50% de los valores centrales están incluidos en
RI
Cuartiles
• Los datos se ordenan de menor a mayor.

25% 25% 25% 25%

 Q1   Q2  Q3 
Observación Observación
Menor Mayor

• El alcance intercuartil es la distancia entre el tercer cuartil


Q3 y el primer cuartil Q1.

Diapositiva 9
• Queremos una medida que hace referencia a la promedia.

• Alternativa: sumar todas las desviaciones al promedio (P ) y


promediar estas ; n
n
D   ( xi  P) i
i 1 N

• ¡Pero entonces sumamos valores positivos y negativas y sería


pequeña aunque la dispersión puede ser grande!
¡Si P  x , D  0 !
 Desviación media
Se conoce también como promedio de desviación. Para una serie de N valores se
puede calcular a través de la siguiente expresión:

= Valor absoluto de las desviaciones de los x valores, respecto de la media.

Y para datos agrupados se tiene:


Promedio de
desviación de cada dato

-2
1
-1

0 1 2 3 4 5

( x   )  0
Diapositiva 12
Desviación media

Se puede calcular las desviaciones en valor


absoluto. n
xi  x ni
Dx  
i 1 n
Es la desviación media respecto a la media
aritmética.
Un valor de D x grande indica una gran
dispersión.
Desviación media respecto
a la mediana
- Recuerda que cuando la distribución está agrupada en
intervalos
n
ni
DMe   xi  Me xi
i 1 N

n
 N i 1 y para xi = yi se usa
Me  Li 1  2 ci las marcas de clase.
ni
Varianza de la Población
• Desviación cuadrática promedio con relación a
la media de la Población.(N 30)

( x   ) 2
 2

N
x 2
 2
  2

N
Diapositiva 15
Varianza de la Población
Datos Agrupados

 ni ( x   ) 2

 2

N
 ni x 2

 2
  2

N
x y marca de clase
i

Diapositiva 16
Varianza
• La varianza es la media aritmética de los
cuadrados de las desviaciones de los valores
de la variable a la media aritmética;

n
ni
S   ( xi  x )
2 2

i 1 n
Desviación Estándar
de la Población

• Raíz Cuadrada de la Varianza de la Población

( x   ) 2
   2

N
x 2
   2
  2

N
Diapositiva 18
Desviación Estándar
de la Población
Datos Agrupados

 ni ( x   ) 2

   2

N
 ni x 2

   2
  2

N
x y marca de clase
i

Diapositiva 19
Varianza de la Muestra

• Desviación cuadrática promedio (n-1) con


relación a la media de la Muestra.(n <30)

( x  x ) 2
s 
2

n 1
 x 2 2

s 
2
x
n 1
Diapositiva 20
Desviación Estándar
de la Muestra

• Raíz Cuadrada de la Varianza de la Muestra

( x  x ) 2
s s 2

n 1

x 2 2
x
s s 2
 
n 1
Diapositiva 21
Varianza de la Muestra
Datos agrupados

 ni ( x  x) 2

s 
2

n 1
 ni x 2
x
2
s 
2

n 1
x y marca de clase
i

Diapositiva 22
Desviación Estándar
de la Muestra
Datos Agrupados

 ni ( x  x) 2

s s 2

n 1
 ni x 2
x
2
s s 2
 
n 1
x y marca de clase
i

Diapositiva 23
Desviación típica o estándar
• La varianza es difícil de interpretar porque las
unidades de la medida están elevadas al
cuadrado. La desviación típica es,
n
ni
S  S   ( xi  x )
2 2

i 1 n
Varianza
• Propiedades de la varianza:
1) La varianza es positiva para una variable (Una constante
tienen la varianza cero!)
2) La varianza es la medida cuadrática de dispersión óptima:
3) La varianza es igual al momento de segundo orden respecto al
origen menos el de primer orden elevado al cuadrado.
4) Si sumamos a todos los valores de la variable una constante,
la varianza no varía.
5) Si multiplicamos a todos los valores de la variable una
constante, la varianza queda multiplicada por el cuadrado de
la constante.
Desviación típica
• Propiedades de la desviación típica:
1)…5)

Nota: Valores extremos tiene más influencia


sobre la desviación típica comparado con la
desviación media.
Comparación de Desviaciones
Estándar
Datos A
Media = 15.5
s = 3.338
11 12 13 14 15 16 17 18 19 20 21

Datos B
Media = 15.5

11 12 13 14 15 16 17 18 19 20 21 s = .9258

Datos C
Media = 15.5

11 12 13 14 15 16 17 18 19 20 21 s = 4.57

Diapositiva 27
4-14

Interpretación y usos de la Desviación


Estándar
• Teorema de Chebyshev: para cualquier
conjunto de observaciones, la
proporción mínima de valores que está
dentro de k desviaciones estándar
desde la media es al menos 1 - 1/k2 ,
donde k es una constante mayor que
1.

Diapositiva 28
4-15

Interpretación y usos de la Desviación


Estándar
• Regla empírica: para una distribución de
frecuencias simétrica de campana:
– Cerca de 68% de las observaciones estará dentro de ±1σ
de la media (μ);
– Cerca de 95% de las observaciones estará dentro de ±2σ
de la media (μ);
– Casi todas (alrededor de 99.7%) las observaciones
estarán dentro de ±3σ de la media (μ).

Diapositiva 29
Curva de Distribución Normal

-3σ -2σ -1σ μ +1σ +2σ +3σ

Diapositiva 30
34.13% 34.13%

13.60%
13.60%

2.135% 2.135%

0.135% 0.135%

-3σ -2 σ -1σ +1σ +2σ +3σ


μ

68.26%

95.46%

99.73%
Diapositiva 31
Tipificación
• Una variable se denomina tipificada,
estandardizada o reducida, si su media es cero
y su varianza es uno.

xi  x
Z
S

• La observación xi está Z desviaciones


típicas por encima (debajo) de la media.
Resultado Estándar

-3σ -2σ -1σ μ +1σ +2σ +3σ

x
Re 

Diapositiva 33
  100   100
  20   20
x  80 x  160
¿ Re? ¿ Re?

-3σ -2σ -1σ μ +1σ +2σ +3σ

80 100 160

80  100 160  100


Re   1 Re  3
20 20

Diapositiva 34
Medidas de dispersión relativas
• ¿Como podemos comparar la dispersión de
dos variables distintas cuando la unidad de
medida es diferente? (¿o cuando la media es
diferente?).

• Necesitamos medidas adimensionales.


Medidas de dispersión relativas
• Coeficiente de apertura.

• La relación por cociente entre el valor mayor (


xn ) y menor ( x1 ),
xn
A
x1
Medidas de dispersión relativas
• Recorrido relativo

• El cociente entre el recorrido y la media


aritmética, R  R.e
r
x

• Indica el número de veces que el recorrido


contiene a la media aritmética.
Medidas de dispersión relativas
• Recorrido semi-intercuartílico:

• El cociente entre el recorrido intercuartílico y


la suma del primer y tercer cuartil:
Q3  Q1
Rs 
Q3  Q1
Medidas de dispersión relativas
• Coeficiente de variación de Pearson

• Coeficiente de variación de Pearson es la


relación por cociente entre la desviación típica
y la media aritmética:
S
V
x
Ejemplo de Dispersión Relativa

Distribuci ón A Distribuci ón B
x  10 x  100
s2 s5

¿Cuál de las dos tiene menor dispersión?


Ejemplo de Dispersión Relativa

Distribuci ón A Distribuci ón B
2 5
CV  100  20% CV  100  5%
10 100

La distribución B tiene menor dispersión


Medidas de dispersión relativas
• Índice de dispersión respecto a la mediana

• Para comparar medianas.

n
ni
DMe  yi  Me
n
VMe   i 1
Me Me
• 1) Asimetría: mide si la curva tiene una forma
simétrica, es decir, si respecto al centro de la
misma (centro de simetría) los segmentos de
curva que quedan a derecha e izquierda son
similares.
• 2) Curtosis: mide si los valores de la
distribución están más o menos concentrados
alrededor de los valores medios de la muestra.
Asimetría
• Hemos comentado que el concepto de
asimetría se refiere a si la curva que forman
los valores de la serie presenta la misma
forma a izquierda y derecha de un valor
central (media aritmética)
COEFICIENTE DE ASIMETRÍA DE PEARSON

X MO 3( X  M e)
AS 1  AS 2

S S

COEFICIENTE CUARTIL DE ASIMETRÍA


Q  2Q  Q
AS  Q  Q
3
3 50 1

3 1

COEFICIENTE PERCENTIL DE ASIMETRÍA


P 2P  P
AS  90 50 10

P P 4
90 10

EN LA PRÁCTICA SE DEBE DECIDIR POR UNA SOLA


FÓRMULA
Asimetría
• Los resultados pueden ser los siguientes:
• AS = 0 (distribución simétrica; existe la misma
concentración de valores a la derecha y a la
izquierda de la media)
Asimetría
• Los resultados pueden ser los siguientes:
• AS > 0 (distribución asimétrica positiva; existe
mayor concentración de valores a la derecha de
la media que a su izquierda)
Asimetría
• Los resultados pueden ser los siguientes:
• AS < 0 (distribución asimétrica negativa; existe
mayor concentración de valores a la izquierda de
la media que a su derecha)
Asimetría
Ejemplo: Vamos a calcular el Coeficiente de
Asimetría de PEARSON de la serie de datos
referidos al peso de los estudiantes del curso
de Estadística.
Curtosis

• El Coeficiente de Curtosis analiza el grado de


concentración que presentan los valores
alrededor de la zona central de la distribución.
Curtosis
• Se definen 3 tipos de distribuciones según su
grado de curtosis:
Curtosis
• Distribución mesocúrtica: presenta un grado
de concentración medio alrededor de los
valores centrales de la variable (el mismo que
presenta una distribución normal).
Curtosis
• Distribución leptocúrtica: presenta un
elevado grado de concentración alrededor de
los valores centrales de la variable.
Curtosis
• Distribución platicúrtica: presenta un
reducido grado de concentración alrededor de
los valores centrales de la variable.
El Coeficiente de Curtosis viene definido por la siguiente fórmula:
COEFICIENTE DE CURTOSIS PERCENTILICO
ES UNA MEDIDA DE LA CURTOSIS BASADA EN LOS CUARTILES Y PERCENTILES
QUE SE DEFINE:
Q Q Q
K ; Q 3 1 ES EL RANGO SEMI-INTERCUARTTILICO.
P90  P10 2
K=0.263 PARA LA CURVA NORMAL DE PROBABILIDADES
.SI K 0.5 LA CURVA ES LEPTOCÚRTICA.
SI K 0.25 LA CURVA ES MESOCÚRTICA.
SI K 0 LA CURVA ES PLATICÚRTICA.

0 0.125 0.25 0.375 0.5


PLATICÚRTICA. MESOCÚRTICA LEPTOCÚRTICA
CURTOSIS
• Ejemplo: Vamos a calcular el Coeficiente de
CURTOSIS de la serie de datos referidos al
peso de los estudiantes del curso de
Estadística.

Вам также может понравиться