Вы находитесь на странице: 1из 52

MEDIDAS DE TENDENCIA CENTRAL ,

DE POSICION Y DISPERSION EN
DISTRIBUCIONES DE FRECUENCIAS.

MEDIDAS CENTRALES
Se les llama medidas de tendencia
central

porque

generalmente

la

acumulacin ms alta de datos se


encuentra en los valores intermedios.
Por

lo

tanto:

son

valores

que

representan a un conjunto de datos.


Entre las medidas de tendencia central
tenemos:
Media aritmtica.
Media ponderada.
Media geomtrica.
Mediana.
Moda.

MEDIA ARITMETICA
Media Aritmtica: Indicador estadstico que representa a un

conjunto de datos cuantitativos.

Conocida tambin como media o promedio. Se calcula Sumando


todos los valores de la poblacin (muestra), dividida por el nmero
total de dichos datos.
Su representacin: : x,

Md(X)

Propiedades de la Media

Todo conjunto de datos de nivel de intervalo y de nivel de razn tiene un


valor medio.
Al evaluar la media se incluyen todos los valores.
Un conjunto de datos slo tiene una media. Esta es un valor nico.
La media es una medida muy til para comparar dos o ms poblaciones.
La media es la nica medida de ubicacin donde la suma de las
desviaciones de cada valor es con respecto a la media, siempre ser cero.

Frmulas de Clculo de la Media


Aritmetica
- Datos no ordenados
Se obtiene de la suma de todos los datos,
dividido entre el nmero total de ellos.
n

x1 x2 xn
x

n
n
i 1

Ejemplo: Estos datos corresponden al numero de


trabajadores de un grupo de empresas de confecciones:
5 6 7 3 4 8 4 5 9 5 3

x1 x2 x N 59
x

5.36 5
n
11
Entonces. cada empresa en promedio tiene 5 trabajadores.
4

- Datos agrupados (Discretos):


Se obtiene de la suma de los productos
de los valores que
toma la variable por su
n
respectiva frecuencia,
dividido
entre
el
f i xi

nmero total dei datos.


1

Ejemplo: NUMERO DE HIJOS DE EMPLEADOS


N Hijos

fi

= 1.3 hijos
1 hijo

15

15

18

30

39

39 / 30

f i xi

TOTALES

x=

Cada empleado tiene en


promedio 1 hijo

- Datos Agrupados: Se obtiene de la suma de los productos


de las marcas de clase (puntos medios) por su frecuencia,
dividido entre el nmero total de ellos.
(MEDIA
PONDERADA)
n

f Pm
i 1

SUELDOS

Pmi

fi

f i Pmi

2.0 2.5

2.25

4.50

2.5 3.0

2.75

22.00

3.0 3.5

3.25

17

55.25

3.5 4.0

3.75

11.25

30

93.00

TOTALES

= 93 / 30
= 3.10 miles
= 3,100 dlares

Cada empleado tiene


en promedio un sueldo
mensual de 3100
dlares

PROPIEDADES DE LA MEDIA:
- La media de una constante M(a) = a
- La media de una constante por una
variable M(a X) = a M(X)
- La media de la suma de dos variables
M(X + Y) = M(X) + M(Y)

Media Geomtrica I
La media geomtrica es otro estadgrafo de
tendencia central, pero de poca utilizacin. El
clculo de la media geomtrica se puede hacer
en datos con frecuencia y datos sin
frecuencias
Para el clculo de la media geomtrica sin
frecuencias se aplica la siguientes expresin:

G n x 1 x2 x3 ....... x
8

Media Geomtrica II
Si los datos fueran los siguientes:
Su media geomtrica
sera:

G 30 34 11 13 2 7 11,26
6

Media Geomtrica III


Para datos en tablas Frecuencias
Se aplica la siguiente expresin:

1
G ( f 1 Log n1 f 2 Log n 2 ........... f k Log n k )
N

G 24 30 2 34 4 115 13 6 3 2 7 4 1,05
10

Media Geomtrica IV
Para intervalos cerrados,
se considera la marca de
clase de cada intervalo
por
su
frecuencia
absoluta.

La media Geomtrica se calcular con el valor de la


Marca de clase de los intervalos multiplicados con la
frecuencias absoluta.

G 62 66 70 74 78 82 1,178
98

30

34

11

11

11

MEDIANA (Me o Md)


Es un indicador estadstico que divide al conjunto de datos en dos partes
iguales.
En una serie de datos ordenados (creciente o decreciente) es la puntuacin o
valor central de la distribucin estadstica.

Caractersticas
Menos sensible que la media a la variacin de las
puntuaciones..
Ms
Datos
representativa
no agrupados

que la media cuando puntuaciones

Si muy
el n de
datos es impar: valor central
extremas.
Si el n de datos es par: media aritmtica de los 2 puntos centrales

CALCULO DE LA MEDIANA EN DATOS


NO AGRUPADOS
Encontrar la mediana para los siguientes datos: (impar)
4 1 2 3 4 2 2 1 5 5 3
SOLUCIN
PASO 1: Ordenar los datos.
1 1
2
2
2
3
3
4 4 5 5
PASO 2: Localizar el valor que divide en dos parte iguales el nmero
de datos.

La mediana es 3, dejando 5 datos a cada lado.


Me = 3

13

Ejemplo: mediana para datos no agrupados (cantidad de datos par)


Modifiquemos el ejemplo anterior, eliminando el ltimo dato. Encontrar la
mediana:
4 1 2 3 4 2 2 1
5 5
SOLUCIN
PASO 1: Ordenar los datos.
1 1 2 2 2 3 4 4 5 5
PASO 2: Localizar el valor que divide en dos parte iguales el nmero de
datos.

El punto medio se encuentra entre dos valores: 2 y


3, por tanto, el valor de la mediana ser 2,5.
Me = 2,5

14

CALCULO DE LA MEDIANA EN DATOS


AGRUPADOS

En datos AGRUPADOS se rige a la siguiente frmula.

n
FA
Mediana L 2
(i )
f
Donde,
L Limite inferior de la clase que contiene la mediana, esto lo determina
el cociente n/2.
n Nmero total de frecuencias
f frecuencia de la clase (mediana)
FA frecuencia acumulada anterior (mediana)
i amplitud de clase
15

Ejemplo: se tiene el SUELDO MENSUAL(miles de dlares) DE


EMPLEADOS de la Empresa X, calcular la mediana.
SUELDOS

fa

2.0 2.5

2.5 3.0

10

3.0 3.5

17

27

3.5 4.0

30

TOTALES

30

n
FA
2
Mediana L
(i )
f

- Calcular la clase que contiene la


mediana: n/2 = 15.
- Determinar los otros valores
de la formula: FA = 10, L = 3.0 ,
f = 17, i = 0.5

15 10
Mediana 3.0
(0.5)
17

16

LA MODA
La moda es la medida que se relaciona con la frecuencia con que se presenta el
dato o los datos con mayor incidencia, con lo que se considera la posibilidad de
que exista ms de una moda para un conjunto de datos
Esta medida se puede aparecer tanto para datos
cualitativos como cuantitativos.

Se dice que cuando un conjunto de datos tiene una


moda la muestra es unimodal, cuando tiene dos
modas bimodal, cuando la muestra contiene mas
de un dato repetido se dice que es multimodal y un
ltimo caso es cuando ningn dato tiene una
frecuencia, en dicho caso se dice que la muestra es
amodal

17

LA MODA
Por ejemplo para series de datos no agrupados
1
2
2
2
3
3
4
4
5
5
6
6
7
7
8
8,0

Notas
1
2
3
4
5
6
7

ni
2
3
7
10
5
3
3

La Moda es: 4
La Moda

La Moda es: 2
La Moda es: 2 y el 5,
es decir Bimodal

en este caso
no existira.

18

LA MODA
La moda , cuando los datos se encuentran en
tabla de distribucin de frecuencias , con
intervalos de clase, se debe aplicar la siguiente
Formula.

Moda Li
1 2

- Li = Limite inferior del intervalo en donde se encuentra la Moda


- El 1 es la diferencia en la frecuencia Absoluta mas cercana a la frecuencia de valor
mayor. (frecuencia premodal)
- El 2 es la diferencia entre la frecuencia inmediatamente mayor a la frecuencia de
mayor Valor. ( frecuencia posmodal)
- El valor i corresponde al Tamao del Intervalo
19

Moda para Datos agrupados


Intevalos Cerrados
60
64
64
68
68
72
72
76
76
80
80
84

xi
62
66
70
74
78
82

ni
30
34
11
13
3
7

Intervalo de mayor frecuencia

Limite inferior del Intervalo modal = 64, por que es


de mayor Frecuencia
2 34 11 23

1 34 30 4

i=4

4
4

64

4 64,59 65
4 23
27

Moda 64

20

Medidas de Tendencia
Mediana

0,5000

Moda

0,4500

Media
Aritmtic
a

0,4000
0,3500
0,3000
0,2500
0,2000
0,1500

Q1

0,1000

Q2

Q3

Q4

0,0500
0,0000
0

Rango
21

Medidas de posicin
Definicin: sirven para describir la localizacin de un
dato especifico en relacin con el resto de la muestra.
El cuantil es la expresin ms general de medidas de
posicin y comprende a todas las otras; el valor que tome
el cuantil X es el valor que deja por debajo de s un % de
los datos

Casos particulares son los cuartiles, deciles, percentiles,...

22

CUARTILES, DECILES Y
PERCENTILES
Los cuartiles son los
tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q 1, Q2, Q3. El segundo cuartil
es precisamente la mediana. El primer cuartil, es el valor en el cual o
por debajo del cual queda un cuarto (25%) de todos los valores de la
sucesin (ordenada).
Los deciles son ciertos nmeros que dividen la sucesin de datos
ordenados en diez partes porcentualmente iguales. Son los nueve valores
que dividen al conjunto de datos ordenados en diez partes iguales, se
denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos
ordenados en cien partes porcentualmente iguales. Estos son los 99
valores que dividen en cien partes iguales el conjunto de datos
ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,...,
percentil 99.
23

Formulas para encontrar la


posicin de los cuantiles para
datos
no
agrupados
Si se tiene una serie de valores X , X , X ... Xn, entonces la
1

posicin de los cuantiles se localiza mediante las siguientes


frmulas:
Cuando n es impar:
Cuando n es par:

CUARTILES

DECILES

PERCENTILES

k *n
, k 1,2,3
4

k *n
, k 1,2,3, ... , 9
10

k *n
, k 1,2,3, ..., 99
100

k ( n 1)
4

k ( n 1)
10

k ( n 1)
100

Formulas para calcular los


cuantiles para datos agrupados
n
Fk
4
Qk Lk
*c
fk
k

CUARTILES

DECILES

PERCENTILES

n
k
Fk
10
Dk Lk
*c
fk

n
k
Fk
100

Pk Lk
*c
fk

K = 1,2,3

K = 1,2,3, , 9

K = 1,2,3, , 99

Donde:
Lk = Lmite real inferior de la clase del cuartil, decil o percentil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil,decil o percentil k.
fk = Frecuencia de la clase del cuartil, decil o percentil k
c = Longitud del intervalo de la clase del cuartil, decil o percentil k
25

del primer cuartil, el sptimo decil y el 30


EjemploDeterminacin
percentil, de la siguiente tabla

Salarios

No. De

(I. De Clases)

Empleados (f1)

200-299

85

85

300-299

90

175

400-499

120

295

500-599

70

365

600-699

62

427

700-800

36

463

30.75
Q1 300
*100 334
90
29.1
D7 500
*100 541.57
70

fa

53.9
P30 300
*100 359.88
90

26

Medidas de Dispersin
Se llaman medidas de dispersin aquellas que
permiten retratar la distancia de los valores de
la variable a un cierto valor central, o que
permiten identificar la concentracin de los
datos en un cierto sector del recorrido de la
variable. Se trata de coeficiente para variables
cuantitativas.
Rango
Rango Intercuartlico
Varianza

Desviacin Media
Desviacion Tipica
27

Dispersin: Amplitud Total


Amplitud Total = Valor Mayor Valor Menor
VENTAJAS:
- Se expresa en las mismas unidades que los datos.
- Es fcil de calcular.
INVONVENIENTES:

- slo considera los valores extremos


- no toma en cuenta ni el nmero de datos ni el
valor de estos
28

El rango intercuartlico
Permite ubicar el
50% de los datos
que
se
encuentran en el
centro
de
la
distribucin,
es
decir, el 25% de
los
datos
son
menores
al
primer cuartil y
tambin 25% de
los
datos
son
Rango
Intercuartil
mayores
al tercer
cuartil.

= Q3 Q1

Ejemplo:
La tabla muestra la experiencia (en aos)
del personal que labora en el Hospital
Central.
Experiencia
Trabajadores
(aos)
0-3
18
4-7
42
8 - 11
68
12 - 15
120
16 - 19
40
20 - 23
34
24 - 27
12
Total
334

A)Entre qu valores
se encuentra el
50% intermedio de
estos datos?
B)Cul es el rango
intercuartlico?

50 %

25 %

25 %

Q1

Q3
Rango
Intercuartlico

Lugar Q1 P25

25(334) 60 1

100

Q 7.5
1

25(334)
83.5o se ubica en la 3ra clase
100

68

Q 8.82 aos
1

Lugar Q 3 P75

75(334)
250.5o se ubica en la 5ta clase
100

75(334) 248 1

100

Q 15 .5

40

Q 15 .65 aos
3

A. El 50% de los trabajadores con experiencia


intermedia se encuentran entre 8,82 y 15,65
aos.
B. El rango intercuartlico es 6 aos 10 meses
aproximadamente

Desviacion Media
Media de las desviaciones absolutas a la media.

Datos Agrupados:

Datos NO Agrupados:

MD =

i =1

MD =

Xi X

i =1

f i Xi X

MD

: Desviacin Media

: Media Aritmtica

Xi

: i-simo valor observado

: Tamao Muestra

Usar la desviacin media:


- Cuando se quiere ponderar todas las
desviaciones de la media segn su magnitud.
-

Cuando desviaciones extremas influiran


indebidamente en la desviacin tpica.

33

La Varianza
Es una medida de desviacin promedio
con respecto a la media aritmtica
a) Clculos
agrupados.

partir

de

S
para una muestra

(X x )
i 1

para un poblacin

n 1
N

datos

(X )
i 1

no

Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas
durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:

x
8

Xi x

8 - 10 = 2

Xi x
4
0

10
5

10 - 10 = 0
5 - 10 = 5

12

12 - 10 = 2

25
4

10

10 - 10 = 0
15 - 10 = 5

0
25

15

X 60

Xi x 0 Xi x

60
x
6
x 10

58
S 6 1 11.6
2

58

a) Clculos a partir de datos agrupados.


n

para una muestra

f i (X x )
i

i 1

n 1

para un poblacin

f i (X i )

i 1

36

Ejemplo: Encontrar la varianza de la siguiente tabla de


distribucin de frecuencia:

37

La Desviacin Estndar
Llamada tambin desviacin tpica representa la
variabilidad (o desviaciones) promedio de los datos
con respecto a la media aritmtica. Es la raz
cuadrada de la varianza, sea poblacional o
muestral.
a) Clculos a partir de datos no agrupados
n

para la muestra

(X i x )
i 1

n 1

para la poblacin

(X i )

i 1

a) Clculos a partir de datos agrupados.


n

para una muestra

f i (X x )

i 1

n 1

para un poblacin

f i (X )
i

i 1

39

El Coeficiente de Variacin
Es una medida relativa de variabilidad de los
datos. Permite comparar la variabilidad de
dos o ms conjuntos de datos expresados en
unidades diferentes (peso: Kg. y libras).
s
CV 100
para la muestra:
x
para la poblacin:

CV

100

Ejemplo:
A continuacin se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
anlisis clnicos. El laboratorio I tiene sus tarifas en
euros y el laboratorio II en dlares Cul de ellos
tiene un plan tarifario ms homogneo o estable?.
Laboratorio I (euros)

Laboratorio II (dlares)

40,70,60,48,52,65,58

70,35,150,140,82,110,140,120

Calculamos la media y desviacin estndar por


cada una de los laboratorios

Laboratorio I
n

x
x

Xi
i 1

393

56.14
7

Xi x

Xi x

40

-16.14

70
60

13.86
3.86

48

-8.14

14.90
66.26

52

-4.14

17.14

65

8.86
1.86

78.50
3.46

58

X 393

Xi x 0

260.50
192.10

Xi x

632,86

Si X i x 632.86
2

2
(
X

x
)
i

i 1

n 1

632.86
10.27
7 1

S
CV 100
x
10.27
CV
100 18.29
56.14

Laboratorio II

Xi

i 1

847
105.87
8

Xi x

Xi x

70

-35.87

1286.6569

35

-70.87

5022.5569

150

44.13

1947.4569

140

34.13

1164.8569

82

-23.87

569.7769

110

4.13

17.0569

140

34.13

1164.8569

120

14.13

199.6569

847

Xi x 0,04

Xi x

11372,88

n
Si X i x
i 1
n

(X i

i 1

11372.88

x)

n 1

S
CV 100
x

11372,88
40.30
8 1

40,30
CV
100 30,06
105,87

El Laboratorio II presenta una mayor variabilidad


en el plan tarifario.

Propiedades del Coeficiente de Variacin:


El coeficiente de variacin es un nmero sin
unidades que se suele expresar como porcentaje.
El coeficiente es una medida de la dispersin
invariante respecto de un cambio de escala, como
consecuencia de las propiedades de la media y la
desviacin tpica. Sin embargo no es invariante
frente al cambio de origen porque el numerador
queda inalterado pero el denominador cambia.
Sirve para comparar dos distribuciones de
variables diferentes.

46

Medidas de forma
Asimetra o sesgo
Apuntamiento o curtosis

Asimetra o
Sesgo

Una distribucin es simtrica si


la mitad izquierda de su
distribucin es la imagen
especular de su mitad derecha.

En las distribuciones simtricas


media y mediana coinciden. Si
slo hay una moda tambin
coincide

La asimetra es positiva o
negativa en funcin de a qu
lado se encuentra la cola de la
distribucin.

La media tiende a desplazarse


hacia las valores extremos
(colas).

Las discrepancias entre las


medidas de centralizacin son

Coeficiente de asimetra (a)


Distribucin simtrica: a = 0

Sesgo a la izquierda: a < 0

Sesgo a la derecha: a > 0

Apuntamiento o
curtosis
La curtosis (K) nos indica el grado de apuntamiento (aplastamiento) de
una distribucin con respecto a la distribucin normal o gaussiana. Es
adimensional.

Platicrtica (aplanada): K < 0

Leptocrtica (apuntada): K > 0

Mesocrtica (como la normal): K = 0

Formulas
Asimetra o sesgo


n
a

1
n

i 1

__

Apuntamiento o curtosis

__


n n 1
k

1
n

2
n

x x

i 1

3 n 1

n 2 n 3

Medidas de Resumen

Centralizacin
Indican valores con respecto a
los que los datos parecen
agruparse.
Media, mediana y moda

Dispersin
Indican la mayor o menor
concentracin de los datos con
respecto a las medidas de
centralizacin.
Desviacin tpica, coeficiente de
variacin, rango, varianza

Forma
Asimetra
Apuntamiento o curtosis

Posicin
Dividen un conjunto ordenado de
datos en grupos con la misma
cantidad de individuos.
Cuantiles, percentiles,
cuartiles, deciles,...

52

Вам также может понравиться