Академический Документы
Профессиональный Документы
Культура Документы
DE POSICION Y DISPERSION EN
DISTRIBUCIONES DE FRECUENCIAS.
MEDIDAS CENTRALES
Se les llama medidas de tendencia
central
porque
generalmente
la
lo
tanto:
son
valores
que
MEDIA ARITMETICA
Media Aritmtica: Indicador estadstico que representa a un
Md(X)
Propiedades de la Media
x1 x2 xn
x
n
n
i 1
x1 x2 x N 59
x
5.36 5
n
11
Entonces. cada empresa en promedio tiene 5 trabajadores.
4
fi
= 1.3 hijos
1 hijo
15
15
18
30
39
39 / 30
f i xi
TOTALES
x=
f Pm
i 1
SUELDOS
Pmi
fi
f i Pmi
2.0 2.5
2.25
4.50
2.5 3.0
2.75
22.00
3.0 3.5
3.25
17
55.25
3.5 4.0
3.75
11.25
30
93.00
TOTALES
= 93 / 30
= 3.10 miles
= 3,100 dlares
PROPIEDADES DE LA MEDIA:
- La media de una constante M(a) = a
- La media de una constante por una
variable M(a X) = a M(X)
- La media de la suma de dos variables
M(X + Y) = M(X) + M(Y)
Media Geomtrica I
La media geomtrica es otro estadgrafo de
tendencia central, pero de poca utilizacin. El
clculo de la media geomtrica se puede hacer
en datos con frecuencia y datos sin
frecuencias
Para el clculo de la media geomtrica sin
frecuencias se aplica la siguientes expresin:
G n x 1 x2 x3 ....... x
8
Media Geomtrica II
Si los datos fueran los siguientes:
Su media geomtrica
sera:
G 30 34 11 13 2 7 11,26
6
1
G ( f 1 Log n1 f 2 Log n 2 ........... f k Log n k )
N
G 24 30 2 34 4 115 13 6 3 2 7 4 1,05
10
Media Geomtrica IV
Para intervalos cerrados,
se considera la marca de
clase de cada intervalo
por
su
frecuencia
absoluta.
G 62 66 70 74 78 82 1,178
98
30
34
11
11
11
Caractersticas
Menos sensible que la media a la variacin de las
puntuaciones..
Ms
Datos
representativa
no agrupados
Si muy
el n de
datos es impar: valor central
extremas.
Si el n de datos es par: media aritmtica de los 2 puntos centrales
13
14
n
FA
Mediana L 2
(i )
f
Donde,
L Limite inferior de la clase que contiene la mediana, esto lo determina
el cociente n/2.
n Nmero total de frecuencias
f frecuencia de la clase (mediana)
FA frecuencia acumulada anterior (mediana)
i amplitud de clase
15
fa
2.0 2.5
2.5 3.0
10
3.0 3.5
17
27
3.5 4.0
30
TOTALES
30
n
FA
2
Mediana L
(i )
f
15 10
Mediana 3.0
(0.5)
17
16
LA MODA
La moda es la medida que se relaciona con la frecuencia con que se presenta el
dato o los datos con mayor incidencia, con lo que se considera la posibilidad de
que exista ms de una moda para un conjunto de datos
Esta medida se puede aparecer tanto para datos
cualitativos como cuantitativos.
17
LA MODA
Por ejemplo para series de datos no agrupados
1
2
2
2
3
3
4
4
5
5
6
6
7
7
8
8,0
Notas
1
2
3
4
5
6
7
ni
2
3
7
10
5
3
3
La Moda es: 4
La Moda
La Moda es: 2
La Moda es: 2 y el 5,
es decir Bimodal
en este caso
no existira.
18
LA MODA
La moda , cuando los datos se encuentran en
tabla de distribucin de frecuencias , con
intervalos de clase, se debe aplicar la siguiente
Formula.
Moda Li
1 2
xi
62
66
70
74
78
82
ni
30
34
11
13
3
7
1 34 30 4
i=4
4
4
64
4 64,59 65
4 23
27
Moda 64
20
Medidas de Tendencia
Mediana
0,5000
Moda
0,4500
Media
Aritmtic
a
0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
Q1
0,1000
Q2
Q3
Q4
0,0500
0,0000
0
Rango
21
Medidas de posicin
Definicin: sirven para describir la localizacin de un
dato especifico en relacin con el resto de la muestra.
El cuantil es la expresin ms general de medidas de
posicin y comprende a todas las otras; el valor que tome
el cuantil X es el valor que deja por debajo de s un % de
los datos
22
CUARTILES, DECILES Y
PERCENTILES
Los cuartiles son los
tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q 1, Q2, Q3. El segundo cuartil
es precisamente la mediana. El primer cuartil, es el valor en el cual o
por debajo del cual queda un cuarto (25%) de todos los valores de la
sucesin (ordenada).
Los deciles son ciertos nmeros que dividen la sucesin de datos
ordenados en diez partes porcentualmente iguales. Son los nueve valores
que dividen al conjunto de datos ordenados en diez partes iguales, se
denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos
ordenados en cien partes porcentualmente iguales. Estos son los 99
valores que dividen en cien partes iguales el conjunto de datos
ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,...,
percentil 99.
23
CUARTILES
DECILES
PERCENTILES
k *n
, k 1,2,3
4
k *n
, k 1,2,3, ... , 9
10
k *n
, k 1,2,3, ..., 99
100
k ( n 1)
4
k ( n 1)
10
k ( n 1)
100
CUARTILES
DECILES
PERCENTILES
n
k
Fk
10
Dk Lk
*c
fk
n
k
Fk
100
Pk Lk
*c
fk
K = 1,2,3
K = 1,2,3, , 9
K = 1,2,3, , 99
Donde:
Lk = Lmite real inferior de la clase del cuartil, decil o percentil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil,decil o percentil k.
fk = Frecuencia de la clase del cuartil, decil o percentil k
c = Longitud del intervalo de la clase del cuartil, decil o percentil k
25
Salarios
No. De
(I. De Clases)
Empleados (f1)
200-299
85
85
300-299
90
175
400-499
120
295
500-599
70
365
600-699
62
427
700-800
36
463
30.75
Q1 300
*100 334
90
29.1
D7 500
*100 541.57
70
fa
53.9
P30 300
*100 359.88
90
26
Medidas de Dispersin
Se llaman medidas de dispersin aquellas que
permiten retratar la distancia de los valores de
la variable a un cierto valor central, o que
permiten identificar la concentracin de los
datos en un cierto sector del recorrido de la
variable. Se trata de coeficiente para variables
cuantitativas.
Rango
Rango Intercuartlico
Varianza
Desviacin Media
Desviacion Tipica
27
El rango intercuartlico
Permite ubicar el
50% de los datos
que
se
encuentran en el
centro
de
la
distribucin,
es
decir, el 25% de
los
datos
son
menores
al
primer cuartil y
tambin 25% de
los
datos
son
Rango
Intercuartil
mayores
al tercer
cuartil.
= Q3 Q1
Ejemplo:
La tabla muestra la experiencia (en aos)
del personal que labora en el Hospital
Central.
Experiencia
Trabajadores
(aos)
0-3
18
4-7
42
8 - 11
68
12 - 15
120
16 - 19
40
20 - 23
34
24 - 27
12
Total
334
A)Entre qu valores
se encuentra el
50% intermedio de
estos datos?
B)Cul es el rango
intercuartlico?
50 %
25 %
25 %
Q1
Q3
Rango
Intercuartlico
Lugar Q1 P25
25(334) 60 1
100
Q 7.5
1
25(334)
83.5o se ubica en la 3ra clase
100
68
Q 8.82 aos
1
Lugar Q 3 P75
75(334)
250.5o se ubica en la 5ta clase
100
75(334) 248 1
100
Q 15 .5
40
Q 15 .65 aos
3
Desviacion Media
Media de las desviaciones absolutas a la media.
Datos Agrupados:
Datos NO Agrupados:
MD =
i =1
MD =
Xi X
i =1
f i Xi X
MD
: Desviacin Media
: Media Aritmtica
Xi
: Tamao Muestra
33
La Varianza
Es una medida de desviacin promedio
con respecto a la media aritmtica
a) Clculos
agrupados.
partir
de
S
para una muestra
(X x )
i 1
para un poblacin
n 1
N
datos
(X )
i 1
no
Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas
durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:
x
8
Xi x
8 - 10 = 2
Xi x
4
0
10
5
10 - 10 = 0
5 - 10 = 5
12
12 - 10 = 2
25
4
10
10 - 10 = 0
15 - 10 = 5
0
25
15
X 60
Xi x 0 Xi x
60
x
6
x 10
58
S 6 1 11.6
2
58
f i (X x )
i
i 1
n 1
para un poblacin
f i (X i )
i 1
36
37
La Desviacin Estndar
Llamada tambin desviacin tpica representa la
variabilidad (o desviaciones) promedio de los datos
con respecto a la media aritmtica. Es la raz
cuadrada de la varianza, sea poblacional o
muestral.
a) Clculos a partir de datos no agrupados
n
para la muestra
(X i x )
i 1
n 1
para la poblacin
(X i )
i 1
f i (X x )
i 1
n 1
para un poblacin
f i (X )
i
i 1
39
El Coeficiente de Variacin
Es una medida relativa de variabilidad de los
datos. Permite comparar la variabilidad de
dos o ms conjuntos de datos expresados en
unidades diferentes (peso: Kg. y libras).
s
CV 100
para la muestra:
x
para la poblacin:
CV
100
Ejemplo:
A continuacin se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
anlisis clnicos. El laboratorio I tiene sus tarifas en
euros y el laboratorio II en dlares Cul de ellos
tiene un plan tarifario ms homogneo o estable?.
Laboratorio I (euros)
Laboratorio II (dlares)
40,70,60,48,52,65,58
70,35,150,140,82,110,140,120
Laboratorio I
n
x
x
Xi
i 1
393
56.14
7
Xi x
Xi x
40
-16.14
70
60
13.86
3.86
48
-8.14
14.90
66.26
52
-4.14
17.14
65
8.86
1.86
78.50
3.46
58
X 393
Xi x 0
260.50
192.10
Xi x
632,86
Si X i x 632.86
2
2
(
X
x
)
i
i 1
n 1
632.86
10.27
7 1
S
CV 100
x
10.27
CV
100 18.29
56.14
Laboratorio II
Xi
i 1
847
105.87
8
Xi x
Xi x
70
-35.87
1286.6569
35
-70.87
5022.5569
150
44.13
1947.4569
140
34.13
1164.8569
82
-23.87
569.7769
110
4.13
17.0569
140
34.13
1164.8569
120
14.13
199.6569
847
Xi x 0,04
Xi x
11372,88
n
Si X i x
i 1
n
(X i
i 1
11372.88
x)
n 1
S
CV 100
x
11372,88
40.30
8 1
40,30
CV
100 30,06
105,87
46
Medidas de forma
Asimetra o sesgo
Apuntamiento o curtosis
Asimetra o
Sesgo
La asimetra es positiva o
negativa en funcin de a qu
lado se encuentra la cola de la
distribucin.
Apuntamiento o
curtosis
La curtosis (K) nos indica el grado de apuntamiento (aplastamiento) de
una distribucin con respecto a la distribucin normal o gaussiana. Es
adimensional.
Formulas
Asimetra o sesgo
n
a
1
n
i 1
__
Apuntamiento o curtosis
__
n n 1
k
1
n
2
n
x x
i 1
3 n 1
n 2 n 3
Medidas de Resumen
Centralizacin
Indican valores con respecto a
los que los datos parecen
agruparse.
Media, mediana y moda
Dispersin
Indican la mayor o menor
concentracin de los datos con
respecto a las medidas de
centralizacin.
Desviacin tpica, coeficiente de
variacin, rango, varianza
Forma
Asimetra
Apuntamiento o curtosis
Posicin
Dividen un conjunto ordenado de
datos en grupos con la misma
cantidad de individuos.
Cuantiles, percentiles,
cuartiles, deciles,...
52