Академический Документы
Профессиональный Документы
Культура Документы
Contenidos:
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.
1.7.
Qu es la Estadstica.
Conceptos bsicos.
Distribuciones de frecuencias.
Representaciones grficas.
Caractersticas de una distribucin de frecuencias.
Medidas de posicin.
Momentos respecto al origen y respecto a la
media.
Medidas de dispersin.
1.1
Qu es la Estadstica (a).
La Estadstica se configura como la
tecnologa del mtodo cientfico que
proporciona instrumentos para la toma de
decisiones cuando stas se adoptan en
ambiente de incertidumbre, siempre que esa
incertidumbre pueda ser medida en trminos
de probabilidad. Por ello, la Estadstica se
preocupa de los mtodos de recogida y
descripcin de datos, as como de generar
tcnicas para el anlisis de esta informacin.
F. J. Martn Pliego.
1.1
Qu es la Estadstica (b).
Ampliar
Montero
Lorenzo, 1.1
Recoge el
comportamiento
de la muestra
respecto a un
fenmeno a
estudiar
Lo plasma en un
modelo
matemtico
(representacin
necesariamente
simplificada de la
realidad)
1.3
Distribuciones de frecuencias (a).
Tipos de frecuencias.
Ampliar
Absolutas y relativas.
Acumuladas.
Montero
Lorenzo, 1.2
Distribuciones unidimensionales de
frecuencias.
Agrupadas y no agrupadas.
Caractersticas de las distribuciones agrupadas.
fi =
ni
i = n1 + n2 + ... + ni = n j
j =1
Fi = f1 + f 2 + ... + f i = f j
j =1
n(i)
f(i)
3
5
7
5
4
2
1
1
28
N(i)
0,11
0,18
0,25
0,18
0,14
0,07
0,04
0,04
1,00
F(i)
3
8
15
20
24
26
27
28
0
0,11
0,29
0,54
0,71
0,86
0,93
0,96
1,00
0,00
Nivel proactividad
Proactividad baja
Proactividad media
Proactividad alta
Total (N)
ni
fi
10
7
3
20
Ni
0,50
0,35
0,15
1,00
Fi
10
17
20
0,50
0,85
1,00
n(i)
Agricultura
Industria
Construccin
Servicios
Total (N)
53,4
143,7
145,6
492,4
835,1
f(i)
0,0639
0,1721
0,1744
0,5896
1,0000
N(i)
53,4
197,1
342,7
835,1
F(i)
0,0639
0,2360
0,4104
1,0000
1.3
Distribuciones unidimensionales de
frecuencias.
xi =
Li 1 + Li
2
Distribucin de
frecuencias no agrupada
en intervalos:
Distribucin de
frecuencias agrupada en
intervalos:
n(i)
10
11
12
13
20
25
30
50
N
L(i)-L(i-1)
0-500
500-1000
1000-1500
1500-2000
2000-2500
2500-3000
N
3
5
7
5
4
2
1
1
28
n(i)
c(i)
7
9
6
4
3
1
30
x(i)
500
500
500
500
500
500
250
750
1250
1750
2250
2750
10
1.4
Representaciones grficas (a).
Diagramas de sectores.
Diagramas de barras.
Diagrama de Pareto.
Cartogramas y pictogramas.
Ampliar
Montero
Lorenzo, 1.3
Caracteres cuantitativos:
53,4
143,7
145,6
492,4
835,1
f(i)
0,0639
0,1721
0,1744
0,5896
1,0000
N(i)
53,4
197,1
342,7
835,1
F(i)
0,0639
0,2360
0,4104
1,0000
Diagrama
de barras:
500
n(i)
400
300
n(i)
200
100
0
Agricultura
Industria
Construccin
Servicios
Sector
11
1.4
53,4
143,7
145,6
492,4
835,1
f(i)
0,0639
0,1721
0,1744
0,5896
1,0000
N(i)
F(i)
0,0639
0,2360
0,4104
1,0000
53,4
197,1
342,7
835,1
Diagrama
por
sectores:
Agricultura
Construccin; 0,1744;
17%
Industria
Construccin
Servicios
53,4
143,7
145,6
492,4
835,1
f(i)
0,0639
0,1721
0,1744
0,5896
1,0000
N(i)
F(i)
0,0639
0,2360
0,4104
1,0000
53,4
197,1
342,7
835,1
1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
800
Diagrama de
Pareto:
700
600
n(i)
500
400
300
200
100
0
Servicios
Construccin
Industria
F(i)
n(i)
F(i)
Agricultura
Sector
12
1.4
n(i)
f(i)
3
5
7
5
4
2
1
1
28
N(i)
0,11
0,18
0,25
0,18
0,14
0,07
0,04
0,04
1,00
F(i)
3
8
15
20
24
26
27
28
0
0,11
0,29
0,54
0,71
0,86
0,93
0,96
1,00
0,00
f(i)
Grfico de
barras:
0,5000
0,4500
0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000
f(i)
10
11
12
13
20
25
30
50
N horas
1.4
n(i)
f(i)
3
5
7
5
4
2
1
1
28
N(i)
0,11
0,18
0,25
0,18
0,14
0,07
0,04
0,04
1,00
F(i)
3
8
15
20
24
26
27
28
0
0,11
0,29
0,54
0,71
0,86
0,93
0,96
1,00
0,00
n(i)
Polgono de
frecuencias:
8
7
6
5
4
3
2
1
0
n(i)
10
11
12
13
20
25
30
50
N horas
13
1.4
0-500
500-1000
1000-1500
1500-2000
2000-2500
2500-3000
N
f(i)
7
9
6
4
3
1
30
N(i)
0,23
0,30
0,20
0,13
0,10
0,03
F(i)
7
16
22
26
29
30
c(i)
0,23
0,53
0,73
0,87
0,97
1,00
x(i)
500
500
500
500
500
500
L(i)
250
750
1250
1750
2250
2750
L(i-1)
500
1000
1500
2000
2500
3000
0
500
1000
1500
2000
2500
F(i)
Histograma:
10
9
8
7
6
5
4
3
2
1
0
n(i)
250
500
750
1000
1250
1500
1750 2000
2250
2500
2750
3000
x(i)
1.4
L(i)-L(i-1)
0-100
100-300
300-400
400-800
n(i)
1000
2000
2000
2000
c(i)
d(i)
100
200
100
400
10
10
20
5
Densidad de
frecuencia:
di =
ni
ci
di
20
Histograma:
15
10
5
100
200
300
400
500
600
700
800
Li
14
15
1.5
Posicin central.
Media
Ampliar
Montero
Lorenzo, 2.2
Aritmtica.
Geomtrica.
Armnica.
Mediana.
Moda.
Posicin no central.
x n + x n + ... + xn nn
x= 1 1 2 2
=
xi ni
i =1
O bien:
x=
xi f i
i =1
16
n(i)
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N
f(i)
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100
N(i)
0,10
0,16
0,12
0,10
0,07
0,07
0,05
0,05
0,04
0,05
0,04
0,06
0,02
0,01
0,01
0,02
0,01
0,01
0,01
1,00
F(i)
10
26
38
48
55
62
67
72
76
81
85
91
93
94
95
97
98
99
100
0,10
0,26
0,38
0,48
0,55
0,62
0,67
0,72
0,76
0,81
0,85
0,91
0,93
0,94
0,95
0,97
0,98
0,99
1,00
suma:
media arit.:
x(i)*n(i)
9000
15200
12000
11000
8050
8400
6500
7000
6000
8500
8000
13800
5000
2750
3000
7000
4000
4500
5000
144700
1447,00
n(i)
38
47
10
3
2
100
c(i)
1000
1000
1000
1000
1000
f(i)
N(i)
0,38
0,47
0,10
0,03
0,02
1,00
F(i)
38
85
95
98
100
x(i)
0,38
0,85
0,95
0,98
1,00
500
1500
2500
3500
4500
suma:
media arit.:
x(i)*n(i)
19000
70500
25000
10500
9000
134000
1340,00
17
1.5
La suma de las
desviaciones de los
valores de la
variable respecto a
su media, por sus
frecuencias
absolutas, es 0.
n
(xi x )ni = 0
i =1
1.5
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100
1447
x(i)*n(i)
x(i)-x(med) (x(i)-x(med))*n(i)
9000
-547
-5470
15200
-497
-7952
12000
-447
-5364
11000
-347
-3470
8050
-297
-2079
8400
-247
-1729
6500
-147
-735
7000
-47
-235
6000
53
212
8500
253
1265
8000
553
2212
13800
853
5118
5000
1053
2106
2750
1303
1303
3000
1553
1553
7000
2053
4106
4000
2553
2553
4500
3053
3053
5000
3553
3553
suma:
0
n(i)
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N
media aritmtica
n(i)
x(i)*n(i)
900
10
9000
Si dividimos la
950
16
15200 (hasta 1150)
distribucin
1000
12
12000 suma x(i)*n(i):
55250
1100
10
11000 suma n(i):
55
de frecuencias
1150
1004,55
7
8050 media:
1200
7
8400
en varios
1300
5
6500
1400
5
7000
subconjuntos
1500
4
6000 (hasta 2300)
disjuntos, la
1700
5
8500 suma x(i)*n(i):
58200
2000
4
8000 suma n(i):
36
media de las
2300
1616,67
6
13800 media:
2500
2
5000
medias de
2750
1
2750
cada
3000
1
3000
3500
2
7000 (hasta 5000)
subconjunto
4000
1
4000 suma x(i)*n(i):
31250
4500
1
4500 suma n(i):
9
es igual a la
5000
3472,22
1
5000 media:
media de toda
la distribucin
x + x + x3 3 1004,55 55 + 1616,67 36 + 3472,22 9
x= 1 1 2 2
=
= 1447
de
100
frecuencias.
18
1.5
Si
transformamos
los valores de
la distribucin
mediante
y(i)=ax(i)+b, la
media de los
valores
transformados
ser:
n(i)
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
y = ax + b
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100
media:
x(i)*n(i)
y(i)=0,3*x(i)+100
9000
370
15200
385
12000
400
11000
430
8050
445
8400
460
6500
490
7000
520
6000
550
8500
610
8000
700
13800
790
5000
850
2750
925
3000
1000
7000
1150
4000
1300
4500
1450
5000
1600
144700
1447
media:
y(i)*n(i)
3700
6160
4800
4300
3115
3220
2450
2600
2200
3050
2800
4740
1700
925
1000
2300
1300
1450
1600
53410
534,10
Ventajas:
19
Inconvenientes:
Ejemplo: suponemos que invertimos 6000 euros en un depsito a 6 aos. En estos aos,
los tipos de inters anuales aplicados han sido el 5%, 3%, 1%, 2%, 1%, 3% por este
orden. Por tanto, al final del perodo la cantidad obtenida ser:
Es decir, un tipo de inters medio acumulado del 0,25%. Si hubiramos aplicado este tipo a
todos los aos, al final se hubiera obtenido la misma cantidad:
20
1
1
1
n1 +
n2 + L +
nn
x1
x2
xn
n
xi ni
i =1
Inconvenientes:
H=
13500
= 150
3000 4500 6000
+
+
100
150
200
Ntese que si cada una de las 90 mquinas tuviera una productividad equivalente a la
media armnica, la produccin total sera 150 x 90 = 13500, la produccin total.
21
H G x
1.5
Mediana (a).
22
1.5
Mediana (b).
Si N es impar, la
mediana ser aquel
valor que ocupe la
posicin:
1
+1
2
2
+1
2
1.5
Mediana (c): ejemplos I.
x(i): salario mensual
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N
n(i)
8
10
6
8
3
3
5
4
2
2
2
5
2
1
1
2
1
1
1
67
x(i)*n(i)
7200
9500
6000
8800
3450
3600
6500
5600
3000
3400
4000
11500
5000
2750
3000
7000
4000
4500
5000
N(i)
8
18
24
32
35
38
43
47
49
51
53
58
60
61
62
64
65
66
67
23
1.5
Mediana (d): ejemplos II.
x(i): salario mensual
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N
n(i)
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100
x(i)*n(i)
9000
15200
12000
11000
8050
8400
6500
7000
6000
8500
8000
13800
5000
2750
3000
7000
4000
4500
5000
N(i)
10
26
38
48
55
62
67
72
76
81
85
91
93
94
95
97
98
99
100
1.5
Mediana (e).
24
+1
i 1
Me = Li 1 + 2
ci
ni
i 1
Me = Li 1 + 2
ci
ni
+ 1 i 1
Me = Li 1 + 2
ci
ni
n(i)
c(i)
34
47
39
35
4
159
10
10
10
10
10
N(i)
34,00
81,00
120,00
155,00
159,00
+1
159 + 1
i 1
34
2
Me = Li 1 +
ci = 10 + 2
10 = 19,79
ni
47
25
n(i)
c(i)
12
24
31
29
4
100
100
i 1
36
Me( I ) = Li 1 + 2
ci = 20 + 2
10 = 24,52
ni
31
Me =
10
10
10
10
10
N(i)
12,00
36,00
67,00
96,00
100,00
100
+ 1 i 1
+ 1 36
2
Me( II ) = Li 1 +
ci = 20 + 2
10 = 24,84
ni
31
Me( I ) + Me( II )
= 24,68
2
1.5
Mediana (i).
26
1.5
Moda (a).
1.5
Moda (b): ejemplo.
x(i): salario mensual
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N
n(i)
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100
27
La amplitud de los
intervalos es la misma
(sabiendo que (Li-1 , Li)
es el intervalo con mayor
frecuencia absoluta) :
Mo = Li 1 +
ni ni 1
c
(ni ni 1 ) + (ni ni +1 ) i
Mo = Li 1 +
La amplitud de los
intervalos es diferente
(sabiendo que (Li-1 , Li)
es el intervalo con mayor
densidad de frecuencia) :
d i d i 1
c
(d i d i 1 ) + (d i d i +1 ) i
di =
ni
ci
1.5
Moda (d): ejemplo.
L(i-1)-L(i)
0-1000
1000-2000
2000-3000
3000-4000
4000-5000
N
Mo = Li 1 +
ni ni 1
d i d i 1
(d i d i 1 ) + (d i d i +1 )
c(i)
1000
1000
1000
1000
1000
38
47
10
3
2
100
(ni ni 1 ) + (ni ni +1 )
L(i-1)-L(i)
0-1000
1000-3000
3000-4500
4500-5000
5000-6000
N
Mo = Li 1 +
n(i)
ci = 1000 +
n(i)
38
47
10
3
2
100
ci = 0 +
47 38
1000 = 1195,65
( 47 38) + ( 47 10)
c(i)
1000
2000
1500
500
1000
d(i)
0,038
0,024
0,007
0,006
0,002
0,038 0
Ojo! Aqu
buscamos el
intervalo con
mayor densidad
1000 = 723,81
28
1.5
Moda (e).
29
M r = (xi Ot )
i =1
ar = xi
i =1
ni
ni
mr = (xi x )
i =1
ni
Ampliar
Montero L,
Apndice tema
2.
i =1
ni
=x
x(i)*n(i)
80
800
8000
-133
2197
-36406
20
30
40
50
10
6
8
3
200
180
320
150
4000
5400
12800
7500
80000
162000
512000
375000
-66
21
107
70
432
71
1443
1647
-2838
242
19372
38580
a1 = xi
n(i)
10
35
sum:
a2 = xi
i =1
ni
930
30500
1137000
5789
18950
26,57
a1
871,43
a2
32485,71
a3
0,00
165,39
541,43
a3 = xi
i =1
ni
m1
m2
n
m3
m2 = ( xi x )
n
m1 = ( xi x )
i =1
ni
=0
i =1
ni
= S2
m3 = ( xi x )
i =1
ni
30
r
h r
mr = ( 1) a1h ar h
h =0
h
x = a1
con:
En el ejemplo anterior:
x(i)
10
20
30
40
50
N
n(i)
x(i )* n(i)
8
10
6
8
3
80
200
180
320
150
35
sum:
x(i)^2* n(i)
x(i)^3*n(i)
800
4000
5400
12800
7500
8000
80000
162000
512000
375000
930
30500
1137000
26,57
871,43
32485,71
a1
a2
r
h r
mr = ( 1) a1h ar h
h=0
h
a3
2
2
2
m2 = (1) 0 a10 a2 0 + (1)1 a11a21 + ( 1) 2 a12 a2 2 =
0
1
2
2!
2!
2! 2
= (+1)
a2 + ( 1)
a1a1 + (+ 1)
a1 a0 =
0!(2 0 )!
1!(2 1)!
2!(0 )!
= a2 2a12 + a12 = a2 a12 = a2 x 2 = 871,43 (26,57 ) = 165,39
2
31
32
1.7
Varianza (a).
Es la ms importante de las medidas de
dispersin absolutas. La varianza se define
como:
n
S = ( xi x )
2
i =1
ni
33
1.7
Varianza (b).
x ( i ): s a la r io m e n s u a l n (i )
x ( i )* n (i ) x (i ) -x ( m e d ) ( x (i) -x (m e d )) ^ 2 (( x (i) -x ( m e d )) ^ 2 ) *n (i )
900
10
90 00
-547
2 99209
2992090
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
16
12
10
7
7
5
5
4
5
4
6
152
120
110
80
84
65
70
60
85
80
138
00
00
00
50
00
00
00
00
00
00
00
-497
-447
-347
-297
-247
-147
-4 7
53
253
553
853
2500
2
2750
1
3000
1
3500
2
4000
1
4500
1
5000
1
N
100
m e d ia a r it m t i c a 1 4 4 7
50
27
30
70
40
45
50
00
50
00
00
00
00
00
1053
1303
1553
2053
2553
3053
3553
2 47009
1 99809
1 20409
88209
61009
21609
2209
2809
64009
3 05809
7 27609
3952144
2397708
1204090
617463
427063
108045
11045
11236
320045
1223236
4365654
11
16
24
42
65
93
126
08809
97809
11809
14809
17809
20809
23809
su ma :
v a r ia n za :
S 2 = ( xi x )
i =1
2217618
1697809
2411809
8429618
6517809
9320809
12623809
60849100
608491
ni
1.7
Varianza (c). Propiedades (I).
La varianza es no
negativa:
S2 0
Es la medida cuadrtica
de dispersin ptima:
S 2 = (xi x )
i =1
n
ni
2 n
< (xi k ) i ; k x
i =1
Se puede expresar
mediante momentos
respecto al origen:
x n
2
i i
2
1
S = m2 = a2 a =
La varianza de la
transformacin ax+b de
una variable estadstica x
ser:
S(2ax+b) =
(ax + b x( ) )
ax+b
i =1
Es decir, la varianza es
invariante ante cambios
de origen; pero no ante
cambios de escala.
= (a(xi x( x ) ))
i =1
(x )
i =1
ni n
2 n
= (axi + b ax( x ) b) i =
i=1
n
ni
2 n
= a2 (xi x( x ) ) i = a2 Sx2
i =1
34
1.7
Varianza (d). Propiedades (II).
x n
2
i i
2
1
S = m2 = a2 a =
(x )
i =1
n(i) x(i)*n(i)
10
9000
16
12
10
7
7
5
5
4
5
4
6
x(i)^2 (x(i)^2)*n(i)
810000
8100000
15200
12000
11000
8050
8400
6500
7000
6000
8500
8000
13800
2500
2
5000
2750
1
2750
3000
1
3000
3500
2
7000
4000
1
4000
4500
1
4500
5000
1
5000
N
100 144700
media aritmtica 1447
varianza: 608491
902500
1000000
1210000
1322500
1440000
1690000
1960000
2250000
2890000
4000000
5290000
14440000
12000000
12100000
9257500
10080000
8450000
9800000
9000000
14450000
16000000
31740000
6250000 12500000
7562500
7562500
9000000
9000000
12250000 24500000
16000000 16000000
20250000 20250000
25000000 25000000
suma: 270230000
a2
2702300
1.7
Varianza (e). Desviacin tpica.
S =+ S =+
2 ni
(
)
x
x
i
i =1
35
1.7
Medidas de dispersin relativas (a).
1.7
V=
S
x
36
1.7
Vamos a suponer que la empresa del ejemplo anterior tiene una filial
en Hungra. En ambas localizaciones (Espaa y Hungra) la distribucin
de los salarios tiene los siguientes datos:
Media aritmtica
Varianza
Desviacin tpica
V
Espaa
1447 euros
608491 euros cuadrado
780 euros
0,539087
Hungra
3280 05 florines
254835551 16 florines cua drado
1596 36 florines
0,4866 86
muchas gracias!
37