Вы находитесь на странице: 1из 37

Tema 1

Variable estadstica unidimensional.


Caractersticas de posicin y
dispersin
Estadstica Empresarial

Contenidos:
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.
1.7.

Qu es la Estadstica.
Conceptos bsicos.
Distribuciones de frecuencias.
Representaciones grficas.
Caractersticas de una distribucin de frecuencias.
Medidas de posicin.
Momentos respecto al origen y respecto a la
media.
Medidas de dispersin.

1.1
Qu es la Estadstica (a).
La Estadstica se configura como la
tecnologa del mtodo cientfico que
proporciona instrumentos para la toma de
decisiones cuando stas se adoptan en
ambiente de incertidumbre, siempre que esa
incertidumbre pueda ser medida en trminos
de probabilidad. Por ello, la Estadstica se
preocupa de los mtodos de recogida y
descripcin de datos, as como de generar
tcnicas para el anlisis de esta informacin.
F. J. Martn Pliego.

1.1
Qu es la Estadstica (b).



La Economa forma parte de las Ciencias


Sociales.
Las Ciencias Sociales se caracterizan por
basarse en regularidades, no en relaciones
exactas, ya que dependen del
comportamiento humano que, a su vez,
depende de inabarcables factores.
La Estadstica permite trabajar en este
contexto de incertidumbre, detectando y
cuantificando las regularidades observadas, y
midiendo el grado de certidumbre de dichas
regularidades.

1.2 Conceptos bsicos (a). Poblacin y


muestra.


Poblacin: conjunto de elementos que


poseen una determinada caracterstica:
personas asalariadas en Espaa. Cada
elemento: individuo.
Muestra: subconjunto de la poblacin
elegido en trminos de
representatividad.

Ampliar

Montero
Lorenzo, 1.1

1.2 Conceptos bsicos (b). Mtodo


Estadstico.
Mtodo
inductivo

Recoge el
comportamiento
de la muestra
respecto a un
fenmeno a
estudiar

Lo plasma en un
modelo
matemtico
(representacin
necesariamente
simplificada de la
realidad)

A travs del modelo


generaliza el
comportamiento de
la muestra a toda la
poblacin

1.2 Conceptos bsicos (c). Variables y


atributos (I).


Variable: caracterstica de una poblacin o


fenmeno que afecta a sta que se concreta
en valores numricos (valores, datos) para
los diferentes individuos (observaciones). Ej.:
ganancia salarial.


Variable discreta: nmero finito o numerable de


valores.
Variable continua: nmero infinito de valores
dentro del intervalo en el que se defina.

1.2 Conceptos bsicos (d). Variables y


atributos (II).


Atributos (o variable cualitativa o factor):


carcter o fenmeno estadstico que no
puede tomar valores numricos. Los
resultados de su observacin se llaman
modalidades, categoras o niveles.


Ej.: sector en el que se es asalariado.

1.2 Conceptos bsicos (e). Escalas de


medida.


Escala nominal: categoras excluyentes entre


s sin relacin de orden (atributos): sector
econmico.
Escala ordinal: dem; pero con un orden
establecido (atributos): nivel de estudios.
Escala mtrica: unidad de medida (variables).

1.3
Distribuciones de frecuencias (a).


Tipos de frecuencias.
Ampliar




Absolutas y relativas.
Acumuladas.

Montero
Lorenzo, 1.2

Distribuciones unidimensionales de
frecuencias.



Agrupadas y no agrupadas.
Caractersticas de las distribuciones agrupadas.

1.3 Distribuciones de frecuencias (b).


Frecuencia absoluta.


Variable X, que toma valores x1, x2, xn.


Frecuencia total (N): nmero total de
observaciones.
Frecuencia absoluta (ni): n veces que se
repite el valor xi.
La suma de todas las frecuencias absolutas es
igual a N.

1.3 Distribuciones de frecuencias (c).


Frecuencia relativa.


Frecuencia relativa (fi): proporcin (en tantos


por 1) de las observaciones de xi que hay en
el total de observaciones:

fi =


ni


La suma de las frecuencias relativas es 1.

1.3 Distribuciones de frecuencias (d).


Frecuencias acumuladas.


Frecuencia absoluta acumulada:


i

 i = n1 + n2 + ... + ni = n j
j =1


La ltima frecuencia absoluta acumulada es N.

Frecuencia relativa acumulada:


i

Fi = f1 + f 2 + ... + f i = f j
j =1


La ltima frecuencia relativa acumulada es 1.

1.3 Distribuciones de frecuencias (e).


Ejemplo frecuencias: escala mtrica.
Distribucin salarial en una empresa de 28 trabajadores.
salario (cientos de euros)
10
11
12
13
20
25
30
50
N

n(i)

f(i)
3
5
7
5
4
2
1
1
28

N(i)
0,11
0,18
0,25
0,18
0,14
0,07
0,04
0,04
1,00

F(i)
3
8
15
20
24
26
27
28
0

0,11
0,29
0,54
0,71
0,86
0,93
0,96
1,00
0,00

1.3 Distribuciones de frecuencias (f).


Ejemplo frecuencias: escala ordinal.
Empresas clasificadas por nivel de proactividad
ambiental en el trmino municipal XXX.

Nivel proactividad
Proactividad baja
Proactividad media
Proactividad alta
Total (N)

ni

fi
10
7
3
20

Ni
0,50
0,35
0,15
1,00

Fi
10
17
20

0,50
0,85
1,00

1.3 Distribuciones de frecuencias (g).


Ejemplo frecuencias: escala nominal.
Ocupados por sector econmico CLM (II trim. 2007)

n(i)
Agricultura
Industria
Construccin
Servicios
Total (N)

53,4
143,7
145,6
492,4
835,1

f(i)
0,0639
0,1721
0,1744
0,5896
1,0000

N(i)
53,4
197,1
342,7
835,1

F(i)
0,0639
0,2360
0,4104
1,0000

Nota: aqu no tiene mucho sentido plantear frecuencias acumuladas, ya que


no existe una preferencia entre los niveles del atributo.

1.3

Distribuciones de frecuencias (h).


Distribuciones unidimensionales de
frecuencias.


Distribuciones unidimensionales de
frecuencias.


Unidimensional: slo se considera una variable o


atributo.
Una distribucin de frecuencias queda definida por
los valores que puede tomar la variable o atributo
y su frecuencia: (xi, ni). Es decir, es el conjunto de
valores que ha tomado una variable con sus
frecuencias correspondientes.

1.3 Distribuciones de frecuencias (i).


Distribuciones agrupadas y no
agrupadas.


No agrupadas: cada valor xi se presenta con


su correspondiente frecuencia ni.


Si para todos los xi, ni=1: distribucin de


frecuencias unitarias.

Agrupadas: los valores xi se agrupan en


intervalos (Li-1 Li]


En el intervalo estn los xi mayores que Li-1 y


menores o iguales que Li.

1.3 Distribuciones de frecuencias (j).

Caractersticas de las distribuciones


agrupadas.


Amplitud del intervalo ci: diferencia entre el


extremo superior Li y el inferior Li-1.
Marca de clase xi: valor representativo del
intervalo:

xi =

Li 1 + Li
2

1.3 Distribuciones de frecuencias (k).


Ejemplos distribuciones de
frecuencias.
x(i)

Distribucin de
frecuencias no agrupada
en intervalos:

Distribucin de
frecuencias agrupada en
intervalos:

n(i)
10
11
12
13
20
25
30
50
N

L(i)-L(i-1)
0-500
500-1000
1000-1500
1500-2000
2000-2500
2500-3000
N

3
5
7
5
4
2
1
1
28

n(i)

c(i)
7
9
6
4
3
1
30

x(i)
500
500
500
500
500
500

250
750
1250
1750
2250
2750

c(i): amplitud del intervalo; x(i): marca de clase

10

1.4
Representaciones grficas (a).


Caracteres cualitativos o atributos:







Diagramas de sectores.
Diagramas de barras.
Diagrama de Pareto.
Cartogramas y pictogramas.

Ampliar
Montero
Lorenzo, 1.3

Caracteres cuantitativos:


Distribuciones no agrupadas: diagramas de


barras, polgonos de frecuencias.
Distribuciones agrupadas: histogramas.

1.4 Representaciones grficas (b).


Atributos: grfico de barras.
Ocupados por sector econmico CLM (II trim. 2007)
n(i)
Agricultura
Industria
Construccin
Servicios
Total (N)

53,4
143,7
145,6
492,4
835,1

f(i)
0,0639
0,1721
0,1744
0,5896
1,0000

N(i)
53,4
197,1
342,7
835,1

F(i)
0,0639
0,2360
0,4104
1,0000

Ocupados por Sector Econmico CLM


600

Diagrama
de barras:

500
n(i)

400
300

n(i)

200
100
0
Agricultura

Industria

Construccin

Servicios

Sector

11

1.4

Representaciones grficas (c).


Atributos: grfico de sectores.
Ocupados por sector econmico CLM (II trim. 2007)
n(i)
Agricultura
Industria
Construccin
Servicios
Total (N)

53,4
143,7
145,6
492,4
835,1

f(i)
0,0639
0,1721
0,1744
0,5896
1,0000

N(i)

F(i)
0,0639
0,2360
0,4104
1,0000

53,4
197,1
342,7
835,1

Ocupados por Sector Econmico CLM


Agricultura; 0,0639; 6%

Diagrama
por
sectores:

Industria; 0,1721; 17%

Agricultura

Servicios; 0,5896; 60%

Construccin; 0,1744;
17%

Industria
Construccin
Servicios

1.4 Representaciones grficas (d).


Atributos: grfico de Pareto.
Ocupados por sector econmico CLM (II trim. 2007)
n(i)
Agricultura
Industria
Construccin
Servicios
Total (N)

53,4
143,7
145,6
492,4
835,1

f(i)
0,0639
0,1721
0,1744
0,5896
1,0000

N(i)

F(i)
0,0639
0,2360
0,4104
1,0000

53,4
197,1
342,7
835,1

1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000

800

Diagrama de
Pareto:

700
600
n(i)

500
400
300
200
100
0
Servicios

Construccin

Industria

F(i)

Ocupados por Sector Econmico CLM

n(i)
F(i)

Agricultura

Sector

12

1.4

Representaciones grficas (e).


Variables: d. no agrupadas (I).
salario (cientos de euros)
10
11
12
13
20
25
30
50
N

n(i)

f(i)
3
5
7
5
4
2
1
1
28

N(i)
0,11
0,18
0,25
0,18
0,14
0,07
0,04
0,04
1,00

F(i)
3
8
15
20
24
26
27
28
0

0,11
0,29
0,54
0,71
0,86
0,93
0,96
1,00
0,00

Salario por empleado

f(i)

Grfico de
barras:

0,5000
0,4500
0,4000
0,3500
0,3000
0,2500
0,2000
0,1500
0,1000
0,0500
0,0000

f(i)

10

11

12

13

20

25

30

50

N horas

1.4

Representaciones grficas (f).


Variables: d. no agrupadas (II).
salario (cientos de euros)
10
11
12
13
20
25
30
50
N

n(i)

f(i)
3
5
7
5
4
2
1
1
28

N(i)
0,11
0,18
0,25
0,18
0,14
0,07
0,04
0,04
1,00

F(i)
3
8
15
20
24
26
27
28
0

0,11
0,29
0,54
0,71
0,86
0,93
0,96
1,00
0,00

Salario por empleado

n(i)

Polgono de
frecuencias:

8
7
6
5
4
3
2
1
0

n(i)

10

11

12

13

20

25

30

50

N horas

13

1.4

Representaciones grficas (g).


Variables: dist. agrupadas (I).
n(i)

0-500
500-1000
1000-1500
1500-2000
2000-2500
2500-3000
N

f(i)
7
9
6
4
3
1
30

N(i)
0,23
0,30
0,20
0,13
0,10
0,03

F(i)
7
16
22
26
29
30

c(i)
0,23
0,53
0,73
0,87
0,97
1,00

x(i)
500
500
500
500
500
500

L(i)

250
750
1250
1750
2250
2750

L(i-1)

500
1000
1500
2000
2500
3000

0
500
1000
1500
2000
2500

Remuneracin bruta mensual por horas extras.

F(i)

Histograma:

10
9
8
7
6
5
4
3
2
1
0

n(i)

250

500

750

1000

1250

1500

1750 2000

2250

2500

2750

3000

x(i)

1.4

Representaciones grficas (h).


Variables: dist. agrupadas (II).

L(i)-L(i-1)
0-100
100-300
300-400
400-800

n(i)
1000
2000
2000
2000

c(i)

d(i)
100
200
100
400

10
10
20
5

Densidad de
frecuencia:

di =

ni
ci

di
20

Histograma:
15

10
5

100

200

300

400

500

600

700

800

Li

14

1.5 Caractersticas de una distribucin de


frecuencias (a).


Objetivo: clculo de medidas que sintetizan la


informacin contenida en una distribucin de
frecuencias.
Vamos a centrarnos en variables, aunque
algunas tambin sirven para los atributos.
Ampliar
Montero
Lorenzo, 2.1

1.5 Caractersticas de una distribucin de


frecuencias (b).
Tipos de Medidas

Posicin: fijan el comportamiento global de la variable

Central: fijan el centro de gravedad de la distribucin.

No central: medidas ms generales.

Dispersin: separacin de las observaciones entre s.


Forma: deformacin de la distribucin
respecto a un estndar.
Asimetra: deformacin horizontal.

Apuntamiento o curtosis: deformacin vertical.

15

1.5

Caractersticas de una distribucin de


frecuencias (c): Medidas de posicin.


Posicin central.


Media







Ampliar
Montero
Lorenzo, 2.2

Aritmtica.
Geomtrica.
Armnica.

Mediana.
Moda.

Posicin no central.


Cuantiles: cuartiles, deciles, percentiles

1.5 Media. Tipos de media. Media


aritmtica (a).
n

x n + x n + ... + xn nn
x= 1 1 2 2
=


xi ni
i =1

O bien:

x=

x1n1 + x2 n2 + ... + xn nn x1n1 x2 n2


x n
=
+
+ ... + n n = x1 f1 + x2 f 2 + ... + xn f n =





xi f i
i =1

16

1.5 Media. Tipos de media. Media


aritmtica (b).
x(i): salario mensual

n(i)
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N

f(i)
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100

N(i)
0,10
0,16
0,12
0,10
0,07
0,07
0,05
0,05
0,04
0,05
0,04
0,06
0,02
0,01
0,01
0,02
0,01
0,01
0,01
1,00

F(i)
10
26
38
48
55
62
67
72
76
81
85
91
93
94
95
97
98
99
100

0,10
0,26
0,38
0,48
0,55
0,62
0,67
0,72
0,76
0,81
0,85
0,91
0,93
0,94
0,95
0,97
0,98
0,99
1,00
suma:
media arit.:

x(i)*n(i)
9000
15200
12000
11000
8050
8400
6500
7000
6000
8500
8000
13800
5000
2750
3000
7000
4000
4500
5000
144700
1447,00

1447 es el valor representativo de la distribucin de frecuencias (centro de


gravedad de la distribucin): si todos los asalariados ganaran 1447 euros, el
montante global de los salarios sera igualmente 1447 x 100 = 144700 euros.

1.5 Media. Tipos de media. Media


aritmtica (c).
Cuando las distribuciones estn agrupadas en intervalos se calcula la media
respecto a la marca de clase:
L(i-1)-L(i)
0-1000
1000-2000
2000-3000
3000-4000
4000-5000
N

n(i)
38
47
10
3
2
100

c(i)
1000
1000
1000
1000
1000

f(i)

N(i)
0,38
0,47
0,10
0,03
0,02
1,00

F(i)
38
85
95
98
100

x(i)
0,38
0,85
0,95
0,98
1,00

500
1500
2500
3500
4500
suma:
media arit.:

x(i)*n(i)
19000
70500
25000
10500
9000
134000
1340,00

1340 es el valor representativo de la distribucin de frecuencias (centro de


gravedad de la distribucin): pero en este caso, la media por la frecuencia
total no coincide con la suma de los salarios: 1340 x 100 = 134000 euros, cuando
vimos si no se agrupan las observaciones que la suma de salarios es 144700
euros: error de agrupamiento.

17

1.5


Media. Tipos de media. Media


aritmtica (d): propiedades I.

La suma de las
desviaciones de los
valores de la
variable respecto a
su media, por sus
frecuencias
absolutas, es 0.
n

(xi x )ni = 0
i =1

1.5

x(i): salario mensual

10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100
1447

x(i)*n(i)
x(i)-x(med) (x(i)-x(med))*n(i)
9000
-547
-5470
15200
-497
-7952
12000
-447
-5364
11000
-347
-3470
8050
-297
-2079
8400
-247
-1729
6500
-147
-735
7000
-47
-235
6000
53
212
8500
253
1265
8000
553
2212
13800
853
5118
5000
1053
2106
2750
1303
1303
3000
1553
1553
7000
2053
4106
4000
2553
2553
4500
3053
3053
5000
3553
3553
suma:
0

Media. Tipos de media. Media


aritmtica (e): propiedades II.
x(i): salario mensual

n(i)

900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N
media aritmtica

n(i)

x(i)*n(i)

900
10
9000
Si dividimos la
950
16
15200 (hasta 1150)
distribucin
1000
12
12000 suma x(i)*n(i):
55250
1100
10
11000 suma n(i):
55
de frecuencias
1150
1004,55
7
8050 media:
1200
7
8400
en varios
1300
5
6500
1400
5
7000
subconjuntos
1500
4
6000 (hasta 2300)
disjuntos, la
1700
5
8500 suma x(i)*n(i):
58200
2000
4
8000 suma n(i):
36
media de las
2300
1616,67
6
13800 media:
2500
2
5000
medias de
2750
1
2750
cada
3000
1
3000
3500
2
7000 (hasta 5000)
subconjunto
4000
1
4000 suma x(i)*n(i):
31250
4500
1
4500 suma n(i):
9
es igual a la
5000
3472,22
1
5000 media:
media de toda
la distribucin
x  + x  + x3  3 1004,55 55 + 1616,67 36 + 3472,22 9
x= 1 1 2 2
=
= 1447
de

100
frecuencias.

18

1.5


Media. Tipos de media. Media


aritmtica (f): propiedades III.

Si
transformamos
los valores de
la distribucin
mediante
y(i)=ax(i)+b, la
media de los
valores
transformados
ser:

x(i): salario mensual

n(i)
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000

y = ax + b

10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100
media:

x(i)*n(i)
y(i)=0,3*x(i)+100
9000
370
15200
385
12000
400
11000
430
8050
445
8400
460
6500
490
7000
520
6000
550
8500
610
8000
700
13800
790
5000
850
2750
925
3000
1000
7000
1150
4000
1300
4500
1450
5000
1600
144700
1447
media:

y(i)*n(i)
3700
6160
4800
4300
3115
3220
2450
2600
2200
3050
2800
4740
1700
925
1000
2300
1300
1450
1600
53410
534,10

0,3 x + 100 = 0,3 1447 + 100 = 534,10 = y

1.5 Media. Tipos de media. Media


aritmtica (g): ventajas e
inconvenientes.


Ventajas:





Utiliza todos los valores de la distribucin.


Fcil de calcular y siempre es calculable.
Es nica.
Es el centro de gravedad de la distribucin.

Inconveniente: si en la distribucin hay


valores anormalmente extremos, puede ser
una medida escasamente representativa.

19

1.5 Media. Tipos de media. Media


geomtrica (a).
n

G =  x1n1 x2n2 L xnnn =  xini


i =1

Inconvenientes:



Invalidada cuando hay algn valor igual a 0.


No es determinable en determinados casos en los que los
valores son negativos.

Se utiliza para promediar variaciones acumulativas:


tipos de inters, porcentajes,tasas de variacin,
nmeros ndice

1.5 Media. Tipos de media Media


geomtrica (b).


Ejemplo: suponemos que invertimos 6000 euros en un depsito a 6 aos. En estos aos,
los tipos de inters anuales aplicados han sido el 5%, 3%, 1%, 2%, 1%, 3% por este
orden. Por tanto, al final del perodo la cantidad obtenida ser:

6000 (1 + 0.05) (1 + 0.03) (1 + 0.01) (1 + 0.02 ) (1 + 0.01) (1 + 0.03) = 6954,37




Aplicando la media geomtrica a las tasas acumulativas:

G = 6 (1 + 0,05)1 (1 + 0,03) 2 (1 + 0,01) 2 (1 + 0,02)1 = 1,025




Es decir, un tipo de inters medio acumulado del 0,25%. Si hubiramos aplicado este tipo a
todos los aos, al final se hubiera obtenido la misma cantidad:

6000 (1 + 0.025)6 = 6954,37




Aplicando la media aritmtica NO se obtendra un resultado correcto (aunque muy cercano,


en este ejemplo concreto).

20

1.5 Media. Tipos de media. Media


armnica (a).
H=

1
1
1
n1 +
n2 + L +
nn
x1
x2
xn


n

xi ni
i =1

Inconvenientes:


Invalidada cuando hay algn valor igual a 0.

Se utiliza para promediar variables cuyas unidades de


medidas son cocientes entre magnitudes:
productividades, rendimientos, velocidades, etc.

1.5 Media. Tipos de media. Media


armnica (b).


Ejemplo: suponemos que una empresa dispone de mquinas con 3 tipos de


productividad diaria (produccin/da), de acuerdo con la siguiente distribucin de
frecuencias (el nmero de mquinas de cada tipo salen de dividir la produccin diaria de
cada uno entre la productividad):
x(i)=tipos de mquina
A
B
C
N

La media armnica de las productividades ser:

H=

x(i)= productividad n(i) produccin n mquinas


100
3000
30
150
4500
30
200
6000
30
13500

13500
= 150
3000 4500 6000
+
+
100
150
200

Ntese que si cada una de las 90 mquinas tuviera una productividad equivalente a la
media armnica, la produccin total sera 150 x 90 = 13500, la produccin total.

21

1.5 Media. Tipos de media. Relacin


entre tipos de media.

H G x

1.5
Mediana (a).


Suponiendo los valores de la variable


ordenados de menor a mayor, la mediana es
el valor que divide a la distribucin de
frecuencias en dos partes con el mismo
nmero de frecuencias u observaciones.

22

1.5
Mediana (b).


Si N es impar, la
mediana ser aquel
valor que ocupe la
posicin:

 1
+1
2

Si N es par, habr dos


valores medianos,
ocupando las
posiciones:


2


+1
2

1.5
Mediana (c): ejemplos I.
x(i): salario mensual
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N

n(i)
8
10
6
8
3
3
5
4
2
2
2
5
2
1
1
2
1
1
1
67

x(i)*n(i)
7200
9500
6000
8800
3450
3600
6500
5600
3000
3400
4000
11500
5000
2750
3000
7000
4000
4500
5000

N(i)
8
18
24
32
35
38
43
47
49
51
53
58
60
61
62
64
65
66
67

En este caso N es impar (67),


por lo que habr un valor
mediano, ocupando la
posicin: ((67-1)/2)+1=34.
Ayudndonos de la frecuencia
absoluta acumulada, vemos
que el valor de la variable que
ocupa la posicin 34 es el
1150.

23

1.5
Mediana (d): ejemplos II.
x(i): salario mensual
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N

n(i)
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100

x(i)*n(i)
9000
15200
12000
11000
8050
8400
6500
7000
6000
8500
8000
13800
5000
2750
3000
7000
4000
4500
5000

N(i)
10
26
38
48
55
62
67
72
76
81
85
91
93
94
95
97
98
99
100

En este caso N es par (100),


por lo que habr dos valores
medianos ocupando las
posiciones: (100/2)=50 y
(100/2)+1=51. Ayudndonos
de la frecuencia absoluta
acumulada, vemos que el
valor de la variable que ocupa
ambas posiciones es el 1150,
con lo que en este ejemplo
hay un nico valor mediano;
pero perfectamente podran
ser dos distintos.

1.5
Mediana (e).


Cuando N es par, y existen dos valores


medianos distintos, por convenio se suele
tomar como nico valor mediano la media
aritmtica de ambos.

24

1.5 Mediana (f): frecuencias agrupadas


en intervalos.


Si N es impar, la mediana ser aquel


valor que ocupe la posicin
(Sabiendo que (Li-1 , Li) es el
intervalo donde se encuentra el
valor mediano) :

Si N es par, habr dos valores


medianos. Si ambos estn en el
mismo intervalo (Li-1 , Li), ocuparn
las posiciones:

En este caso, se puede tomar la


media aritmtica como nico valor
mediano.

 +1
 i 1
Me = Li 1 + 2
ci
ni


 i 1
Me = Li 1 + 2
ci
ni

+ 1  i 1
Me = Li 1 + 2
ci
ni

Si pertenecen a distintos intervalos,


se procede de forma anloga.

1.5 Mediana (g): frecuencias agrupadas


en intervalos: ej. I.
L(i-1)-L(i)
0-10
10-20
20-30
30-40
40-50
N

n(i)

c(i)
34
47
39
35
4
159

10
10
10
10
10

N(i)
34,00
81,00
120,00
155,00
159,00

 +1
159 + 1
 i 1
34
2
Me = Li 1 +
ci = 10 + 2
10 = 19,79
ni
47


En este ejemplo N es impar. Mediante la frecuencia absoluta


acumulada sabemos que el intervalo mediano es el (10,20].
Aplicamos la frmula para obtener el valor de la mediana.

25

1.5 Mediana (h): frecuencias agrupadas


en intervalos: ej. II.
L(i-1)-L(i)
0-10
10-20
20-30
30-40
40-50
N

n(i)

c(i)
12
24
31
29
4
100


100
 i 1
36
Me( I ) = Li 1 + 2
ci = 20 + 2
10 = 24,52
ni
31

Me =


10
10
10
10
10

N(i)
12,00
36,00
67,00
96,00
100,00


100
+ 1  i 1
+ 1 36
2
Me( II ) = Li 1 +
ci = 20 + 2
10 = 24,84
ni
31

Me( I ) + Me( II )
= 24,68
2

En este ejemplo N es par. Mediante la frecuencia absoluta acumulada


sabemos que el intervalo mediano es el (20,30].
Aplicamos las frmulas para obtener los valores medianos, y se
procede a calcular su media aritmtica como nico valor mediano.

1.5
Mediana (i).


Buena medida de posicin central cuando


existen valores extremos anmalos.
En el caso de atributos expresados en escala
ordinal.

26

1.5
Moda (a).


La Moda es el valor ms repetido en la


distribucin de frecuencias, es decir, el de
mayor frecuencia absoluta ni.

1.5
Moda (b): ejemplo.
x(i): salario mensual
900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300
2500
2750
3000
3500
4000
4500
5000
N

n(i)
10
16
12
10
7
7
5
5
4
5
4
6
2
1
1
2
1
1
1
100

27

1.5 Moda (c):distribuciones agrupadas en


intervalos.


La amplitud de los
intervalos es la misma
(sabiendo que (Li-1 , Li)
es el intervalo con mayor
frecuencia absoluta) :

Mo = Li 1 +

ni ni 1
c
(ni ni 1 ) + (ni ni +1 ) i

Mo = Li 1 +

La amplitud de los
intervalos es diferente
(sabiendo que (Li-1 , Li)
es el intervalo con mayor
densidad de frecuencia) :

d i d i 1
c
(d i d i 1 ) + (d i d i +1 ) i
di =

ni
ci

1.5
Moda (d): ejemplo.
L(i-1)-L(i)
0-1000
1000-2000
2000-3000
3000-4000
4000-5000
N

Mo = Li 1 +

ni ni 1

d i d i 1

(d i d i 1 ) + (d i d i +1 )

c(i)
1000
1000
1000
1000
1000

38
47
10
3
2
100

(ni ni 1 ) + (ni ni +1 )
L(i-1)-L(i)
0-1000
1000-3000
3000-4500
4500-5000
5000-6000
N

Mo = Li 1 +

n(i)

ci = 1000 +

n(i)
38
47
10
3
2
100

ci = 0 +

47 38
1000 = 1195,65
( 47 38) + ( 47 10)

c(i)
1000
2000
1500
500
1000

d(i)
0,038
0,024
0,007
0,006
0,002

0,038 0

(0,038 0) + (0,038 0,024)

Ojo! Aqu
buscamos el
intervalo con
mayor densidad

1000 = 723,81

28

1.5
Moda (e).


La moda es la mejor medida de tendencia


central en el caso de atributos presentados
en escala nominal.

1.5 Medidas de posicin no central:


cuantiles.





Son aquellos valores de la variable que, ordenados


stos de menor a mayor, dividen a la distribucin en
partes, de manera que cada una contiene el mismo
nmero de frecuencias u observaciones.
Son una generalizacin de la mediana.
Por ejemplo, los cuartiles son valores que dividen a la
distribucin en 4 partes con igual nmero de
frecuencias u observaciones.
los percentiles son valores que dividen a la
distribucin en 100 partes con igual nmero
de frecuencias u observaciones.
Ampliar
Montero
Lorenzo, 2.2.2

29

1.6 Momentos respecto al origen y


respecto a la media (a).


Los momentos son unos valores que, respecto a un origen


arbitrario Ot, se definen como:
n

M r = (xi Ot )

i =1


Si Ot=0, tendremos los momentos respecto al origen:


n

ar = xi
i =1


ni


ni


Si Ot=media aritmtica, tendremos los momentos


respecto a la media:
n

mr = (xi x )

i =1

ni


Ampliar
Montero L,
Apndice tema
2.

1.6 Momentos respecto al origen y


respecto a la media (b).


Un ejemplo. Se calculan los momentos respecto al origen y


respecto a la media de rdenes 1, 2 y 3:
x(i)

i =1

ni
=x


x(i)*n(i)

x(i)^2*n(i) x(i)^3*n(i) (x(i)-x(med))*n(i) (x(i)-x(med))^2*n(i) (x(i)-x(med))^3*n(i)

80

800

8000

-133

2197

-36406

20
30
40
50

10
6
8
3

200
180
320
150

4000
5400
12800
7500

80000
162000
512000
375000

-66
21
107
70

432
71
1443
1647

-2838
242
19372
38580

a1 = xi

n(i)

10

35
sum:

a2 = xi
i =1

ni


El momento respecto al origen


de orden 1 es la media
aritmtica.

930

30500

1137000

5789

18950

26,57
a1

871,43
a2

32485,71
a3

0,00

165,39

541,43

a3 = xi
i =1

ni


m1

m2
n

m3

m2 = ( xi x )
n

m1 = ( xi x )
i =1

ni
=0


i =1

ni
= S2


m3 = ( xi x )
i =1

ni


El momento respecto a la media


de orden 2 es la varianza.

30

1.6 Momentos respecto al origen y


respecto a la media (c).


Existe una propiedad basada en el desarrollo del binomio de


Newton que permite calcular los momentos respecto a la
media a partir de los momentos respecto al origen:

r
h r
mr = ( 1) a1h ar h
h =0
h

x = a1

con:

1.6 Momentos respecto al origen y


respecto a la media (d).


En el ejemplo anterior:
x(i)
10
20
30
40
50
N

n(i)

x(i )* n(i)

8
10
6
8
3

80
200
180
320
150

35
sum:

x(i)^2* n(i)

x(i)^3*n(i)

800
4000
5400
12800
7500

8000
80000
162000
512000
375000

930

30500

1137000

26,57

871,43

32485,71

a1

a2

r
h r
mr = ( 1) a1h ar h
h=0
h

a3

2
2
2
m2 = (1) 0 a10 a2 0 + (1)1 a11a21 + ( 1) 2 a12 a2 2 =
0
1
2
2!
2!
2! 2
= (+1)
a2 + ( 1)
a1a1 + (+ 1)
a1 a0 =
0!(2 0 )!
1!(2 1)!
2!(0 )!
= a2 2a12 + a12 = a2 a12 = a2 x 2 = 871,43 (26,57 ) = 165,39
2

31

1.7 Medidas de dispersin: Introduccin


(a).


Objetivo: medir la representatividad de las


medidas de posicin.
Esto equivale a cuantificar la separacin de
los valores de la distribucin respecto a la
medida de posicin considerada.
A esta separacin se la denomina dispersin
o variabilidad.
Ampliar
Montero
Lorenzo, 2.3

1.7 Medidas de dispersin: Introduccin


(b): tipos de medidas de dispersin.
Supongamos dos distribuciones de frecuencias. Ambas
tienen como media aritmtica un mismo valor x:
x

Puede comprobarse como en la primera distribucin la


media es representativa de los valores que toman los
diferentes individuos; pero en el segundo caso no se
puede considerar: existe una gran dispersin.

32

1.7 Medidas de dispersin: Introduccin


(c): tipos de medidas de dispersin.


Podemos distinguir dos tipos de medidas:




Absolutas: estn expresadas en las unidades, o en


transformaciones de las unidades en las que
vienen expresadas las distribuciones de
frecuencias: Kg., euros, euros al cuadrado
Relativas: no vienen expresadas en unidades
(adimensionales). Por tanto, permiten comparar la
dispersin de distribuciones de frecuencias
expresadas en distintas unidades de medida.

1.7
Varianza (a).
Es la ms importante de las medidas de
dispersin absolutas. La varianza se define
como:
n

S = ( xi x )
2

i =1

ni


33

1.7
Varianza (b).
x ( i ): s a la r io m e n s u a l n (i )
x ( i )* n (i ) x (i ) -x ( m e d ) ( x (i) -x (m e d )) ^ 2 (( x (i) -x ( m e d )) ^ 2 ) *n (i )
900
10
90 00
-547
2 99209
2992090
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300

16
12
10
7
7
5
5
4
5
4
6

152
120
110
80
84
65
70
60
85
80
138

00
00
00
50
00
00
00
00
00
00
00

-497
-447
-347
-297
-247
-147
-4 7
53
253
553
853

2500
2
2750
1
3000
1
3500
2
4000
1
4500
1
5000
1
N
100
m e d ia a r it m t i c a 1 4 4 7

50
27
30
70
40
45
50

00
50
00
00
00
00
00

1053
1303
1553
2053
2553
3053
3553

2 47009
1 99809
1 20409
88209
61009
21609
2209
2809
64009
3 05809
7 27609

3952144
2397708
1204090
617463
427063
108045
11045
11236
320045
1223236
4365654

11
16
24
42
65
93
126

08809
97809
11809
14809
17809
20809
23809
su ma :
v a r ia n za :

S 2 = ( xi x )
i =1

2217618
1697809
2411809
8429618
6517809
9320809
12623809
60849100
608491

ni


Problema de interpretacin: 608491 euros cuadrado indica una dispersin


grande o pequea? Es el problema de las medidas absolutas.

1.7
Varianza (c). Propiedades (I).


La varianza es no
negativa:

S2 0

Es la medida cuadrtica
de dispersin ptima:

S 2 = (xi x )

i =1


n
ni
2 n
< (xi k ) i ; k x
 i =1


Se puede expresar
mediante momentos
respecto al origen:

x n

2
i i

2
1

S = m2 = a2 a =

La varianza de la
transformacin ax+b de
una variable estadstica x
ser:
S(2ax+b) =

(ax + b x( ) )

ax+b

i =1

Es decir, la varianza es
invariante ante cambios
de origen; pero no ante
cambios de escala.

= (a(xi x( x ) ))
i =1

(x )

i =1

ni n
2 n
= (axi + b ax( x ) b) i =
 i=1


n
ni
2 n
= a2 (xi x( x ) ) i = a2 Sx2


i =1

34

1.7
Varianza (d). Propiedades (II).


Calculando la varianza mediante la


propiedad que la relaciona con los
momentos respecto al origen:

x(i): salario mensual


900
950
1000
1100
1150
1200
1300
1400
1500
1700
2000
2300

x n

2
i i

2
1

S = m2 = a2 a =

(x )

i =1

n(i) x(i)*n(i)
10
9000
16
12
10
7
7
5
5
4
5
4
6

x(i)^2 (x(i)^2)*n(i)
810000
8100000

15200
12000
11000
8050
8400
6500
7000
6000
8500
8000
13800

2500
2
5000
2750
1
2750
3000
1
3000
3500
2
7000
4000
1
4000
4500
1
4500
5000
1
5000
N
100 144700
media aritmtica 1447
varianza: 608491

902500
1000000
1210000
1322500
1440000
1690000
1960000
2250000
2890000
4000000
5290000

14440000
12000000
12100000
9257500
10080000
8450000
9800000
9000000
14450000
16000000
31740000

6250000 12500000
7562500
7562500
9000000
9000000
12250000 24500000
16000000 16000000
20250000 20250000
25000000 25000000
suma: 270230000
a2
2702300

1.7
Varianza (e). Desviacin tpica.


La desviacin tpica es la raz cuadrada


positiva de la varianza.
n

S =+ S =+

2 ni
(
)
x

x
i
i =1

Ventaja: se eliminan las unidades al


cuadrado en la medida de la dispersin.

35

1.7
Medidas de dispersin relativas (a).


1.7

Surgen de la necesidad de poder comparar la


dispersin de variables estadsticas
expresadas en diferentes unidades.
Estudiaremos el coeficiente de variacin de
Pearson.

Medidas de dispersin relativas (b).


Coeficiente de variacin de Pearson
(I).


El coeficiente de variacin de Pearson se


define como el cociente entre la desviacin
tpica y la media aritmtica.

V=


S
x

A mayor V -> mayor dispersin -> menor


representatividad de la media.

36

1.7

Medidas de dispersin relativas (c).


Coeficiente de variacin de Pearson
(II).


Vamos a suponer que la empresa del ejemplo anterior tiene una filial
en Hungra. En ambas localizaciones (Espaa y Hungra) la distribucin
de los salarios tiene los siguientes datos:
Media aritmtica
Varianza
Desviacin tpica
V

Espaa
1447 euros
608491 euros cuadrado
780 euros
0,539087

Hungra
3280 05 florines
254835551 16 florines cua drado
1596 36 florines
0,4866 86

Aparentemente pareca que, al tener la filial de Hungra unas mayores


varianza y desviacin tpica, sus salarios tendran una mayor
dispersin. Pero el coeficiente de Pearson V muestra que eso es
errneo. El engao se deba a las unidades, ya que un euro equivale
a unos 236 florines hngaros. Por tanto, el salario medio de la empresa
hngara es algo ms representativo del total de salarios que en el caso
espaol.

Fin del tema.




Hemos llegado al final de la


exposicin

muchas gracias!

37

Вам также может понравиться