Академический Документы
Профессиональный Документы
Культура Документы
Paraninfo
:X-// ¿)o 1 - ~
'-¡ z ,(..
=e? o ·- éJro lj S tJ ~ 2 - e:.- e J
-=:,;e_~
"::~.><'-
'5?.. ,
\2 c.__ ;<. ~ ) ro~l~civn
-- 5v S2'-.. C~nt- c:W 'ºl~c.¡~,)
V
Sección 1 • Introducción
Capítulo 1 La Estadística aplicada a la Economía 3
1.1 Estadística y rné:todos estadísticos . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Variables, atributos y escalas.. .. .. ......... ... ..... 6
1.1. 2. Población y muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
l. l. 3.Etapas del análisis estadístico . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Ciencia económica y Estadística....... ............ .. ... 9
-
Distribución de frec_uencias_
2.1
13
Variable estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1. l. Variable discreta y variable continua . . . . . . . . . . . . . . 14
2.2 Distribuciones de frecuencia . .. ..................... .. ... 15
2.2.1. Frecuencia absoluta y relativa . . . . . . . . . . . . . . .. . . . . . . 15
2. 2.2. Frecuencias acumuladis-: . ~ -~ ........ . .. .. .. .. .. .. 16
2.2.3. Distribución de frecuencias de una sola variable 16
2.2.4 . Recorrido, intervalos y marcas de clase.......... . 17
2.3 Representaciones gráficas . .. .................. :·.. .. ...... 18
2.3.1. Tipos de gráficas......... . ........ .. ................ . . 19
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Apéndice. Operadores Suma y Producto . . . . . . . . . . . . . . . . . . . . . 32
El operador suma o sumatorio .. . .. .. .. .. .. .. .. . . .. . . .. . . . 32
El operador producto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
IX
X • INTRODUCCIÓN A LA ESTADÍSTICA ECONÓMICA Y EMPRESARIAL
-----
3.6Moda
3.6.1. Cálculo de la moda .................................. .
53
53
3.7 Medidas de posición no centrales.. . ............... . ... . 58
3. 7.1. Los cuartiles .......................... : ............... . 59
3.7.2. Los deciles .. ........ . .... ... ... . ... . ... . .... ... .... .. . . 59
3. 7. 3. Los percentiles ....... .... ... .. .. ................. . .. . . 59
Ejercicios resueltos.............................................. 61
~ -Apéndice. Momentos potenciales. .. .... ....................... . 68
Momentos respecto al origen y momentos respecto
a la media . . . .. . . . .. .. .. . .. .. . . . . . . .. .. . .. .. .. . . . .. .. . . .. . . . . . 68
Capítulo 4 Dispersión 73
4. 1 Medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.1. Medidas de dispersión absolutas........................... 75
4.1. 2. Desviación media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.2 Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
_1.2.1.-_ Desviación_rípjs_a ,Q estándar . . . . . . . . . . . . . . . . . . . . . . . . 80
4.2.2. Propiedades de la varianza.... . ..... ........ . .. ..... 81
4.2.3. Propiedades de la desviación típica ..... .. .. .. .. ... 83
4.2.4. Tipificación...................................... .. . ... 84
4.3
- ........._ - - - _..., ....
Medidas de dispersión relativas......................... 86
.
4.2.5. Cálculo de la varianza.. .... . . . .................. . ... .
- 85
4.3.1.
'--~_...,.
4 .3. 2.
--...... --
Coeficiente de variación de Pearson..... .. . . . . . .. .
Indice de dispef'Si'Oñi'especto a la mediana . . . . . . .
.. 88
89
Ejercicios resueltos.... ........................................ . . 91
CONTENIDO 11 XI
Sección 3 • Desigualdad
Capítulo 6 Concentración 163
6.1 Medidas de concentración .............................. . 163
6.2 Índice de concentración de Gini y Curva de Lorenz. 164
6. 3 Coeficiente de concentración de Theil ................. 172
Ejercicios resueltos .. ......... ......... .......................... 176
Ejercicios de la Sección 3 ............................................ 179
CAPÍTULO 1
La Estadística
aplicada a la
Economía
3
4 • SECCIÓN 1. INTRODUCCIÓN
(a ) Escala nominal
(b ) Escala ordinal
Las medidas en escala ordinal son aquéllas que participando de las propiedades
de la escala nominal, se diferencian de éstas en que sí se puede establecer algún
tipo de orden, existiendo, pues, algún origen de referencia para tal ordenación.
Las observaciones que se puedan obtener sobre niveles de estudios (primarios,
medios, superiores, y otros) , estratificaciones de familias por su capacidad de
consumo (bajo, medio, alto , etc.) pertenecen a este tipo de escala ordinal.
(d ) Escala de proporción
Por otra parte, el análisis estadístico puede extenderse o no, a todo el conjunto
de elementos que participan del carácter objeto de nuestra investigación.
Recibe el nombre de población, colectivo o universo, todo el conjunto de
individuos o elementos que tienen unas características comunes.
No siempre es factible estudiar todos y cada uno de los elementos de lapo-
blación ya sea por razones de coste, de rapidez en la obtención de la informa-
8 • SECCIÓN 1. INTRODUCCIÓN
La Ciencia ~conómica, como el resto de las ciencias sociales, tiene por objeto
el estudio del comportamiento, en este caso desde la óptica económica, del ser
humano y de la sociedad en general, intentando descubrir las interrelaciones y
diferentes actitudes de los individuos o grupos sociales ante los estímulos de
carácter económico.
En esta ardua labor, el científico económico se encuentra con una sociedad
en continuo cambio, donde ciertas respuestas pertenecientes al pasado se en-
tremezclan con posturas ya impregnadas de hábitos del futuro siendo, en defi-
nitiva, imposible establecer normas fijas de comportamiento y leyes inmutables
que r~gulen las relaciones económicas.
Además, el científico económico encuentra que sus evidencias empíricas no
pueden ser obtenidas ·y repetidas en ningún laboratorio económico controlando
las condiciones de partida.
Ante esta situación, la utilización del método estadístico como método de
investigación en las ciencias sociales, no sólo es aconsejable sino que se hace
imprescindible. La posibilidad de disponer de instrumentos objetivables para la
verificación estadística de las hipótesis que sobre un determinado comporta-
miento económico se establezcan constituye la única salida racional al proceso
de investigación económica.
Cualquiera que sea, pues, el nivel en que se desarrolle una investigación
económica, se hace imprescindible el estudio y conocimiento de las principales
técnicas de la Estadística. El análisis formal de la economía sectorial, de los
problemas monetarios, de las finanzas públicas, de las políticas económicas que
puedan adoptarse, de la economía laboral, del comercio internacional, de la
economía empresarial, de la comercialización de productos, etc., requiere mé-
todos estadísticos. Es por ello por lo que parece necesario para todo economista
el estu<,lio de estas técnicas, incluso para el historiador económico, ya que cada
10 8 SECCIÓN 1. INTRODUCCIÓN
Distribuciones
de frecuencias
13
14 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
2.2 Distribuciones
de frecuencias
2.2.1. FRECUENCIA ABSOLUTA Y RELATIVA
/¡ = n¡ .
N
Por ejemplo, en nuestra tabla estadística,
Renta (euros) ' Free. ftbsolllta Qbs. acum. Free. rel. acum.
X¡
,•
11¡ f¡ 1' N¡ F¡
"'· .:&
901 > 1 1/20 1 1/20
931 3 3/20 4 4/20
949 2 - 2/20 6 6120
961 3 3/20 9 9120
973 5 5120 14 14120
991 1 1120 15 15/20
1 081 1 1120 16 16/20
1 117 2 2/20 18 18/20
1 202 1 1/20 19 19/20
1 232 1 1/20 20 =N 20/20 = 1
N= 20 1 - -
16 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARJABLE
Así, por ejemplo, N 1 = 16, nos dice que valores iguales o inferiores a
x7 = 1.081 hay 16.
D Frecuencia relativa acumulada. Es el resultado de dividir cada frecuencia
acumulada por el número total de datos. Se designa por F; .
En nuestro ejemplo,
F
7
= N? =~.
N 20
Es evidente que:
(a) La suma de todas las frecuencias relativas· es igual a la unidad. En efec-
to:
n n n n n +n +···+n N
LJ;=.:..:l.+-...1..+···+__1!_= 1 2 n=-=1.
i=t N N N N N
Nt =ni
N2 = ni+ n2
N3 = 11.¡ + ~ + n3
Por tanto
Para que dos distribuciones de frecuencias sean iguales han de ser iguales
los diferentes X; y sus frecuencias relativas f; .
África del
Norte
Los diagramas de rectángulos tienen una base constante y una altura pro-
porcional a la frecuencia absoluta correspondiente (Fig. 2.2) . Su superficie es
proporcional a la frecuencia absoluta.
500 000 -
B 400 000 -
.§
E
< -
"'
"'
-¡:;
300 000 ..
..,
e
1 ~
F -,_
::>
u
e 200 000 - -·
¡,¡.
r.
lOO 000 -
,,
Países del
01 1 '1
,_
Clase Clase
Media-alta alta
Clase
~~~· Clase
Media-Media Obrera
y
Media-Baja
Fueme: Manuel .García Ferrando, «Estratificación social en el campo español>>. Revista de Estudios
Agrosoctales, 102, 1978, pág. 21.
·' ·~'
X¡ ni Ni ·.!; ·Ft .
XI 0,1 0,1
x2 2 3 0,2 0,3
x3 4 0,1 0,4
x4 3 7 0,3 0,7
x5 3 10 0,3 1,0
10
5 N= lO
il
N4
3
it
ir
2
2
:+N
lt l 11
X¡ ~ X) x4 Xs X¡
y se conoce como densidad de frecuencia; por tanto, el área del rectángulo será
n.
S. = c. _j_ = n. .
l l c. l
l
-----------------...-----,
------------- .----
t
~ ............ L¡_¡
Lo- l; fl¡ NJ
l;- L2 n2 N2
L2- L3 ~ N3
Li-1- Lí n¡ N.1
: --------------------------~-~ -~-~-~
~ .... ........ LH
1
FIGURA 2.7. Polígono de frecuencias
% s/PIB
10,0
9,0
8,0
7 ,0 -
6,0 - ,,
5,0 -
4,0 -
,.;
,:, ,¡:
3,0
·• ·"1·~
2,0 - '
1,0 - ..
't/'
.
0,0
1978
1 1
1979 1980 1981
,.
1982
'
1983
·~
A veces presenta un gran interés efectuar este tipo de gráficos para varios
grupos y considerarlos cohjuntamente, comparándolos. Así se pueden observar
las áreas donde las distribuciones correspondientes coinciden o se separan.
Un ejemplo de esto se puede ver en un trabajo de M.S. Weitzman sobre las
distribuciones de los ingresos en las familias de población blanca y negra de los
Estados Unidos, reflejado en la figura 2.10.
28 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
%
14
12
Población
10 Población blanca
8
6
4
2
o
$1000 $2000 $5000 $50000
Ingresos
En este ejemplo, que hemos tomado del análisis gráfico realizado por
Weitzman , se produce una coincidencia del 71% del área de ambos polígonos
de frecuencias. Una segregación completa, del 0%, vendría dada por una re-
presentación gráfica en la que no se produjeran coincidencias mientras que, una
integración completa, del 100%, se produciría si coincidieran ambas poligona-
les.
L
DISTRIBUCIONES DE FRECUENCIAS • 29
Ejercicios resueltos
EJERCICIO 1
Investigados los precios por habitación de 50 hoteles de una ciudad se han obtenido
los siguientes resultados:
700, 300, 500, 400, 500, 700, 400, 750, 800, 500
500, 750, 300, 700, 1000, 1500, 500, 750, uoo, 800
400, 500, 300, 500, 1000, 300, 400, 500, 700, 500
300, 400, 700, 400, 700, 500, 400, 700, 1000, 750
700, 800, 750, 700, 750, 800, 700, 700, 1200, 800
Determínese:
l. La distribución de los precios:
(a) agrupados en frecuencias
(b) agrupados en 5 intervalos de igual amplitud.
2. Represéntense gráficamente dichas distribuciones.
SOLUCIÓN
(a) En primer lugar hay que proceder a la ordenación de la información, haciendo
recuento de las veces que se repite cada precio. Habremos formado así la tabla es-
tadística de la distribución de precios agrupados por frecuencias .
..'
Precios (x¡) 300 400 500 700 750 800 1000 1200 1500 Total
250 - 500 22
500 - 750 17
750- 1000 8
1000- 1250 2
1250- 1500
N=50
11 ------ -----------
10 ----------
7
6
5 --
3
2
--------------1
300 400 500 700750 800 1000 1200 1500 X¡
FIGURA 2.11
DISTRIBUCIONES DE FRECUENCIAS • 31
25
20
15
10
FIGURA 2.12
32 • SECCIÓN 2. ANALISIS ESTADÍSTICO DE UNA VARIABLE
APÉNDICE
Operadores Suma y Producto
El operador L: representa, pues, una suma y goza, por lo tanto, de todas las
propiedades de ésta. No obstante, vamos a desarrollar algunas de ellas:
(a) La suma de una constante desde 1 hasta n es n veces la constante.
En efecto,
n
Lk =k+ k+ .. · +k= n·k.
i= 1
(b) La suma de una constante por una variable es igual a la constante por
la suma de la variable
n n
L kx¡ = kx 1 + k.x2 + · · · + kx11 = k (x1 + x 1 + · · · + X 11 ) = k LX¡.
i= 1 i =1
DISTRIBUCIONES DE FRECUENCIAS • 33
EL OPERADOR PRODUCTO
rr"
i = 1
X¡ = X 1 · X2 · X3 · · · Xn .
rr n
i = 1
k = k . k . k ... k = k" .
rr
n
i = 1
kx¡ = kx1 · kx2 · · · kx, = k · k · · k · X1 · X 2 · • · Xn = k" rr
"
i = 1
X¡ .
log nn
i = 1
X¡ = log(x1 · X2 ···X,) =
n
= log x1 + log x2 + · · · + log x, = L log x;
i = 1
CAPÍTULO 3
Medidas de posición
35
36 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE l.iNA VARIABLE
En este proceso de síntesis buscamos unos valores que nos fijen el compor-
tamiento global del fenómeno a partir de los datos individuales recogidos en la
información disponible.
En una primera etapa se intentará resumir las características básicas de la
información en algunos valores sintéticos que reciben tradicionalmente el nom-
bre de medidas de posición.
Las medidas de posición, como veremos, podrán ser promedios (o valores
medios) o no, así como de tendencia central o no.
Los promedios más importantes son la media aritmética, la media geométri-
ca y la media armónica.
También estudiaremos, como medidas de posición, la mediana, la moda y
los cuantiles.
EJEMPLO
Sea la variable X que representa los pesos en kilogramos de 10 estudiantes y que pre-
senta los valores:
X¡ = {54, 59, 63, 64}
Es decir
X. ni
1
54 2
59 3
63 4
64 1
10
Pero esto sólo es válido en el supuesto más sencillo en que los datos de la
variable estén sin agrupar . En el caso de que tuviésemos una distribución con
datos agrupados, los valores individuales de la variable serían desconocidos y,
por tanto, no podríamos hacer uso de la fórmula anterior. En este supuesto se
postula la hipótesis de que el punto medio del intervalo de clase (marca de cla-
se) representa adecuadamente el valor medio de dicha clase; y se aplica la fór-
mula original de la media simple para dichos valores.
EJEMPLO
- ~
n xn
; 1
X=~-
¡ o l N
30-40 3 35
40 - 50 2 45 x= 35 · 3 + 45 · 2 + 55 · 5 = 470 = 47
50-60 5 55 10 10
10
Otro tema al que hay que hacer referencia es el de la llamada media arit-
mética ponderada, que se produce cuando se otorga a cada valor de la variable
x, una ponderación o peso, distinto de la frecuencia o repetición. En este caso,
en el cálculo de la media aritmética tendríamos en cuenta dichas ponderaciones,
38 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
:Lv}.)i
x = __,,'=·: : - - -
Lffi;
donde ro; son las ponderaciones respectivas.
EJEMPLO
Supongamos que un estudiante realizó tres exámenes en los que logró las puntuaciones
de 50, 80, 70; el primer examen lo hizo en media hora, el segundo en una hora y el
tercero en hora y media. Se les atribuye una ponderación de 1, 2 y 3, respectivamente.
Entonces,
50 1
80 2
70 3
x = 50 · 1 + 80 · 2 + 70 · 3 = 420 = 70 .
1+2+3 6
En efecto
n
n n n
¿x¡n¡
1
"(x.
L...J 1 - x)n.1 ¿x¡n¡ -x¿n¡ = N.:_¡=__.:=----- xN = NX- NX = O.
i = 1 i ~ 1 i ~ 1 N
que toma diferentes valores para una misma distribución de frecuencias, según
los distintos valores de k.
Si sumamos y restamos x, dentro del paréntesis, tenemos que:
n n
D(k) ::: ¿(X¡ - k) 2 _¡_ :::
i=1 N
n.
= ¿n (x. - k + x - x) 2 __.1_ =
i~I 1 N
n n
= L[(x.- x)- (k- x)f-L =
i=l 1 N
n. n. n.
= ¿n (x¡ - X)
2
__.1_ + (k - X)
2
¿n __.1_ - 2 (k - X) ¿n (x¡ - x) __.1_
!}] Si a todos los valores de una variable les sumamos una constante k, la
media aritmética queda aumentada también en esa constante. Es decir, la me-
1
n.)
1
--
dia aritmética queda afectada por los c_g.__mbios de..01:i.ge!!.
En efecto , sea la distribución de frecuencias (x.; ; su media es
n n.
x = ¿x.
i~l N 1
-L ·
GJ Si todos los valores de una variable los multiplicamos por una constante
k, su media aritmética también queda multiplicada por la misma constante. Es
decir, la media aritmética queda afectada por los qambios de escala:..
~--
Sea la distribución (x,-; ni) con
~ n.
X= ¿X. _l_
;~¡ 1 N
n n. n n.
x" = ¿ kx. N
i =l 1
_l_ = k I x. N
;~ ¡ 1
_l_ = kX .
n. n.
= a ¿n x . _l_ + b ¿n _l_ = ax + b .
i=l 1 N i=! N
X¡ ní-
XI ni
x2 n2
: : IN,
xh nh
xh+l .,,,}
N1
X nn
n
- -
N
de donde se han formado dos subconjuntos, el primero de los cuales recoge los
h primeros valores, y el segundo, los restantes . Tenemos que
h n
h 11 ""
L...J x,,
.n ""
L.J x,.n,.
n n ¿ X¡n ¡ + ¿ X¡n¡ N I i =NI + N2 i = h+ l
"" ; ; = 1 ; = h+l 1 N2
X = ,L.; X. - = - - ----'----- - = - -----'--------=----- =
i=l 'N N N
Como ventajas podemos citar las tres que se le exigen a una medida de sínte-
sis, es decir,
l. Consideración de todos los valores de la distribución.
2. Ser calculable.
3. Ser única.
42 • SECCIÓN 2. ANÁLISIS ESTADfSTICO DE UNA VARIABLE
Media geométrica
Sea una distribución de frecuencias (x;; n;) . La media geométrica, que repre-
sentaremos por G, se define como la raíz N-ésima del producto de los N valores
de la distribución.
Así:
W
n n.
X.1 ' =
i = 1
3.3.1. PROPIEDAD
En efecto
EJEM PLO
Sea una clase de 22 niños, en los cuales la talla se reparte del modo siguiente:
= -145,22193 = 2, 05554
22
G = antilog2,05554 = 113,6 cm.
EJEMPLO
Supongamos un capital colocado durante n años a unos tantos unitarios de interés anual
i1 , i2 ,
00 in . Si deseamos saber el tanto de interés medio del período, no debemos cal-
. ,
cular la media aritmética de los n tantos de interés anuales, pues nos daría un valor
erróneo. En efecto, sea e0 el capital inicial. Al final de cada año obtendremos los
montantes e l ' e 2, o, en siguientes:
00
el = eo (1 + ¡1)
e 2 = e 1(1 + i 2) = e 0 (1 + i1)(1 + i 2 )
El tanto medio i que estamos buscando tiene que ser el que cumpla la igualdad
(1 + iY = (1 + i 1) (1 + i2 ) 00
• (1 + Ín)
(1 + i) = ~(1 + ~) (1 + i 2 ) 00
• (1 + in)
Media armónica
La media armónica, H, de una distribución de frecuencias (x¡; n) se define como
N N
=---
H = 1 1 1 n 1
-X n1 + -n
X 2
+ ··· +-n
X n
'L - n¡
1 2 n i = 1 X¡
EJEMPLO
Supongamos un móvil que efectúa un recorrido de 100 km, en dos sentidos. En un
sentido va a una velocidad constante vi = 60 km/h y, en el otro, a una velocidad tam-
bién constante v2 = 70 kmlh y, por tanto, diferente de la anterior.
Sustituyendo
2s 200km
V=---
100 km 100 km
60 kmlh 70 km/h
2km 2
l
1
kmlh = 64,62 km/h ==H .
- +-
60 70
obteniéndose que la velocidad media es la media armónica de las velocidades de cada
recorrido.
G = ~x1 x2 ;
~;
2
--:1;-------:1;--- ::;
-+-
X¡ x2
4x1x 2 ::; x~ + x~ + 2x 1x 2
O ::; x~ + x~ - 2x1x 2
MEDIDAS DE POSICIÓN • 47
y siempre
con lo que H $ G.
con lo que
X¡ n¡ N.1
1 3 3
2 4 7
5 9 16
7 10 26
lO 7 33
13 2 35
35
donde
N = 35 = 17 5
2 2 ,
Suponemos, en primer lugar, que todos los valores comprendidos dentro del
mtervalo mediano se encuentran distribuidos uniformemente a lo largo de éL A
continuación, vamos a considerar la poligonal de frecuencias acumuladas co-
rrespondiente al intervalo mediano y a sus dos contiguos, y determinamos grá-
ficamente la mediana (Fig. 3.1).
N
1
2 1
1
1
1
.-------r-::;¡¡¡jfC·- ------~- C'
e: 1
1'1¡
FIGURA 3.1
Vemos que
Me= L¡_ 1 +m.
AC BC
===
AC' B'C'
6. 6.
ya que ABC =AB' C' .
50 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Pero
AC =m
AC' =c.l
- N
BC =--N.
2 t-1
B'C' = N.1
- N1-
.1 = n.
l
Por tanto ,
N
m -2 -Ni-1
c¡ ni
Es decir,
con lo que
N_N
2 i-1
Me= L.1-1 + n. c.1
1
EJEMPLO
Sea la siguiente distribución de salarios
671
N = 671 = 335 5
2 2 '
MEDIDAS DE POSICIÓN • 51
indica que el salario anual mediano está comprendido en el tercer intervalo. La ampli-
IUd de este intervalo es C; = 31 .
3.5.1. PROPIEDAD
k> Me. ·
Por definición de Me tendremos igual número de valores iguales o infería-
que iguales o superiores. Supongamos que hay m - 1 en cada lado; ten-
•m<>s que:
m-1 a-1 n
X; - k1 = ~)k - x¡) + I (k - x¡) + I (x; - k) [1]
i= l i=m i=a
m-1 a-1 n
x, - MeJ = L (Me- x¡) + L(X;- Me)+ I <x;- Me) [2]
i=l i=m i=a
n m-1
xí -k 1- L 1x; -Me j = :¿ (k- Me ) +
i =1 i = 1
[3]
a- 1 n
+ I (k + Me - 2x¡) + L (Me - k)
i = m i =a
52 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
a-1
Sumando y restando L, (k- Me) en [3]:
i=m
a-1 a-1
+ L (k + Me - 2x¡) + ¿(k - Me) =
i=m i=m
a-1
= (m - l)(k - Me) - (m - l)(k - Me) + ¿ (2k - 2x,) =
i=m
a-1
= 2 ¿(k- x¡).
i=m
Es decir
n n a-1
L1
i~1
X¡ - k 1- L1
i ~ 1
X¡ - Me 1 = 2 L (k -
i~m
x¡) > 0
luego
n n
'Lix;- kl > 'Lix; - Mel
i~ 1 i=1
n
por tanto ¿1 X; - Me 1 es mínimo para cualquier k > Me . Análogamente se
i= 1
CÁLCULO DE LA MODA
FIGURA 3.2
Ejemplos de los otros dos casos están representados en las figuras 3.3 y 3.4:
Moda Moda
rela1iva absolma
n.
1
---
n.
1 ni +!
---- ni-1
,.__!!}_~
FIGURA 3 .5
56 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Pero
m = ni+J
e¡- m n¡_ 1
de donde
Por tanto
EJEMPLO
L1_ 1 - L¡ n¡ C¡
o- 25 20 25
25- 50 40 25
50- 75 100 25--?
75- 100 60 25
220
Aplicando la fórmula
~.¡ 60
Mo = L1_ 1 + -~-'--- · c. = 50 + · 25 = 50 + 15 = 65 .
n¡_ 1 + ni+t ' 40 + 60
MEDIDAS DE POSICIÓN • 57
Obsérvese que cuando los intervalos son desiguales operamos con densida-
de frecuencias; es por esto por lo que en la fórmula anterior aparecen los
no los n¡ . Por otro lado, la deducción, en este caso, de dicha fórmula es
~-.u.o<U al caso anterior, con la diferencia, repetimos, de que ahora se conside-
densidades de frecuencias.
58 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
EJEMPLO
Añadiendo a la tabla de frecuencias ya conocida una columna adicional para d; .
400
d i-l 3,6
MO = L. 1 + · C¡ = 25 + · 25 = 25 + 20,5 = 45, 5 .
l- di - l + d i+ l 0, 8 + 3,6
Por último, cabe señalar que la moda es la medida más representativa en ca-
so de distribuciones en escala nominal. Esto es debido a que las distribuciones
de este tipo presentan los datos no susceptibles de ordenación, de tal forma que
para estas distribuciones no es posible realizar operaciones elementales con sus
observaciones.
Relacionar las medidas estudiadas (.X, Me, Mo) con los tipos de escalas es
algo muy importante , porque cada escala tiene su medida más apropiada.
LOS CUARTILES
los tres valores que dividen ·1a distribución en cuatro partes iguales, es de-
en cuatro intervalos dentro de cada cual están incluidos el veinticinco por
de los valores de la distribución.
LOS DECILES
los nueve puntos que dividen la distribución en diez partes de forma que,
de cada una, están incluidos el diez por ciento de los valores.
LOS PERCENTILES
3
C3 es el valor que ocupa el lugar ;
Deciles:
D1 es el valor que ocupa el lugar !!..
lO
2N
D2 es el valor que ocupa el lugar lo
Percentiles:
P.1 es el valor que ocupa el lugar !:!_
100
2N
P2 es el valor que ocupa el lugar 100
!_·N-N.
k 1-1
Qrfk = Li-1 + . C¡
n.1
en donde
para k = 4 y r = 1, 2, 3 , tendremos los cuartiles
para k = 10 y r = 1, 2, ... , 9 tendremos deciles
para k = 100 y r = 1, 2, ... , 99 tendremos percentiles
<20 7 7
20-40 13 20
40-60 35 55
60- 80 30 85
>80 15 100
100
:\ledia aritmética.
:\lediana.
~loda.
_JC/ÓN
x: como la distribución es abierta por ambos extremos, y como no tenemos in-
formación complementaria, no es posible calcular las marcas de clase del primer y
del último intervalo. Por tanto, no se puede calcular L x¡n¡ y, en consecuencia,
tampoco :X .
. N
Me: Valor que ocupa el lugar 2 = 50. Como N2 = 20 y N3 = 55, el intervalo
mediano es (40-60), luego:
N
- -N
Me= L. + 2 50 20
1-1
i-1 . c.
1
= 40 + - . 20 = 5714.
ni 35 '
e Mo: al ser los intervalos de diferente amplitud, tendríamos que calcular las densi-
dades de frecuencia, pero esto no es posible porque no se conoce la amplitud del
primer y del último intervalo. Por tanto, la moda tampoco se puede calcular.
62 • SECCIÓN 2. ANÁIJSIS ESTADÍSTICO DE UNA VARIABLE
Ejercicio 2
La distribución de los salarios en 2003 en el sector turístico de un país es la que
figura en la tabla siguiente. Calcúlese:
(a) El salario medio por trabajador (marca de clase del último intervalo 200 000).
(b) El salario más frecuente.
(e) Un s:;tlario tal que la mitad de los restantes sea inferior a él.
!1.
Li-1-4 n¡ X¡ X; · n¡ Ni d.1 = ...L
C¡
SOLUCIÓN
(a) El salario medio es la media aritmética:
(b) El salario más frecuente es el valor modal de la distribución. Como los intervalos son
desiguales hay que calcular la densidad de frecuencias y ver, así, cuál es el interva-
lo modal, el de mayor densidad. En este caso, es el que corresponde al intervalo
(35 000- 40 000). Para calcular el valor modal se aplica la fórmula correspondiente.
Mo = L. +
d l.+ l
· c.1 = 35 000 +
o' 061 5 000 =
1
¡ - di-1 + d i+ l 0,222 + 0,061
MEDIDAS DE POSICIÓN • 63
salario tal que la mitad de los restantes son inferiores a él, es el salario media-
Como
N= 5000
2 ,
unervalo mediano es (25 000 - 30 000), pues es el que contiene esa frecuencia
iiOIUJD)ada.
N _N
W: L 2 i -1 . c. = 25 000 + 5 000 - 4 505 . 5 000 =
• e = i- 1 + n. ' 955
l
3
empresas de importación han realizado, cada una de ellas, cuatro pagos en
a lo largo del año, siendo el cambio aplicado a cada operación así como la
!lllllllr:aci.ón trimestral en euros, las siguientes:
3,5
2,7
3,3
2,5
Caicúlese el tipo de cambio medio del dólar respecto al euro para cada una de las
. . empresas citadas.
-uCIÓN. Como vimos en la parte teórica, para promediar datos que vienen
apresados en términos relativos (€/$) hay que utilizar la media armónica (H).
64 • SECCIÓN 2. AN.ALISIS ESTADÍSTICO DE UNA VARIABLE
Empresa A:
L,n; _ __ 3_,5_+_2_
, 7_+_3,_3_+_
2,_5_ _ _ = _1_2_ = 1, 001 €/$.
1 1 1 1 11•98
"-n.
L...Jx_ 1
- -3 5 + - - 2 7 + !3 3 + - - 2 5
0,98 ' 0,99 ' 1 ' 1,05 '
1
Ejercicio 4
Una cadena hotelera tiene cinco hoteles de diferente número de plazas cada uno de
ellos. En el año 2003, los ingresos totales y el rendimiento por habitación de cada
hotel son los siguientes:
SOLUCIÓN. El rendimiento de cada hotel será igual a los ingresos del mismo,
partido por el número de habitaciones, es decir
R
1
= iL_
H donde H1 = !_;__
1 Rl
MEDIDAS DE POSICIÓN • 65
Ejercicio 5
t:a un determinado país la renta «per cápita>> ha sido en 1997 de 3 200 $. Se ha
lllimado que en los próximos ocho años se duplicará la renta <<per cápita».
Ddermínese:
Si la tasa de crecimiento de 1998 ha sido un 3% anual, ¿cuál será la renta
«per cápita» en ese período?
La tasa media anual acumulativa para poder alcanzar el objetivo de duplicar
esta renta.
,.... _JC/ÓN
La renta <<per cápita» de 1997 es de 3 200 $ y la tasa de crecimiento de 1998 es
del 3%, luego al final de ese período la renta será
Renta 98 = Renta 97 + Tasa crecim.98 x Renta 97 ==
= 3 200 + 0,03 + 3 200 =
= 3 200(1 + 0,03) =
= 3 200 X 1, 03 =
= 3 296$ .
66 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
(b) Dentro de ocho años (2005) se quiere que la renta «per cápita» sea el doble, es
decir,
Renta05 = 2 Renta97
La tasa media anual acumulativa r será tal que:
Renta05 = Renta97 (1 + r) 8
2 Renta97 = Renta 97 (1 + r) 8
2 . 3 200 = 3 200 (1 + d
r = Vi - 1 = 1,09 - 1 = 0,09 = 9% .
EJERCICIO 6
Disponemos de la información del número de turistas entrados en España durante
el mes de enero de los años 1990 y 1992, así como del gasto efectuado por los
turistas en dólares según su procedencia. La información es la siguiente:
;,
~~' -~~
1,•• •.. Año l99!J · Ar1v 1?92" _e<
Paises
i''i. Nil'iJe~turii'td;·_ ~
'•
aasto$ N° de turistas G~to$
Francia 300 37 500 350 45 000
Alemania 500 25 000 750 20 000
Inglaterra 450 14 000 500 16 000
Holanda 350 10000 350 12 500
Bélgica 400 6 500 400 7 500
Hállese la tasa media de crecimiento del gasto entre los dos años.
Gasio N° de turistas
x 1n1
x:¡ . ll¡ "'
Año 1990:
300 37 500 11 250 000
500 25 000 12 500 000
450 14 000 6 300 000 L X¡fl¡ 36 150 000
350 10 000 3 500 000
xoo = -- =
N 93 000
400 6 500 2 600 000
= 388,7 $.
N= 93 000 36 150 000
MEDIDAS DE POSICIÓN • 67
Año 1992:
15 750 000
15 000 000
8 000 000 _ L x;n, 46 125 000
X =--=---
4 375 000 92 N 101 000
3 000 000
= 456,68$.
N=lOlOOO 46 125 000
La rasa de crecimiento anual r entre los gastos medios de 1990 y 1992 será tal que
x92 = x90 (1 + d ,
456 68
r=JE-1= • - 1 = 1,0839 - 1
388,70
= o' 0839 = 8,39%.
/ SECCIÓN 2. ANÁLISIS ESTADISTICO DE UNA VARIABLE
/
APÉNDICE
Momentos potenciales
en donde
x; : diferentes valores de la variable
O, : origen arbitrario
n; : frecuencia absoluta de x;
N: número total de datos
r: orden del momento
MEDIDAS DE POSICIÓN • 69
respecto al origen
llllal:mente, dichos momentos se representan por ar y se obtienen hacien-
. por tanto
ar
n n.
m =
r
¿
i = 1
(x. -
1
xY -L
N
m0 = ¿~ (x¡ ~ -
- x-)o -ni -- ¿ ni -_ -N -_ 1
i=l N i=lN N
m1 = ¿~ (X¡ -
-) -ni = ¿
X
~ X¡ -ni - -X ¿~ -ni = X- -
-N
X- = X- -
- = O
X
i=l N i=l N i=IN N
Conviene resaltar el significado del nombre que se emplea para designar estos
momentos. Obsérvese que los términos de la suma son de la forma (x.1 - .X)' n1. . Si
llamamos
~ ,n. ~,n.
m = ¿ (x. - .X) _l_ = ¿ u. _l_
, i= l 1 N i=l 1 N
que es, por definición, el momento de orden r respecto al origen para la distribu-
ción (u¡; n¡) . Quiere decir esto que, conceptualmente, no existe diferencia entre los
momentos respecto al origen y respecto a la media. La única diferencia existente
entre ambos consiste en que mientras en los momentos respecto al origen se toma
como origen de medidas el cero de la escala correspondiente a la característica en
estudio, en los momentos centrales se hace una traslación del origen de medidas,
para situarlo precisamente en la media aritmética.
Podemos verlo gráficamente en la figura de la página siguiente.
MEDIDAS DE POSICIÓN • 71
o:1
XI
1
1
nuevo origen
FIGURA A.1
= i=o(-l)h ( r)ar-hbh .
1! h
Por tanto:
72 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Casos particulares
m4 = I<x¡ - xf nN¡ =
i~l
I
h~O
(-l)h (~) ata4-h =
Todas estas expresiones serán muy útiles para el cálculo de las característi-
cas-resumen de cada distribución de frecuencias, como iremos comprobando en
los capítulos posteriores.
Por otra parte, en el capítulo 7 generalizaremos el estudio de los momentos
para el caso de distribuciones de frecuencias en donde se realicen observaciones
de dos o más características simultáneamente.
PÍTULO 4
.tsperston
.,
Medidas de dis
F~GURA 4 .1
x = 6.500
FIGURA 4.2
1 Re = xn -XI 1
Por ejemplo, si tenemos una distribución de edades y el recorrido Re
= 5,
el número total de observaciones N = 50 , en principio podemos decir
existe poca dispersión.
Se uata, por consiguiente, de un medio burdo para medir la dispersión,
_,_u•~ sólo a algunos casos.
l amamos recorrido intercuartílico a la diferencia existente entre el tercer
· y el primero. Es decir,
11 1 11 1 11 111
x1 x 2 ................•... p .................... Xn
11 1 1 1
x 1 x2 ............... ............ p ...................... ...... ........ xn
FIGURA 4.3
pero esto, que sería lo primero que se nos ocurriría, tiene un grave inconve-
niente: puede ocurrir que tengamos una distribución muy dispersa a ambos
lados del promedio. Hallamos las desviaciones respecto a P, que serán muy
grandes, y promediamos éstas. Al efectuar esta última operación, tenemos que
sumar todas las desviaciones y dividir por N. Como estas desviaciones tendrán
sus correspondientes signos (positivo las desviaciones de los valores a la dere-
cha de P y negativo las correspondientes a las de su izquierda) al sumar se
compensarán las desviaciones positivas con las negativas y la medida que ha-
bíamos definido resultaría pequeña siendo la dispersión grande.
Para solucionar este inconveniente tendremos que optar por una de las dos
siguientes alternativas: considerar los valores absolutos de las desviaciones o
elevar éstas al cuadrado.
1
- P) __L
N
caso, optar por una de las dos hipótesis para ambos cálculos (para xy
247,5
D = _i _= _I________
N
Pero ya vimos que la primera propiedad de la x era que el valor de D era
siempre nulo ; por tanto, no se puede utilizar D como medida de dispersión.
Podemos eliminar este problema empleando una potencia par para las desvia-
ciones. De todas las potencias pares elegimos la más sencilla, la cuadrática, y
así surge una nueva medida de dispersión, denominada varianza, que defini-
mos como la media aritmética de los cuadrados de las desviaciones de los valo-
res de la variable a la media aritmética, es decir, el momento de segundo orden
respecto a la media aritmética, S2 = m2 .
-)2 -n;
-X
N
Así como las desviaciones medias vienen expresadas en las mismas unidades de
medida que la distribución, la varianza no, ya que vendrá dada en las unidades
DISPERSIÓN • 81
--LLl.
ser la raíz cuadrada de la varianza vendrá expresada en las mismas unidades
que la distribución, lo cual la hace más apta como medida de dispersión.
PROPIEDADES DE LA VARIANZA
También se podría haber llegado a esta relación, como caso particular del
te<Jrema de Kónig que vimos en el capítulo anterior, y que decía
Haciendo k = O , queda
.¿, 2
L. x.
n.
_L =
n
L (x; - X) NI
2 n. .
+ x2 '
1
i =i N i=i
Esta propiedad es de gran utilidad práctica, ya que así es como se suele cal-
cular S2 .
n n.
x = ¿x;--L;
i =i N
i=l t
X)
2
--L ·
N
DISPERSIÓN • 83
Sea ahora (kx;; n;) resultando de multiplicar cada x; por k, sabemos que
x' = kX .
n n N
S12 = ¿(x -xi-;- = - - S2
i=l ' N-1 N-1
S~ O.
Es una medida de dispersión óptima.
'lll:mcJs de hacer notar que en la desviación típica tienen más influencia las
-...,.innP" de los valorés muy extremos que en la desviación media, ya que
desviaciones, en la primera medida, están previamente elevadas al cua-
/ 84 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
4.2.4. TIPIFICACIÓN
1
1
1
1
1
:.1s
12
2s
1
1
1
1
:o- ~4
65 70 90
x
FIGURA 4.4
x-x
Z =S- - ,
X
~--..-
es su tipificada.
DISPERSIÓN • 85
En efecto
- 1 _ .X
Z = - x --=O
sx sx
CÁLCULO DE LA VARIANZA
2 ,;, _;=_ 1_ _ _ __
8
N
a veces para el cálculo práctico de la varianza es preferible usar la rela-
s= = a2 -a~ que habíamos estudiado antes.
: ,,
-- ·., --
X¡ n. · 2
l · xinh X¡ IJ¡
".,·
1 6 6 6
2 11 22 44
3 6 18 54
4 7 28 112
5 9 45 225
6 11 66 396
50 185 837
86 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Vamos a hacer ahora una ligera referencia a la relación existente entre las
tres medidas estudiadas hasta ahora: desviación media respecto a la media y
respecto a la mediana, y desviación típica.
Tanto la varianza como la desviación típica son susceptibles de aplicación
del cálculo algebraico, lo que ha hecho que su uso se haya generalizado en
relación al de las otras dos medidas.
Por último, como
n
-)2 -ni
L:<x;
i = 1
-X
N'
tenemos que
~
L..:J
E cociente ha eliminado las unidades y ahora nos es posible comparar dos
110buc:io11es a través de este coeficiente. Si bien es verdad que este coefi-
es el más fácil de calcular, presenta una serie de inconvenientes, entre
cuales citamos los siguientes: mide la dispersión de la distribución sin hacer
- .u...:w. a ningún promedio, por lo que no se resuelve el problema de la
.,anlLCiém entre éstos; por otra parte, como no tiene en cuenta más que los
nlores extremos de la distribución nos dará una gran dispersión si estos
están muy separados, a pesar de que puede ocurrir que el resto de los
estén concentrados tal y como se representa en el ejemplo gráfico de la
~ . 5:
1 111 11 1 11 1 111 1
x2 .......................... ...... xn-1
FIGURA 4.5
n
D L: jx;- Mej
V = _____!.!!__ = _;_=_1_ _ _ _ __
Me Me N·Me
comentario expresado respecto de V, en general, se puede aplicar aquí.
característica específica recordaremos las dificultades de cálculo de Me y
a ver un ejemplo que haga referencia a todas las medidas más im-
que hemos estudiado en este capítulo .
2
2
90 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIA BLE
Se pide:
Obtener el rendimiento medio en cada país, precisando en cuál de los dos hay mayor
grado de homogeneidad.
(a) En las empresas españolas:
""x.n .
.X = _L_. ,-' = 1160 000
N
Y= LY;n¡ = 13 000
N
2
S2 = L(Y; - y) n; = 3000 000
Y N
De la comparación entre los coeficientes de variación resulta que las empresas es-
pañolas (0,103 < 0,13) son más homogéneas que las norteamericanas.
DISPERSIÓN • 91
4
6
8
10
12
X. - X
-'--
sx
y como
LX; 40
x=-'-=-=8
N 5
4 16
6 36 ¿x;2
8 64 s2 = a - a2 = _;_ - x2 = 360 - 64 =
X 2 1 N 5
10 100
12 144 =72-64=8
40 360
S.r =.J8=2 .Ji
..;~
z. 1 ,,
,,- '~ zJ
. ¡, -
¿z. 1 o
·"* z =_,_ =-=o
-fi N 5
2
-.fi/2
¿z}
0,5 s2
2
= _i_ _ - .l2 = ~ - o = 1
o o N 5
cio 3
de dos grupos de familias durante un cierto período de tiempo ha sido el
N° de ftmiilias
10 14 8 5
12 16 10 10
14 20 11 15
16 15 13 30
18 18 15 20
20 17 18 16
20 4
100 100
••ínese cuál de los dos grupos es más homogéneo respecto a su gasto, con
•c.:ión de los pasos aplicados y de los resultados obtenidos.
S
V =-
x
. .llc:nos , pues, este coeficiente para cada grupo. Para el grupo A:
¡. ··
x¡ TI¡~ x~n.
., x¡n¡
1 !..
10 14 140 1400
12 16 192 2 304
14 20 280 3 920
16 15 240 3 840
18 18 324 5 832
20 17 340 6 800
N= 100 1 516 24 096
94 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
:¿x.n.
.X = _;_'_' = 1 516 = 15 16
N 100 '
la varianza de ese grupo es
24 096
= - (15 16) 2 = 11 1344
100 ' '
y la desviación típica
vx = sx = 3,34 = 0,2203.
x 15,16
Y¡ n; Y¡n¡
?
LY;n;
./ Íni - = _;__ = 1 363 = 13 63
y N 100 '
8 5 40 320
2
JO JO 100 1 000 LY; n;
11 15 165 1 815 s 2 = 1 _ y2 =
13 30 390 5 070 Y N
15 20 300 4 500
18 16 288 5 184 = 19 489 - (13 63)2 = 9 11
100 ' '
20 4 80 1 600
3 02
vy = !.x_ = • = 0,2215 .
y 13,63
EJERCICIO 4
En un cierto barrio se ha constatado que las familias residentes se han distribuido,
según su tamaño, de la forma siguiente: ·
DISPERSIÓN • 95
Primero formamos la tabla con las columnas de los datos que nos van a hacer
falta.
!:" . ~
.. -··. - .
..""
-~
. f
tt-1-t-.L¡ ~i J~.~
n>
"> · ~ ~ ~- ·--:
'" '· ~.
..- ..
(Jt11i 2
X¡ n¡ !fr
(b) El tipo de familia más frecuente será el valor modal; el intervalo modal es (2, 4)
n1 =200,c1 =2
ni+l 90
Mo = L1_ 1 + c.1 = 2 + 2 = 29
n1_ 1 + n1+ 1 110 + 90 '
por lo que el tipo de familia modal será aquélla que se compone de 2,9 personas.
(e) Para determinar los componentes que tendría que tener una familia para que estu-
viera incluida en el 50% de los que tienen aparcamiento, bajo los supuestos seña-
lados, calculamos la mediana. Observando N1 vemos que el intervalo mediano es
N_N
Me = L. + 2 i -1 e = 2 + 250 - 110 2 = 3 4.
1- l
n; i 200 '
(d) Para poder hacer previsiones de acuerdo al número medio de personas por fami-
lia, esta media deberá ser representativa. Calculemos su desviación típica.
S 2 = a2 - a 12 a1 = :X = 3, 82
L:x?n 1
s 2 = -''.'--__ _ y 2 = 9 860 - (3 82) 2 = 19 72 - (3 82)2 = 5 1276
N 500 ' ' ' '
S= ~5,1276 = 2,26.
(e) Calculemos previamente el coeficiente de variación del primer barrio:
EJERCICIO 5
En una empresa el 20% es personal «DO cualificado, , el 50% es personal «Cua-
lificado» y el resto personal «técnico». La plantilla consta de 1 000 empleados. Se
ha estimado la productividad para cada uno de estos grupos en unos coeficientes
que van de 1 a 5 como se puede observar en la tabla siguiente:
DISPERSIÓN • 97
P¡
10 5 4,5
~ 20 20 10 l7
3 30 20 40 28
.! 30 40 30 35
5 10 15 20 15,5
x.
Personal no cualificado:
:i
..
. ·. .: ::"' 2.'-r
X¡ E . ·p,i ~¡P(·~f:. :· •-:XíPI. ··
.1' · •>t· a
'
1 10 10 10
2 20 40 80
3 30 90 270 ¿x¡p;
4 30 120 480 i - 2
5 10 50 250
-'"=-- - XNe
LJP;
i
100 310 1 090
= 1 090 - (3 1)2 = 1 29
100 , ,
Personal cualificado:
:. ,;
X¡ p; XiP; 'z .;·
X¡ p¿
1 5 5 5
2 20 40 80
3 20 60 180
4 40 160 640
5 15 75 375
100 340 1 280
= 1 280 - (3 4)2 = 1 24
100 , '
se = ~1,24 = 1,1135
entonces
Por tanto, el personal cualificado presenta una productividad media más repre-
sentativa.
PÍTULO 5
.tmetrta
, .
y curtosts
que la varianza mide la dispersión por térmioo medio, ya que es la media ariunética de las
cuadráticas.
99
100 • SECCIÓN 2. ANÁLISIS ESTADfSTICO DE UNA VARIABLE
x
simétrica asimétrica a derechas asimétrica a izquierdas
x x
asimétrica a derechas asimétrica a izquierdas
FIGURA 5.1
i=l
N
hemos visto que esta medida siempre es cero. Por otro lado, no pode-
IDmar potencias pares porque perderíamos los signos, que nos interesa
. Así pues, tomaremos una potencia impar de dichas desviaciones. Y
de asimetría podría ser el promedio de estas desviaciones, elevadas a
impar más simple, es decir,
-1 ~
L., ( X. - X
-)3 n.
m N ; =l 1 1
g, = si = 312
g1 = O la distribución es simétrica
g1 > O la distribución es asimétrica positiva
g1 < O la distribución es asimétr ica negativa.
8t <o
8t =o
8t >o
1 AP ~ X -SMo 1
basado en el hecho evidente de que en una distribución campaniforme simétrica
x = Mo =Me.
3(x- Me)
S
ASIMETRfA Y CURTOSIS • 105
J;; :,...
;;,· X¡ · n¡
o 2
10 4
20 7
30 5
40 2
o o o o
w 40 400 4 000 40 000 6
lO 140 2 800 56 000 1 120 000 13
30 150 4 500 135 000 4 050 000 18
40 80 3 200 128 000 5 120 000 20
x.
. t _,n t !xt.·- Me 1 1X¡ - Me r'¡r·,
o 2 20 40
10 4 10 40
20 7 o o
30 S 10 so
40 2 20 40
20 170
DM =
e
_!_ "1
x. -Me n.
N LJ '
1 1
=
170
20
= 8,5
Re=40-0=40
R1 = C3 - e, = 30 - 1o = 20
ASIMETRIA Y CURTOSIS • 107
gl = m3 = -137,235 = -0,098.
S3 11,169
m3 = a3 - 3a2a1 + 2a( = 16150-3 · 545 · 20,5 + 2. 20,53 = -137,25.
A = :X - Mo = 20, 5 - 20 = O 04 .
P S 11169 '
X '
A = e3 + e1 - 2 Me = 30 + 10 - 2 . 20 = 0 .
A S 11,169
f(x )
FIGURA 5.5
Pues bien, tomando esta distribución como referencia diremos que una dis-
tribución puede ser más apuntada que la normal (es decir, leptocúrtica) o me-
nos apuntada (platicúrtica) (Fig. 5.6). A la distribución normal, desde el punto
de vista de la curtosis, se le llama mesocúrtica .
x X
platicúrtica Jeptocúrtica
FIGURA 5 .6
ASIMETRÍA Y CURTOSIS • 109
1g, ~? - 3 1
mesocúrtica (normal) si g2 = O
leptocúrtica si g2 > O
platicúrtica si g2 < O
FIGURA 5.7
EJEMPLO
Dada la distribución de frecuencias del ejemplo anterior, calcule el coeficiente de cur-
tosis.
SOLUCIÓN
4
= L,x; n; = 10 330 000 = 516 500
a4 N 20
m4 = a4 - 4a3 a1 + 6a2 a; - 3a: =
= 516 500 - 4 X 16150 X 20,5 + 6 X 545 X 20,52 - 3 X 20,5 4
= 36 587,3125
82
= m4 _
3 = 36 587,3125 _ = _
3 2 35 3
= -ü 65
4
S 11. 1694 ' '
que, como vemos, nos dice que esta distribución es platicúrtica (g2 < O), es decir,
con un apuntamiento por debajo de la normal.
Ejercicios
DE LA SECCIÓN 2
EJERCICIOS DE LA SECCIÓN 2 • 113
ÓN
La variable correspondiente a las calificaciones puede tomar los valores cero a
diez; para determinar la distribución de frecuencias que resume el conjunto de las
100 observaciones hay que proceder a un recuento que nos determinará el número
de veces que se repite cada valor o frecuencia absoluta.
El resultado del recuento se ofrece en la tabla siguiente:
114 • SECCIÓN 2. ANÁLISIS ESTADfSTICO DE UNA VARIABLE
·.'' 'jff'
.,
. ... . ..
F~ecuenda
1" '"•'
Frecttencia
FreCUI!rld<l Fr_ecuencja
Galijjcaciones
Recuento al)soluta relativa ·.absofúla r:w, félllliva
<icumúlada acumuJada
-~- i ·~
;
1 ~' ~ 1 ~-~ ~
- -
16
13
11 ~-----------
10 f-.----- - --- ---
2 1---- --- --- --- --- --- --- --- 1---- ---.---1
o 2 3 4 5 6 7 8 9 10
FIGURA S2.1
o 2 3 4 5 6 7 8 9 10
FIGURA 52.2
116. SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Ejercicio 2. 2
Sea la siguiente distribución del gasto anual en bienes y servicios, excepto
alimentación, de los jóvenes entre 18 y 26 años:
0-5 40 40
5- 10 110 150
10- 15 165 315
15-20 220 535
20-25 75 610
25-30 60 670
N= 670
SOLUCIÓN
(a) Como la distribución del gasto está agrupada en intervalos de la misma longitud,
entonces, para formar sobre cada intervalo un rectángulo proporcional a su fre-
cuencia absoluta, bastará con dar a cada uno de estos intervalos una altura que sea
proporcional a estas frecuencias, con lo que el histograma será como sigue:
n.1
22
165
110
7
6
4
5 2 25 3
FIGURA S2.3
EJERCICIOS DE LA SECCIÓN 2 • 117
150
40 +---i
5 10 15 20 25 30
FIGURA 52.4
2.3
-~ntt~e gráficamente la siguiente distribución:
0- 10 12 10 1,20
10- 40 32 30 1,07
40- 80 64 40 1,60
80- 100 57 20 2 ,85
100 - 130 89 30 2,97
130 - 160 44 30 1,47
n.
d=__j_·
1 c.
1
n
S
n
=Cd
nn
=Cnc
.....!!....=nn
n
2,97 ----------------------------.--~----,
2,85 ----------------------r----l
1,60
1,47
1,20
1,07
FIGURA S2.5
io 2.4
una encuesta en una ciudad, se han agrupado los establecimientos
el número de plazas que poseen, obteniéndose la siguiente
. ~''c'•t,•
~~-P~ ~0 ~h~lea
~-·
0- 100 25
100- 200 37
200- 300 12
400- 500 22
500- 600 21
600- 700 13
700- 800 5
800- 900 3
900- 1 000 2
SOLUCIÓN
(a) Fácilmente obtendremos este número de establecimientos a partir de las frecuen-
cias absolutas acumuladas, Ni .
Ejercicio 2. 5
En un museo se sabe que el precio medio de entrada es de O, 70 euros. Los adultos
deben pagar sus correspondientes tickets a 1 euro y los niños a 0,30 euros. ¿Qué
porcentaje de adultos y niños visitan el museo?
EJERCICIOS DE LA SECCIÓN 2 • 121
1 P+0,30 (100-P) =O ?O
100 '
p = 57,14.
F1 porcentaje de adultos será el 57,14 y el de niños el 42,86.
2.6
~ país en donde se integran tres regiones tales que:
A 550 65
B 1 180 80
e 370 40
-unne.-;e el valor del indicador número de teléfonos por cada mil habitantes
el conjunto de este país.
2.7
X¡ = {1, 2, 3} , cuya media es .X = 2 . ¿Cómo se vería afectada esta
si transformamos la distribución con un cambio de origen y de escala
122 • SECCIÓN 2. ANÁLISIS ESTAD[STICO DE UNA VARIABLE
Z¡ = ax¡ + b
X¡ Z¡ =a·x+b
1} i;;,'
1 5 = 2. 1 +3
2 7 =2-2+3
3 9=2-3+ 3
6 21
y, por tanto,
siendo
ü"=.f - 1=2-1=1
v = -x + 1 = - 2 + 1 = -1
luego se comprueba que estos valores medios son diferentes.
Ejercicio 2.8
Una compañía inmobiliaria tiene 200 apartamentos para alquilar. La distribución
de las superficies de los apartamentos es la siguiente:
EJERCICIOS DE LA SECCIÓN 2 • 123
N = 200 13 350
Como la distribución que nos dan viene agrupada en intervalos, tendremos que
determinar las marcas de clase de cada intervalo, que, por ejemplo, para el primer
aervalo será
XI = 40 + 50 = 45 .
2
La superficie media, entonces, es
n
¿x.n.
:X = ¡ ; I 1 1 = 13 350 = 66 75 m2 •
N 200 '
Mo = 40 + - 4- 10 = 50 m .
2
0+4
Ejercicio 2. 9
Consideremos una variable X 1 = {x1, x2 , x3}, tal que x 1 = O, x2 = 2 y x3 = u.
Estúdiese la evolución de la media aritmética y de la mediana cuando u varía.
¿:xl 2 1
x = _;_ = 0+2+U =- +-u
N 3 3 3
es decir, que x es una función lineal creciente de u, e irá aumentando a medida que lo
haga u.
La mediana de esta distribución es 2, ya que es el valor central de los tres, por lo
que esta medida de posición es invariante respecto a los valores que pueda tomar u,
siempre que u > x2 = 2 .
Ejercicio 2. 1 O
Hállense la mediana y la moda de la siguiente distribución:
lO - 20 27
20-30 10
30-40 6
40-50 5
50 - 60 2
50
EJERCICIOS DE LA SECCIÓN 2 • 125
10-20 27 27
20-30 10 37
30-40 6 43
40-50 5 48
50-60 2 50
N= 50
Para este cálculo conocemos todos los valores menos la frecuencia acumulada
.-erior Ni-J, porque no existe, ya que el intervalo mediano es el primero. Por
11010, no se puede determinar la mediana.
25-
Me = 10 + - -
o · 10 = 19,25.
27
El intervalo modal, el más frecuente, en este caso también será el primero,
que su frecuencia, ni , es la mayor.
Sabemos que
10
Mo = 10 + - - · 10 = 20 .
o+ 10
126 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Ejercicio 2. 11
Los ingresos anuales de una muestra de 500 familias se distribuyen de la forma
siguiente:
Menos de 80 25 40 25 0,31
80- 100 61 90 - 86 3,05
100- 150 72 125 158 1,44
150-200 75 175 233 1,50
200-250 128 225 361 2,56
250- 300 64 275 425 1,28
300- 500 45 400 470 0,23
Más de 500 30 ? 500
N = 500
Determínese:
(a) El ingreso medio por familia.
(b) El ingreso modal.
(e) La mediana de estos ingresos.
SOLUCIÓN
(a) El ingreso medio sería:
,L:x¡n¡
.f = _,_·- - .
N
Para calcularlo es necesario que estén determinadas todas las marcas de clase
de cada intervalo.
Esta distribución es abierta tanto en el intervalo inferior como en el superior;
al ser la variable el volumen de ingresos familiares, que se supone positiva, enton-
ces el primer intervalo, «menos de 80», lo podemos considerar equivalente a <<de O
a 80», con lo cual la marca de clase de ese intervalo sería 40.
El intervalo superior de <<más de 500», sin embargo, está indeterminado, por lo
que no es posible, sin disponer de mayor información, saber cuál sería su marca
de clase. Esta indeterminación nos impide el poder calcular la media aritmética, al
no poder fijar el valor de X¡ en el último intervalo.
EJERCICIOS DE LA SECCIÓN 2 • 127
di+l 144
Mo = L¡_1 + · e¡ = 80 + ' · 20 = 96,45.
di-1 + di+l 0,31 + 1,44
Es el valor que ocupa el lugar
N = 500 = 250
2 2
que se sitúa en el intervalo 200 a 250. Por tanto,
N_N
2 250 233
M e = Li - t + í-1
n. . e; = 200 + -
128 · 50 = 206,64 .
1
2.12
un barrio de una ciudad, el 20% de las viviendas tiene una superficie
da entre 50 y 60m2 , el 25% entre 60 y 70, el 20% entre 70 y 80, el 25%
80 y 100 y el 10% entre 100 y 120.
Porcentaji!$}J.
frecuencia 'relcitiva
X¡
f;
IJ. = 1 75,75
(b) El intervalo modal, al ser los intervalos de distinta longitud, será aquél que tenga
mayor densidad. En este ejemplo, el intervalo modal es el constituido por vivien-
das con una superficie entre 60 y 70m2 .
Por tanto, podemos considerar como superficie más frecuente de estas vivien-
das a
0 0200
· c. = 60 + • · 10 = 65m2 •
' O, 0200 + O, 0200
Ejercicio 2. 13
Dada la distribución 3, 5, 10 y 12, pruébese que
H~G~x
siendo:
H = Media armónica.
G = Media geométrica.
x = Media aritmética.
EJERCICIOS DE LA SECCIÓN 2 • 129
G == ~fJx, = V3 · 5 · 10 · 12 = 6,5136
L;x;
x= _;_ == 3 + 5 + 10 + 12 = 30 == 7 5 .
N 4 4 '
Queda, pues, comprobado que
H~G~x.
2.14
. .liei:tdo que x ;: : G , demuéstrese <lue
H ~ G.
N
HX =
¿ __!__ n.1
i X¡
N N 1
HX -- = -
L;-n;1 L;u,n; u
¡ X¡
130 • SECCIÓN 2. ANÁLISIS ESTAOrSTICO DE UNA VARIABLE
es decir,
Ejercicio 2.15
Demuéstrese que, si X¡ = (x1, x2 ), entonces
G = .Jx · H
SOLUCIÓN. En efecto,
G=fi7=
" ...1 ...2
XX
(x + x ) 1 2
1 2 X +X
1 2
--
1
2
~
1
= .Jx . H.
-+ -
xl x2
Ejercicio 2. 16
Obténgase la media geométrica de la siguiente distribución:
-1, 3, 9,
comentando el resultado.
2.17
distribución formada por N valores que se han estratificado en tres grupos
• N 1 y N 3 valores cada uno de ellos, tal que N1 + N 1 + N 3 = N.
bajo qué condición, si G1 , G2 y G3 son las medias geométricas de cada
o estrato, la media geométrica del conjunto de los N valores es la media
de estas medias geométricas de cada estrato.
G1 = N,fx
\J 1x2 ··· x N 1
N
3
JIDr" lallto, para que se cumpla esta relación, los estratos deben ser ·todos del mismo
132 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Ejercicio 2.18
Determínese la media geométrica de la siguiente distribución:
115 15
124 30
162 32
214 23
N= lOO
G = N~;~ x( =
100
.JI15
15
· 124
30
· 162
32
· 214
23
Ejercicio 2. 19
Una cooperativa agrícola tiene cuatro fmcas en explotación. Las producciones de
trigo y los rendimientos por hectárea obtenidos son los siguientes:
Producción Rendimieñ{()S
Fincas
(Qm) (QI'n/Ha)
A 2200 11
B 2 800 7
e 3 200 16
D 4 000 25
EJERCICIOS DE LA SECCIÓN 2 • 133
Rendimientos Superficie
(Qm/l{a) . .,(Ila)
·, > ''
-\ 11 - 200
7 400
16 200
25 160
12 200 960
R=
N
11 . 200 + 7 . 400 + 16 . 200 + 25 . 160
200 + 400 + 200 + 160
12 200
= = 12 71 Qm/Ha.
960 '
Por tanto, si no transformamos la información, en estos casos de magnitudes relati-
el valor medio se ha de calcular a través de una media armónica.
134 • SECCIÓN 2. ANALISIS ESTADÍSTICO DE UNA VARIABLE
Compaiua
.. A É
.,, e
"
..., o
Por tanto, la productividad media del conjunto de las tres empresas será
Ejercicio 2. 21
Determínese el tipo de cambio medio del yen respecto al euro para una empresa
que durante un año realizó las siguientes operaciones en esa divisa:
- ~
·":'
Operaaones
""·. ,,, .
A:
B ~;¡. ciiii .,. 1,' :<...
D .!!!!
,,
Tipo de cambio (1 yen) 70 72 65 68
Volumen negociado ( 106 euros) 200 250 100 400
EJERCICIOS DE LA SECCIÓN 2 • 135
Por tanto, observamos que el tipo de cambio medio es la media armónica de los ti-
de cambio de las cuatro operaciones.
2.22
de los trabajadores de una empresa, según su categoría
A 15
B 40
e 10
PH = i
-1 + - + - 1
== -
3
-
0,1917
= 15,65 unidades/hora.
15 40 10
El tiempo medio empleado será el inverso de PH ,
- 1 1
T -
- --- == 0,0639 horas/unidad.
PH 15,65 u/h
136 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Ejercicio 2. 23
Sea la distribución
X¡ n.
1
XI ni
x2 ~
¿Qué valores deben tomar n1 y n2 para que la varianza de esta distribución sea
máxima?
x= A.x1 + (1 - A.) x 2 .
La varianza será
2
S (A.) = 2:: (x,. - X)
2
~ = (X¡ - X)
2
"
2
+ (x2 - X) (1 - A) =
1
= A (1 - Al (x1 - x 2 ) 2 + (1 - A) A2 (x2 - x/ =
2
= A-(1 - A-)[1 - A + A](x1 - x2 ) =
2
= A(l - A) (x1 - x 2) •
EJERCICIOS DE LA SECCIÓN 2 • 137
. 1 N
1
DDIO, SI r.. = -,entonces fl¡ = n2 = - ·
2 2
2.24
números naturales, hállese su media aritmética y su
2
3
4
99
100
0- 10 10 5 50 250
LO- 20 10 15 150 2 250
20- 30 10 25 250 6 250
30- 40 10 35 350 12 250
40- 50 10 45 450 20 250
50 - 60 10 55 550 30 250
60- 70 10 65 650 42 250
70- 80 10 75 750 56 250
80- 90 10 85 850 72 250
90- 100 10 95 950 90 250
Por tanto,
¿x.n.
1
x == _,._~- == 5 OOO == 50
N 100
2
S == a2 -a:
a1 == x == 50
'l:x n2
1 1
== i = 332 500 = 3 325
a2 N 100
S 2 == 3 325 - 502 == 825
S == +.J825 = 28, 7 .
Si no hubiéramos efectuado esta agrupación en intervalos tendríamos que
x = _'l:xt
1_ == 1 + 2 + · · · + 100 = _1_ . 1 + 100 . 100 == 50 5
N 100 100 2 '
S2 =a2-a,2
¿x2 1 2 2 2
a == _ 1_ = _1_+_2__+_·_··_+_10_0_ = _1_. 100(100 + 1) (2 · 100 + 1) ==
3 383 5
2
N 100 100 6 '
ya que
1 +N
1 + 2 + · · · + N == - - N
2
¡2 + 22 + ... + N 2 == N (N + 1) (2N + 1)
6
s 2 == 3 383,5 - 50,5 2 = 833,25, s = +~833, 25 = 28,9
con lo que comprobamos los errores que se cometen al agrupar los datos en intervalos,
debido a la pérdida de información que ello supone.
Ejercicio 2.25
Sean los números 1, 2 y 3 y supongamos que su varianza es S~ . Agregando dos
veces el número 2 tenemos 1, 2, 2, 2, 3, cuya varianza es Si . ¿Será Si menor,
mayor o igual que S~ ?
EJERCICIOS DE LA SECCIÓN 2 • 139
1+2+3=2
3
1+2+2+2+3
- - - - - - - = 2.
5
~ suma de las desviaciones cuadráticas respecto a su valor medio es igual. En
n
¿ (x¡ - x/ = o - 2/ + (2 - 2)2 + (3 - 2) 2 = 2
i=l
n
¿ ex; - x2)
2
= (1 - 2)2 + 3 (2 - 2/ + (3 - 2)2 = 2
i=l
2.26
las variables X¡ + h y X¡ + A.h, donde h = {-2, - 1, O, 1, 2}.
_ (x - 2) + (x - 1) + x + (x + 1) + (x + 2)
X = =X
1 5
(x - 2A) + (x - A) + x + (x + A) + (x + 21..)
X2= 5 =X.
Y¡ = - = -
St .Ji
X¡ X
v = s2 = x..fi
2
X2 X
V
se verifica que V2 = A. Y¡ , luego, para que Y¡ = _l_ , tendremos que A. = 2 .
2
Ejercicio 2.27
Sea una distribución (x;; n) , con las siguientes características:
.X= 7
Mo = 5
2
S = 3, 4
N = 50
Determínense estas medidas para:
(a) La distribución (x; + 2; n) .
(b) La distribución (20 x;; n) .
EJERCICIOS DE LA SECCIÓN 2 • 141
En este caso, se define una nueva variable Y; = X¡ + 2 que, por las propiedades
de estas medidas estadísticas, cumple que
Y=x+2=7+2=9
s~ = s; = 3,4
NY = Nx =50
Mo (y) = Mo (x) + 2 =5 + 2 = 7
z = 20 x = 20 · 7 = 140
s 2
Z
= 20 2 2
S = 400 . 3, 4 = 1 360
X
N, = Nx = 50
M o (z) = 20 Mo (x) = 20 · 5 = 100.
2.28
dos distribuciones simétricas y campaniformes. Disponemos de la siguiente
.-.uacHJ•n de cada una de estas distribuciones
Distrif{Y:Ción A se Dis(ljbucíón B .,
'"
Me = 15 Mo = 20
sz = 36 s2 = 36
cuál de las dos distribuciones presenta una mayor variabilidad.
SA 6 SB 6
V = - = - = 0 4· V8 =-=-=03
A XA 15 , , x8 20 '
La distribución B, al tener menor coeficiente, presenta una menor dispersión relativa.
1 42 • SECCIÓN 2. ANÁLISIS ESTAD ÍSTICO DE UNA VARIABLE
~j e rcicio 2.29
Hállese el coeficiente de variación de la siguiente distribución:
-4
-3
o
2
5
Razónese el resultado.
2
X¡ X¡
-4 16
-3 9
o o
2 4
5 25
o 54
Como
¿:xi
x= -¡-=.Q=O
N 5
2 2
S =a2 - a 1
a1 =x=O
¿x;
a2
= _ i _N = 54
5
= 1o, 8
2
S = 10,8- 0 2 = 10,8
S = +.JSi = +J10,8 = 3,28.
Por tanto, el coeficiente de variación es
2.30
que el coeficiente de variación de una distribución es 0,2 y que la
JI_ Hállese la desviaCión típica de la distribución.
S =V · x = 0,2 · 30 =6.
2.31
v - ~ ~(YJ
x N
(X¡ -X)
--'--x-- indica la desviación relativa de x; con respecto a x.
~(<X¡; XJ
N
x es invariante respecto al sumatorio.
2.32
•ariable X tiene su desviación típica igual a 4 y su media es 6. Determínense la
y la varianza de las variables:
X- 1
Y = -- ·
2
X- 6
T= - - ·
4
144 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
SOLUCIÓN
(a) Sabemos que , si Y = a + bX , entonces
y= a+ bx
s2y = b2s2.
X
1 1
Y=-X--
2 2
tendremos que
T=..!.x-~
4 4
- l_ 6 1 6
t = - X - - = - 6--=0
4 4 4 4
s2 = (..!.)2
l 4
s2 = _..!._
X 16
. 42 = I
es decir, T =O y S1 =1 .
Esta segunda variable T es precisamente la variable tipificada de X, confir-
mando estos resultados las propiedades de este tipo de variables.
Ejercicio 2.33
Un hotel tiene cinco tipos de habitaciones, cuyos precios, así como los ingresos
obtenidos, son los siguientes:
,_
Precia par habitaci6n -~- Ingresas.
200 16 000
500 20 000
750 37 500
1 000 30 000
1 300 26 000
EJERCICIOS DE LA SECCIÓN 2 • 145
J:n primer lugar hay que hallar el número de habitaciones de cada precio.
Como los ingresos correspondientes a las habitaciones de 200 unidades mone-
llrias (u.m.) han sido 16 000, esto indica que el número de habitaciones de este
llpOes
= 16 000 = 80 .
fZ¡ 200
Análogamente,
n1 = 20000 = 40 n, = 37 500 = 50
500 750
= 30 000 = 30 = 26 000 = 20
n4 1000 n5 1 300
¿x.n.
- i
X = - --
1 1
=
129 500 = 588 64 um
N 220 ' ..
S2 = a2 - a12
a 1 =:X= 588,64
Como el otro hotel tiene un coeficiente de variación de O, 75, este hotel presen-
ta una estructura más homogénea de precios.
Ejercicio 2.34
De dos regiones con la misma población, de un determinado país, se han tomado
sendas muestras sobre las rentas percibidas. La información recogida es la
siguiente:
Númeroáe
(en eures) JWrlilias
6 010- 12 020 24 30 050 - 90 150 10
12 020- 18 030 36 90 150- 150 250 42
18 030 - 24 040 20 150 250 - 330 550 35
24 040 - 30 050 20 330 550 - 450 760 20
30 050- 60 100 50 450 760 - 570 960 13
150 120
(a) Hállese la renta media de las muestras de cada región y la renta media del
conjunto de las dos regiones.
(b) ¿Cuál de las dos rentas medias es más representativa?
(e) ¿Es posible decir si una región posee un nivel de vida superior a la otra, si
medimos este nivel a través de la renta?
(d) ¿Cuál es el nivel de renta percibido por un mayor número de familias en la
primera región?
(e) Si en la segunda región clasificamos a una familia en el grupo en donde se
encuentran el SO% de las menos favorecidas, ¿cuál sería el tope de renta que
podría percibir?
EJERCICIOS DE LA SECCIÓN 2 • 147
3,612E+10 0,00016639
6,0682E+ 11 0,00069884
2,0227E+l2 0,00019412
3,0522E+12 0,00016638
3,3927E+12 0,00010815
120 28517680 9,1106E+12
:~.:>2n.
a = ; 1 1 = 135 143 354 150 = 900 955 694 3
2 N 150 '
SX2 = 900 955 694,3 - 26 484,062 = 199 549 907,1
fS2
S x = + V0 x = 14126,2134
fs2
- Sy = +'\j'"'y = 139 446,90
vx = ~ = 0,5333
X
sy
vy= -=-
y
= o, 5867
(e) El tope de renta que podrían percibir sería la renta mediana. El intervalo mediano
será el que contenga la frecuencia
N = 120 = 60
2 2 ,
EJERCICIOS DE LA SE CCIÓN 2 • 149
2.35
Central de Correos realiza una encuesta por muestreo sobre el
medio de las cartas que diariamente tiene que distribuir en la ciudad. La
•a1n recogida, sobre una muestra de 500 cartas, es la siguiente:
0, 18 145
0,24 132
0,30 84
0,42 50
0,60 48
0,72 22
1,08 10
1,20 8
1,50
500
la muestra y verifíquese si es
.·
.... 1<.'·~ '
xft, 2- · ,
X¡ n¡ X¡n¡
. 1 1 ·''
'·
0,18 145 26,10 4,70
0,24 132 31,68 7,60
0,30 84 25,20 7,56
0,42 50 21,00 8,82
0,60 48 28,80 17,28
0,72 22 15,84 11,40
1,08 10 10,80 11,66
1,20 8 9,60 11,52
1,50 1 1,50 2,25
S2 =az -a¡2
a1 = x = 0,34
¿x;n¡ 82 79
a2 =-'-=O 16
N 500 '
2
S = o,16- o,34
2
= o, 0444
S = +fil = +.J0,0444 = 0,2107
Como la desviación típica es menor que una vez la media, la dispersión en tor-
no a la media aritmética no es alta y ésta, por lo tanto, es representativa.
(b) Para determinar si el servicio es rentable debemos estimar los ingresos diarios por
este servicio; para ello supondremos que el franqueo medio de la muestra es el
franqueo medio del total de las 350 000 cartas, es decir, es el franqueo medio de
la población. Por tanto,
Ingresos = 350 000 x 0,34 = 119 000 euros.
7
2,25
130 4,2
~-nnT,._<:ll
tiene dividida su plantilla en tres categorías o estratos, por lo que el
medio será
N
== _h el peso o tamaño relativo de cada estrato.
N
- 20 50 130 3
X == -30 + - · 14,5 + -15,6 == 16,765 · 10 €
200 200 200
152. SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
V, = ST = 2_ = o 23
T X¡. 30 '
V = SA = 2,25 =o 15
A XA 14,5 '
V = So = 4,2 =O 27
0
x0 15,6 '
Como VA = 0,15 es quien toma el menor valor, podemos decir que existe ma-
yor homogeneidad de los salarios en esta categoría que en las otras dos, al ser
dispersión relativa inferior.
(e) Si representamos los salarios de cada uno de los 200 empleados por X¡ , tendría-
mos:
Caso l. Que una subida proporcional del 5% de todos los salarios situaría todos
ellos en
x; = X¡ + 0,05 X¡ = 1,05 X¡
con lo que, teniendo en cuenta las propiedades de la media, varianza y desviación
típica, estas características para cada categoría laboral serían
X~ = 1,05 XT = 1,05. 30 = 31,5
~ = 1,05 XA = 1,05. 14,5 :::: 15,225
~ = 1,05 x0 = 1,05 · 15,6 = 16,38
S~ :::: 1,05 ST = 1,05. 7 :::: 7,35
S~ = 1,05 SA = 1,05. 2,25 = 2,3625
S~ = 1,05 S0 = 1,05 · 4,2 = 4,41
x;. = Xr + 1 = 30 + 1 = 31, O
x~ =XA +1 =14,5+1 =15,5
~ = x0 + 1 = 15,6 + 1 = 16,6
la categoría de administrativos
x; =X¡+ 0,08 X; = 1,08 X;
XA = 1,08 XA = 1,08 ·14,5 = 15,66
S~ = 1,08 SA = 1,08. 2,25 = 2,43.
la categoría de operarios
x; =X¡+ 0,10 X; = 1,10 X;
x0 = 1,10 x0 = 1,10 ·15,6 = 1, 71
S~ = 1,10 S0 = 1,10 · 4,2 = 4,62 .
• _,...,..,n medio global sería
±= 1
20
x = h whx;. = 200 31,2+
50
200
15,66+
130
200
1.71 = 8,15
2.37
10-20 7
20-30 11
30-40 15
40-50 10
50-60 5
60-70 2
50
154 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
calcúlense:
(a) Media, mediana y moda. Desviación media respecto a la media.
(b) Tercer cuartil, sexto decil y trigésimo percentil.
(L7 Recorrido intercuartílico.
( d) Coeficiente de asimetría de Bowley.
(~ El percentil que corresponde al valor 47.
SOLUCIÓN
(a) Formemos previamente la tabla:
:L:Xn.
:X = _;_'_' = 1 760 = 35 2 .
N 50 '
N_N
Me = L. + 2 i- 1 . c. =
1-1 1
n¡
25 18
= 30 + - . 1o = 34 66 .
15 ,
10
= 30 + . 10 = 34,76 .
11 + 10
EJERCICIOS DE LA SECCIÓN 2 • 155
:Lix;- xh
Dx = ---'----- =
j
N
= 513,2 = lO 264.
50 •
3
Tenemos que determinar N = 37,5 ; el intervalo donde se en-
4
acma esta frecuencia, observando la columna N;, es (40 - 50), luego
= 40 + 37,5lO- 33 . 10 = 44, 5 .
6N
Ahora la frecuencia buscada es - = 30 , que se encuentra en el
10
30 18
= 30 + - . 10 = 38.
15
ngésimo percentil. Busquemos en qué intervalo se encuentra la frecuencia
30.V = 15. El intervalo es (20- 30), luego
00
30N -N
100 . i-1
= Li- l + . e¡
n.1
15- 7
= 20 + - - ·10 = 27,27.
11
156 • SECCIÓN 2. ANÁUSIS ESTADÍSTICO DE UNA VARIABLE
44,5- 25 '
P. -33 5
(e) 47 = 40+-'--·10; P,. =40; P.=40= 0J. }=80.
10 J 100'
El percentil 80.
~jercicio 2.38
Dada la siguiente distribución:
1 5
3 12
4 20
6 8
10 5
50
calcúlense: ·
(a) Media aritmética, mediana y moda.
(b) Desviación típica, coeficiente de apertura y coeficiente de variación.
(e) Coeficientes de asimetría de Pearson y de Fisher.
(d) Coeficiente de apuntamiento\ W\ ~4·
- "'
EJERCICIOS DE LA SECCIÓN 2 • 157
x41n1 N¡
5 5 5 5 5
36 108 324 972 17
4 80 320 1280 5 120 37
6 48 288 1 728 JO 368 45
10 5 50 500 5 000 50000 50
¿x.n.
- -
X- i
- -219
1 1 -
- -- - 4 38
N 50 ' .
Me= 4.
El valor más abundante de la distribución es
Mo = 4
S 2 =a2 - a12
a1 = x = 4,38
.L:X2n
= i 1 1 = 1 221 = 24 42
a2 N 50 '
s2 = 24,42 - 4, 38
2
= 5, 2356
S = +~5,2356 = 2,29 .
158 • SECCIÓN 2. ANÁLISIS ESTADÍSTICO DE UNA VARIABLE
Coeficiente de apenura
A = XII = .!.2. = 10 .
X1 1
Coeficiente de variación
V = ~ = 2,29 = 0,52 .
x 4,38
A = x- Mo = 4,38 - 4 = O 16 >O.
P S 2,29 '
¿x;n; 8 337
a 3 i
N
= -50- = 166' 74
¿x;n;
a4 = 66 465 = 1 329 3
N 50 ,
EJERCICIOS DE LA SECCIÓN 2 • 159
luego
2.39'
y número de unidades vendidas de un artículo ha sido:
li¡iE!.~~J~~~·J~~i~_;:]~;i:{;~J!~!1~i
1999 6,01 15 000
2000 6,61 15 500
2001 7,81 16 000
2002 9 16 200
2003 11 17 000
2004 12 17 300
N=97 000
160 • SECCIÓN 2. ANALISIS ESTADÍSTICO DE UNA VARIABLE
Así,
n
¿x;n;
x = ~ = 857 965 = 8 84 €
N 97000 '
n
nos interesa estudiar hasta qué punto la suma total de rentas L x; está equitati-
i =1
vamente repartida.
No cabe duda que las infinitas posiciones de reparto que se nos pueden pre-
sentar estarán incluidas entre las dos siguientes situaciones extremas:
l. Concentración máxima: cuando de los n rentistas, sólo uno percibe el total
de renta y los demás nada:
para xn ~ o.
2. Concentración mínima o equidistribución: todos los rentistas perciben la
misma cantidad:
De los diferentes estudios teóricos sobre este tema, vamos a desarrollar los
conocidos de Gini, Lorenz y Theil.
M:ull:tda la renta total para todos los rentistas, que evidentemente será un ,
lllllres:aremc,s cada u; en tantos por ciento de un. A este porcentaje le lla-
N u.
pJ =.:.:J.. · lOO q. = _l ·lOO
N l Un
~ P¡ ql
n2 Xz ~ u2 p2 q2
~ XJ~ NJ UJ PJ qJ
n.1 x;n; N; U¡ P; q;
N u.
NI
p .= - · 100.
' N
u.
q. = ....!... . 100 .
1 u
n
166 • SECCIÓN 3·. DESIGUALDAD
de Lorenz
o 100 P¡%
lOO
~ Concentración
máxima
A
o
FIGURA 6 .2
Luego podemos empezar a .pensar que cuanto más próxima esté la curva a
la diagonal OB mejor será la distribución de la renta, en el sentido de más
equitativa.
En total concordancia con la curva de Lorenz, podemos estudiar la concen-
tración a través del siguiente índice de concentración de Gini:
i = 1
/G =- -n-- -,..-1- -
LP¡
i = 1
entonces
n-1 n-1
L(P;- q¡) Í:(P;- O)
i ~ 1 i ~ 1
IG n- 1 = n-1 = 1
LP; LP;
i ~ l i~ 1
~CIQIO
de variación de IG va, pues, de cero a uno; e IG responderá a
•mucwn tanto más justa de la renta o del salario cuanto más próximo
o 100
FIGURA 6 .3
otra parte, se puede demostrar fácilmente, para una curva de Lorenz tal
la representada en la figura 6.3, que el índice de Gini es aproximada-
~ al área encerrada entre la diagonal OB y la curva (área rayada)
~
por el área del triángulo OAB. Es decir
, ~B
Areao
1G :::: ....,Á,-r_e_a--=---~
8
170 • SECCIÓN 3. DESIGUALDAD
O A P;% A P;%
Distribución de concentración mínima Distribución de concentración máxima
FIGURA 6.4
Pero entre los dos casos extremos representados en la figura 6.4 están los
casos intermedios , en los que la curva de Lorenz es más curvada cuanto más
desigual sea la distribución, y más fuerte la concentración.
P;%
CONCENTRACIÓN • 171
iibimo, cabe señalar que si bien el índice de Gini tiene la ventaja de re-
una sola cifra las complejas informaciones expresadas por la curva de
por lo mismo, permite comparar más fácilmente que la curva la con-
de dos distribuciones, esta ventaja tiene su contrapartida: dos distribu-
aspectos muy diferentes pueden, en efecto, tener dos índices de caneen-
del mismo valor. Así, las distribuciones representadas por las siguientes
de Lorenz A y B tienen el mismo grado de concentración global, pero la
del reparto de la variable no es la misma (Figs. 6.5 y 6.6).
un ejemplo de estas medidas.
A y B tienen 100 trabajadores cada una. Los salarios anuales por trabaja-
A: 20 perciben 8 000€
10 ((
10 000 €
10 << 12 000 €
10 << 15 000 €
50 << 75 000 €
B: 10 perciben 8 000 €
30 << 10 000 €
35 << 12 000 €
24 « 15 000 €
1 << 75 000 €
n- 1
X¡
8 000
}¡t N¡
10
x1n1
n
l:x,n,: u;
/•l
p.
'
'N..
= :.:L
N
. 100
' ~ ~"4
"
q. = iu'' ·100
u.
6,48
P,-1
3,5~
10 80000 80 000 10
10000 30 40 300 000 380 000 40 30,77 9,23
12 000 35 75 420 000 800 000 75 64,78 10,22
15000 24 99 360 000 1 160 000 99 93,93 5,07
75 000 1 100 75 000 1 235 000 lOO 100,00 -
100 1 235 000 28,04
ll-1
¿ <P; - q¡) 2s 04
1G, = l= 1 rr-1 ' - = o,125.
= -224
LP;
1=1
6.3 Eoeficiente de
concentración de Theil
La entropía es una medida de orden-desorden dentro de un sistema que puede
utilizarse para determinar la mayor o menor equidad en el reparto de una mag-
nitud económica. Veamos a continuación cómo se utiliza en el análisis de la
concentración.
Consideremos un conjunto de N rentistas cuyas rentas son:
tales que
N
,Lx; =X,
i=l
N
'_¿pi= 1 = 100%.
i=1
N N 1
HN (x) =- "'_¿ P; logp; = ¿ P; log-
; =1 ; = 1 P;
'íli
con lo que
N 1 N 1 1
HN(x) = L:P; log-
; =1 P;
= L:-log- =
; N 11N =1
1
= N-logN = logN.
N
En el supuesto de concentración máxima habrá un P; = 1 = 100% , el
resto de los pi = O para j * i, obteniéndose quet
N 1
HN (x) = ¿ P; log- =
; = 1 P;
= o+ o+ ... + 1. o+ ... + o = o.
• 1 1
p1 log - = 1 log - = llog 1 = 1 · O = O .
P¡ 1
174 • SECCIÓN 3. DESIGUALDAD
índice que varía entre O y 1, que posibilita las comparaciones, pero que,
embargo, pierde la información sobre el número de partícipes N.
EJEMPLO
Determínese el coeficiente de concentración T de Theil que existe en la siguiente distri-
bución de una herencia:
N
T = log N + Í: p1 log p1 =
; = 1
= log 5 - 0,590173 =
= 0,698970- 0,590173 = 0,108797.
T = 0,108797 = O1556 .
r 0,698970 '
176 • SECCIÓN 3. DESIGUALDAD
Ejercicios resueltos
EJERCICIO 1
Supóngase que dos padres de familia, cada uno de ellos con cuatro hijos, deciden
testar y repartir su patrimonio de la siguiente forma:
PadreA Padre$
Padre A
Previamente hay que ordenar los patrimonios heredados de menor a mayor; a continua-
ción formamos la siguiente tabla:
4 1 000 000
1 200 000
1 300 000
1400 000 4
4 5 000 000 10
O, 066 < O, 44 , podemos concluir que el reparto del padre B es más justo, ya
d reparto será tanto mejor o más justo cuanto menor . sea el índice de concentra-
187 000 21
204 000 25
280 000 30
325 000 17
450 000 15
500 000 18
620 000 14
1 000 000 10
150
SOLUCIÓN
n-1
I (P¡ - q)
111 95
IG
i=1
n- 1 = 406,65
• = o,2753
LP¡
i=l
Como 0,2753 no está muy lejos de cero podemos decir que los salarios
bastante bien repartidos.
(b) La curva de concentración de Lorenz que mostramos en la figura 6.7 se forma
los porcentajes P;• q¡ , llevando P; a abscisas y q; a ordenadas. Observando la cllr\1l
comprobamos su coherencia con el mdice calculado, puesto que cuanto más próxima
esté la curva a la diagonal OB menor será la concentración, y mejor será el reparto.
100 1-- - - - - - - - - - - - - - . . . B
90
80
70
60
50
40
30
20
10
o 10 20 30 40 50 60 70 80 90 100 p¡%
FIGURA 6.7
Ejercicios
DE LA SECCIÓN 3
EJERCICIOS DE LA SECCIÓN 3 • 181
i=l
1c (X) = .:.__:_n--1,.---
LP;
i=l
i
'L,n;
p . =N._ , =
i=l
--
1 N N
/
0
(y) = / 0 (x) .
3.2
de 100 familias en el último año fue:
182 • SECCIÓN 3. DESIGUALDAD
Alwn·o Número de
(en euros) familias
(- 1000)- o 16
0- 500 20
500 - 1 000 32
1000-2000 24
2 000-5 000 8
100
Ejercicio 3. 3
En una determinada provincia, las rentas percibidas se han distribuido según la
siguiente tabla:
4- 10 25 000
10 - 20 15 000
20- 25 30 000
50- 100 25 000
100- 150 5 000
100 000
n- 1
L/P; -q¡)
1 - i : 1 = 101,3 =o 44.
G- n-1 230 '
LPi
1
i :
3.4
tenía, a 31-ll-2003, 11 053 accionistas. La distribución del capital social
siguiente:
o- 25 7 568
25- 50 1 746
50- 100 934
100-500 725
Más de 500 80
11 053
SOLUCIÓN
(a) Formemos la siguiente tabla:
ll¡
L:X;n;
x = _i=-1- -
1 087 625
= - - - - = 98,4 acciones/accionista.
N 11053
(b) Para estudiar en qué medida está repartido el capital social entre sus accionistas
determinaremos el índice de concentración de Gini
n-1
L(P;- q;)
i=1
le n-1
LP;
i= 1
Tenemos que
·n-I
LP; = 344,5
i=I
luego
258,9 = o75 .
le = 344,5 ,
Como hemos comprobado, le = 0,75 está más próximo a uno que a cero.
Esto nos indica que hay una fuerte concentración del capital social en unos pocos
accionistas. El número medio de acciones por accionista, en este caso, no será
significativo.
EJERCICIOS DE LA SECCIÓN 3 • 185
3.5
empresa trabajan 20 000 productores, cuyos salarios, según categorías,
10 - 20 12 000
20- 40 6 000
40- 50 1000
50 - 100 800
100-200 200
20 000
n- l
'L:<P¡- q)
i ~ l
n-l
LP¡
i ~t
Por tanto,
n-1
L (P; - q¡)
.:...;~-'1---:-- = 59,2 ::: o17
n- 1 344 ,
LP;
i~l
ya que
n- 1 n
¿ P; = LP; - 100 = 444 - 100 = 344.
i = 1 i~l
Como este coeficiente está próximo a cero, la masa salarial está bastante
repartida.
(b) El 5% del personal mejor pagado será el que va del tramo del 95% al del 1
(véase la columna P; ). A este 5% de trabajadores le corresponde el siguiente
centaje de la nómina
100%- 81,8% = 18,2%
de donde
408
X=--=11 2%
36,3 ,
y, por tanto, el 50% de los salarios se lo repartirán entre el 60% + 11,2% = 71,2 'l
de los trabajadores.
EJERCICIOS DE LA SECCIÓN 3 • 187
3.6
se determinaron las siguientes distribuciones de la
Observamos que los niveles de renta establecidos son los mismos para cada re-
p.)n; para comprobar la afirmación propuesta calcularemos los índices de Gini pa-
a cada una de estas regiones.
Formamos, pues, las siguientes tablas:
2 225
3,5 182
5,5 56
8,25 32
Regi6nB
.·' ~,, 1;~·
.,, .. ,
Marca de clase
Renta /l.
¡ xiní U¡ N¡ P;% qi% P;-
X¡
y para la región B
90 38
1 (B) = • = O 32
e 283,07 '
y, por tanto, le (A) "# l e (B), con lo que este índice depende del número de indl-
viduos incluidos en cada nivel.
(b) La distribución de la renta para el conjunto de las dos regiones es:
..
Marca de clase
Renta x.¡ n¡ X¡fl¡ U¡ N¡ P;% q¡% P;-
'
0,5- 1,5 1 928 928,00 928,00 928 39,66 15,72 23,9-t
1,5 - 2,5 2 660 1 320,00 2 248,00 1 588 67,86 38,07 29,- -
2,5- 4,5 3,5 376 1 316,00 3 564,00 1 964 83,93 60,36 23,5-
4,5- 6,5 5,5 277 1 523 ,50 5 087,50 2 241 95,77 86, 17 9,6(
6,5 - 10 8 ,25 99 816,75 5 904,25 2 340 100,00 100,00 -
I = 86,90 = O30.
G 287,22 '
3.7
3.8
empresa de 20 empleados se registran los siguientes salarios anuales, en
siendo
n
T = log N+ LP; logp;
j;¡
Sabemos que T varía entre cero y log N, por lo que, como en este caso T está más
próximo a cero, el nivel de concentración salarial es bastante pequeño.
EJERCICIOS DE LA SECCIÓN 3 • 191
3.9
910
LP¡
i=l
con lo que
68 31
I
G
= 337,03
• = O, 2027 .
910 - 2,894446
y el coeficiente T es igual a
67 92
I = • = O2015
G 337,03 ,
107 107 ,
Por tanto, como
X.1
194 • SECCIÓN 3. DESIGUALDAD
tendremos
Marca de clase
P¡ n.l logp; P¡logp, '~P; lOg P;
x. ,_,
'
1 0,000395 125 -3,403403 -0,001344 -0,168000
2 0,000791 381 -3,101824 -0,002454 -0,934974
3,047 0,001205 214 -2,919013 -0,003517 -0,752638
3,907 0,001545 107 -2,811072 -0,004343 - 0,464701
5,5 0,002175 62 -2,662541 -0,005791 -0,359042
11 0,004350 21 - 2,361511 -0,010273 -0,215733
910 -2,895088 1
y entonces
T = 2,959041 - 2,895088 = 0,063953
..
istribución;
idimensional
frecuencias
Cuando no existe relación entre dos variables, se dice que las variables son
independientes. Inversamente, cuando la relación entre dos .variables es perfec-
ta, se dice que las variables están relacionadas funcionalmente, lo que significa
que su relación puede ser expresada bajo la forma y = f (x) .
Dependencia Dependencia
funcional ..,.¡~1-------- estadística -----tliJJ>~ Independencia
FIGURA 7.1
11¡)
n.y
X
'} n.¡ n'} N
-- ~
Estudios
Bachillerato Superiores
'1 1 ~1 '~1
B '12 ~2 ~2
e '1 3 n23 ~3
D '14 n24 ~4
X. Yj nij
1
X¡ Y¡ '11
:
X¡ Yj n ..
1}
:
xh yk nhk
DISTRIBUCIONES MARGINALES
X y
X¡ n.1• Yj n.
•J
X¡ n1· Y¡ n.1
xz nz. y1 n.1
x1. n.1 • yj .
n ).
xh nh· yk n.k
N N
Es claro que:
h k h k
'\'n.
¿ 1•
= '\'n
¿ •). = L ¿ nij = N
i =1 j = 1 i = lj =1
xJyz 1l¡p.
'"
X¡ 71¡2
x2 n22
X. ni2
1
: :
xh nh2
n.2
..
x;jyj n¡¡¡
,,,.
X¡ Tl¡j
x2 n2j
:
X.1 n ..
1}
:
xh
nhj
n.
•)
Yijx; nj/1
Y¡ ni l
y2 ni2
yj nij
yh nik
n.
1•
EJEMPLO
Sea la siguiente tabla de doble entrada
~ 5
1
1
2
2
3
1
4
3
n.1•
10 2 1 3 2 8
15 3 2 1 2 8
n . 6 5 5 7 23
•J
Se pide calcular:
(a) La distribución marginal de la Y.
(b) La distribución condicionada de X/Y = 2.
DISTRIBUCIONES BIDIMENSIONALES • 205
y. fl. 11
·j/N
J •J
1 6 6/23
2 5 5/23
3 5 5/23
4 7 7/23
23 1
5 1
INDEPENDENCIA ESTADÍSTICA
Vi, j.
Representaciones gráfic·a s
>< n ..
Yj - - - - - - - - - -- -------":< '1
>< :
>< >< :
1
>< :
1
1
FIGURA 7.2
X
FIGURA 7.3
FIGURA 7.4
208 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Moméntosen
·distribuciones
bidimensionales
h k n..
ars :L :L x;y; _!!_
; = tj = 1 N
h k n..
a1o = L L x>J N
; = tj = 1
_!!_ =
h k n.. h k n..
= LL
i=tj=l
X¡ _!!_
N
= L X¡
i=!
L
j=t
_!!_
N
=
n.
h
= ¿x¡ _,
_. = x
i=t N
h k n..
ao1 = L L x~y} N
; = tj = t
_!!_ =
h k n.. k h n..
:L :L Yj N = :L Yj :L _2_ =
i=tj=t
_!!_
j=t i=tN
k n.
= ¿
j =t
Yj ___:¿_
N
=y
h k n..
ao2 = 2:~ 2: x~ y~ __!!_
¡ tj = tN
=
h k n.. k h n ..
= 2: 2: y~ N = 2: y~ 2: N
i~tj=t
__!¿_
j=t i=t
__!¿_ =
k n.
=l:l_:¿_
j = t ¡ N
Análogamente
mo, =O.
Por su parte, los momentos de segundo orden (m20 , m02 , fr1 1) serían
h k n..
= ¿ ¿ (xí - xi (y¡. - y) 0 _!!_
N
=
h k n. h k n..
= L L (X xi 1
- _!!_ = L (X¡ - xl L __!!_ =
í=lj=I N í=l j=I N
h n.
= ¿ (x. - xl-r•
í = 1 Nr
=S 2
x
h k n.. h n
=L L (x; - x)2 __!!_ = ¿ (x; - x)2 __!:_ =
t= lj=J N i = J N
h n.1 h n. h n. h n.
= L (x; - 2x;x + x 2 ) - -· = ¿ x; -~-· - 2x¿ x; -~-· + x 2 ¿- 1
-· =
·=1 N i =J N i=J N i =IN
- - 2 1 2 2 2 2
= a2o - 2 xa1o + x · = a2o - a1o + a¡o = a2o - a1o
h k n ..
L L (x; - x) (yj -y)_!!_ =
; = lj = 1 N
h k n..
= L. "
"' L.' ( x iyj - -
xyj - -yx; + x- -
y )- 1) =
; = Jj = 1 N
1z k n.. h k n..
·= L. "
"' L.' L.' "
x i y j1)- - x- " L.' y j -
IJ -
i=lj=J N i=lj=l N
/¡ k n.. h k n..
-y L L xi_!!_ + xy L L
i =l j = l N
__!!_
i=lj=IN
=
= a 11 - x · a01 - ya¡ 0 + xy · 1 =
212 • SECCIÓN 4. ANÁLI SIS ESTA DÍSTICO DE DOS O MÁS VARIABLES
Y' = a2 + b2y
Por las propiedades de la varianza tendremos que sólo el factor de escala
( b1 o b2 , en cada caso) le afectará, siendo invariantes respecto a los compo-
nentes de cambio de origen, es decir,
(S' )2
X
= b21 s2 X
S'y = b2S y
Vamos, por último, a estudiar cuál será el valor de la covarianza de las
nuevas variables . Tendremos, pues, que
h k n ..
S~ = m; 1 = L L <x; - x') (y~ - f ) _jL =
; ;1 j ;J N
h k n..
=L L [(a 1 + b1x) - (a1 + b1x)] [a2 + b2 y) - (a2 + b2 y)] _iL =
;;¡ j ;J N
h k n ..
= L: L: [bl <x; - X> b2 <Yj - Y>l _jL =
; ; ¡ j ;I N
h k n..
= blb2 L L (x¡ -
; ;¡ j ; I
x) (yj - y) _!L
N
=
= blb2Sxy .
DISTRIBUCIONES BIDIMENSIONALES • 213
h k n..
all = LL
; = lj = 1
x;yj _!L
N
=
h k n n.
= .L .L
i=lj= l
xiyj __!_:_ • __:_!._ =
N N
h n k n.
= L
i=l
X;__!_:_ L Yj
Nj=l
__:_!._
N
= a1o · ao1
SOLUCIÓN
<'i
r 2 4 n.1•
t
x.w.·
1 '' l•
LY
5 1 o 2 3 15 75 9
10 2 o 3 30 300 4
15 o 3 4 60 900 14
11 .
•j
3 2 5 10 105 1 275 295
y j 11· j 3 4 20 27
2 3 8 80 91
y J. 11•J.
Por tanto
""x.n.
~ 1 l• 105
x= 1
N
= - = 10 5
10 '
1275
S2 = a 20 - :X
2
= - 10 52 = 17' 25
X 10 '
S2
y
= a02 - y-2 = 2.!..
10
- 2 72
'
= 1' 81
N
sxy = all - :xy = 29,5 - 10,5. 2,7 = 1,15
Para ver si las variables son independientes recordemos el resultado según el cual si las
variables son independientes su covarianza es cero.
Aquí,
sxy = 1,15 * o,
luego, no son independientes.
PÍTUL0 .8
terpolación
•
JUSte
215
216 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Jn·terpolación lineol
y parabólica
La interpolación parabólica establece la hipótesis de que los valores buscados
pueden obtenerse con suficiente aproximación a partir de la ecuación de un
polinomio de grado n - 1 que pasa por los n puntos conocidos de la sucesión.
Así, si tuviéramos dos puntos la función interpolatriz sería un polinomio de
grado uno, etc.
Véase, a este respecto, MARTÍN-GUZMÁN, P. y MARTÍN PLIEGO, F. J.: op. cit., págs. 119-126.
INTERPOLACIÓN Y AJUSTE • 217
esta parábola debe pasar por todos los puntos, las condiciones que deben
•:act!r los coeficientes «a)), serán:
x2 n-1
1 x2 x2
2
= (x2 - x 1) (x3 - x)
1
· · · (x -
11
xn - i ) :¡:. O'
1 xn x2 x~-1
n
existen puntos repetidos, habrá que eliminar estas repeticiones para que
anule 1 ~ ~-
caso particular de interpolación parabólica se produce cuando
= 1. Éste es el caso más elemental, que es aquél en el cual conocemos
(xl' y1) e (x2 , y2 ), y se quiere determinar la correspondencia en Y
x0 tal que x1 ::;; x 0 ::;; x2 •
218 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
1 y = a+ bx 1
por lo que para determinar la recta que pasa por los dos puntos (xl'
(x2 , y2 ) habrá que conocer los valores de los parámetros a y b . Para ello
demos proceder de tres formas:
a• Como (x1, y 1) y (x 2 , y2 ) son puntos de la recta, deben verificarla, por lo
e • Se puede comprobar que la recta que pasa por dos puntos puede expre-
sarse de la forma
X y 1
XI Y¡ 1 =Ü
x2 y2 1
EJEMPLO 1
Vamos a ver un ejemplo de interpolación parabólica. Supongamos que tenemos los si-
guientes cuatro puntos (x;; y): (0, 4), (1, 3), (2, 2), (3, 7) y queremos calcular el valor
de Y; para x = 1,5 . Hacemos pasar por los cuatro puntos un polinomio de tercer grado
INTERPOLACIÓN Y AJUSTE • 219
3 = a0 + la1 + 12 a2 + 13 a 3
2 = a0 + 2a1 + 22 a2 + 2 3 a 3
2
7 = a0 + 3a1 + 3 a2 + 33 a 3
ahora sólo dispusiéramos de dos puntos: (1, 5) y (3, 7), por ejemplo, y si quisié-
interpolar para x0 = 2 estaríamos en un caso de interpolación lineal, en donde
7-5
y = - - (x - 1) + 5 = x + 4,
3- 1
y (2) = 2 + 4 = 6 .
que haber dado, según él, 75 €, ya que el cambio teórico serían 1 €/$. Esto no ha
cedido así.
Para poder aclararle el tema al turista, procedamos de la forma siguiente:
(a) La relación entre €/$ no es estadística.
(b) Es una relación proporcional, es decir, vendrá expresada por una función
terpolatriz de tipo lineal.
(e) Determinemos dicha función, ya que si x son dólares e y euros, conocemos
puntos por Jos que pasa: (10, 10) y (75, 78).
La recta interpolatriz será
es decir
y -10 X -10
78 - 10 75-10
de donde
y = 1,05x- 0,46
siendo y los euros , comprobamos que el tipo de cambio es de 1,05 €/$, pero
en la oficina de cambio cobran una comisión fija de 0,46 € por cambio. Así..
interpolando, por 25 $ le darían
y = 1, 05 · 25 - O, 46 = 25,79 €
y por 130 $obtendría
y = 1,05 . 130 - 0,46 = 136,04 €.
Aiuste
Sea (x¡, y ; n¡) una distribución bidimensional en la que se supone que existe
1
relación entre las variables X e Y. A diferencia de la interpolación, ahora no
vamos a suponer que exista dependencia funcional entre las variables, sino
dependencia estadística.
INTERPOLACIÓN Y AJUSTE • 221
X X
X X
FIGURA 8.1
infinitas que hay en el plano, pasa lo más cerca posible de los puntos.
Dados los puntos (x1, y1), (x2 , y2 ), . .. , (xm, ym), elegida una función de
definida por
FIGURA 8.2
Existen otros métodos de ajuste que pueden verse en MARTÍN-G UZMÁN, P. y MARTÍN PLIEGO , F . J.
op. cit., págs . 140-155.
INTERPOLACIÓN Y AJUSTE • 223
FIGURA 8.3
<t> = L: L: <Yj -
i j
2
Y;) nij
Como los valores teóricos son los obtenidos a partir de la curva ajustada,
claro que
para lo cual la condición necesaria es que las primeras derivadas parciales res-
pecto a cada uno de los parámetros se anulen, es decir,
La cqndición suficiente para que <l> tenga mínimo se cumple siempre para el
valor obtenido en (1).
a<I>
-ab = 2"" (y. -a- bx.) (-x.) n.. =O
L.. L.. 1 11 1 1
1 1
L L (yj -
i j
a - bx) nij == O
L L (yj -
i j
a - bx) (x) nij =O
y traspasando términos
¿ Lj yjnij
i
=aL
i
Lj nij + b L Lj x;n;j
i
L Lj xiyjnij
i
= a L Lj xinij + b L Lj xJnij
i i
¿yjn·j == aN + b ¿x;n;.
j
EJEMPLO
El número de accidentes de carretera ocurridos en una determinada ciudad y el
de coches matriculados en la misma durante una serie de períodos de tiempo han
los siguientes
i""
N° de coches matricultuúJs N° de accidentes
(x.) (y¡) '· ..... , ;
''·'""' ""
500 23
510 25
520 29
540 31
580 32
Ajústese una recta que exprese el número de accidentes ocurridos en función del
ro de coches matriculados.
140 = 5a + 2 650b }
74 630 = 2 650a + 1 408 500b
cuya solución es
de una parábola
caso, la curva seleccionada es
2 3
"
L. " 1 = a"
L. x.y.n..
1 1 1 L. x.n.
1 1•
+ b "x
L. 1 n.1• + e"
L. x1 n.1•
i j í 1 i
i j
0<1>
- =2
aa1
¿¿
-- (y.-ao -nx.-ax.
1 ll 21
2 - .. · -ax.)(-x.)n.=O
h
hl 111
1 1
0<1>
- =2
aah
¿¿
-- (y.-ao -nx.-ax. 1 ---¡1 21
2
- "·-ax.
hl
h h
)(-x)n.
1 11
=0
1 1
o bien
+a1 "xn
L.,¿ i ¡.
+ .. . +ah "xh _n_
L.,¿ 1 1•
1 1
LLxiyjnij = a0 ¿x¡n¡.
1 1
siendo
N="n.
L. 1•
Ajuste hiperbólico
Este tipo de funciones tienen un especial interés para el economista, y para
introducirlas nada mejor que considerar un ejemplo económico, la función de
demanda de un cierto bien. Llamando p al precio y q a la cantidad dema~dada.
definimos la elasticidad de la cantidad demandada respecto al precio como
dq p
e q,p = - · -
dp q
INTERPOLACIÓN Y AJUSTE • 229
dq p
E
q,p
= kc:> - · - = k
dp q
pq = K
r· q2 .......................T................
P¡ p
FIGURA 8.4
Esto quiere decir que si partimos de una distribución (x1, yj; n1) ,
ajustar una hipérbola equilátera debemos ajustar una recta a la distn
(z1, yj; n1) , donde
1
x_
1
Ajuste potencial
La forma general de la función potencial es
y= a· x b
que se puede reducir al caso general lineal tomando logaritmos
log y = log a + b log x =A + b log x
Partiendo de (x1, yj ; nij) , para ajustar una función potencial,
ajustar una recta a la distribución (z.,
1
u1 ; n1} ) en donde
Z¡ = log X 1
uj = log yj
una vez determinados los parámetros, A = log a y b en el ajuste
u = A + bz , la potencial será •
y= a· x b donde a = antilog A .
EJEMPLO
Estudiando el mercado de un cierto producto de consumo se ha reunido la siguiente
información sobre los consumidores:
2,5
4,3 4,6
e = Iog e}
Y = log y se transforma en e = A + bY .
A = log a
Y¡ ej Y¡ Ijej y2
J
L ej
j
= NA +bL
i
Y; }
¿ ¿ r;ej = A ¿ r; + b ¿ Y; 2
1 J t '
1,35217 = 4A + 2,59724b
0,89392 = 2,59724A + 1,69153b
A = 1,35217- 2,59724b
4
1 35217 2 59724
0,89392 = 2,59724( • -4 · b ) + 1,69153b
b = 3,11328
De donde
b = 3,11328
a = antilog A = antilog(-1,68344) = 0,021
Por tanto,
e* = O, 021 . /·"Jzs.
EJEMPLO
Dada la siguiente distribución
X.¡ 1 2 3 4 5
'
LL~iyj
i j
= A ¿x
i
1 +B ~x¡
1
' ~ X1 ,¡;"
,. Y¡ Y.J x21 x.Y.
1 J
15 10,4106 55 31 ,5565
10,4106 = 5A + 15B }
31,5565 = 15A + 55B
A = 10,4106- 15B
5
10 410
31,5565 = 15( • ~- 15 B ) + 55B
B = 0,03247
A = 1,98471
y* = 96,54 · 1, 0776x .
ÍTULO 9
. ,
greston y
rrelación
Regresión 1 de Y sobre X
Consideremos la nube de puntos de la figura 9 .l. Si nos preguntáramos qué
valor deberíamos asignar a Y para X == x1 , diríamos que la media de las Y
cuya X sea x 1 , es decir, la media de las yj cuyaabscisa sea x1 , que no es otra
que la media de Y condicionada a que X tome el valor x1 •
REGRESIÓN Y CORRELACIÓN • 237
x2 x3 ............... xh X
FIGURA 9.1
el gráfico, las ordenadas de los puntos que están unidos entre sí repre-
estas medias condicionadas. La regresión I de Y sobre X estaría formada
puntos:
(x1 ; Y/ x1 )
(x2 ; Y/x2 )
(x3; Yj x3)
puntos aparecen unidos por una línea quebrada para indicar que son
que pertenecen a una misma regresión.
I de X sobre Y
y3 -----------------
Y¡
FIGURA 9.2
que se unen por una línea quebrada para indicar, igual que en el caso anterior
que son puntos que pertenecen a una misma regresión.
Si los campos de variación de las variables fueran intervalos reales, ten-
dríamos infinitos puntos correspondientes a las medias condicionadas, y las
regresiones I, tanto de Y sobre X como de X sobre Y, serían funciones conti-
nuas.
REGRESIÓN Y CORRELACIÓN • 239
REGRESIÓN 11
11 de X sobre Y
2: 2: (x¡ -
i j
xn
2
nij
2
LL[Yi- f(x)] nii·
i j
240 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
de regresión de Y sobre X
m:;mato la técnica de mínimos cuadrados para el ajuste de una recta, es de-
Jr.aciendo mínimo
<I>, = L L (y j - a - bx/ nij
i j
a0 ;= a + b · a10 }
[1]
a11 = a · a10 + b · a 20
a = a01 -
sxy a
-
- sxy x- .
= y - -
sx2 10 sx2
las estimaciones mínimo cuadráticas de los parámetros a y b son:
~(. ~-"
~ '·.J \
'O-"'
- / 1 • í\Q'.."'
\! l ,.,::.,"'\ V
~e\r:::;•~'
a= y- S2 X
X
242 • SECCIÓN 4. ANÁLISIS ESTA DÍSTICO DE DOS O MÁS VARIABLES
que, reordenando, es
1Y - ji = t (x - X) 1
2
.
pero
b = tg a = ~y
~
6]
1
1
1
: óy
1
1
1
--------, 1
óx
FIGURA 9.3
óx
--------------r---------
1
1
óy :
S
_31_
bl -
- 2
sy
X X+ ÓX
FIGURA 9.4
244 • SECCIÓN 4. ANÁLISIS EST ADISTICO DE DOS O MÁS VARIABLES
como
Llx
b' = tg a.' = Lly '
FIGURA 9.5
9.2 Correlación
n. n.
sz = "'"'(y.
ry L..L.. 1
- y*)2 _!!_
1 N
= "'(y.
L. 1
- y*)2 __:¿_ •
1 N
1 1 1
52y
es la varianza marginal de Y, y donde este cociente funcionará en
mverso al de la varianza residual respecto a la dependencia.
armonizar el sentido de la medida de la correlación con la correlación
. a mayor medida, mayor dependencia, y viceversa), se define el coe-
de correlación general de K. Pearson corno:
~
R=f-s:·
cuadrado del coeficiente de correlación, es decir a R 2 , se le denomina
de determinación general.
246 • SECCIÓN 4. ANÁLISIS ESTADÍSTJCO DE DOS O MÁS VARIABLES
de donde
R=
n 2
y
tendremos que
coeficiente nos medirá el grado de cor relación lineal que existe entre las
. Téngase en cuenta que el concepto de correlación está íntimamente
al de regresión, ya que siempre se debe hablar de correlación según una
.....LU.L<.ua curva de regresión. Puede ocurrir que las variables no estén reta-
n ..
S2 = ""(y . - y*i __!!__ =
ry L.L. ' ' N
lr;~
1 J
~ ~~ { y1 - [Y + ~! (x, - X)
2
s
= LL [ (y . -Y)- __2_(x. -:X)
] n..
__!!__ =
. . '
1 )
s2 X
1 N
~
= LL(Yj -Y) ~ +
1 J
2 n..
(S7)2
X
LL<x; - -)2~
1 J
x N-
S n..
-2__2_
s2X ""<Y·-
L.L. '
y-) (x.- :X)_!!_=
N 1
l J
[S;; s xy
r=f -s:= SX ·Sy
es decir,
INTERPRETACIÓN ANALÍTICA DE r
S
- = -xyX
y-y ( -X-)
s2 X
S
X --X =xy- ( y-y
-)
s2y
coeficidente de correlación lineal es
r =
S S
b' =~ = r-2..
2
Sy sy
Y- Y= o}
x-x=O
es decir, dos rectas paralelas, cada una de ellas respecto a un eje.
Y X=X
---+---+------------
(x, y)
y = y
o X
FIGURA 9.6
r =
SX ·Sy
el capítulo 7 vimos que cuando las variables eran estadísticamente inde-
la covarianza era cero. Por consiguiente, si las variables son in-
-""'""'""• están también incorrelacionadas linealmente, al ser r = O .
bien, el recíproco no se verifica necesariamente, ya que la correla-
líneal entre las variables puede ser nula; al ser r = Sxy = O , y no ser in-
-aa._...._,.,, ya que la covarianza se puede anular sin que se cumpla la condi-
de independencia.
252 • SECCIÓN 4. ANÁLISIS ESTA DÍSTICO DE DOS O MÁS VARIABLES
y~ = a2 + b2yj
las desviaciones típicas y la covarianza, en función de las nuevas v
serán
S'X = bS
1 X
S'y = b2Sy
S~ = b1b2 Sxy
Varianza debida a la
regresión y coeficiente .
de determinación lineal
de Y.
1 1
+~!
¡ j ¡ j
~ ~ ~ { YJ + (x, - ~ ]} ; ~
n.. S n..
= ¿¿ (yj - Y) _!1_ - -4 ¿ ¿ (x¡ - x) _!1_ =
¡ 1 N Sx ¡ j N
=Y-e=Y
Vemos que, el valor medio de los valores teóricos y; coincide
valor medio de los valores observados.
Teniendo en cuenta estos resultados, podemos definir las siguientes \
zas:
n ..
" <Y1 _ y*)2
= "LJLJ 1
_!}_ = s2
N ry
1 1
[3]
es decir, en este caso X no nos sirve para ampliar la descripción del coJIIlDOd
miento de la variable Y.
caciones de la ··
resión y la correlación
e= a+ bYd.
Por otra parte, aunque desde el punto de vista estadístico siempre cabe
posibilidad de plantearse las dos regresiones, la de Y sobre X y la de X sobre
desde el punto de vista de investigación aplicada puede ocurrir que '>VléUUIMII
una de las dos regresiones tenga sentido teórico.
Todas estas consideraciones son fundamentales antes de abordar el
estadístico de la regresión y de la correlación.
9.4.2. PREDICCIÓN
S
- + -2
xy(xo - x-) .
Yo = y
sx
Es claro que la fiabilidad de esta predicción será tanto mayor, en princilrJÍCII
cuanto mejor sea la correlación entre las variables. Por tanto, una medida
ximativa de la bondad de la predicción podría venir dada por r.
No obstante, hemos de señalar que tanto este tema, como en general toda
formulación de los modelos de regresión, están más rigurosamente tratados
la teoría avanzada de los modelos lineales, siendo todo lo expuesto un p ·
contacto con los problemas que se suscitan en los modelos de regresión al nh
introductorio con que se plantea este texto.
Veamos a continuación un ejemplo de los métodos expuestos.
EJEMPLO
Dada la siguiente distribución
REGRESIÓN Y CORRELAC IÓN • 2 59
2 3 5
2 4 10
2 5 17
4 5 19
7 4 20
7 5 16
10 3 9
10 5 4
100
a= y- bx;
32 64 128
30 80 170
o o 19
19 76 304
o o 380
o 20 16
36 252 1 764
o 560 560
9 o 4
13 130 1 300
270 o 200
14 30 56 100 522 3 496
Lx;n;. ~22
--'---- = _:>- = 5 22
N 100 '
s; = a10 - a,o = 34,96- 5,22 2 = 7,7116
2
LY~n.j 2006
a
01
= 1
= - - = 20, 06
N 100
Sy 2
= 20,06- 4,422 = 0,5236
Sry = a
11
- a a
10 01
(b) Para estudiar la dependencia lineal entre las variables calcularemos el ""''rP<:TVl-.
diente coeficiente de correlación lineal
r =~ = -0,5724 = -0,2848.
sx · sy ~7,7116 ~0,5236 ·
a = ~- bt
{b = ....!!.
s2t
1998 3 -3 9 9 -9
1'999 6 -2 4 36 - 12
2000 7 -1 1 49 -7
2001 8 o o 64 o
2002 10 1 1 100 10
2003 11 2 4 121 22
2004 12 3 9 144 36
57 o 28 523 40
'2>: =0
t'= -j-
N
LYj 57
J=~ = --;:¡=8,1
262 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
"'t'2
L. l 28
a =-'-- = - = 4
2o N 7
LYJ 523
a02 = _j_
N
= 7 = 74 , 7143
¿¿t;yj 40
i j
N
=
7 = 5, 7143
con lo que
2
S/ =a20-a:o =4-0=4
s: = a 02
- a~ 1 = 74,7143- 8,14 2 = 8,4547
St'y = all - a10 a01 = 5,7143 - 0 · 8,14 = 5,7143
Por tanto
Sr'
r = __Y_ = 5,7143 = o 98
Sy · S¡ ' ~8,4547 J4 , .
Este coeficiente próximo a 1 nos indica que la evolución de la renta se adapta
proporcionalmente a las variaciones del eje de tiempos.
EJERCICIO 2
El gasto de los consumidores en bienes y servicios y la renta co•~re:mo,ndienl•
(ambos en 'billones de euros) han sido
REGRESIÓN Y CORRELACIÓN • 263
:~:::cj
e = _i_ = 10 = 1
N 10
y=
L Y;
_ i -
· 169
= - ' = 1,69
N 10
¿e~
11 12
a02 = _i _ = • = 1112
N 10 '
LY:
a = -;- = 3 1,91=3191
20
N 10 '
¿¿eiyi
a = ; i = 18,33 = 1,883
11
N 10
s: = a02 - a~ 1= 1,112 - 2
1 = 0,112
s: = a 20
- a~0 = 3,191 - 1,69 = 0,3349
2
El modelo ajustado es
e = 0,026 + 0,57629y .
Cuando la renta y = O, el consumo no es cero sino e = 0,026 , es decir.
produce un desahorro para gastar en el mínimo vital.
En 2006 la renta será
(b) Una medida de la bondad de la predicción nos vendrá dada por el coeficiente de
correlación lineal entre las variables
r = ~ = 0,193 = O 99
se . sy ~0,112 ~0,3349 '
Juego el 98% de las causas que determinan un cierto nivel de gasto en bienes y
1 - r2 = 1 - 0,98 = 0,02
Imponación Producción
(en 106 euros) (en 106 euros)
22 105
33 120
45 125
50 130
65 140
67 154
Suponemos que las importaciones (M) estarán en función del nivel de producción
iDiustrial (Y) y que el tipo de relación es lineal
m=a+by
266 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
m = 282 = 47
6
774
y= = 129
6
14812
ao2 = 6 = 246866
,
101266
a2o = 6 = 16 877,66
37 813
an = = 6 302,16
6
2
Sm2 = 2 468,66 - 47 = 259,66
Sy2 = 16 877,66 - 1292 = 236,66
Smy = 6 302,16 - 129 · 47 = 239,16
r =
Sry2 = Sy2 (1 - r 2 )
Comprobamos que
Y=rz!'
268 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Producción (L) 10 20 26 31
u1 = lnY1 }
z.1 = In L.1 tendremos el modelo lineal u = a + bz
a= Inr
Y.
J
L.1 u1 = In Y1 Z¡ = lnL¡ u~ u. .
J
J
de donde
:~::u,
- j 11, 99038
u=--= = 2,997595
N 4
-
LZ¡
1 24,37130
z = -- = = 6,092825
N 4
REGRESIÓN Y CORRELACIÓN • 269
1>2
= _1_1 = 36,68364 = 9 17091
ao2 N 4 ,
I,z;
a = _;_ = 149, 57426 = 37 393565
20 4 4 '
S"'- = a11 - ~ 0 a01 = 18,48628 - 2, 997595 · 6, 092825 = O, 22245825
LLU¡Z¡
j l 73,94512 = 18 48628
a11 = N 4 '
Y = 0,1355 · L0' 82 .
Y, = renta período t
y0 = renta inicial
t = tiempo
p es un parámetro
270 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Sabiendo que:
Años R(fnra
1 12
2 15
3 20
4 26
5 34
Determínese:
(a) La renta inicial.
(b) La renta estimada para el año 10.
si llamamos
u, = ln Y,}u, =a + pt
a = ln y0
- .L t i
t= - ' - = -
15
=3
N 5
s: = a 02 - a~ 1 = 9,1064 - (2,9946) 2 = 0,1387708
¿uz
a = _¡_ '' = 45,5322 = 91064
o2 N 5 '
¡: t i2 55
a2o =-'-=-=11 .
N 5
S., = a11 - a10a01 = 9,51038 - 2,9946 - 3 = 0,52658
.L.Lu t.
r1 ¡
1 1
' = 47,5519 =
9 51038
N 5 '
p = 0,52658 = 0,26329
2
a = 2,9946 - 0,26329 - 3 = 2,20473 _
Y(
= 9' 068 eo. 26329 ,
gresión múltiple
istribU.c ión.p-dimensional
frecuenci(Js
273
274 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
1a observación
2 a observación
N-ésima observación
ecuación del plano que queremos ajustar, los coeficientes b12 , b13 (coefi-
de regresión parcial) y b10 se determinarán con la condición de que
•trn1ma la suma de los cuadrados de las diferencias entre los valores obser-
x1j y los calculados mediante la ecuación del plano, x1: •
X X
X X
X X
X X
X x2
X O'
--..e--)XI, X2.X3
X
FIGURA 10.1
276 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
s2 = "(x!j - x~)2
rl·2 3 .. . p 7 N
szr l ·2 3 ···
"R
• .,.2 3 ... p
=
~
1_ 2
p
51
a considerar el caso en que se seleccione una función del tipo lineal, tal
e= =y- y*
$="<Y·-
L.,¡ J
j
y*)
J
2
= "e
L.,¡ J
j
2
= e'e = [y- Xb]' [y - Xb] =
1X' Xb = Xy 1
es una matriz no singular, es decir, si su determinante
es distinto de cero, se puede calcular l~ inversa [X' xr 1
y entonces
1b = [X' xr1 xy 1
son los coeficientes de regresión parciales, y así, por ejemplo, b2
la variación de Y, inducida por una variación de X2 , suponiendo que las
variables permanecen constantes.
otra parte, la condición mínimo-cuadrática
X'Xb = Xy
Xy - X' Xb =O
X'[y - Xb] =O
X'e = O.
1' l'e o
X'1 X'1e o
X'e = X'2 e= X'2e =0= o
X'p X'pe o
de donde
l'e = O.
Pero como
" e.,
L., = "L., (y.1 - y*)
1 = O
j j
es decir que y = Y* .
La media, pues, de las observaciones de Y es igual al valor medio
valores teóricos obtenidos en el hiperplano de regresión. Este resultado lo
caremos a continuación.
R = 1
_ Varianza residual
Y· n .. p Varianza total
REGRESIÓN MÚLTIPLE • 281
S 2 == _!_[y'y - b'Xy]
r N
1 1 1
s2 == - " (e. - e)2 == - " e2 == - " (y . - y*)2
r NL. 1 NL. 1 N~ 1 1
1 J J
- y*)
J
2 = "e 2
L. J == e'e =[y- Xb]' [y ·_ Xb] =[y' - b'X'][y- Xb] =
j
ya que
(b) 'f.y7 2
=y*' y* = [Xb]' [Xb], teniendo en cuenta, según vimos
j
• A la expresión
2
"L..,¿ (y.1 - y*)
1
= y'y - b'X'y
j
I<Y; - '}) 2
= b'X'y- NY2
j
"' c(.lluÍrados
Varianza Correlación
b'X'y - Nyl
y'y - b'X'y
y'y - NY 2
R = ~~- s2s; = 1-
y'y - b'X'y
y'y - Ny2 -
-
b'X'y - N y2
V y'y - N y2
y
S2 S2 b'X'y - N y 2
Rl = 1- _ r_ = ....Ji. = ----=------=~
s2y s2y y'y- Ny2
s: = s~.12 + s~.12
284 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Demostrándose que
2
SRy•l23 > s2
- Ry·l2
2
Sry•l23 < 52
- ry•i2
. 3. EL PROBLEMA DE LA MULTICOLINEALIDAD
problema surge cuando existe una correlación lineal simple perfecta entre
o más) variables explicativas, ya que implica que una (o más) columna(s)
matriz X de observaciones son combinaciones lineales de otra(s), con lo
rango de esta matriz X se reduce.
En principio el rango de [X' X] es p + 1 , es decir, igual al número de pa-
. pero si existe alguna combinación lineal entre las colm1ll1as de X,
su rango es menor que p + 1 , con lo que el determinante
= O, lo que nos impide calcular la matriz inversa de [X' X] , y por lo
el vector de coeficientes b
b =[X' xr 1
xy
rpl rp2 1
que es simétrica dado que f¡j = rji ; si 1Rx 1 = O , decimos que existe m111ltilall
nealidad. Cuando 1 Rx 1 = O, se dice que existe cuasi-multicolinealidad
multicolinealidad imperfecta.
La solución de este problema requiere modificar el modelo o realizar
tipo de transformación que elimine la multicolinealidad, pero éste es un
que se sale del objetivo del texto y que se encuentra debidamente tratado
cualquier manual de econometría.
EJEMPLO
Sean las siguientes variables Y, XI ' x2 ' de las que se dispone de la siguiente .
ción:
2 4 1
3 5 2
6 10 7
8 11 8
10 15 12
2 2
xli x2J Yi1i yix2i x11 x21
4 16 1 8 2 4
9 25 4 15 6 10
7 36 100 49 60 42 70
11 8 64 121 64 88 64 88
15 12 100 225 144 150 120 180
45 30 213 487 262 321 234 352
LY¡ 29
y= T = s- =5,8
- ~x,i 45
X
1
= - - = - =9
N 5
- ~x2i 30
X2 =--= -= 6
N 5
LY~
s2 = _ i _ - Y-2 = 213 - 5 82 = 8 96· sy = 2,9933
Y N 5 ' ' '
s, = 4,04969
sx,. = 4,04969
LYjXlj
j 321 .
Syx, - y-.xl = - - 5,8. 9 = 12
N 5
LYjX2j
j 234
Syx,_ - y .X2 = 5 - 5' 8 · 6 = 12
N
¿xlJx2J
j 352
Sx x - x;.x2 = - - 9. 6 = 16 4
1 2 N 5 '
288 • SECCIÓN 4. ANÁLISIS ESTA DÍSTICO DE DOS O MÁS VARIABLES
S
rYX¡ = ___3._ =
S S
o' 989
y X,
S
ryx,_
= ...--I:L
S S
= o' 989
y x,
S
r = ___5.2_ = 1
yx, S S
X¡ x2
b = [X'Xr1 [Xy]
N ¿xlj
+:
Ixzj
j j 45
[X' X]= ¿xlj ¿x;j ¿xljx2j 487 301
352
j j j
30 352 262
Ixzj ¿x.ljx2j Ixij
j j j
45
487
30]
352 = 637 970 + 475 200 + 475 200 -
1 X' X 1 = [ .:
30 352 262 - (438 300 + 619 520 + 530 550) = o
siguiente tabla nos muestra los valores de las variables «importaciones de bienes
!B"Vicios» (variable dependiente Y ), «producto nacional bruto» (PNB, X1 ) y
relativos de las importaciones>> ( x2 ), durante el período 1995-2004 de la
•10m1a de un país
Lx11
- = _ 1_ = 759 = 75 9
~ T 10 '
Lx21
x2 = -~- = 1 058 = 105,8
T 10
- = ~y/ = 618 = 61 8
y T 10 '
b = [X'Xr1 Xy.
Para ello los cálculos matriciales necesarios son:
donde
T
759
1 058]
59 787 79 090
79 090 112 818
REGRESIÓN MÚLT IPLE • 291
6181
= 50 560
[
63 232
20,00606 1
b " [ :: 1"txxr' X 'y =
[
1, 3556359
-0,5774955
= _!_[b'X'y- TY2 ] =
T
= ~{[20,00606
lO
1,3556359 -0,5774955] [so ;~~1- 10. 61,8
2
] =
63 232
= 619,610073
292 • SECCIÓN 4 ANÁLISIS ESTAD[STICO DE DOS O MÁS VARIABLES
y comprobamos que
R2 _ S~ _ 6196,10073 = O
9914396
- s2 - 6 249,6 '
y
o bien
s2 53 49927
R 2 = 1- _2:...
2
= 1- · = 1- 8 560431 · 10-3 = O 9914396
s 6 249 6 • '
y '
:Ll
s2 = -~-~ _ y- 2 = 44442
-6182 = 62496
Y T 10 ' '
L X~
s2 = -~-- _x2 = 59787-7592 = 21789
x, T 1 10 ' '
¿x1
s2 = -~-21- - _x2 = 112 818 - 105 82
2
= 8816
x, T 10 ' '
sy = 24,9992
S.r, = 14,76109
Sx, = 9,38935
¿ xy 11 1 50560
Syx, = 1
T - x1)1 = ----w- - 75,9 · 6 1,8 = 365,38
¿x21yl
Syx, 1
T - .f2)1 = Il--
63 2 2
105,8 · 61,8 = - 215,24
REGRESIÓN MÚLTIPLE • 293
79 090
-- =
- xtx2 10 - 75 , 9 . 105, 8 = - 121, 22
T
S 365,38 = o 99
rYX, = -YX,- =
SS
y x,
24,9992 ·14,76109 ,
S -215,24
ryx, ~ = -215,24 = -0 917
SS
y X!
24,9992 . 9, 38935 742,26953 ,
Y¡ X¡¡ ~
-5 -1 3
3 1 1
-1 o 2
4 2 1
Sabemos que
-1 3
[X'~= r-~ r: ~ ~1
1 1
1
1 o
1 o 2 =
1 2 7 o 15
2
294 • SECCIÓN 4 ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
de donde
~21
-30
adj [X' X] = rw
-30 11 14 = [adj [X' X]]'
-42 14 20
luego
90 30 42
6
--
6
--
6
[adj [X' X]]' 30 11 14
[X' X]-1 -- - -
¡xx¡ 6 6 6
42 14 20
-- - -
6 6 6
-5
xy =
o
2 1
= -10
4
tenemos que
90 30 42
-
6
--
6
--6
L:l=Ul
30 11 14
b = [X' X]- 1 Xy = -- - -
6 6 6
42 14 20
-- - -
6 6 6
-3] r 1~ 51
b'X'y = ( 5
- 10
-5
1 =
3
y'y = [-5 3 1 4) = 51
4
51- 4(_!_ )
R2 = 4 = 1,
51 -4(±J
, que en este caso la correlación múltiple es perfecta, siendo nulos todos y cada
los residuos.
Ejercicios
DE LA SECCIÓN 4
EJERCICIOS DE LA SECCIÓN 4 • 299
4.1
cambios de dólares por euros según la siguiente equi-
10 11
75 89
100 119
E1 turista piensa que si por los 10 $ primeros le han dado 11 €, por los 75 $ segun-
le tenían que haber dado 82,5 €, ya que el cambio teórico sería de 1,1 €/$.
Para poder aclarar este tema pensemos, en primer lugar, que la relación entre divi-
80 es estadística, sino que responde a algún tipo de función matemática, y si el tipo
cambio no varía, esta relación ha de ser lineal; es decir, que los tres puntos que
los tres primeros cambios han de estar sobre una recta.
Para comprobar este supuesto consideremos los dos primeros casos, y determine-
la recta que pasa por esos puntos; siendo x la variable dólares e y la variable
esta recta interpolatriz será
y - Y¡ X- X
1
=
Y2 - Y1 x2 - x1
y -11 X -10
89 - 11 75 -10
y = 1,2x- 1
lo que el tipo de cambio es de 1,2 €/$, cobrando la oficina de cambio una comisión
de 1 € por cambio.
Verifiquemos que esta relación se da en el tercer cambio
y = 1, 2 . 100 - 1 = 119 €
Ejercicio 4.2
El consumo de productos congelados (yj ) y la renta mensual familiar ea
muestra de 5 hogares son los siguientes:
Consumo
20 25 35 40 45 Renta
(en miles)
FIGURA E4.1
EJERCICIOS DE LA SECCIÓN 4 • 301
L, yi = Na + bL, x; }
L,x;yi =a L,x; + bL,x; 2
, X¡
x.=-·
l 100
840 = 5a + 165b }
2 950 = 165a + 587,5b
a = 31,38
b = 4,14
y = 31,38 + 4,14x'.
4.3
de ahorro y la renta del sector familias, en billones de pesetas
de 1977, para el período 1977-1986, fueron:
SOLUCIÓN
(a) Para ajustar por mínimos cuadrados el modelo lineal
S1 =a+ by1
L S = Ta + b L y
(
1
(
1 )
¿s y =a LY + b ¿y;
1 1 1
( ( (
s, Y, ~Y, y; ~
1,9 20,5 38,95 420,25 798,475 8 615,125
1,8 20,8 37,44 432,64 778,752 8 998,912
2,0 21 ,2 42,40 449,44 898,880 9528,128
2,1 21,7 45,57 470,89 988,869 10218,313
1,9 22,1 41,99 488,41 927,979 10 793,861
2,0 22,3 44,60 497,29 994,580 11089,567
2,2 22,2 48,84 492,84 1 084,248 10941,048
2,3 22,6 51,98 510,76 1 174 ,748 11543,176
2,7 23,1 62.~7 533,61 1 440,747 12 326,391
3,0 23,5 70,50 552,25 1 656,750 12 977,875
S, . = bo + blyt + b2yr2
¿s, = Tbo + bl L Y, + bz L Y;
1 1 1
I s,y, = .bo I Y, + bl I y; + b2 I 3
Y,
1 1 1 1
es decir
E = L dS = Lb.
sfy S dy S
s; 6
= -5,27 + 0,34 · 23,5 = 2,72
23 5
E*
Sfy
= • · 0,34 = 2 94 .
2, 72 '
ES/y = sy dS y
dy :::: -s<bl + 2b2y) •
304 • SECCIÓN 4. ANÁLISIS ESTADfSTICO DE DOS O MÁS VARIABLES
* 23,5
+ 2. 0, 189. 23,5) = 7,26.
ES/y = 2 98 (-7,962
'
(d) La propensión media al ahorro en 1986 será
s* 2,12
PMS = - = - - = O 116"" 11 6%
y 23' 5 ' '
Ejercicio 4.4
El gasto familiar y el nivel de ingresos (en el mes de marzo) de las
domésticas en los últimos años fueron (en €)
610 1 120
720 1200
800 1310
840 1470
950 1500
1000 1750
G, = a+ bx1
G, x;
610 1120 0,00089 0,5429 0,7921 . 10-{í
4 920 = 6a + 0,0044b }
6
3,5262 = 0,0044a + 3,2948 · 10- b
a = 820,0
b = - 1.1753. w- 6
El modelo hiperbólico ajustado es
- = 4 -6
G 920 = 820,
1 dG
EG/I = G di = G
1 [-
P
b] - b
= G/ .
1
G*
1
= 820 -1,1753 · 10-ó == 820
1 600
entonces
E
* = -(-1,1753. 10-ó) =0
Gf / 820 · 1 6()()
Ejercicio 4. 5
Los impuestos corrientes sobre la renta y el patrimonio y la renta bruta
de las familias, en billones de pesetas, en el período 1971-1980, fueron:
T1 =a· yb1
Llamando
Z1 = log T,
= log a
A
xz = log yl
Z1 =A+ bx1
Y,
0,10 2,59 -1,00000 0,41330 -0,41330 0,1708:
0,12 3,02 -0,92082 0,48001 -0,44200 0,23~:
0,15 3,63 -0,82391 0,55991 -0,46132 0,3135(
0,18 4,50 -0,74473 0,65321 ' -0,48646 0,4266S
0,24 5,24 -0,61979 0,71933 -0,44583 0,51744
0,30 6,29 -0,52288 0,79865 -0,41760 0,63784
0,40 7,90 -0,39794 0,89763 -0,35720 0,805~4
0,58 9,81 -0,23657 0,99167 -0,23460 0,9834.
0,75 11,44 -0,12494 1,05843 -0,13224 1,12or
1,01 13,11 - 0,00432 1,11760 -0,00483 1,24903
el sistema queda
cuya solución es
A = -1,609378
b = 1,391189:::: 1,39
T1 = O, 0246 y11'39 •
(b) La elasticidad impuestos-renta de este modelo es
E = }_ dT = Labyb-1 = abl =b
T/y T dy T T
ya que T =a/.
Comprobamos que, en este tipo de modelos potenciales, la elasticidad
constantemente igual aben todos sus puntos y, por tanto, para 1980
¿e,
e = - '- =O
N
EJERCICIOS DE LA SECCIÓN 4 • 309
4.6
a precios de mercado y la formación bruta de capital fijo {FaCF), en
de pesetas, en el período 1970-1982, fueron:
SOLUCIÓN
(a) La función de producción de Cobb-Douglas es
zl = log y/
A= log a
x 1 = log K 1
A = 0,6471
e = 1,1026 =1,1
a = antilog A = 4,4374 =4,4
~BlCICtn reducida de Cobb-Douglas es
Y1 = 44
'
· K11' 1 •
Ejercicio 4. 7
Dada la distribución
1 3
6 7
11 13
24 16
36 21
SOLUCIÓN
(a) Para poder determinar los parámetros del modelo exponencial a y b,
linealizar previamente dicho modelo tomando logaritmos
log y = log a + x log b .
Llamando
Z¡ = log Y;
A = log a
B = log b
L Z; = NA + B LX;
1 1
}
¿z;x; =A ¿x; + B¿x¡
i i i
1 3 0,0000 0,0000 9
6 7 0,7782 5,4474 49
11 13 1,0414 13 ,5382 169
24 16 1,3802 22,0832 256
36 21 1,5563 32,6823 441
4, 7561 = 5 A + 60 B }
73,7511 = 60A + 924B
B = 0,081754
A = -0,029828
b = antilog B = 1, 21
a = antilog A = 0,93.
El modelo exponencial ajustado es
y = 0,93 · 1,21x.
E = ~ . dy = ~ abx In b = X In b . abx = X In b
yfx Y dx Y abx
o 4.8
comunidad, la renta semanal de sus integrantes se distribuyó de la forma
314 • SECCIÓN 4 . ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
0,7 10
1,2 22
1,5 34
1,8 46
2,2 53
2,7 61
3,2 38
3,5 24
4,0 12
N= 300
SOLUCIÓN
(a) La ley de Pareto viene definida a través de la expresión
donde:
y representa el porcentaje de personas con una renta igual o inferior a x .
x0 es la renta mínima del colectivo.
b es un parámetro estructural.
Para poder proceder al ajuste, en primer lugar, hemos de lograr la
ción de este modelo
y=l-(~J
1 - y=(~J
ln(l- y) = blnx0 - blnx.
Llamando
Z ln(l- y)
=
A= blnx0
B = -b
u= lnx
EJERCICIOS DE LA SECCIÓN 4 • 315
.as queda
Z = A+ Bu
lo cual el problema se reduce a un ajuste mínimo-cuadrático a la distribución
. Z¡) , en donde se obtienen los valores de A y B a través de las ecuaciones
L Z; = NA + B L u; }
i i
L Z;u¡ = A L u; + B L u;
1 1 1
Z1111 Jl1
l
x1n1
- 8, 3980=8A+5 B}
-8,9914 = 5A + 5,18B
que L u; para los ocho primeros niveles de renta será 6,39 - 1,39 = 5,00 .
tanto,
b = -B = 1,7677
316 • SECCIÓN 4. ANÁLISIS EST AD{STICO DE DOS O MÁS VARIABLES
(b) La renta mínima teórica del colectivo x0 , según esta relación, será
A = blnx0
x0 = antiln A
b
= antiln °· 0551
1,7677
= antiln 0,0312 "' 1,032
E
y fx
dy
= _L =~
dx . y
o dy
dx
= ~ [ -b ( Xo ) b-1 ( - xo2 ) =
y X x
l
X
_ bx
- y · xgx b+ l
_ b( x
- y ---;0)b
Consideremos ahora los dos casos que nos proponen:
Caso l. Para x0 = 1, 032
E* _ .!!_[Xo)b b
Y/Xo - y* XO y*
donde
1 032 )107677
y* = 1 - ( -'- = o.
1,032
Por tanto,
EJ ERCICIOS DE LA SECCIÓN 4 • 317
n
¿:x.n
x = ~ = 702,1 = 2 34
N 300 '
1.7677
1 032
y
* = 1- (
•
2,34 )
= o' 7647
1.7677
E* _ = 1,7677 1,032 =O 5438 _
yjx O, 7647 ( 2,34 ) '
y; = 0,7647
decir, que según éste, a una renta de hasta 2,34 le correspondería un porcentaje
perceptores del 76,47%, pero, si nos fijamos en nuestras observaciones, a este
de renta le debería corresponder un porcentaje acumulado entre el 55% y el
%. Esta cierta coherencia de resultados nos revela el hecho de que este ajuste
es del todo malo.
4.9
Sx = 3 , y = 2 y que la recta de regresión de X sobre Y
0.1 5y , determínese la recta de regresión de Y sobre X y los valores de Sxy,
x* = a'+ b'y
a'= x- b'y
318 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
pero como Sx =3
Entonces
1,8Sy = 0,15Sy2
S = ~ = 12
y 0,15
Sxy = 1, 8Sy = 1,8 · 12 = 21,6.
La recta de regresión de Y sobre X será
y* =a+ bx
b = Sxy = 21,6 = 2 4
s2 32 ,
X
a =y- bx =2 - 2, 4 · o, 3 = 1, 28
es decir,
y* = 1,28 + 2,4x.
EJERCICIOS DE LA SECCIÓN 4 • 319
4.10
una distribución bidimensional en donde syx = 4,1' s: = 9 y el coeficiente de
de la recta de Y/X es b = -1,1 . Determínense:
Las dos rectas de regresión de Y/X y X/Y , sabiendo que x = 2 , y = 5.
El coeficiente de correlación lineal.
N
Los coeficientes de regresión de las rectas serían
Y/ X b = - 1,1
lo cual es imposible, ya que los dos coeficientes de regresión deben ser del mismo
signo, puesto que, como
y las varianzas son no negativas, entonces el signo de b y b' debe ser el mismo
cpe el de la covarianza sxy.
Como, en este caso, Sxy = 4,1 > O, no puede ser b = - 1,1, resultado que
8eeesariamente debe estar equivocado. Aceptando como verdadero valor
S., = 4,1, lo único que podemos determin.lf es la recta de regresión de X sobre Y
X * -2= -4,1 (y - 5)
9
x* = - 0,3 + 0,46y.
320 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
(b) Por los mismos motivos que antes no se puede determinar r, ya que, como
r = s¡;y
sxsy
b . =~
= -11 s2 X
s2 =~<o
X -1,1
Ejercicio 4 . 11
Justifíquense las razones por las cuales debe aceptarse o rechazarse que las
rectas y = 2x + 1, x = 5y + 10, son, respectivamente, las líneas de rP(Jrr*""~
mínimo-cuadráticas de Y sobre X y de X sobre Y de una misma serie de nh<>P.........
ciones.
r = ..¡¡;-:-¡;
siendo 1r 1 ~ 1 , en este caso, tendríamos que
r = ~ = ,JlO = 3,16
4.12
la distribución bidimensional (x;; y ), cuyas rectas de regresión son
1
X+ 4y = 1
X+ 5y = 2
jllléng.ase el coeficiente de correlación lineal y explíquese su significado.
1r 1 = ~ = ~( -~) (-4) = O, 89 •
esta es la solución correcta y, por tanto, el coeficiente de correlación lineal que
será r = -0,89.
4.13
en cuáles de los casos que a continuación se relacionan los resultados que
son compatibles entre sí:
322 • SECCIÓN 4. ANÁLISIS ESTADISTICO DE DOS O MÁS VARIABLES
SOLUCIÓN
(a) Como el coeficiente de regresión de la recta b =4
coeficiente de correlación lineal negativo.
(b) El coeficiente de correlación lineal es
S 100
r=___!L_=--=1
SS
X y
5 ·20
r = JI - :~ = Jt - 4~ = 1
en donde s; es la varianza de los residuos o de los errores.
Por tanto, estos resultados muestran coherencia entre sí.
(e) En este caso existen dos posibilidades:
Caso l . Que las rectas sean
Y/X y* = 5x + 8
X/Y x* = 5y - 45
X/Y X *= -1 y - -
8
5 5
EJERCICIOS DE LA SECCIÓN 4 • 323
y, por tanto,
y = ±x+4}
x=y+4
2y- 8}X =
-y+x=4
de donde
y= 12
X = 4 + y = 4 + 12 = 16
que son, precisamente, los dos valores medios que nos ofrecen.
4.14
•u~;tnese que, siendo y* el valor teórico obtenido a través de la recta de
de Y sobre X, se verifica que
y* - Y = b(x - X),
b es el correspondiente coeficiente de regresión.
324 • SECCIÓN 4. ANÁLISIS ESTADISTICO DE DOS O MÁS VARIABLES
Y>2
s;. = ¿<y*-
'¡y
ya que, como sabemos, la media de la variable
y; por tanto
=b L L (yj- Y) (X¡ - X) = bS
N xy
Ejercicio 4.15
De la distribución bidimensional (x,1 y.;
J
n1).. ) se sabe que, para 100 observaciones..
LYjn·j = 1 000
j
Í:L:X;Yjn!i = 6 000
i j
EJERCICIOS DE LA SECCIÓN 4 • 325
cov(x, y) = 60 - 5 · 10 = 10.
2X=3U+4}
f=2Z +3
2
tenemos que
U= 3 ~X-~}
3
3
Z=f - -
2
y, por tanto,
2 2 20
= - · 1 cov (X · Y) = - · 10 = -
3 3 3
3 26 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Ejercicio 4.16
Dada la distribución bidimensional
10 200
20 180
30 150
40 120
50 100
SOLUCIÓN
(a) Formemos la siguiente tabla:
y* =a+ bx
siendo
a=y-bx
EJERCICIOS DE LA SECCIÓN 4 • 327
. ¿:xi
x = _;_ = 150 = 30
N 5
~>j
- j 750 150
Y = ---¡:¡-=-5-=
a 10 = x = 30
a
¿:x:
= _;_ = 5 500 = 1100
20
N 5
s2
X
= noo - 2
30 = 200
a01 = Y= 150
Í:Y~
= _ j _ = 119 300 = 23 860
ao2 N 5
2,2,xiyj
i j = 19 900 = 3 980
N 5
Sxy = 3 980 - 30 · 150 = -520.
Por tanto,
b = sxy = - 520 = _ 2 6
SX2 200 •
a = y - bx = 150 - ( -2, 6) · 30 = 228,
de donde la recta ajustada es
y = 228 - 2,6x.
El coeficiente de correlación lineal es
r =~ = - 520 = -0,99.
sx sy JiOO ..}1 360
328 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Ejercicio 4.17
Dada la distribución
-----
.. •
· .. Yj ·
: El
'.- • • ~ •
.
r
.:""'1; ••
~j .. _·
- • 'i=
:~ :
•1 · -·
14
12
6 18
4 5 25
20 49 56 131 200
sy = 1,4697 = 1,47
r =~ =
0 24
• = 0,2206.
sx sy o. 74 . 1,47
También podríamos haber formado una tabla de correlación, de doble entrada, co-
la siguiente:
5 ,.
1(: x.n.
l ,.
2
X¡n1•
2 13 26 52
(12) (56)
4 2
3 6 18 54
(24) (30)
5 5 25
(20)
n.
•J 6 4 8 2 N= 20 49 131
yjn·j 6 8 32 10 56
2
yj n·j 6 16 128 50 200
330 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
.l:Xln.
1 1•
a2o
1
= ~ = 6 55
N 20 '
.l)jn·j
j
ao1 = 56
20 = 2 80
,
N
12 + 56 + 24 + 30 + 20 = 142 = 7 10
20 20 ,
y luego seguiríamos los mismos cálculos que hemos tenido que efectuar antes.
Ejercicio 4.18
Dada la distribución:
C;
. '
Y¡ x,
4 2
7 5
12 8
21 11
25 14
SOLUCIÓN
(a) Para detenninar los parámetros a, b y e de este modelo parabólico hacemos uso
las ecuaciones normales mínimo-cuadráticas:
EJERCICIOS DE LA SECCIÓN 4 • 331
LY; = Na + b L x; + e L x;
i i i
L Y;X; = a L x; + b L x; + e ¿
i i ; i
x;
L Y;x;
i
= a L x; + b L x¡ + e L x:
i i i
Yr ·"~l . x:·
i X: x41 Y¡X¡ '
2
Y¡X¡
4 2 4 8 16 8 16
7 5 25 125 625 35 175
12 8 64 512 4096 96 768
21 11 121 1 331 14 641 231 2 541
25 14 196 2 744 38 416 350 4 900
y el sistema será
69 = 5a + 40 b + 41 Oe }
720 = 40a + 410b + 4 720e
8 400 = 410a + 4 720b + 57 794e
cuya solución es
= 1, 057
'a = 1, 057138
b = 1,104763 =1,105
e = 0,047619 = 0,048
y el modelo ajustado es
en donde s:
R=
y, y S~ es la varianza de los
residuos o errores que se obtienen con este ajuste. Para calcularlas formamos la
tabla:
332 • SECCIÓN 4. ANÁLISIS ESTADISTICO DE DOS O MÁS VARIABLES
69 - 0,165 6,637791
y, por tanto,
~Y; 69
y=~= 5 = 13,8
s2
LY?
= _;_ - Y
- 2 = 1 275 - 13 82 = 64 56
Y N 5 ' '
¿e;
e=_;_= -0,165 =-o 033
N 5 '
¿e¡
s 2
= _; _ _ e2 = 6 •637791 -(-o 033) 2 = 1 326469
ry N 5 ' '
1 326469
R = 1_ •
64,56
= Jo' 979454 = o' 9897
que, como está próximo a la unidad, nos indica un alto grado de correlación
bólica entre las variables.
Ejercicio 4.19
En el Servicio Central de Turismo de un país se ha observado que el núm~
plazas hoteleras ocupadas es diferente según sea el precio de la habitación.
el total de plazas ocupadas en un año, se tiene la siguiente distribución
precio de las habitaciones:
EJ ERCICIOS DE LA SECCIÓN 4 • 333
,- ' --
- :>,_ ' • ~ '" : ·' ' • • • ' -.1 ' ' '1 • ):
.. . . ~ .. - --- - . . . '
Hasta 50 4 725
50 - 80 2 610
80- 120 1 872
120- 160 943
160-300 450
10 600
¿Cuál será el precio tope al que se podrían ofrecer plazas hoteleras en ese
país, si el comportamiento de los turistas no variase?
¿Cuántas habitaciones se llenarían a 130 € por día?
¿En qué medida podemos considerar que el nivel de ocupación depende de la
estructura de precios?
- i
LP;
560 112
P = -¡:¡-=-5- =
LYj
10 600
y = _j_ = = 2120
N 5
SP2 = aw -ato
2
334 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
a 10 = p = 112
a = _í_
LP: = 87 350 = 17 470
20
N 5
S~ = 17 470 - 1122 = 4 926
a 01 =Y= 2120
LY~
- 33 733 858 ::::: 6 746 771 6
ao2 -
j
----¡;¡- 5 ,
¿¿)jpí
í j = 710 495 = 142 099
N 5
syp = 142 099 - 112 . 2 120 = -95 341
de donde
4.20
han observado, durante un mes determinado, el gasto de electricidad y el
total en seis familias. Los resultados obtenidos han sido:
1a familia 0,2 4
23 familia 0,3 6
33 familia 0,5 8
43 familia 0,9 10
5" familia 1,0 12
63 familia 1,9 20
donde
S
b -- _!]_
2
sx
a= y- bx
como
.L>i = 60 = 10
x = _;_
N 6
-
.L>j
j 4,8 o8
Y = -¡¡-=-¡;=,
S2 = a20 - 10
X
a
2
'I.x:
a2o
= _;_N = 760
6 = 126, 66
LY:
am = _ j _N = 56•8 = o, 9666
s: = 0,9666- 0,82 = 0,3266
b = sxy = 2,93 = o 11
SX2 26,66 '
a= y- bx = 0,8-0,11 ·10 = -0,3
luego la regresión lineal simple de Y sobre X es
y = -0,3 + O,llx
EJERCICIOS DE LA SECCIÓN 4 • 337
2,932 = o 986.
26,66 · O, 3266 '
del litro de leche en los cinco últimos años, así como el consumo de
alimenticios, han sido:
r .. - ~ _,~ ~ . - ~~- -:
t ' ~: ;~ ~< .,_-: : ' ~~ • ' ; • '
0,50 42
0,52 48
0,55 50
0,60 55
0,64 62
es el precio y e el consumo.
338 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Formemos la tabla:
Tenemos que
LPj
-
P = _ j _ = 2•81 = o 562
N 5 '
¿e¡
e = _ i _ = 257 = 51 4
N 5 '
2 2
SP = aoz - ao¡
a01 = p = 0,562
a =
LPJ
_j_ = 1,5925 = O 3185
02
N 5 '
s: = 0,3185- 0,562 = 2,656. 10-3
2
Se2 =a20-a!O
2
cuál será, según esta relación, el precio del litro de leche en el próximo
-:=ID{Js
consumo es de 70 millones de €, según nos dicen:
l.clltaiJil11dad del sector lechero vendrá medida por la diferencia entre sus ingre-
costes. Los ingresos totales para este año se obtendrán de la venta de los
litros de leche a 0,701 €; sabemos que los costes son de 70 000 €. Por tanto,
B = 200 000 · O, 701- 70 000 = 70 200 €,
este precio de venta del litro de leche se pueden financiar los costes de su
r =~ = 0,3412 = 0,98.
se sp .J45,44 .J2,656. 10-3
1500 3
1 750 4
3 250 4
4 000 6
5 000 8
340 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
SOLUCIÓN
(a) Supongamos que el número de diputados elegidos depende de los gastos
cidad linealmente, es decir,
y= a+ bg
Como
- 25
y=--=-=5
~>j
N 5
¿gi
g= _i_ = 15 500 = 3 100
N 5
s: = a02 - a;1
ao¡ =Y = 5
LY~
= _ j _ = 141 = 28 2
a02 N 5 '
EJERCICIOS DE LA SECCIÓN 4 • 341
2
Sy = 28' 2 - 52 = 3' 2
s2 2
e = a20 - a¡o
a10 = g = 3100
¿g¡
= _i_ = 56 875 000 = 11375 000
a2o N 5
2
Sg = 11 375 ooo - 3 1002 = 1 765 ooo
Syg2 = all - awaol
¿¿yjgi
a
11
= ¡ j = 88 500 = 17 700
N 5
syg = 11 100 - 3 100 5
o = 2 200
Por tanto,
confianza con que se puede esperar este resultado dependerá de que la propa-
sea realmente efectiva y sea factor explicativo del número de diputados
IIIIK'l!óJ.U'J~ Para dar una medida de la confianza utilizaremos el coeficiente de corre-
o
lineal, que nos dirá en qué grado están relacionadas linealmente estas
syg 2 200
r = sy sg = .J3,2 ~1 765 000 =
0 92
' o
Ejercicio 4. 23
Los turistas llegados a un país caribeño procedentes de cinco países,
2000, fueron:
A 5 1,4
B 4 1,3
e 3 1,3
D 2 1,2
E 1,1
Turistas Relación 2
;yi x2 X;Yj .
yi X¡ l
r=~
SX Sy
)i=-1-=-=3
2>j 15
N 5
-
2>¡
i 6,3 1 26
x=N=-s= •
aOI =y= 3
552>:
a02 = -1- = - = 1 1
N 5
2
Sy = 11- 32 = 2
Sx2 = a2o - a1o
2
a10 =x = 1,26
.L:Xi2 7 99
a = _;_ = • = 1 598
2o N 5 ,
,·
2
SX = 1,598- 1,262 = o,0104
0 14
r = • =O 97
.Jo,OI04 J2 '
laego existe una fuerte correlación lineal entre ambas variables.
344 • SECCIÓN 4 . ANÁLISIS EST ADISTICO DE DOS O MÁS VARIABLES
0,869-1,4 = 1.ZI66
0,869 . 1,3 = 1,1297
0,869. 1, 3 = 1,1297
0,869. 1,2 = 1,0428
0,869. 1,1 = 0,9559
b = sxy2 = ~= 13 46
s X
o,0104 '
a = y- bx = 3 - 13,46 · 1,2(¡ = -13,96
luego
y = -13,96 + 13,46x.
Así, el número de turistas esperados después de esta variación de los
será:
EJERCICIOS DE LA SECCIÓN 4 • 345
4.24
un determinado sector, la producción y las exportaciones durante los 6ltimos
han sido (en miles de euros):
1998 400 80
1999 420 80
2000 440 90
2001 480 92
2002 500 98
Como
2:::Xj 440
x= _j_ = = 88
N 5
- - i
LY;
2 240 - 448 .
Y -- - -- - --
N 5
2 2
SX = 0 02 - 0 01
a01 = x = 88
l:x}
= _j_ = 38 968 = 7 793,6
ao2 N 5
a 10 =y = 448
¿y¡
a = _;_ = 1010 400 = 202 080
2o N 5
sy = 202 080 -
2
4482 = 1 376
Sxy =al! - aiOaOI
Tendremos que
b = sxy = 248 = o 18
Sy2 1376 •
a = x-bY = 88- 0,18 · 448 = 7, 36
El modelo ajustado es
X = 7,36 + 0,18y.
Se estima que la producción en 2004 va a ser de 640 000 € y que las condicio-
nes del mercado internacional no cambian. Esta última hipótesis nos faculta para
poder seguir utilizando el modelo lineal ajustado; por tanto,
x = 7,36 + 0,18 · 640 = 122,56 miles de € .
r = ~= 248
= O, 95.
sx sy .)49,6 ~1376
4.25
_ ..,.._LUu privado interior y la renta nacional disponible a precios de mercado en
de pesetas fueron, en el período 1971-1980:
.. _. :
!1'5~'. ,--,-<:-~-/- ' . .' . .. ... ., . . ..
SOLUCIÓN
(a) Sabemos que las estimaciones mínimo-cuadráticas de los parámetros a y b de
modelo de regresión son:
S
b = --f; a = e- by.
sy
Para determinar, pues, a y b formamos la tabla:
¿e,
e= _ l_ = 55,90 = 5 59
-T 10 '
Se2 = a02 - ao1
2
= ao2
-2
- e
¿e;
a = _,_ = 398,2970 = 39 8297
02
T 10 '
2 2
Se = 39,8297- 5,59 = 8,5816
S, = 2,929
EJERCICIOS DE LA SECCIÓN 4 • 349
-=
Y
~Yr = 71,08 = 7 108
T 10 '
Sy2 = a2o - aJo
2
= a2o -
-2
Y
:~:>:
a = -~--= 638,5210 = 63 8521
20 T 10 '
s: = 63,8521 - 7' 108
2
= 13, 3284
Sy = 3,651
e¡ = 0,111 + 0,802y, .
10 69332
• = o 9999 = 99 99%
8,5816 . 13,3264 ' ' '
lo que nos muestra que el 99,99% de la variabilidad del conswno queda explicado
por el nivel de renta disponible a través de esta estructura de relación lineal.
Nótese que hemos utilizado unas series de consumo y renta a precios corrien-
tes y que, por el efecto de la elevación general de precios, va sistemáticamente
awnentando tanto el nivel de conswno como el de renta. Este análisis hubiese sido
más correcto efectuarlo con las series de conswno y renta a precios constantes de
algún año que se tomara como referencia. Esta problemática cae de lleno en el
tema de la deflactación, que será tratado más adelante en el capítulo relativo a los
números índices.
350 • SECCIÓN 4. ANÁLISIS ESTA DÍSTICO DE DOS O MÁS VARIABLES
Ecfy = l. de = l. b
e dy e
Como
P.MC = !:._
y
*
C80 = 0,111 + o,802. 13,77 = 11,15
PMC~ =
11 15
' = 0,809 = 80,9%.
13,77
Como para 1980 tenemos observaciones de ambas variables, podíamos
hecho
PMC
80
= ~ = ll,02 = 0,800 = 80,0%
Yso 13,77
Ajústese el modelo C
1
= by1 por el método de mínimos cuadrados.
Compruébese que, en este caso, la media de los errores o residuos no es nula.
Estúdiese si se cumple la descomposición de la varianza total s; s; + s;c.
=
CIÓN
Dado que el modelo de regresión lineal general es de la forma
c*=a+b·
r yr
J.
'!' L....' (er -
= " e*?
r
352 • SECCIÓN 4. ANÁLISIS ESTADISTICO DE DOS O MÁS VARIABLES
tendremos que
Q4¡ =
ob
L' 2(e, - by)(-y)
, '
=O
de donde
¿e,y,
b=-'--·
¿y;
1
504 2705
b ::; • ::; o 78975 = o 79
638,5210 ' '
e; = 0,79y,.
(b) Los errores o residuos son
e, =e,- e;
y, por tanto,
¿e,y, ¿ e,
1 1
b =~"#~,
L.Y1 L.Y,
entonces L e, -:~: O .
e* o; e* e*.
En nuestro ejemplo
y formando la tabla
, e';
2,12 2,70 O, 79 · 2, 70 = 2,1330 -0,0130 4,5497 0,000169
2,47 3,18 O, 79 · 3,18 = 2,5122 -0,0422 6,3111 0,001781
2,97 3,87 O, 79 · 3,87 = 3,0573 - 0,0873 9,3471 0,007621
3,64 4,74 O, 79 · 4, 74 = 3, 7446 -0,1046 14,0220 0,010941
4,29 5,54 0,79. 5,54 = 4,3766 -0,0866 19,1546 0,007500
5,23 6,64 O, 79 · 6,64 = 5,2456 -0,0156 27,5163 0,000243
6,65 8,40 O, 79 · 8,40 = 6,6360 0,0140 44,0365 0,000196
8,08 10,28 O, 79 · 10,28 = 8,1212 -0,0412 65,9539 0,001697
9,43 11,96 O, 79 · 11,96 = 9,4484 -0,0184 89,2723 0,000339
11,02 13,77 O, 79 · 13,77 = 10,8783 0,1417 118,3374 0,020079
¿e¡ 56 1532
e* = -'-T = •
10
= 5' 61532
Let 55 9
e =-'-
T
= 10
• = 5' 59
e* e*.
354 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
2 2
¿ e1
= "" + ""
¿ e*
1 - ¿ e11
2 "" e*
1
pero, como
entonces
=¿ e; + b ¿ 2
y; - 2b . b ¿ y; =
1 1
es decir, que
'* '*
pero, como e O y e e*, de la condición (1) no se deduce la (2), luego
este modelo con restricción
l
Numéricamente:
s: = 8,.5816
¿c;2
s2 = _,__ _ c-*2
R T
398 5009
•
10 - 5, 615322 = 8, 3183
L:e,2
s2 = _,_- e2
re T
[S!:
R=f-s:=
0 0044
= 1- •
8,5816
= o, 9997
y el de determinación
R2 = 0,9995 = 99,95%.
Obsérvese que, en este modelo particular,
R = ~~ - S!
2
S
* !e,_
S S
= r.
e e y
cio 4.27
tres variables Y, X 1 , X2 , de las que se dispone de la siguiente información:
356 • SECCIÓN 4. ANÁLISIS ESTADISTICO DE DOS O MÁS VA RI ABLES
Ejercicio 4.28
Sean las siguientes variables Y, XI y x2 ' de las que disponemos de la
siguiente:
Y¡ ;¡¡} ~
•
1 3 3
4 5 7
6 8 13
7 10 17
10 12 21
3 3
[X'~~ [: 5
7
1
8
13
10
17
1
~~1
21
5
8
10
12
7
13
17
21
+:
61
38
342
570
611
570
957
&to ocurre porque existe multicolinealidad entre X1 y X2 , es decir, que existe una
lineal entre estas variables. Vamos a comprobarlo; para ello calcularemos la
de X1 sobre X2 y su correspondiente coeficiente de correlación lineal .
, entonces, la tabla:
3 3 9 9 9
5 7 25 49 35
8 13 64 169 104
10 17 100 289 170
12 21 144 441 252
38 61 342 957 570
358 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
luego también ~2 = 1 , es decir, existe una relación lineal perfecta entre estas
riables.
Si determinarnos la recta de x 1 sobre x2 tenemos
x1 =a+ bx2
b = sl2 = 21,28 = o5
S~ 42,56 '
a = .x; - bx2 = 7,6- 0,5 · 12,2 = 1, 5
es decir,
x1 = 1,5 + 0,5x2 ,
y comprobamos que
..
,;
>?_¡
. . . xjj ~ 1;5 + 0.5-'2 ~
. J"
3 1,5 + 0,5 . 3 = 3 3
7 1,5 + 0,5 . 7 = 5 5
13 1,5 + 0,5 . 13 = 8 8
17 1,5 + 0,5 . 17 = 10 10
21 1,5 + 0,5 . 21 = 12 12
Ejercicio 4. 29
A partir de la siguiente información:
EJERCICIOS DE LA SECCIÓN 4 • 359
1 2 17
3 1 15
4 3 13
6 4 10
7 5 9
10 8 8
15 7 6
16 9 5
18 11 3
20 12 4
b = [X'xr1 xy.
Para obtenerlos empezaremos calculando la matriz
2 17
1 15
1 3 13
1 4 lO
1~]
1
5 9
3 4 5 8 7 9 11
8 8
15 13 10 9 8 6 5 3
7 6
1 9 5
1 11 3
12 4
62
= ['o
62 514
90]
405
90 405 1014
360 • SECCIÓN 4. ANÁLISIS ESTADISTICO DE DOS O MÁS VARIABLES
cuyo determinante es
1 X' X 1 = 5 211 960 + 2 259 900 + 2 259 900- 4163 400-
- 1 640 250 - 3 897 816 =
= 30 294 "#o
que, como es no nulo, nos señala que podemos calcular la inversa.
Para ello, en primer lugar, obtenemos la matriz de los adjuntos
357 171 ·-26 418
-21150]
adj[X' X] = -26 418 2 040 1 530 = [adj[X' X]]'
[
-21150 1 530 1296
luego
3
4
6
~ ~~]
1 1
7
xy = [ 1 3 4 5 8 7 9 11
10
17 15 13 10 9 8 6 5 3
15
16
18
20
= ¡::]
621
EJERCICIOS DE LA SECCIÓN 4 • 361
Por tanto,
b = [X'Xr1 Xy =
-26 418
30 294
2 040
30 294
1530
30 294
[100]
843 ==
621
-21150 1530
- 1 296
-
==
[10,0,9332][ b,
- 0,67
= bl
b2
l 30 294 230 294 30 294
b0 = 10,32
bl = 0,93
b2 == -0,67
2
R ==-
S~ b'X'y- Ny2
s2 y
y'y- Ny2
1 2
= -(100) = 1 000
10
R 2 = 1399,92 - 1 000 == 399,92 == O 96
1416 -1 000 416 ,
como está próximo a la unidad podemos aceptar que la utilización del modelo es
~~Etantefiable.
362 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
Ejercicio 4.30
Siendo Y el nivel de renta de unas familias y C su consumo
~~- ' -
Consumo ~enta
¡;
eí Y;
0,3 1, 1
0,8 2,0
2,2 3,1
2,8 3,9
3,2 4,7
4,1 5,3
e = b0 + b1x1 + b2x2
b = [X'Xf 1 X 'e .
La matriz [X' X] es
1,1 1,21
2,0 4, 00
1 1
l
5, 3 28,09
= 20,1
6
80, 21
20,1
80,21
351,14
80,21
351,14
1618,1765
l
EJERCICIOS DE LA SECCIÓN 4 • 363
0,3
0,8
x·c~r~.1 13,~]
1 1 1
2,0 3,1 3,9 4,7 5,3 j 2,2
2,8
[
= 56,44
1,21 4,00 9,61 15,21 22,09 28,09 253,15
3,2
4,1
[bo 1
4,651 - 3,123
0,447] [ 13,40]
b :.: -3,123 2,346 -0,354 56,44 = r-0, 78]
O, 94 = b1
[
0,447 -0,354 O, 055 253,15 -0,07 b2
4.31
XI ' x2 y x3 ' de las que se dispone de la siguiente infor-
yJ ..l)j -·
2 4 2 3
3 5 4 6
6 10 6 7
8 11 7 8
10 15 10 9
4 3
[Z' Z] = [ :
6
5 10
7
11
8
ji l +:
1
1
1
10
11
15
5 6
7
8
9
33
45
487
335
33
335
239
IZ'ZI = 1472 *o
1 1
[Z' Zf = - -
[4168 3oo
300
106
-~6]
- 190
1472
- 996 -1 90 410
2
5
6
10
7
11
8
1~] ~ [3~:]
9 8
=
220
10
y entonces
y = - 1,3234 + 0,6291x1 + 0,2215x3 .
La segunda regresión es
~~~ ~: =::~1
4
1 1
[Z'zr =_ _ [
1472
-996 -190 410
2
Z'X, = l: 1
5
6
1
10
7
11
8
10
luego
x2 = -1,1929 + 0,4552x1 + 0,4389x3 .
La tercera regresión es
1 4 2
v·v = l~ 1
5
4
10
6
1
11
7
1~1
10
1
1
5
10
11
15
4
6
7
10
+~ 29
45
487
315
291
315
205
j V'V 1 = 508 *O
-90
[Y' vrl
[ 610
= - 1- -9o 184 -270 521
508
52 -270 410
366 • SECCIÓN 4. ANÁLISIS ESTADÍSTICO DE DOS O MÁS VARIABLES
V'Y = r: 5
4
10
6
11
7
1~1 ~ r3~:1
10 8
=
208
10
d = [V'Vr 1 V' Y =
-0,7559]
0,5787 =
rd 0
d1
]
r 0,2323 d3
por tanto
1 610
[V'Vr = - - -9o
1 r -90
184 -270
52]
508
52 -270 410
3
r~ ~~]
1 6
v· x, =
5 10 11 7 = r 33
335
4 6 7 10 8
9
218 1
h = [V'vr 1 v' X3 =
r 2.5005 = r~
-0,3740 ~~¡
1,2716 1 1 ~
luego
-0,1066 0,011364
=o 0,721462
~
xj1 = -1,1929 + 0,4552x1 + 0,4389x3 e21 = x21 - x;i ez.J
=o 0,547556
2
Yfc7-> 7 --ü,75.59 + 0,5787x1 + 0,2323x2 eyo (2)
1
= Yj - Yj(2)
..
eY¡ (2)
=o 0,830709 .
368 • SECCIÓN 4 . ANÁLISIS ESTAD[STICO DE DOS O MÁS VARIABLES
=0
e,.<I> = e,.<2> =
J J
e2j = ~j = o,
las varianzas y covarianzas de los residuos serán
~e~, <I>
s2 = 1
= o,I44292
e, (1) N
L;eiJ
sez2 = -1-· N- = 0,109511
L;e,.<I> e2J
--'1'-
. _ ' _ _ = -0,012228
N
"e2
LJ Y¡ (2)
1
_..:;- - = 0,166142
N
L;eY, <2>elJ
S•,. <2) e, = _..:1;- N
- - = 0,085827.
s., ( lj e, -0,012228
r = -0,10 .
Y.lz .Jü,l44292. 0,109511
EJERCICIOS DE LA SECCIÓN 4 • 369
2. De Y con X3
b = [X' xr xy . 1
20 10 30 40
10 160 80 100
[X' X] :=
30 80 90 110
40 100 110 140
Por tanto,
20 10 30 40 30 10 30 40
10 160 80 100 170 160 80 100
1 X' X 1 := 30 80 90 110
=
80 90 110 110
40 100 110 140 140 100 110 140
-10 10 30 40
70 160 80 lOO
=
o 80 90 110
O lOO 110 140
160 80 100 10 30 40
= -10 80 90 110 - 70 80 90 110
100 110 140 100 110 140
= -10 · 44 000- 70 (-9 000) = 190 000 * O.
Como esta matriz es no singular, tiene inversa. Calculemos ahora, en
lugar, la matriz de los adjuntos de [X' X]
LYJ
j
15
'LxlJYJ
j 100
Xy =
'LxzJYJ 180
1
120
¿xlJYJ
j
luego
44 9 14 -30 480
- - -
190 190 190 190 190
9 4 2 -7 15 55
- -
190 190 190 190 100 190
b =
14 2 58 -51 180 4 730
- - - -
190 190 190 190 120 190
-30 -7 -51 55 -3 730
- ---
190 190 190 190 190
de donde
480
bo = 190 = 2, 53
b1 = 22..
190
=o ,29
4 730
b2 = 190 = 24, 89
b3 = - 3190
730
= -19 ,63
El hiperplano de regresión ajustado es
y = 2,53 + 0,29x1 + 24,89x2 - 19,63x3
Para determinar la parte de la variabilidad de Y que queda explicada por esta re-
gresión múltiple, calcularemos el coeficiente de determinación lineal R2
R2 = s; = b'Xy - NY
2
S2 = - í'[ yy-
, N y- 2] = - - y
-2= rr
Y N N
LY~ 2
= _j_ - y2 = 2 600 - (~J = ·129 44
N 20 20 '
y como
S 2 -- -1 [b'X'y- N y- 2] - 1 b'X'y-y
- - -2
R N N
15
b'X'y = [ 480
55 4 730 -3 730] 100 = 416 500 = 2 192.~
190 190 190 190 180 190
120
obtenemos que
úmeros índices
375
376 • SECCIÓN 5. NÚMEROS ÍNDICES
al espacio.
período inicial se le denomina período base o de referencia, por con-
-ión, la situación que queremos comparar es denominada período actual
l. = ¡t (i) = 3!._
t O X
JO
I- P,t
Po -
P;o
378 • SECCIÓN 5. NÚMEROS ÍNDICES
a. magnitud compleja X formada por las simples X1, X2 , ... , X;, ... , XN que
N N
~ ~xit
L.,¿ Ji L.,¿ -
- JI + /2 + ... + Ji + ... + JN i = 1 i = l XiO
1 = -'-'-=--=--·
N N N
¡*
NÚMEROS ÍNDICES • 381
=
"w
¿
i=l
i IJ!w.
N
.
1
1
i =1
w1 + · ·· + w; + · · · + w N
¿w;
; = 1
¡* ----~------~------~--- = ~---
H
1 1 1 ~ w;
-w + ·· · + - w. + ·· · + -w L...,
/1 1 /¡ ' fN N ¡ = 1 /¡
0 Circular. Si consideramos los períodos O, t, t', tn, se debe '"' .... .L......... ~
to · ¡I' =1 1
· / ¡'0
1
l oe . ¡e'c=o=> ¡t ¡e' ¡t'
o ·t = o
11.
Supongamos que los precios de un determinado bien son 12, 14, 24 y 30 unidades mo-
aetarias, para el período 1996-1999 respectivamente. En este caso los enlaces relativos
p25 = ~3~4p45.
Aplicando este supuesto a los datos del ejemplo tendríamos
96 = 100%
P96
91
P96 = 116,6%
99
p96
97 98
= p96 . p91 . p98
99 = .!i . 24
12 14
. 30 = 250%
24
que
lndices de precios
Vamos a detenernos en el estudio de las magnitudes económicas a tra,·es
llamados índices de precios, que miden la evolución de la magnitud
un conjunto de bienes y servicios. Los números índices de precios más
dos son los siguientes.
1, = P¡¡
P;o
• Índice de Bradstreet-DUtot
Es la media agregativa sin ponderar de los precios
N
LP;,
i = 1
B-Dp = N
LP;o
i = 1
Estos dos índices que acabamos de ver tienen la ventaja de ser fác·
aplicar, pero presentan el siguiente inconveniente: No tienen en cuenta
NÚM EROS ÍNDICES • 385
Supongamos una <<Cesta de la compra» compuesta por los siguientes artículos: pan,
Ia!che, huevos y carne, de los que la información disponible aparece en la tabla siguien-
ae:
Precws
Bienes
2002 2003 2004
llatloni.en<io que el año base es 2002, ¿cuáles serían los índices de Sauerbeck y de
para cada uno de los otros dos períodos?
2003 "'
Bienes Pi'2002 \lO)
s 2oo3 i :
± P; (2003)
1P; (2002) = 443,8 = 110 97
4 4 '
±
P2002
P; (2004)
s2004 i = 1 P; (2002) = 484,3 =
121 07
P~, 4 4 '
386 • SECCIÓN 5. NÚMEROS ÍNDICES
4
¿p. c2oo3)
B-D9a
p91
i=l
±
i = 1
1
P; (2002)
= 14,36 = 118 68
12,1 O ,
4
L P; (2004)
B-D99
p91
i
±
=1
i = 1
P; (2002)
= 16,09 = 132 98
12,10 ,
• Índice de Laspeyres
Es la media aritmética ponderada de los índices simples de precios. El
de ponderación seguido es w; = Pw · qw ; por tanto
~
N N
P;r
LI;w; ~ ~ P;o . q;o LP;c · qiO
Lp
i = 1 P;o
i = 1
= --:-N:-'-'~--- i = 1
N N
LW;
i = 1
L P;o . qiO
i = 1
L P;o
i = 1
· q;o
u:ambién una media aritmética ponderada de los índices simples, pero aquí el
· de ponderación es w; = P;o · qil ; por tanto,
N N
~ P¡¡
Ll;w; L..., - piO . qit
i; 1 ; ; 1 P;o i; 1
N
= --:-N: - ' - " - - - = - N
:-:-----
¿w;
i ; 1
¿ P;o . qit L P¡o . qit
i; 1 i ; 1
de Edgeworth
media agregativa ponderada de precios cuyo coeficiente·de ponderación,
do en los grupos anteriores, es w; = q;o + q;1 ; portanto,
N N
L P¡¡W¡ L P¡¡ (q;o + qit)
Ep = -i N,;_,--1 -
i ; 1
= .;_N
: -:-"--- ---
¿
i ; 1
P;ow; L P;o (q;o + qit )
i; 1
L PiO LPiO
i = 1 i = 1
• Índice de Laspeyres
N
LPit' qiO
L~ = _
iN
~
= _1 - - = _i _- _1"""N, - - - - - = (1 + k)Lp .
i
I= 1 P¡o qiO I= 1 P¡o qiO
i
• Índice de Paasche
N N
Índice de Edgeworth
N N
j
L P¡¡• (q¡o + qi1)
= 1 . j
L (1 + k)p¡¡ (q¡o + q¡¡)
= 1
E'p = N
= -'--'---:-:-
N -- - - - - = (1 + k)EP.
-.am<)S que para el conjunto de bienes del ejercicio anterior disponemos de infor-
adicional sobre la cantida vendida en cada uno de los períodos considerados y
reflejada en la tabla que presentamos a continuación. Determínense los índi-
precios de Laspeyres, Paasche, Edgeworth y Fisher para 2004 con respecto al
de 2002.
390 • SECCIÓN 5. NÚMEROS ÍNDICES
Cantidad vendida
Bienes
2002 2004
SOLUCIÓN
i ~ 1
4
L P;04qi04
p04 = i ~1 = 7 429,20 = 129 62
piYl. 4 5 731,50 '
i
L P;w.qi04
~ 1
NÚMEROS ÍNDICES • 391
N
"f.J¡ ·W¡ ¿ -q;oP;o
N
qit
N
"f.qítpiO
i = 1 i = 1 qiO i = 1
Lq N = N N
¿w; L q;o P;o L q;o P;o
i= 1 i=1 i= 1
N
L(W;
¿ -q;oP;r
N
qít
N
"f.qít pít
i = 1 i = 1 qiO i = 1
pq N N N
¿w; Lq;oP;r "f.q;oPu
i = 1 i = 1 i= 1
2 v2 = LP;2q;z
ik
que lo normal es expresarnos en términos de valores de mercado y éstos están referidos a los precios
IDCillento de la valoración.
394 • SECCIÓN 5. NÚMEROS ÍNDICES
~ LPitqit'
i = l
N LP;rqir
~ ~ = Vo . pq VR
LJ = 1
P;o q;o · -i N ::----
:¡:.
r .
Lp
i =
1
L
P;r qiO
i =1
N
L P;o · q;o
i =1
N
~
LJ P;o qir = VR
e •
i = 1
LP;oqic
i = 1
cambio de base
Periodo lndice
o ¡O
o
l ¡1
o
i ¡i
o
: :
h ¡h
o
t ¡1
o
Periódo indice,
o ¡O
h
1 ¡1
h
i lh
: :
h ¡h
h
: :
t / /¡
¡i = /~ . ¡h - !~
h ¡h h ¡h
o o
en donde !~ es el índice que hace de enlace técnico entre las dos series
EJEMPLO
Supongamos que poseemos para un conjunto de bienes los siguientes datos:
1990 LP;oq;o =5
1991 LP;,q;o = 5,5
1992 'f.pi2qi0 = 6
1993 LP;3qt0 = 6,5 LP;oq;o = 8
1994 'f.p;,q;o = 9
1995 LP;2q;o = 10
donde los períodos base de ponderación son 1990 y 1993, respectivamente. Con
datos se han elaborado los correspondientes índices de precios de Laspeyres
NÚMEROS ÍNDICES • 397
5
Lw'XJ = - = 100% L93 =
93
~8 = 100%
5
L9I =
90
~ = 110% J!493 = -
9
= 112 5%
5 8 '
6 L95 =10
L: = - = 120% 93
- = 125%
5 8
L93 =
90
~= 130% J!6
93
=
10 5
• = 131 25%
5 8 '
j ¡~
I h =¡h
--
o
~= L:
L: = 100%
130%
= 76 9%
'
1!931 = 1!901 • L 90
93
= 110%. 76,9% = 84, 6%
!1pit qiO
R.
1
= N
L piO qiO
i = 1
L !1pit qiO
i = 1
N N
:L P10 qiO
i = 1
NÚMEROS ÍNDICES 111 399
L P;o q¡o
_R., 1- - -
_,._; ,-- ·100 = flpil qiO . 100
N N
L P,., qiO
i; 1
LPit qiO
i; 1
N
L P¡o qiO
i; 1
. también se cumplirá que su suma para todas las componentes será igual a la
ariación porcentual del índice generaL
Entenderemos por participación en porcentaje de la componente i en la va-
riación del índice general a la relación por cociente entre la repercusión en
rcentaje y la suma de las repercusiones en porcentaje de todas las compo-
nentes, expresada en tanto por ciento. Su expresión será
flpil qiO
N
. 100
LPit qiO
i ~ l flpit q,.o
P.1 N
· 100 = N
. 100
L flpil qiO L flpit q,.o
i ~ 1 i ~ 1
N
· 100
LP¡,q¡Ó
i ~ 1
este apartado se intenta dar una visión general del conjunto de índices que
calculan en España por los organismos estadísticos oficiales, destacando la
~todología de aquéllos de uso más frecuente.
/
/ :>ECCIÓN 5. NÚMEROS ÍNDICES
Así pues, el índice de precios de consumo tiene por objeto medir la evolu-
en el tiempo de los precios de un conjunto determinado de bienes y serví-
que componen la llamada cesta de la compra.
Para calcular este índice será necesario tener en cuenta las siguientes etapas:
1 . Realización de una Encuesta Permanente de Consumo a través de una
que comprenda a un número significativo de familias del país.
2. Estimación, para el período base, de los bienes y servicios consumidos a
de la información muestral.
3. Selección, de entre todos los bienes y servicios, de aquéllos que por su
en el gasto toal deban incluirse en la cesta de la compra.
4. Especificación de cada uno de los artículos de la cesta, es decir, deter-
de las características de todos los artículos (calidades, variedades,
de medida, etc.).
5. Selección de municipios y, dentro de éstos, de los establecimientos en
se va a efectuar la recogida de datos .
- Transportes.
-Comunicaciones.
- Ocio y cultura.
- Enseñanza.
- Hoteles, cafés y restaurantes.
-Otros bienes y servicios.
Aparte de ellos, se calculan índices más detallados para estudios
al igual que índices mensuales y medios anuales.
P (X)
R = ~P __
PP(M)
Valor nouúna/
Periodos
(en ptas corrientes)
o PIBo = L P;oq;o
i
2 PIB2 = L Pi1.qi2
ik
---'~-- = yR
1
Deflactor
por lo que si obtenemos:
PIB1
--R- = Deflactor
PIB,
El IPCA de ~ada país cubre aquellos bienes y servicios que superan el uno
mil del total de gasto de la cesta de la compra nacional. En cada Estado
-...nhr·n ha sido necesario realizar particulares ajustes para conseguir la coro-
a seis meses para un primer Avance, más de un año para las cifras provisionales, y aún más para las
.-~ru¡e las repercusiones y participaciones de cada uno de los grupos del «índice
precios de consumo» en la variación sufrida en el índice global a 31-Xll-77.
es el grupo más afectado por la subida de precios?
· Los grupos referidos son los correspondientes al antiguo IPC.
L.... 1 = ~Lp .
"R.
i
entonces
p
3
=~ = 4,4816 = 14 83%
M.,p 30, 22 ,
p
4
= ~ = 1,6275 = 5 39%
M.,p 30 , 22 ,
p = !!J._ = O, 7425 =2 45 %
5 M., 30, 22 ,
p
p =~ = 2,43625 = 8 06%
6 M.,p 30 , 22 ,
p
7
=!!:J._= 1,9446 = 6 43%
M.,p 30 , 22 ,
p =~ = 2,2788 = 7 54%
8 M., p 30, 22 ,
:¿ P; = wo% .
i
B grupo que más ha afectado a la subida del índice es el primer grupo (alimentos,
bebidas y tabaco), el cual, en la subida del índice en un 30,22, ha repercutido con
un 14,182, que supone un 46,92% de la variación del total.
2003 2004
Númert¡de Precio Número de
unidades Venta uniiládes
428 27 614 30 805
530 24 722 25 910
102 37 224 39 235
410 • SECCIÓN 5. NÚMEROS ÍNDICES
Debe tenerse en cuenta que las ponderaciones que se realizan en los índices
cos deben ser la base a valores añadidos, es decir, se debe ponderar con el valor
haya incorporado en ese proceso de producción.
Así, en 2002, el envase tipo «A» se ha realizado con materias primas cuyo
sido 10 euros. El precio de venta es 25 euros, luego la diferencia es de 15 €.
el valor añadido por unidad.
Razonando análogamente para los otros tipos:
Valor añadido envase tipo «B>> ~ 5 €/unidad = (20 - 15)
Valor añadido envase tipo <<C>> ~ 10 €/unidad = (30- 20)
Por lo tanto
EJERCICIO 3
Las relaciones comerciales entre dos países vienen reflejadas en la
información:
País A exporta a país B
1998
Productos
Precio Cantidad
X 10 1 200
y 12 1 500
NÚMEROS [NDICES • 411
z 5 600 8 710
u 7 420 12 560
V 10 530 15 940
Por tanto
EJERCICIO 4
Las cantidades pagadas por una empresa de seguros en concepto
nizaciones por incendios en el período 89-93, así como los correspondientes
de precios al consumo para dicho período vienen dadas en el siguiente cuadril:
89 204,3 5 430
90 275,7 9 680
91 384,3 13 940
92 424,5 15 100
93 479,8 17 590
¡ 91 = ~:~ = 384,3 = 80 1
93 ¡93 479 8 •
86 •
¡ 90 = /: = 275,7 =57 46
93 ¡93 479 8 •
86 •
¡ 89
93
= 1:: = 204,3
¡93 479 8
= 42 58
• .
86 ,
Con lo que el valor de las indemnizaciones del período a u.m. de 1993 será:
A fíO
l IPC (1993 = 100) 3
lndem¡¡izaciones en 10 u. m. de 1993 1
89 42,58 5 430/0,4258 = 12 752,47
90 57,46 9 680/0,5746 = 16 846,50
91 80,10 13 940/0,801 = 17 403,25
92 88,50 15 100/0,885 = 17 062,15
93 100,00 17 590/1 = 17 590,00
81 654,37
Ejercicios
DE LA SECCIÓN 5
EJERCICIOS DE LA SECCIÓN 5 • 415
5.1
EP el índice de precios de Edgeworth, demuéstrese que, si LP < PP,
LP<E<P
p p
L P;oq;o = B
1
LP¡,q;, =e
i
D
E =A+C.
P B+D
416 • SECCIÓN 5. NÚM EROS ÍNDICES
de donde
A A+ e
- < --
B B +D
y, análogamente, sumando ahora eD,
AD + eD < Be + eD
e (B + D)
D (A + e) <
A+ e e
-- < -
B+D D
y, por tanto,
A A+
- <- - <-
e e
B B+D D
es decir,
LP < EP < PP.
PP < EP < LP
por lo que podemos afirmar que el índice de precios de Edgeworth siempre toma
res comprendidos entre los de los índices de Laspeyres y Paasche.
Ejercicio 5. 2
El índice de precios de Bowley es
SOLUCIÓN.
El índice de precios de Bowley cuando ll = O se transforma en
1 + ll
, ~pit(~qiO +~qit)
= J~ ~>.. e:~ q, + 1 ~ ~ q, J
L,pitqit
i = p
LP;oq;t P
Ejercicio 5. 3
Una magnitud económica aumenta, entre el año Oy ell, en un 30%.
2 un 20%, y ha disminuido entre el 2 y el 3 en un 40% .
Obténgase la serie de números índices para esta magnitud con base O=
o 100,0
1 130,0
2 156,0
3 93,6
( Ejercicio 5.4
Conocidos los precios y cantidades de tres artículos de consumo corres~o.•
los años 2000 a 2004:
2
3 5
4 7 6 12
4 8 5 13
EJERCICIOS DE LA SECCIÓN 5 • 419
LPitqiO
L ===;_ _
P L P;oq;o
Por tanto,
LOI = 2 . 10 + 6. 12 + 11. 3 = 125 = 113,6%
p 2·10+5·12+10·3 110
L02 = 3 · 10 + 6 · 12 + 12 · 3 = 138 = 125 4 %
p 110 110 ,
L03 = 4 · 10 + 7 · 12 + 12 · 3 = 160 = 145 4 %
p 110 110 ,
L04 = 4 · 10 + 8 · 12 + 13 · 3 = 175 = 159 1%.
p 110 110 ,
Paasche. Este índice es de la forma
LP;¡qit
p - ==
; _ _
P - L P;oqit
pOI = 2 · 12 + 6 · 10 + 11 · 2 = 10q = , %
112 8
p 2 . 12 + 5 . 10 + 10 . 2 94
p02 = 3 . 15 + 6 . 5 + 12 . 3 = .!...!._! = 130,6%
p 2 . 15 + 5 . 5 + 10 . 3 85
p03 = 4 . 20 + 7 . 6 + 12 . 1 = 134 = 167,5 %
p 2 . 20 + 5 . 6 + 10 . 1 80
p04 = 4. 18 + 8. 5 + 13. 2 = 138 = 170,4% .
p 2 . 18 + 5 . 5 + 10 . 2 81
Edgeworth. Este índice agregativo adopta la expresión
E =±;_ _ __ _
L Pu (q;o + q¡¡)
P L P;o (q;o + qit)
i
420 • SECCIÓN 5. NÚMEROS fNDIC ES
con lo que
Ejercicio 5. 5
Una fábrica de automóviles produce cuatro modelos, cuyos precios de
de materiales empleados y números de unidades producidas en los
años fueron los siguientes
2001 2002
Modelos
Precio ,\ '" de Precio N ° de
Coste Coste
vema unidades ¡·en/a 1 unidades
El índice de producción de Laspeyres para 2002 y 2003, con base 2001 = 100.
l.A:Is índices cuánticos de Paasche, con la misma base.
Los índices de precios de Laspeyres, con la misma base.
En los mdices de producción, cuánticos o de cantidades los valores que actúan como
..,.ooerac1ones deben ser valores añadidos, con objeto de evitar las dobles contabili-
IICIOnc~s y/o sobreestimaciones de las distintas fases del proceso productivo.
ejemplo, en 2001, si el precio de venta del modelo 206 era de 9 000 euros y
coste de los materiales empleados en producirlo era de 4 000, entonces el valor
en la fabricación de este modelo es tan sólo de 9 000 - 4 000 = 5 000
, ya que los 4 000 euros del coste de los materiales utilizados será valor in-
en procesos productivos anteriores, el imputable a los suministradores
los materiales.
• TDlJLDalldo los valores añadidos de cada modelo en cada uno de estos tres años
_ ......u"v" la tabla siguiente:
0 ,7 4 300
0,9 2000
1,6 1 200
Lq;rPiO
L = -;!::
; --
q L q;oP10
i
y entonces
p qOI = 100,0%
pW. = 4100. 0,6 + 3 000. 0,6 + 2 400. 0,9 + 1500. 1,6 = 8 820 = 95.
q 3 200 · O, 6 + 4 200 · O, 6 + 2 300 · O, 9 + 1 700 · 1, 6 9 230
p03 = 5 600. 0,6 + 4 300 . 0,8 + 2 000. 0,8 + 1200. 1,5 = 10 200 =
q 3 200 · O, 6 + 4 200 · O, 8 + 2 300 · O,8 + 1 700 · 1, 5 9 670
(e) Los índices de precios de Laspeyres son
LP;rqiO
L = -;::'=· ,.- -
P L P;oq;o
Si queremos estudiar la evolución de los precios de venta de estos aut()IIJIÍÍIIIII
volviendo a la primera tabla tendremos
L01
p
= 100 0%
'
Lw. = 1,1 · 3 200 + 1,3 · 4 200 + 2,0 · 2 300 + 4,1 · 1700 = 20 550 = ..,.
10
p 0,9. 3 200 + 1,3. 4 200 + 1,9. 2 300 + 3,8. 1700 19170
L03 = 1,2 · 3 200 + 1,5 · 4 200 + 2,1 · 2 300 + 4,3 · 1700 = 22 280 =
1
p 19170 19170
.....lJEjercicio 5. 6
El valor de un bien en 1998 es un 20% superior al de 1994 y un 7% superior
valor en 1996. ¿Cuál era el valor relativo de este bien en 1996 respecto a 1994!
V. V.96 . 1 07
/
98
96
= __.2ª-.
V.
= V.
' = 1' 07 = 107' O%
96 96
¡96 =
94
I:!
¡98
= 120 = 112 15%
107 '
96
5.7
almacenes, las cifras de ventas anuales para el período 1999-2003,
_...,.,.,¡.,.., en tanto por ciento, en relación a las del año anterior, fueron:
. .
.. . . :. . .:;::· ·?f -~-~- -'_"
·- . -
SOLUCIÓN
(a) En este ejemplo nos proporcionan una serie de índices en los cuales, en cada
cicio anual, el período de referencia es el año inmediatamente anterior. Esu:s
ces nos indican que en el año 1999 las ventas crecieron un 18% respectO
conseguidas en 1998, en el año 2000 las ventas volvieron a crecer respecto
en un 4%, en el año 2001, por el contrario, se produjo una disminución del
men de ventas respecto a 2000, ya que su índice está por debajo de 100, ~
cesivamente.
Por tanto, como las ventas en 1998 fueron de 1 000 millones de pesetas,
V99 = V98 (1 + t98 ) = V98 (1 + 0,18) = V98 . 1,18 =
1
= v98 . ....2ª- = 1180,00 millones de u.m.
100
V00 = V99 (1 + t 99 ) = V99 (1 + 0,04) = V99 . 1, 04 =
1
= v99 . ~ = 1227,20 millones de u.m.
100
Análogamente
1 98
V01 = V00 · ~ = 1227,20 · - = 1202,66 millones de u.m.
100 100
1 96
V
02
= V01 · _Q!_
100
= 1 202 66 ·-
100
= 1154,55 millones de u.m.
1 106
V03 = V02 · ~ = 1154, 55 · - = 1223,82 millones de u.m.
100 100
(b) Tomando como referencia la cifra de ventas de 1998, los índices serían
l oo = 1227,20::::1 23 = 123%
98 1 000 ,
= 1 202,66::::
IOI
1 20 = 120 %
98 1 000 ,
1998 100
1999 118 118
2000 104 123
2_001 98 120
2002 96 115
2003 106 122
v = s 1223•
1000
82
- 1 = 1 04- 1 = o 04
' '
= 4%
_..lb1~:n podría determinarse teniendo en cuenta los índices que recogen la evolu-
respecto a 1999
V. = 1122
5
- 1 = 1,04 - 1 = 0,04 = 4%.
100
5.8
medicamentos, en euros corrientes desde 1995 a 2004, ha sido
Gastos
Años
(en 106 €)
1995 10
1996 12
1997 15
1998 16
1999 18
2000 21
2001 20
2002 25
2003 27
2004 30
426 • SECCIÓN 5. NÚMEROS fNDICES
1995 100
1996 110
1997 112
1998 120
1999 125
2000 130 100
2001 105
2002 120
2003 124
2004 128
/~ = 105 .
1995 100
1996 110
1997 112
1998 120
1999 125
2000 130
2001 136,5
2002 156
2003 161,2
2004 166,4
G = _E_ = E_ = 10 91 .
110% 1,10 ,
Para el año 1997 es
G = _____!2_ = ~ = 13,39 .
112% 1,12
Procediendo análogamente tendremos
.
Gastos
Años
.' ~.
(en 106 euros constantes de 1995)
1995 10,00
1996 10,91
1997 13,39
1998 13,33
1999 14,40
2000 16,15
2001 14,65
2002 16,02
2003 16,75
2004 18,03
(; = 30 - 1o = 2 o = 200% .
M 10 '
428 • SECCIÓN 5. NÚMEROS ÍNDICES
Ejercicio 5.9
En cierto país el salario medio por hora, en unidades monetarias
trabajadores de un determinado sector productivo y los índices
consumo a lo largo de los seis últimos años fueron:
Años
1989 52 140
1990 58 162
1991 60 175
1992 63 190
1993 64 200
1994 84 205
SOLUCIÓN
(a) Suponemos que la serie de índices de precios que nos proporcionan es
para deflactar los salarios, pero observamos que dicha serie tiene corno
base uno no especificado, por lo que considerarnos conveniente realiza:
mente, un cambio de base para situar este período de referencia en alguno
años que estamos estudiando. Podemos tomar como período base, por
primero, 1989.
Los nuevos índices de precios con base 1989 = 100
minar la influencia de los precios y hacer más comparables los salarios de cada
año utilizamos, pues, como deflactores estos índices de precios de la siguiente
forma:
Salarios reales en pesetas de 1989:
52 63
1989 =52 o 1992 = 46 4
100,0 % ' 135,7% '
58 64 = 44 8
1990 =50 1 1993
115,7 % ' 142,9% '
60 84
1991 =480 1994 =57 4
125,0% ' 146,4% '
Todos estos resultados los resumimos en la siguiente tabla:
~-
Salario/hora Tasa de variación
Salario/hora Índices de
Índices de en u.m. del salario/hora
Años en u.m. precios base
precios constantes real respecto al
corrientes 1989 = 100
de 19S9 año anterior
1989 52 140 100,0 52,0 -
1990 58 162 115,7 50,1 -3,6%
1991 60 175 125 ,0 48,0 -4,2%
1992 63 190 135 ,7 46,4 -3,3%
1993 64 200 142,9 44,8 -3 ,4%
1994 84 205 146,4 57,4 +28,1 %
sM
=
84
-
52
52
=
84
52
- 1 = o 615 = 61 5 %
' '
Ejercicio 5. 1O
El propietario de un apartamento tiene pactado en 2001 un alquiler ~
inquilino de 200 000 ptas. mensuales. Si en 2004 quiere revisarle el alquiler ea
a los incrementos del grupo vivienda del índice de precios de consumo ea
años, cuyos índices han sido
- = 130, 5 - 118,3 = 10 3%
01
118, 3 '
a = 147,3- 130,5 = 12 8 %
2 130,5 ,
a = 167,8 -147,3 = 13 9 %_
3 147,3 ,
5.11
medio de los automóviles de menos de 1 200 centímetros cúbicos, así
los índices de precios, fueron, para los últimos años, los siguientes:
00 155
/ = · 100 = 140 91
97 110 '
4 32 • SECCIÓN 5. NÚM ERO S ÍNDIC ES
PR == 6
8 73
• -1 == ~1,1487 -1 == 1,0234-1 == 0,0234 == 2,34%.
7,60
(e) Como el precio en 2004 crece un 6% en términos reales, entonces el
u.m. constantes de 1997 será
p04/ 91 = 8,73 + 0,06. 8,73 == 8,73(1,06) == 9,25.
Ejercicio 5. 1 2
Los IPC en España y en el conjunto de la Unión Europea (UE)
período 1980-1985:
Años
' .- ·•.
IPC ~-1980 ..2 100)
¡' .·' - ..
r··
'Es¡laiia UE.
.·· "
4,6% = 8,3%(1 + d) 4
d =
o 4*6
4 -'-
8,3
-1 = 0,8628-1 = -0,1372:::: -13,7% o
434 • SECCIÓN 5. NÚMEROS ÍNDICES
España
Años
IPC IPC
Tasa anual Tása anual
(base 1980 = 100) (base 1980 =
Ejercicio 5. 1 3
Del índice de precios de consumo (IPC) con base 1983 = 100
Índice mensual
Grupos medio de 1985
:LI,w 1
L = --;';·::::---
P ¿w,
en donde w1 son las ponderaciones de cada bien o servicio e 11 los índices de
cada grupo.
La repercusión de cada grupo i-ésimo en la variación global del IPC desde 1983 a
1986 viene dada por
R = M 1w1
, ¿~
Por tanto,
La suma de las repercusiones será igual a la variación del índice general; e11
to,
LR; = 4,08885%
i
0 53314
R2 (%) = R2 · 100 = • · 100 = O 42175%
LP(1985) 126,41115 '
0 3714
JS (%) = R3 . 100 = • · 100 = 0,29380%
LP {1985) 126,41 115
0 05018
R (%) = Rs . 100 = • · 100 = O 03970%
S Lp (1985) 126,41115 ,
0 2876
R6 (%) = R6 · 100 = • · 100 = O 22751%
LP(1985) 126,41115 '
0 29232
R7 (%) = R, · 100 = • · 100 = O 23124%
LP (1985) 126,41115 '
0 23004
R8 (%) = R8 · 100 = • · 100 = O 18198%
LP (1985) 126,41115 '
Por tanto,
p1 = _!i_ = 2 21301
• = 54 12304% ~ = !!L = 0,05019 = 1 22748%
!:JL 4 08885 ' !:JLP 4,08885 '
p '
p
2
= !!L = 0,53314 = 13 03887% p6 = !!.L = 0,28760 = 7 03376%
!:JLp 4 ' 08885 ' !:JLp 4, 08885 '
0 3714
p3 = !!:L
!:JL
= •
4 08885
= 9 08324%
'
0,29232 = 7 14920%
4,08885 '
p '
donde
¿~ = 1oo,o%.
i
El grupo que más ha afectado a la subida del IPC es el primero (alimentos, bebi-
dll;s y tabaco), el cual en la subida índice de un 3, 23%, ha repercutido con un
1,75%, lo que supone un 54,12% de la variación total.
El que menos fue el quinto (servicios médicos y sanitarios) que repercutió tan sólo
con un 0,04%, que equivalía al1,23% del incremento global del período.
' Sabemos que el l. P.C. es un índice de Laspeyres del tipo
representando esta última igualdad el hecho de que el valor global de los bienes y
servicios incluidos en el IPC en el -.período base,
Vo = L P;oq;o '
j
438 • SECCIÓN 5. NÚMEROS ÍNDICES
VD(Gk) = ¿ P;oq;o ,
ieG,
entonces
_
L pilqiO + L pilqiO + ... + L pilqiO
ieG1 ieG2 ieG8
Lp
donde cada
= 130.~
23 9 143 8 69 6 85 2
+ • 123 8 + • 121 3 + • 129 6 + • 137 9
1000 , 1000, 1000, 1000,
EJERCICIOS DE LA SECCIÓN 5 • 439
Ejercicio 5. 14
En una región existen cuatro industrias lácteas, cuyos niveles de ocupación y
salarios en el período 2002-2004 fueron los siguientes:
Ocupación Salarios
(núm. personas empleadas) ( 103 € por empleado al a!lo)
2002 2003 2004 2002 2003 2004
820 810 920 97 107 112
1 480 1 510 1 560 95 98 106
920 910 940 109 126 132
314 370 450 110 118 125
Como los índices de Laspeyres son medias ponderadas de los, índices simples, en
donde el sistema de ponderaciones utilizado corresponde al período base, un índi-
ce de salarios de Laspeyres podría definirse como
en donde
Su = Salarios en el período ten cada industria i.
Sm = Salarios del año base O.
ei0 = Nivel de empleo u ocupación en cada industria en el año base.
L Ss.
i
_jf_ •
iO
e.
11
2005
Industrias
Salarios Empleados
Lagasa 122 966
Ladegasa 116 1 591
Galecsa 142 940
Ingalesa 135 450
y, por tanto,
Ejercicio 5. 1 5
Las relaciones comerciales entre dos países, Northernland y Farland,
reflejadas en la siguiente información:
EJERCICIOS DE LA SECCIÓN 5 • 441
el 20 800 32 1 400
e2 7 1 500 11 600
e3 12 200 14 500
2003
El índice de precios de Laspeyres para la exportación (X), con base 1997 = 100
será
y el de Paasche
¿pitqil
p (X) = ='=-·- -
P LP;oq;,
i
En 1997 será
que, como es mayor que la unidad, nos revela una mayor actividad exportadora
que importadora en Northerland, mostrando también el superávit comercial en
2003 que antes habíamos señalado.
1990 1996
Acciones
Volumen negociado
Cotización Cotización
(en 109 u.m.)
Según esto, el valor de esta cartera aumentó desde 1990 a 1996 en un 238,16""
Ejercicio 5. 1 7
Un ahorrador invierte 100 euros en la Bolsa en el año 1999.
cotizaciones y general de precios al fmal de los años siguientes son:
EJERCICIOS DE LA SECCIÓN 5 • 445
lo que la bajada persistente de la Bolsa en estos años le ba hecho perder más del
% del valor de su inversión, considerada a precios constantes.
5.18
JllllernllÍn.enlse los deflactores implícitos para el Producto Interior Bruto a precios
mercado sabiendo que
446 • SECCIÓN 5. NÚMEROS ÍNDICES
Fuente: INE.
que reflejan la evolución general de los precios de todos los items incluidos en el
APÍTULO 12
eries temporales
tn·troducción
449
• SECCIÓN 6 . SERIES TEMPORALES
Ventas mensuales
Meses (en miles de euros)
teoría clásica de las series de tiempo se basa en que toda serie empírica está
por cuatro componentes teóricas: tendencia, variaciones estacionales,
.-.:aciiOD«~ cíclicas y variaciones residuales.
452 • SECCIÓN 6. SERIES TEMPORALES
Y¡
220
60
FIGURA 12.1
La tendencia, que toma el valor 100 para enero de 1998 y que va aumen-
rando cada vez una unidad hasta 171 en diciembre de 2003.
Un ciclo de período 24 meses, que tomando el valor O en enero de 1998,
toma sucesivamente los valores 5, 15, 30, 40, 45, 50, 45, 40, 30, 15, 5,
O, -5 , - 15, - 30, -40, -45 , -50, -45 , -40, - 30, - 15, - 5 y otra vez cero
en enero de 2000, volviendo a repetirse el ciclo.
Una variación estacional dada por
Variaciones residuales
Meses
1998 1999 2000 2001 2002
Enero -1 -2 -2 -2
Febrero 3 4 -2 o 2
Marzo -2 2 o 2 -1 --
Abril 4 -1 2 3 o _:;
..,
Mayo 4 3 1 4 3 -
Junio -5 2 -1 -1 2 -3
Julio 5 -5 3 o 5 .!
Agosto -2 2 o -1 2 -3
Septiembre 1 -1 o o -1 o
Octubre -5 3 3 2 4 1
Noviembre -2 -4 -3 -3 -3 o
Diciembre -3 5 -4 5 -1
Componentes
teóricas
171
50
cik
lOO
- 50
eik
10
-lO
5
rik
-5
FIGURA 12.2
SERIES TEMPORALES • 455
Esquema multiplicativo 1:
desviación
desviación
típica típica
•
• • •
• • • •
• •
• • • • •
• •
media
Y,
YYYYY~
1 11 111 IV 1 11 111 IV 1 11 111 IV 1 11 IIIIV 1 IIIIIIV 1 11 111
"--y--1 "--y--1 "--y--1 "--y--1 '--y-J "--y--1
al\o 1 al\o 2 al\o 3 3110 4 al\o 5 al\o 6 31101 311o2 allo3 311o4 311o5 al\o6
1
Para aislar la componente cfclica, véanse los procedimientos que se exponen en: MARTÍN-GUZMÁI'.
MARTÍN PLIEGO, F.J.: op. cit., págs. 256-260.
SERIES TEMPORALES • 459
idea principal de este método consiste en ajustar una función que relacione
variable en función del tiempo, que sea sencilla y que recoja de manera satis-
toda la marcha general del fenómeno. De acuerdo con esto, hemos de tomar
doble decisión: en primer lugar, determinar la forma de la función y, en
_ _,,~..,~v, los valores concretos de los parámetros.
yp+l = Y1 + Y2 + ··· + Yp
~----------~
Yp+3
2
p 2
p
- =
y+y+···+y
3 4 p+2 ...
Yp+5
2 p
~
pues ahora -p+2
2- , 2 , .•. ,
'
SI son enteros.
, ~ j 1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1 1 1 1 1 1 1 1
2 3 4 5 6 7 8 9 eje de tiempos
p =4
r
~
1
X1
1
! 1 '\l!
.
1
•
'i1
1
1
1 •• •• ••
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1 1 1
1
1 1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
eje de tiempos
l 2 3 4 5 6 7 8
Una vez obtenidas las medias móviles defmitivas, la tendencia será la línea
brada que las una. Esto es fácil de ver si recordamos la descomposición de
serie en sus componentes: tomando el esquema aditivo para simplificar el
cíclicas es cero (véase en el epígrafe 12.1 los valores que toma esa com-
en la serie artificial que allí propusimos); por un razonamiento similar,
462 • SECCIÓN 6. SERIES TEMPORALES
lo mismo sucede con la componente estacional, con tal que tomemos años
ros en el cálculo de los promedios. Como a su vez el promedio de las
nes erráticas es de esperar que sea cero (ya que si siempre fuese
ejemplo, habría algo no errático en esas presuntas variaciones erráticas .
nos queda es el promedio de las tendencias o valor estimado de la
para el punto medio del intervalo temporal considerado. Si la serie
esquema multiplicativo como el (e) el detalle del razonamiento se
aunque la esencia del mismo permanece.
Como es natural cobra especial interés la determinación del valor de
que, de su correcta elección depende que realmente el promedio de v
se reduzca al promedio de las T;k correspondientes. De ahí que lo "u"'"....,._
escoger como valor de p el período de las oscilaciones más importanres
presenta la serie.
Esto ya constituye una primera crítica al método, pues supone conocer
de las componentes cíclica y/o estacional; además, en el supuesto de
superpongan varias oscilaciones (por ejemplo, una oscilación estacional
con una componente cíclica), aunque escojamos el valor de p adecuado
eliminar una de ellas, la otra permanecerá en la serie de medias móviles
obtengamos, lo que nos impide aislar la componente tendencial. En este
do, la elección no es tan trivial como parece, sino que requiere un
miento previo del fenómeno a estudiar.
En resumen, este procedimiento es operativamente más sencillo que el
ajuste, pero presenta como inconvenientes, además del señalado en el
anterior, que no va acompañado de una medida de fiabilidad análoga al
ciente de correlación y que supone una pérdida de observaciones , en el
de que si pes impar no podemos determinar la tendencia de las P; 1- 1
ras observaciones y de las IT- - 1 últimas, mientras que si p es par n P •., , . . _
-.~-----
Y-1•. =a+ bi
/k Y.k
e=-=-
ik 100 y
En el caso de que la serie no presente tendencia, es decir, b = O, entonces
cálculos se simplifican mucho, dando lugar a lo que se conoce como méto-
de las relaciones de las medias mensuales respecto a la media anual, que
un caso particular del anterior.
e·k =-
Y.k -E· k
Si el esquema es multiplicativo,
equivale a
1 N-i y. 1 N-1 1 N- ir.
--L-A=-- ¿eik + - - L -lL
N - 1 ; = Eik
1 N - 1 ;= N - 1 ; = Eik
1 1
Parece mucho más fiable el método visual que propusimos. Podemos obser-
Yar que la serie parece moverse alrededor de la tendencia con una dispersión
o menos constante (compruébese en su representación gráfica en la figura
2.1); así, aunque la tendencia es alcista las oscilaciones alrededor de ella no se
más pronunciadas.
Por lo que respecta a la variación estacional, en primer lugar podemos
w-u-nnrntv>r que existe, fijándonos en que el valor de enero siempre es menor
el del diciembre anterior, agosto siempre es menor que septiembre, etc. Al
tiempo, no parece que la diferencia entre meses tienda a crecer a medi-
que crece la tendencia, con lo que podemos suponer que el esquema es adi-
U)
....e<11
Q)
>
Q)
"'O
Q)
-~
(/)
co
...
N
470 • SECCIÓN 6. SERIES TEMPORALES
.,..,
Y.k = Y.k - 7' 45 (k - 1) ,
12
es decir,
Ejercicio 6. 1
¿Con qué componentes de una serie temporal asociaría cada uno de los siguientes
hechos?
(a) Una huelga de trabajadores del sector del metal.
(b) Un incremento de la producción de trigo debido a la incorporación de nuevas
técnicas de cultivo.
(" Un aumento de las ventas de automóviles durante el mes de mayo.
d) Una disminución de las ventas de helados en agosto a causa de una oleada de
frío.
(e) Una recesión en el volumen de construcción de viviendas durante tres años.
:OLUC/ÓN
Una huelga de trabajadores del sector del metal es una fluctuación de tipo errático
o residual, que no presenta periodicidad.
La incorporación de nuevas técnicas de cultivo cambiará la estructura de la pro-
ducción de trigo; aquí aparece un cambio de tendencia de la serie.
~ El incremento de las ventas de automóviles durante el mes de mayo es un movi-
miento estacional que obedece a la lógica demanda del consumidor que, aproxi-
mándose las fechas veraniegas, elige esta época para plantearse este tipo de acqui-
sición.
El movimiento es claramente residual.
Este hecho de la recesión del volumen de construcción de viviendas es cíclico;
téngase en cuenta el período superior al año del supuesto.
rcicio 6.2
Yolumen de facturación de un hipermercado, desde 1989 hasta 2003, ha seguido
siguiente evolución:
476 • SECCIÓN 6. SERIES TEMPORA LES
1989 2 500
1990 3 400
1991 3 800
1992 4 200
1993 4 700
1994 5 200
1995 5 500
1996 6000
1997 6 500
1998 6200
1999 7 500
2000 8 200
2001 9000
2002 9 300
2003 9 000
SOLUCIÓN
(a) Consideraremos la siguiente tendencia
y1 == a+ bt.
.. .
\,
'
. ' - - --
. --
1 y. "'-
~
.t. _,
- - -
Tenemos que
Entonces
a10 =t' = O
-
a20
L:t' 280 = 18 66
= -- = -
2
N 15 '
478 • SECCIÓN 6. SERIES TEMPORALES
s; = 18,66- 0 2
= 18,66
Syr, = a11 - a10a01
b = 8 953,33 = 479 81
18,66 '
a' = 6 066,66- 479,81 ·O = 6 066,66
Por tanto, la recta de tendencia es
Y, = 6 066,66 + 479,811' ,
o bien
Y, = 6 066,66 + 479,81(t- 1996),
(b) El coeficiente que nos puede medir el grado de bondad del ajuste es el coe:na.e~~
de correlación lineal
Ejercicio 6.3
Una empresa, con vistas a afrontar la fmanciación de una posible expansión,
interesada en estimar el volumen de ventas para el año 2009. Para ello utiliza
información disponible de las ventas de años anteriores.
EJERCICIOS DE LA SECCIÓN 6 • 479
1994 100
1995 120
1996 132
1997 140
1998 182
1999 210
2000 205
2001 310
2002 420 (2 524 250,84 €)
2003 430 (2 584 352,05 €)
Tenemos que
- = I Y, = 2 249 = 224 9
Y N 10 '
~t :L/
=- = -
5 = 0,5
N 10
Sy2 = ao2 - ao1
2
a 01 = y = 224,9
a02 = LY? = 638 073 = 63 807 3
N 10 '
s: = 63 807,3 - 224,9 = 13 227,29 2
Sr·2 = aw - aw
2
a 10 = t' = 0,5
a 20
It'- = -85 = 8,5
=-
2
N 10
s,: = 8,5 - 0,5
2
= 8,25
"' Y · t'
a 11
-
-
L., t
N
= -4 10
216
- = 421,6
syt. = 421,6- 224,9. o,5 = 309,15.
Entonces
b = s". = 309,15 = 37 47
2
S,. 8' 25 •
a' =y- bi' = 224,9- 37,47 · 0,5 = 206,16.
o bien
Y, = 206,16 + 37,47 (t - 1998).
Yiooo = 206,16 + 37,47 (2000- 1989) = 618,33 millones de ptas. ó 3 716 238,15
EJERCICIOS DE LA SECCIÓN 6 • 481
r = !L_ = 309,15 = 0 93
sy s ~13 221,29 .Js,25
1
• ' ·
Este coeficiente nos indica la existencia de un alto grado de dependencia lineal en-
tre las variables.
Ejercicio 6.4
El volumen de pasivos fmancieros (en millones de libras esterlinas) de la banca
privada en el período 1992-2003 evolucionó de la forma siguiente:
2,5 -12,5
3,1 -4 -12,4
3,9 -3 - 11 ,7 -27
4,7 -2 -9,4 -8
5,9 -1 1 - 5,9 -1
7,0 o o 0,0 o
8,0 1 1 8,0 1 8,0
9,6 2 4 19,2 8 16 38,4
11,7 3 9 35 ,1 27 81 105,3
14,0 4 16 56,0 64 256 224,0
16,8 5 25 84,0 125 625 420,0
19,2 6 36 115,2 216 1 296 691,2
..,·".
1, •
... ...
482 • SECCIÓN 6. SERIES TEMPORALES
SOLUCIÓN
(a) Para simplificar los cálculos hacemos el cambio
t' = t-1997
por lo que la recta ahora ajustada será
y1 =a+ bt'
L Y = T · a + b L t' }
1
106,4 = 12a + b6 }
265,6 = 6a + b146
en donde
a = 8,12 b = 1,49
y la recta ajustada es
Y1 = 8,12 + 1,49t'
es decir
Y1 = 8,12 + 1,49(t- 1997)
Este sistema, una vez resuelto, nos lleva a que la parábola ajustada es
Yr = 6, 97 + 1, 37t' + O,llt' 2
Yr = 6,97 + 1,37 (t -1977) + O,ll(t -1997) 2
que, para t = 2005 , nos proporciona la predicción y6'5 = 24,97 millones de li-
br.as-esterlinas.
Para poder estudiar cuál de las dos predicciones es mejor se deberían determinar
los correspondientes coeficientes de correlación, lineal y parabólico, con lo que
podemos hacernos una idea de cuál de los dos modelos ajustados se adapta mejor a
la información disponible, y, además, en el caso más favorable, si el ajuste es su-
ficientemente bueno. En efecto, podría ocurrir que el ajuste lineal fuera mejor que
el parabólico, por ejemplo; pero podría ser el coeficiente de correlación lineal su-
ficientemente bajo e indicarnos que tampoco este ajuste es bueno, con lo que de-
beríamos buscar otro modelo de éomportamiento que respondiera mejor a la es-
tructura de relación entre estas variables.
SOLUCIÓN
(a) Al tener el ciclo un período de cinco años, consideraremos medias
cada cinco años, tales· como
- Y1 + Y2 + ··· + Yp
Yp+l =
-2- p
- _ Y2 + Y3 + ... + Yp+l
Yp+3 -
-2- p
- _ Y¡ + Y2 +; .. + Ys
y3 - 5
y +y +···+y
y4 = 2 3 5 6
1992 600 - -
1993 800 - -
1994 750 2900 580
1995 400 2 800 560
1996 350 3 000 600
1997 500 3 200 640
1998 1 000 3 610 722
1999 950 3 800 760
2000 810 4 020 804
2001 540 4 180 836
2002 720 - -
2003 1 160 - -
EJERCICIOS DE LA SECCIÓN 6 • 485
Y,
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
FIGURA E6.1
d caso del ciclo con un período de cuatro años, período par de años, las me-
móviles serían
486 • SECCIÓN 6. SERIES TEMPORALES
Años
1992 600
1993 800
.......................... 2 550
1994 750 4 850
.......................... 2 300
1995 400 4 300
...... .. ....................... 2 000
1996 350 4 250
...........................2 250
1997 500 5 050
.................... ...... 2 800
1998 1 000 6 060
.......................... 3 260
1999 950 6 560
...... . ...... ... ............... 3 300
2000 810 6 320
....................... .... .... 3 020
2001 540 6 250
.................. .. ..... ..... . 3 230
2002 720
2003 1 160
2, 5 + 3,5 = 3.
2
El procedimiento práctico, en este caso, para obtener las .............u ....
móviles centradas es obtener los totales móviles de cada cuatro datos
pués obtener los totales móviles centrados de cada dos totales móviles
y, por fm, dividir por ocho.
La serie de medías móviles centradas sería la que se muestra en e
esta página.
La tendencia sería, por su parte, la poligonal que une las medias
tradas.
EJERCICIOS DE LA SECCIÓN 6 • 487
6.6
recogido datos de la evolución de los gastos (en €) en vestido y calzado por
y mes durante los años 2002, 2003 y 2004:
1er Trimestre 12 13 15
2 ° Trimestre 15 18 18
3er Trimestre 10 12 10
4 ° Trimestre 22 25 32
Y1•. =a + bi.
202 o 2 16 13 730
-
Y = ¿)¡. = 202 = 67 33
N 3 '
r = ¿t = .2. = o
N 3
2 2
Sy = a02 - ao1
a01 = Y = 67,33
488 • SECCIÓN 6. SERIES TEMPORALES
a =
02
~>~ = 13 730 = 4 576 67
N 3 '
Sy2 = 4 576,67- 67,33 = 43,34 2
a10 = r =o
a
¿·12 2
= _ l _ = - = O 67
2o N 3 '
2
si: = o,67- 0 = o,67
= LLY;.i' = ~ = 5 33
ll¡¡ N 3 '
syi' = 5,33- o. 67,33 = 5,33.
Por tanto
b = syi. = 5,33 = 7 95
si: o, 67 •
a' = y- bf = 67,33 - 7,95 ·O = 67,33
La tendencia para el gasto total es
Y;. = 67,33 + 7,95(i- 2003).
50,50 o 2 4
EJERCICIOS DE LA SECCIÓN 6 • 489
Por tanto,
50,50 = 3a + Ob}
4 = Oa + 2b
de donde
4
b= - =2.
2
Formemos la siguiente tabla:
-.
~ -;/:~_;.:~~;;;:~~L>,··.,;;:::>~:-.=-k~;L :_· ,_-_. . _._,_- _:~_ ~--,:-. ~- _· ' ---~)~:~~·; : ~ ~~~<~~::~·:: ':_., :: ;ii:~~j
1er Trimestre 12 13 15 40 13,33 13,33 83%
2° Trimestre 15 18 18 51 17 16,50 103%
3er Trimestre 10 12 10 32 10,67 9,67 60%
4 ° Trimestre 22 25 32 79 26,33 24,83 154%
2·2
"13 = 10,67 - - 4- = 9,67
3-2
"14 = 26,33 - -4- = 24,83.
Al determinar la media y
16,08, los índices de variación estacional, bajo el
=
supuesto de esquema multiplicativo, son:
13 33
/VE1 = • . 100 = 83%
16, 08
16 50
/VE2 = • . 100 = 103%
16,08
9 67
/VE3 = • . 100 = 60%
16,08
24 83
/VE4 = • . 100 = 154%.
16,08
Para desestacionalizar basta con dividir los datos correspondientes a las obser-
vaciones trimestrales por sus respectivos índices de variación estacional.
490 • SECCIÓN 6. SERIES TEMPORALES
2° Trimestre ~ = 14 56 ~
1, 03
= 17 47
•
~
1,03
= 17 47
•
1,03 •
3er Trimestre ~
0,60
= 16 67
•
_E_= 20 -
10
0,60
= 16 67
•
0,60
4 ° Trimestre _E_= 14 28 ~
1,54
= 16•23 23._ = 20 78
1,54 • 1,54 .
(e) La recta de tendencia, obtenida sobre los valores medios anuales, era
b=2
50 5
a' = • = 16 8
3 '
Y;. = 16,8 + 2 (i - 2003)
EJERCICIOS DE LA SECCIÓN 6 • 491
con lo que el valor de la tendencia para cada uno de estos tres años será
y en el supuesto multiplicativo
rcicio 6. 7
precios de una mercancía, observados durante cada trimestre de los años
, 2000, 2001, 2002 y 2003 fueron los siguientes:
492 • SECCIÓN 6. SERIES TEMPORALES
1999 ¡o 2
1999 20 3
1999 30 3
1999 40 4
2000 ¡o 5
2000 20 4
2000 30 5
2000 40 6
2001 ¡o 5
2001 20 4
2001 30 4
2001 40 3
2002 ¡o 3
2002 20 4
2002 30 6
2002 40 7
2003 ¡o 6
2003 20 6
2003 30 8
2003 40 8
1er Trimestre 2 5 5 3 6
2° Trimestre 3 4 4 4 6
3er Trimestre 3 5 4 6 8
4 o Trimestre 4 6 3 7 8
Totales Y;. 12 20 16 20 28
Medias Y;. 3 5 4 5 7
~. - :- --- ' . -
Como
24 5a + bO }
=
8 = aO + blO
24
a=-=48
5 '
8
b = - = 0,8.
10
4,0
4,8
7 5,0 111%
12 20 16 20 28 18,0
3 5 4 5 7 4,5
494 • SECCIÓN 6 . SERIES TEMPORALES
.,.., = 5 6 - 3 . 0,8 = 5
Y.4 • ·
4
Posteriorm~nte se calcula la media de las medias corregidas, que en este
y= 4,5.
Los IVE serán los porcentajes respecto a Y' de cada media corregida, ya que
nemos que el esquema es multiplicativo; para el primer trimestre, por ejemplo:
42
!VE1 = • . 100 = 93%.
4,5
Los demás índices, ya calculados de forma análoga, figuran en la tabla.
Ejercicio 6.8
La región A de un determinado país experimentó, desde 1998 hasta
siguientes entradas de turistas en millones:
Primavera 2 3 3 4 4 5 6
Verano 6 9 11 14 16 19 20
Otoño 3 3 4 4 5 5 6
Invierno 1 1 2 2 3 3 4
Total ... 12 16 20 24 28 32 36
- - 16 - 4
Yz. - -
4
EJERCICIOS DE LA SECCIÓN 6 • 495
: .
1998 3 -3 9 -9
1999 4 -2 4 -8
2000 5 -1 1 -5
2001 6 o o o
2002 7 1 1 7
2003 8 2 4 16
2004 9 3 9 27
42 o 28 28
42 = 7a + bO }
28 = aO + b28
de donde
42
b=28= 1 Q= - =6.
28 7
Nos fijamos en la pendiente b, que es el crecimiento de la serie en cada año.
i.
496 • SECCIÓN 6. SERIES TEMPORALES
Verano
Otoño
Invierno 4
Total .. 12 16 20 24 28 32 36 22,49
Y;. 3 4 5 6 7 8 9 5,6225
.,.,.2
Y = 13 57 - ~ = 13 57 - !4 = 13' 32
' ' 4 '
r 3
= 4,28- 2
·b
4
= 4,28 - ~ = 3, 78
4
3. b 3
.,.,.4 = 2 28 - -
Y = 2 28 - - = 1 53
' ' 4 ' 4 '
En este caso b = 1 .
5 . Se halla la media de las medias corregidas rk
=- = ¿rk = 22, 49 = 5 6225 .
Y 4 4 '
6. Por fin, los índices de variación estacional (IVE) se obtienen expresando, en
por ciento, cada media corregida de la tendencia respecto a la media de las
corregidas.
El índice de variación estacional para la primavera será:
13 32
IVE
V
= 5,6225
• · 100 = 236' 91%
6.9
la empresa VENPLASA, que se dedica a la venta a plazos, se registró el
pien1te volumen de ventas trimestrales (en millones de euros) durante los años
2002 y 2003:
. . .
75 24,125
4 21 5,25
25 88 26,705
2001 15 -1 1 -15
2002 19,5 o o o
2003 22 1 22
56,5 o 2 7
56,5 = 3a + bO }
7 = aO + b2
de donde
7 56 5
b=-=35 a= ' = 18,8.
2 ' 3
Una vez calculadas las medias trimestrales
este caso
Y:! = 14
5 25
IVE3 = • · 100 = 29 96 %
17,52 '
26 705
IVE4 = • ·lOO= 152 43 %.
17,52 '
En esta empresa se produce una estacionalidad en sus ventas de forma que, por
ejemplo, las ventas del segundo trimestre son un 37,7 % superiores a las que ten-
dría en caso de que su actividad no presentara estacionalidad.
La serie de ventas totales anuales es
Y¡. =a+ bi
Haciendo i' = i - 2002 reducimos los cálculos. Sabemos que
-y = L Y¡. = 226 = 75 33
N 3 '
Ji= L,i' = Q =o
N 3
s; = a02 - a~1
a0 1 = J = 75, 33
428
= L,yJ. = 17 = 5 809 33
am N 3 '
s; = 5 809,33- 75,33
2
= 134, n ·
S¡•2 = a2o - a1o
2
a10 = P =O
L, 1 ·12 2
a = - - = - = O 67
20 N 3 '
si: = 0,67 - 0
2
= 0,67
500 • SECCIÓN 6. SERIES TEMPORALES
"'Y,·. · i'
=L.,¿:_:.__
28
== - == 9, 33
au == N 3
syr == 9,33- o. 75,33 == 9,33.
Entonces
b == syi' == 9,33 == 13 93
S~ 0,66 '
a' == y- bf == 75,33- 13,93 ·O == 75,33.
La recta ajustada es
Y¡. == 75,33 + 13, 93i'
o bien,
Y¡. == 75,33 + 13,93(i- 2002) .
Debemos dar una medida de la bondad del ajuste por medio del ""'•hr:r...,....,
correlación lineal
es decir,
6.10
evolución estacional del número de turistas en España, en millones de personas,
el período 1961-1968, fue
7,45
30-40 7,66
4°-1° 8,14
502 • SECCIÓN 6. SERIES TEMPORALES
- =: 13,00 = 1,63
Y., 8
- =: 24,17 = 3,02
Y.2
8
- = 55, 30 = 6 91
Y.J 8 ,
Y.4
= 17,21 =215
•
8
teniendo en cuenta los valores de E.k de la tabla anterior, la componente
será
e:, = 1,63- 3,49 =: -1,86
e:2 = 3,02- 3,62 = -0,60
e:3 = 6,91 - 3,23 =: 3,68
e:4 = 2,15- 3,33 = -1,18.
EJERCICIOS DE LA SECCIÓN 6 • 503
vez obtenido este cuadro de componente estacional, hallamos las medias por
es decir,
.....,-v>c::1rr"" ,
1 N- 1 Y;k
e:k =-
N
- l: -
- 1 ; ; I Eik
504 • SECCIÓN 6. SERIES TEMPORALES
que son
-
e.¡
= 3,478 =
7
o' 497
6 295
e·2 = •7 = o' 899
13 913
- =
e.J •7 = 1 988
'
- = 4, 341
e.4 7
= o' 620
cuya media, a su vez, es
1,70 = 1,53
89,81%
3 64
1 83 = •
' 198,60%
2,29 = 1,42
61,94 %
Primavera 2 3 3 4 4 5 6
Verano 6 9 11 14 16 19 20
Otoño 3 3 4 4 5 5 6
, Invierno 2 2 3 3 4
Calcúlense los índices de variación estacional por el método de las relaciones de las
medias mensuales respecto a la tendencia, y por el método de medias móviles,
comparando los resultados.
~·
500 • SECCIÓN 6. SERIES TEMPORALES
Otoño 3 4
Invierno 2 16
Total .. 12 16 20 24 28 32 36
Y;. 3 4 5 6 7 8 9
donde lo primero que obtenemos son las medias anuales Y.; , a las que ·
una recta de tendencia.
Para ello, teniendo en cuenta que i' = i - 2000 ,
.
i Y¡. i' (2 ~- . i'
1997 3 -3 9 -9
1998 4 -2 4 -8
1999 5 -1 1 -5
2000 6 o o o
2001 7 1 1 7
2002 8 2 4 16
2003 9 3 9 27
42 o 28 28
¿);. = Na +b 2/ }
LY)' = a¿i' + bz.)'2
42 = 7a + bO }
28 = aO + b28
de donde a =6 y b = 1.
Seguidamente calculamos las medias trimestrales Y.k , que ya figuran en la
corrigiéndose a continuación estas medias de la parte de tendencia que les
es decir
ft = Y.t = 3,86
_, = -y - !!._ = 13 57 - .!. = 13 32
Y·2 ·2 4 , 4 ,
EJERCICIOS DE LA SECCIÓN 6 • 507
.,.,·4
Y = -y·4 - 3
4
b = 2•28 - ~
4
= 1•53
Por último, los índices de variación estacional se obtienen expresando cada una
de estas medias en tantos por ciento de su media, luego, si
3 86
JVE1 =f 1 · 100 = • · 100 = 68 62%
y 5,625 •
32
JVE2 =f 2 · 100 = 13• · 100 = 236 80%
y 5,625 •
Éstos serían los índices que podríamos utilizar para desestacionalizar la serie en el
supuesto de que admitiéramos un esquema multiplicativo en la relación de sus
componentes.
Método de las medias móviles. Con los datos de que disponemos formaremos
medias móviles de cada cuatro años para, en primer lugar, eliminar la componente
estacional y obtener la componente extraestacional.
Ahora bien, al ser par el número de elementos que forman cada media móvil,
éstas quedarán descentradas, es decir, entre cada dos estaciones, y será necesario
110lver a centrar la serie, para lo que volveremos a hallar medias móviles de cada
de las medias móviles que hayamos obtenido antes.
Desde el punto de vista práctico, parece más cómodo calcular, en primer !u-
los totales móviles de cada cuatro datos, que no estarán centrados; luego, los
de cada dos de los totales no centrados, y, por último, dividir por ocho
x 2) cada elemento de esta tabla final.
,. .
508 • SECCIÓN 6. SERIES TEMPORALES
Primavera-verano 16 19 24 27 32 35
Verano-otoño 12 16 20 24 28 32 36
Otoño-invierno 13 16 21 24 29 33
Invierno-primavera 16 18 24 26 32 34
-~~~~~~Yi::~~~-~i8~_.;_ ~:-i~~:~~:~2~~J)}G}~f{~~hh~~~~:.r~!
Primavera - 0,75 0,65 0,67 0,60 0,62 0,70 0,66
Verano - 2,25 2,26 2,33 2,33 2,37 2,25 2,30
Otoño 0,96 0,75 0,78 0,67 0,70 0,61 - 0,74
Invierno 0,28 0,23 0,36 0,32 0,39 0,36 - 0,32
e= e: 1 + e: 2 + e: + e:
3 4 = 0,66 + 2,30 + 0,74 + 0,32 =
1005
4 4 •
Entonces, los índices de variación estacional se obtienen determinando los co-
cientes:
IVE =
e
_:.!_ · 100
e
luego
0 66
!VE1 = e:e
1
o 100 = •
1,005
100 = 65 67%
o
'
2 30
IVE2 = e: 2 100 = • · 100 = 228 86%
e o
1,005 '
0 74
!VE3 = e:e
3
-100 = •
1,005
100 = 73 63%
o
'
lVE4 = -·4
e 100 =- -
o,32
100 0
= 31 84/oo
01
e
o
1,oo5 •
CAPÍTULO 13
Tasas de variación
Variación temporal
de variables económicas
su medida
513
514 • SECCIÓN 7 ASAS DE VARIACIÓN
EJEMPLO
Supongamos que el valor de la serie J-; en el momento t - 1 es igual a 200
en el momento tes 220 unidades, la variación absoluta sería
VA (J-;) = ~1-; = 1-; - J-;_ 1 = 220 - 200 = 20 unidades.
TASAS DE VARIACIÓN • 515
Ahora observemos otra serie X, que en el momento t - 1 toma el valor de 2 000 uni-
dades y en el momento t se sitúa en 2 020 unidades, su variación absoluta entre estos
períodos es
Para poder medir estas variaciones del modo más preciso, de manera que se
reflejen las características de cada serie, eliminando las diferencias de escala
para que sean comparables entre sí, es necesario relativizarlas, que es lo que
vamos a estudiar a continuación.
VA(Y,) y
Yt - yt-1 = _t_
~ = -----'- -1
Y,_¡ Y,_¡ Y, _¡
Esta medida viene dada, en principio, en tantos por uno, y es habitual ex-
presarla en porcentaje o tantos por ciento, lo que se logra multiplicando el re-
sultado obtenido por 100.
EJEMPLO
(continuación)
En el primer ejemplo ct,_¡ epígrafe anterior la tasa de variación sería
220
~ = - - 1 = 1,10- 1 = 0,10 = 10%
200
es decir, del 0,10 por uno, o del10%, que es lo mismo.
516 • SECCIÓN 7. TASAS DE VARIACIÓN
xl = xl - xl-1 = li__ - 1 =
xl-1 x1-1
2020
= -- - 1 = 1, O1 - 1 = O, O1 = 1 %
2000
lo que nos revela que, aunque en ambos casos su crecimiento absoluto fue de 20
des, en la primera serie esta variación suponía un 10% respecto al valor inicial
como referencia mientras que, en el segundo caso, la variación relativa fue del 1
Una ventaja adicional del uso de las tasas de variación proviene del
adimensional de éstas, lo que posibilita cualquier tipo de comparación
evolución de las series, aunque dichas series vengan expresadas en
dispares unidades de medida.
Otra manera de introducir el concepto de tasa de variación que, por
te, se deduce de las definiciones anteriores, proviene de la siguiente ,·,.IPnlhm. .
VA(Y)
t; = t;_1 + VA(t;) = t;_ 1+ ~ t; _1 =
1-1
EJEMPLO
(continuación)
Siguiendo el ejemplo número anterior, la cadena de identidades se transformaría ea
.-
Si la variación absoluta es negativa también lo será la correspondiente
de variación.
TASAS DE VARIACIÓN • 517
(continuación)
Así, si en el mes t el valor de la serie es 200 y en el mes anterior es 220, la tasa de
"-ariación que obtendríamos sería
~ = l_ 1 = 200 - 1 =
~ -1 220
= 0,9090- 1 = -0,0909 = -9,09%.
t: na causa de este hecho podría ser la aparición de una helada o un granizo que reduzca notablemente la
:::osecha de un producto alimenticio básico en una campaña, encareciéndose dicho producto anormal y tran-
moriamente.
518 • SECCIÓN 7 . TASAS DE VARIACIÓN
T3 = Dicl -1
Setl ·
Die
T12 = - -1- -1
Die r-1
Los subíndices <<j>> en cada una de las tasas T.J hacen referencia al número de
incluidos en el período en el cual se mide la variación. Eh todos estos
, no hemos tenido en cuenta la estacionalidad. Si se observa este efecto
...,.a.. lvu.,u, como ya hemos comentado, es más conveniente utilizar las tasas
o las que se obtienen por medias móviles, que veremos en el epígrafe
t La utilización de medias móviles para la obtención de tasas, no hace especial hincapié en el tema del
trado de la serie para un p par, ya que aquí lo relevante es la distancia en el eje de tiempos entre las
móviles comparadas.
TASAS DE VARIAC IÓN • 521
Todas estas tasas, I;0 , calculadas según medias móviles, son tasas de ca-
mensual porque la distancia entre estas medias móviles calculadas siem-
es lógico, y como veremos también, se podrán establecer relaciones entre tasas trimestrales y se-
1111:Strales con las anuales, o con las de cualquiera de los períodos entre sí.
522 • SECCIÓN 7. TASAS DE VARIACIÓN
T=~-Yo=~-1
1 V V
Lo Lo
en donde Y¡ = Y0 (1 + I;).
En el segundo mes tendríamos
T=Y2-~=Y2_1
1 ~ ~
es decir, Y2 = ~ (1 + I;) .
Y así sucesivamente, hasta el duodécimo mes en donde:
T = ~2 - ~~ = ~2 - 1
1 ~] ~]
siendo ~ 2 = ~ 1 (1 + I;).
Estableciendo una relación recurrente mes a mes, obtendríamos que el
final del año de la serie sería:
~2 = ~ 1 <1 + I;) = ~o (1 + I;)(1 + I;) =
= Y.; (1 + I;)(1 + :f¡) (1 + I;) = ... =
= Y0 (1 + I;) (1 + I;)(1 + t 1) • • • (1 + I;) =
= y0 (1 + I;)J2 .
siendo
. ...
-
TASAS DE VARIACIÓN • 523
17;2 = (1 + I;i2 - 1 1
Para reflejar que esta tasa anual es una tasa equivalente a la mensual, es decir,
que se ha calculado a partir de la mensual, la notación más generalizada es la
de 7;1 que se lee como «tasa de variación mensual elevada a anual>>.
En general, las tasas equivalentes se notarán por TJ; cuya lectura será: «tasa
de variación de período j elevada a tasa de período i>> .
Dentro de las tasas de períodos inferiores al año elevadas a anuales, la ex-
presión general que las liga será:
IIJ1= (1 + 1J )12/j - 1 1
A continuación, por ser las más frecuentes, ofrecemos como casos particu-
las relaciones de equivalencia entre tasas para algunos períodos:
Tasa de variación trimestral elevada a anual:
1T3t = (1 + T3 )4 - 1 ~ ·
Tasa de variación cuatrimestral elevada a anual:
1r; = (1 + T4 )3 - 1 1
Tasa de variación semestral elevada a anual:
1r; = (1 + T i - 1 1
6
r'lt'o de los ejercicios que suelen presentarse cuando se trabaja con tasas de
•·.A.:-iación es el referente a su promediación.
524 • SECCIÓN 7. TASAS DE VARIACIÓN
T. (1)
1
= ~-
y
1
o
T. (2) = y2 - 1
1 y
1
T. (3) =
1
y; - 1
y
2
~ (12) = f¡ 2 - 1
Y¡¡
que lo normal es que sean diferentes en cantidad e, incluso, en signo.
Estas diferencias en las tasas mensuales :f¡ (K) , nos hace pensar en cuál
ría el valor de la tasa de variaciór. que aplicada repetidamente a lo largo de
meses nos reprodujera el valor a final del período anual f¡ 2 partiendo de
valor inicial Y0 . Es dt:!cir, la denominada tasa media de variación
ría a aquélla que cumpliera la siguiente relación funcional:
f¡2 = Yo (1 + TM¡i2
Para su determinación no hay más que tener en cuenta que del cálculo de
tasas mensuales de variación se deduce que:
Y¡ = Y0 [1 + :f¡ (1)]
y2 = Y¡ [1 + :f¡ (2)]
y3 = y2 [1 + :f¡ (3)]
(1 + ™1 i 2
= {[1 + ~ (1)] [1 + I; (2)] [1 + ~ (3)] ... [1 + ~ (12)1}
Por otra parte, una vez obtenida la tasa media de variación mensual puede
sarnos el determinar su tasa anual equivalente, lo que, según el epígrafe
...,.,.,.,r,,., lograríamos de acuerdo con
:z;l = (1 + ™/2 - 1.
Esta tasa anual equivalente podría calcularse directamente a través de las
~~rvaciom!s de la s'"'rie mensual haciendo:
~ = ~ -1 (1 + ~) .
Por otra parte, siempre es posible encontrar una constante de prc>porctiOIIil•
dad p1 en donde se verifique:
es decir
= -~-
y
1-1
y y
l ~
o
Por consiguiente, este tipo de aproximación será tanto más aceptable cuanto
~ r
-
Ejercicios
DE LA SECCIÓN 7
EJERCICIOS DE LA SECCIÓN 7 • 531
Ejercicio
::--
7. 1 - r
9 968 9
Febrero 1986 • - 1 = o 927 - 1 = -0 073 = -7 3 %
10 752,5 , ' '
91780
Octubre 1986 é1 = 8 967,4
• - 1 = 1 024- 1 = o 024 = 2 , 4%
, '
9 572 3
Noviembre 1986 . = 9 178,0
• - 1 = 1 043 - 1 = o 043 = 4' 3%
el , ,
(b) La tasa intermensual, formada por medias móviles anuales, es una tasa
mensual para períodos anuales de 12 meses. La podemos representar por écc
en este ejemplo, será
. Ene86 + Feb 86 + · .. + Dic 86 113 013,8 _ =
e(l2) = . - 1 =---- 1
Dlc85 + Ene 86 + ... + Nov 86 112 941,9
= 1,0U06- 1 = 0,0006 = 0,06%
EJERCICIOS DE LA SECCIÓN 7 • 533
1+ e, 2 = (1 + e, )12
e, 2 = (1 + i:\ )12 - 1 =
= (1,006001)- 1 = 0,006 = 0,6%.
e.¡1 = e. 12 = (1 + e..1)12 -
1
Ejercicio 7. 2
Los precios, en un determinado país, suben un 1% en cada uno de los once
primeros meses del año, y bajan el 10% en diciembre. ¿Cuál será el incremento
anual de los precios?
534 • SECCIÓN 7. TASAS DE VARIACIÓN
SOLUCIÓN. Si tomamos el mes de diciembre del año anterior como base de a.-
paración, haciendo 100 su índice, los de los doce meses de este año serán
t- 1 Diciembre 100,00
Enero 101,00
Febrero 102,01
Marzo 103,03
Abril 104,06
Mayo 105,10
Junio 106,15
Julio 107,21
Agosto 108,29
Septiembre 109,37
Octubre 110,46
Noviembre 111,57
Diciembre 100,41
. 100,41
~2 = 100,00 - 1 = 1, 0041- 1 = 0,0041 = 0,41%.
En el año los precios subieron sólo un 0,41 %. Sin embargo, los consumidores
sufrido alzas de precios en once de los doce meses del año, pagando por amlCIJ[)311•
subidas de precios que luego se neutralizarían.
Ejercicio 7. 3
Las ventas de una empresa en el mes de enero de 2004 fueron del orden de 215 . _
euros, y en febrero de 222 000.
(a) ¿Cuál sería la estimación del crecimiento de las ventas de ese año?
(b) ¿Y si en marzo se registrasen unas ventas de 230 000 euros?
SOLUCIÓN
(a) La tasa de variación intermensual de las ventas entre enero y febrero fue
222 000
V:1 = 215 000 - 1 = 1, 033 - 1 = 3 , 3% .
(b) En este caso tenemos más información: las ventas del mes de marzo, aunque lo
idóneo sería conocer la evolución mensual de las ventas en años anteriores.
Con estos datos sólo podemos efectuar las siguientes previsiones:
l. Hallar las tasas medias mensuales, y su tasa promedio elevarla a anual, es de-
cir, si la tasa mensual de febrero a marzo es
. 230
V.1 = -222 - 1 = 1, 036 - 1 = 3, 6%
2. Hallar la tasa media mensual de estos tres meses en base a medias móviles bi-
mensuales, es decir,
222 230
V:(Z) = +
215 + 222
- 1 = 1 0343 - 1 = 3 43%
• •
v;2)
"1
= (1 + 0,0343) 12 - 1 = 1,499- 1 = 49,9%.
Este segundo procedimiento tiene la ventaja de que amortigua parte de la posi-
ble estacionalidad.
Ejercicio 7.4
Dado un fenómeno que evoluciona exponencialmente y que pasa en 16 años del
valor lOO a 4 728, hállese su tasa media anual acumulativa de crecimiento.
de donde
. = v4100728
r 16 - - - 1 = 1,2725- 1 = 0,2725
.
= 27,25%.
536 • SECCIÓN 7. TASAS DE VARIACIÓN
Ejercicio 7. 5
Obténgase la tasa media anual acumulativa de los salarios anuales siguientes:
Salarios
Años
(en lo:' €)
2002 100
2003 120
2004 156
SOLUCIÓN. Para detenninar esta tasa podemos proceder por dos vías alte:rruñ •
obteniendo previamente las tasas anuales, o directamente.
En el primer caso se obtienen las tasas anuales de variación para los distintos
dos:
Para el período 2002-2003 tendremos que
120 = 1oo<1 + s 03 )
de donde
s
04
=
156
120
- 1 = o 30
'
= 30%.
La tasa media anual acumulativa que nos piden será tal que
(1 + sl = (1 + s03
) (1 + s 04
)
s = ~(1 + S )(1 + S
03 04
) - 1 = ~(1 + 0,20) (1 + 0,30) - 1 =
= 1,2489- 1 = 0,2489 = 24,89%.
Esta tasa media es, pues, la media geométrica de los valores unitarios al final de
cada período.
Nótese que la tasa media no es la media aritmética de las tasas anuales, que en es1e
caso sería
Por otra parte, esta tasa media se puede determinar directamente, teniendo en cuen-
ta que
S. = ~56
- - 1 = 0,2489 = 24,89 % .
lOO
Este procedimiento, como puede comprobarse, es mucho más rápido que el ante-
rior.
Ejercicio 7. 6
El índice de precios de consumo de un determinado país ha evolucionado de la
forma siguiente:
1995 100
1996 105
1997 110
1998 116
1999 120
2000 125
2001 132
2002 141
2003 150
¡ Cuál será el índice en 2005 si suponemos que la tasa media anual acumulativa del
período 1995-2003 se mantiene estable?
I. = v150
- - 1 = 1, 052 - 1 = O, 052 = 5, 2% .
100
Ejercicio 7. 7
Supongamos que se quiere lograr en cuatro años rebajar la tasa de incremente
índice general de precios desde un 30% a un 10%. ¿Cuál sería la tasa media
acumulativa de desacel~ración en la subida de los precios? Reconstr.úyanse
índices de precios esperados en esos cuatro años.
10 = 30(1 + P)4
de donde
p. = 4~0
- - 1 = 0,7598- 1 = -0,2402 = -24,02%.
30
Es decir, que si en el año O los precios subieron un 30%, en los cuatro años
guientes las tasas de incremento deberán ser:
Índices
Años
(base año O = 100)
o 100,00%
1 100(1 + 0,2279) = 122,79%
2 122, 79(1 + 0,1732) = 144,06%
3 144,06(1 + 0,1316) = 163,02%
4 163,02(1 + 0,10) = 179,32%
EJERCICIOS DE LA SECCIÓN 7 • 539
Ejercicio 7.8
Consideremos la evolución de los siguientes agregados monetarios:
'' . . ' . ·.
..
\, ~.- '•
~
.
r· . ~ . ! .: . • . . r, . . . ''· .
. -- ~· .. . .. --
- .. ~
Fuente: Boletín Estadístico del Banco de España. Saldos en miles de millones de pesetas a 31 de
diciembre.
SOLUCIÓN
(a) Sabemos que el agregado monetario M2 es igual al M1 (oferta monetaria) más los
depósitos de ahorro, que las disponibilidades líquidas (M3) se obtienen agregando
a M2 los depósitos a plazo, y que los ALP son igual a la M3 más los otros pasi-
vos líquidos del sistema; por tanto,
Puede observarse que las series de tasas que presentan menos fluctuaciones
las relativas a la M 3 y a los ALP, siendo el crecimiento de esta última más
dentro de su desaceleración
Las tasas medias anuales para el período 1979-1986 son
7 322 8
M1 = 7 • - 1 = 11048 - 1 = 10 48%
3 645,6 ' ,
Como es más cómodo este procedimiento, para los otros agregados monetillil
tendremos
13 298 1
M2 = 7 • - 1 = 11038- 1 = 10 38%
6 662,5 ' ,
23 001 0
M3 = 7 • - 1 = 11144- 1 = 11 44%
10 774,7 ' ,
28175 6
ALP =7 • - 1 = 11437 - 1 = 14 37%
11 004,2 ' '
7 322 8
M = 4 4 926,3
1 • - 1 = 1 1042 - 1 = 10 42%
, ,
13 298 1
4
• - 1 = 11038- 1 = 10 38%
8957,9 ' '
EJERCICIOS DE LA SECCIÓN 7 • 541
23 001 0
M.J = 4 16 603,0
• - 1 = 1 0849 - 1 = 8 49%
'
7
C
0
28175 6
ALP = 4 • -1
17 212,7
= 11311-1
•
= 1311
•
%.
Ejercicio 7. 9
Sean las variables X e Y tales que
X = {x1x2 .. . xN}
y = {yly2 ... yN }
SOLUCIÓN
(a) Si U = X · Y , entonces, para cada observación i-ésima,
Análogamente, como
X.
V. = _!_
' Y;
tendríamos que
en donde sabemos que los salarios reales se obtienen deflactando los salarios
netarios, nominales o corrientes por el correspondiente índice de precios, es decD"
S = SM.
R J
. v220
150 - 1
SM = = 1,1005- 1 = 0,1005 = 10,05%
j = v 138
100
_ 1 = 1,0838 _ 1 = 0,0838 = 8,38%
159 4
sR
=
4
• - 1 = 1 0153- 1 = o 0153 = 153%.
150,0 ' ' '
EJERCICIOS DE LA SECCIÓN 7 • 543
de donde
Ejercicio 7. 1 O
Los indicadores coyunturales de la economía de algunos países comunitarios
europeos muestran que, en el trienio 1986-1988, se van a producir las variaciones
porcentuales en el PIB, consumo privado y precios siguientes:
Alemania 2,5 1,5 2,0 4,2 3,3 2,9 - 0,4 0,8 2,0
España 3,0 2,8 3,0 3,9 3,5 3,1 9,1 6,0 5,4
Francia 2,4 1,5 2,4 2,9 1,8 1,9 2,7 2,7 2,3
Inglaterra 2,4 3,1 2,6 4,7 3,8 3,2 3,7 3,9 4,2
Italia 2,7 3,2 2,8 3,2 4,2 3,9 6,3 4,3 3,7
CEE-12 2,5 2,2 2,3 3,7 3,1 2,8 3,8 3,2 3,3
Fuente: A. Fernández Díaz. •Política económica coyuntural• . Editorial AC. Madrid, 1987.
Determínense:
(a) Las tasas medias anuales de crecimiento del PIB.
(b) Las tasas anuales de crecimiento del PIB en unidades monetarias corrientes.
(e) La tasa de variación del consumo en España en el período 1986-1988.
(d) Las elasticidades consumo-producción de estos países.
544 • SECCIÓN 7. TASAS DE VARIACIÓN
SOLUCIÓN
(a) Las tasas medias anuales de crecimiento del PIB para cada uno de estos países..
simbolizamos esta macromagnitud por Y, son
por lo que las tasas de variación anual para el PIB nominal o monetario serán
etc ...
(e) La tasa de variación del consumo en España para el período 1986- 1988 es
é86- 88 ::::: (1 + 0,039)(1 + 0,035) (1 + 0,031)- 1 = 1,1087- 1 = 10,87%
donde puede observarse de qué manera tan dispar los expertos de la CEE pensa-
ban que iba a comportarse el consumo en estos años y países.
Ejercicio 7. 11
El índice de precios de consumo (IPC) en España, para el conjunto nacional, tolllÓ
en el período enero de 2002 a diciembre de 2003, los valores que se ofrecen a
continuación:
~f~~~;I~~~~-,~~~ ·;1;~~~
Enero 101,3 105
Febrero 101,4 105,2
Marzo 102,2 106
Abril 103,6 106,8
Mayo 103,9 106,7
Junio 104,0 106,8
Julio 103,2 106,1
Agosto 103,5 106,6
Septiembre 103,9 106,9
Octubre 104,9 107,7
Noviembre 105,1 108
Diciembre 105,5 108,2
Fuente: INE.
(a) Obténganse las tasas de variación anual para el período 2002-2003 (IPC de
diciembre de 2001 = 100).
(b) Estímese la taSa de variación del IPC en 2004.
EJERCICIOS DE LA SECCIÓN 7 • 547
SOLUCIÓN
(a) Estas tasas de variación anual del IPC, en base al índice de diciembre de un año
sobre el índice de diciembre del año anterior, serán
P. =105,5 _ 1=55%
2002
100 '
P. = 108,2 - 1 = 2 56%
2003 105,5 ,
(b) Para estimar la tasa de variación del IPC en 2004 podríamos adoptar alguna de las
siguientes alternativas:
l. Determinar las tasas mensuales de enero a diciembre de 2003, hallar su tasa
media mensual y elevarla a anual.
Tasas mensuales de enero a diciembre de 2003:
105 2
Febrero P.!Febrero = • - 1 = o 001904
105 '
548 • SECCIÓN 7. TASAS DE VARIACIÓN
Marzo P. = ~- 1 = o 007604
!Marzo 105,2 '
. 106,8
Abril ~Abril = 106 - 1 = 0,007547
106 7
Mayo P.!Mayo = • - 1 = -0 0009363
106,8 '
106 8
Junio P. . = • - 1 = o 0009372
llumo 106, 7 '
106 1
Julio P.lluho. = • - 1 = -{) 006554
106, 8 '
106 9
Septiembre P.!Sepnembre
. = 106,6
• - 1 = o 002814
'
107 7
Octubre P.!Octubre = • -1 =o 007483
106,9 '
Noviembre P.!Novtembre
. =~
107,7
- 1 = o ' 002785
. 108,2
Diciembre ~Diciembre = 108- 1 = 0,001851
Tasa media mensual:
P¡ = 2.j(l - 0,0009514) (1 + 0,001904) (1 + 0,007604) (1 + 0,007547) (1- 0,0009363
1
Ejercicio 7. 1 2
Con los datos córrespondientes al IPC y las tasas interanuales de variación del IPC
del período 1998-2001, estúdiese la estacionalidad de las tasas de varíacióa
intennensuales y coméntese su incidencia en las previsiones anuales.
--
EJERCICIOS DE LA SECCIÓN 7 • 549
¡: '_
('
--
-
- - ' - - -~ - - ~
1
t· .,
-
Enero 1,61 1,53 1,75 2,83
Febrero 0,53 0,38 0,86 0,47
Marzo 0,63 0,75 0,60 0,31
Abril 1,35 0,56 1,02 0,23
Mayo 0,41 0,46 0,34 0,31
Junio 0,61 0,74 -0,17 0,85
Julio 0,31 1,55 0,59 1,08
Agosto 1,42 0,72 0,17 0,23
Septiembre 0,80 0,18 1,08 1,06
Octubre 1,29 0,62 0,49 0,38
Noviembre 1,08 0,44 0,74 -0,22
Diciembre 1,55 0,71 0,49 0,45
SOLUCIÓN. Aparecen como claramente estacionales las variaciones del IPC en los
meses de enero de estos añ.os. También, y en sentido contrario, habría que destacar los
meses de mayo.
::..L o,
_;:: 1-i I~ :'~, p~:;;_,·í~.- ~-t; k·~·200ti . [> ;2001' :•
Enero - 105,25 115,79 125,50
Febrero - 106,28 116,50 126,45
Marzo - 107,25 117,23 127,40
Abril - 108,18 118,00 128,36
Mayo - 109,05 118,78 129,26
Junio - 109,87 119,58 130,11
Julio 99,57 110,67 120,42 -
Ago~to 100,53 111 ,51 121,31 -
Septiembre 101,48 112,37 122,18 -
Octubre 102,42 113,25 122,99 -
~oviembre 103,33 114, 16 123,76 -
Diciembre 104,26 115,02 124,59 -
EJERCICIOS DE LA SECCIÓN 7 • 551
12
~1 = [1 + ~] 12 - 1 = [1 + 0,008292] - 1 = 1,1042- 1 = 10,42%
mientras que con las tasas intermensuales de las medias móviles de los índices
~1 = [1 + ~] 12
- 1 = [1 + 0,00725t2 - 1 = 1,091- 1 = 9,1%
que está bastante más próxima a la tasa registrada para ese año, que fue del 8,25%.
Por tanto, hay que tener cuidado con el empleo de tasas mensuales cuando existe
estacionalidad, a la hora de perfilar comportamientos a mayor plazo. Lo recomendable,
pues, es un estudio de esta componente previamente.
CAPÍTULO 14 ' r
Estadística
de atributos
555
Bovino 4 495
Ovino 16 238
Caprino 2 403
Porcino 9112
Caballar 266
Mular 377
Asnal 310
Total 33 201
LX. = L y. = 1 + 2 + ... + N = -1 +N
- .N
i ¡ i ¡ 2
y por tanto
N (N _+ _.:_.:.___
1) (2N_ +___:_ (
1 +2N N)2 3
- N
= _..:..._ 1)
_o_-=-----<-- =N
6 N 12
Por otra parte , siendo di = xi - Y¡, y teniendo en cuenta que, en este caso,
x=Y
558 • SECCIÓN 8. ANÁLISIS ESTADÍSTICO DE DATOS ORDINALES Y CATEGÓRICOS
Ld;
i
2
= I<x;
i
-Y/ = L[(x; - x) - (y; - Y)f =
¡
= I<x; - x) + I<Y; - Y) 2 2
- 2 I<x; - x) (y; - y)
i ¡ ¡
de donde
3 3
-N -- N
-+ N - N
- "L.Jd.12
"L.J (X¡ -) (Y; - y- ) -- 12 N3 - N __;_ _
- X 212 ; = 12 2
con lo que este coeficiente de correlación por rangos, que se representa por p.
será
N3
N "d,~
L.J
I<x; - x) (y; -Y) -
_ __ _ _ i_ _
p = i 12 2
~¡:.<x; - x)2 I<Y; - Y)2
l l
es decir,
6Idi2
-1- _____,..:..
i __
P- N3 - N
Y; N (N - 1) (N - 2) [N - (i - 1)] 2
y entonces p = -l.
ESTADfSTICA DE ATRIBUTOS • 559
.....
EJEMPLO
Los rangos de 5 estudiantes según sus calificaciones de Estadística y de Economía son
los siguientes:
. -
·~·
; ~
/,.,.,:, ' .
{
. ... . .
.
.
-
.
--~- ~
. .
--· ····)_" ..
- -
..
- -
- ..
.
~-~~~-~---~: ~ ~: ~--~-~~~:_j~-~~J.:~i. ~--?-._:~·::I
A 1 3 -2 4
B 2 2 o o
e 3 1 2 4
D 4 5 -1 1
E 5 4 1 1
15 15 o 10
Luego
p
= 1 - ~=1-
53 - 5
60
120
=05
'
Atributo A
Modalidades A¡ n.,.
ni! n¡z nlj.. nik
Las distribuciones que se refieren a uno solo de los dos atributos también se
denominan distribuciones marginales. Éstas están reflejadas en la última fila
reseñada para el atributo B, y en la última columna, para el atributo A, de la
tabla de contingencia, de modo que las distribuciones marginales extraídas de
esta tabla son:
k h
A¡
j
¿ni¡
~ 1
= n¡. B¡ L n¡¡
i = 1
= n.¡
A¡ ¿n2i = n2· B2 L:n;2 = n.2
j i
............... ···············
A¡ ¿nii = n.,. B¡ ¿nii = n·i
j i
............... ...............
Ah ¿nhi = nh· B* L:nih = n.k
i
j
De donde se deduce
h k h k
L.. ,. = "n.
"n. L.. =LL •j niJ =N
i = 1 j = 1 i = 1j =1
ESTADÍSTICA DE ATRIBUTOS • 561
A¡
n¡¡ n-¡2 n¡.
(mujer)
Se dice que dos atributos son independientes cuando entre ellos no existe nin-
gún tipo de influencia mutua.
Si tenemos dos atributos A y B con las modalidades (J\; ~) y (B1; B2 ) res-
pectivamente, no hay relación entre ambos atributos si la proporción de ciegos
en las mujeres es la misma que la proporción de ciegos en los varones. Esto es
nll n21
-=-
n¡. n2 •
562 • SECCIÓN 8. ANÁLISIS ESTA DÍSTICO DE DATOS ORDINALES Y CATEGÓRICOS
de donde
.5.!_
fl¡.
n21
=
=
nu + n21
n1. + n2.
n" + n21 =
!!:!_
N
!!:!_
=>
¡
nii=N ~.n.,
n n
n21 = ~ ·1
n2· n1. + n2. N
E igualmente para las otras dos modalidades. Con esto queremos señalar que si
dos atributos, A y B, son estadísticamente independientes, la frecuencia relativa
conjunta será igual al producto de las frecuencias marginales respectivast .
Coeficiente de asociación H
Por tanto, podría obtenerse una primera medida de asociación mediante la dife-
rencia
Con lo que:
si H = O => los atributos son independientes
si H > O => presenta una asociación positiva
si H < O => presenta una asociación negativa.
-nn_ nn
Este coeficiente variará entre 12 ·· · ·z¡ y _!!__1L
N N
Por otra parte, también puede calcularse Ha través de
n n
H=n -~=
u N
~~ + ~2 + n2I + n22
EJEMPLO
De 1 000 conductores de turismos, 734 son hombres y el resto mujeres. De aquéllos,
100 han sufrido algún accidente conduciendo durante un número de horas determinado,
mientras que las mujeres accidentadas fueron 14. Establézcase la tabla de doble entrada
correspondiente y determínese si existe asociación o independencia entre los atributos
«SeXO>>y «tener accidentes».
El valor H = -16,324 indica que existe una disociación o asociación negativa entre
categorías o modalidades mujer y accidentes, según estas observaciones de que se
pone.
n .. = - - vl,j
lJ N
y como
h k h k n. n .
I'Ln~ =IL. ~=N
i=1 }=1 i= 1j = 1 N
resulta finalmente
es decir
2 h k n~
x·=II-+-N
nij i= 1 1 =1
EJEMPLO
En un centro universitario se dispone de tres libros de texto para impartir la asignatura
de Estadística: A, B, C. Se supone que la calidad de los textos influye en las califica-
ciones obtenidas por los alumnos. Para comprobar si tal suposición se ajusta o no a la
realidad, se realiza un experimento consistente en que tres grupos de alumnos estudien
con cada uno de los libros, siendo impartidas las clases por el mismo profesor. Los
resultados fueron
~
Suspenso Aprobado Notable Sobresaliente
Total
(S) (A) (N) (SS)
. ::.:,:
A 10 32 12 40 94
B 14 12 10 30 66
e 8 10 6 16 40
Total 32 54 28 86 200
t Para estudiar con cierta exbaustividad las técnicas estadísticas aplicadas al análisis de datos categóricos,
véase: RUIZ-MAYA, L.; MARTÍN PLIEGO, F.J.; MONTERO, J.M.; URIZ, P.: Análisis estadístico de encues-
tas: Datos cualitativos, Ed. AC, Madrid, 1995.
568 • SECCIÓN 8. ANÁLISIS ESTAD[ST ICO DE DATOS ORDINALES Y CATEGÓRICOS
S A N SS
A 1,69 1,72 0,10 0,0044
B 1,12 1,9 0,06 0,092
e 0,4 0,06 0,03 0,083
x2 = ¿ ¿ (n'.,, - ,n,,..
3 4 )2
= 7,2594.
¡ = tj = 1 nij
Este coeficiente es un número que varía entre O y 1, lo ,que indica que, como está muy
cerca de cero, el nivel de asociación es muy pequeño.
Utilizando el coeficiente de Tschuprow tenemos
x2
-:-:----r=:====:=:==:=:=:7 = o' o1481
J<h - 1)(k - 1) N -.}(3 - 1) ( 4 - 1)
que es algo menor que el coeficiente C, acusando un menor grado de asociación que el
registrado por C.
Ejercicios
DE LA SECCIÓN 8
EJERCICIOS DE LA SECCIÓN 8 • 571
Ejercicio 8. 1
En la tabla siguiente figuran clasificados los países de la CEE-12 según el número
de televisores y de teléfonos por cada 1 000 habitantes en 1983:
Alemania 3 3
Bélgica 6 6
Dinamarca 2 1
España 7 9
Francia 1 4
Grecia 8 lO
Holanda 5 8
Inglaterra 4 5
Irlanda 11 11
Italia 10 7
Luxemburgo 9 2
Portugal 12 12
SOLUCIÓN. La tabla anterior nos proporciona los rangos u órdenes de cada país en
cada una de las dos categorías.
Para medir el grado de asociación entre estos dos indicadores, al ser los datos de
carácter ordinal, podemos utilizar el coeficiente de correlación por rangos de Spear-
man:
6 :¿ d¡2
p = 1- ----:;;-'-
¡--
N3 - N
Rango en el Rango en el
Pafs ... índice de televisores índice de teléfonos d1 = x,- y1
d¡ '~~
X¡ Y;
Alemania 3 3 o o
Bélgica 6 6 o o
Dinamarca 2 1 1 1
España 7 9 -2 4
Francia 1 4 -3 9
Grecia 8 10 -2 4
Holanda 5 8 -3 9
Inglaterra 4 5 -1 1
Irlanda 11 11 o o
Italia 10 7 3 9
Luxemburgo 9 2 7 49
Portugal 12 12 o o
o 86
tendremos que
6. 86
p = 1- 3
12 - 12
= 1- o. 30 = o. 70
que, como está más próximo a la unidad que a cero, muestra correlación ordinal entre
estos dos indicadores.
Ejercicio 8. 2
En una prueba de maratón, 15 atletas llegan a la meta en este orden (los atletas
llevan un dorsal que va desde ell all5):
7, 4, 2, 3, l, 6, 10, 5, 8, 11, 14, 9, 13, 12 y 15
Hállese el coeficiente de correlación por rangos entre los órdenes de los dorsales y
los de llegada.
lf?{i~f~1i~1~~:E~~~~}r~:~~~;~:;~;~~~::~~~:i~~~:~1i:i
~~;'s~íi:~1t'c.'·t'«c-'il~~~~t\:!:~{,k-,~~.3:~4J:.,,.;4':wi.;,·s:.:;1;,;~
1 7 -6 36
2 4 -2 4
3 2 1 1
4 3 1 1
5 1 4 16
6 6 o o
7 10 -3 9
8 5 3 9
9 8 1 1
10 11 -1 1
11 14 -3 9
12 9 3 9
13 13 o o
14 12 2 4
15 15 o o
o 100
donde d; es la diferencia de los rangos de las dos clasificaciones para cada individuo i-
ésimo:
y comprobamos que
ya que la suma de todos los rangos en cada una de las clasificaciones debe ser la mis-
ma.
Por tanto, el coeficiente de correlación por rangos de Spearman es
6'fA2
p = 1- --:,-:.i_ _
N3 - N
= 1- 6·100
153 - 15
= 1 - 0,179 = 0,821
que, como está cercano a la unidad, nos indica que la asociación entre estas dos clasifi-
caciones es bastante alta.
574 • SECCIÓN 8. ANÁLISIS ESTADÍSTICO DE DATOS ORDINALES Y CATEGÓRICOS
Ejercicio 8. 3
Diez novelistas concurren a un premio de novela, siendo clasificados por tres
jueces en estos órdenes:
1, 6, 5, 10, 3, 2, 8, 7, 9, 4
2, 4, 3, 9, 7, 10, 6, 5, 1, 8
5, 3, 9, 6, 4, 2, 8, 7,. 10, 1
Discútase, utilizando el coeficiente de correlación por rangos, cuál es el par de
jueces que más próximos están en cuanto a sus preferencias.
SOLUCIÓN. Calcularemos los coeficientes de correlación por rangos para cada dos
jueces, para lo cual construimos la siguiente tabla:
l 2 5 -1 1 --4 16 -3 9
6 4 3 2 4 3 9 1 1
5 3 9 2 4 --4 16 -6 36
lO 9 6 1 4 16 3 9
3 7 4 --4 16 -1 1 3 9
2 10 2 -8 64 o o 8 64
8 6 8 2 4 o o -2 4
7 5 7 2 4 o o -2 4
9 1 10 8 64 -1 l -9 81
4 8 1 --4 16 3 9 7 49
o 178 o 68 o 266
6í:di2
p = 1- i
N3 - N
tendremos que
6. 178
P1 2 = 1 - = -O, 079
- 103 - 10
6. 68
P1_ 3 = 1 - = 0,588
990
6. 266
P2-J = 1- = -0,612
990
"'
EJERCICIOS DE LA SECCIÓN 8 • 575
lo cual nos muestra que los jueces 1° y 2 ° son los que tienen criterios menos similares,
y
al estar su coeficiente muy próximo a cero; los jueces 1° 3° son los que tienen crite-
rios más concordantes en su evaluación, mientras que los jueces 2 ° y 3 ° son bastante
discordantes.
Ejercicio 8.4
Dos analistas de inversiones estudian doce peticiones de crédito en un banco. Uno
de ellos fija unas puntuaciones que, de menor a mayor, muestran su preferencia
por clientes a los que considera más idóneos para concederles el crédito; el otro
ordena los expedientes de las peticiones marcando con una letra del abecedario su
orden de preferencias.
El resultado del análisis de estos dos expertos es el siguiente:
¡o 215 e
20 75 G
30 110 B
40 45 L
so 80 F
60 110 J
70 200 A
8o 60 K
90 75 1
10° 150 H
110 180 D
120 20 E
Estúdiese si existe relación entre los criterios de los dos analistas de inversiones.
Así, al valor 110 repetido le corresponderían los rangos 5 y 6, en este caso; el cri-
5 6
terio que ·apuntamos supone asignarle + = 5,5 a cada uno de ellos. De igual ma-
2
8 9
nera, a los valores repetidos 75 y 75 les asignamos el rango + = 8, 5 .
2
Con estas salvedades, para calcular el coeficiente de correlación por rangos de
Spearman formamos la siguiente tabla:
0,0 109,00
y entonces
6"f.dí2
=1- j = 1 - 62. 109 = o 62
p N 3 - N 12 - 12 ' .
Como p = 0,62 está más próximo a la unidad que a cero, podemos aceptar que
existe cierta relación entre los criterios de los dos analistas de inversiones.
Ejercicio 8. 5
De una población de 100 personas, se ha observado que 30 de ellas están en paro.
Los padres de 11 de ,estas 30 personas tampoco tienen empleo. Estúdiese si el paro
. es una situación que sé reproduce dentro de las familias, teniendo en cuenta que de
las 100 personas observadas, 40 tienen padres en desempleo.
EJERCICIOS DE LA SECCIÓN 8 • 577
SOLUCIÓN. En el cuadro siguiente figuran los datos que nos han suministrado.
Encerrados en un círculo aparecen los que nos dan directamente, determinándose el
resto fácilmente por diferencia.
Padres parados ® 29
Padres ocupados 19 41 60
Total 70
Vamos a analizar si existe algún tipo de asociación entre estos caracteres: la situa-
ción de parado-ocupado de un individuo y la situación laboral de su padre.
Para ello determinamos, al tener una tabla de contingencia 2 x 2 , el coeficiente de
asociación H , siendo una de sus formulaciones
Ejercicio 8. 6
Se les pregunta a 500 personas con empleo cuál es, en su opinión, el problema
económico más acuciante en España, obteniéndose el siguiente resultado:
.·
~~::~::.z:~;~,!.~~2~~~r ~:~/ ~i~~7~~~} ~~:~~~¿~·~:;;~f¿
Asalariados 236 86 322
Ejercicio 8. 7
1 000 súbditos de nacionalidad española (E), francesa (F), italiana (1), argentina
(A) y colombiana (C) fueron interrogados acerca de cuáles eran sus deportes
favoritos, obteniéndose los siguientes resultados
~ 'S
Fútbol
E
82
F
67 107
1 A
76
e
16
Total
348
Baloncesto 75 10 16 47 30 178
Tenis 12 23 42 41 40 158
Atletismo 16 20 44 36 22 138
Golf 8 53 30 43 44 178
nij -, nij
i =I j =I nij
EJERCICIOS DE LA SECCIÓN 8 • 579
donde, como sabemos, n~ son las frecuencias teóricas que se determinan bajo la hipó-
tesis de independencia
n.n .
n~. = ___!:____:_!__ Vi;}
" N
La tabla de contingencia correspondiente a estas frecuencias teóricas es
Fútbol 67 60 83 85 53 348
Baloncesto 34 31 43 43 27 178
Tenis 31 27 38 38 24 158
Atletismo 27 24 33 34 20 138
-------------------------
Golf 34 31 42 43 28 178
Total 193 173 239 243 152 1000
donde, por ejemplo, la frecuencia teórica del número de españoles que prefieren el
fútbol sería:
Ahora, para calcular este coeficiente "l, disponemos las frecuencias observadas,
nij , y las teóricas, n~ , debidamente apareadas, en la tabla siguiente:
580 • SECCIÓN 8. ANÁLISIS ESTADÍSTICO DE DATOS ORDINALES Y CATEGÓRICOS
y, por tanto,
x2 = 199,98
que, como es mayor que cero, nos indica la presencia de cierto grado de asociación
entre los dos caracteres.
Para hacernos una mejor idea de cuál es el grado de asociación, empleamos el co-
eficiente de contingencia C de K. Pearson
~
C = ~~=
199,98 =o 41
1 000 + 199,98 ,
que, como está más próximo a cero que al valor ideal 1, nos indica que la asociación
existente no es muy relevante .
EJERCICIOS DE LA SECCIÓN 8 • 581
e*= e =
~(h- 1)/ h
0,41 = 46%
~(5- 1)/ 5
lo que nos muestra que nuestro coeficiente de contingencia, en este caso, sólo supone el
46% del valor máximo de asociación total que podría tomar el coeficiente de contin-
gencia C.
Ejercicio 8.8
Se les pregunta a 50 economistas, 40 ingenieros y 10 abogados si cree que la bolsa
en el próximo mes va a bajar, subir o permanecer igual. El 20% de los economistas
opina que subirá, mientras que el 40% de ellos piensa que bajará; el 50% de los
ingenieros se inclina por que permanecerá igual, y tan sólo el 5% cree que bajará;
por último, la mitad de los abogados se decanta por la subida y la otra mitad cree
que bajará.
¿Existe relación entre los pronósticos sobre la evolución del mercado bursátil y la
profesión del encuestado?
Economista 20 20 10 50
Ingeniero 2 20 18 40
Abogado 5 o 5 10
Total 27 40 33 100
Para medir si existe asociación entre estos dos atributos utilizaremos el coeficiente
de contingencia x2 de K. Pearson:
582 • SECCIÓN 8. ANÁLISIS ESTADISTICO DE DATOS ORDINALES Y CATEGÓRICOS
en donde n~. son las frecuencias teóricas conjuntas, calculadas bajo el supuesto de
lj
~
Permanece
Baja Sube Total
igaal
l
Economista 14 20 : 16 so
'
'
Ingeniero 11 16 ' 13 40
-----------------------
Abogado 2 4 4 JO
Total 27 40 33 lOO
(nij- n/
nü - "ii)2
1
nü nij nü - nij ( 1
llij
"""·,....,..
20 14 -6 36 2,57
2 11 9 81 7,36
5 2 -3 9 4,50
20 20 o o 0,00
20 16 -4 16 1,00
o 4 4 16 4,00
10 16 6 36 2,25
18 13 -5 25 1,92
5 4 -1 1 0,25
100 100 o - 23,85
obteniéndose que x2 = 23,85, que como es mayor que cero, nos revela cierto grado
de asociación entre la profesión del opinante y su pronóstico.
Para obtener un coeficiente relativo que muestre cuál es el grado de asociación,
calculamos el coeficiente de contingencia C de Pearson:
C=M;=
__2_3,_8_5_ = 0,
1 44
100 + 23,85
EJERCICIOS DE LA SECCIÓN 8 • 583
que, al estar más próximo a cero que al valor' ideal 1, indica que el grado de asociación
no es demasiado importante.
N ~(h - l)(k - 1)
Ejercicio 8.9
En un barrio de una ciudad se realizó una encuesta sobre la situación laboral de
sus residentes, obteniéndose los siguientes resultados:
h k (n' - n)2
2
X = LL ij , ij
i=t i=t nij
j •.
584 • SECCIÓN 8. ANÁLISIS ESTADfSTICO DE DATOS ORDINALES Y CATEGÓRICOS
en donde d.ij serían las frecuencias que corresponderían a. cada celda si ambos atributos
fueran independientes, es decir, si
n.n.
_::___:j__ Vi;j
N
La tabla de contingencia correspondiente a estas frecuencias teóricas es
Disponiendo ahora de forma apareada las frecuencias observadas, nij, y las teóri-
cas, n~ , en la siguiente tabla:
800,30
= 0,56
1 760 + 800,30
N .j(h - 1) (k - 1)
800,30 = 0,16
1 760 .j(3 - 1) (5 - 1)
que nos muestra que la intensidad de la asociación entre la edad de los encuestados y su
situación laboral no es muy relevante.
Ejercicio 8. 1 O
A un grupo de empresarios se les pregunta su opinión sobre la posibilidad de
exportar a Estados Unidos según el tipo de cambio del euro con el dólar,
obteniéndose las siguientes respuestas:
1
20 32 1 15
Igual 1 67
_____ _i~~ ______(~~~ (15)
34 20 15
Mayor 69
(27) (27) (15)
Total j- 70 70 40 180
h * (n' - n)z
2
X = L: L: ij , ij
i=l i= l nif
16 17 1 1 0,059
20 26 6 36 1,385
34 27 -7 49 1,815
18 17 -1 1 0,059
32 26 -6 36 1,385
20 27 7 49 1,815
10 10 o o 0,000
15 15 o o 0,000
15 15 o o 0,000
2
Como x = 6,518 -:t O, parece que existe cierta asociación entre los tipos de cam-
bio y las exportaciones; no obstante, para medir el grado de asociación empleamos el
coeficiente e de Pearson
e -- --
6,518 = o 19
180 + 6,518 '
que, como está próximo a cero, nos indica que la asociación es muy débil, pudiéndose
mantener la hipótesis de que la evolución de las exportaciones parece asociada más a
otros factores que al tipo de cambio.
EJERCICIOS DE LA SECCIÓN 8 • 587
6,518 = 0,02
180 ~(3 - 1) (3 - 1)