Вы находитесь на странице: 1из 194

JOS M.

CASAS SNCHEZ
Catedrtico de Estadstica Econmica y Empresarial
Universidad de Alcal de Henares. Madrid
Estadstico Facultativo del Estado.
JULIN SANTOS PEAS
INTRODUCCIN
;
A LA ESTADISTICA
PARA ADMINISTRACIN
Y DIRECCIN
DE EMPRESAS
Segunda edicin
EDITORIAL CENTRO DE ESTUDIOS RAMN ARECES, S. A.
Primera edicin: julio 1999
Segunda edicin: julio 2002
Reservados todos los derechos.
Ni la totalidad ni parte de este libro puede reproducirse o
transmitirse por ningn procedimiento electrnico o me-
cnico, incluyendo fotocopia, grabacin magntica, o
cualquier almacenamiento de informacin y sistema de
recuperacin, sin permiso escrito de Editorial Centro de
Estudios Ramn Areces, S. A.
EDITORIAL CENTRO DE ESTUDIOS RAMON ARECES, S. A.
Toms Bretn, 21. 28045 Madrid.
ISBN: 84-8004-522-1
Depsito legal: M. 31.204-2002
Compuesto e impreso por Fernndez Ciudad, S. L.
Catalina Surez, 19. 28007 Madrid
Impreso en Espaa 1 Printed in Spain
A nuestras familias
'------------------------------------------------------------------------------------------------------------------------------------------------------------------------
,
__ L.
;
lndice
PRLOGO ................................................................ 11
CAPTULO l. EL MTODO ESTADSTICO EN LA INTERPRE-
TACIN DE LOS HECHOS ECONMICOS . . . . . . . . . . . . . . . . . . . . 13
l. l. Las ramas de la Estadstica y sus mtodos cientficos . . . . . . . . 13
1.2. La Estadstica Descriptiva y el estudio de los hechos econ-
micos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3. El Clculo de Probablidades como herramienta matemtica
de Inferencia Estadstica. La Estadstica Moderna . . . . . . . . . . . 17
1.4. La Inferencia Estadstica como mtodo de estudio de los he-
chos econmicos ........................... ...................... 18
CAPTULO 2. DISTRIBUCIONES DE FRECUENCIAS UNIDI-
MENSIONALES . . . . .. . . . .. . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . .. . . 21
2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2. Conceptos fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3. Tareas a desarrollar en las grandes etapas de la investigacin
estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4. Construccin numrica y grfica de las distribuciones de fre-
cuencias unidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.1. Distribuciones de frecuencias unidimensionales con los
datos no agrupados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.4.2. Distribuciones de frecuencias unidimensionales con los
datos agrupados en intervalos de clases . . . . . . . . . . . . . . . 43
2.4.3. Representaciones grficas para distribuciones de fre-
cuencias de datos cualitativos .. .. . .. .. .. .. .. .. .. . .. .. .. 47
8 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
2.4.4. Representaciones grficas para distribuciones de fre-
cuencias de datos cuantitativos. . .......... , ............ .
2.5. Medidas de posicin ........................................... .
2.5.1. La media aritmtica .................................... .
2.5.2. La media geomtrica .................................. ..
2.5.3. La media armnica .................................... .
2.5.4. La mediana ............................................. .
2.5.5. La moda ................................................ .
2.5.6. Otras medidas de posicin no centrales: los cuantiles ..
2.6. Momentos .. ' ................................................... .
2.7. Medidas de dispersin ......................................... .
2.8. Medidas de asimetra y curtosis ............................... .
2.9. Medidas de concentracin ..................................... .
Ejercicios .............................................................. .
CAPTULO 3. DISTRIBUCIONES DE FRECUENCIAS BIDI-
MENSIONALES ..................................................... .
3.1. Introduccin .................................................... .
3.2. Tabulacin de variables estadsticas bidimensionales: distribu-
ciones bidimensionales de frecuencias ......................... .
3.2.1. Tablas de correlacin .................................. .
3.2.2. Tablas de contingencia ................................. .
3.3. Dependencia funcional y dependencia estadstica ............ .
3.4. Regresin y correlacin lineal simple ......................... .
3.4.1. La regresin lineal simple ............................ ..
3.4.2. Correlacin lineal simple .............................. .
3.5. Regresin y correlacin lineal mltiple ....................... .
3.5.1. Ajuste de un plano por el mtodo mnimo-cuadrtico
3.5.2. Ajuste de un hiperplano mediante la utilizacin del
lgebra matricial ........................................ .
3.6. Ajustes no lineales por mnimos cuadrados .................. .
3.7. Estudio de la asociacin entre variables cualitativas ........ .
Ejercicios .............................................................. .
CAPTULO 4. NMEROS NDICES
4.1. Introduccin .................................................... .
4.2. Clasificacin de los nmeros ndices ......................... ..
4.3. Propiedades de los nmeros ndices .......................... .
4.4. ndices de precios .............................................. ..
50
61
62
70
73
77
84
90
95
97
102
104
109
121
121
122
122
135
138
145
145
151
160
160
171
179
184
188
201
201
202
203
204
NDICE 9
4.4.1. ndices simples de precios .. . .. .. .. .. .. . .. .. .. . .. .. . .. .. 205
4.5.
4.4.2. ndices complejos de precios sin ponderar . . . . . . . . . . . . 206
4.4.3. ndices complejos de precios ponderados . . . . . . . . . . . . . 208
ndices de cantidades o cunticos .. .. .. . .. . .. .. .. .. .. .. .. .. .. .. 212
4.6. Propiedades que cumplen los ndices complejos y ponderados
de precios y cantidades .. .. .. .. .. .. .. .. . .. .. .. ... .. .. .. .. .. .. .. . 216
4.7. ndices en cadena .. .. .. .. .. . .. .. .. .. . .. .. .. .. . . .. .. . .. .. . . . .. . .. . 217
4.8. Cambio de base en una misma serie de nmeros ndices . . . . 218
4.9. Renovacin y enlace de series de nmeros ndices con distintas
bases . . . . . . . . . . .. . . . . . . . . . . ... . . . . . . . . . . . . . . . . . . . . . .. . . . . .. . . . . . . . . 222
Repercusin y participacin en las variaciones de un ndice . 224
ndices de valor y deflactacin de series econmicas . . . . . . . . . 226
4.10.
4.11.
4.11.1. ndices de valor .. .. .. .. .. . .. .. .. .. .. . .. .. .. .. . .. .. . .. .. 226
4.11.2. Deflactacin de series econmicas .. . .. .. .. .. . .. . .. .. . 227
4.12. ndice de precios de consumo (IPC) .. . .. .. .. . .. .. .. .. .. . .. .. .. 229
4.12.1. Caractersticas principales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
4.12.2. Mtodo de clculo .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . .. 240
4.12.3. Enlace de series. Coeficientes de enlace . . . . . . . . . . . . . . 242
4.13. ndice de precios de consumo armonizado (IPCA) . . . . . . . . . . . 247
4.14. Otros ndices o indicadores de coyuntura elaborados .. .. .. .. 249
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
CAPTULO 5. ESTUDIO CLSICO O DESCRIPTIVO DE LAS
SERIES TEMPORALES ............................................. 261
5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261
5.2. Concepto de serie temporal y definicin de sus componentes. 261
5.3. Determinacin de la tendencia .. .. .. .. .. . .. . .. .. .. .. .. .. .. .. .. .. . 267
5.4. Determinacin de las variaciones estacionales . . . . . . . . . . . . . . . . . . 280
5.5. Determinacin de las variaciones cclicas . . . . . . . . . . . . . . . . . . . . . . . 288
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
CAPTULO 6. FENMENOS ALEATORIOS Y SUCESOS . . . . . . 297
6.1. Introduccin ...................................................... .
6.2. Fenmenos aleatorios ........................................ ' .. .
6.3. Espacio muestra! ................................................. .
6.4. Sucesos ........................................................... .
6.5. Operaciones con sucesos ........................................ .
6.5.1. Propiedades de las operaciones con sucesos .......... ..
6.6. Sucesiones de sucesos ........................................... ..
297
298
299
303
305
313
315
:
1
1
1

11
l)'
i
11
li
1
1
!l
10
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
6.7. lgebra de sucesos ............................. . ..
6.8. Mtodos de enumeracin o conteo ............ ' .
6.8.1. Tablas de doble entrada ................ .
6.8.2. Principio de multiplicacin ............
6.8.3. Diagramas de rbol ................. :
6.8.4. Combinaciones, variaciones y permutaciOnes ........ .
Ejercicios
CAPTULO 7. PROBABILIDAD ..................
7.1. Introduccin ......................................... ....
7.2. Definicin clsica de la probabilidad .......................
7.3. Definicin frecuentista de la probabilidad .................... .
7.4. Interpretacin subjetiva de la probabilidad .................. .
7.5. Defmicin axiomtica de la probabilidad .................... .
7.5.1. Teoremas elementales o consecuencias de los axiomas.
7.6. Probabilidad condicionada .......................... .....
7.6.1. Teorema de la probabilidad compuesta o producto ..
7.6.2. Teorema de la probabilidad total ..................... .
7.6.3. Teorema de. Bayes ...............................
7.7. Independencia de sucesos ..............................
Ejercicios .........................................
BIBLIOGRAFA

317
320
320
321
321
323
325
331
331
332
335
339
341
342
355
361
362
364
366
370
385
Prlogo a la Segunda edicin
El presente libro est planteado para que sirva de texto base para el estudio
de un semestre de Introduccin a la Estad{stica en la Licenciatura de Adminis-
tracin y Direccin de Empresas.
Los captulos 1 y 2 pretenden introducir al lector en el manejo de los datos
numricos, ensearle a organizar los resultados obtenidos de las observaciones
y a sintetizar la informacin con las diferentes medidas de posicin, dispersin,
forma y concentracin. .
En el captulo 3 se proporcionan los instrumentos necesarios para el estu-
dio de las variables estadsticas bidimensionales. Se introducen los conceptos
de tablas de correlacin, contingencia, distribuciones marginales y condicio-
nadas, independencia estadstica, regresin, correlacin, etc.
Dedicamos los captulos 4 y 5 a dar algunos instrumentos que nos permitan
hacer comparaciones y a estudiar la evolucin de magnitudes econmicas y
sociales, introduciendo para ello los nmeros ndices y el estudio de las series
temporales. Tambin dedicamos dos captulos al estudio de los fenmenos alea-
torios y sucesos, as como a los conceptos ms importantes sobre probabilidad.
En esta segunda edicin se ha introducido la nueva unidad monetaria, el
Euro, se ha actualizado todo el captulo de Nmeros ndices, recogiendo la
nueva metodologa del ndice de Precios de Consumo y se ha suprimido la
Aplicacin Informtica IPD para Anlisis Estadsticos.
Por ltimo, deseamos agradecer a nuestros colaboradores, Mariano Ruiz
Espejo y Ana Isabel Zamora Sanz sus ayudas en la redaccin de algunos
ejercicios prcticos y en la correccin de pruebas.
LOS AUTORES
Madrid, julio de 2002
i'
i
li
J:
1
:..
1 =,
1:.
,.
i
1
Captulo 1
El mtodo estadstico
en la interpretacin
de los hechos econmicos
l. l. Las ramas de la estadstica y sus mtodos
cientficos
La Estadstica, en su acepcin ms general, puede considerarse como la
ciencia que estudia las regularidades que se observan en una serie de fen-
menos que pueden expresarse a travs de la informacin numrica. Su propia
evolucin histrica favorece, como veremos, que la percibamos como un con-
junto de cifras, grficos, promedios, etc. En una segunda acepcin la Estads-
tica es un conjunto de mtodos cientficos que nos permiten interpretar la
informacin numrica, elegir muestras representativas para hacer inferencias,
contrastar hiptesis, estimar relaciones causa-efecto y hacer predicciones. La
agrupacin del conjunto de conocimientos que componen a la Estadstica da
origen a tres ramas claramente diferenciadas:
La Estadstica Descriptiva que se estudiar en los prximos cinco captulos.
El Clculo de Probabilidades que se desarrolla en el captulo siete y en
el texto del mismo autor: Estadstica I: Probabilidad y Distribuciones.
La Inferencia Estadstica que se estudia en otra obra, tambin del
mismo autor.
La Estadstica Descriptiva es la que tiene sus races histricas ms pro-
fundas, ya que con una cierta ordenacin y sistemtica fue empleada por las
sociedades humanas ms primitivas. Su mtodo cientfico es el deductivo ya
que plantea un conjunto de datos ordenados y genricos y va extrayendo
conclusiones particulares de los mismos. Va de lo general a lo particular que
es la esencia del mtodo deductivo.
' :r:
i
1:
:
!l
i,:
l!
1:
li
14 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
El Clculo de Probabilidades tambin emplea el mtodo deductivo ya que
en esencia es un razonamiento puramente matemtico. Arra:p.ca con la defi-
nicin de probabilidad a travs de una serie de axiomas de los que se van
deduciendo un conjunto de teoremas. Este conjunto de conocimientos no
constituye en s una rama de la Estadstica si no las herramientas matem-
ticas y modelizadoras en las que se apoyar la Inferencia Estadstica para su
formulacin y desarrollo. El Clculo de Probabilidades empez a formali-
zarse a lo largo de las siglos XVI y XVII tratando de resolver problemas de
juegos de azar y del mundo de la Astronoma.
Por ltimo, sealaremos que la Inferencia Estadstica emplea el mtodo
inductivo basndose en el conjunto de instrumental matemtico-deductivo que
le proporciona el Clculo de Probabilidades. Procede de las observaciones
particulares de una muestra representativa y llega a la induccin de propie-
dades generales para el conjunto del que se extrae la mencionada muestra. La
Inferencia Estadstica es considerada como la Estadstica moderna ya que se
ha desarrollado a lo largo del siglo XX como unin y confluencia de la
Descriptiva y el Clculo de Probabilidades.
Utilizando las anteriores reflexiones podemos concluir que la Estadstica,
en su conjunto, teniendo en cuenta todas sus ramas, emplea el mtodo deductivo
en unas determinadas etapas de su proceso de investigacin y el inductivo en
otras.
De manera muy general podemos decir que las etapas de toda investigacin
estadstica son las siguientes:
t. Definicin de los objetivos que se persiguen con la investigacin
Esta primera fase es fundamental, ya que se definen los parmetros pobla-
cionales que se pretenden investigar. Por ejemplo, supongamos que deseamos
conocer los hogares o familias que tienen ms de un automvil en la Comu-
nidad de Madrid; la poblacin a investigar son todos los hogares de la Co-
munidad y el parmetro poblacional ser la proporcin o porcentaje de los
mismos que tienen ms de un automvil.
2. Recogida de los datos estadsticos para llegar a conocer los parmetros
poblacionales
Existen fundamentalmente dos formas de obtener los datos estadsticos:
Por la ejecucin de una encuesta censal. En el ejemplo de los hogares de
la Comunidad de Madrid consistira en preguntar a todos ellos si p6seen
ms de un automvil. La caracterstica de inters se mide en todos y
cada uno de los elementos de la poblacin. Cuando el estudio estadstico
que se ejecuta es de naturaleza censal no existe ningn problema de
inferencia y el mtodo empleado ser ntegramente deductivo. Los estu-
dios censales son excepcionales ya que tienen un elevado coste y un
perodo largo de ejecucin.
EL MTODO ESTADSTICO EN LA INTERPRETACIN DE LOS HECHOS... 15
Por la ejecucin de una encuesta muestral. Esta segunda alternativa es
la que se utiliza en la investigacin estadstica ya que tiene las enormes
ventajas de un coste econmico reducido, un corto perodo de ejecucin,
en comparacin con los censos, y la calidad de los datos observados
puede controlarse mejor que en stos al ser volmenes ms reducidos.
La caracterstica que se est investigando slo se mide en un subconjunto
de la poblacin, muestra, y los resultados obtenidos se infieren al total
poblacional. El mtodo por tanto es inductivo ya que de lo particular de
la muestra se generaliza al total de la poblacin. Siendo esta la razn
por la que la Inferencia Estadstica adquiere toda su significacin: defi-
nicin de estimadores para los parmetros poblacionales, modelos de
probabilidad que siguen, niveles de confianza en las estimaciones, errores
de muestreo que estamos dispuestos a admitir, tamaos de muestras, etc.
3. Descripcin y estimacin de los parmetros poblacionales
Si se ha. utilizado la investigacin censal nuestro estudio finaliza con la
descripcin de las caractersticas poblacionales a travs de tablas de frecuen-
cias y grficos. Se emplear el mtodo deductivo siguiendo el camino de lo
general a lo particular.
Si se ha utilizado la investigacin muestral hay que considerar dos niveles
de anlisis: el de modelizacin probabilstica del proceso a priori que es
deductivo-inductivo (definicin del modelo y proceso de inferencia) y el de
descripcin de los datos obtenidos o anlisis a posteriori que es descriptivo o
deductivo. Cuando se obtienen los datos de la muestra seleccionada por un
procedimiento probabilstico, ya no tenemos estimadores que siguen una dis-
tribucin o modelo de probabilidad, sino estimaciones o datos concretos que
hay que describir o reducir de forma ordenada de lo general -conjunto de
los datos muestrales- a lo particular. Luego la Estadstica Descriptiva con su
mtodo deductivo interviene cuando tenemos un conjunto de datos a poste-
riori, bien provengan de una investigacin censal, bien de una muestral. Cuan-
do estemos en este ltimo caso, las descripciones de las estimaciones deben
venir acompaadas de sus niveles de confianza y de sus respectivos errores de
muestreo.
1 2 ~ La estadstica descriptiva y el estudio
de los hechos economicos
La utilizacin de la Estadstica en la interpretacin de los hechos econ-
micos, hay que contemplarla a travs de la evolucin histrica de las tres
ramas que venimos considerando: la Estadstica Descriptiva, el Clculo de
11,
!
1'
:
,,
1:
]"
11'
]''
~
!''
JI!
!i
1
1'
,
i.:
.!il
IJ:i ~
;
:.
(
1;
li
l=
ii'
!
1
.
!J'
\
',
1
!i
1'
~ 1
~
!
f
!.:
f
:
;
!.
"
:
!:
16 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Probabilidades y la Inferencia Estadstica. Empecemos por la primera. Es de
todos conocido que los egipcios, chinos, griegos y romanos re.lizaron recuen-
tos descriptivos de su poblacin y riquezas. Tenemos referencias del historia-
dor griego Herodoto (485-425 a. de J.C.) que en el ao 3050 a. de J.C. Egipto
elabor un censo de poblacin y riqueza con objeto de abordar la construc-
cin de las pirmides. Tambin en Egipto Ramss II hizo un censo de tierras
con objeto de establecer una nueva poltica de reparto de las mismas. Siguien-
do el enfoque descriptivo, los griegos y romanos efectuaban recuentos peri-
dicos de sus recursos econmicos y humanos con claros fines tributarios y
militares.
En la Edad Media no se realizan operaciones estadsticas de descripcin
econmica si se exceptan los inventarios de posesiones de la Iglesia. Hay que
esperar al nacimiento de las escuelas mercantilistas de los franceses, alemanes
y anglosajones de los siglos XVI, XVII y XVIII. Las ideas mercantilistas de los
franceses Colbert, Buffon y Condorcet influyen tanto en la escuela alemana
formada por Seckendorff, Coring y Achenwall, como en la inglesa constituida
por Graunt, Petty, Halley, Davenant y King, principalmente.
La preocupacin fundamental de la escuela inglesa eran los datos demo-
grficos. Gramit, a mitad del siglo XVII, se plante la estimacin de la pobla-
cin inglesa que estaba sometida a grandes fluctuaciones por causa de las
epidemias. Obtuvo tasas de mortalidad y de natalidad partiendo de una mues-
tra de la poblacin. A finales del siglo XVII Petty efecta estudios descriptivos
sobre demografa, de rentas y trficos mercantiles.
En los siglos XVIII y XIX se produce un rpido crecimiento de datos
estadsticos inicindose la elaboracin de los . primeros censos oficiales. En
EE.UU. se elaboran censos de poblacin cada diez aos desde 1790; a lo largo
del siglo XIX se crean Oficinas de Estadstica en los principales Estados que
se dedican a elaborar estadsticas de forma peridica sobre temas econmicos.
Tambin, durante el siglo XX la produccin de estadsticas descriptivas ha
seguido una tendencia exponencial debido a la demanda de datos en los
modelos de planificacin y desarrollo econmico.
Vista la evolucin histrica de la Estadstica Descriptiva podemos conluir
con las siguientes reflexiones:
El origen de la palabra Estadstica, en trminos filolgicos, es estadista
que proviene a su vez del latn status. Es la ciencia que contabiliza las
cosas del Estado desde los tiempos ms remotos hasta nuestros das:
recoge, describe y analiZa informacin de cualquier hecho o fenmeno.
Si es del mundo econmico estaremos ante una Estadstica Descriptiva
Econmica.
Es una estadstica econmica que no contiene incertidumbre con lo que
est ausente la probabilidad como medida de aqulla.
EL MTODO ESTADSTICO EN LA INTERPRETACIN DE LOS HECHOS... 17
La Estadstica Descriptiva o Deductiva la debe de dominar tanto el
economista de empresa como el general, ya que le ensea cmo debe
hacer un anlisis primario y bsico de un conjunto de datos que provie-
nen de haber efectuado una investigacin censal o muestral de un deter-
minado fenmeno econmico.
1.3. El clculo de probabilidades como
herramienta matemtica de inferencia
estadstica. La estadstica moderna
Hemos apuntado anteriormente que la base cientfica de la Inferencia
Estadstica es el Clculo de Probabilidades que es una rama de las matem-
ticas que se basa en el razonamiento deductivo. Veremos posteriormente que
la Estadstica Moderna del siglo XX es el resultado de la fusin de la Descrip-
tiva y el Clculo de Probabilidades con lo que es obligado efectuar un breve
desarrollo histrico de ste. El origen del Clculo de Probabilidades est
relacionado con la resolucin de problemas de juegos de azar. Las excavacio-
nes arqueolgicas han demostrado que las culturas primitivas practicaban
juegos de azar cuyos resultados estaban ligados a la voluntad divina. Pero es
a partirdel siglo XVII, con pequeos antecedentes de Cardano (1501-1576) y
Galileo (1564-1642) cuando se empieza a formalizar esta rama de las matem-
ticas.
Los Matemticos Bias Pascal (1623-1662) y Pierre de Fermat (1601-1665)
empiezan con su famosa correspondencia la formalizacin del Clculo de
Probabilidades sobre juegos de azar que les planteaba el conocido jugador
Caballero de Mer. Christian Huygens recopil los trabajos de Fermat y
Pascal apareciendo en 1669 la primera sistematizacin del Clculo de Proba-
bilidades. Espoleados por la contrastacin emprica de las teoras sobre a s t r o ~
noma y fsica siguieron las aportaciones de Jacobo Bernoulli (1654-1705);
Abraham de Moivre (1675-1750); Daniel Bernoulli (1700-1782); Pierre Simon
Laplace (1749-1827); Karl Friedrich Gauss (1777-1855); Simeon Denis Poisson
(1781-1840) y P. Chebychev como grandes impulsores de esta disciplina a lo
largo de los siglos XVIII y XIX. Durante el siglo XX son autores clsicos del
Clculo de Probabilidades Markov, Liapounoff y Kolmogoroff de la escuela
rusa; Borel; Lvy, Lebesgue y Frchet de la francesa.
Durante los siglos XVII, XVIII y XIX el Clculo de Probabilidades se desa-
rrolla desconectado de la Descripcin estadstica de los hechos econmicos si
exceptuamos pequeas interrelaciones efectuadas fundamentalmente por Que-
teleta mediados del siglo XIX. Los matemticos dedicados a los problemas de
la fsica y la astronoma emplean un lenguaje diametralmente opuesto al
utilizado por los estadsticos que describen los hechos econmicos a travs de
18
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
sus tablas, tasas de mortalidad y natalidad, nmeros ndices, etc. La unin de
ambas tendencias se produce a comienzos del siglo XX ,consolidndose a lo
largo del mismo por lo que conocemos como la Inferencia Estadstica aplicada
a la economa, cuyo estudio requiere un conocimiento previo del cuerpo
fundamental del Clculo de Probabilidades ya que nos proporcionar los
instrumentos matemticos necesarios para que, siguiendo la lgica inductiva,
las conclusiones de una muestra las generalicemos a la poblacin a la que
pertenece.
1.4. La inferencia estadstica como mtodo
de estudio de los hechos econmicos
La Inferencia Estadstica tambin se empez a desarrollar a lo largo del
siglo XVIII resolviendo problemas de estimacin y contraste en el mundo de
la astronoma. Combina la observacin de datos (Descriptiva) con la estima-
cin de determinados parmetros de los modelos tericos del Clculo de
Probabilidades. Dentro del desarrollo de la Inferencia hay que considerar tres
corrientes metodolgicas que surgen de las distintas interpretaciones del con-
cepto de probabilidad. En primer lugar hay que considerar la Inferencia
Clsica>> que arranca con Laplace-Gauss con su problemtica de las observa-
ciones astronmicas y culmina con la estimacin y contrastacin de hiptesis
de la Escuela Inglesa en el campo de las ciencias naturales --estudios funda-
mentalmente biolgicos- formada por Karl Pearson (1857-1936), William S.
Gosset (Student) (1876-1937), Ronald A. Fisher (1890-1962) y Jerzy Neyman
(1894-1981). Esta corriente clsica de la Inferencia se apoya en el concepto
frecuencialista de la probabilidad obtenido de la informacin descriptiva mues-
tra! cuando el experimento aleatorio de la investigacin se realiza en las
mismas condiciones un nmero elevado de veces.
Una segunda corriente es la denominada Inferencia Bayesiana. Sus bases
iniciales las formul el matemtico ingls reverendo Thomas Bayes (1702-
1761). La esencia del enfoque bayesiano est en su famoso teorema que com-
bina todo tipo de informacin a priori sobre los distintbs estados de la natu-
raleza con la informacin muestral en sentido clsico para obtener o inferir el
modelo de distribucin a posteriori. A Bayes le siguen los modernos autores
de la probabilidad subjetiva como son los estadsticos .Frank Ramsey, Bruno
de Finetti y Leonard Savage cuyos enfoques son de gran utilidad en el mundo
econmico-empresarial.
La tercera corriente, de enorme aplicacin en el campo econmico-empre- .
sarial, es lo que se conoce como Teora de la Decisin. Su formulacin se debe
al estadstico A. Wald (1902-1950) que aprovecha la inferencia bayesiana com-
binada con la nocin de probabilidad subjetiva aportando el concepto de
EL MTODO ESTADSTICO EN LA INTERPRETACIN DE LOS HECHOS... 19
funcin de prdida en el que se apoya el decisor para cuantificar sus expecta-
tivas y racionalizar el tratamiento de la incertidumbre econmica.
En 1912 Irving Fisher (1867-1947), economista americano conocido por su
dedicacin a la elaboracin de nmeros ndices, inicia un movimiento para
incorporar los mtodos inferenciales conocidos en el mundo de las Ciencias
Naturales al mundo de la economa. En 1930 funda con Charles F. Roos y
Ragnar Frisch la Soci.edad de Econometra con el objetivo de que los econo-
mistas aceptasen que el cuerpo vigente de conocimientos estadsticos prove-
nientes de los campos de la Fsica, Astronoma y Ciencias Naturales, poda
ser aplicado a los datos econmicos.
A lo largo de las siguientes dcadas se ha ido implantado paulatinamente
el enfoque probabilstico en el estudio de los hechos econmicos lo que permite
confrontar los modelos tericos con los datos estadsticos o estudiar el modelo
que mejor se ajusta a los datos empricos disponibles.
No cabe duda que la aparicin y difusin de los potentes ordenadores
personales ha revolucionado la aplicacin y difusin de los mtodos estads-
ticos aplicados a la economa. Existen multitud de aplicaciones de fcil manejo
que permiten dar un tratamiento descriptivo a uri conjunto de datos econ-
micos en un tiempo rcord. En una segunda fase pueden ejecutarse tratamien-
tos multivariantes ms complejos: regresin y correlacin, anlisis factoriales,
anlisis de conglomerados y anlisis discriminantes.
1
1
i
):
1
1 ;
!
1
j.
!t.
'1;
1
V
1
J.
.i
,
il
1
!1':
: :

!!
i,'
!,
J.:
i!
1
!
1
1
li .
: .,
:
1 :
:;
1 i'
1
' :
!
1
1
'1
!
!

'
1
l
j
j
l
l
1

j
l
Captulo 2
Distribuciones de frecuencias.
unidimensionales
2.1. Introduccin
En este captulo iniciamos lo que hemos denominado la Estadstica Des-
criptiva o Deductiva que se ocupa de recopilar, organizar y analizar datos
numricos. El estudio lo iniciamos con la presentacin de una serie de con-
ceptos previos fundamentales que se emplearn constantemente en el desarro-
llo de esta disciplina: poblacin, muestra, atributos, escalas de medicin y va-
riables estadsticas.
En segundo lugar se aborda la explicacin de las distintas tareas que
componen las tres grandes etapas de toda investigacin estadstica: definicin
de objetivos, recogida de los datos y estimacin y descripcin de los parme-
tros poblacionales.
El tercer aspecto que se estudia, centrndonos en la tarea descriptiva de la
etapa denominada anlisis descriptivo primario, es la elaboracin de lo que se
denomina distribucin de frecuencias unidimensionales, tanto en su aspecto
numrico como grfico. En cuarta posicin se analizan de forma global las
distribuciones de frecuencias a travs de sus medidas de posicin: medias,
mediana, moda y cuantiles.
Otras medidas que se introducen, en quinto lugar, en el estudio de las
distribuciones son los denominados momentos potenciales con relacin al ori-
gen y a la media aritmtica. En sexta posicin se abordan las medidas de
dispersin: recorrido, intervalos intercuartlicos, varianza, desviacin tpica,
coeficiente de apertura, recorrido relativo, recorrido semi-intercuartlico y coe-
ficiente de variacin. Le siguen la exposicin de lo que se conoce como
medidas de forma: asimetra y curtosis. Dos distribuciones que tengan la
misma media aritmtica y la misma varianza pueden diferir en la forma de sus
22 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
representaciones grficas, con lo que se llega a un estudio ms profundo con
la utilizacin de las medidas de forma.
Por ltimo se abordan las medidas de concentracin o de desigualdad:
ndice de Gini y Curva de Lorentz. Estas medidas se conciben para medir la
equidad en la distribucin de ciertas caractersticas de contenido econmico:
rentas personales o familiares, salarios, beneficios, etc.
2.2. Conceptos fundamentales
Vamos a exponer de forma sencilla una serie de definiciones que constan-
temente las estaremos empleando en estadstica.
Poblacin. Se entiende por poblacin, universo o colectivo cualquier conjun-
to de personas, objetos, animales, plantas, instituciones o entes en general que
son portadores de una serie de caractersticas que nos interesa estudiar.
Ejemplos de poblaciones:
Las personas que trabajan en la Administracin Central.
Las lavadoras automticas que se han producido en nuestro pas duran-
te 1994.
Los pinos existentes en la Comunidad de Madrid a 31 de diciembre
de 1994.
Los autobuses de la E.M. T. a 30 de junio de 1995.
Las poblaciones estn compuestas de elementos o individuos por lo que
deben de estar definidas con absoluta precisin de forma que siempre se pueda
discernir si un elemento pertenece o no pertenece a la misma. Se clasifican en
finitas o infinitas segn que el nmero de elementos que la componen sea de
una clase u otra. En el mundo econmico y social estaremos casi siempre ante
poblaciones finitas: habitantes de una regin, empresas de un sector, deman-
dantes potenciales o reales de un producto, etc.
Muestra. Llamamos muestra a todo subconjm,1to representativo de la po-
blacin de forma que las conclusiones sacadas en aquella se generalizan a sta.
Las poblaciones se pueden estudiar bien realizando una investigacin exhaus-
tiva de todos sus elementos y entonces diremos que estamos realizando un
censo, o bien, investigando una parte o subconjunto de las mismas y entonces
diremos que estamos realizando un estudio muestra). .
Atributo. Es toda caracterstica poblacional no susceptible de ser medida
numricamente. La observacin de un atnbuto da lugar a distintas modalidades.
Son ejemplos de atributos:
El sexo de una poblacin humana cuyas modalidades son: varn y mujer.
Los colores de un semforo cuyas modalidades son: rojo, verde y amarillo.
La profesin de un conjunto de personas activas.
j
l
!
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 23
Aunque los atributos no son susceptibles de ser medidos numricamente,
sus modalidades pueden relacionarse con lo que se denominan escalas nomi-
nales y ordinales. Las observaciones de las distintas modalidades decimos que
estn en una escala nominal cuando los nmeros que le asignamos slo se
emplean para diferenciar las distintas categoras. Si al ejemplo de los colores
del semforo le asignamos los dgitos 1, 2 y 3, slo cabe la interpretacin de
que el 1 -=f. 2 -=f. 3 sin que se pueda afirmar que uno es superior a otro y sin
que se puedan ordenar. La escala nominal es la forma de medicin ms dbil
y se utiliza slo para clasificar las distintas modalidades de un atributo. No
permiten ninguna relacin de orden ni operaciones aritmticas de suma, resta,
multiplicacin y divisin. La medicin de las caractersticas cualitativas o
atributos tambin admite en ciertos casos lo que se conoce como escalas
ordinales. Se podr emplear la escala ordinal cuando las distintas modalidades
admiten una determinada graduacin u ordenacin. En estudios de mercado
y de opinin se emplean con mucha frecuencia las escalas ordinales. La imagen
de un determinado poltico podr calificarse de: muy mala, mala, regular,
buena y muy buena. Si se le asignan los dgitos 1, 2, 3, 4 y 5 no quiere decir
que la imagen buena sea el doble que la mala, sino que est en un orden
superior. Este tipo de mediciones con escalas ordinales es superior al nominal
ya que adems de clasificar las distintas modalidades permiten ordenarlas,
pero tampoco admite, como en las nominales, las operaciones aritmticas de
suma, resta, multiplicacin y divisin.
Variables. Son las caractersticas poblacionales susceptibles de tomar valo-
res numricos a los que se les pueda aplicar lo- que se conocen como escalas
de intervalos y de razn o proporcin. Las primeras son aquellas que permiten
una unidad de medida con lo que podemos cuantificar numricamente la
distancia existente entre dos observaciones cualesquiera. El orden de esta
escala es superior a las nominales y ordinales ya que adems de clasificar y
ordenar las mediciones permite diferenciar con exactitud unas situaciones de
otras. En el mundo econmico-empresarial tenemos multitud de caractersticas
en las que pueden aplicarse escalas de intervalos: salarios de una empresa,
cualquier tipo de presupuesto, gastos, ventas, etc. Las escalas de proporcin o
razn, adems de las cualidades de las de intervalo, se caracterizan por incor-
porar un punto de origen no arbitrario (un cero verdadero) como puede
ocurrir, con los pesos y las edades de las personas, litros de gasolina en
un depsito, etc. En conclusin podemos decir que las escalas de intervalo
admiten unidades de medida y un origen (cero) arbitrarios y las de razn
adems de la unidad de medida tienen asignado un punto de origen no
arbitrario ya que es un verdadero cero o cero absoluto. En estas escalas s
se permiten las operaciones aritmticas de la suma, resta, multiplicacin Y
divisin.
Las variables estadsticas pueden clasificarse de distintas maneras. Tenien-
24 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
do en cuenta el nmero de caractersticas que estudiamos en los elementos de
una poblacin las variables pueden ser unidimensionales, bidimensionales o
pluridimensionales. Por ejemplo, si en el colectivo o poblacin formado por las
empresas del sector qumico estudiamos slo su volumen de produccin esta-
remos ante una variable unidimensional. Si estudiamos al mismo tiempo la
produccin y el nmero de trabajadores de cada empresa ser bidimensional
(se observan dos caractersticas o variables cuantitativas en los elementos
poblacionales). Las variables tambin pueden ser discretas o continuas segn
tomen un nmero finito o infinito numerable, o bien infinito no numerable de
valores en un determinado intervalo de su campo de variacin.
2.3. Tareas a desarrollar en las grandes etapas
de la investigacin estadstica
En el primer captulo hemos considerado, de forma muy genrica, las tres
grandes etapas que pueden considerarse en toda operacin 'estadstica: defini-
cin de objetivos, recogida de datos y estimacin y descripcin de resultados
finales. En el presente apartado vamos a comentar brevemente las distintas
tareas contenidas en las grandes fases tal y como estn relacionadas en el
grfico 2.1.
En la definicin de objetivos la primera tarea es identificar las caractersticas
cualitativas o cuantitativas que se desean estudiar. Debe existir una necesidad
de realizar la investigacin estadstica explicitando qu datos son los relevantes
para la toma de decisiones. El gobierno de un pas puede tener necesidad de
investigar a travs de una muestra representativa las siguientes caractersticas:
- Altas y bajas de empleados en distintos sectores econmicos por tipo-
loga de contratos (fijos, eventuales, por obra, de .formacin, a tiempo
completo, a tiempo parcial, etc.).
- Evolucin mensual de las ventas del comercio minorista.
- Evolucin del transporte de mercancas por carretera.
Una empresa puede tener la necesidad de conocer:
- El mercado actual de un determinado producto a travs de su volumen
de ventas (caracterstica cuantitativa). ,
- La motivacin fundamental por la que se compra un artculo de una
determinada marca (caracterstica cualitativa) que se consume en los
hogares.
El xito de toda investigacin estadstica se basa en la correcta seleccin
de las caractersticas que se van a analizar de forma que se alcancen los
objetivos que nos hemos propuesto.
'
1
j
'
l
l
j

1
1
1
i
i
j
1
i
1
.
l
J
l
l
1
l

I
1
1
1
1
l

l
1
l
1
:l
j
DISTRlliUCIONES DE FRECUENCIAS UNIDIMENSIONALES
CD Etapa: Definicin de objetivos
Tareas:
Identificacin de caractersticas cualitativas o cuantitativas que
se desean estudiar.
Definicin de la poblacin portadora de las caractersticas a
investigar.
Identificar el marco o listado de unidades poblacionales especifi7
cando sus soportes (magntico, papel, documentos, etc.) y su
accesibilidad.
Decidir si la investigacin va a ser censal o muestral determinan-
do tamao de la muestra y presupuesto necesario.
Especificar el mbito del estudio y la forma de recoger los datos:
entrevistas personales, por correo, por telfono o mixtas.
@ Etapa: Recogida de los datos estadsticos
Tareas:
Diseo del cuestionario.
Diseo muestral de acuerdo con el marco disponible.
Diseo del material auxiliar de la encuesta.
Recogida de los datos.
Tratamiento de los datos.
G) Etapa: Estimacin y descripcin de los parmetros
poblacionales especificados en los objetivos
Tareas:
Anlisis descriptivo primario.
Estimacin de errores muestrales y no muestrales.
Anlisis especiales multivariantes.
GRFICO 2.1. Etapas y tareas de toda investigaci6n estadstica.
25
26 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
La segunda tarea consiste en delimitar con absoluta precisin, sin ningn
tipo de ambigedad, la poblacin en la que podemos estudiar las caracters-
ticas que nos interesan. En el caso de las altas y las bajas en el empleo sern
las empresas que conforman los distintos sectores, en el segundo ejemplo ser
todo el conjunto de establecimientos minoristas (tiendas tradicionales, auto-
servicios, supermercados, hipermercados y grandes almacenes), en el tercer
caso el censo de camiones y furgonetas de distintos tonelajes, en el cuarto caso
las empresas que fabriquen el producto en cuestin y en el quinto ejemplo los
compradores del producto. .
La tercera tarea de la primera etapa es determinar el marco que contiene
a los elementos de la poblacin de nuestro estudio. En los ejemplos anteriores,
y siguiendo el mismo orden establecido los marcos suelen ser: las bases de
datos existentes en soportes magnticos en el Ministerio del Trabajo (altas y
bajas de la Seguridad Social); los censos de establecimientos minoristas elabo-
rados por organismos pblicos o empresas privadas; los ficheros del Ministerio
de Transportes que contengan las licencias de transporte de mercancas vigen-
tes; anuarios de fabricantes por productos y los censos de poblacin elabora-
dos peridicamente por el INE. Los marcos deben estar actualizados y depu-
rados de unidades extraas ya que de ellos se seleccionan de forma aleatoria
las unidades muestrales cuando la investigacin estadstica no es exhaustiva.
En la cuarta tarea se decidir si la investigacin estadstica va a ser ex-
haustiva o, no dependiendo del tamao de la poblacin, las disponibilidades
econmicas, el plazo disponible, etc. Normalmente se acudir a investigaciones
muestrales (no exhaustivas) con lo que se establecern los tamaos muestrales
de acuerdo con los niveles de confianza que se deseen y los errorl::s muestrales
que estemos dispuestos a admitir. Estas ltimas cuestiones que se refieren a la
fiabilidad de la investigacin estn relacionadas con los costes de la misma ya
que a mayor nivel de precisin se requerir una mayor muestra y por tanto,
un mayor presupuesto. Tambin tendremos que establecer el mbito de la
investigacin: nivel municipal, comarcal, regional, nacional, etc., as como la
forma ms adecuada de recoger la informacin: entrevistas personales, por
correo, por telfono o mixtas.
La primera tarea de la segunda etapa (recogida de los datos estadsticos)
es el diseo del cuestionario. Para su elaboracin se parte de todos los antece-
dentes que nos proporciona la primera etapa: caractersticas que mediremos,
unidades que van a facilitar los datos: empresas, perso.nas, organismos, etc., y
forma de recoger los datos: por correo, con agentes entrevistadores o por
telfono. Toda esta serie de antecedentes nos van determinando el formato del
cuestionario y la naturaleza de sus contenidos. Elaborar un cuestionario que
no tenga fallos es una tarea especializada que debe de desarrollar un grupo
de expertos en las materias correspondientes. Aqu nos vamos a limitar a dar
unas directrices para su buena confeccin:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
27
Claridad en el lenguaje utilizado. El nivel cultural de los estrevistados es
heterogneo en la mayora de los casos (se exceptan las encuestas
realizadas a colectivos del mismo nivel cultural: mdicos, abogados, in-
genieros, economistas, etc.) por lo que hay que emplear un lenguaje
sencillo y directo evitando trminos tcnicos que slo son comprensibles
para los especialistas.
Precisin en las preguntas. Deben de ser concretas y cortas con objeto
de obtener respuestas precisas. Un ejemplo de pregunta no concreta es
No piensa Vd. que fuma mucho? El ,trmino mucho es subjetivo y tiene
distinto valor para distintas personas. La pregunta concreta sera
tos cigarrillos fuma V d. diariamente?
No se debe influir en la respuesta. Deben evitarse juicios de valor a la
hora de efectuar las preguntas que condicionan las respuestas. No sera
correcto hacer preguntas del tipo No piensa Vd. que nuestra empresa
da un servicio posventa de gran eficacia? La pregunta correcta sera:
Qu opina Vd. de nuestro servicio posventa?
Deben evitarse las preguntas indiscretas que molestan al entrevistado. Hay
que tener en cuenta que determinadas preguntas pueden molestar al
entrevistado con lo que podemos conseguir que se niegue a contestar a
la totalidad del cuestionario, o bien, que nos den respuestas falseadas.
Est demostrado que no deben de pedirse directamente los ingresos de
una persona ni la edad. Es mucho ms eficaz pedirles que se siten
dentro de una escala previamente establecida. La pregunta Cules son
sus ingresos anuales?, debe de sustituirse ppr: Indique, por favor, dentro
de qu tramo de la siguiente escala se encuentran sus ingresos anuales:
menos de dos millones, entre dos y cuatro o ms de cuatro.
Hay que cuidar el orden de las preguntas. Las preguntas ms sencillas
deben de ir al comienzo del cuestiona#o y las ms complejas o delicadas
al final. Con ello se consigue un mayor grado de respuesta y colabora-
cin por parte del entrevistado ya que una vez que se ha avanzado en
la cumplimentacin es ms difcil que se niegue a seguir contestando
aunque las preguntas sean ms comprometidas.
Las anteriores recomendaciones generales no agotan toda la normativa
existente de cmo deben confeccionarse las preguntas de un cuestionado. Se
ponen a de ejemplo para dejar constancia de que es una tarea compleja
que requiere verdaderos especialistas.
Las preguntas de un cuestionado pueden clasificarse desde mltiples as-
pectos. Si atendemos, por ejemplo, a la libertad de eleccin de respuesta las
preguntas pueden ser:
Abiertas: son aquellas cuya respuesta es totalmente libre para el entre-
vistado. Por ejemplo, a los cabezas de familia podra preguntrseles Qu
28 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
usos les dara V d. a los ordenadores personales en su hogar? Seale todos
los que le parezcan.interesantes. En esta cuestin nos em;ontraremos una
gama variada de respuestas: hacer un inventario de las existencias de
productos alimenticios, hacer un presupuesto por partidas de gastos con
un seguimiento semanal, hacer un listado de productos que se van ago-
tando para responerlos cuando vamos a la compra, confeccionar un
archivo con telfonos y direcciones de nuestras amistades y proveedores,
etc. En este caso el entrevistador anota literalmente las respuestas em-
pleando las mismas palabras del entrevistado.
Cerradas: son aqullas cuyas posibles respuestas estn listadas. El entre-
vistado escoge una o varias respuestas de las que se le presentan. Si
queremos cerrar la pregunta de los usos que se dan a los ordenadores
personales en el hogar sera: Qu usos dara Vd. a un PC en su hogar
de todos los siguientes?: D Para escribir cartas, D Hacer un invetario de
productos no perecederos, D Llevar la contabilidad del hogar, D Como
pasatiempo con videojuegos.
Otros aspectos que permiten clasificar las preguntas son: por el nmero de
respuestas que permiten: dicotmicas (dos respuestas) o de respuesta mltiple;
por la forma de realizarse: directas o indirectas, etc. Un ejemplo de pregunta
dicotmica y directa sera: Es Vd. fumador?: D S, D No.
Como recomendacin final en la elaboracin de un buen cuestionario hay
que hacer constar la absoluta necesidad de someterlo a una prueba piloto o
pretest con objeto de aseguramos su buen funcionamiento antes de proceder
a su edicin.
La segunda tarea que se relaciona en el grfico 2.1, dentro de la segunda
etapa, viene referida al diseo muestral en el supuesto de que la investigacin
estadstica no tenga carcter de exhaustiva. El diseo de muestras proba-
bilsticas, que son las que deben emplearse en toda toma de datos, requieren
el dominio de la Teora del Muestreo en Poblaciones Finitas que es una materia
compleja a la que se dedican cursos completos para obtener un nivel de
conocimientos adecuados. Los tipos de muestreo que se estudian son:
a) Muestreo aleatorio simple (m.a.s.): Es la forma de muestreo ms sen-
cilla. Los elementos de la poblacin objeto de estudio se numeran del 1 hasta
N y se seleccionan n de forma aleatoria (empleando tablas de nmeros alea-
torios) que constituyen una muestra aleatoria sin reemplazamiento (un lnisnio
nmero aleatorio slo aparece una vez) representativa de todo el conjunto. El
diseo tambin puede efectuarse con reemplazamiento (m.a.s.r.).
b) Muestreo estratificado: Es un diseo que se emplea mucho en la prc-
tica ya que permite mejorar la fiabilidad de las estimaciones respecto al m.a.s.
para un mismo tamao n de la muestra. Tambin nos permite obtener esti-
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 29
maciones para cada estrato o subpoblacin en los que hemos dividido la
poblacin objeto de estudio. La estratificacin consiste en dividir la poblacin
en grupos que sean homogneos internamente respecto a la caracterstica que
estemos estudiando y que existan grandes diferencias entre unos y otros estra-
tos. Si, por ejemplo, se desea investigar la renta de los hogares de la Comu-
nidad de Madrid se pueden agrupar en tres estratos o grups: renta baja,
media y alta. El total de la muestra que se emplee puede distribuirse de forma
proporcional a la poblacin de cada estrato o emplear otros criterios que
pueden estudiarse en los manuales de Muestreo de Poblaciones Finitas.
e) Muestreo por conglomerados: Los conglomerados son agrupaciones de
elementos de la poblacin de naturaleza heterognea dentro de ellos respecto
a la caracterstica que estemos estudiando. En el ejemplo de los hogares un
conglomerado debe tener unidades de renta baja, media y alta de forma que
si se efecta un muestreo dentro del mismo se obtenga informacin de los
distintos niveles que pueden alcanzar los ingresos de las unidades familiares.
Se distinguen varios tipos de muestreo por conglomerados: de distintos tama-
os, de tamaos iguales, sin submuestreo, con submuestreo, etc.
d) Muestreo sistemtico: Es una forma muy sencilla de seleccin de la
muestra dada en una poblacin numerada del 1 hasta N. El procedimiento
consiste en las fases siguientes: se divide el tamao de la poblacin N por el
de la muestra n; empleando una tabla de nmeros aleatorios se elige uno que
est -comprendido dentro del cociente dado por el resultado anterior (si
N = 100 y n = 5, N /n = 20, se elige de forma aleatoria un nmero entre 1 y
20) y por ltimo se obtienen los (n - 1) elementos muestrales restantes suman-
do al que se ha elegido de forma aleatoria el resultado del cociente (si en el
ejemplo el aleatorio ha sido 12, el segundo sera 12 + 20 = 32, el tercero sera
32 + 20 = 52, el cuarto 52 + 20 = 72 y el quinto elemento muestra! sera
72 + 20 = 92). Este procedimiento se denomina sistemtico ya que lo nico
que tiene aleatorio es el arranque. El inconveniente de este diseo, igual que
en el muestreo aleatorio simple, es que para utilizarlo es absolutamente nece-
sario tener numerados del 1 al N todos lo elementos de la poblacin. Esta
numeracin tiene que estar hecha al azar para evitar posibles sesgos sistem-
ticos a la hora de medir la caracterstica de inters en nuestro estudio.
e) Muestreo polietpico o complejo: Es el que se aplica en la prctica
cuando se hacen estudios sociales. Los tipos de muestreo que hemos visto
anteriormente no suelen aplicarse en estado puro cuando deseamos medir
caractersticas de unidades de consumo (familias) o de produccin (empresas)
por razones de carencias de marco (inexistencia de soportes que contengan
numerados todos los elementos de la poblacin) o por razones de coste (el
mtodo de seleccin conlleva tal dispersin en la localizacin de las unidades
30 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
de la poblacin que hacen inviable el estudio desde el punto de vista econ-
mico). Por estas tazones en la prctica hay que acudir al polietpico
o complejo.
Veamos esta problemtica con un ejemplo. Supongamos que el Ministerio
de Cultura desea entrevistar a la poblacin espaola mayor de 18 aos para
conocer con qu periodicidad se visitan los museos. Se considera que a nivel
nacional una muestra de 3.000 personas es suficiente. Para seleccionarlas por
un procedimiento puro de m.a.s. podra acudir a la Direccin General de la
Polica y solicitar que de forma aleatoria, utilizando los nmeros del D.N.I.,
se seleccionaran las 3.000 personas con su nombre completo, direccin y dems
datos personales. Estas personas estaran muy dispersas por todo el territorio:
zonas rurales, pueblos pequeos, medianos, capitales de provincia, etc. Habra
que entrevistar a una persona en un pueblo, a otra en una pedana, a dos en
una capital de provincia y as sucesivamente se tendra un perodo largo y
dificultoso en recogida de informacin con costes de desplazamientos y dietas
de los entrevistadores elevadsimos. Tambin es probable que ni el Minis-
terio del Interior ni el Instituto Nacional de Estadstica puedan por Ley
utilizar esa informacin para facilitar la muestra al Ministerio de Cultura.
Luego en este diseo de m.a.s. existen dos graves impedimentos: elevado coste
y no disponibilidad de ficheros de poblacin para seleccionar aleatoriamente
la muestra.
La nica solucin viable suele ser acudir a un muestreo polietpico ejecu-
tando el siguiente diseo muestral complejo: en primer lugar se estratifican
(muestreo estratificado) los ncleos de poblacin por cruce de Comunidades
Autnomas y tamao de hbitat; en segundo lugar (primera etapa de seleccin)
se eligen municipios con probabilidad proporcional a su tamao (muestreo
por conglomerados). En esta etapa los municipios grandes de las capitales de
provincia suelen estar autorrepresentados eligindose de forma aleatoria slo
los medianos y pequeos. Los municipios grandes elegidos en la primera etapa
se vuelven a estratificar (muestreo estratificado) en distritos de naturaleza
homognea respecto a caractersticas socio-econmicas. Se eligen en una se-
gunda etapa de seleccin una serie de estos distritos o manzanas de naturaleza
equivalente a las secciones censales diseados por el INE (muestreo por con-
glomerados). En estas manzanas, elegidas en la segunda etapa hay que hacer
un listado de todas las viviendas que contienen y sobre el mismo elegir me-
diante m.a.s. las viviendas que correspondan. Una vez seleccionadas las vivien-
das, y tambin por un procedimiento de m.a.s. se selecciona las personas
mayores de 18 aos a entrevistar. Estos conglomerados ltimos (manzanas de
viviendas) que se han elegido suelen ser bastante homogneos en cuanto a las
caractersticas socio-econmicas de las personas con lo que se aconseja realizar
en cada uno un mximo de 10 entrevistas.
En el esquema descrito anteriormente se observa que el muestreo que se
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 31
aplica realmente en los estudios socio-econmicos es una mezcla de los distin-
tos tipos de muestreo que se estudian con lo que los diseos reales son
complejos y su puesta en prctica requiere el concurso de verdaderos especia-
listas en la materia.
f) Muestreos no probabilfsticos: Los muestreos que se han comentado de
forma abreviada anteriormente son todos probabilsticos. Todos tienen en
comn que los elementos de la poblacin que entran a formar parte de la
muestra se han obtenido por procedimientos de azar y todos tienen, a priori,
antes de ser seleccionados, una determinada probabilidad de ser elegidos.
Cuando en el proceso de seleccin existan unidades poblacionales que no
tengan probabilidad conocida y utilizada en la seleccin para entrar a formar
parte de la muestra, el muestreo no es probabilstico. Se pueden poner multitud
de ejemplos de muestreos no probabilsticos: un investigador de un laboratorio
toma una muestra de conejillos introduciendo su brazo en una jaula con lo
que slo eligir los que estn a su alcance; el socilogo de una empresa toma
una muestra de empleados para saber su edad cogiendo, segn su criterio
personal, slo las 50 primeras fichas de un montante de 500; a un entrevistador
se le ordena que en una manzana de casas escoja al azar, segn su criterio, a
20 personas para entrevistarlas con la nica condicin de que el 50 % sean
hombres y el 50 % mujeres. Este ltimo ejemplo es lo que se conoce por
muestreo por cuotas que se emplea normalmente en los sondeos de opinin y
estudios de mercado ya que no exige la elaboracin de listados previos de los
elementos que se van a seleccionar. No es probabilstico al no seleccionar
unidades de acuerdo con probabilidades conocidas y preasignadas por el
investigador.
La principal ventaja de utilizar un muestreo no probabilstico por cuotas es
que abarata mucho la recogida de informacin. Tiene el grave inconveniente,
como todos los no probabilsticos, que carecen del rigor cientfico necesario
para estimar los posibles errores muestrales que se comenten al estimar carac-
tersticas poblacionales a travs de subconjuntos muestrales ni se pueden
establecer intervalos de confianza para las estimaciones.
La tercera tarea que se resalta en la segunda etapa del grfico 2.1 es
elaborar el material auxiliar que sea necesario para que la recogida de infor-
macin tenga los menores errores posibles ajenos al muestreo propiamente
dicho: hojas de control del trabajo de campo que contienen listados de direc-
ciones donde hay que hacer las entrevistas, partes de incidencias que puedan
darse en el marco de la investigacin, material de inspeccin, carnet de entre-
vistador, cartas de presentacin, instrucciones generales para cumplimentar los
cuestionarios, etc.
Como cuarta tarea de la segunda etapa aparece la recogida de los datos
propiamente dicha. Es la tarea esencial ya que la calidad de los datos depende
32 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
de su correcto desarrollo mediante el adecuado manejo de sus mltiples fac-
tores: entrenamiento del personal que interviene y modaliqad empleada en la
recogida de los datos (entrevistas personales, por telfono, por correo, etc.).
El personal que interviene suele dividirse en: entrevistadores, jefes de grupo,
inspectores, codificadores, depuradores, grabadores, etc., que estn supervi-
sados por una Direccin de trabajos de campo. En las entrevistas personales
los agentes entrevistadores van provistos de los respectivos cuestionarios
editados en papel. Otra variante que se utiliza actualmente son las entrevistas
personales asistidas por ordenadores porttiles. La entrevista se desarrolla
segn la secuencia que indica el ordenador en su programa de ejecucin que
tambin incorpora controles de inconsistencias, con lo que se obtiene la
informacin de manera instantnea completamente depurada y coherente
envindose por disquette o por mdem a la central de procesamiento. Si se
emplea este moderno procedimiento los entrevistadores tienen que estar
entrenados en el manej de estos costosos equipos, que requieren una inver-
sin inicial considerable, que se ve compensada con el ahorro de grabacin y
validacin necesarias en los cuestionarios tradicionales editados en papel. En
la modalidad de entrevistas telefnicas asistidas por ordenador se emplea el
mismo procedimiento metodolgico indicado anteriormente con la enorme
ventaja que los agentes entrevistadores no tienen que desplazarse con la con-
siguiente reduccin de costes y tiempo invertido.
La ltima tarea de la segunda etapa del proceso de investigacin
estadstica es el adecuado tratamiento de los datos. En el caso de las entrevistas
personales o telefnicas asistidas por ordenadores el tratamiento de la infor-
macin (grabacin y depuracin de inconsistencias) se realiza de forma auto-
mtica. Tras acceder al entrevistado el entrevistador conecta su ordenador y
va ejecutando el programa de la entrevista de forma que automticamente va
detectando las inconsistencias que han sido programadas previamente.
Si la encuesta se ejecuta por un procedimiento clsico (cuestionario editado
en papel y agente entrevistador sin ordenador personal), el tratamiento de la
informacin sigue el proceso siguiente: se agrupan los cuestionarios cumpli-
mentados en la sede central del trabajo estadstico, se codifican las preguntas
que lo exijan, se graban de forma masiva, los ficheros se someten a un pro-
grama de validacin que saca los listados de inconsistencias, se corrigen y, por
ltimo, se almacenan los ficheros completamente depurados listos para some-
terlos al programa de tabulacin.
La tercera y ltima etapa denominada estimacin y descripcin de parme-
tros poblacionales se compone de tres tareas fundamentales: anlisis descriptivo
primario, estimacin de errores y anlisis especiales multivariantes.
Una vez que los datos estn depurados de todo tipo de inconsistencia se
someter a un anlisis descriptivo empleando los mtodos de Estadstica
Descriptiva que se estudian en el presente captulo y el siguiente. Para cada
l
.

L
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 33
una de las variables que se han medido conviene obtener su distribucin de
frecuencias, su representacin grfica, sus medidas de posicin, de dispersin, de
forma, etc. .
Despus de obtener estas primeras descripciones y medidas, cuando el
estudio no es exhaustivo, hay que plantearse el grado de fiabilidad de las
estimaciones a travs del clculo de los errores de muestreo a posteriori. A
priori, en la primera etapa cuando se definen los objetivos de la investigacin,
se ha debido de definir el tamao de la muestra que asegura unos errores
mximos de muestreo para un determinado nivel de fiabilidad. Estas defini-
ciones previas hay que contrastarlas con los clculos de errores muestrales
para los distintos mbitos del estudio y las distintas variables observadas una
vez que tenemos las primeras estimaciones. Tambin hay que tener presente
los errores ajenos al muestreo que hay que tratar de miriimizarlos ya que los
sesgos que introducen en las estimaciones pueden llegar a invalidarlas: cues-
tionarios mal diseados, grabacin de datos deficiente (siempre hay que veri-
ficar con una doble grabacin), validaciones inadecuadas y mala actuacin de
los agentes entrevistadores.
Por ltimo, una vez que se han hecho los estudios descriptivos y de
fiabilidad correspondientes es cuando se pueden plantear los anlisis especiales
multivariantes de los datos: modelos de reduccin de la dimensin (anlisis
factoriales, de componentes principales y correlaciones cannicas); modelos
causales (regresiones de todo tipo y anlisis de la varianza); modelos de agru-
paciones y clasificaciones (anlisis de grupos y discriminante) y modelos din-
micos o de series temporales (estocsticos y no estocsticos); etc. En estos
anlisis especiales es donde se puede plantear la modelizacin estadstica en su
mximo nivel: postulado del modelo, contraste de las hiptesis iniciales del
modelo, de los parmetros del modelo, validacin y resultados finales.
2.4. Construccin numrica y grfica
de las distribuciones de frecuencias
unidimensionales
Una vez que se han precisado los distintos conceptos bsicos que se
emplean en la elaboracin de datos estadsticos, pasamos a analizar el proceso
de elaboracin de lo que se llama en la Estadstica Descriptiva distribuciones
de frecuencias unidimensionales. Son unidimensionales porque slo observamos
una caracterstica (sus valores pueden representarse en el espacio de una
dimensin) en los elementos de una poblacin (investigacin censal) o de una
muestra (encuesta muestra!). Existen dos tipos fundamentales de distribuciones
de frecuencia: las de valores de la variable o datos no agrupados y las de datos
agrupados en intervalos de clases.
34 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
2.4. l. Distribuciones de frecuencias
unidimensionales con los datos
no agrupados
Designemos con X la caracterstica (puede ser una variable o un atributo)
que deseamos observar en los elementos de una poblacin o de una muestra.
Realicemos el siguiente proceso: se observan los distintos valores o modalida-
des de la caracterstica; si es una variable que admite ordenacin se ordena de
menor a mayor y como puede haber valores que se repitan se agrupan todos
ellos. Si el valor o dato X; se repite n; veces a ste se le denomina frecuencia
absoluta de dicho valor. Al proceso que hemos descrito se le denomina tabula-
cin de datos y cuando se culmina se obtiene un conjunto formado por valores
ordenados de menor a mayor (caso de variables que admitan este proceso) que
tienen asociados el nmero de veces que han aparecido (n;) que llamamos
distribucin de frecuencias unidimensional de datos o valores no agrupados.
Pueden darse dos tipos de distribuciones de frecuencias qe datos no agru-
pados: las que no tienen valores repetidos o de frecuencias unitarias y las que
tienen valores repetidos y por tant<;>, alguna o algunas de sus frecuencias no
son unitarias.
Definicin 2.1. Distribucin de frecuencias unitarias.
Llamamos distribucin de frecuencias unidimensional unitaria de la
caracterstica X al conjunto de los r datos distintos y ordenados de
menor a mayor (x
1
, x
2
, ,X;, ... , x,) de forma que ninguno est repetido.
Este tipo de distribuciones surgen cuando la variable X toma pocos valores
y ninguno se repite, con lo que las frecuencias absolutas n; son todas unitarias,
ponderando en el anlisis de la misma forma todos los valores X;. Se presentan
en tablas que tienen la siguiente forma:
TABLA 2.1. Distribuciones de
frecuencias unitarias.
Valores de la variable
X
~
x,
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 35
Puede observarse en la tabla 2.1 que no se expresan las frecuencias abso-
lutas ya que son todas unitarias.
Ejemplo 2.1
Supongamos que las rentas anuales de cinco familias, expresadas en miles
de euros son: 200, 150, 300, 250 y 175. Con esta informacin construir la tabla
de la distribucin de frecuencias.
Solucin:
La tabulacin es inmediata y simple ya que basta con ordenar la variable
de menor a mayor:
T A,BLA 2.2. Distribucin de frecuencias
de la renta de las familias.
150
175
200
250
300
Definicin 2.2. Distribucin de frecuencias unidimensional con los datos no
agrupados.
Llamamos distribucin de frecuencias unidimensional de la caracters-
tica X al conjunto de los r datos distintos, ordenados de menor a mayor,
acompaados de sus respectivas frecuencias absolutas:
X
1
, X
2
, , X, ... , x,
Este tipo de distribuciones se elaboran cuando la caracterstica X toma
pocos valores pero se repiten un gran nmero de veces con lo que las frecuencias
ya no son unitarias. Cada valor X; est ponderado por el nmero de veces que
ha aparecido, representado por su respectiva frecuencia absoluta n;. Los datos
estadsticos se presentan en la Tabla 2.3:
36 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
TABLA 2.3. Distribuciones de frecuencias unidimensional con los datos no agrupados.
Valores de la variable x
1
Frecuencias abslutas n
1
x, n,
Ejemplo 2.2
En una comunidad de vecinos se ha preguntado a las 20 familias que la
componen, el nmero de personas que trabajan en cada una. Las respuestas
han sido recogidas en el siguiente cuadro:
1 o 2 4 1
3 2 o 1 1
1 2 1 1 o
o 1 1 1 2
A partir de esta informacin construir la tabla de la distribucin de fre-
cuencias.
Solucin:
Existen pocos valores de la variable o caracterstica nmero de personas
que trabajan en la familia que la representamos por el smbolo matemtico
X. Estos posibles valores x
1
son: O, 1, 2, 3 y 4 que se repiten un cierto nmero
de veces luego nos conviene calcular las frecuencias absolutas n;. Existen 4
familias en las que trabajan cero personas; trabaja 1 persona en 10 familias; 2
en 4 familias y por ltimo, trabajan 3 y 4 personas en una sola familia respec-
tivamente. La Tabla 2.4 nos da la distribucin de frecuencias de esta situacin.
TABLA 2.4. Distribucin de frecuencias unidimensional con los datos no agrupados del
nmero de personas que trabajan en 20 familias.
X
o
1
2
3
4
4
10
4
1
1
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
37
Vamos a continuacin a establecer nuevos conceptos que aparecen en las
distribuciones de frecuencias.
Definicin 2.3. Total de datos o frecuencia total.
Llamamos total de datos o frecuencia total, y la denotaremos por N
a la suma de todas las frecuencias absolutas n;. O sea:
T
N= In;
i= l
En el ejemplo 2.1, al ser las frecuencias unitarias la columna de las n; ni
aparece con lo que el total de datos ser el nmero de valores de la variable:
N=S.
En el ejemplo 2.2
5
N=
I
n; = 20
i=l
Definicin 2.4. Frecuencia relativa de un determinado valor de la variable X;.
Llamamos frecuencia relativa del valor de la variable X; al cociente
entre la frecuencia absoluta de dicho valor y el nmero total de datos N:
De la definicin anterior se deduce que la suma de las frecuencias relativas,
al ser tantos por uno, debe ser la unidad:
T T n. 1 T 1
I !;= I ~ I n;=-N= 1
i= l i=l N N i=l N
Las frecuencias relativas se pueden expresar tambin en tantos por cien con
la simple multiplicacin 100. ; con lo que expresamos el porcentaje de veces
que aparece el valor X; en el conjunto de todos los datos. En este supuesto la
suma en vez de la unidad ser 100.
38 CASAS-SNCHEZ, J. M. y SANTOS-PEl\IAS, J.
Definicin 2.5. Frecuencia absoluta acumulada ascendente.
,
Llamamos frecuencia absoluta acumulada ascendente N[ de un deter-
minado valor de la variable ordenado (de menor a mayor) X; al nmero
de datos que son menores o iguales a l:
i
N!= " n.
' L., 1
j=1
Luego la Ni contabiliza el nmero de observaciones que existen hasta
llegar al valor X; bajo el supuesto, que es con el que venimos trabajando, de
que los valores estn ordenados de menor a mayor, o sea:
x
1
< x
2
< < x,
Segn la definicin 2.5 podemos escribir que:
Nl = n
1
N1 = Nl + n
2
Ni= Ni_
1
+ n;
NJ=N
Definicin 2.6. Frecuencia absoluta acumulada descendente.
Llamamos frecuencia absoluta acumulada descendente Nt de un de-
terminado valor ordenado X; al nmero de datos que son mayores que l:
r
N ~ " n.
' L., 1
j=i+1
Por tanto la Nt contabiliza los datos que quedan a partir de x; par llegar
al total de observaciones N. Con la definicin 2.6 se establece lo siguiente:
Ni= N- Nl
N ~ N- N1
1
.j
1
l
l
.l
l
.!
1
.1
l
'
j
l
i
1
'J
1
.f
l
l
1
1
j
l
' l

]
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 39
Nt =N- Ni
N ~ = N - NJ = N - N = O
De estas expresiones se deduce que:
Las frecuencias relativas acumuladas tanto ascendentes como descendentes
se definen de forma anloga slo que se suman las Jj en vez de las ni
Verificndose que:
i
Fi = I Jj
j=1
r
Ft = I Jj
j=i+1
Fl = f1
F1=Fl+fz
FJ = 1
Por otro lado las descendentes se van obteniendo de la forma siguiente:
Fi = 1- Fl
F ~ = 1- F1
F ~ =1-FT
' '
F ~ = 1 - FJ = 1 - 1 = O
De las expresiones anteriores tambin se deduce que:
FJ + Ft = 1
40 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Todos estos conceptos dan lugar a la siguiente tabla genrica que nos
representa las diferentes distribuciones de frecuencia en su ms amplio:
TABLA 2.5. Distribuciones de frecuencias con datos no agrupados.
n.
NT N! FT Fl
X n; /=....!.
N
. . . .
n
Nt NI pt pi
X n
f1 =N 1 1 1 1
n2
m
NI pt pi
x2 n2 f2= N 2 2 2
n
NT Nf
pT p+
X n;
j=....!.
' N
1 1 1
NJ=N P! = 1
N
De esta tabla genrica pueden obtenerse las tablas parciales que se deseen
con slo relacionar los valores de la variable x
1
con cualquiera de las frecuen-
cias: tabla de frecuencias absolutas (columnas X y n
1
); tabla de frecuencias
relativas (columnas x
1
y fJ; tabla de frecuencias absolutas acumuladas ascenden-
te (columnas x
1
y NJ) y as sucesivamente.
Ejemplo 2.3
Con los datos del ejemplo 2.1 obtener las distintas tablas de frecuencias
absolutas, relativas, absolutas acumuladas ascendentes, absolutas acumuladas
descendentes, relativas acumuladas ascendentes y relativas acumuladas descen-
dentes.
Soluci6n:
Partiendo de los datos de la tabla 2.2 se van construyendo las distintas
columnas. La primera de las frecuencias absolutas son todas la unidad ya que
no se repite ningn valor. Las frecuencias relativas/; son todas iguales a un
r


1

1
i
1

t:.


,.
!
!
.;
1
1
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 41
quinto. Las acumuladas, tanto ascendentes como descendentes si varan por
propia definicin:
TABLA 2.6. Distribuciones de frecuencias del ejemplo 2.1.
X n; /
NJ
NI
1
Ft
1
F!
1
150 1 1/5 1 4 1/5 4/5
175 1 1/5 2 3 2/5 3/5
200 1 1/5 3 2 3/5 2/5
250 1 1/5 4 1 4/5 1/5
300 1 1/5 5 o 1 o
N=5
Ejemplo 2.4
Con los datos del ejemplo 2.2 obtener las tablas de frecuencias absolutas,
relativas, absolutas acumuladas ascendentes, absolutas acumuladas descenden-
tes, relativas acumuladas ascendentes y relativas acumuladas descendentes.
Soluci6n:
Haciendo operaciones y teniendo en cuenta las defmiciones dadas tenemos:
TABLA 2. 7. Distribuciones de frecuencias absolutas, relativas, absolutas acumuladas as-
. cendentes, absolutas acumuladas descendentes, relativas acumuladas ascen-
dentes y relativas acumuladas descendentes.
X n; /
NJ
N!
1
o 4 4/20 4 16
1 10 10/20 14 6
2 4 4/20 18 2
3 1 1/20 19 1
4 1 1/20 20 o
N=20
As, por ejemplo, para x
3
= 2 se han obtenido:
n
3
4
!
3
=N= 20
3
Fl
4/20
14/20
18/20
19/20
1
N1 = I ni= n
1
+ n
2
+ n
3
= 4 + 10 + 4 = 18
j=l
= N - N1 = 20 - 18 = 2

1
16/20
6/20
2/20
1/20
o
42
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
3 4 10 4 18
F1 = .L Jj = 20 + 20 + 20 = 20
=1
18 2
~ = 1 - F1 = 1 -
20
=
20
y as sucesivamente, para los distintos valores de la variable X;.
Todo lo dicho anteriormente est referido a observaciones de naturaleza
cuantitativa. Si la variable es cualitativa, o sea, nos referimos a un atributo
que toma distintas modalidades, no tiene ningn sentido el calcular frecuencias
acumuladas. La tabla de frecuencias se construye de la forma siguiente: en la
primera columna se describen las distintas modalidades, en la segunda se
registran las frecuencias absolutas y en la tercera las relativas.
TABLA 2.8. Tabla de frecuencias de datos cualitativos.
Modalidades de la
n;
;
caracterstica x
M n n/N
M2 n2 n
2
/N
M; n; njN
M, n, n,/N
N 1
Ejemplo 2.5
En 100 personas mayores de edad se ha observado que 50 son casados, 25
solteros, 15 viudos y lO divorciados. Con los datos anteriores construir la tabla
de frecuencias de la variable cualitativa o atributo denominado estado civil.
TABLA 2.9.
Distribucin de frecuencias del estado civil.
X n;
; ; ~ 100
Casado 50 50/100 50
Viudo 15 15/100 15
Soltero 25 25/100 25
Divorciado . 10 10/100 10
N= 100 1 100
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 43
En este ejemplo las frecuencias relativas tambin se han expresado en
tantos por cien ya que muchas veces se suelen presentar de esta forma en vez
del tanto por uno que venimos calculando.
2.4.2. Distribuciones de frecuencias
unidimensionales con los datos
agrupados en intervalos de clases
Este tipo de distribuciones se elabora cuando el nmero de valores que
puede tomar la caracterstica de inters es muy elevado con lo que es necesario
agruparlos en intervalos de clases. Estos intervalos slo tiene sentido en el caso
de variables cuantitativas en las que se puede aplicar las escalas que llevan
este nombre o las de razn.
La agrupacin de los valores de la caracterstica que se est analizando en
intervalos de clases tiene el inconveniente de producir una prdida de infor-
macin, ya que si sabemos que un dato se encuentra dentro de un determinado
intervalo, no podremos conocer su valor exacto sino slo que se sita dentro
de unos lmites determinados. Esta prdida de informacin se compensa con
una mayor manejabilidad de la distribucin.
Los intervalos pueden construirse con amplitud -diferencia entre el lmite
superior e inferior- constante o variable. Antes de sealar cmo se elaboran
los intervalos vamos a definir lo que se conoce como recorrido o rango de la
variable X en estudio que lo designamos por R:
R = x,- x
1
= mx {x;}- rnn {x;}
i i
supuesto que los datos observados estn ordenados de forma creciente como
hacemos en las caractersticas cuantitativas.
Una vez determinados los datos mximo y mnimo de una variable es-
tadstica (x, y x
1
) podemos agrupar los datos en intervalos del modo siguiente:
siendo L
0
= x
1
y Lk = x,. As, la distribucin agrupada de frecuencias est
determinada por el conjunto de elementos (intervalos, frecuencias) como se
indica en la tabla 2.10; siendo n; la frecuencia absoluta de datos contenidos en .
el intervalo (L;_
1
, LJ.
Llamamos amplitud del intervalo (L
1
_
1
, L;] a la cantidad e;,
c
1
=L;-L;_
1
44
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
verificndose que
k k
Le;= L (L;-L;_
1
)=Lk-L
0
=x,-x1 =R
i=l i= 1
Si la amplitud de todos los intervalos es constante, e igual a e
e = e, (i = 1, 2, ... , k)
entonces
k
L e= ke = R
i=l
de donde la amplitud comn de los intervalos resultara ser:
e=R/k
A efectos operativos, llamamos inarca de clase del intervalo (L;_ 1, LJ a su
punto medio denotado x:
Li-l + L e
X = 2 = Li-1 + 2
puesto que al ser e la amplitud del intervalo,
L = L-1 +e
La tabla de frecuencias con los datos agrupados en intervalos de clases equi-
valente a la tabla 2.5 de valores sin agrupar ser:
TABLA 2.10.
Intervalos
(L;_
1
, LJ
[L
0
, L
1
]
(L
1
, L
2
]
(Lk-2' Lk_]
(Lk-l' LJ
Tabla de frecuencias con los datos agrupados en intervalos de clases.
Marca de
clase (x;)
n;
X n
x2 n2
;
fl
!2
hc-1
h
N!
1
Ni
1
Ni
2
N"
1
N"
,1
N"
2
pi
1
pi
1
pi
2
pi.
k-l
pi
k
P"
1
p!
1
p!
2
Pi-1
p!
k
~ ~
:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 45
Ejemplo 2.6
Un comercio ha abierto sus puertas al pblico durante 25 das de un mes
y ha obtenido las siguientes recaudaciones:
16.500 10.050 12.320 10.000 22.540
7.325 13.800 18.300 14.600 25.000
17.085 19.000 11.900 13.760 15.075
20.210 7.280 21.200 23.090 24.500
15.800 5.000 13.050 21.600 17.700
Dado que la recaudacin mnima, en los 25 das considerados, es de
5.000 y la mxima es de 25.000 podemos denotar por x1 = 5.000 y
x, = x
25
= 25.000. Los r = 25 datos observados pueden recogerse en una tabla
de frecuencias, como hemos visto previamente, o bien, dado que el recorrido
R = x
25
- x
1
= 25.000 - 5.000 = 20.000 y los datos no tienen frecuencia ab-
soluta mayor que 1 en todos los casos, podemos agrupar estos datos de modo
homogneo en cada grupo. Una posibilidad es elegir como amplitud de cada
clase, el valor comn e = R/k =;= 20.000/5 = 4.000; si queremos agrupar los
datos en k = 5 clases.
Otras posibilidades son: si k = 4, e = 5.000
si k= 2, e= 10.000
si k= 10, e= 2.000, etc.
Si la amplitud comn a las 5 clases es 4.000, los intervalos son:
Para i = 1, 2, 3, 4 y 5:
L
0
= x
1
= 5.000
L
1
= L
0
+e= 5.000 + 4.000 = 9.000
L
2
= L
1
+ e = 9.000 + 4.000 = 13.000
L
3
=L
2
+e=17.000
L
4
= L
3
+ e = 21.000
L
5
= x
25
= L
4
+e= 25.000, pues k= 5
Las marcas de clase son:
Lo+ Ll
X =
1 2
5.000 + 9.000
----=7.000
2
9.000 + 13.000
---2-- = 11.000
46 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Lz + L3
x
3
=
2
= 15.000
L4 + Ls
X = = 23000
5 2 o
La tabla agrupada de frecuencias resultar:
Intervalos
[5.000, 9.000]
(9.000, 13.000]
(13.000, 17.000]
(17.000, 21.000]
(21.000, 25.000]
Marca de clase
7.000
11.000
15.000
19.000
23.000
Frecuencias absolutas
3
4
7
5
6
La frecuencia absoluta 3 del intervalo [5.000, 9.000] es debido a los 3 datos:
7.350 ; 7.280 ; 5.000
La amplitud de los intervalos puede no ser comn, y podramos tener
intervalos de diferente amplitud.
Es sencillo advertir que agrupando datos se pierde informacin de la
variable estadstica, aunque se gana en facilidad de uso. La tabla completa de
las distintas frecuencias ser la siguiente:
TABLA 2.11. Tabla de frecuencias con los datos agrupados en intervalos de clases.
(L,_
1
, LJ X n, ;
Nt
1
M
1
pt
1
F"
1
[5.000, 9.000] 7.000 3 3/25 3 22 3/25 22/25
(9.000, 13.000] 11.000 4 4/25 7 18 7/25 18/25
(13.000, 17.000] 15.000 7 7/25 14 11 14/25 11/25
(17.000, 21.000] 19.000 5 5/25 19 6 19/25 6/25
(21.000, 25.000] 23.000 6 6/25 25 o 1 o
N=25 1
Ejemplo 2.7
Una sociedad del sector maderero ha adquirido troncos de cierta variedad
forestal para su posterior transformacin. Al recibirlos, ha decidido clasificar-
los segn tramos de metros cbicos de volumen de madera por unidad. El
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
47
resultado de esta operacin ha sido recogido en la siguiente tabla agrupada
de frecuencias:
Intervalos (en m
3
) Marca de clase (en m
3
) Frecuencias absolutas
[0, 0,25]
(0,25, 0,50]
(0,50, 1]
(1, 2]
(2, 5]
0,125
0,375
0,75
1,5
3,5
1.235
187
50
18
10
1.500
De esta tabla, se observa que las amplitudes de los intervalos de volumen
de madera es creciente, pasando de
c
1
= 0,25- O= 0,25, a
c
2
= 0,50 - 0,25 = 0,25, a
c
3
= 1 - 0,50 = 0,50, a
c
4
= 2 - 1 = 1, hasta
c
5
= 5 - 2 = 3 metros cbicos
Tambin se aprecia que la mercanca es tanto ms frecuente cuanto menor sea
su volumen. La tabla completa de los distintos tipos de frecuencias queda de
la forma siguiente:
TABLA 2.12. Tabla de frecuencias con los datos agrupados en intervalos de clases.
(L;-n LJ X; n; ;
NJ
Ni FJ Ff
.
'
[0, 0,25] 0,125 1.235 1.235/1.500 1.235 265 1.235/1.500 265/1.500
(0,25, 0,50] 0,375 187 187/1.500 1.422 78 1.422/1.500 78/1.500
(0,50, 1] 0,75 50 50/1.500 1.472 28 1.472/1.500 28/1.500
(1, 2] 1,5 18 18/1.500 1.490 10 1.490/1.500 10/1.500
(2, 5] 3,5 10 10/1.500 1.500 o 1 o
1.500
2.4.3. Representaciones grficas para
distribuciones de frecuencias
de datos cualitativos
En la Estadstica Descriptiva las representaciones grficas tienen la ventaja
de que el impacto visual nos proporciona de forma instantnea una visin
global del reparto de los datos observados, pero nunca deben sustituir al
48 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
estudio analtico que es el que nos proporciona las conclusiones definitivas del
fenmeno objeto de estudio. Los distintos tipos de grficos ~ o simplemente
una forma complementaria, nunca sustitutiva, de describir la realidad que nos
interesa. Las figuras ms empleadas para los datos cualitativos son el diagrama
de rectngulos, diagrama de sectores o de pastel, pictogramas y cartogramas.
Las dos primeras se dibujan bajo el principio de proporcionalidad entre las
reas de los rectngulos o sectores y las frecuencias absolutas n; de cada
modalidad del atributo.
Los pictogramas consisten en reflejar las frecuencias de cada modalidad a
travs de dibujos artsticos cuyo tamao tambin guarda proporcionalidad
con las frecuencias absolutas. Por ltimo los cartogramas son una representa-
cin por medio de un mapa que se utiliza cuando las modalidades estn
contenidas en reas geogrficas.
Si la distribucin de frecuencias es unitaria (pocas modalidades y no se
repite ninguna) su representacin grfica carece de inters ya que los rectn-
gulos, los sectores o las figuras de los pictogramas tendran todas el mismo
tamao, al tener todos la unidad por frecuencia absoluta, oon lo que no se
puede realizar ningn anlisis diferenciador de la importancia relativa de cada
modalidad ya que todos tienen el mismo peso o importancia. Ahora bien, si
los datos son los del ejemplo 2.5, con frecuencias no unitarias, podemos
construir los siguientes grficos:
- Diagrama de rectngulos, en donde todos los rectngulos tienen la
misma base y sus reas son proporcionales a las frecuencias absolu-
tas n;. Grfico 2.2.
n
50
40
30
20
10
CASADO VillDO SOLTERO DNORCIADO M
GRFICO 2.2. Diagrama de rectngulos para la caracterstica cualitativa estado civil del
ejemplo 2.5.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 49
Digrama de sectores, en donde el rea de cada sector es proporcional
a la frecuencia de cada modalidad, casados: 50, solteros: 25, viudos: 15
y diverciados: 10. Grfico 2.3.
GRFICO 2.3. Diagrama de sectores o de pastel para la caracterstica cualitativa
estado civil del ejemplo 2.5.
- Pictograma, en donde el tamao de las figuras es proporcional a las
frecuencias de cada modalidad. Grfica 2.4.
CASADOS SOLTEROS VllJDOS DNORCIADOS
GRFICO 2.4. Pictograma para la caracterstica cualitativa estado civil del ejemplo 2.5.
50 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
2.4.4. Representaciones grficas para
distribuciones de frecuencias
de datos cuantitativos
Vamos a estudiar en primer lugar las representaciones grficas de las
distribuciones de frecuencias no agrupadas. Es evidente que no tiene ningn
sentido el efectuar una representacin grfica de la tabla 2.1 ya que al ser las
frecuencias absolutas todas la unidad no nos aportara ninguna informacin
diferenciadora respecto a los distintos valores de la variable. En cambio en la
tabla 2.3 se representa mediante lo que se conoce como diagrama de barras.
La figura se construye utilizando un sistema de ejes cartesianos de forma que
en el eje de abscisas se toman los distintos valores de la variable y en el eje de
ordenadas las frecuencias absolutas. Sobre cada valor de la variable cuantitativa
X (ordenados previamente de menor a mayor) se levanta una barra cuya altura
sea su frecuencia absoluta n. Luego la grfica del diagrama de barras de la ta-
bla 2.3 tendr la forma del grfico 2.5. Anlogamente se puede construir el
diagrama de barras para las frecuencias relativas, y se puede emplear en la misma
figura una doble escala en el eje de ordenadas ya que de unas a otras se pasa
dividiendo por el total de observaciones, siendo as ambas escalas proporcionales.
f n
n
nsT
-------------
o X X3 ------------- Xr X
GRFICO 2.5. Diagrama de barras.
Ejemplo 2.8
Construir el diagrama de barras de la tabla 2.4 del ejemplo 2.2.
Solucin:
En el eje de abscisas del sistema cartesiano se anotan los cinco valores
de la variable: O, 1, 2, 3 y 4. En el de ordenadas se pone la escala de las
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 51
frecuencias absolutas del 1 (mnima) hasta el 10 (mxima). Para x
1
= O se
levanta una barra de altura 4, para x
2
= 1 de 10, para x
3
= 2 de 4, para x
4
= 3
de 1 y para x
5
= 4 de l. El resultado de este proceso de construccin es el
grfico 2.6.
f n
0,50 10
0,45 9
0,40 8
0,35 7
0,30 6
0,25 5
0,20 4
0,15 3
0,10 2
0,05
o
2 3 4 X
GRFICO 2.6. Diagrama de barras de la tabla 2.4 del ejemplo 2.2. (La escala de las
frecuencias relativas, J;, se obtiene dividiendo las absolutas n; por el total
de observaciones que en este caso son N = 20 ).
Con el grfico 2.6 podemos comprobar con gran rapidez y de un solo
vistazo que en la mayora de las familias observadas (50%) slo trabaja una
persona. Esta es la gran ventaja de las representaciones grficas: obtener
conclusiones con el impacto visual de la figura.
Como en las variables cuantitativas s tienen sentido las columnas de las
frecuencias acumuladas, vamos a ver sus representaciones grficas a travs de
las figuras denominadas diagramas acumulativos de frecuencias. Ahora se trata
de representar las columnas NI, N[, Fi y F[ de la tabla 2.5. Las funciones que
las representan tienen forma de escalera ascendente o descendente, segn se
trate de Ni o Fi o bien de N[ o Ff. Se sube o se baja un peldao al pasar de
cada valor de la variable al siguiente. La altura de cada peldao viene deter-
minada por el valor de la frecuencia correspondiente (absoluta o relativa) y
como siempre en el eje de abscisas estn los valores de la variable y en el de
ordenadas las frecuencias acumuladas que corresponden a cada valor. En el
grfico 2.7 se representa el diagrama acumulativo ascendente correspondiente
a las columnas Ni y Fi de la tabla 2.5. Para cada valor de la variable X se
determina el punto (x, ND y desde el mismo se traza una lnea paralela al eje
52 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
de abscisas de trazo continuo hasta la vertical del siguiente punto (x;+
1
, N[+
1
).
Este trazo continuo viene por la izquierda coincidiendo con el,eje de abscisas,
tericamente desde menos infinito, ya que a la izquierda de x
1
(mnimo valor
de la variable) no se puede acumular ninguna frecuencia y no existen los
peldaos de escalera. Justo en x
1
tenemos n
1
= Nl y la altura del peldao
coincide con su valor; de x
1
a x
2
, sin incluir x
2
, no se acumula ninguna
frecuencia con lo que la funcin se mantiene en trazo grueso paralela al eje
de abscisas hasta llegar a x
2
En este punto, al existir la frecuencia absoluta
n
2
que se acumula a Nl dando como resultado N1, hay un nuevo salto de
peldao coincidiendo con el valor x
2
As sucesivamente hasta el ltimo valor
x, en el que la escalera tiene su ltimo peldao de altura n,. A partir de
(x,, N!) la funcin se convierte en una paralela al eje de abscisas, tericamente
hasta ms infinito, ya que cualquier punto x del eje de abscisas con un valor
igual o mayor que x,, la N! = N y la F! = 1, y no se vuelve a acumular ninguna
frecuencia con lo que los peldaos de la escalera desaparecen.
Ft
1 Nt
Ft
r
t
Fr-1
t
Nr-1
:
F!
:t
Nz
Ft Nt
o
----------------------------------.-------..

1 1
1 1
1 1
1 1
1 1
1
1 1 1
1 1 1
1 1 1
[ 1 :
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
X Xz ---------- Xr-1
Xr X
GRFICO 2.7. Diagrama acumulativo de frecuencias ascendente. (La escala de las fre-
cuencias relativas acumuladas ascendentes se obtiene de las N[ dividin-
dolas por el total de datos N).
Ejemplo 2.9
Construir el diagrama acumulativo de frecuencias ascendente,
los datos de la tabla 2.7.
Solucin:
De la tabla 2.7 hay que representar los datos de las columnas N[ y F[ que
son los siguientes:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
X;
o
1
2
3
4
NT
'
4
14
18
19
20
FT
'
4/20 = 0,20
14/20 = 0,70
18/20 = 0,90
19/20 = 0,95
20/20 = 1
53
Los datos anteriores se llevan en forma de escala al eje de ordenadas y los
valores de la variable al eje de abscisas del sistema cartesiano. La curva, como
se indica en l grfico 2.8 viene por la izquierda desde menos infinito hasta
que encuentra el primer valor x
1
=O en el que hay un salto de peldao
n
1
"" Nl = 4; sigue paralela al eje de abscisas a esa altura de 4 ya que no
acumula ninguna frecuencia hasta que llega a x
2
= 1 donde se acumula
n
2
= 10 (nuevo salto de peldao) y pasa otra vez a ser paralela a la altura
total N1 = n1 + n
2
= 4 + 10 = 14. As sucesivamente hasta x
5
= 4 donde se
da el ltimo salto de peldao de altura n
5
= 1 convirtindose en una paralela
hasta ms infinito a la altura total N1 = N = 20 para la escala de NT o la
unidad para F[. '
1
0,95
0,90
0,70
0,20
Nl
20 -------------------------------,..----.....
19 ---------------------- r-------_,
18 --------------...-------j
14
4-1---i
o
2 3 4 X
GRAFrco 2.8. Diagrama acumulativo de frecuencias relativas acumuladas ascendentes.
(La escala de las frecuencias relativas acumuladas ascendentes FT se
obtiene dividiendo la Ni por el total de datos N= 20). '
54 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
El diagrama acumulativo de frecuencias del grfico 2.8 nos indica que, del
total de familias observadas, las que tienen dos personas o menos trabajando,
son 18 que son el 90% del total (dato dado por Ff expresado en porcentajes,
o sea, 100 x FJ) y las que tienen tres o menos son el 95 % de las familias.
La representacin de las columnas N[ y F[ de la tabla 2.5 dara como
resultado el diagrama acumulativo descendente con la forma que se expresa en
el grfico 2.9. La funcin descendente viene tericamente desde menos infinito
a la altura del total de datos N = N ~ para la escala de las frecuen-
cias absolutas y de la unidad para las relativas. Cuando llega a la vertical de
x
1
baja un peldao justo hasta la definicin de Ni =N- Nl con lo que queda
cancelado el punto (x
1
, Ni}. A partir de este punto la funcin descen-
dente es paralela hasta encontrarse con la vertical de x
2
en la que vuelve
a bajar un nuevo peldao hasta N ~ = N - N1. El proceso se repite sucesiva-
mente hasta encontrarnos con la ltima vertical del mximo valor x, en la
que baja el ltimo peldao, pasando al valor cero hasta ms infmito, ya que
N; = N - N ~ = N - N = O, como ya sabemos.
N
1
1
1
1
1
1
1
} }i
F,_ N,_
Ft
o
GRFICO 2.9.
Ejemplo 2.10
1
1
1
1
1
~
: :
l :
-----t------+-------
: :
: :
1 1
1 1
1 1
1 1
: :
-----l------+-------------.:.. --...,
1 1
1 1
1 1
: 1
X X2 ---------- Xr-! X
((Diagrama acumulativo de frecuencias 4escendente. ,
Construir el diagrama acumulativo de frecuencias descendentes utilizando
los datos de las columnas N[ y F[ de la tabla 2.7.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 55
Solucin:
De la tabla 2.7 hay que representar los datos de las columnas N[ y F[ que
junto con los valores de la variable son los siguientes:
X M
'
Ft
'
o 16 16/20 = 0,80
1 6 6/20 = 0,30
2 2 2/20 = 0,10
3 1 1/20 = 0,05
4 o 0/20 = o
En el grfico 2.10 la funcin acumulada descendente viene siendo paralela
al eje de abscisas, tericamente desde menos infinito, ya que para cualquier
punto x del eje de abscisas, inferior al primer valor de la variable x
1
= O, los
superiores al mismo acumulan todas las observaciones o datos que ascienden
a 20. Justo al llegar a la vertical de x
1
=O, que coincide con el eje de orde-
nadas, los valores superiores al mismo acumulan 16 datos u observaciones
obtenindose la
Ni = N - Nl = 20 - 4 = 16
siendo 4 la magnitud del peldao descendente en la mencionada vertical. La
funcin se mantiene paralela hasta que encuentra la vertical de x
2
= 1 donde
vuelve a descender el montante de 14 observaciones con lo que
N ~ = N - N1 = 20 - 14 = 6;
o sea, los datos superiores a x
2
= 1 ascienden a 6 mantenindose esta situacin
hasta x
3
= 2 que pasan a ser 2; x
4
= 3 que son 1 y para valores superiores a
x
5
= 4 no existe ninguna observacin con lo que la funcin coincide con el
eje de abscisas hasta ms infinito. La interpretacin de este diagrama acumu-
lativo de frecuencias descendentes es fcil empleando la escala de F[: el 80 %
(Fi x 100) de las familias observadas tienen alguna persona trabajando, el
30% tiene ms de una persona trabajando, ellO% tiene ms de dos personas
trabajando, el 5% ms de tres y no hay ninguna familia que tenga ms de
cuatro personas trabajando. Est claro que la informacin que suministran los
grficos 2.8 y 2.10 es complementaria ya que como sabemos
N[+ N[= N.
56 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Luego si el 80% de las familias observadas tienen alguna persona trabajando,
un 20 % no tienen ninguna, si un 30 % tienen ms de una, un 7.0 % tiene una
o ninguna y as sucesivamente; basta con observar las escalas F[ multiplicadas
por 100, o sea, expresadas en porcentajes.
0,80 16 +----.
0,30
0,10
0,05
6 r ~ .
1
1
1
1
1
2 -------+------- ! 1
1 -------T---------------r------,
o 2 3 4 X
GRFICO 2.10. Diagrama acumulativo de frecuencias descendente.
Por ltimo, vamos a estudiar las representaciones grficas de las distribu-
ciones de frecuencias agrupadas en intervalos de clases. Las tablas del tipo 2.10
se representan a travs de los llamados histogramas de frecuencias que tienen
la forma expresada en el grfico 2.11. Como los valores de la variable estn
ahora agrupados en intervalos se levanta un rectngulo cuya base es la am-
plitud de aqullos. En cada intervalo (L;_
1
, L;] de los definidos en la tabla
2.10 se levanta desde el eje de abscisas un rectngulo que, con dicha base (L;_
1
,
L;), llegue a la altura njc; sobre el eje de ordenadas. De este modo el rea del
rectngulo es proporcional o coincide con n;:
r
n.
ea(i) =base altura= e;....!.= n; (i = 1, 2, ... , k)
C;
Si todos los intervalos tienen la misma amplitud, las alturas de los rectn-
gulos sern las correspondientes frecuencias. A las alturas de cada rectngulo
n)c; se le denomina densidad de frecuencia del intervalo i-simo.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
57
n/c
n3/c3
n2/c2
nJ!ck
nlc
o
Lo
L
L?. ~ Lk-1 Lk Extremos de intervalos
GRFICO 2.11. H stograma de frecuencias.
Ejemplo 2.11
Elaborar el histograma de frecuencias de los datos de la tabla 2.11.
Soluci6n:
Para elaborar el histograma slo nos interesan los datos de las columnas
(L;- 1, L;] y n; de la tabla 2.11 que son los siguientes:
(L;-
1
, L;] n;
[ 5.000, 9.000] 3
( 9.000, 13.000] 4
(13.000, 17.000] 7
(17.000, 21.000] 5
(21.000, 25.000] 6
Lo primero que hay que observar es si la amplitud de los intervalos es
constante o es variable. En este caso es constante e = 4.000; luego las alturas
de los rectngulos del grfico 2.12 son directamente las frecuencias llevadas a
la escala de ordenadas.
58
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
f n
0,28 7
0,24 6
0,20 5
0,16 4 +-------------------
0,12 3 +--------
o 5.000 9.000 13.000 17.000 21.000 25.000
X
GRFICO 2.12. Histograma de frecuencias de los datos de la tabla 2.1 l. (La escala de
las frecuencias relativas se obtiene dividiendo las absolutas n, por el total
de observaciones N = 25 ).
Ejemplo 2.12
Los ingresos anuales de 50 familias expresados en miles de euros, y agru-
pados en intervalos de clases son los siguientes:
(L;_
1
, L;]
[ 40, 100]
(100, 200]
(200, 500]
(500, 1.000]
Elaborar su histograma de frecuencias.
Solucn:
10
20
15
5
Se observa que la amplitud de los intervalos es variable; luego hay que
calcular las alturas de los rectngulos h; = njc; como se indica en la tabla 2.13
con objeto de construir el grfico 2.13.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 59
TABLA 2.13. Clculo de densidades de frecuencias h,.
(L;-, LJ n; C h=!!!
l
C
- [ 40, 100] 10 60 0,17
(100, 200] 20 100 0,20
(200, 500] 15 300 0,05
(500, 1.000] 5 500 0,01
h
1.000 X
GRFICO 2.13. Histograma de frecuencias cuando la amplitud de los intervalos es va-
riable.
En la construccin de los histogramas han intervenido las frecuencias
absolutas o relativas, pero sin acumular. Como estamos tratando variables
cuantitativas hay que representar grficamente las frecuencias acumuladas (N-
y F;) que en el caso de distribuciones agrupadas reciben el nombre de
acumulativos de Vam?s a representar slo las columnas NJ y FJ
la tabla gennca 2.10. En el eJe de abscisas se expresan los limites de los
Intervalos y en el de las ordenadas la NJ y FJ tal y como se representa en el
grfico 2.14.
Puede observarse que el pogono acumulativo se obtiene uniendo median-
te rectas cada par consecutivo de los siguientes valores:
t
60 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
t
f
Nk ----------
t
Fk-!
t
Nk-:-1
Ft
: t
N2
Ft
t
N
o
L --------- Lk-! Lk L
GRAFICO 2.14. Polgono acumulativo de frecuencias ascenqentes.
El polgono acumulativo descendente puede tambin a.
de los datos de las columnas Nf y F[ uniendo los puntos consecutivos sigUien-
tes mediante segmentos:
Ejemplo 2.13
Construir el polgono acumulativo de frecuencias ascendentes y descenden-
tes con los datos de la tabla 2.11.
Soluci6n:
De la tabla 2.11 obtenemos los datos de las columnas NJ, FJ, N[ Y Ff que
son los siguientes:
(L;-, LJ
[ 5.000, 9.000]
( 9.000, 13.000]
(13.000, 17.000]
(17.000, 21.000]
(21.000, 25.000]
NT
'
3
7
14
19
25
FT
'
3/25 = 0,12
7/25 = 0,28
14/25 = 0,56
19/25 = 0,76
25/25 = 1
22
18
11
6
o
F+
'
. 22/25 =
18/25 = 0,72
11/25 = 0,44
6/25 = 0,24
o
El grfico 2.15 se construye uniendo, para la escala de NJ, los puntos
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
61
.-_y
>siguientes mediante segmentos: (5.000, 0), (9.000, 3), (13.000, 7), (17.000, 14),
. (21.000, 19) Y (25.000, 25). A partir del ltimo punto la funcin es paralela al
. eje de abscisas.
Si se emplea la escala de FJ el polgono es idntico slo que en ordenadas
se reduce el tamao 25 veces que son el total de observaciones para las que
se han dividido las Ni para obtener las FJ. Luego basta con poner la escala
de F[ en el eje de ordenadas aliado de NJ como se indica en el grfico 2.15.
2.5. Medidas de posicin
Cuando disponemos de una distribucin de frecuencias asociada a cierta
variable estadstica, sta puede ser resumida o reducida por unas medidas que
dan una idea global de cmo es la distribucin sin tener que recordar todos
los datos con sus frecuencias absolutas o relativas.
Entre estas niedidas se encuentran las de posicin que sitan la distribucin
entorno a dichos parmetros, dando una idea de en qu valores se distribuye
la variable estadstica.
t
N
25 ----------------------------------------------..,----___, ....
0,76 19 --------------------------------------
0,56 14
0,28 7
0,12 3
o
5.000 9.000 13.000 17.000 21.000 25.000
L
GRAFICO 2.15. Polgono acumulativo de frecuencias.
La mayora de las medidas de posicin son nmeros que se obtienen por
operaciones aritmticas una vez que se han ordenado los valores de la variable.
Slo tienen sentido en el caso de datos cuantitativos si exceptuamos lo que
62 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
llamaremos moda que s puede obtenerse y tiene pleno sentido en el estudio
de caractersticas cualitativas o atributos. ,
En el estudio de las medidas de posicin trabajaremos con distribuciones
de frecuencias de tipo unitario, de datos no agrupados (valores observados
junto con sus frecuencias absolutas) y con datos agrupados en intervalos de
clases (considerando las marcas de clase y sus frecuencias absolutas). Estudia-
remos la media aritmtica, la media geomtrica, la media armnica, la mediana,
la moda y los cuantiles.
2.5. l. La media aritmtica
El concepto de media aritmtica de una distribucin de frecuencias es uno
de los ms importantes en la descripcin de datos al ser el ms usado cuando
representamos al conjunto de la distribucin por una sola medida de posicin
central. Se debe utilizar, ya que lo exige su propia definicin,. cuando los datos
observados son de naturaleza aditiva (rentas, salarios, beneficios, pesos, esta-
turas, puntos, etc.) de tal forma que una suma representa el total de los
recursos repartidos entre todos los elementos de la distribucin.
Definicin 2.7. Media aritmtica.
Llamamos media aritmtica a la suma de todos los valores de la
distribucin dividida por el nmero total de observaciones.
Para las distribuciones de tipo unitario ser:
_ x
1
+ x
2
+ .. + x, _ 1 ~
X= -- L. X
N N i=1
[2.1]
Para las distribuciones no unitarias tanto agrupadas como no agru-
padas:
_ x
1
n
1
+ x
2
n
2
+ ... + x,n,
x=
N
1 r
I xn;
N i=1
[ ~ 2 ]
En las no agrupadas los X; son los valores de la variable estadstica
directamente observados y en las agrupadas en intervalos de clase son
lo que hemos denominado marcas de clase.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
63
Ejemplo 2.14
Obtener la media aritmtica de la distribucin de tipo unitario referidas a
las rentas anuales de cinco familias expresadas en miles de euros, contenida en
la tabla 2.2. Los datos de dicha tabla son:
Solucin:
X
150
175
200
250
300
- 150 + 175 + 200 + 250 + 300 1.075
x= =--= 215
5 5
La media aritmtica de las rentas anuales es de 215.000 euros y nos
representa al conjunto de los cinco valores de la distribucin.
Ejemplo 2.15
Obtener la media aritmtica de la distribucin de frecuencias no agrupada
del nmero de personas que trabajan en 20 familias contenida en la tabla 2.4
cuyos datos son:
X n;
o 4
1 10
2 4
3 1
4 1
Solucin:
- 1
4
. 1 1 5
x = N I X;n; =- (O 4 + 110 + 2 4 + 3 1 + 4. 1) = -. 25 = - ~ 1
i=O 20 20 4
Por trmino medio trabaja aproximadamente una persona por familia ya
que al ser una variable cuantitativa de naturaleza discreta (no admite deci-
males) la solucin se expresa en nmeros enteros de forma aproximada.
64 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ejemplo 2.16
Obtener la media aritmtica de la distribucin de frecuencias agrupada de
las recaudaciones diarias de un comercio expresadas en la tabla 2.11. De dicha
tabla las columnas que necesitamos son la de las marcas de clase X; y la de
las frecuencias absolutas que son:
X n;
7.000 3
11.000 4
15.000 7
19.000 5
23.000 6
Solucin:
1 .
.X=
25
(7.000 3 + 11.000 4 + 15.000 7 + 19.000 5 + 23.000 6) =
1.000
= ""'25 (21 + 44 + 105 + 95 + 138) = 40.403 = 16.120
Hay que resaltar que la media aritmtica viene expresada en las mismas
unidades de medida que los datos originales observados. En el caso de las
distribuciones agrupadas en intervalos de clases la media la obtenemos utili-
zando las marcas de clases, ya que los valores observados son desconocidos,
con lo que difiere de la que podra obtenerse si se utilizaran los valores no
agrupados. En este caso se trabaja bajo la hiptesis de que los valores obser-
vados se distribuyen dentro de cada intervalo de forma uniforme con lo que
su punto medio (marca de clase) es representativo de todo el conjunto.
La expresin [2.1] se conoce con el nombre de media aritmtica simple ya
que al ser las frecuencias unitarias todos los valores de la variable tienen la
misma importancia o peso a la hora de calcular .X. Por el contrario, la expre-
sin [2.2] recibe el nombre de media aritmtica ponderada ya que cada X;
aparece ponderado o multiplicado por su respectiva frecuencia absoluta n; que
al ser distinta de la unidad da distinta importancia o relevancia a cada X.
Existen otras formas de ponderar que son distintas a las frecuencias absolutas
n. Estas situaciones aparecen cuando en distribuciones de tipo unitario, en las
correspondientes expresiones del tipo [2.1] se introducen unos coeficientes de
ponderacin denominados w; que son distintos de n; con lo que la media
aritmtica ponderada sera:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
I XW
.X = .:___; =-=1'------
r
I W
i= 1
65
[2.3]
Puede observarse en la expresin [2.3] que los w hacen la misma funcin
que las n; de la frmula [2.2], ya que como sabemos
r
N= In;
i= 1
Estos coeficientes de ponderacin son valores positivos que representan el
nmero de veces que un valor de la variable es ms representativo o ms
importante que otro en el que su correspondiente w sea la unidad.
Ejemplo 2.17
El examen final de una asignatura punta el doble que los exmenes
parciales. Un alumno ha obtenido las siguientes calificaciones: primer parcial
no liberatorio 5 puntos sobre 10; el segundo 9 y el examen final 6. Obtener
su nota media a final de curso.
Solucin:
Al tener distinta importancia o peso las distintas calificaciones la media
que nos piden como calificacin final es una media aritmtica ponderada:
Calificaciones Coeficientes de ponderacin
X W
5 1
9 1
6 2
5. 1 + 9 . 1 + 6. 2 26
.X=
4
= 4 = 6,5
Obsrvese que los w establecidos slo indican la importancia de cada valor
de la variable y slo son nmeros reales positivos. Al mismo resultado llega-
mos si los w son w = 2, 2, 4, ya que:
5 . 2 + 9 . 2 + 6 . 4 52
.x =
8
=
8
= 6,s
66 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
La nica condicin que exige el problema es que w
3
(peso del examen final)
sea el doble que w
1
y w
2
(pesos de los exmenes parciales}.
Propiedades de la media aritmtica
I. Si a la variable estadstica X; la sometemos al mismo tiempo a un
cambio de origen Ot y a un cambio de escala e mediante la trans-
formacin:
x- ot
Y; = -e- (siendo Ot y e constantes) [2.4]
entonces resulta que
[2.5]
Demostracin:
De la expresin [2.4] se deduce que
x = ey + ot
Sustituyendo X; en la frmula de la media aritmtica. para el caso de
distribuciones no unitarias (sin agrupar o agrupadas) ya que la demostracin
es idntica en las unitarias:
r r
y,.n,. n,.
1 r 1 r .L. L.,
x =- x;n; =- (ey + ot)n; = e '--'=-=
1
-- + ot i=Nl = ey + ot
N i=l N i=l N
Esta propiedad nos manifiesta que la media aritmtica es sensible a los
cambios de origen o de escala. Si e= 1 entonces x =y+ ot y diremos que
se ha realizado un cambio de origen. Esta operacin se realiza para facilitar
los clculos y se toma como Origen de trabajo Ot el valor central de la
distribucin en el caso de ser impares o uno de los centrales si son pares. As
en la distribucin del ejemplo 2.15 se tomara como origen de trabajo Ot = 2
transformando X; en Y; de la forma siguiente:
X Y;= X- 2 n;
o -2 4
1 -1 10
2 o 4
3 1 1
4 2 1
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
- 1 1 3
y= 20 [(- 2) 4 + ( -1)10 +o. 4 + 11 + 21] =- ( -15) = --
20 4
x=y+O = -
3
+
8
=2
t 4 4 4
67
Si Ot = O la [2.5] se transforma en x = ey y diremos que se ha
efectuado un cambiO de escala en la variable X. Esta operacin se suele
efectuar tambin para facilitar los clculos cuando los valores observados
0
las de distribuciones agrupadas) son muy elevados y tienen
un mx1mo comund1v1sor. En los datos del ejemplo 2.16 el cambio de escala
podra ser e = 1.000 quedando
X
- X
Y;- 1.000
n;
7.000
7
3
11.000
11
4
15.000
15
7
19.000
19
5
23.000
23
6
1
y= 25 (7. 3 + 11 4 + 15.7 + 19.5 + 23. 6) =
1 403
= 25 (21 + 44 + 105 + 95 + 138) = 25 = 16,12
x = ey = 1.000 16,12 = 16.120
. Si en la distribucin anterior hacemos al mismo tiempo un cambio de
ongen Y escala, que es lo que nos dice la expresin [2.5] de la propiedad r
tendremos que, por ejemplo, si ot = 15.000, e= 4.000: '
X
x- ot
y=--e-
n;
7.000 -2
3
11.000 -1
4
15.000
o
7
19.000
1
5
23.000
2
6
1
y = 25 [(- 2). 3 + (- 1) . 4 + o. 7 + 1 . 5 + 2 . 6] = 2
25
68
CASAS-SNCHEZ, J. M. y J.
de donde
7 '
.X = e y + Ot = 4.000
25
+ 15.000 = 16.120
11. La suma de las desviaciones . de los valores o datos a su media
aritmtica es cero:
Demostraci6n:
En efecto:
r r
(x; - x)n =
ya que como
i=l
1 r
.X=- L x;n;
N i=l
i=l
r
(x; - x)n; = o [2.6]
i=l
r
" n. = .XN - .XN = O
L., '
i=l
r r
.XN = L xn; y L n;=N
i=l i=l
111. La suma de los cuadrados de las desviaciones de los valores obser-
vados unitarios respecto a una constante arbitraria e es mnima
cuando esa constante e coincide con la media aritmtica .X:
N
S(C) = L (x;- C)2 [2.7]
i=l
mnimo cuando e = .X.
Demostraci6n:
Como sabemos para obtener el mnimo de la expresin S(C) se halla su
primera derivada y se iguala a cero. La condicin suficiente es que la sgunda
derivada sea positiva. En efecto:
dS(e)
(
N )
d L (x; - e)2 N .
i=
1
= 2 L _(x- C)( -1) =O
de i=1 de
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Dividiendo por dos y desarrollando el parntesis:
N
LX= Ne
i= 1
e=.x \
La segunda derivada es:
d2S(C) N
de2 = 2 L ( -1)( -1) = 2N >o
i=l
con lo que se cumple la condicin suficiente de mnimo.
IV.
Si el total de datos u observaciones se estratifica en L grupos
distintos, la media aritmtica del total es una meda aritmtica de
las distintas medas de los estratos ponderadas por el nmero de
observaciones que tienen los mismos:
Demostraci6n:
Las observaciones las dividimos en L estratos quedando:
La meda total o global ser
.X= (xu + X12 + .. + X1N) + ... + (xLl + xL2 + ... + xLNJ =
N1+N2+ .. +NL
Nt NL
L xli + .. + L XL;
i=l i=l .X1N1 + ... + .XLNL
N1+N2+ .. +NL
[2.8]
69
70 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
ya que como sabemos
con lo que
N1
I X
- i= 1
x
1
= ---:---, etc.
1
N1
I x
1
; = x
1
N
1
, etc.
i=l
Ventajas e inconvenientes de la media aritmtica
Las ventajas que podemos sealar de la media aritmtica como ms rele-
vantes son:
- Es calculable en las variables de naturaleza cuantitativa.
- Para su clculo se utilizan todos los valores de la distrib"ucin.
- Est perfectamente definida de forma objetiva y es nica para cada
distribucin de frecuencias.
- Tiene un claro significado ya que al ser el centro de gravedad de toda
la distribucin nos representa a todo el conjunto de valores observados.
Entre los inconvenientes hay que sealar que es una medida de posicin
muy sensible a los valores extremos de la distribucin con lo que puede llegar
a ser poco representativa del conjunto si la dispersin de los datos es muy
elevada. A pesar de este inconveniente, por sus mltiples ventajas, es la medida
de posicin central ms utilizada.
2.5.2. La media geomtrica
En muchas ocasiones los valores de la distribucin no son de naturaleza
propiamente aditiva como ocurre en los casos de los nmeros ndices o
porcentajes que representan la evolucin de una caracterstica con respecto
al valor que tiene en un perodo o situacin que llamamos base. Cuando se
desea obtener promedios de magnitudes tales como tipos d ~ inters, tas.as,
porcentajes, nmeros ndices, etc., la media aritmtica pierde la propiedad de
tener un claro significado ya que la suma de dichas magnitudes no representa
un total de recursos como en las magnitudes de naturaleza aditiva. En estos
casos debe de emplearse la media geomtrica como la medida de posicin
central ms representativa cuando la variable presenta variaciones acumula-
tivas.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Definicin 2.8.
Llamamos media geomtrica de una distribucin de frecuencias y la
denotaremos por G a la raz N-sima del producto de los N valores
observados:
Para las distribuciones unitarias:
G=r:}x
1
x
2
... x,=
N ~
V ~ X
Para las distribuciones no unitarias (agrupadas o no)
G = r:}x"
1
x"
2
x" =
1 2 r
[2.9]
[2.10]
71
Como propiedad fundamental de la media geomtrica damos la siguiente:
El logaritmo de la media geomtrica es igual a la media aritmtica de los
logaritmos de los valores de la variable.
Demostracin:
Ejemplo 2.18
1 r
logG =- I n;logx
N i=l
[2.11]
c.q.d.
Los tipos de inters que ofrece una entidad bancaria durante tres aos
consecutivos para depsitos a plazo son: 4,5, 5 y 5,5 por 100. Hallar el tipo
medio anual que ofrece el banco.
Solucin:
Los tipos de inters actan sobre un capital inicial C
0
que lo convierten
al cabo de tres aos en otro final C
1
por un proceso acumulativo. Luego el
promedio ms representativo para este caso es la media geomtrica.
En el primer ao obtenemos un capital C
1
tal que:
C
1
= C
0
(1 + 0,045)
72
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
En el segundo ao:
C
2
= C
1
(1 + 0,05)
En el tercer y ltimo ao:
C
3
= Cz(1 + 0,055) = C
0
(1 + 0,045)(1 + 0,05)(1 + 0,055)
El tipo medio de inters i ser aqul que verifique:
C
0
(1 + i)
3
= C
0
(1 + 0,045)(1 + 0,05)(1 + 0,055)
osea
(1 + i) = .U<1 + o,o45)(1 + o,o5)(1 + o,o55) = 1,049992
Puede observarse que (1 + i) es la media geomtrica de los valores
(1 + 0,045), (1 + 0,05) y (1 + 0,055) siendo las cantidades (0,045, 0,05 y 0,055)
las que operan internamente de forma multiplicativa en C0 para transfor-
marlo en C
3
El promedio de estas cantidades de 0,049992 con lo que la tasa
media del tipo de inters que hace el mismo efecto que las tres tasas anuales,
expresada en porcentajes es
i = 4,9992 por 100
Si se calcula la media aritmtica:
4,5 + 5 + 5,5
i = = 5
3
vemos que no coinciden siendo sta menos representativa del fenmeno ya que
no tiene en cuenta el efecto multiplicativo de las tasas de inters.
El ejemplo 2.18 tambin puede resolverse aplicando la expresin [2.11] en
el caso de frecuencias de tipo unitario:
1 3 1 [ J
log G =- L log X;=- log(1 + 0,45) + log(1 + 0,05) + log(1 + 0,055) =
3 i=l 3
1 . 00686032
= 3 [0,1613680 + 0,0211892 + 0,0232524] = ' 3 = 0,022867
y su antilogaritmo:
Antilog (0,022867) = 1,054064
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 73
Ventajas e inconvenientes de la media geomtrica
Entre las ventajas de las media geomtrica podemos sealar:
- Es ms representativa que la media aritmtica cuando la variable evo-
luciona de forma acumulativa con efectos multiplicativos.
- Est definida de forma objetiva y es nica, si existe.
- Tiene en cuenta en su clculo todos los valores de la distribucin.
- Los valores extremos tienen menor influencia que en la media aritm-
tica por estar definida a travs de productos en vez de sumas.
Los inconvenientes que hay que resaltar son:
- Su clculo es ms complicado que en la media aritmtica.
- No puede calcularse si algn X; es cero ya que se anula al definirse
como productos. Tampoco puede determinarse con valores negativos
ya que dara lugar a que apareciesen nmeros de naturaleza imaginaria
con lo que el problema no quedara resuelto, salvo que el radicando
sea negativo y el ndice de la raz sea impar. As en la distribucin del
ejemplo 2.15 no es que no exista la media geomtrica sino que no es
un buen promedio al ser x
1
= O con lo que dara:
En cambio s puede obtenerse la media geomtrica en la distribucin del
ejemplo 2.16:
G =
2
,Y7.000
3
-11.000
4
15.000
7
19.000
5
23.000
6
= 15.132
Si comparamos la media aritmtica del ejemlo 2.16 con la geomtrica: la
x = 16.120 y G = 15.132 vemos que G < x. Igual ocurre en el ejemplo 2.18 en
el u ~ .X = 5 y G = 4,9992. Demostraremos ms adelante que para datos no
negativos
2.5.3. La media armnica
Existen situaciones en las que no es adecuado el empleo de la media
aritmtica ni de la media geomtrica ya que los datos observados no son de
naturaleza aditiva ni multiplicativa. Esto ocurre en los casos en los que se
desea promediar velocidades, rendimientos, productividades, etc., en los que
hay que combinar una serie de conceptos tales como: entidades de produc-
74
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
cin (recorridos, fincas, empresas, secciones, etc.), recursos producidos por
cada entidad (n
1
, n
2
, ... , n,), de recursos (N= ;t
1
'n} ritmo de
produccin de cada entidad (x
1
, x
2
, ... , x,) que se expresa en producto obte-
nido por unidad de produccin y unidades de produccin de cada entidad que
se obtienen dividiendo la produccin de cada entidad por su ritmo de produc-
cin (n
1
, nz, ... , n,) El problema que tenemos que resolver es obtener un
x
1
x
2
x,
promedio de los ritmos de produccin (x
1
, x
2
, ... , x,) que multiplicando por
las unidades de produccin nos d el total de recursos producidos. A este
producto H se le denomina media armnica:
[2.12]
Despejando H en la expresin [2.12] tenemos:
Definicin 2.9.
Dada una distribucin de ritmos de produccin x
1
, x
2
, ... , x, y las
producciones de r entidades: n
1
, n
2
, ... , n" llamamos media armnica de
aqullos a:
N N
[2.13] H = ------= -,--
n1 n2 n, " n;
-+-+ .. +- L.
xl Xz x, i=l X;
V en tajas e inconvenientes de la media armnica
Entre las ventajas de la media armnica hay que destacar las siguientes:
- Est definida de forma objetiva y es nica.
- Su clculo es sencillo.
- Intervienen todos los valores de la distribucin.
- Es ms representativa que las otras medias en los casos de obtener
promedios en velocidades, rendimientos y productividades.
Como inconvenientes hay que citar:
- No debe de usarse para valores de la variable muy pequeos (cercanos
a cero) ya que sus inversos pueden aumentar muchsimo haciendo
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 75
despreciable frente a ellos la informacin de otros valores de x; que
sean mayores.
- No es posible calcularla cuando existen valores iguales a cero.
Relacin entre las medias armnica, geomtrica y aritmtica
Vamos a demostrar que para una misma distribucin de frecuencias con
todos sus datos positivos ocurre que:
Consideremos el caso ms sencillo de una distribucin con dos valores de la
variable con frecuencias unitarias y que con dichos valores pueden calcularse
los tres promedios:
2
H= 1 1
-+-
xl Xz
G = F'0z
- xl + Xz
x=
2
2
Vamos a demostrar en primer lugar que H G, o sea:
Elevando al cuadrado los miembros de la anterior desigualdad y operando:
4x
1
x
2
xi + + 2x
1
x
2
xi + 2x
1
x
2
(xl- Xzf
Con lo que queda demostrado que H G. Por otro lado G x ya que:
76 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Con lo que
Por tanto, queda demostrado que H G .X. Esta demostracin puede gene-
ralizarse para cualquier nmero de valores de la variable. La media armnica
del ejemplo 2.16 ser:
25
H = _3 ___ 4 ___ 7 ___ 5 ___ 6_ = 14.022
--+--+--+--+--
7.000 11.000 15.000 19.000 23.000
Vemos que se cumple que
ya que
14.022 < 15.132 < 16.120
Ejemplo 2.19
Un automvil realiza los siguientes recorridos 200, 300 y 400 km a las
velocidades medias de 50, 60 y 80 km por hora. Calcule la velocidad media
para el recorrido total.
Solucin:
En este ejemplo los ritmos de produccin o valores de la variable son las
velocidades medias del vehculo en cada recorrido (entidades de produccin)
(x
1
= 50, x
2
= 60 y x
3
= 80). Los recursos producidos son las distancias que
se han recorrido (n
1
= 200, n
2
= 300 y n
3
= 400) con lo que la distribucin de
frecuencias ser:
X; n;
50 200
60 300
80 400
900
H = 200 300 400 = 64 kmjhora
-+--+-
50 60 80
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 77
Ejemplo 2.20
Cuatro fincas han producido 100, 120, 150 y 200 quintales mtricos de trigo
con unos rendimientos de 10, 15, 12 y 18 quintales mtricos de trigo por
hectrea. Calcular el rendimiento medio.
Solucin:
En este ejemplo los ritmos de produccin son los rendimientos obtenidos
por hectrea y los recursos producidos son los montantes de quintales mtricos
de trigo obtenidos en cada una de las fincas que son las entidades de produc-
cin. La distribucin de frecuencias ser:
2.5.4. La mediana
X;
10
12
100
150
15 120
18 200
Las anteriores medias que hemos estudiado (aritmtica, geomtrica y ar-
mnica) son medidas de posicin central que representan al conjunto de valores
observados de la distribucin equilibrando los ms elevados, los intermedios y
los pequeos ya que en su cmputo intervienen todos ellos. El problema que
tienen estas medias es que son sensibles a los valores extremos muy altos o
muy bajos y cuando existe mucha dispersin son poco representativas del
conjunto de observaciones. Con objeto de superar esta dificultad vamos a
definir otra medida de posicin central en cuyo clculo no intervienen todos
los valores de la variable X;. En vez de equilibrar valores de la variable para
determinar el centro de gravedad de la distribucin equilibra las frecuencias
observadas a ambos lados de su valor.
78 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Definicin 2.10. Mediana
Dada una distribucin de frecuencias con los valores ordenados de
menor a mayor, llamamos mediana y la representamos por M e al valor
de la variable que deja a su izquierda el mismo nmero de frecuencias
que a su derecha.
Determinacin de la mediana en las distribuciones de tipo unitario
Pueden ocurrir dos casos:
a) Que el nmero de valores de la variable sea impar: la mediana es el
valor central. Por ejemplo, si la distribucin unitaria es X;: 1, 3, 9, 13, 14 la
mediana es M. = 9 ya que es el valor que deja a su izquierda los mismos datos
u observaciones que a su derecha; o sea, dos datos.
b) Que el nmero de valores de la variable sea par: la mediana es la media
aritmtica de los dos valores centrales. Por ejemplo, si la distribucin unitaria
es x;: 2, 3, 4, 5, 7, 8 la mediana es
4+5
M.=-
2
-=4,5
ya que es un punto del campo de variacin de la variable que deja tres
observaciones por debajo de l (2, 3 y 4) y otras tres por encima (5, 7 y 8). Si
la variable que se est estudiando es de naturaleza discreta (por ejemplo,
nmero de personas) y no admite decimales, la M.= 4,5 no sera admisible
con lo que las medianas seran conjuntamente los dos valores centrales (4 y
5) ya que valores menores o iguales a 4 hay tres y valores iguales o superiores
a 5 tambin hay tres.
Determinacin de la mediana en distribuciones no unitarias
y con los valores no agrupados en intervalos de clase.
Si la distribucin de frecuencias no es unitaria hay que acudir al concepto
de frecuencias acumuladas para determinar la mediana. Si de la correspondien-
te distribucin se representan en el mismo sistema de ejes cartesianos los
diagramas acumulativos ascendentes y descendentes, la abscisa del punto
donde se encuentran corresponde con la mediana ya que por encima del
mismo hay un 50% de observaciones y por debajo otro 50% como indica el
grfico 2.16. El procedimiento de determinacin numrica es el siguiente: se
calcula N/2 y se construye la columna de las NJ. A continuacin se observa
cul es la primera NJ que supera o iguala a N/2 distinguindose dos casos:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
79
a) a N/2 la es el X; que corresponde a ese NJ.
. St N; es _Igual a N/2 la medtana es la media aritmtica de x. y el
st_gwente X;+ 1 St.este no fuese admisible porque la distribuci,n es
discreta Y no admite dectmales; la medi\lna sera los dos valores conjuntamente.
Ejemplo 2.21
. Obtener la de la distribucin de frecuencias no agrupada del
eJ_emplo refendo al nmero de personas que trabajan en 20 familias. La
dtstnbuctn es:
o
GRAFICO 2.16.
Solucin:
1
1
1
L.___,
X
1
1
1
1
...
,'1
r---:
1
1
1
1
1
1
1
1
1
1
X
grfica de la mediana a travs de los diagramas acumu-
lativos ascendente y descendente.
X; n; Ni
'
o 4 4
1 10 14
2 4 18
3 1 19
4 1 20
Observando en la columna N[ que el primero que supera a
N/2 = 10 es N1 = 14.
80 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Luego la mediana es su correspondiente valor de la variable que es M.= l.
Este resultado nos indica que las familias con un ocupado, al tener, una
frecuencia acumulada de 14 incluyen a las observaciones que ocupan los
lugares dcimo y dcimo-primero que cumplen la definicin de mediana para
este ejemplo con un total de 20 observaciones.
Ejemplo 2.22
Los salarios mensuales de 100 empleados de unos grandes almacenes son
los siguientes:
Solucin:
Salarios (x;)
1.000 euros
1.250 euros
2.000 euros
3.000 euros
N.
0
empleados (n;)
50
30
15
5
NT
'
50
80
95
100
Observando NI vemos que el primero que iguala a N/2 =50 es Nl =50.
Luego estamos en el caso en el que la mediana ser
1.000 + 1.250 1 125
----- = . euros
2
Puede observarse que un salario mensual de 1.125 euros tiene por debajo
de l al 50% de los salarios de los trabajadores y por encima al otro 50%.
Determinacin de la mediana en distribuciones con los datos agrupados
en intervalos de clase.
En este caso no tenemos valores observados de la variable al estar incluidas
en intervalos de clase. Luego la mediana la obtendremos siguiendo el
de observar la columna de frecuencias acumuladas hasta encontrar un valor
de Ni que supere o iguale a N /2. Grficamente si de una distribucin agrupada
representamos sus polgonos acumulativos ascendentes y descendentes,
se cortan ambas funciones su correspondiente abscisa nos dara la mediana
como se indica en el grfico 2.17. Observando la columna de NI nos podemos
encontrar con los casos:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
81
a) Que N/ supera a N/2 el intervalo mediano ser (L;_
1
, LJ que corres-
a ese NJ > N /2. Puede observarse en el grfico 2.17 que el valor de la
abscisa que se corresponde con M. tiene una ordenada de N/2. Para obtener
el la mediana al lmite inferior del intervalo mediano hay que aadir
la d1stancm d que es un trozo de la amplitud del intervalo e;. Luego:
determinar la distanciad se adopta la hiptesis de que los valores de
la _vanable X; que pertenecen al intervalo mediano se distribuyen de forma
umforme a lo largo del mismo. Luego podemos establecer una relacin direc-
tamente proporcional entre la frecuencia absoluta del intervalo mediano (n;),
N
N
N
N/2
N_
o
Lo----- L
'
'
'
'
'
'
'
'
'
'
'
,____...
X
GRAFICO 2.17. Determinacin grfica de la mediana a travs de la representacin de los
polgonos ascendentes y descendentes de una distribucin de frecuencias
agrupada en intervalos de clase.
su amplitud (e;), la longitud desconocida (d) y la frecuencia que le corresponde
(N/2- N/_
1
):
C d
n; N/2- N/_
1
'
de donde
N/2- NT
d
- -1
- C
n. '
'
82
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Sustituyendo:
N/2- NI-1
M.=Li-1 + C;
n;
t ma por convenio como
b) Que NI es igual a N /2. En este c ~ o se o
mediana el lmite superior del intervalo mediano.
Ejemplo 2.23
Los ingresos anuales de las 50 familias del ejemplo 2.12 expresados en miles
de euros y agrupadas en intervalos de clases son:
[40, lOO]
(100, 200]
(200, 500]
(500, 1.000]
Calcular la mediana.
Solucin:
10
20
15
5
N!
'
10
30
45
50
Observando la columna NI vemos que el primer Ni q ~ e iguala o su?era
( t Pera) a N/2
- 25 es Ni = 30 con lo que el mtervalo mediano
en es e caso su - z
es (100, 200]. Por tanto:
25- 10
M = 100 + lOO= 175
e 20
La conclusin que obtenemos es que el ingreso de 175.000 euros deja por
debajo al 50% de las familias y por encima al otro 50%.
Ejemplo 2.24
Cien pequeos comercios se agrupan segn su nmero de empleados, en
la siguiente distribucin:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
N.
0
de empleados
(Li-1 L;)
[ O, 1]
( 1, 2]
( 2, 4]
( 4, 6]
( 6, 10]
(10, 15]
Calcular la mediana.
Solucin:
N.
0
de comercios
20
30
20
15
10
5
N!
'
20
50
70
85
95
100
83
El primer NJ que iguala o supera a N/2 = 50 (en este caso iguala) es
N1 = 50 con lo que el intervalo mediano es (1, 2] y la mediana es su lmite
superior M.= 2.
Ventajas e inconvenientes de la mediana.
Como ventajas de la mediana cabe destacar:
- Es la medida ms representativa en el caso de variables que slo
admiten la escala ordinal.
- Es una medida de posicin central sencilla de calcular.
- Tiene una fcil interpretacin al ser un valor de la variable en el caso
de las distribuciones de frecuencias unitarias o las no unitarias no
agrupadas. En el caso de las agrupadas est dentro del campo de
variacin del intervalo mediano.
- En la mediana slo influyen los valores centrales de la distribucin y
es insensible a los valores extremos. La M. puede calcularse en distri-
buciones en las que los valores extremos son desconocidos siempre y
cuando tengamos informacin sobre sus frecuencias (casos de intervalos
iniciales y finales de naturaleza abierta).
El nico inconveniente que se le puede sealar a la mediana es que en su
determinacin no intervienen todos los valores de la variable. Este inconve-
niente se transforma en ventaja cuando son desconocidos los valores extremos
o existe una enorme dispersin entre los mismos que invalidan las. medias
como medidas de posicin central al no ser representativas del conjunto de la
distribucin por la enorme influencia que ejercen los mencionados valores
extremos en su clculo.
1
'
1
r
1'
1
,
1
,,
i'
i
i
1 ,.
'
'
84 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
2.5.5. La moda
Igual que la mediana es una medida de posicin central que est funda-
mentada en las frecuencias de la distribucin y no en el conjunto de los valores
de la variable como ocurre con las distintas medias. La moda siempre estar
definida en relacin a valores de la variable asociados a sus distintas frecuen-
cias con lo que no tiene sentido hablar de moda en las distribuciones de
frecuencias de tipo unitario.
Definicin 2.11. Moda absoluta
Dada una distribucin no unitaria llamamos moda absoluta, que
representaremos por M
0
, al valor de la variable (o los valores) con mayor
frecuencia absoluta. En el caso de existir dos, tres o ms valores con la
mayor frecuencia absoluta, la distribucin se dir que es bimodal, trimo-
dal o multimodal.
Determinacin de la moda en distribuciones no unitarias y no agrupadas
En este caso la determinacin de la moda es inmediata ya que basta con
observar la columna n, de frecuencias absolutas.
Ejemplo 2.25
En la distribucin de frecuencias del ejemplo 2.2 referido al nmero de
personas que trabajan en 20 familias obtener la moda. Los datos de la distri-
bucin (tabla 2.4) son los siguientes:
X n;
o 4
1 10
2 4
3 1
4 1
Solucin:
Observando la columna de frecuencias absolutas la mayor corresponde a
n
2
= 10, siendo la moda absoluta su correspondiente valor de la variable M
0
=l.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
85
Ejemplo 2.26
Las puntuaciones de 100 alumnos en un examen fueron recogidas en la
siguiente distribucin de frecuencias:
2 15
6 40
7 40
9 5
Determinar su moda.
Solucin:
Observando la columna n, vemos que es una distribucin bimodal o con
dos modas absolutas ya que la mxima frecuencia, 40, se repite en dos valores
de la variable con lo que sus modas absolutas son M
0
= 6 puntos, o bien,
M
0
= 7 puntos.
Definicin 2.12. Moda relativa
Dada una distribucin no unitaria llamamos moda relativa a aquel
valor de la variable (o los valores) cuya frecuencia absoluta no es supera-
da por las de sus valores contiguos.
Ejemplo 2.27
Las puntuaciones de 120 alumnos en un examen fueron recogidas en la
siguiente distribucin de frecuencias:
1 20
3 30
4 20
5 40
7 7
9 3
Obtener las posibles modas de la distribucin.
86 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Solucin:
'
Observando la columna n; la moda absoluta es M
0
= 5. Tambin existe
una moda relativa M
0
= 3 ya que su frecuencia asociada n
2
= 30 no es supera-
da por sus valores contiguos que tienen unas frecuencias absolutas de 20
observaciones.
Determinacin de la moda en distribuciones agrupadas en intervalos
Al estar los valores de la variable agrupados en intervalos slo obtendre-
mos una aproximacin al valor de la moda como ocurra con las medias (se
utilizaban las marcas de clase al no disponer de los valores realmente obser-
vados) y la mediana (se utiliz la hiptesis de la proporcionalidad directa entre
frecuencias absolutas y amplitudes del intervalo mediano). Para determinar la
moda pueden emplearse distintas hiptesis pero las ms utilizadas son las
siguientes:
- La moda se encuentra en el intervalo que tiene mayor frecuencia ab-
soluta dividida por su amplitud (es decir, mayor densidad de frecuencia)
que recibe el nombre de intervalo modal.
- La moda estar ms cerca de aquel intervalo contiguo que tenga mayor
frecuencia absoluta. Luego dentro del intervalo modal la moda se en-
cuentra en un punto para e! cual las distancias a los extremos inferior
y superior del intervalo son inversamente proporcionales a las frecuen-
cias absolutas de los intervalos adyacentes a dichos extremos.
Teniendo en cuenta las hiptesis anteriores vamos a considerar dos casos:
a) Que los intervalos tengan todos una amplitud constante c.
Para determinar la moda se observa la columna n; de frecuencias absolutas
concretando que la mayor de todas nos determina el intervalo modal. Supon-
gamos que es como se indica en el grfico 2.18 el intervalo (L;_
1
, LJ con una
frecuencia absoluta n;. Los intervalos contiguos al modal tienen unas frecuen-
cias absolutas de ; _
1
el anterior y n; +
1
el posterior. Luego la moda ser:
M
0
=L;_
1
+d
La hiptesis que hemos establecido de proporcionalidad inversa de las
distancias d y (e - ) a las frecuencias n; _
1
y n; +
1
nos permite escribir:
d e- d
-1-=-1-
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 87
n;
o
X
GRFICO 2.18. Determinaci6n de la moda a travs del histograma de frecuencias.
Teniendo en cuenta las propiedades de las proporciones de suma de ante-
cedentes y consecuentes queda:
d e-d e
1 1 1 1
--+--
n;-1 ni+1 n;-1 n;+1
Tomando el primer y ltimo miembro de estas igualdades y despejando
nuestra incgnita que es la distanciad queda:
1 1 n;-1 ;+1
d =
n;-1 ;-1 ;-1 ;+1
--:........::'---e= e= e= e
1 1 ni+1 + ;-1 n;-1 + ni+1 n;-1 + ni+1
-+-
Sustituyendo d por su valor en funcin de las frecuencias de los intervalos
adyacentes al modal y de su amplitud constante e queda la expresin de la
moda:
M =L. + ni+
1
e
o -1 n;-1 + ;+1
88 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ejemplo 2.28
Los salarios anuales de 200 ejecutivos de un pas expresados en miles de
euros se recogen en la siguiente distribucin de frecuencias:
Salarios anuales N.
0
de ejecutivos
(Li-l -LJ ni
[75-125] 25
(125-175] 100
(175-225] 50
(225-275] 25
Solucin:
Podemos observar que la amplitud de los intervalos es una constante
e = 50. Observando la columna ni vemos que la mayor es n
2
= 100. con lo que
el intervalo modal es (125-175]. Por tanto el valor de la moda es:
50
M
0
= 125 +
2
50= 158,33 miles de euros
5 +50
Conclusin: el salario que ms se repite en los 200 ejecutivos es de 158.333
euros.
b) Que los intervalos sean de amplitud variable ci.
En este caso nos encontramos con el mismo problema que cuando se
construan histogramas con intervalos de amplitud variable que haba que
calcular previamente las densidades de frecuencias:
n.
h.=_.
1
ci
El intervalo modal ser el que tenga una mayor densidad de frecuencias.
Una vez determinado el correspondiente (Li_
1
, LJ basta con sustituir las
frecuencias absolutas de los intervalos adyacentes por sus
densidades de frecuencias con lo que la expresin de la moda en este caso
ser:
Mo=Li-l+h h ci
i-1 + i+l
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
89
Ejemplo 2.29
Las recaudaciones mensuales expresadas en miles de euros de 100 estable-
cimientos comerciales se reflejan en la siguiente distribucin de frecuencias:
Recaudaciones N. o de comercios Densidad de frecuencias
(Li-l -LJ
n.
ni
h.=_.
1 ci
[75-200] 50 0,40
(200-250]
40 0,80
(250-300] 7 0,14
(300-400]
3 0,03
Solucin:
Puede observarse que utilizando la columna ni el intervalo modal sera
[75-200]. Pero esta conclusin es errnea ya que la amplitud de los intervalos
es variable y las frecuencias absolutas directamente no son vlidas. Hay que
obtener la columna hi de densidades de frecuencias siendo la mayor h
2
= 0,80
con lo que el intervalo modal ser (200-250] y la moda:
0,14 .
M0 = 200 + 50= 213 mtles de euros
0,40 + 0,14
Conclusin: la recaudacin que ms se repite en los establecimientos
comerciales es de 213.000 euros.
Ventajas e inconvenientes de la moda
La moda tiene una serie de ventajas tales como:
- Es la nica medida de posicin central que puede obtenerse en las
variables de tipo cualitativo que slo admiten la escala nominal ya
siempre podemos determinar la modalidad que ms se repite en el
estudio de un determinado atributo.
- Es de sencillo clculo.
- Es de fcil interpretacin ya que nos da directamente el valor de la
variable que ms se repite.
Como inconveniente hay que sealar que en su determinacin no intervie-
nen todos los valores de la distribucin (caso de las medias) ni todas las
frecuencias (caso de la mediana) centrndose slo en la mayor frecuencia
absoluta de un determinado valor de la variable.
90 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
2.5.6. Otras medidas de posicin no centrales:
los cuantiles
Hasta ahora hemos estudiado las medidas de posicin central ya que de
una forma u otra se ha buscado un valor representativo de todo el conjunto
de la distribucin. Las medidas que denominamos cuantiles son valores de la
variable que dividen a la distribucin en partes proporcionales, o sea, en
intervalos que contienen el mismo nmero de observaciones. Es evidente que
la medida de posicin central que hemos llamado mediana es un cuantil ya
que es un valor de la variable que la divide en dos partes iguales a la dis-
tribucin.
Definicin 2.13. Cuantiles
Llamamos cuantiles a aquellos valores de la variable que dividen a
la distribucin en intervalos que tienen un nmero de frecuencias abso-
lutas proporcional a una constante comprendida entre O y 1. Los ms
conocidos son:
- Los cuartiles (Q) que son tres valores que dividen a la distribucin
en cuatro partes iguales.
- Los deciles (D;) que son nueve valores que dividen a la distribu-
cin en diez partes iguales.
- Los percentiles (P ) que son noventa y nueve valores que dividen
a la distribucin en cien partes iguales.
Clculo de cuantiles en distribuciones no agrupadas en intervalos de clase
Como la mediana es un caso particular de cuantil, ya que divide a la
distribucin en dos partes iguales, las reglas de clculo que se vieron para
rN
obtener M. son vlidas para obtener los distintos cuantiles: se calcula -
q
siendo r el cuantil correspondiente, q el nmero de intervalos con iguales
frecuencias en que se divide la distribucin y N el nmero tqtal de datos,u
observaciones; seguidamente se construye la NJ (los valores de la variable
siempre estn ordenados de menor a mayor) y se observa cul de los NJ supera
rN
o iguala a -. Recordemos que en el caso de la mediana r = 1 y q = 2 con
q
rN
lo que la expresin es N/2. Si NJ supera a- el cuantil es el correspondiente
q
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
91
valor de la variable y si lo iguala es la media aritmtica de ese valor y el
siguiente igual que ocurra cuando se obtena la mediana. En el caso de los
tres cuartiles (Q
1
, Q
2
y Q
3
) la expresin
rN
ser
q
1N
4
2N
4
que como coincide con la M. simplificando es
3N
N/2 y
4
para Q
3
.
En el caso de los nueve deciles las expresiones de las frecuencias acumu-
ladas ascendentes que nos lo determinan sern:
Para D
1
la frecuencia absoluta acumulada
1
N
10
Para D
2
la frecuencia absoluta acumulada
2
N
10
Para D
9
la frecuencia absoluta acumulada
9
N
10
Para los percentiles:
1N
Para P
1
la frecuencia absoluta acumulada
100
2N
Para P
2
la frecuencia absoluta acumulada
100
Para P
99
la frecuencia absoluta acumulada
99
N
100
92
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ejemplo 2.30
'
En la distribucin del ejemplo 2.27 de las puntuaciones 120 alumnos
determinar los tres cuartiles, el sptimo decil y el 99.o percentil.
X n;
NT
'
1 20
20
3 30
50
4 20
70
5 40 110
7
7 117
9
3 120
Solucin:
Las frecuencias absolutas acumuladas ascendentes que nos los
tres cuartiles son:
1N = 120 = 30 para Ql
4 4
2N = 240 = 60 para Q2
4 4
3N = 360 = 90 para Q3
4 4
Luego observando en la columnas N/ los tres cuartiles son:
Q
1
= 3 , Q
2
= 4 y Q3 = 5
ya que son los tres valores de la variable x
1
que. se corresponden con
N
i = 50 Ni = 70 y Nl = 110
2 , 3
que son las frecuencias absolutas acumuladas que las condiciones de
ser las primeras mayores o iguales que las respectivas
1N 2N 3N
4 4 y ---
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Puede observarse que Q
2
coincide con la mediana ya que
120
N/2=-=60
2
93
y observando en N/ es N1 = 70 el que cumple la condicin de ser la primera
igual o mayor que N /2 con lo que su correspondiente valor de la variable o
mediana es M. = 4.
La frecuencia absoluta acumulada ascendente que nos determina el spti-
mo decil ser:
7N 7 120 840
10=10=10=
84
Observando en la columna N[ es Nl = 110 el que cumple la condicioin
con lo que el sptimo decil es el valor de la variable correspondiente:
La frecuencia absoluta acumulada ascendente que nos determina el 99.
0
percentil ser:
99N 99 120
100 =---()() = 118,8
Observando la columna Nf es el ltimo valor = 120 el que cumple la
condicin con lo que:
Clculo de cuantiles en distribuciones agrupadas en intervalos
Este problema se resuelve de forma idntica que en el caso de la mediana.
Luego la frmula de determinacin es la misma slo que en vez de una
frecuencia absoluta acumulada ascendente de N /2 ser en trminos genricos
la de los cuantiles hasta rN. Por tanto, para determinar el cuantil de orden r
q
y nmero de intervalos iguales q, o sea crfq' ser:
rN
-- NJ_l
q
C,q = L
1
_
1
+-=----e;
n;
'

.. -
94 CASAS-SNCHEZ, J. M. y SANTOS-PEl'lAS, J.
Todo el procedimiento de determinacin estudiado en la mediana es apli-
cable al cien por cien al caso de los cuantiles.
Ejemplo 2.31
En la distribucin de frecuencias del ejemplo 2.29 referida a las ventas
mensuales de 100 establecimientos comerciales. Calcular: a) El nivel de venta
que no es superado por el 25% de los b) El nivel de venta
mnimo que recaudan el15% de los comercios que ms venden.
Solucin:
En la distribucin del ejemplo 2.29 hay que obtener la columna de las
frecuencias absolutas acumuladas ascendentes quedando:
(L;_
1
- LJ n; Ni
l
[75-200] 50 50
(200-250] 40 90'
(250-300] 7 97
(300-400] 3 100
a) El nivel de ventas que nos piden corresponde al de_l primer
cuartil; luego la frecuencia absoluta acumulada que nos determma el mtervalo
donde se encuentra es:
1N = 100 =
25
4 4
Observando en la columna Ni cumple la condicin de igualarla o
por primera vez el primer valor Nl = 50 con lo que el intervalo es el pnmero
[75-200]:
1N _ r
4 N;-1 25-0 .
Ql = L;_
1
+----c.= 75 + --125 = 137,5 mtles de euros.
n; ' 50
Puede observarse que al aplicar la frmula de determinacin, al ser el
primer intervalo de la distribucin donde se encuentra el primer cuartil, el
Ni =O ya que antes del primero no existe ninguna frecuencia acumulada.
al problema planteado es que son 137.500 euros el nivel de ventas
que no es superado por el 25 % de los establecimientos comerciales.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
95
b) El nivel de ventas mnimo que nos piden nos lo proporciona el per-
centil 85 ya que es el valor que nos deja a su derecha, por encima de l, un
15 % de los comercios con las mayores ventas. La frecuencia absoluta acumu-
lada ascendente que lo determina es:
85N 85100
1oo =100=
85
Observando en la columna Ni vemos que = 90 nos determina el inter-
valo donde se encuentra el percentil 85 que es (200-250]. Aplicando la frmula
de determinacin:
85N
--N
100 i-l 85 - 50
Pas = L;-1 + e;= 200 +
40
50= 243,75 miles de pesetas.
n;
Conclusin: el nivel de ventas mnimo que corresponde al 15% de los
comercios que ms venden es de 243.750 euros.
2.6. Momentos
Los momentos son medidas obtenidas a partir de todos los datos de una
variable estadstica y sus frecuencias absolutas. Estas medidas caracterizan a
las distribuciones de frecuencias de tal forma que si los momentos coinciden en
dos distribuciones diremos que son iguales, siendo ms semejantes cuanto
mayor sea el nmero de momentos que coinciden.
Se define el momento de orden h respecto al origen de una variable es-
tadstica a la expresin:
Algunos ejemplos son: si h = 1, a
1
= x que como sabemos es la media
aritmtica; si h =O, a0 = 1; ah es la media aritmtica de los valores observados
elevados a la potencia h.
El momento de orden h respecto a la media aritmtica o central de una
variable estadstica es:
siendo x la media aritmtica de la variable estadstica.
96
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ejemplos: si h = 1,
1 r 1 r 1
m
1
=- (x; - x)n; = N .L x.n. - - .X L n; = .X - .X = O;
N i=l 1=1
1 1
N i=l
si h = 2, se denota m
2
= s
2
y se llama varianza que es la medida de disper-
sin absoluta que se estudiar ms adelante.
Relaciones entre los momentos
Todo momento respecto a la media puede expresarse en funcin de los
momentos respecto al origen de rdenes menores o igual al orden del primero.
Para ello usamos el binomio de Newton:
h (h)h''
(x; - x)h = 'L ( -1Y . x;-
1
x
1
j=O 1
As:
1 r 1 r Lh (h) h--]
mh =- L (x; - x)hn; = - L L ( -1)1 . X;
1
x
1
n; =
N i= 1 N i= 1 =o 1
h (h) ( 1 r , ) h G) -
= L (-1)1 . x
1
- .L x?-
1
n; = (-1Y . ah_i,Xl.
j=O 1 N 1=1 rO
Tambin cualquier momento respecto al origen, ah, se puede expresar en
funcin de mh- i y .X.
Un caso particular de especial relevancia es m2:
2 (2) o (2) (2) - (2)-2
m2= (-1Y j a2-}J= O a2- 1 ax+ 2 x, =
es decir, la varianza coincide con el momento de orden 2 respecto al origen
menos la media aritmtica elevada al cuadrado.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
Los cambios de escala y origen en el clculo de los momentos
respecto a la media
97
Los momentos respecto a la media se ven afectados por los cambios de
escala pero no por los cambios de origen. Si se realiza la transformacin
siguiente:
resulta que
Demostracin:
x- 0
1
y=--c-
En la demostracin anterior se ha tenido en cuenta que los cambios de escala
Y. origen s ambos a los momentos respecto al origen ya que como se
VIo en la pnmera propiedad de la media aritmtica, que es un momento de
orden uno respecto al origen,
.X= 0
1
+ Cy.
Los momentos se utilizan constantemente en la Estadstica Descriptiva en
el clculo de medidas de dispersin, de asimetra y de apuntamiento o curtosis
como se ver en los prximos epgrafes.
2. 7. Medidas de dispersin
'
Las medidas de dispersin tratan de medir lo ms o menos esparcida que
se encuentra la variable estadstica entorno a una medida de posicin o de
tendencia central, indicndonos lo representativa que es la medida de posicin.
mayor dispersin, menor representatividad de la medida de posicin, y
viceversa.
98 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Algunas medidas de dispersin absolutas (dependen de las unidades de
medida de la variable) o relativas (estn definidas por cociente y no.dependen
de las unidades de medida de la variable) vamos a definirlas a continuacin.
Las medidas de dispersin absolutas slo tienen sentido cuando vienen acom-
paadas de un promedio. Las relativas permiten comparar la dispersin de
distintas distribuciones.
a) Recorrido, rango o intervalo de variacin:
R = x,- x
1
= mx{x,}- mn{x,} para 1 i r
b) Intervalos intercuantflicos:
Intervalo intercuartlico, I = Q
3
- Q
1
-
Intervalo semiintercuartlico, (Q
3
- Qt>f2.
Intervalo intercuartlico relativo, (Q
3
- Q
1
)/Me.
Intervalo 10- 90 por 100, D
9
- D
1
.
Intervalo 7 - 93 por 100, P
93
- P
7

etc.
e) Medidas de dispersin respecto a la media aritmtica:
1 r
Desviacin absoluta media respecto a la media, da = N

Jx, - xJn,.
. 2 1 -)2 -2
Vananza, s =- (x,- x n, = m
2
= a
2
- x .
N <=1
Desviacin tpica, s = ;;;;_ = J a
2
- x
2

Coeficiente de variacin de Pearson, sjx, que es la medida de disper-
sin relativa que ms se utiliza para comparar la dispersin de
distintas distribuciones.
Las unidades en que se miden las medidas de dispersin son las mismas
de los datos (por ejemplo: da, s, R, I, etc.), o en unidades al cuadrado (por
ejemplo: s
2
) o son magnitudes escalares independientes de las. unidades d&
medida (por ejemplo: intervalo intercuartlico relativo, sjx, etc.).
A efectos de comparar las dispersiones de dos o ms variables estadsticas
en las mismas o distintas unidades, se realiza habitualmente a travs del
coeficiente de variacin de Pearson, sjx, como hemos indicado anteriormente.
Existen otras muchas medidas de dispersin, pero las ms usadas utilizan
la varianza, por lo que la vamos a estudiar algo ms.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
99
Propiedades de la varianza, s
2
a) La varianza siempre es positiva:
Para probarlo:
V i = 1, 2, ... , r: oo > (x, - xfn, O
por lo que dividiendo entre N, y sumando en todos los valores de la variable
tenemos:
La. varianza S
2
= O cuando x, - x = O V i = 1, ... , r , o sea los valores de
la variable coinciden con la media aritmtica.
b) La desviacin cuadrtica media de una variable estadstica respecto de
k, se hace mnima en k = x en cuyo caso la desviacin cuadr-
tica medta respecto a x es la varianza s
2
Vemoslo: sea
1 r
f'(k) =N

2(x, - k)( -1)n, = O => k = x
2 r
f"(k) = N

n, = 2 > O, luego x es mnimo.
Queda comprobado que: f(x) = s
2

e) Mtodo abreviado de clculo de s
2
:
Como en el mtodo abreviado de clculo de la media aritmtica vimos que:
x = e y + ot = x = c.v + 0
1
,
ahora
100
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
til cuando o, es un valor
0
dato central de la variable X y ,c. es
la distancia
0
separacin entre dos datos consecutivos de la
X. Como la s2 es un momento de segundo orden a la volvemos
a comprobar que a stos no les afecta el cambio de ongen pero Sl el de escala.
d) Clculo de la varianza a travs de los momentos respecto al origen:
Como ya se demostr en el apartado de los momentos:
s
2
= m
2
= Jo ( ii = -G)alx + G)x
2
=
-2 -2 -2
= a2 - 2x + x = a2 - x
1 s2 = a2- x2 1
Relacin muy importante desde el punto de vista prctico.
Ejemplo 2.32
La varianza de la variable estadstica presentada en el ejemplo 2.15 se
puede obtener as:
donde
y por el mismo ejemplo 2.15 la media aritmtica es:
luego
5
x=-
4'
2- 51 - =51 - 25 = 204 125 = 79
S - 20 4 20 16 80 80
La desviacin tpica ser:
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 101
El coeficiente de variacin de Pearson es:
S j79i8o
i = 5/4 :::!: 0,7949842
En la variable estadstica presentada en la distribucin agrupada de fre-
cuencias del ejemplo 2.16,
1
a
2
=
25
(7.000
2
3 + 11.000
2
4 + 15.000
2
7 + 19.000
2
5 + 23.000
2
6) =
1
= 25 10
6
(49. 3 + 121 4 + 225.7 + 361 5 + 529. 6) =
= 4. 10
4
. (147 + 484 + 1.575 + 1.805 + 3.174) = 40.000. (7.185) = 287.400.000;
Sabemos, por el mismo ejemplo 2.16 que la media aritmtica es:
x = 16.120;
por todo ello, la varianza resulta ser:
s
2
= a
2
- x
2
= 287.400.000- 16.120
2
=
= 287.400.000- 259.854.400 = 27.545.600
La desviacin tpica es:
S = p :::!: 5.248,3902
y el coeficiente de variacin de Pearson:
S
::- :::!: 0,3255825.
X
Como se ha comentado, la desviacin tpica, como medida de dispersin
absoluta, expresada en las mismas unidades que la variable estadstica, tiene
significado si se compara con el valor de la media aritmtica. En este caso
supone aproximadamente 1/3 de la media con lo que podemos concluir que
sta es bastante representativa de todo el conjunto de datos, ya que se puede
considerar que la dispersin es baja. El coeficiente de variacin de Pearson
por su definicin por cociente nos indica lo que representa la dispersin (s) en
razn al promedio (x). Cuanto ms se aproxime a la unidad mayor dispersin
existir en los datos observados y peor ser la representatividad del promedio.
102 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
A partir de la unidad el promedio no representa bien como medida de ten-
dencia central al conjunto de datos y debe descartarse.
2.8. Medidas de asimetra y curtosis
Una distribucin es simtrica si y slo si el diagrama de barras que la
representa es simtrico respecto de la recta x = x, siendo x la media aritmtica.
Es fcil comprobar adems que si una distribucin es simtrica, el momento
m
3
= O, pero no al revs, es decir, de que m
3
= O no se deduce que la distri-
bucin es simtrica.
Se han propuesto distintas medidas de asimetra para variables estadsticas;
entre ellas destacamos el coeficiente de asimetra de Fisher:
Si g
1
> O, la distribucin es asimtrica positiva o a la derecha:
n
o X
Si g
1
= O, la distribucin puede ser simtrica o no; si sta es simtrica se
dar siempre g
1
= O.
Si g
1
<O, la distribucin es asimtrica negativa o a la izquierda, lo
tramos en la figura de la pgina siguiente.
La simetra en una distribucin implica que Me= x. Si adems es unimo-
dal, Me= X= M
0

Cualquier cambio lineal es una variable estadstica y = ax + b, a > O y b
constantes, transforma distribuciones simtricas en otras simtricas (y asim-
tricas en asimtricas).
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
103
La curtosis o apuntamiento surge al comparar la forma de una variable
n
o
X
estadstica con respecto a la distribucin llamada normal Se mi"de f d
talme t 1 fi
, . un amen-
n e por e coe ICJente de curtosis de Fisher:
1
Si q2 .>O, tiene ms apuntamiento que la distribucin normal, y se llamar
(El grado de apuntamiento de la normal es tres como se indica
en a antenor expresin de Fisher.)
Si g2 =O, la un apuntamiento similar a la distribucin
normal, y se llamar mesocurtlca.
11
Si g2 < ?, , ti:ne menos apuntamiento que la distribucin normal y se
amar platicurtica. '
Ejemplo 2.33
Sea la variable estadstica asimtrica siguiente:
o 2
5/9 3
1
104 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Veamos que su coeficiente de asimetra es cero, por ser m
3
= O. En efecto:
1 1
=--0=0
6 9
3

Este ejemplo comprueba que si el coeficiente de asimetra de Fisher g
1
=O,
la variable no necesariamente es simtrica. Aunque la simetra implica m
3
= O,
y por tanto, g
1
=O. Luego una condicin necesaria, aunque no suficiente, para
que una variable estadstica sea simtrica, es que su coeficiente de asimetra
de Fisher g
1
sea igual a cero. Simetra implica g
1
= O pero g
1
= O no implica
simetra.
2. 9. Medidas de concentracin
En esta seccin trataremos el ndice de concentracin de Gini y la curva
de Lorentz, como instrumentos vlidos para analizar la mayor o menor con-
centracin en una distribucin de rentas de los individuos que las reciben.
ndice de concentracin de Gini
Consideremos la variable estadstica X {(x
1
, n
1
): i = 1, 2, ... , r}, donde X; es
la renta de los n
1
individuos, que ordenados en sentido creciente de rentas,
ocupan los lugares N/_
1
+ 1 hasta N/. Llamamos
u
1
= I, xini, (i = 1, 2, ... , r)
j=1
a la renta total percibida por los NJ primeros rentistas, supuesto el orden de
rentas
x
1
~ x
2
~ .. ~ X; ~ .. ~ x,.
DISTRIBUCIONES DE
FRECUENCIAS UNIDIMENSIONALES
105
Denotando
NT
P; = ~ 100 y
u.
q = ~ 1
u,
(i = 1, 2, ... , r)
donde p = 100 y q _
100 1
, d'
' ' - ' e m Ice de concentracin de Gini es
r-1
(p- q)
1 - _i =_1_.,...... __
G- r-1
L P;
1=1
Para obtener el ndice de Gini e .
que por un proceso sucesivo de cl s lcon;emente construir la tabla 2.14 ya
nos definen dicho ndice. La col cu o o tenemos las columnas q Y P; que
' . umna X;n; nos da el reparto del total de
recursos L x n entre 1 d. .
. i= 1 ; ; os Istmtos elementos de la distribucin dados por las
frecuencias absolutas n;. Las columnas Ni .
de recursos (u) y de ind' 'd
1
Y u; nos dan la evolucin acumulada
lVI uos que se los reparten (Ni) p , .
nos representa dicha evolucin d ; or ltimo, q
1
y p.
expresa a en porcentajes. '
TABLA 2.14. Elaboracin del ndice de Gini.
X
i
n;
xn
N!
U= I
U
N!
'
xjnj
q = -100
Pt =; 100 j 1 u,
X
n x
1
n
1
Nt
U = Xn
U
Nt
1
q =-100
Pt = -...!100
u,
N
x2 n2
x2n2 Nf
u2 = Xn + x2n2
u2 Ni
2
q2 = -100
p2 = ~ 1
u,
N
X n;
xini N!
U=
I
U
N!
'
xjnj
q = -100
P = --..!.100
j= 1
u, ' N
x, n,
__3:!}__
N u =
I
xjnj r
100
100
N
i=l
I xin
i=1
106
CASAS-SNCHEZ, J. M. y SANTOS-PE:"AS, J.
Si la concentracin de renta es mnima, es decir, si la renta est repartida
por igual entre los N individuos, X= x =cte., lo que implica: U= xN[, y esto
implica a su vez q = p, por lo que la renta est equidistribuida, e
Si la concentracin de renta es mxima, es decir, slo el ltimo individuo
percibe toda la renta:
por lo que
El ndice de concentracin de Gini puede tomar gradualmente valores de
O a 1, segn pase de la equidistribucin hasta el caso opuesto concentracin
mxima de la renta en un solo individuo.
Curva de Lorentz
Es la grfica 2.19 de los puntos (p, qJ, i = 1, 2, ... , r en el plano cartesiano.
La curva parte de (0, O) y llega a (100, 100). El caso de equidistribucin de la
renta corresponde a la diagonal que une (0, O) con (100, 100), y el caso de
q%
)0-+-------------""A! (100, 100)
(0, 0)
(lOO, O) p%
GRFICO 2.19. Curva de Lorentz.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 107
concentracin mxima de la renta corresponde a la curva que partiendo de
(0, llega a (100, O) mediante un segmento, y de (100, O) llega a (100, 100)
medmnte otro segmento.
Conviene aadir que el ndice de Gini es aproximadamente el rea som-
breada (entre la diagonal y la curva de Lorentz) dividida por el rea del
tringulo de vrtices (0, 0), (100, O) y (100, 100).
Ejemplo 2.34
En .una existen cuatro categoras profesionales y cada una tiene .
unos mveles de mgresos mensuales diferentes. La distribucin de frecuencias
que los niveles de ingresos y el nmero de personas en cada categora
es la s1gmente:
X (niveles de ingresos
expresados en euros) n,{ N.
0
de personas)
1.000 25
2.000 10
3.000 4
4.000 1
Obtener el ndice de Gini y la curva de Lorentz.
Solucin:
Vamos a construir las columnas que se necesitan para resolver el problema:
NT
NT u.
P = ---'- 100 U
' ' N u,
25 62,5 25.000 40,98
35 87,5 45.000 73,77
39 97,5 57.000 93,44
40 100,00 61.000 100,00
El ndice de Gini ser:
1 = (62,5 - 40,98) + (87,5 - 73,77) + (97,5 - 93,44)-
G 62,5 + 87,5 + 97,5 -
0

159
- ~ . T,.,..,
108
CASAS-SNCHEZ, J. M. y SANTOS-PEJ\IAS, J.
que al tomar un valor prximo a cero se puede concluir que existe una buena
equidistribucin en los ingresos.
La curva de Lorentz ser:
o 62,5 87,5 97,5 Pi
Ejercicios
l. Para asistir a un partido de ftbol hay dos tipos de entradas: adultos a
40 euros y nios a 5 euros. Sabiendo que el precio medio result de 12 euros.
Cul fue la proporcin de asistentes adultos?
Soluci6n:
La variable estadstica est compuesta por dos datos: x
1
= 40 euros y
x
2
= 5 euros., con frecuencias relativas respectivamente de: f
1
y !
2
= 1 - f
1

La media aritmtica es:
es decir:
12 = 40!1 + 5(1- ft) = 35!1 + 5.
Luego:
es la proporcin de asistentes adultos. (Por tanto f
2
= 1 - f
1
= 0,8 fue la
proporcin de nios espectadores entre el total.)
2. Una empresa tiene cuatro reas de produccin. Cada rea produce un
nmero distinto de bienes o servicios, que llamamos productos. Los ingresos
totales y el rendimiento por producto de cada rea son:
rea
Ingresos totales Rendimiento/producto
(euros.) ( euros.jprod ucto)
1 100.000 500
2 720.000 1.000
3 500.000 25.000
4 360.000 90.000
110 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Calcular el rendimiento medio por producto para el total de reas de la
empresa.
Solucin:
El rendimiento medio por producto ser:
4 n.
x = L X; .r:r, siendo n; el nmero de productos del rea i( = 1, 2, 3, 4) y X;
i= 1
el nmero de ptas. por producto del rea i.
donde:
100.000
n
1
= = 200 productos, y x
1
= 500 euros/producto
500
720.000
n
2
= = 720 productos, y x
2
= 1.000 euros/producto
1.000
500.000
n
3
= = 20 productos, y x
3
= 25.000 euros./producto
25.000
360.000
n
4
= = 4 productos, y x
4
= 90.000 euros./producto
90.000
4
N = L n; = 200 + 720 + 20 + 4 = 944 productos en total de todas
; = 1 las reas.
Luego
1
4
1
x =- L X;n; =-(100.000 + 720.000 + 500.000 + 360.000) =
N ;=
1
944
1
=
944
1.680.000 1.779,66 euros/producto para el total de reas
de la empresa.
3. Un sistema industrial realiza dos tipos de transformaciones: produccin
y control de calidad. El ritmo o velocidad media de produccin es de. 30
bienes/hora. El ritmo o velocidad media de control de calidad de la produccin
es de 60 productos/hora. Calcular la velocidad o ritmo medio de ambas
transformaciones, supuesto que el control de calidad afecta a toda la produc-
cin.
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
'111
Solucin:
Los ntmos med10s de produccin i't = . y de control
. . . ( nmero productos)
tiempo t
1
d l
'd d (- nmero productos)
e ca I a r
2
= . son:
tiempo t
2
y
r2 =!!.. = 60 (=> t
2
=.E_=..!!._)
t2 r
2
60
El ritmo medio de tranformacin es:
r = nmero transformaciones en total - _p_+_p_ = _2_p_ = __ 2_
tiempo en realizarlas
2 2 120
1 1 = 2 +
1
= -
3
- = 40 transformaciones/hora.
-+- --
30 60 60
Que es la media armnica de los ritmos medios de produccin y control
de calidad.
4. En cierta comunidad se han censado los establecimientos hoteleros segn
el nmero de empleados, y los datos se han presentado en una tabla agrupada
de frecuencias:
N. o de empleados
Oa5
5 a 15
15 a 50
50 a 200
N.
0
de hoteles
125
60
13
2
200
112 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Se pide:
a) El nmero de hoteles con ms de 5 empleados de esa comunidad.
b) El nmero de hoteles con ms de 5, y menos o igual de 15 empleados.
e) Representar grficamente la variable nmero de empleados.
d) Calcular la mediana del nmero de empleados y explicar en qu hip-
tesis nos basamos para realizar dicho clculo.
Solucin:
a) El nmero de hoteles con ms de 5 empleados es el total de hoteles
(200) menos el nmero de hoteles con 5 o menos de 5 empleados (125):
Es decir: 200 - 125 = 75 hoteles tienen ms de 5 empleados
b) Nos piden la frecuencia absoluta del intervalo (5, 15] de nmero de
empleados. En la tabla agrupada de frecuencias, se asigna a ste intervalo la
frecuencia absoluta 60 hoteles.
e) Mediante el histograma de frecuencias:
N.
0
de hoteles
Amplitud lnt.
0
1;5 = 25
13/35
2/150
50 200
N.
0
de empleados '
d) La frecuencia total es N = 200. Luego debemos calcular la posicin de
N/2 = 200/2 = 100. Pero 100 verifica:
0:::;100<N
1
=125,
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
113
l ~ e g o l ~ mediana, M. se. encuentra en el primer intervalo (0, 5], y bajo la
hiphtests de que .en ste mtervalo la distribucin del nmero de empleados
por otel, es umforme:
100- o
M e = O + 5 = 4 empleados
125
~ Una empresa distribuidora de bienes de consumo conoce el nmero de
clientes que demandan estos bienes, segn su cantidad distribuida
Calcular:
Distribucin
0-1.000
1.000-2.000
2.000-4.000
4.000-6.000
6.000-8.000
Clientes
8
15
45
30
2
100
a) El porcentaje de clientes que demandan ms de 1.000 bienes de con-
sumo, y 6.000 o menos.
b) El nmero de bienes ms demandado.
Solucin:
a) De 1.000 a 2.000 hay 15 clientes
De 2.000 a 4.000 hay 45 clientes
De 4.000 a 6.000 hay 30 clientes
De 1.000 a 6.000 hay 90 clientes
. Como. en total hay 100 clientes, 90 clientes representan el 90 % de los
clientes. ~ ~ en total hubiera N clientes, se obtendra por una regla de tres el
porcentaje:
90- N} 9.000
x -- 100 x=N%
114
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
b) La moda, bajo el supuesto contemplado en la teora, se calcula as:
0,015 .
M = 2.000 + 2.000 = 3.000 btenes.
o 0,015 + 0,015
6. Dada la siguiente distribucin que refleja la variable estadstica produc-
tividad en cierto sector econmico:
Intervalos
0-10
10-30
30-50
Frecuencias
32
8
10
Calcular la media, mediana y moda.
Solucin:
1 720
Media: a =
50
(5 32 + 20 8 + 40 10) = 5o = 14,4
25- o 125
M
ediana M =O+ --10 =- ~ 7 8125
e 32 16 '
Moda:
8/20 , ,
M o = O +
0
+
8120
10 = 10; se puede calcular segun se ve en teona,
pues de existir, la moqa se situara en el intervalo 0-10, pero no existe
frecuencia no nula para ningn intervalo inferior.
7. Demostrar que si los datos x
1
y x
2
son positivos, entonces
H ~ G ~ x
siendo H, G y .X, las medias armnica, geomtrica y aritmtica respectivamente,
para dichos datos.
Solucin
G=JY;
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 115
Ahora:
2x1x2 ~ ~
H ~ G ~ + ~ ..., x
1
x
2
~ 2..., x
1
x
2
~ x
1
+ x
2
~
X 1 Xz
~ 4x
1
x
2
~ xi + 2x
1
x
2
+ ~ ~
~ xi - 2x
1
x
2
+ x ~ = (x
1
- x
2
)
2
;;:, O cierto.
Tambin:
1
Fx0z ~ 2(X + X2) ~
. 1 2 . 2
~ XXz ~ 4(x
1
+ 2x
1
x
2
+ x
2
)
8. Los pesos en gramos de cierto producto agrcola, han sido anotados, as
como la frecuencia de presentacin en un cierto lote del producto.
Pesos:
Frecuencia:
70
4
74
9
78
16
82 86
30 44
90 94
36 20
98 102
12 6
Calcular la media y la desviacin tpica de los pesos, con y sin cambio de
variable.
Solucin:
Media:
1
x =
177
(704 + 749 + 7816 + 82 30 + 86-44 + 90 36 + 9420 +
1
+ 98. 12 + 102. 6) = 177 (280 + 666 + 1.248 + 2.460 + 3. 784 +
1
+ 3.240 + 1.880 + 1.176 + 612) = -15346 86 700565
177 '
Con cambio de origen y escala:
Sea 0
1
= 86 y C=4 X =4y + 86
116
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y= _1_((-4)4 + (-3)9 + (-2)16 + (-1) 30 + 0-44 + 1 36.+ 2-20 +
177
+ 3 12 + 4. 6) = -
1
-(- 16 - 27 - 32 - 30 + 36 + 40 + 36 + 24) =
. 177
1
= - 31 :::= 0,1751412
177
Entonces
31
.X= 4y + 86 = 4.
177
+ 86 :::= 86,700565
Desviacin tpica:
1339364 - (15346)2 :::= 7,0739122
s = J?' = J az - a
2
= 177 177
donde
=-
1
-(7024+ 7429 + 78216 + 82
2
30+ 86
2
-44 + 90
2
36 + 94
2
20+
a2 177
+ 982 12 + 1022. 6) = + 49.284 + 97.344 + 201.720 + 325.424 +
1.3
39

364
7567 0282
+ 291.600 + 176.720 + 115.248 + 62.424) = 177 :::= '
Con cambio de origen y escala:
Sea 0
1
= 86 Y
C=4
X= 4y + 86
+ 2220 + 3212 + 426) = + 81 + 64 + 30 + 36 + 80 + 108 +
1
+ 96) = -559 :::= 3,1581921
177
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 117
Entonces:
S = C Sy = 4sy 7,0739156
La variacin en millonsimas, entre las dos formas de calcular la desviacin
tpica de la variable x, se debe a la correspondiente aproximacin de decimales.
9. En un determinado pas se sabe que la renta media es de 2.000.000 de
u.m.jao y su varianza es 90.000 (u.m.)
2
en ese ao. Cinco aos despes, la
renta media se elev a 2.600.000 u.m.jao, y su varianza result ser 125.000
(u.m.)
2
Determinar:
a) En qu ao, inicial 5 aos despus, hubo mayor dispersin ab-
soluta?
b) En qu ao hubo mayor dispersin relativa?
Solucin:
a) La dispersin absoluta se mide por la varianza:
90.000 = < si = 125.000 (hubo mayor dispersin absoluta 5 aos despus).
b) La dispersin relativa se mide usualmente por el coeficiente de varia-
cin de Pearson:
J9o:OOo s
0
s
1
.)125.000
o,ooo15 =
2
_
000
_
000
= xo > _x
1
=
2
.
600
_
000
0,00013598207
(hubo mayor dispersin relativa el ao inicial)
Aunque la dispersin absoluta ha aumentado tras los cinco aos, y por
ello cabra suponer que las desigualdades en la renta han aumentado, con la
dispersin relativa se constata una disminucin en las desigualdades econmi-
cas de la renta percibidas, por lo que podramos concluir que se ha avanzado
en la disminucin relativa de las desigualdades sociales o no redistribucin
de la renta, en cuanto a la renta percibida en relacin a las medias de la renta
de cada ao, segn la informacin del enunciado del problema.
118 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
10. Una variable estadstica, que mide el saldo de una cuenta corriente a
fin de ao, presenta los siguientes datos en tres aos consecutivQS:
10.000 euros
80.000 euros
- 10.000 euros
Obtener la media geomtrica y comentar el resultado.
Solucin:
g = .V1o-1o
3
. 8010
3
( -10)10
3
= 1o
3
V -8.ooo = -2o.1o
3
=
= -20.000 euros< mn{10.000; 80.000; -10.000}
Para estos datos, la media geomtrica es una mala medida de posicin pues
se sita muy a la izquierda de, o inferior a, cualquiera de los tres datos
disponibles y no entre ellos, como sera deseable en una medida de posicin.
11. Los datos de una variable estadstica recogen las tarifas, de una com-
paa de transportes y distribucin, cobradas en ijn perodo temporal, y son
recogidas en tres tipos de albaranes segn la cuanta econmica de la mer-
canca. Los tres tipos de albaranes contienen todas las facturas cobradas a los
clientes y cada factura, segn su cuanta se recoge en un solo tipo de albarn.
Si el nmero de facturas, en ese perodo, han sido de N
1
= 700, N
2
= 500 y
N
3
= 25, para cada tipo de albarn, y en media aritmtica el ingreso ha sido
de x
1
= 3.500 euros; x
2
= 15.000 euros y x
3
= 225.000 euros para cada tipo
de albarn. Se pide: hallar el ingreso medio por factura del total de cobros.
Solucin:
Llamando N= N
1
+ N
2
+ N
3
= 700 + 500 + 25 = 1.225,
al total de facturas o albaranes, la media aritmtica pedida es:
1
3
1
X = N

N; X = 1.
225
(700 3.500 + 500 15.000 + 25. =
1
= 1.225 (2.450.000 + 7.500.000 + 5.625.000) =
1
= 1.
225
15.575.000 12.714,286 euros
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES
119
pues
(i = 1, 2, o 3)
denotando por X;i la factura j-sima cobrada en el albarn tipo i;
i = 1, 2 o 3 y
j = 1, 2, ... , N.
12. Una empresa vende dos X e Y. En su entorno, la distribucin
de ventas de est.os productos ttene las siguientes frecuencias (nmero de em-
presas con tal mvel de ventas):
Ventas del
Frecuencia
Ventas del
producto X
producto Y
Frecuencia
0-40
25
0-100
52
40-100
54
100-500
63
100-300
21
500-2.000
85
100
200
Si la_ empresa vende 72 productos X, y 700 productos Y, en qu producto
X Y ttene mayor penetracin relativa entre las empresas del mercado en su
entorno?
Solucin:
72 = 40 + 100px - 25. 1 [ 54]
54 60 => Px =
100
25 + (72 - 40)
60
= 0,538
700 = 500 + 200Py- 115.
85 1.500 =>
=> Py =
20
1
0
[115 + (7oo- =o 6316
1.500 '
120
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
De este modo hemos calculado Px y Pr que son las proporciones de
empresas del entorno que venden menos del producto X, e Y; pues 72 ~ s un
cuantil Q de la variable estadstica Ventas de X, y 700 es otro cuanttl QPr
Px
de la variable Ventas de Y. .
En X la empresa supera en ventas al 53,8 % de las e m ~ e s s competidoras.
En el producto Y, la empresa supera en ventas al 63,16% de las empresas
de la competencia.
Luego tiene mayor penetracin en el sector del producto Y, que en el sector
de vendedores del producto X.
3.1.
Captulo 3
Distribuciones de frecuencias
bidimensionales
Introduccin
A lo largo del Captulo 2 hemos estudiado con detenimiento el comporta-
miento de una sola caracterstica o variable estadstica que hemos medido u
observado en un conjunto de elementos o individuos que formaban una po-
blacin estadstica o una muestra representativa de la misma. Pero podemos
estudiar para cada elemento de la poblacin dos o ms caractersticas de tipo
cualitativo (que como sabemos vienen dadas en escalas nominales u ordinales)
o cuantitativo (medidas en escalas de intervalo o de razn). Como sabemos
estas variables o caractersticas pueden ser de naturaleza continua (toma infi-
nitos valores no numerables) o discreta (toma un nmero finito o infinito
numerable de valores).
Lo habitual es que se estudien al mismo tiempo varias caractersticas de
los elementos de una poblacin estadstica. Consideremos, por ejemplo, que
nuestro objetivo es estudiar las causas que originan los distintos niveles de los
gastos de los individuos varones mayores de 18 aos de la Comunidad de
Madrid. Adems de la mencionada variable, que normalmente se medir en
una muestra representativa de la poblacin estadstica (individuos varones
mayores de 18 aos en la provincia de Madrid), nos interesar medir otras
caractersticas que pensamos que estn relacionadas con ella: ingresos del
individuo (variable cuantitativa continua), estado civil (variable cualitativa),
nmero de habitantes del municipio donde vive (variable cuantitativa discreta),
forma de locomocin que emplea con ms frecuencia (variable cualitativa),
aficiones que tiene (variable cualitativa), edad (variable cuantitativa continua
o discreta si se expresa en aos enteros).
122
CASAS-SNCHEZ, J. M. y SANTOS-PENAS, J.
Todas estas caractersticas influirn en distinto grado en los niveles de
gastos y nos podrn explicar su comportamiento. En general, a mayores
ingresos existir un mayor gasto, los tramos de edad ms bajos gastarn ms
ya que tendrn ms movilidad y mayores aficiones ldicas que comportan un
mayor dispendio. Como es lgico podr estudiarse separadamente cada carac-
terstica construyendo su distribucin unidimensional y calculando sus medi-
das de posicin y dispersin, como se ha indicado en el Captulo 2; pero lo
normal presentar ms de una con el
de estudiar sus posibles relaciOnes y responder a cuestiOnes como las sigUien-
tes: en qu medida el nivel de ingresos determina el nivel de gastos?, existe
relacin entre el nivel de gastos y la edad?, y el estado civil?, y el tamao
del municipio?, etc. En los apartados que siguen se estudiarn cuestiones tales
como las distintas tabulaciones de las variables estadsticas bidimensionales y
los nuevos conceptos que generan (distribuciones de frecuencias marginales
y condicionadas), el concepto de independencia estadstica, y la regresin y
correlacin entre variables;
3.2. Tabulacin de variables estadsticas
bidimensionales: distribuciones
bidimensionales de frecuencias
Vamos a considerar dos tipos de tabulaciones: para variables cuantitati-
vas y para variables cualitativas. En el primer caso el resultado de la tabu-
lacin recibe el nombre de tabla de correlacin y en el segundo tabla de
contingencia.
3.2.1. Tablas de correlacin
Partimos de una poblacin estadstica en la que se estudian simultnea-
mente dos variables o caractersticas cuantitativas que nos definen una varia-
ble estadstica bidimensional.
Llamando X e Y a las variables consideradas, podemos construir la llama-
da tabla de correlacin. Los datos en que se presenta la variable X, los
denotamos X (i = 1, 2, ... , r). Los datos en que se presenta la variable Y, los
denotamos yi U = 1, 2, ... , s). Sea n;i la frecuencia absoluta con que se presenta
el par simultneo (x;, yi). La distribucin conjunta o bidimensional ser la de la
tabla 3.1. -
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 123
TABLA 3.1. Tabla de correlacin

Yt Yz yj Ys ni.
X nll nz nli nls nL
Xz nz nzz nzi nz. nz.
X n; n;z nii nis
n.
..
x, n, n,z nrj n .. n,.
n.i n.l n.z n.i n . N
r s
As N = n;i es la frecuencia absoluta total o nmero de unidades
i=l j=l
r s
en la poblacin. Tambin: n.i = n;i y n;. = nii
i=l j=l
Con lo que se construyen la ltima fila y la ltima columna de la tabla de
correlacin que se denominan frecuencias marginales.
Considerando estas expresiones es evidente que:
r s r s
" n. = " n . = " " n .. = N L. l. L... .J L. L. l)
i=l j=l i=l j=l
Las tablas de correlacin del tipo de la 3.1 se construyen cuando el nmero
de observaciones es elevado y existe tambin un elevado nmero de pares de
valores (x;, yi) en los que i = j i ,. j. Tambin puede darse el caso que sea
conveniente, para hacer la distribucin ms manejable, agrupar los valores de
las variables en intervalos de clases con lo que los respectivos (x, yi) seran
las correspondientes marcas de clase.
Ejemplo 3.1
Se ha efectuado una encuesta a 100 familias preguntndoles sus ingresos
anuales (X) y el nmero de miembros (Y) que los aportan. Los ingresos se han
expresado en miles de euros y se han agrupado en cuatro intervalos de clases
con lo que X son las respectivas marcas de clases. Los resultados de la
tabulacin han sido los de la tabla 3.2
En la tabla 3.2 se observa que de las 100 familias slo hay, por ejemplo,
15 en las que el dinero lo aparta una sola persona y sus ingresos estn com-
prendidos entre 10.000 y 15.000 euros; 30 en las que los ingresos los aportan
124
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
TABLA 3.2. Tabla de correlacin de los ingresos familiares y el nmero de miembros que
los aportan

)
1 2 3 n;.
S
S
L_
1
- L; X
10-15 12,5 15 2 1 18
15-20
17,5 10 20 2 32
20-30
25,0 12 30 4 46
30-50
40,0 1 2 1 4
n.i
38 54 8 100.
dos personas y estn comprendidos entre 20.000 y 30.000 euros y as sucesiva-
mente se interpretan las frecuencias absolutas conjuntas n;j. Las marginales.n;.
y n.i nos sealan el nmero de veces que se repiten los valores de X; e Yi por
separado sin que se establezca entre ellas ninguna relacin conjunta. As de
las 100 familias 38 tienen un slo miembro que ingresa dinero, 54 dos miem-
bros y 8 tres. Al observar los niveles de ingresos representados por X vemos
que 18 estn en el primero, 32 en el segundo, 46 en el tercero y slo 4 familias
pertenecen al cuarto nivel de mayores ingresos.
Tambin se puede construir la tabla de correlacin de frecuencias relativas
sin ms que dividir toda frecuencia absoluta por el nmero total de observa-
ciones N:
Es inmediato comprobar que la suma de todas las frecuencias relativas es
la unidad:
r S r S n.. 1 r S N
I I hi=" I I _y_="_ I I n;j=-=1
i=t i=t i=t i=t N N i=t i=t N
Las frecuencias relativas marginales sern:
S
" n .. L. lJ S S
n;. i=
1
" n;i "
h. = N = -N = .L.... N = .L.... hi
J=l J=l
r
" n ..
L. ZJ r r
_ n.i _ i= 1 _ " n;i _ "
fi - N - -N - .L.... N - .L.... hi
.=1 _::::: 1
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 125
Tambin se verifica que:
r s r s
I h. = I fj = I I hi = 1
i=1 j=l i=1j=1
Ejemplo 3.2
partir de la Tabla 3.2 obtener la tabla de correlacin de frecuencias
relatlvas.
Solucin:
Dividiendo. las frecuencias absolutas por el total de observaciones la
tabla ser la stgutente:
TABLA 3.3. Tabla de correlacin de frecuencias relativas

1 2 3
h.
12,5 0,15 0,02 0,01 0,18
17,5 0,10 0,20 0,02 0,32
25,0 0,12 0,30 0,04 0,46
40,0 0,01 0,02 0,01 0,04
fj 0,38 0,54 0,08 1
?uanto pocas observaciones y las frecuencias son unitarias no tiene
sentldo una tabla de correlacin ya que muchas de las celdillas de
las absolutas seran cero. En este caso, la distribucin bidimensio-
nal es stmplemente dos columnas que se expresan de la forma siguiente:
X Y;
X
Yt
Xz Yz
X Y;
x, Yr
As, por ejemplo, el valor de la produccin (yJ expresado en millones de
euros Y nmero de trabajadores (xJ de cinco empresas del sector de la
construcctn se tabular de la forma siguiente:
126 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Y; X
1.500 350
2.500 500
5.000 800
10.000 1.500
15.000 1.700
Aunque las frecuencias conjuntas no sean unitarias, si el nmero de pares
de valores de la variable bidimensional es reducido, tampoco es necesario
construir una tabla de correlacin ya que es suficiente una tabulacin a tres
columnas de la forma siguiente:
X Y;
xl Y1
Xz Yz
X Y;
x,
Yr
n,
N
As, por ejemplo, la siguiente tabla es una tabulacin de 500 empresas en
las que se ha estudiado su nivel de produccin en tres intervalos expresados
en millones de euros, y su nmero de trabajadores:
Produccin (y;)
[100-200]
(200-400]
(400-1.000]
N.
0
de trabajadores (x;)
[20-50]
(50-80]
(80-200]
Distribuciones marginales de frecuencias
Definicin 3.1. Distribuciones marginales de frecuencias.
300
150
50
Dada una distribucin bidimensional de las variables (X, Y), llama-
mos distribuciones marginales de dichas variables a los conjuntos:
{(x;, n;.): i = 1, 2, ... , r}, distribucin marginal de X
{(yi, n): j = 1, 2, ... , s}, distribucin marginal de Y
Luego las marginales de una distribucin bidimensional es el estudio
unidimensional de cada componente con independencia del otro.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
127
. Expresadas en forma de columnas las distribuciones marginales de frecuen-
Cias de la Tabla 3.1 seran:
X
n;.
Yi
n .
J
xl
Y1 n.l
Xz nz.
Yz n.z
X
n;.

n.
;J
x, n,_
Ys n .
. J:?e distribuciones marginales, como en esencia son distribuciones
u_mdrmenswnales ya que expresan el estudio de cada variable con independen-
Cia de la otra, obtenerse todas las medidas de posicin, dispersin, etc.
que han :studiado en el Captulo 2 de las variables unidimensionales
(medias margmales, varianzas marginales, etc.).
Ejemplo 3.3
De la tabla de correlacin 3.2 obtener las distribuciones de frecuencias
marginales, la moda de Y y la media aritmtica de X.
Solucin:
a) Distribuciones marginales de frecuencias:
X n.
'
yj n.
}
12,5 18
1 38
17,5
32
25,0 46
2 54
40,0 4
3
8
b)
Moda de Y: M.= 2.
e)
Media aritmtica de X:
- 1 r
X=- x.n. =
N ''
i= 1
1
=
100
[12,5 18 + 17,5 32 + 25,0 46 + 40,0 4] = 20.950 euros
128 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Dada una tabla de correlacin bidimensional siempre se pueden obtener
sus dos distribuciones marginales con la simple suma por filas y columnas de
sus frecuencias conjuntas. Pero la inversa no es siempre cierta; o sea, dadas
las distribuciones marginales no siempre puede elaborarse de modo nico la
distribucin conjunta (X, Y) = {(x, yi; ni): i = 1, 2, ... , r; j = 1, 2, ... , s}.
Vemoslo con un ejemplo:
Si
n1. = 6}
n = 9
2.
n = 15
3.
y
n = 6}
.1
n.
2
= 15
n.
3
= 9
son las frecuencias marginales de la variable estadstica bidimensional
(X, Y)= {(x, yi; ni): i,j = 1, 2, 3}, sta no est determinada; para ello. podem?s
proponer dos posibles variables bidimensionales distintas con las mismas dis-
tribuciones marginales:
a) b)

Y! Y2 Y3
n.

Y1 Y2 Y3
n.
'
xl o 6 o 6 X o 6 o 6
x2 2 6 1 9 x2 3 3 3 9
x3 4 3 8 15 x3 3 6 6 15
n.
.J
6 15 9 30 n.
.J
6 15 9 30
Esto comprueba que dadas las distribuciones marginales, no siempre se
puede reconstruir la variable estadstica bidimensional conjunta de modo nico.
Distribuciones condicionadas de frecuencias
Definicin 3.2. Distribuciones condicionadas de frecuencias.
Dada una variable estadstica bidimensional (X, Y), llamamos varia-
ble X condicionada a que Y= yi, y denotaremos (XI Y= y) a la variable
estadstica que toma los valores X con frecuencia absoluta nJ:
(X 1 Y= y} = {(x, nii) : i = 1, 2, ... , r} para cualquier j = 1, 2, ... , s.
r
La frecuencia total de (X 1 Y= Y} es n.i = L nii.
i= 1
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
129
Anlogamente se define la variable estadstica Y condicionada a que
X = X, denotndola
(Y 1 X = X) = {(yi, n;) : j = 1, 2, ... , s} para cualquier i = 1, 2, ... , r
S
La frecuencia total de (Y 1 X = xJ es n;. = L n;i .
j=l
Las frecuencias relativas condicionadas de las variables (X 1 Y= yi) e
(YI X= xJ sern respectivamente:
n ..
Jj; = n:J
l.
Puede observarse que pueden definirse tantas distribuciones de frecuencias
condicionadas como valores tienen las variables X e Y ya que cada una queda
determinada por la f.tla o la columna del correspondiente valor que condiciona.
Las distribuciones condicionadas tambin son unidimensionales y por tanto
pueden obtenerse todas las medidas de posicin y dispersin de las mismas.
Ejemplo 3.4
De la tabla de correlacin 3.2 obtener: a) La distribucin de Y condicio-
nada a que X = 175. b) Obtener la moda, media aritmtica, la desviacin
tpica, y el coeficiente de variacin de dicha distribucin.
Soluci6n:
a) El valor que condiciona X = 175 nos define la segunda fila de frecuen-
cias absolutas conjuntas nii que son las que formarn la distribucin junto con
los valores de la variable Y. Luego la distribucin pedida es una unidimensio-
nal formada por las siguientes columnas:
Y= YiiX = x
2
= 175
1
2
3
10
20
2
130 CASAS,SNCHEZ, J. M. y SANTOS,PEAS, J.
b) La distribucin obtenida anteriormente se manipula como una unidi,
mensional para obtener las distintas medidas de y dispersi9n:
M
0
(Y JX = 175) = 2
Lo que nos indica que lo ms frecuente son dos miembros por familia los
que aportan ingresos dentro del segundo intervalo 15-20.
- 1 56


=
32
(110 + 220 + 32) =
32
= 1,75
Son 2 miembros por familia los que aportan ingresos dentro del inter-
valo comprendido entre 15.000 y 20.000 euros. Recordemos que cuando la
variable es de tipo discreto, como en este caso (Y son individuos) no tienen
sentido los decimales dando el resultado por exceso o defecto en nmeros
enteros.
s
2
= _.!._ [(1 - 1 75)
2
. 10 + (2 - 1,75)
2
. 20 + (3 - 1,75)
2
. 2] =

32
'
= _.!._ [5,625 + 1,25 + 3.125] = 0,3125
32
0,56
El coeficiente de variacin de Pearson ser:
0,56 0,32
1,75
Este coeficiente nos indica, expresado en tantos por 100, que la desviacin
tpica supone un 32 % de la media aritmtica con lo que podemos admitirla
como promedio que nos representa al conjunto de la distribucin. Hasta un
50 % de participacin de la dispersin en el promedio se considera como
aceptable la representatividad. Algunos autores son ms estrictos y no aceptan
promedios en los que el coeficiente de variacin sea superior al 10%.
Momentos en las distribuciones bidimensionales
Igual que en las unidimensionales los momentos son medidas que reducen
los datos de una variable estadstica, que en este caso ser bidimensional,
permitiendo tener una idea general de la distribucin sin tener que enumerar
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
131
todos los pares de valores (x;, Y) con sus frecuencias absolutas n; .. Podemos
distinguir dos tipos principales de momentos: con relacin al origen o con
respecto a las medias.
a) Momentos respecto al origen
Llamamos momento de orden h, k respecto al origen de la distribucin
conjunta (X, Y) al valor:
(h, kEN)
Algunos casos de este tipo de momentos con relieve son:
r n.
" ' alo = LJ X; N

r

2
n;.
x.-
'N
b) Momentos respecto a las medias
(media marginal de X)
(media marginal de Y)
n.
ao2 = L yJNJ
1
y
(momento producto)
El momento de orden h, k respecto a las medias de la variable estadstica
bidimensional (X, Y) es:
(h, kEN)
Como ;jemplo, = m01 =O. El momento m
20
es la varianza de x, S
2
(X),
y m02 =S (Y). Es duecto comprobar que m
20
= a
20
- ai
0
y m
02
= a
02
-


El momento m11 recibe el nombre de covarianza de las variables X e Y, y
le denotamos Cov (X, Y) 6 Sxy
132
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ejemplo 3.5
Disponemos de la siguiente tabla de correlacin que recoge la ~ a r i a b l ~
estadstica bidimensional (X, Y) donde X es el nmero de transferencras recz-
bidas por una sucursal bancaria al da, e Y el nmero de transferencias
enviadas desde la misma sucursal el mismo da. Los datos se han anotado
durante un total de 18 das hbiles.
~
1 2 3
2 1 4 1 6
3 2 4 2 8
4 1 2 1 4
4 10 4 18
Obtener algunos momentos de relieve.
Soluci6n:
1 1 26
a = -(26 + 38 + 44) =-52=-
10
18 18 9
1 1
a =-(14+210+34)=-36=2
01
18 18
1
a = -(2 11 + 2 2 4 + 2 3 1 + 3 1 2 + 3 2 4 + 3 3 2 + 4 1 1 +
11
18
1 104 52
+422 + 431) = 18(24 + 48 + 32) = 18 = 9
1 1 ~ w
a = -(22. 6 + 32.8 + 42. 4) = -(24 + 72 + 64) = -18 = -9
20 18 18
80 (26)2 720 - 676 44
m2o = a2o - aio = 9- 9 = 81 = 81
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
- 1 ( 2 2 2 80 40
. a02 -
18
1 4 + 2 10 + 3 4) =
18
= 9
2 = 40 - 22 = 40 - 36 4
mo2 = ao2 - ao1
9 9 9
Independencia estadstica
133
Dos variables estadsticas X e Y son independientes entre s cuando la
variacin de una de ellas no influye en la distribucin de la otra condicionada
por el valor que tome la primera. Por el contrario existir dependencia cuando
los valores de una condicionan la distribucin de los valores de la otra. Acudien-
do a la defmicn que se dio de frecuencia relativa condicionada tenemos que:
n;
n.. N ;.
;/} = ..21. = - = ..Y.
n_
1
n.
1

1
N
;} = ;/} -/ [3.1]
La expresin [3.1] nos indica que la frecuencia relativa conjunta de
(X = X, Y= y) es el producto de la frecuencia relativa de X; condicionada por
Y= yi, por la frecuencia relativa marginal Ji cuando existe independencia
estadstica; o sea que el valor y
1
que condiciona influye en la distribucin de
la variable X;- Si existe independencia estadstica es evidente que las frecuencias
relativas de X condicionadas por los distintos valores de yi, seran todos
iguales entre s e iguales a la frecuencia relativa marginal de X ya que dichos
valores Yi no influyen para nada en la distribucin de la variable X;. O sea, se
cumplir que:
;/1 = ;/2 = ;/3 = ... = ;/} = ... = ;. = ;_
O lo que es lo mismo:
nu n
2
n;. nil + n;
2
+ ... + n;. n;.
-=-= ... =-= =-=;
n.
1
n.
2
n.. n.
1
+ n.
2
+ ... + n.. N '
[3.2]
[3.3]
Sustituyendo en la expresin [3.1] la frecuencia relativa condicionada ;
11
por la marginal;_ de la expresin [3.2], ya que estamos bajo la hiptesis de
independencia estadstica, tenemos que:
;
r f b' n;i = n; . . n.J
ii =Ji .. j o len N N N
134
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Definicin 3.3. Independencia estadstica.
Dadas las variables estadsticas X e Y, la condicin necesaria y sufi-
ciente para que sean independientes es:
y V j = 1, 2, ... , s)
Una propiedad de inters es que si X e Y son independientes, entonces la
covarianza entre ellas es nula. Veamos para ello que
T S n.. T S ni. n.. T ni. S n.j
a -" "xy ''-" "x.y.-__.1=" x,.-" y,.-=atoaol
11
- ; ~ i ~ t i i N - i ~ t i ~ t '
1
N N ; ~ N i ~ l N '
pero como m
11
= a
11
- a
10
a
01
= a
10
a
01
- a
10
a
01
=O, que es lo que que-
ramos probar.
Sin embargo, que Cov (X, Y) = O no implica que X e Y sean independientes.
Esto puede comprobarse con un contraejemplo en que X e Y sean dependien-
tes (o no independientes) y adems m
11
= O.
Ejemplo 3.6
En la tabla de correlacin presentada en el Ejemplo 3.5, las variables X e
Y son dependientes, pues por ejemplo:
La independencia estadstica entre x e y, exige que para todo i = 1, 2 y 3,
y todo j = 1, 2 y 3, se verifique:
como esto no se da para algn par (i, j), concretamente para i = 2 y j = 1,
concluimos que X e Y son dependientes.
Adems, vimos en el Ejemplo 3.5 que m
11
= Cov(X, Y) = O, por lo que ste
es un contraejemplo de que m
11
= O equivale a que X e Y son independien-
tes. Efectivamente, hemos demostrado que si X e Y son independientes, esto
implica que m
11
= Cov(X, Y) = O. Pero no ocurre lo recproco: si m
11
= O no
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 135
necesariamente X e Y son independientes, como ocurre en el ejemplo presen-
tado en el que m
11
= O y las variables X e Y son dependientes.
3.2.2. Tablas de contingencia
En los estudios socioeconmicos se analizan en muchas ocasiones variables
de tipo cualitativo que slo admiten escalas nominales y como mucho ordina-
les (sexo, nacionalidad, profesiones, niveles de estudios, imagen de polti-
cos, etc.). Como ya se coment en los anlisis unidimensionales, en las varia-
bles cualitativas no tiene sentido la obtencin de promedios si se excepta la
moda en las de escala nominal y la mediana en las de escala ordinal. Luego
en este tipo de anlisis no tiene ninguna lgica la definicin de momentos
respecto al origen o respecto a la media.
Lo que s se puede es obtener sus respectivas tablas de frecuencias que en
el caso de las bidimensionales se las denomina tablas de contingencia. Es una
tabla de doble entrada como la 3.4 en la que en la primera columna y primera
fila se expresan las modalidades de los atributos M y M'; en las celdillas
centrales estn las frecuencias absolutas conjuntas nii. La ltima columna y la
ltima fila nos definen lo mismo que en las tablas de correlacin las frecuencias
marginales del atributo M y el M' con las que pueden construirse las dos
distribuciones marginales o unidimensionales representadas por los conjuntos
{(M;; n;.) para i = 1, 2, ... , r} y {(Mj; n.) para j = 1, 2, ... , s}. Tambin pueden
definirse las correspondientes distribuciones condicionadas de frecuencias da-
das por los conjuntos
M,
n.J
{(M/M' = Mj); nij para i = 1, 2, ... , r}, y
{(M'/M = M;); n;j para j = 1, 2, ... , s}.
TABLA 3.4. Tabla de contingencia
M'
1
n.l
M'
2
n.z
M ~
J
n.j n.s
n.
..
n,.
N
136 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Como a las variables cualitativas no se las puede someter a las operaciones
de sumas, restas y divisiones, al venir expresadas en escalas nomiqales u
ordinales, no tiene sentido el hablar de medias marginales o condicionadas o
de varianzas o desviaciones tpicas. Lo que s cabe es establecer el concepto de
independencia estadstica entre variables cualitativas ya que como vimos en las
tablas de correlacin de las variables cuantitativas, en su definicin slo inter-
vienen determinadas propiedades de las frecuencias relativas tanto conjuntas
como marginales. Luego la condicin necesaria y suficiente para que los
atributos M y M' sean independientes es que la frecuencia relativa conjunta
sea igual al producto de las frecuencias relativas marginales:
nii =ni .. n.i
N N N
V i,j
La deduccin de la anterior expresin es idntica a la efectuada para las
tablas de correlacin de variables cuantitativas.
Ejemplo 3.7
Se han observado 100 conductores de turismo de los cuales 40 estn
casados y 60 solteros. De los primeros 5 han sufrido algn tipo de accidente
en el ltimo afio y de los segundos han sido 15. Obtener: a) La tabla de
contingencia. b) Las distribuciones marginales y sus respectivas modas. e) La
distribucin de los accidentes condicionada a que sean solteros con su respec-
tiva moda. d) Comprobar si los dos atributos son independientes.
Soluci6n:
a) Tabla de contingencia
~ Con ocldente
Casados 5
Solteros 15
n.j 20
Sin accidente
35
45
80
n'.
l.
40
60
100
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
b) Distribuciones marginales
M
Casados
Solteros
40
60
M'
Con accidente
Sin accidente
20
80
137
La moda del atributo estado civil es solteros y de los accidentes es sin acci-
dente.
e) La distribucin de los accidentes (M') condicionada a ~ u sean solteros
ser:
La moda es sin accidente.
M'/M =Solteros
Con accidente
Sin accidente
15
45
60
d) Independencia estadstica. Se construye una tabla de frecuencias rela-
tivas
>(
Con accidente Sin accidente
Casados 0,05 0,35
Solteros 0,15 0,45
n .
....:l.
0,20 0,80
N
Como en la primera comprobacin
nu n.l nl.
N =/= N N, ya que 0.05 =/= 0.20 0.40,
n,.
N
0,40
0,60
1
se puede decir que los dos atributos M y M' no son independientes estadsti-
camente hablando.
Tambin se pueden elaborar tablas de contingencia combinando caracters-
ticas cualitativas con cuantitativas: sexo con edad, hbitat donde viven las
familias (rural o urbano) con niveles de renta, etc.
138
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
En las distribuciones bidimensionales tambin pueden establecerse repre-
sentaciones grficas. Como las marginales y son
nales todos los grficos estudiados en el captulo 2 son a las nusmas.
En las conjuntas se acudir a las tres dimensiones. En un eJe la
variable X en el otro la Y y en el tercero la frecuencia conJunta nu. SI los
valores de la variable no estn agrupados la figura ser un diagrama de barras
en tres dimensiones. Si estn agrupados (slo para variables de tipo cuantita-
tivo que admitan las escalas de intervalo o razn) sern tridimen-
sionales que nos generan estereogramas formados por una sene de parale-
leppedos cuyos respectivos volmenes son proporcionales a las n;i'
3.3. Dependencia funcional y dependencia
estadstica
Es frecuente encontrarse cuando se estudian conjuntamente dos caracters-
ticas
0
variables que exista una relacin de dependencia entre las mismas.
dependencia tiene dos naturalezas: dependencia que es cuando
una relacin matemtica exacta entre las dos vanables y dependencia es-
tadstica que se caracteriza por una relacin aproximada lo.s dos fen-
menos. La dependencia funcional se puede representar segun mdica el grfi-
co 3.1 en el que los pares de valores observados de una _variable
(x;, y;) pertenecen exactamente a la funcin matemtica que hga a las
variables que en este caso es una recta. Podra representar un fenmeno fsico
y
Ys
Y4
Y3
Y2
YI
XI X2 X3 X4 X5
X
GRFICO 3.1. Dependenciafuncional exacta de tipo lineal.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 139
que es el espacio {y;) que recorre un vehculo que va a una velocidad constante
(b) en distintos perodos de tiempo (xJ A cada valor X; le corresponde un slo
valor Y; dado por la funcin matemtica que liga a las variables.
La dependencia estadstica, expresada en trminos aproximados, ocupa en
la teora del conocimiento econmico un lugar preponderante a la hora de
constrastar determinadas hiptesis de dependencia funcional formuladas por
la teora econmica. Luego debe haber un planteamiento terico previo al
estudio estadstico para no llegar a conclusiones que no tengan sentido. Puede
darse el caso, por ejemplo, que exista dependencia estadstica, por puro azar,
entre la evolucin del nmero de accidentes de automviles y la produccin de
queso manchego. De ello no podemos sacar la conclusin de que una variable
determina a la otra ya que no tiene ningn sentido. S parece lgico formular
que el nivel de gasto de los hogares est dependiendo .de su renta disponible.
Pero esta dependencia no es de tipo matemtico-funcional sino estadstica. Si
se observan un conjunto de pases de valores de renta disponible y niveles de
gastos nos encontraremos que para un mismo nivel de renta pueden darse
distintos niveles de gastos ya que existen otra serie de caractersticas, adems
de la renta, que influyen en el gasto aunque sea de forma menos relevante.
Este tipo de fenmenos se representan en un sistema de ejes, a travs de
una nube de puntos como se indica en el Grfico 3.2. Por ejemplo, la figura
a) representa una dependencia lineal positiva (al crecer la renta disponible X
tambin crece el consumo familiar Y). Puede observarse que en la dependencia
estadstica los pares de valores observados (x;, Y;) ya no estn alineados como
se indica en el Grfico 3.1 con la dependencia funcional. Tambin nos indica
la nube de puntos que la relacin entre x e y es de distinta naturaleza: lineal
positiva representada por la figura a); lineal negativa expresada en la figura
b); curvilnea segn la forma de la figura e); sin ninguna relacin como se
indica en la figura d); etc.
Existen tres motivos fundamentales por los que una variable que vamos a
llamar dependiente o endgena est influida por otra que acta como indepen-
diente o exgena: la casualidad o el azar ha hecho que ambas variables estn
relacionadas estadsticamente (por ejemplo, como se ha sealado, el mimero
de accidentes de automvil y la produccin de queso manchego); una tercera
variable est determinando a las que estamos estudiando (por ejemplo el
consumo de caviar y la compra de yates de recreo estn determinadas por la
renta disponible de las personas) y, por ltimo, puede existir una relacin
causa-efecto como el ejemplo de que los niveles de consumo estn determina-
dos fundamentalmente por la renta disponible. En los estudios estadsticos de
los fenmenos socioeconmicos slo nos deben preocupar las relaciones de
causa-efecto que son las que tienen una base terica.
Las nubes de puntos de la forma del Grfico 3.2 nos sealan el tipo de
ligazn existente entre Jas dos variables. La regresin es una parte de la
140
y
y
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
X X
X X
X X
X X X X
X X X
Xx X
xx
(a)
X
X
X X
X
X X
X Xx
X
XX
X X X
X X
(e)
X
X
y
y
XX
X X X
X X
X X
X
X X
X
X
X
X
X
X
X
X X
(b)
X
X
(d)
X
X
X
X
X
X
X
GRFICO 3.2. La dependencia estadstica expresada por las nubes de puntos de las
observaciones.
Estadstica Descriptiva que nos ensea a determinar la lnea hacia la que
tiende la nube puntos. Luego la Teoa de la Regresin nos permite pasar de
la dependencia estadstica representada en una nube de puntos a la dependen-
cia funcional dada por una lnea de regresin. Existen dos formas de obtener
la lnea de regresin: a travs del empleo de las distribuciones de frecuencias
condicionadas o a travs de los ajustes mnimo-cuadrticos.
Vemos como se construirla por el primer mtodo la lnea de regresin de
Y sobre X cuando Y es la variable dependiente o efecto, y la X es la indepen-
diente o causa. Para ello, si hay r observaciones consideramos t o d ~ distribu-
ciones condicionadas:
Yfx
1
, Yfx
2
, , Y/x,.
En estas distribuciones, al ser unidimensionales se obtienen las correspon-
dientes medias aritmticas:
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
141
formando la siguiente lnea quebrada de puntos
que es la lnea de regresin tal y como se indica en el Grfico 3.3. Hemos
p s ~ d o de la nube de puntos en la que a cada valor xi le pueden corresponder
vanos valores de Yi (por ejemplo a un mismo nivel de renta pueden corres-
ponderle varios niveles de consumo ya que ste no depende slo de aqulla)
a una lnea de regresin en la que a cada xi le corresponde un slo valor d ~
la ordenada que es la media aritmtica de Y condicionada a dicho valor.
y
Ys
Y2
Y1
: P2(x2, Ylx2)

lic
, P(x, Y{x)
' '
* *
' '
' '
' '
' '
' '
'
!
l/c
' P r(x,. Ylxr)
r
t
t
X
x2 Xr X
GRFICO 3.3. Lfnea de regresin de Y/X obtenida por el mtodo de las medias aritm-
ticas condicionadas.
Por idntico procedimiento puede obtenerse la lnea de regresin de X
sobre Y actuando en este caso la X como dependiente y la Y como indepen-
diente. Las distribuciones de frecuencias condicionadas serian:
X/y1, Xfy2, ... , Xfy.
Las medias aritmticas serian:
X/y
1
, X/y
2
, ... , Xfy.
con lo que se generan los puntos de la lnea:
142
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y
P;(Xfys, Ys)
Y S --------------------M---------------------- --------M--------------------
Y2 ---------)(----------M------------ -- ----------------)(----- ---------------
Pi(Xfy2,y
-------- -)(- ------ ------------ ------------------------M--------------------
P(Xly, y)
y
X X2 ----- --------- Xr
X
GRFICO 3.3'. Unea de regresin de X/Y obtenida por el mtodo de las medias aritm-
ticas condicionadas.
Ejemplo 3.8
De la tabla de correlacin del Ejemplo 3.5 obtener las lneas de regresin
de Y/X y X/Y por el mtodo de las medias aritmticas condicionadas.
Soluci6n:
a) Lnea de regresin de Y/X:
- 1
(Y/X = 2) = -(1 1 + 2 4 + 3 1) = 2
6
- 1
(Y/X= 3) = -(1 2 + 2 4 + 3 2) = 2
8
- 1
(Y/X = 4) = -(1 1 + 2 2 + 3 1) = 2
4
Los puntos de la lnea son: P
1
(2, 2), P z(3, 2) y P
3
(4, 2) que es una paralela
al eje de abscisas. El que las medias aritmticas condicionadas sean todas
iguales y su unin d una paralela no implica independencia estadstica entre
las variables como se comprob en el Ejemplo 3.6. La inversa si es cierta, si
existe independencia las condicionadas son todas iguales e iguales a las mar-
ginales como se seala en la Expresin 3.2.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
b) Lnea de regresin de X/Y:
- 1
(X/Y= 1) = (2 1 + 3 2 + 4 1) = 3
- 1
(X /Y = 2) =
1
O (2 4 + 3 4 + 4 2) = 2,8
- 1
(X/Y= 3) = -(2 1 + 3 2 + 4 1) = 3
4
143
Los puntos sern: P
1
1
(3, 1), 2) y 3). El Grfico 3.4 contiene las
dos lneas.
Otra forma ms utilizada en la obtencin de las lneas de regresin Y/X y
X/Y es el denominado ajuste mnimo-cuadrtico. Esta segunda versin es me-
nos pura que la de las medias condicionadas pero es mucho ms manejable
ya que se obtiene una funcin estimada en el ajuste y no una lnea de puntos
y
3
2
1
1
1
P'
3
P,'
. .
2
\
\
3

4
GRFICO 3.4. Uneas de regresin del ejemplo 3.8.
X
como ocurre con las medias aritmticas condicionadas, ya que en la realidad
siempre tendremos una serie de observaciones discretas que nos proporcionar
una lnea de puntos ms o menos prximos, pero no una curva continua como
nos proporciona el ajuste mnimo-cuadrtico.
Dada una distribucin de frecuencias bidimensional expresada por el con-
junto {(x;, y); n;} el ajuste mnimo-cuadrtico consiste en desarrollar el pro-
ceso siguiente:
144 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
- Representar la nube de puntos dada por los valores observados (x;, Yi)
y elegir la funcin del tipo Yti = f{x;, a
1
a
2
, ., an) que ms se aproxime
a dicha nube. El nmero de parmetros {a
1
, a
2
, ... ) tiene que ser inferior
al nmero de observaciones para que el ajuste tenga grados de libertad
que es la diferencia entre el nmero de observaciones y el nmero de
parmetros. En el Grfico 3.5 lo que mejor puede ajustarse a la nube
de puntos es una parbola de tercer grado de tipo
y = ax
3
+ bx
2
+ ex + d.
- Para cada X; se define un error o residuo que es la diferencia entre la
variable dependiente observada yi y el valor terico
Yti = axf + bxf + ex; + d
dado por la funcin: ei = Yi- Yti Estos residuos son unos positivos (el
representado en el Grfico 3.5) y otros negativos (cuando las observa-
ciones estn por debajo de la funcin) y para que no se anule su suma
se eleva al cuadrado:
S= L(yi- Ytl
[3.4]
y
)( )(
Yi
Y ti
o
X X
GRFICO 3.5. Ajuste mnimo-cuadrtico.
- El mtodo del ajuste mnimo cuadrtico consiste en que la expre-
sin 3.4 de los errores o residuos cuadrticos sea un mnimo (que la
funcin ajustada pase lo ms prxima posible a todos los puntos que
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 145
forman la nube). Aplicando la condicin necesaria de mnimo que es
que se anulen las derivadas parciales de [3.4] respecto a los parmetros
desconocidos (a
1
, a
2
, a
3
, ... ) de la funcin Yti tendremos un sistema
llamado de ecuaciones normales que nos resuelve el problema pasando
de la dependencia estadstica a la funcional. Al estdiar la regresin
lineal simple en el prximo apartado veremos algn caso prctico del
ajuste mnimo-cuadrtico.
3.4. Regresin y correlacin lineal simple
3.4. l. La regresin lineal simple
En la mayora de los fenmenos de naturaleza econmicosocialla nube"de
puntos nos indica que la relacin entre las variables es de naturaleza lineal.
La regresin lineal simple nos permitir pasar de la dependencia estadstica a
la funcional con las siguientes caractersticas:
a) La funcin a estimar es lineal es decir una recta.
b) Existe una sola variable explicativa o exgena y por ello recibe el
nombre de simple.
e) En la exposicin vamos a referirnos a una tabla de correlacin de
frecuencias unitarias del siguiente tipo:
X; Y;
xl Y1
Xz Yz
X; Y;
XN YN
d) Se emplear el ajuste mnimo-cuadrtico para estimar la ecuacin de
la recta:
y= a+ bx
de modo que llamamos:
Yti =a+ b X;
Siguiendo el proceso de todo ajuste mnimo-cuadrtico se realizarn las
siguientes operaciones:
- Representar la nube de puntos dada por los pares de observaciones
(x;, yJ como se indica en el Grfico 3.6.
146
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y
y= a+ bx
Yi
Y ti
o
X X
GRFICO 3.6. Ajuste lineal mfnimo-cuadrtico.
- Ajustar la recta y = a + bx de forma que la suma de todos los errores
e
1
elevados al cuadrado, sea mnima:
N N N
S = L e = L (y - Ytif = L (y - a - bx;)
2
~ m n i m [3.5]
i=1 i=1 i=l
Para minimizar la expresin [3.5] se tiene en cuenta la condicin necesaria
de todo mnimo que es que se anulen las derivadas respecto a las incgnitas
que son los coeficientes de regresin lineal a y b:
as N
- = 2 L [y - a - bxJ ( -1) = O
aa i=1
as N
- = 2 L [Y; - a - bxJ (- XJ = O
ab i=1
que nos permite llegar al siguiente sistema de ecuaciones normales mnimo
cuadrticas:
N N
L Y; = N a + b L X;
i=1 i=1
[3.6]
N N N
LX; Y;= aL X+ b L x'f
i=1 i=1 i=1
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 147
Si en la expresin [3.6] dividimos por N podemos expresarlo en funcin de
los momentos respecto al origen:
(3.7)
Resolviendo el sistema correspondiente a la expresin [3.7] obtendremos
su solucin:
Sustituyendo en la segunda ecuacin
Luego las estimaciones mnimo cuadrticas de los coeficientes de regresin
lineal simple se resuelven por el siguiente sistema:
[3.8]
- Sxy -
a=a -ba =Y--X
01 10 s;
Si sustituimos a y b en la recta y = a + bx queda:
[3.9]
que es la recta de regresin mnimo cuadrtica de Y sobre X.
148 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
La recta de regresin mnimo cuadrtica de X sobre Y, por analoga resulta
ser:
[3.10]
Ambas rectas pasan porel punto del plano xy (a
10
, a
01
), y sus pendientes
. mu mu . . .
son repecbvamente - y -. Como m
20
y m
02
son vananzas positivas (salvo
m2o mo2
casos triviales), ambas pendientes tienen el signo comn de la covarianza m
11
;
de aqu, ambas rectas son crecientes, o ambas son decrecientes.
Si las variables estadsticas X e Y son independientes, entonces m
11
= O
por lo que las rectas de regresin sern
y
respectivamente, es decir, paralelas a los ejes coordenados X e Y.
El coeficiente de regresin lineal simple b es la pendiente angular de la
recta de regresin, o sea, es la derivada de y con respecto a x y tiene un
significado muy concreto: nos determina en cunto vara la variable dependiente
o endgena cuando la independiente o exgena vara en una unidad. Si la recta
que se ajusta es una funcin de consumo en relacin con la renta, el coeficiente
b sera lo que se conoce en teora econmica como la propensin marginal a
consumir. El significado del a, que es la ordenada en el origen de la recta, a
veces puede tener sentido econmico y a veces no.
El Ejemplo 3.9 es un caso de ajuste lineal simple por el mtodo de los
mnimos cuadrados cuando la distribucin bidimensional es de naturaleza
unitaria y el Ejemplo 3.10 es una tabla de correlacin donde las frecuencias
ya no son unitarias.
Ejemplo 3.9
En 10 familias se han observado sus ingresos (xJ y sus gastos (y) anuales
expresados en millones de pesetas dando lugar a las siguientes cantidades (x:
2, 3, 4, 5, 6, 7, 8, 8, 9, 10) e (y: 2, 3, 3, 4, 4, 5, 6, 5, 7, 9). Obtener la recta
regresin del gasto en funcin de los ingresos e interpretar los valores estima-
dos de los coeficientes de regresin.
Solucin:
Para estimar a y b empleamos la formulacin de la expresin 3.8; luego los
clculos conviene establecerlos de la forma siguiente ya que tenemos que
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 149
obtener las medias aritmticas marginales (X, Y), la covarianza y la varianza
de la variable independiente:
Y X X y X ~

2 2 4 4
3 3 9 9
3 4 12 16
4 5 20 25
4 6 24 36
5 7 35 49
6 8 48 64
5 8 40 64
7 9 63 81
9 10 90 100
10 10 10 10
L Yi = 48 LX= 62 L Xy = 345 L xf = 448
i= 1 i=l i=l i=l
- 1
10
62
X= ao = 10 i ~ l x= 10 = 6,2
- 1
10
48
y= aol = 10 i ~ l Yi = 10 = 4,8
10
L XY
i=l 345
a
11
= ;;__::_N __ = 10 = 34.5
m
11
= Sxy = a
11
- a
10
a
01
= 34.5- 4,86,2 = 34.5-29.76 = 4,74
1
10
448
a2o =
10
~

xf = 10 = 44,8
m20 = s; = a20 - aio = 44,8 - 38,44 = 6,36
b m11 Sxy 4.74
=- = -s2 = 6 36 ~ 0.745
m2o x
a= a
01
- b a
10
~ 4,8 - 0,745 6,2 ~ 4,8 - 4,621 = 0,179
1 y=O.l79+0.745x 1
150 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
El significado de b = 0,745 es que cuando los ingresos aumentan en una
unidad el gasto aumenta en 0,745 unidades. El significado del trmino inde-
pendiente es que cuando el ingreso es cero existe un consumo autnomo de
179.000 pesetas aunque esta interpretacin carece de sentido econmico ya que
sin ingresos no puede existir gasto sino existe un endeudamiento paralelo.
Ejemplo 3.10
Obtener las rectas de regresin mnimo cuadrticas asociadas a la siguiente
tabla de correlacin:
)'(
o 3 6
1 1 5 2 8
2 4 4 1 9
5 9 3 17
Solucin:
Empleando la notacin de los momentos respecto al origen y respecto a la
media tenemos:
1 26
alo = 17(18 + 29) = 17
1 45
a = -(0 5 + 3 9 + 6 3) =-
01
17 17
1 63
a = -(1 01 + 1 3 5 + 1 6 2 + 2 04 + 2 3 4 + 2 6 1) =-
11
17 17
63 26 45 1071- 1170 -99
mu = au- aloaol = 17- 17.17 = 289 289
1 44
a =-(1
2
8+2
2
9)=-
20 17 17
1 81 + 108 189
a = - (0
2
5 + 3
2
9 + 6
2
3) = = -
02
17 17 17
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 151
2 44 (26)
2
748 - 676 72
m 20 = a20 - a 10 = 17 - 17 = 289 = 289
m = _ 2 = 189 _ (45)
2
= 3.213- 2.025 = 1.188
02 ao2 aol 17 17 289 289
Con estos clculos, las rectas de regresin de Y sobre X, y de X sobre Y
son respectivamente:
26 99 ( 45)
X- 17 =- 1.188 y- 17
3.4.2. Correlacin lineal simple
A travs de la regresin hemos estudiado la forma funcional de la relacin
entre dos variables pero no se ha tratado el grado o la intensidad de esa
relacin. Corresponde a la teora de la correlacin el estudiar el grado de
asociacin existente entre las dos variables; es decir, el medir la intensidad de
la dependencia entre las mismas. Una vez que se ha realizado cualquier tipo
de ajuste nos interesa conocer en qu media la variable endgena o depen-
diente queda determinada por el modelo matemtico que se ha estimado al
pasar de la dependencia estadstica a la funcional. Si nos fijamos en el Grfico
3.6, sea cual sea la funcin que pretendemos ajustar a la nube de puntos (recta,
parbola, exponencial, etc.) el valor observado de la variable endgena Y; es
igual al valor terico o estimado por la funcin y,; ms el correspondiente
residuo o error; o sea:
[3.11]
La variable dependiente observada Y; tiene una determinada variabilidad
o dispersin que como sabemos se mide por su varianza s;. Los valores
estimados por el modelo ajustado Yti constituyen una serie que se obtiene, una
vez estimado el modelo, para los distintos valores de la variable exgena o
explicativa que se van introduciendo en el mismo, con una determinada va-
riabilidad dada por su varianza s; que la vamos a denominar varianza de la
variable endgena Y; explicada por Ia regresin. El tercer elemento de la expre-
sin [3.11] es el residuo que tambin tiene su correspondiente variabilidad que
la vamos a medir a travs de lo que vamos a llamar varianza residual o
varianza de los errores o residuos s;Y.
152
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Relacin entre la varianza de la variable dependiente, la varianza
explicada por la regresin y la varianza residual
Vamos a demostrar que estas tres varianzas se relacionan de la forma
siguiente:
[3.12]
Si en la expresin [3.11] elevamos al cuadrado ambos miembros y suma-
mos para N pares de observaciones de frecuencias unitarias tendremos:
N N N N
L yf = L L ef + 2 L Ytiei
[3.13]
i=1 i=1 i= 1 i=1
N
Vamos a ver seguidamente qu vale la expresin
L Y ti e; en el caso de
i= 1
ajustar una recta a la nube de puntos:
N N N N
L ytiei = L (a+ bxJe; =aL e;+ b L e;X;
i=1 i=1 i=1 i=1
N
El .L, e; = O ya que:
i=1
e; = Y; - Y ti = Y; - a - b X;
sumando para los N valores:
N N N
L e; = L Y; - N a - b .L, X; = O
i=1 i=1 i=1
para que se cumpla la primera ecuacin normal de la expresin [3.6].
N
Veamos qu vale .L, e;x;
i= 1
N N N N N
.L, e;X; = .L, (y- a- bx;)x; = .L, X;Y;- a .L, X;- b .L, xf ,=O
i=1 i=1 i=1 i=1 i=1
para que se cumpla la segunda ecuacin normal mnimo-cuadrtica de la
expresin. Luego la expresin [3.13] queda reducida a
N N N
.L yf = .L Yii + .L ef
[3.14]
i=1 i=1 i=1
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 153
en .la [3.14] a cada valor de las tres variables se le resta su
media antmhca Y se divide por el total de observaciones N, recordando que
N
la media de los residuos es cero, e= O, ya que L e = o y que la media de
i=1
Yti coincide con la media de Y;, o sea:
1 N 1 N
N

Yti= N

(a+bx;)=a+bX= Y
al tener en cuenta que la recta de regresin pasa por (X, Y); tendremos:
1 N - 1 - 1
N (y - Y? = N :E (yti - Yf + N :E
con lo que demostramos que:
sz = sz + sz
Y Y, ry
variar:zas s;, y s;y pueden obtenerse una vez que se ha realizado
el aJuste mmmo cuadrtico para obtener las series de y . y e. = (y - y \
d 11 ' i tih
Y. po er .operar con ellas. No obstante existen otras formas de obtenerlas
sm necestdad de efectuar el ajuste en funcin de las varianzas y covarianza
deXef:
1 N 1 N
s;Y = N = N (y - Ytif
Sustituyendo Yti por lo que vale a travs de la expresin [3.9],
queda:
154
CASAS-SNCHEZ, J. M. y SANTOS-PE"AS, J.
Luego:
(3.15)
La varianza explicada se obtiene despejndola de la expresin [3.12]
[3.16]
Ejemplo 3.11
Utilizando las varianzas y covarianza del Ejemplo 3.10 obtener la varianza
explicada por la regresin y la varianza residual comentando sus resultados.
Solucin:
99 72
Del ejemplo 3.10 la m
11
= -
289
-0.343, la m
20
=
289
0.249 y la
1.188
mo2 = 289 4.1
mi
1
0,117
S
2
=m -- 4111--- 4111-0469 = 3 642
ry 02 m20 ' 0,249 ' ' '
s
2
= s
2
- s
2
4 111 - 3 642 = o 469
Yt Y ry ' ' '
Si se observa el valor de s;Y se llega a la conclusin de que es muy elevado
en relacin con la varianza total de Y; representada por s; con lo que la
varianza explicada por la regresin es muy reducida y la lnea de regresin no
es representativa del conjunto de valores observados de Y;
Coeficientes de determinacin y de correlacin lineal simple
Se observa en la expresin [3.12] que la varianza de la endgena observada
y, o sea s;, se obtiene como suma de la varianza explicada por la regresin
S
2
y la varianza no explicada o varianza residual s;Y. Si no existiesen errores
Y,.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 155
o residuos e la s;y = o con lo que s; = s;, las varianzas de la variable depen-
diente o endgena Y; se debern nica y exclusivamente a las variaciones de
la variable independiente o exgena X, existiendo nicamente una dependencia
funcional o exacta. Como esta situacin no suele ocurrir en los fenmenos
econmicos y sociales, vamos a definir lo que se conoce como coeficiente de
determinacin.
Se denomina coeficiente de determinacin a la participacin de la varianza
explicada por la regresin en la varianza marginal de la variable dependiente
observada:
[3.17]
Al estar definido por cociente entre varianzas es un parmetro indepen-
diente de las unidades de medida y permite comparar resultados entre distintas
asociaciones entre variables, cosa que no ocurre con las varianzas explicadas
o residuales, como indicadores de grados de asociacin, al venir influidas por
las . unidades de medida de las variables. El significado del coeficiente de
determinacin es que nos proporciona el porcentaje de causas comunes que
tienen las dos variables relacionadas para explicar su variabilidad o evolucin
si se expresa en tantos por 100. Si lo expresamos en tantos por uno, como
indica la formulacin [3.17], sin multiplicar por 100 su resultado, su signifi-
cado es que nos indica el tanto por uno de varianza de Y; explicado por la
variable independiente X; a travs de la funcin ajustada Yti
Como las varianzas que definen a R
2
son siempre positivas llegamos a la
conclusin que R
2
O. Por otra parte las varianzas que intervienen S
2
y S
2
y ry
como mucho sern Iguales a la total marginal s; cuando exista una retacin
exacta o funcional entre las variables (S
2
= S
2
) y las causas comunes son el
Yt Y
100 por 100 (s;Y = O) o cuando las causas comunes son nulas (S; = S
2
) y el
R
2
= O. Conclusin: el campo de variacin del coeficiente de es
O;:( R
2
;:( l. Cuando las causas comunes a x e y llegan al 0,75 expresadas en
tantos por uno, o el 75% en tantos por cien, el modelo ajustado suele acep-
tarse. Si el porcentaje es inferior se llega a la conclusin de que la relacin
elegida (en este caso lineal) no es buena, debindose ensayar con otras fun-
ciones.
El coeficiente de determinacin de la expresin [3.17] es una formulacin
genrica y sirve para cualquier tipo de regresin ya sea lineal o no lineal.
Vamos a determinar seguidamente otra formulacin para el caso de la regre-
sin lineal simple. Si en la expresin [3.17] se sustituye la varianza residual
156 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
por lo que vale en funcin de la covarianza y las varianzas marginales segn
se vio en la expresin [3.15] tendremos:
[3.18]
Resumiendo, en la regresin lineal simple el coeficiente de determinacin
puede obtenerse con las siguientes formulaciones equivalentes:
[3.19]
Si en la segunda formulacin equivalente despejamos la varianza residual:
[3.20]
Vamos a definir el coeficiente de correlacin lineal simple como la raz
cuadrada del de determinacin:
n
s
R=+ = ~ = ~
- S S - ....uu
y X y
[3.21]
El coeficiente de correlacin se usa para determinar el grado de dependencia
lineal de la variable endgena ante los valores de la exgena. Esta dependencia
puede ser directa o positiva, o indirecta o negativa, segn sea el signo de la
covarianza Sxy Si la covarianza es positiva la correlacin tambin lo es y su
coeficiente tomar valores entre cero y uno: O R ~ l. Si R = 1 implica que
la s;Y =O y los valores tericos o estimados Yti coinciden con los observados
Y; exitiendo una dependencia exacta o funcional. Si R = O implica que s;Y = s;
no existiendo ninguna dependencia o asociacin entre las variables de tipo
lineal, aunque s puede haberla de otra naturaleza (parablica, exponencial,
etc.), convirtindose las rectas de regresin en dos paralels a los ejes de
coordenadas a las alturas Yti = Y y xti = X ya que Sxy = O con lo que en las
expresiones [3.9] y [3.10] los valores estimados de las rectas coinciden con las
medias aritmticas marginales.
y
y
y
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
X
a) R = l. "Dependencia exacta o
funcional positiva".
Xti =X
X
X
X
X X
X Yti =y
X
X X
X
X
e) R =O. "Con independencia entre
las variables".
ylx =x/y
y
y
y
X
b) R = -l. "Dependencia exacta o
funcional negativa".
X
XX
X
xx
X
XX
V V Yti =y
~ x x x
X X X X
X X )C
X X
X
d) R = O. "Con independencia lineal
pero con dependencia exponencial.
Las variables son dependientes".
x/y
ylx =x/y
X X
157
e) O < R < l. "Dependencia no exacta f) -1 < R < O. "Dependencia no exacta
positiva". negativa".
GRAFICO 3.7. Rectas de regresin para distintos valores del coeficiente
de correlacin R.
158 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Si la covarianza es negativa la correlacin tambin lo es y su coeficiente
tomar valores entre menos uno y cero: - 1 :::::; R :::::; O. Si R = - 1 la correla-
cin es perfecta existiendo una dependencia funcional pero negativa. Las rectas
de regresin coincidiran en una sola que sera decreciente al tener una pen-
diente negativa. Concluyendo diremos que el campo de variacin total del
coeficiente de correlacin es: - 1 :::::; R :::::; l. Cuando vara de - 1 a cero estamos
en una correlacin negativa y la dependencia ser mayor cuanto ms se
aproxime a - l. Si la variacin est entre cero y + 1 la correlacin es positiva
y el grado de asociacin o dependencia ser mayor cuanto ms se aproxime
a ms uno. A partir de 0.75 diremos que la dependencia es fuerte o acepta-
ble. Si el valor es inferior se rechaza el modelo estimado para hacer predic-
ciones ya que son poco fiables. El Grfico 3. 7 recoge las distintas posibilidades
de representacin segn el valor de R. Las figuras e) y f) son las que se dan
en los casos reales.
Prediccin
Uno de los objetivos que persigue la regresin y correlacin es hacer
predicciones de la variable dependiente o endgena en funcin de los que toma
la independiente o exgena. Las predicciones se efectan utilizando la recta
estimada Ya = a + b X. Obtenemos valores de Y ti' que son promedios de los
observados, mediante valores dados de X; y la actuacin de los coeficientes de
regresin a y b estimados. La prediccin ser ms fiable cuanto mayores sean
los coeficientes de determinacin o de correlacin ya que menor ser la va-
rianza de los residuos que es la que nos indica la cuanta de la separacin
entre lo observado y lo estimado.
Hay que tener presente que la fiabilidad de las predicciones disminuye a
medida que los valores d la variable exgena X; se alejan de su recorrido.
Ejemplo 3.12
Aprovechando los momentos respecto a la media del ejemplo 3.10 obtener
los coeficientes de correlacin y determinacin lineal.
Solucin:
~ 1 ~ .
R = = ~ -0,3385,
~ fo:z J72. J1.i8s
R
2
~ 0,11458,
Segn estos datos la fiabilidad o confianza del ajuste lineal, presentado en el
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
159
ejemplo 3.10, es delll,45% (porcentaje de causas comunes entre las variables
X e Y en dichos ajustes lineales: de X sobre Y, y de Y sobre X) no siendo
suficiente la forma funcional estimada para representar la dependencia entre
las dos variables {el nmero debe ser un 75 %).
En cuanto a la correlacin, medida por R = - 0.3385, es negativa y por
ello una de las variables tiende a aumentar cuando la otra variable disminuye,
y viceversa: una tiende a disminuir cuando la otra tiende a aumentar.
En el ejemplo 3.11 se obtuvo la varianza residual para el mismo supuesto
y vimos que era muy elevada con lo que el ajuste no poda ser bueno. Los
bajos valores de los coeficientes de correlacin y determinacin nos confirman
este hecho.
Ejemplo 3.13
Obtener los coeficientes de determinacin y correlacin del ajuste lineal
efectuado con los datos del Ejercicio 3.9.
Solucin:
Empleando la expresin R
2
= b b', ya se obtuvo el coeficiente b = 0.745. Para
obtener b' se efecta la regresin X/Y. Esta regresin tiende sentido estadstico
pero carece de sentido econmico en la relacin causa {gasto) y efecto {ingre-
sos) ya que los niveles de gasto no determinan los niveles de ingresos sino
todo lo contrario. Para calcular
b, = m
11
l f 1 1 1 2
, s o nos a ta ca cu ar m
02
= a
02
- a
01

moz
El a
01
= 4,8 segn el Ejercicio 3.9.
1 N 1
aoz =
10
; ~ yf =
10
270 = 27.
m 474
m
02
= 27 - 23,04 = 3,96 , b' = _____!.! = -'- = 119
m
02
3,96 '
R
2
= bb' = 0,7451,19 = 0,89
1 R = J0,89 = 0,94
160 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Conclusin: El nivel del ingresos determina el 89 % del nivel del gasto
siendo la correlacin positiva y de nivel elevado con lo que el modelo e,'ltimado
es fiable para hacer predicciones.
Ejemplo 3.14
Con la informacin que nos proporcionan los Ejercicios 3.9 y 3.13 predecir
el nivel de gasto para unos ingresos de 12 y 15 millones de pesetas comentando
la fiabilidad de dichas predicciones.
Solucin:
Las predicciones se realizan con la recta estimada:
- Para X;= 12; Yti = 0,181 + 0,745 12 = 9,121 millones de pesetas
- Para X;= 15; y
1
; = 0,181 + 0,745 15 = 11,356 millones de pesetas
Ambas predicciones son fiables ya que el coeficiente de correlacin es
R = 0,94; pero la primera es ms fiable que la segunda ya que el valor X = 12
est ms cerca de X= 6,2 que el valor segundo de X;= 15, al alejarse del
recorrido de X en la nube de puntos.
3.5. Regresin y correlacin lineal mltiple
Aunque este captulo est dedicado fundamentalmente a las distribuciones
bidimensionales, vamos a realizar una introduccin al anlisis multidimensio-
nal explicando el sentido de nuevos conceptos como son los coeficientes de
determinacin y correlacin parcial y el problema de la multicolinealidad.
3.5. l. Ajuste de un plano por el mtodo
mnimo-cuadrtico
Para que didcticamente se comprendan mejor los conceptos vamos a
empezar por el estudio de la regresin y correlacin de la funcin de un plano
generalizando seguidamente al caso del hiperplano. Se parte de la nube de
puntos tridimensionales en la que se recogen las observaciones de frecuencias'
unitarias de tres caractersticas estudiadas en una poblacin (por ejemplo: '
gastos familiares y, ingresos familiares X y nmero de miembros de la fa-
milia x
2
;).
Si el nmero de observaciones tridimensionales es N, la nube de puntos la
formarn las siguientes ternas:
(y1, Xu, X21), {yz, X12 Xzz), (y3, X13, X23), ... , (yN, X1N X2N).
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 161
Vamos a ajustar por el mtodo mnimo-cuadrtico la ecuacin de un plano a
esta nube de puntos:
[3.22]
El sistema de ecuaciones normales surge de minimizar la expresin:
N
S= L (y- bo- b1X1;- b2X2;f [3.23]
i=l
Derivando la Expresin 3.23 respecto del trmino independiente b
0
tene-
mos la primera ecuacin normal:
N N N
L Y; = N b0 + b1 L X
1
; + b
2
L X
2
; [3.24]
i=l i=l i=1
Dividiendo por N:
[3.25]
La expresin [3.25] nos indica que el plano pasa por el punto tridimen-
sional (X
1
, X
2
, Y) llamado centro de gravedad de la distribucin. Tambin nos
sirve para obtener el trmino independiente de la funcin, conocidos los coe-
ficientes de regresin parcial de Y/X
1
que es el b
1
y el de Y/X
2
que es b
2
y las
medias marginales de las tres caractersticas en estudio (X
1
, X
2
, Y):
[3.26]
Para determinar los coeficientes de regresin parcial b
1
y b
2
se vuelve a
derivar en la expresin [3.23]. Para hacer ms manejable el sistema vamos a
tomar como variables las desviaciones a sus correspondientes medidas aritm-
ticas llamando y= Y;- Y, X ~ = X- xl y X ~ = x2i- Xz.
Luego si restamos ordenadamente la expresin [3.25] de la [3.22] tendre-
mos la frmula del plano que pasa por el nuevo origen (X
1
, X
2
, Y):
con lo que la expresin que hay que minimizar para obtener b
1
y b
2
ser:
N
S = L (y - b
1
x'u - b
2
x ~ f
i=1
162 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Derivando parcialmente respecto a las incgnitas b
1
y b
2
e igualando a
cero tendremos el siguiente sistema de ecuaciones normales que junt? con la
expresin [3.26] resuelven nuestro problema:
N N N
I y;x'li = h
1
I x'{; + b2 I x'ux;;
:l :1 :1
[3.27]
N N N
I y; X ~ ; = b
1
I x ~ ; x ; ; + b2 I x'i.
i:1 :1 i:1
El sistema de la expresin [3.27] lo podemos expresar en funcin de las
respectivas covarianzas y varianzas marginales dividiendo por N todos sus
elementos:
(3.28)
Empleando la Regla de Cramer se despejan las incgnitas del sistema [3.28]:
[3.29]
y anlogamente de la b
2

La expresin [3.29] se puede poner en funcin de los coeficientes de
correlacin lineal simple si dividimos numerador y den01ninador por Sv Si ~
[3.30]
Por analoga la expresin para calcular el otro coeficiente de regresin
parcial ser:
[3.31]
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 163
Las expresiones [3.26], [3.30] y [3.31] resuelven nuestro problema de
estimacin del plano de regresin. El significado de los coeficientes de regre-
sin b
1
y b
2
se obtiene observando que con las derivadas parciales de y
1
son
respecto a X
1
y X
2
. Luego b
1
mide la variacin de la variable endgena y
1
al
variar X
1
en una unidad permaneciendo constante la otra variable exgena X
2

El b
2
mide la variacin de y
1
cuando X
2
vara en una unidad permaneciendo
constante la x
1

El problema de la multicolinealidad en el ajuste de un plano
Este problema surge slo en la regresin mltiple cuando las variables
explicativas, exgenas o independientes tienen entre s una fuerte relacin de
dependencia. Si esta dependencia entre X
1
y X
2
fuese exacta, es decir Rf
2
= 1,
entonces:
ya que si:
R12 = 1 = Rv1 = Rv2
R1z = -1 = Ryl = -Rvz
y entonces para R
12
= 1 resulta que:
_Sv R,
1
-Ry
2
R
12
_Sv Ry
1
-Ry
1
Ry
2
_Sy Ry
1
-Rv
1
1 O
b -- -- -- =-
1 S
1
1- Rf
2
S
1
1- Ri
2
S
1
1- 1 O
y para R
12
= - 1:
b = Sy. Ry1 + Ry1( -1) = ~
1
s
1
1 - 1 o
De manera anloga se tiene que
Como se ha visto si existe multicolinealidad perfecta es imposible calcular
los coeficientes de regresin parcial con lo que nos llevara a cambiar la
estructura del modelo eliminando una de esas variables. Pero si la multicoli-
nealidad no es perfecta pero elevada, por ejemplo un +0.8 < IRd < + 1,
aunque s pueden obtenerse Jos b
1
y b
2
, ya que ya no se da la indeterminacin
matemtica, la fiabilidad de Jos coeficientes de regresin parcial se ve mermada
ya que las variaciones de Yti ante variaciones unitarias de xl y x
2
; estn
mezcladas con lo que obliga a cambiar el diseo del modelo matemtico que
liga a las tres variables.
164 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Coeficientes de determinacin y correlacin mltiple
en el ajuste de un plano
El significado de estos coeficientes es el mismo que se ha dado en la
correlacin simple. Se sigue cumpliendo que la varianza marginal de la varia-
ble dependiente o endgena s; es igual a la varianza explicada por la regresin
s;,.
12
(se denota con los subndices 1 y 2 al existir dos variables explicativas)
ms la varianza residual s;Y.
12
. El coeficiente de determinacin mltiple ser
la participacin de la varianza explicada por la regresin en la varianza de los
valores observados de Y; o varianza marginal de Y;
Por tanto, partiendo de la igualdad
s; = s;,-12 + s;yl2
el coeficiente de determinacin mltiple ser:
R2 = s;,-12 = s;- s;yl2 =
1
_ s;yl2
yl2
8
2
8
2
8
2
y y y
[3.32]
Por las mismas causas que se expusieron en la correlacin simple su campo
de variacin sigue siendo el mismo: O R;.
12
l.
Este coeficiente se puede obtener bien por su definicin genrica dada en
[3.32], que como sabemos es vlida para cualquier tipo de ajuste sea lineal o
no, bien haciendo una transformacin para el ajuste del plano. La definicin
de varianza residual en la regresin de un plano con las variables expresadas
en desviaciones a sus medas aritmticas (se hace un cambio de origen de forma
que el plano pasa por el nuevo origen dado por X
1
, X
2
, Y
2
) es:
1 N 1 N
s;yl2 =N L e?= N L e(y;- bx'li-
i=l i=l
[3.33]
En la anterior demostracin se ha tenido en cuenta la definicin del error
e como diferencia entre la endgena observada y la estimada por el plano
e= (y;- b
1
x'li-

y el sumatorio de los errores por las exgenas son


\
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 165
nulos como se demostr e:n la correlacin simple al deducir la expresin [3.12],
o sea
N N
.L ex'li = O y L =O
i= 1 i=l
o para que se cumplan las ecuaciones normales de la regresin, es decir las
expresiones [3.28].
Sustituyendo lo que vale la varianza residual en el ajuste de un plano dado
por [3.33] en [3.32] tenemos:
[3.34]
La expresin [3.34] puede utilizarse para obtener R;.
12
slo exclusiva-
mente en el caso de la regresin lineal mltiple de un plano.
La varianza residual la obtenemos de la expresin [3.33] y conocida sta
puede obtenerse la varianza explicada por la regresin s;,12 por diferencia
con las;:
s2 - s2 s2
yr12- y- ryl2
[3.35]
El coeficiente de correlacin es la raiz cuadrada del de determinacin. En
la correlacin mltiple no tiene ningn sentido el estudio de la dependencia
positiva o negativa y por tanto el signo de su coeficiente ya que la pendiente
del plano puede ser positiva repecto a x
1
y negativa respecto a x
2
o viceversa:
[3.36]
Coeficientes de determinacin y correlacin parcial en el ajuste de un plano
Al existir ms de una variable explicativa puede estudiarse la evolucin
conjunta o causas comunes entre la variable dependiente Yti y la primera
independiente xli permaneciendo constante la otra explicativa X
2
. Luego slo
se estudia la influencia de x
1
en Yti Vimos en la correlacin lineal simple que
el coeficiente de determiacin se poda obtener como producto de los coefi-
cientes angulares de la recta yjx de la x/y. Por analoga el coeficiente de
166 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
determinacin parcial d ~ Ytifxli permaneciendo constante la x
2
; ser el pro-
ducto de
b
ay, b'
1 = ~ por 1
uXli
[3.37]
Sustituyendo el valor b
1
dado por la expresin [3.30] y por analoga
cuando la xli acta de dependiente la y, de independiente ser donde pone
en la expresin [3.30] el subndice uno poner y y donde pone y poner uno:
b' = Sl. R,t - R,2 R12
S, 1- R:
2
Sustituyendo en 3.3 tendremos:
R2 _ b b' _ (R,t - R,2 R12f
y1.2- 1 t- (1- Ri2)(1 - R:2)
[3.38]
El coeficiente de determinacin parcial de y,Jx
2
; permaneciendo constante
x
2
; ser:
2
(R,2 - R,t . Rz)2
R - b b' - - - - - = - ~ - < - = - - - = = - ; -
y2.1 - 2 . 2 - (1 - Ri2)(1 - R;t)
[3.39]
Los coeficientes de correlacin parcial son como siempre la raz cuadrada
de los de determinacin:
[3.40]
[3.41]
Estos coeficientes variarn lo mismo que en la correlacin simple entre -1
y + 1 dando sentido al signo de la dependencia parcial.
Ejemplo 3.15
Se han observado en cinco individuos varones mayores de 18 aos sus
niveles de gastos totales anuales, sus niveles de ingresos y el nmero de
habitantes que tienen las ciudades donde viven. Los gastos e ingresos vienen
expresados en millones de pesetas y los habitantes de las ciudades tambin en
millones. Los valores observados de las tres variables son los siguientes: Y;
(gastos): 1, 2, 3, 2, 4; X (ingresos): 1, 3, 4, 4, 5; x
2
; (habitantes): 1, 1, 2, 3, 4.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 167
Estos ejemplos son a ttulo didctico ya que en los casos prcticos reales se
manejan cientos de observaciones ya que una muestra representativa tiene
muchas ms observaciones de las caractersticas.
Se pide:
a) Estimar el plano de regresin de los gastos en funcin de los ingresos
y el nmero de habitantes de las ciudades donde viven, comentando el pro-
blema de la multicolinealidad.
b) Descomponer la varianza marginal de los gastos observados en varian-
za explicada por la regresin del plano y en varianza no explicada.
e) Obtener los coeficientes de determinacin y correlacin mltiples.
d) Obtener los coeficientes de determinacin y correlacin parcial.
Solucin:
a) Para estimar el plano y= b
0
+ b
1
x
1
+ b
2
x
2
emplearemos las expresio-
nes [3.26], [3.30] y [3.31]. Luego dispondremos los datos para obtener las
medias marginales, las varianzas y covarianzas que requieren dichas expresiones:
Y; xli x2i yf xi xi Y;Xli Y;X2; XliX2i
1 1 1 1 1 1 1 1 1
2 3 1 4 9 1 6 2 3
3 4 2 9 16 4 12 6 8
2 4 3 4 16 9 8 6 12
4 5 4 16 25 16 20 16 20
12 17 11 34 67 31 47 31 44
Medias marginales:
_ 1 N 12
y=- L Yi = - = 2,4
5 i=l 5
La expresin [3.26] es:
El valor de b
1
se calcula con la expresin [3.30]:
168 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
luego hay que calcular las varianzas marginales s; y Si, ~ as como los
coeficientes de correlacin lineal simple: Ry
1
, Ry
2
y R
12
(para calcuJar otros
coeficientes hay que obtener las covarianzas):
Varianzas marginales:
1 N - 34
S
2
= - L y ~ - Y
2
= - - (2 4f = 6 8 - 5 76 = 1 04
Y N i= t ' 5 , , ' '
1 N - 67
S
2
= - L x
2
. - X
2
= - - (3 4f = 13 4 - 11 56 = 1 84
1 N i=l , 1 5 ' ' , ,
2 -
1
~ 2 -2 -
31
2
- 4 8 - 1 36
s2-- L., x2i- x2--- (2,2) - 6,2- ' 4- ,
N i=l 5
Desviaciones tpicas:
Sy = Jl,04 = 1,02 S = fl84 = 136
1 V J.,O"t '
s2 = fi,36 = 1,17.
Covarianzas:
1 N --
Sy! =- L Yhi - YX 1 = 9,4 - 8,16 = 1,24
N i=l
1 N --
Sy2 =- L Y;X
2
;- YX
2
= 6,2- 5,28 = 0,92
N i=t
1 N - -
S
12
=- L X
1
;X
2
;- X
1
X
2
= 8,8- 7,48 = 1,32
N i=l
Coeficientes de correlacin lineal simple:
S
1
1,24 1,24
Ry! = _Y_ = = -- = 0,89
sy. S
1
1,o2. 1,36 1,39
= ~ = 0,92 = 0,92 = o 77
RY
2
S y. S
2
1,02 1,17 1,19 '
s12
R2=-s S
1. 2
1,32 = 1,32 = o 83
1,36. 1,17 1,59 '
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 169
Hay que resaltar que estos coeficientes de correlacin lineal simple slo se
calculan a efectos de emplearlos en las expresiones [3.30] y [3.31] que nos
determinan los coeficientes de regresin parcial b
1
y b
2
Al existir una fuerte
correlacin o multicolinealidad en sentido amplio entre xli y x
2
;, al ser
R
12
= 0,83, los RY
1
y RY
2
no nos pueden indicar el grado de dependencia entre
la variable endgena y cada una de las exgenas por separado. Para ello x 1i
y x
2
; tendran que estar incorrelacionadas cosa que no suele ocurrir en la
evolucin de caractersticas socioeconmicas. Lo que hay que perseguir es que
la correlacin sea la menor posible entre las variables explicativas con objeto
de que b
1
y b
2
representen con la mayor nitidez posible las variaciones de Yri
ante variaciones unitarias de las variables explicativas.
Empleando las expresiones [3.30], [3.31] y [3.26], los coeficientes de re-
gresin parcial son:
Sy RY
1
- Ry
2
R
12
1,02 0,89 - 0,77 0,83
b =- =- =061
1
S
1
1-Ri
2
1,36 1-0,69 '
b = S y. Ry2 - Ry1 R12 = 1,02. 0,77 - 0,89 0,83 = O
084
2
S
2
1-Ri
2
1,17 1-0,69 '
b
0
= 2,4 - 0,61 3,4 - 0,084 2,2 = 0,215
El coeficiente b
1
es la derivada parcial de Yti respecto de xli y significa que
al variar x
1
; en una unidad, permaneciendo constante x
2
;, la Yri vara en 0,61
unidades. El b
2
de la variacin de Yti cuando la x
2
; vara en una unidad
permaneciendo constantes los ingresos x
1
;. Como se observa una elevada
multicolinealidad entre las variables explicativas estos coeficientes son inesta-
bles con lo que su significado como propensiones marginales al gasto en
relacin con los ingresos o con el nmero de habitantes no tienen excesiva
pureza. Sera conveniente modificar el diseo del modelo eliminando de la
regresin la variable nmero de habitantes, que como se observa, al tener un
coeficiente de regresin parcial muy pequeo, no es relevante en la determi-
nacin del gasto.
b) Derterminar la varianza explicada y la varianza residual.
Se parte de la igualdad s; = s;,.
12
+ s;y.
12
.
La varianza marginal observada de la variable dependiente Y; ya la hemos
obtenido s; = 1,04. Luego si obtenemos la residual est resuelto el problema.
Empleando la expresin [3.33];
s;y.
12
= s; - b
1
syl - b
2
Sy
2
= 1,04 - o,84 = 0.2
s;..
12
= s; - s;y .
12
= 1,04 - 0,2 = o,84
170
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
e) Coeficientes de determinacin y correlacin mltiples.
Coeficiente de determinacin mltiple
2 - s;,.12- 0,84-
Ry 12 - s2 - 1 04 - 0,81
y '
Coeficiente de correlacin mltiple
Ry.
12
= = 0,90
Como el coeficiente de determinacin es relativamente elevado podemos
conducir que el grado de fiabilidad del modelo como instrumento de prediccin
es aceptable. Lo mismo ocurre con la dependencia global del gasto en relacin
con los ingresos y el nmero de habitantes que se eleva, a un 90 % si el
coeficiente de correlacin mltiple lo expresamos en porcentajes.
) Coeficientes de determinacin y correlacin parcial.
Recurriendo a las expresiones [3.38] y [3.39] tenemos:
2
= (Ry
1
- RY
2
R
12
)
2
= (0,89- 0,77 0,8W =O
50
RY
1

2
(1 - Ri
2
)(1 - R;
2
) (1 - 0,69)(1 - 0,59) '
2
= (Ry
2
- RY
1
R
12
)
2
= 0,77 - 0,89 0,77)
2
= O
10
Ry
2

1
(1 - Ri
2
)(1 - R;
1
) (1 - 0,69)(1 - 0,79) '
Como sabemos el coeficiente de determinacin parcial estudia las
causas comunes que tienen las variables Y ti y xu (niveles de gastos e ingresos)
permaneciendo constantes las que tengan Yti y x2;, o sea una vez que se ha
efectuado la regresin de Yti sobre x
2
;. Una vez que hemos efectuado la regre-
sin de los gastos sobre el nmero de habitantes quedar una determinada
varianza residual o no explicada s;Y.
2
que debe reducirse con la introduccin
en el modelo de la variable x
1
;; pues bien el que R;1 . 2 = 0,50 significa que al
incorporar xu la s;Y.
2
queda explicada en un 50% demostrndonos que es
una variable con un fuerte sentido explicativo dentro del modelo. Por el
contrario la incorporacin de x
2
; al modelo, una vez efectuada la regresin
con x
1
;, slo reduce la varianza no explicada s;yl en un 10%. Los'coeficientes
de correlacin parciales tienen signo positivo ya que todas las covariaciones
son positivas y sern:
Ry
1
.
2
= = 0,70
Ry
2
.
1
= = 0,32
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
3.5.2. Ajuste de un hiperplano mediante
la utilizacin del lgebra matricial
171
La regresin lineal mltiple se estudia empleando el lgebra matricial por
lo recomendamos al lector que se ponga al da de los conocimientos
bstcos. en esta materia: operaciones con matrices, reglas de trasposicin,
matriz inversa, rangos, etc. En este epgrafe slo daremos unas
en una primera aproximacin al problema de la regresin
lmeal desde un punto de vista descriptivo ya que en los cursos de
a la Econometra se estudia esta teora en profundidad introdu-
cindose en el modelo probabilstico.
Vamos a considerar la ecuacin de un hiperplano con una variable end-
gena o dependiente (y) y k variables exgenas o explicativas (x
1
, x
2
, , xk):
[3.42]
. Por otro lado sabemos que el valor i-simo de la endgena observada es
tgual al valor estimado o terico del modelo y . ms el error o residuo e.
tl l"
Y;= Y ti+ e;= b
0
+ bX
1
; + h
2
X
2
; + + bkxki +e; [3.43]
Al tener en cuenta todas las observaciones muestrales de las variables o
sea para i = 1, 2, 3, ... , N, la expresin [3.4] se transforma en el
sistema de ecuaciones:
Yt = ho + bXu + h2x21 + + bkxk
1
+ e
1
Y2 = ho + h1x12 + b2x22 + + bkxk2 + e
2
YN = bo + h
1
X1N + b
2
x2N + + bkxkN +eN
El sistema [3.44] se puede expresar matricialmente:

X2N
xkl][b
0
] [e
1
]
xk2 b e2
. . + .
. . .
o
xkN bk ek
es decir
y= xb +e
[3.44]
[3.45]
Como xb es la endgena estimada la expresin [3.45] tambin toma la
forma matricial:
Y= Yt +e [3.46]
172
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
En las expresiones [3.45] y [3.46] existen los siguientes elementos matri-
ciales:
El vector columna de las observaciones de la endgena y de dimensiones
(N x 1) ya que tiene N filas y una columna:
El vector columna de los (k+ 1) coeficientes de regresin parcial b de
orden [(k+ 1) x 1] ya que tiene k+ 1 filas y una columna:
El vector columna de los errores o residuos e de orden (N x 1) ya que
tiene N filas y una columna:
La matriz de las observaciones de las k variables explicativas x de orden
[N x (k + 1)] ya que tiene N filas y (k+ 1) columnas. La primera co-
lumna es de unos ya que sera el factor del coeficiente constante de la
exgena ficticia que afecta al trmino independiente del hiperplano:
[i
X u Xz
Xz Xzz
xlN XzN
DISTRIBUCIONES DE FRECUENCIAS 173
El vector columna de la variable endgena estimada por el modelo o
hiperplano de orden (N x 1) ya que es el resultado del producto xb cuyos
rdenes son [N x (k+ 1)] y [(k+ 1) x 1], resultando xb de orden
(N X 1):
[
Ytl]
Ytz
Yt = .
YtN
Estos cinco elementos matriciales intervienen en todo . el proceso de la
regresin en sus variadas operaciones y transformaciones como se ver a
continuacin.
Nuestro problema consiste, como siempre, en estimar el vector de los
coeficientes de regresin parcial b empleando el mtodo de los mnimos cua-
drados. Hay que minimizar la suma de los cuadrados de los errores de las
distintas observaciones:
N N N
S= L ef = L (y- Yr;)
2
= L (y- bo- bX;- - bkxkl [3.47]
i= 1 i= 1 i=l
Derivando parcialmente la expresin [3.47] respecto a las incgnitas que
son los coeficientes tenemos:
Simplificando y operando tendremos el siguiente sistema de ecuaciones
normales mnimo cuadrticas:
N N N N
L Y; = Nbo + bl L X; + bz L Xz; + ... + bk L xki
i= 1 i= 1 i= 1 i= 1
174
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
N N N N N
L xliyi = bo L X;+ b L xL + b2 L X;X2; + ... + bk L XXk;
i=l i=1 i=l i=l i=l '

N N N N N
L Xk;Y; = bo L Xk; + b L X;Xk; + b2 L X2hi + + bk L x;
i=l i=l i=l i=l i=l
Este sistema podemos expresarlo de forma matricial:
Y1
X u X12 X1N Y2 X u
x21 X22 X2N Y3 X21
xkl xk2 xkN YN xkl
[(k + 1) X N], (N X 1)

[(k+ 1) X 1)]
bo
X u X21 xkl
bl
x12 X1N
X12 X22 xk2
X22 X2N
X1N X2N xkN
bk
xk2 xkN
[(k+ 1) X N]
[N (k+ 1)], [(k+ 1) X 1)

[(k + 1) X (k + 1)] --..
x'y = x'xb
1
[(k+ 1) X 1]
[3.48]
A la expresin [3.48] tambin se puede llegar operando directamente con
elementos matriciales. La suma de los errores elevados al cuadrado puede
ponerse, segn el lgebra matricial, como producto del traspuesto del vector
de los errores por dicho vector:
N
L ef = e' e = [y - xb ]' [y - xb] = [y' - b' x'] [y - xb] =
i= 1
= y'y - y'xb - b'x'y + b'x'xb = y'y - 2y'xb + b'x'xb
[3.49]
En la demostracin anterior se ha tenido en cuenta que y'xb = b'x'y ya que
los escalares, como son los anteriores trminos, son iguales a sus traspuestos.
Derivando la expresin matricial [3.49] respecto al vector de las incgnitas
b e igualando a cero, como condicin necesaria de mnimo, el
sistema de ecuaciones normales mnimo cuadrticas:
o sea
ae'e
- = -2x'y + 2x'xb =O
ab
x'xb = x'y
[3.50]
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 175
Si el sistema de ecuaciones normales [3.50] lo ponemos de forma semide-
sarrollada, obteniendo los productos x'x y x'y, se ver el significado de sus
elementos:
N N N
N X
xki bo

Y;
i= 1 i=l i=l
N N N N

xki
xi; XXki b
XliYi
i=l i= 1 i= 1 i= 1
[3.51]
N N N N

xki

xkixli
x; bk

Xk;Y;
i= 1 i=l i= 1 i=l
[(k + 1) X (k + 1)] ([k+ 1) X 1] (k+ 1) X 1]
En la expresin [3.51] se observa que la matriz x'x es cuadrada de orden
[(k+ 1) x (k+ 1)] y dividiendo por N sus elementos obtenemos los momentos
de primer o segundo orden respecto al origen de las variables explicativas. El
producto x'y origina un vector columna que dividiendo por N nos proporcio-
na los momentos de primer orden de las endgenas respecto al origen y los
de segundo orden entre sta y las explicativas.
Como x'x es una matriz cuadrada podemos obtener su determinante lx'xl
y si es distinto de cero implica que es una matriz no singular y puede obtenerse
su inversa [x'xF
1
. Premultiplicando la expresin [3.50] por dicha inversa y
teniendo en cuenta que el producto de la inversa por la matriz dada es la
unitaria, tenemos que:
[x'xF
1
[x'x] b = [x'xF
1
x'y
[ b = [x'xF
1
x'y j [3.52]
La expresin [3.52] nos proporciona las estimaciones de los elementos del
vector columna b que son los coeficientes de regresin parcial del hiperplano
[3.42]. La interpretacin de estos coeficientes es la misma que se ha dado en
el ajuste de un plano.
El problema de la multicolinealidad en el ajuste de un hiperplano
Para que se pueda aplicar la expresin [3.52] no puede existir ninguna
relacin lineal exacta entre cualquier subconjunto de variables exgenas o
176 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
explicativas. Si esto ocurre sabemos por el lgebra matricial que la matriz
[x'x] sera singular, o sea que tendra determinante nulo, \x'x\ = Q, lo que
imposibilitara el clculo de la matriz inversa [x' x] -
1
y como consecuencia
es imposible obtener el vector columna de los coeficientes de regresin parcial.
Ejemplo 3.16
Obtener los coeficientes de regresin parcial del plano del Ejemplo 3.15
utilizando la expresin [3.52].
Solucin:
b ~ [!l x.r'xy
5 5
N
I
X1;
I
X2; 5 17 11
i ~ i ~
5 5 5
.[x'x] =
I
xli
I
xi;
I
xlixu 17 67 44
i=1 i ~ 1 ; ~ 1
5 5 5
I
X2;
I
X2;X1;
I
X ~ 11 44 31
i ~ ; ~ 1 ; ~ 1
Vamos a calcular la [x'xr
1
En primer lugar se obtiene el determinante
de la matriz por la regla de Sarrus:
5 17 11
Jx'x\ = 17 67 44 = 56731 + 174411 + 174411-116711-
11 44 31
- 17. 17. 31 - 5. 44.44 = 10.385 + 8.228 + 8.228 - 8.107 - 8.959 - 9.680 =
= 26.841 - 26.746 = 95
En segundo lugar obtenemos la matriz de adjuntos (menores complemen-
tarios con su signo):
[
141
Adj [x'x] = -43
11
-43
34
-33
11]
-33
46
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
Como es una matriz simtrica coincide con su traspuesta:
Adj [x'x] = {Adj [x'x]}'.
Como sabemos, la inversa es:
_
1
{Adj [x'x]}'
[x'x] = =
lx'xl
141
95
43
95
11
95
43
95
34
95
33
95
Veamos el valor de x'y que segn el sistema [3.51] es:
5
I
Y;
12
; ~ 1
5
x'y=
I
XuY;
47
; ~ 1
5
I
X2;Y;
31
i ~
141 43 11
- 12
95 95 95
b = [x'xr
1
x'y =
43 34 33
95
47
95 95
11 33 46
95 95
31
95
11
95
33
95
46
95
0,13
0,62
0,074
177
Las diferencias de estos coeficientes de regresin parcial y los obtenidos en
el ejemplo 3.15 son debidas a los errores de redondeo ya que son coeficientes
muy pequefl.os con gran sensibilidad en su clculo.
Forma matricial del coeficiente de determinacin mltiple en el ajuste
de un hiperplano
La bondad del ajuste la obtenemos con el clculo del coeficiente de deter-
minacin mltiple que sigue siendo la participacin de la varianza explicada
178
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
por la regresin sobre la varianza total de la endgena observada. Estas
varianzas se pueden obtener tambin empleando el clculo matricial con los
elementos del modelo. Como sabemos los valores observados del vector co-
lumna y son iguales a los estimados por el modelo Yt ms el vector columna
de las desviaciones o errores e:
y = Yt + e = xb + e
Operando niatricialmente con estos elementos se demuestra igual que en
la regresin lineal simple que la varianza total de la endgena s; es igual a
la varianza estimada por la regresin s;,.J23k ms la varianza residual s;y!23k'
o sea:
s2- s2 + s2
y- y
1
123k ryl23k
El coeficiente de determinacin mltiple ser:
R2 =s;,.123k
y123k s2
y
La varianza explicada por la regresin en su forma matricial ser:
1 N _ 1 [N -]
s;,.123k =N .I (Yti- Yf =N .I Y ~ Nf"Z =
=1 =1
1 i""72 1 - 1 -
= N [y;yt - N r] = N [(xb)' (xb) - NY
2
] = N [b'x'xb - NY
2
] =
1 1 - 1 i""72
=- [b'x'x(x'x)- x'y - NVZ] =- [b'x'y - N r]
N N
La varianza total de la variable endgena ser:
2
1;., -
2
1 [N -] 1 _
sy =- L., (yi- Y) =- I yf- NY
2
=-[y' y- NY
2
J
N i=1 N i=1 N .
Luego la expresin matricial del coeficiente de determinacin mltiple en
la regresin de un hiperplano con trmino independiente b
0
es:
b'x'y- NY
2
R;. 123 k = -,....:....-N-,==-72
yy- r
[3.53]
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 179
Ejemplo 3.17
Con los datos del Ejemplo 3.16 obtener la bondad del ajuste del plano.
Solucin:
Para obtener el coeficiente de determinacin mltiple empleamos la expre-
sin [3.53]:
b'Xy ~ (0,13 0,62 0,074)(:;) 32,994 ~ 33
NY
2
= 5. (2,4)
2
= 5. 5,76 = 28,8
b'x'y - NY
2
~ 33 - 28,8 = 4,2
5
y' y= I yf = 34
i=l
y'y- NVZ = 34- 28,8 = 5,2
2 4,2
Ry12 ~ 5 2 = 0,81
'
3.6. Ajustes no lineales por mnimos cuadrados
En los epgrafes anteriores se ha estudiado en profundidad la regresin
lineal ya que es la adecuada para explicar la mayora de los fenmenos de
naturaleza socioeconmica. No obstante existen otras ocasiones en las que la
nube de puntos de los datos observados no se ajustan a funciones de natura-
leza lineal. As, por ejemplo, en el Grfico 3.8 figura a) representa una nube
de puntos a Jos que se ajusta un polinomio de segundo grado, a la b) una
funcin exponencial, a la e) un polinomio de tercer grado y a la d) una
hiprbola equiltera. El planteamiento de estos ajustes por el mtodo de los
mnimos cuadrados es anlogo al estudiado en los casos lineales.
Ajuste de una parbola o polinomio de segundo grado
El modelo que se pretende ajustar es:
[3.54]
180 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y y
)(
)( )(
)( )(
)(
)(
)(
)(
)(
)(
)(
X
(a) (b)
y y
X
(e) (d)
GRFICO 3.8. Los ajustes no lineales.
Para obtener los coeficientes se minimiza la expresin:
N
S= L [y- (a
0
+ a
1
x; + a
2
xf)JZ
i=l
obteniendo el sistema de ecuaciones normales del modo siguiente:
as
-=0
aao
as
-=0
aa
2
X
)( )(
X
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 181
Operando da lugar al siguiente sistema de ecuaciones normales:
N N N
: Y;= Na
0
+ a
1
: X;+ az L
X ~
1
i=l i= 1 i= 1
N N N N
: Y; X= ao : X;+ a
1
: x? + a
2 X ~
i= 1 i= 1 i= 1 i=l
N N N N
L Y; xf = a0 L xf + a1 L x ~ + a
2
L x'f
i=l i=l i=l i=l
Resolviendo el sistema obtendramos los coeficientes de la parbola que
sustituidos en la expresin [3.54] da lugar al modelo ajustado. En este ajuste
el nmero de observaciones tiene que ser mayor que tres que es el nmero de
coeficientes a estimar. El ajuste puede generalizarse a polinomios de grado r
en general, para r + 1 < N, ya que habra r + 1 incgnitas o coeficientes.
Ajuste de una hiprbola equiltera
La ecuacin de una hiprbola equiltera es la siguiente:
1
y= ao +al-
X
[3.55]
Como sabemos la endgena observada ser igual a la estimada ms el
error:
Efectuando el siguiente cambio de variable:
1
z=-
x
nos quedara la ecuacin de una recta de Y sobre Z cuyo ajuste ya hemos
estudiado:
182 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ajuste potencial
La ecuacin de una funcin potencial es:
[3.56]
La expresin [3.56] tiene la peculiaridad respecto a los que hemos estu-
diado hasta ahora de que no es lineal en los parmetros. Cuando las funciones
son lineales en los parmetros, como por ejemplo la hiprbola equiltera, basta
con hacer una transformacin en la variable para aplicar el mtodo de los
mnimos cuadrados. Si la funcin que se desea estimar no es lineal en los
parmetros, hay que transformarla en lineal previamente. En el caso que nos
ocupa basta con tomar logaritmos:
logy = loga
0
+ a
1
logx
Si hacemos el siguiente cambio:
logy =u
logx = z
loga
0
=a
aplicamos el mtodo mnimo cuadrtico al modelo lineal simple de U sobre Z:
u= a+ bz
Una vez estimados a y b se sustituyen en la expresin [3.56] donde
a
0
= antilog a, y a
1
= b.
Ajuste exponencial
La ecuacin de la funcin exponencial es:
Se transforma en lineal tomando logaritmos
logy = loga
0
+ xloga
1
Haciendo el cambio de variable
logy =u
loga
0
=a
loga
1
= b
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 183
Se ajustara por mnimos cuadrados el modelo lineal simple de U sobre X,
u= a+ bx
Una vez estimados a y b se obtienen los verdaderos parmetros deshacien-
do el cambio: a
0
= antilog a y a
1
= antilog b.
En los casos del ajuste de una hiprbola equiltera, potencial y exponencial
vistos, el mtodo de Gauss o de mnimos cuadrados se aplica previa transfor-
macin de las variables.
Ejemplo 3.18
Disponemos de los datos siguientes del consumo X y precio Y de un
producto:
2 3
3 2
Ajustar a estos datos:
a) Una hiperbla equiltera del precio sobre el consumo.
b) Una funcin potencial.
e) Una funcin exponencial.
Solucin:
Construimos la siguiente tabla
1
X Y;
z.=-
l xi
z; = log X U= log Y;
1 1 5 1 o 1,6094379
2 2 3 1/2 0,6931471 1,0986123
3 3 2 1/3 1,0986123 0,6931471
1 1
a) y= a
0
+ a
1
- = a
0
+ a
1
z = 0,6538 + 4,3846-
x X
donde
- m
11
- }
a
0
=Y- -Z = 0,6538
mzo m
11
a
= mu = 4 3846 mzo
es la covarianza entre Y y Z
es la varianza de Z
1 '
mzo
184 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
donde
u = log y = log a
0
+ b log x = log a
0
+ bz'
siendo
- m ~ l m ~ 1
loga
0
=U- -,-Z' = 1,8538 y b = -,- = -1,2057,
m2o m2o
donde m'
11
es la covarianza de U y Z', y m ~
0
la varianza de Z'.
e) y = a
0
ai = 1,2429 0,6325x
donde
(
- m ~ 1 -) m ~ 1
u = log y = log a
0
+ x log a
1
= U - - X + x - =
m2o m2o
= 0,2174418 - 0,4581453 X,
siendo m'{
1
la covarianza de U y X.
3.7. Estudio de la asociacin entre variables
cualitativas
En el estudio que hemos realizado de la regresin y correlacin se ha
tratado slo el caso de variables cuantitativas (ingresos, gastos, precios, sala-
rios, etc.) a las que se les puede someter a todo tipo de clculos numricos
(sumas, restas, divisiones, etc.). Vimos en el Apartado 3.2.2 que con variables
de tipo cualitativo pueden construirse las denominadas tablas de contingencia
y a travs de las mismas se poda estudiar la independencvia estadstica entre
distintos atributos. Si dos atributos son dependientes estadsticamente pode-
mos construir una serie de coeficientes que nos midan el grado de asociacin o
dependencia entre los mismos.
Partimos de la tabla de contingencia 3.4 en la que existen r modalidades
del atributo M y s del M'. El total de observaciones ser:
r s
N= L L n;j
i= 1 j= 1
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 185
Como vimos la independencia estadstica se dar entre los dos atributos
si y slo si:
nij = n; .. n.j
N N N
V i,j [3.57]
Si la expresin [3.57] no se cumple se dir que entre los mencionados
atributos existe un determinado grado de asociacin o dependencia estadstica.
Existe asociacin por ejemplo entre el nivel educativo y los puestos de respon-
sabilidad ocupados en las empresas. Si de la expresin [3.57] despejamos la
frecuencia absoluta conjunta y la denotamos por n;j tendremos:
[3.58]
Este valor n;j es la frecuencia terica que existira si los dos atributos fuesen
independientes. V amos a llamar nij a la frecuencia absoluta conjunta observada.
La diferencia al cuadrado entre estas dos frecuencias es un indicador del grado
de asociacin entre los dos atributos. Un primer coeficiente de asociacin o
contingencia es el llamado cuadrado de contingencia:
[3.59]
Este coeficiente tiene un campo de variacin variable desde cero --cuando
existe independencia y n;j = n;- hasta determinados valores, todos positivos,
que dependern de las magnitudes de las frecuencias absolutas que lo compo-
nen. Este inconveniente de lmites variables se elimina con el empleo del
coeficiente de contingencia debido a K. Pearson que se define como:
~
C=.vJi"+?
[3.60]
Su campo de variacin es de cero a uno. El valor cero se dar en el caso
de independencia al coincidir las frecuencias tericas con las observadas:
n;j = nij. A medida que se va aproximando a la unidad el grado de asociacin
entre los dos atributos es mayor. Slo alcanzar la unidad en el supuesto lmite
de que el cuadrado de contingencia es muy grande ya que el lmite de C
cuando x
2
tiende a infinito es uno.
186 CASAS-SNCHEZ, J. M. y SANTOS-PE:f.lAS, J.
Ejemplo 3.19
A partir de la tabla del Ejemplo 3. 7 determinar el grado de asociacin entre
los atributos estado civil y accidentes automovilsticos.
Solucin:
La tabla de contingencia es:
Accidentes
Estado civil
Casados
Solteros
Con accidente
5
15
20
Sin accidente
35
45
80
n.
'
40
60
100
En primer lugar construimos la tabla de frecuencias tericas n;i:
n n 4020
' - l. .1- - 8
n11 - ----::- -loO -
n' = nl. n. 2 = 40 80 =
32
12
N lOO
n n
1
6020
n' = -
2
--- = --= 12
21
N lOO
TABLA. n;,
M!
M' M
J
M;
1
M 8 32
Mz 12 48
DISTRIBUCIONES mi FRECUENCIAS BIDIMENSIONALES
En segundo lugar se obtienen los elementos de la x
2
:

n
11
f (8- 5)2
' = 8 = 1,125
nu


- nd
2
(32 - 35f
' = 32 = 0,281
n12
TABLA.
(n;,- n;/

M'
1
1,125
0,750
El cuadrado de contingencia ser:
M'
2
0,281
0,188
2 2 (n' - n f
x
2
= ij , ij = 2,344
i= 1 i= 1 n;i
187
A no ser cero este coeficiente nos indica que existe asociacin o dependencia
entre el estado civil y los accidentes. Para ver el grado en la escala de cero a
uno obtenemos el coeficiente de contingencia de Pearson:
rx.z-- 2,344
e= loo+ 2,344 = v0,0229 = 0,1513
Como el coeficiente e est muy prximo a cero, se llega a la conclusin
de que la asociacin entre los dos fenmenos es muy baja.
Ejercicios
l. Un jefe de un establecimiento comercial quiere saber si el aumento en el
nmero de clientes potenciales que entran en sus almacenes, supone un aumen-
to en sus ventas. Para ello observa las variables estadsticas X (nmero de
clientes potenciales) e Y (importe de las ventas), durante los seis das de una
semana; los datos son:
Da L M
X 87 63
y 120 85
Se pide:
X
70
90
J
55
63
V S
90 105
110 150
a) Las medias aritmticas y varianzas marginales de X e Y.
b) La covarianza de X e Y.
e) Coeficiente de correlacin entre X e Y.
) La dependencia o independencia estadstica entre X e Y.
e) Las rectas de regresin lineal de X sobre Y, y de Y sobre X.
Soluci6n:
- 1 1 235 -
a) X=
6
(87 + 63 + 70 +55+ 90 + 105) = 6470 = 3 = 78,3 = a
10
- 1 1 o
Y=
6
(120 + 85 + 90 + 63 + 110 + 150) = 6618 = 1 3 = a
01
2 38.588 (470)
2
-
m
20
= a
20
- a
10
= -
6
- - 6 ~ 295,2
a
20
= 8 7
2
+ 63
2
+ 70
2
+ 55
2
+ 90
2
+ 105
2
) =
6
1
= 6(7.569 + 3.969 + 4.900 + 3.025 + 8.100 + 11.025) =
1 -
= 6 38.588 = 6431,3
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 189
- 2 68.294 -
mo2 - ao2 - ao1 = -
6
- - 103
2
= 773,3
1
aoz = 6(120
2
+ 85
2
+ 90
2
+ 63
2
+ 110
2
+ 150
2
) =
1
= 6(14.400 + 7.225 + 8.100 + 3.969 + 12.100 + 22.500) =
1 -
= 6 68.294 = 11382,3
b) mu = a
11
- a
10
a
01
= 8.535 - 78,3 103 = 466,6
1
a1 1 = 6 (87 120 + 63 85 + 70 90 + 55 63 + 90 110 + 105. 150) =
1
= 6(10.440 + 5.355 + 6.300 + 3.465 + 9.900 + 15.750) =
1
= 6 51.210 = 8.535
R
m1 1 466,6 466,6
e) = = ~ ~ 09766723
~ ; ; ; ; fo52.fi73J 17,18293227,808871- '
Existe un grado de correlacin entre clientes potenciales y ventas del 97,6 %.
) R i= O => x e y son variables dependientes.
)
- 466,6
e X sobre Y: x- 78 3 =---(y- 103)
' 773,3
466,6 -
Y sobre X: y- 103 =
295
,
2
(x- 78,3)
2. Calcular la varianza residual de Y sobre X, y de X sobre Y, as como el
coeficiente de determinacin para los datos del problema anterior.
Soluci6n:
R
2
= 0,9538887 => 95,39% de concasualidad.
s;Y = m02 (1 - R
2
) ~ 35,659342 varianza residual de Y sobre X
s;x = m20 (1 - R
2
) ~ 13,61308 varianza residual de X sobre Y
190 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
3. Si hxy y byx son las pendientes de las rectas de regresin de X sobre Y, y
de Y sobre X, demostrar que el coeficiente de determinacin, R
2
= h-xy b,x
Solucin:
bxy = ~ }
2
_ mil _ mu mu _
R - --.-- byxbxy
m
11
mzomoz mzo moz
b =-
yx mzo
debido a la propiedad conmutativa del producto de nmeros reales.
4. Justifquese si debe aceptarse o rechazarse que de unos datos relati-
vos a cierta variable bidimensional se ha obtenido que m
11
= 40, m
20
= 16 y
m
02
= 25.
Solucin:
De ser ciertos estos momentos, podremos calcular el coeficiente de corre-
lacin:
m
11
40 40 40
R= = =-=-=2>1
~ ; ; ; ; ; Ji6J25 4 5 20 '
que contradice que el coeficiente de correlacin debe estar comprendido entre
- 1 y 1: - 1 ~ R ~ l. Debe rechazarse, por ser imposibles los datos.
5. A partir de un conjunto de datos sobre una variable estadstica bidimen-
sional, se ha calculado la recta de regresin de X sobre Y, obtenindose los
siguientes resultados:
x = 2y - 18 ; R
2
= 0,9 ; a
01
= 19
Obtener por deduccin lgica la recta de regresin de Y sobre X.
Solucin:
La recta buscada es:
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 191
de la que conocemos a
01
= 19; por otro lado,
siendo 2 la pendiente de la recta de regresin de X sobre Y, de donde la
pendiente de la recta de regresin de Y sobre X,
mll 9
- = 09/2 = 045 =-
mzo ' ' 20
Luego slo queda determinar a
10
, pero la recta de regresin dada es
x - a
10
= 2{y - a
01
) = 2{y - 19),
y coincide con
X= 2y- 18
de donde:
-18 = a
10
- 2 19 = a
10
- 38 = a
10
= -18 + 38 = 20
por lo que la recta pedida, sustituyendo ser:
o bien:
o equivalentemente:
9 9
y- 19 = -(x- 20) = -x- 9
20 20 '
9
Y
= -x + 10
20 '
[! = 0,45x + 10
6. Entre los empleados de cierta empresa se dispone de la informacin de
sus salarios brutos al ao, que se han clasificado en dos intervalos: de 1 a 3
y de 3 a 7 millones de pesetas. Por otro lado se han encuestado a los asala-
riados sobre el nmero de vehculos a motor (incluyendo automviles, moto-
192 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
cicletas, camionetas y similares) adquiridos en los ltimos 5 aos. Los resul-
tados han sido:
Vehculos, Y
o 1 2 3
Salario, X
1-3 2 3 1 o 6
3-7 o o 1 2 3
2 3 2 2 9
Obtener:
a) La recta de regresin de Y sobre X.
b) La recta de regresin de X sobre Y.
e) El coeficiente de correlacin y el de determinacin.
d) Si son ambas variables independientes o no.
e) La varianza residual de Y sobre X.
Soluci6n:
1 1
a
10
= -(26 + 53) = -(12 + 15) = 3
9 9
1 1 13
a
0 1
= -(O 2 + 1 3 + 2 2 + 3 2) = -(O + 3 + 4 + 6) = -
9 9 9
m
20
= a
20
- ai
0
= 11 - 3
2
= 11 - 9 = 2
1 1
a
20
= -(2
2
6 + 5
2
3) = -(24 + 75) = 11
9 9
29 (13)
2
261 - 169 92
moz = aoz - = 9 - 9 = 81 = 81
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
1
a =- (2 O 2 + 2 1 3 + 2 2 1 + 2 3 O + O 5 O + 1 5 O +
11 9
1 50
+ 2. 5. 1 + 3. 5. 2) =- (6 + 4 + 10 + 30) =-
9 9
b) Aprovechando los clculos ya efectuados,
=> X _
3
= 11/9 (y _ 13) =
92/81 9
= 99
92 9
=> X _
3
= 99 (y _ 13)
92 9
e) Coeficiente de determinacin:
11 99 1.089
R
2
= 6576087
18 92 1.656 '
Coeficiente de correlacin:
{1089
R = sig(m
11
)JR2 = + yt:656 0,8109307
193
d) R # O = Variables estadsticas dependientes. El salario de los emplea-
dos influye en el nmero de vehculos a motor adquiridos en
los ltimos 5 aos.
e) S
2
= m (1 - R
2
) = - 1 - -- O 38
92 ( 1.089) -
ry
02
81 1.656 '
La variabilidad de Y no explicada por la recta de regresin de Y sobre X,
es del 38,8 %.
194 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
7. De una variable estadstica bidimensional (P, V) = (precio, ventas en tm.)
de cierto producto de consumo en diferentes das, se han ajustado las siguien-
tes rectas de regresin:
4P+ V=2}
25P + 16V= 9
Calcular el coeficiente de correlacin.
Solucin:
Las rectas sern:
o bien:
1 1
P=--V+-
4 2
V= -4P + 2
25 9
y V=--P+-
16 16
16 9
y P=--V+-
25 25
Si fueran ciertas la rectas de P sobre V y de V sobre P de (1), entonces:
R=- J( [-1, 1]
(1)
(2)
Mientras que si las rectas de V sobre P y de P sobre V fueran respectiva-
mente las recogidas en (2), se deducira:
R=-

[-1, 1],
donde - 8/5 no puede ser nunca un coeficiente de correlacin.
Luego:
5
R = - S = - 0,625.
8. De las estadsticas de una variable bidimensional (H, C) = (horas de
trayecto, consumo de combustible en litros) de cierta flota mercante, se han
obtenido estos valores:
100 100
N = 100, L h; = 31.000 ht = 200.000.000
i= 1 i= 1
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
195
100 100
L C = 100.000 L c'f = 150.000.000
i= 1 =1
100
L h C = 50.030.000
=1
Hallar:
a) La recta de regresin de e sobre H.
b) El coeficiente de determinacin.
e) La varianza explicada por la recta obtenida de e sobre H.
Solucin:
190.300
e - 1.000 = 1.
903
.
900
(h - 31 O)
Donde.
100.000
a
01
= ----o= = 1.000 litros
31.000
a
10
= 10() = 310 horas
m
20
= a
20
- afo = 2.000.000 - 310
2
= 1.903.900
200.000.000 .
azo =
100
= 2.000.000 (horas)
2
m
11
= a
11
- a
10
a
01
= 500.300 - 310 1.000 = 190.300
50.030.000
a
11
=
100
= 500.300
moz = a
02
-

= 1.500.000 - 1.000
2
= 500.000
150.000.000
aoz =
100
= 1.500.000
196 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
La explicacin puede deberse a que los buques de gran tamafio y consumo
de combustible hagan muy frecuentemente trayectos breves, mientras que
los de menor tamao y consumo hagan tambin los trayectos largos en
horas.
e) s;c = m
02
(1 - R
2
) ~ 480.978,996 es la variabilidad de e no explicada por
la recta de e sobre H.
Por todo ello, la varianza explicada por la recta de e sobre H, es:
2
_
2
_ mi
1
_ (190.300j2 .
2
m
02
- Src- m
02
R - m
20
- 1.
903
.
900
~ 19.021,004 (litros)
9. De la distribucin de una variable bidimensional se sabe que:
Obtener las rectas de regresin de Y sobre X, y de X sobre Y.
Solucin:
Y sobre X:
m
11
R ~ ;;;;;;
y - a = -(x - a ) = (x - a ) *
01 m2o 10 m2o 10
08J2J8
y - 4 = '
2
(x - 3) = 1,6 (x - 3) * y = 1,6x - 0,8
X sobre Y:
m
11
. 3,2
x- a
10
=-(y- a
01
) * x- 3 = -
8
{y- 4) = 0,4{y- 4)
mo2
* X = 0,4y + 1,4
10. Estudiar si las siguientes variables, X= sexo, e Y= estado civil, son o
no independientes. En el caso de haber dependencia obtener el cuadrado de
la contingencia.
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 197
nij:
~
S e V n.
'
V 80 52 20 152
H 48 52 12 112
n .
J
128 104 32 264 =N
Solucin:
y
n;/ S e V
X
V
19.456 15.808 4.864
264 264 264
H 14.336 11.648 3.584
264 264 264
donde para ver si son X e Y independientes se debe verificar:
i = 1,2 ; j = 1, 2, 3.
Por ejemplo:
19.456
n ~

= 264 =1= n
11
= 80 * X e Y son variables dependientes.
El cuadrado de la contingencia es:
2 3 (n' _ n )2
x
2
= ij , ij ~ o,5390749 + 1,0366826 + o,1347687 + o,7316017 +
i= 1 j= 1 nij
+ 1,4069264 + 0,1829004 = 4,0319547
198
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
11. Ajustar una parbola a los datos relativos al precio P y demanda D de
cierto artculo si se han observado ambas variables conjuntamene en 4 das
consecutivos: '
Da i
Solucin:
1
10
6
2
7
9
3
11
5
4
9
8
Debemos ajustar la funcin D =a+ bP + eP
2
, para ello resolvemos el
sistema de ecuaciones normales
que resulta ser:
4 4 4
D = 4a + b P; + e Pf
i=l i=l i=l
4 4 4 4
D; P; = a P; + b Pf +e pt
i=l i=l i=l i=l
4 4 4 4
" D. = a " + b " + e " _.,, L.-t L..a. _.,
i=l i=l i=l i=t
28 = 4a + 37b + 351e}
250 = 37a + 351b + 3.403e
2.294 = 351a + 3.403b + 33.603e
a= 7-

=
35
:5)0 = 37(7-
3
!
1
e) + 351b + 3.403e )
2.294 = 351 7 - --b ----e + 3.403b + 33.603e
DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES
(
37
2
) ( 351) ) -9=b 351---- +e 3.403-37---
35137 351
2
- 163 = b ( 3.403 - -
4
-) + e ( 33.603 - -
4
-)
35 625 ) -9 = - b - - e - 36 = 35b + 625e }
4
4
= -652 = 625b + 11.21le
625 11.211
-163 = - b + -- e
4 4
1
b = - (- 625e - 36)
35
625
- 625 = - {- 625e - 36) + 11.211e
35
- 22.820 = e(- 390.625 + 392.385) - 22.500
de donde:
y
= -22.820 + 22.500 = -320 = -o 18
e 1.760 1.760 '
1
b =- (-625e- 36) e:,; 2,21818
35
37 351
a= 7- -b--e e:,; 7- 20,518165 + 15,954545 = 2,43638
4 4
La parbola de regresin de D sobre Pes aproximadamente:
1 D = 2,43638 + 2,218l8P- 0,181818P
2
1
199
12. Con los datos del problema anterior, calcular la varianza residual de D
sobre P y el coeficiente de determinacin R
2

200 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Solucin:
1
~ 0,362157 = 0,09054,
donde:
Df = a + bP
1
+ ePi ~ 6,7273 + 1,2336 10 - 0,1269 10
2
~ 6,369
~ = a + bP
2
+ P ~ ~ 6,7273 + 1,2336 7 - 0,1269 7
2
~ 9,1444
~ ~ 4,942
D! ~ 7,5508
El coeficiente de determinacin se calcula as:
s;D o,09054
R
2
= 1 --~ 1 - --= 0,963784,
mo2 2,5
donde
2 = 206 - 72 = 206 - 196 10
mo2 = aoz - aol 4 4 4
1 1 206
a
02
= (6
2
+ 9
2
+ 5
2
+ 8
2
) = (36 + 81 + 25 + 64) = 4
1 28
a
01
= (6 + 9 + 5 + 8) = 4 = 7
Por tanto existe una concausalidad parablica del 96,38 % entre las varia-
bles estadsticas P y D.
Captulo 4
Nmeros ndices
4. 1. Introduccin
A lo largo de los captulos 2 y 3 se ha estudiado la descripcin de variables
aisladas tanto cuantitativas como cualitativas as como las relaciones entre
distintas variables a travs de la regresin y la correlacin. Las distribuciones
de frecuencias tanto unidimensionales como multidimensionales estn referidas
a un slo perodo temporal, o sea no se ha tenido en cuenta la variable tiempo
en el estudio de las variables econmico-sociales. En el presente captulo y el
que le sigue vamos a tratar de la descripcin de fenmenos econmicos a lo
largo del tiempo a travs de la construccin de lo que se denominan nmeros
ndices y el tratamiento clsico o descriptivo de las series temporales.
Existen un gran nmero de fenmenos econmicos cuyo significado y
estudio alcanza distintos niveles de complejidad. Ejemplos de estos fenmenos
son lo que se conoce como coyuntura econmica, nivel de inflacin, nivel de
desarrollo, etc. Los nmeros ndices que estudiaremos en el presente captulo
constituyen el instrumental analtico ms adecuado para estudiar la evolucin
de una serie de magnitudes econmicas que nos den respuesta a cuestiones
tales como si la coyuntura econmica es positiva o negativa, si el nivel de
inflacin es adecuado o no o si nuestro ritmo de crecimiento econmico
permite o no permite crear empleo neto positivo.
Un nmero ndice puede definirse como una medida estadstica que nos
proporciona la variacin relativa de una magnitud simple o compleja a lo
largo del tiempo o del espacio. Lo ms corriente es que se estudie la evolucin
de la magnitud a lo largo del tiempo con lo que hay que establecer lo que se
conoce como perodo inicial o base sobre el que se va comparando la evolucin
de la magnitud o variable estadstica. El procedimiento de comparacin es
muy sencillo. Supongamos, por ejemplo, que queremos estudiar la evolucin
202 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
de la produccin de automviles, siendo X. el valor de la misma en el perodo
base (un ao determinado) y xt los automviles fabricados en otro perodo t
distinto del base que se denomina perodo de comparacin. El ndice de evo-
lucin de o a t expresado en tantos por cien ser:
X
1
1
= ___! X 100
o x.
[4.1]
La expresin [4.1] toma el valor 100 en el perodo base ya que X
1
=X. y
en los dems perodos fluctuar de acuerdo con la evolucin X
1
El hecho de
que ~ < 100 implica que X
1
<X. (en el perodo de comparacin se han
producido menos automviles que en el base). Si ~ > 100, X
1
> x., indicando
que la evolucin ha sido positiva en el recorrido del perodo base o al perodo
de comparacin t.
La elaboracin de nmeros ndices tienen sentido en las variables de
naturaleza cuantitativa. La expresin [4.1] est definida por cociente con lo
que el ndice es independiente de las unidades de medida en que venga expre-
sada la variable con lo que se pueden efectuar agregaciones de distintos ndices
construyndose indicadores de evolucin general de fenmenos econmicos.
4.2. Clasificacin de los nmeros ndices
Los nmeros ndices se clasifican atendiendo a la naturaleza de las mag-
nitudes que miden (simples o complejas) y a la importancia relativa de cada
componente dentro del conjunto en el caso de las complejas. Luego segn esto
tendremos:
- Nmeros ndices simples que surgen cuando se estudia la evolucin a
lo largo del tiempo de una magnitud que tiene un slo componente (no admite
desagregacin). Sera el caso, por ejemplo, de estudiar la evolucin del precio
del queso manchego puro de oveja, de una determinada marca en los ltimos
diez aos. Luego dada una magnitud simple X; su nmero ndice simple ser
en el perodo t el siguiente:
Siendo:
x.
l. =-'
1
X 100
" X;.
1;
1
=Nmero ndice en el perodo t de la magnitud i.
X;
1
= Valor de la magnitud en el perodo t.
X;o = Valor de la magnitud en el perodo base.
[4.2]
Los nmeros ndices simples se emplean con gran difusin en el mundo de
la empresa a la hora de estudiar las producciones y ventas de los distintos
artculos que fabrican y lanzan al mercado.
1
1
NMEROS NDICES 203
- Nmeros ndices complejos sin ponderar que surgen cuando se estudia
la evolucin de una magnitud que tiene ms de un componente y a todos se
les asigna la misma importancia o peso relativo. As, por el ejemplo, la mag-
nitud compuesta puede ser el precio de un conjunto de productos lcteos
(queso, leche y mantequilla) establecindose la hiptesis, por otro lado nada
realista, que los tres componentes tengan la misma importancia o peso en el
consumo de los hogares. Como en la realidad los componentes de una mag-
nitud compleja tienen pesos distintos, estos ndices tienen poca utilidad en el
mundo econmico-empresarial.
Su elaboracin no plantea ninguna dificultad. Supongamos que la magni-
tud compleja que nos interesa tiene N componentes (1, 2, ... , i, ... ,N). En primer
lugar se elaboraran los ndices simples de cada componente 1
11
, 1
21
, , 1;
1
, ,
1N
1
; siendo el ndice complejo sin ponderar la media aritmtica simple todos
ellos:
1 N 1 N Xit
lt = - L lit = - L - X 100
N i=l N i=l X;.
[4.3]
- Nmeros ndices complejos ponderados surgen cuando a los componen-
tes de la magnitud compleja que se est estudiando se le asigna a cada uno
un determinado coeficiente de ponderacin W;. Este tipo de nmeros ndices
son los que realmente se emplean en el anlisis de la evolucin de los fen-
menos complejos de naturaleza econmica: ndice de precios de consumo
(IPC), ndice de produccin industrial (IPI), etc.
Su formulacin general es inmediata ya que basta con introducir en la
expresin [4.3] los coeficientes de ponderacin de los N componentes (W
1
, W
2
,
... , W, ... , WN):
N N
x.

l;tWi -'
1
X 100W.
1 =
i=l i=l
X;. '
[4.4]
t N N
W; W;
i= 1 i=l
4.3. Propiedades de los nmeros ndices
1." Existencia: Todo nmero ndice debe existir y se puede calcular para
cualquier valor de la variable, tomando un valor real y distinto de cero.
2. Identidad: Si se hacen coincidir los perodos base y de comparacin el
ndice vale la unidad si se expresa en tantos por uno o cien si es en
tantos por 100:
x. x.
1
1
= _____!!_ X 100 = ~ X 100 = 100
X;. X;.
204 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
3." Inversin: El producto de dos ndices en los que se han invertido los
perodos base y de comparacin es igual a la unidad:
4." Cicular: Es una genralizacin de la de inversin. Si generalizamos a
tres perodos t', t, o, tendremos:
l
it' it io 1 it' it _ 1 _ it
io ' it1 it = => io ' it' - io - io
it
s. Proporcionalidad: Si la magnitud vara en proporcin 1 + K, y ftjado
el perodo de comparacin, el nmero ndice tambin vara en la
misma proporcin. Sea x;, = Xit + KX
11
= (1 + K) X,
X (1 + K)X-
1
X. X.
T =-'
1
= '=-''+K-'
1
=/. +KJ. =(l+K)J.
,, X;. X;. X;. : X;o ,, ,, ,,
Estas propiedades, que se cumplen en general para los nmeros ndices
simples, no suelen cumplirse todas en el caso de los ndices complejos o de
varias componentes.
En los apartados siguientes nos ocuparemos de la elaboracin de ndices
concretos: ndices de precios, de cantidades, de valor, etc., que son los que ms
se utilizan en el campo econmico.
,
4.2. lndices de precios
La magnitud que vamos a considerar en este caso concreto es el precio,
los nmeros ndices de precios se clasiftcarn tambin en:
Nmeros
ndices de
precios
Simples' (se estudia el precio
de un slo producto o servicio)
{
Sin ponderar
Complejos (se refiere
a un precio con varios
componentes)
Ponderados
{
Sauerbeek
Bradstreet-Dutot
{
Laspeyres
Paasche
Edgeworth
Fisher
'!1'''' '
~
1
1
i
NMEROS NDICES 205
4.4. 1 . ndices simples de precios
Se designa la magnitud precio del nico componente del ndice simple i
por p
1
Luego la expresin del ndice simple de un precio para el perodo t ser:
[4.5]
Siendo:
P
1
, =Nmero ndice simple de precios del componente i en el perodo t.
p
1
, =Precio del componente i en perodo t.
Pio = Precio del componente i en el perodo base.
Ejemplo 4.1
Los precios expresados en pesetas corrientes del litro de leche entera de
una determinada marca, en el perodo 1995-2000, han sido: 75, 77, 85, 89, 97
y 105. Obtener la serie de nmeros ndices simples de la magnitud precio del
litro de leche tomando como perodo base 1990.
Solucin:
Aos
p. = Pit X lOO
11
Pio
75
1995 -X 100 =lOO
75
77
1996 - X 100 = 102,6
75
85
1997 -X 100 = 113 3
75 ,
89
1998 - X 100 = 118,6
75
97
1999 - X 100 = 129,3
75
105
2000 - X 100 = 140,0
75
206 CASAS-SNCHEZ, J. M. y SANTOS-PEJ'lAS, J.
Si se observa la serie de los nmeros ndices simples vemos la evolucin
de la magnitud a lo largo del perodo observndose que de 199,5 a 1996 el
precio ha crecido un 2,6 por 100 de 1995 a 1998 un 18,6 por 100 y en todo el
perodo un 40 por 100. Como se ha comentado anteriormente los ndices, al
estar definidos por cociente no dependen de las unidades de medida.
4.4.2. ndices complejos de precios
sin ponderar
En este caso la magnitud precio es compleja ya que intervienen en su
definicin varios componentes. Nos podemos plantear la evolucin de los
precios de los productos lcteos a travs de tres componentes: leche, queso y
mantequilla. El ndice complejo se puede definir empleando dos criterios: el
de la media aritmtica simple o de Sauerbeck o el de la media agregativa simple
o de Bradstreet-Dutot.
a) ndice media aritmtica de ndices simpleso de Sauerbeck
En primer lugar si tenemos N componentes del precio se obtienen los
ndices simples, Pw para cada una, siendo el ndice de Sauerbeck la media
aritmtica no ponderada de los mismos:
1 N 1 N .
p = - L: P. =- L: p,, X 100
s N i=l
11
N i=l Pio
[4.6]
Ejemplo 4.2
Los precios de la leche, el queso y la mantequilla, de una determinada
marca, que ha pagado una familia en el perodo 1997-1999 han sido los
siguientes:
Artculos
1. Leche (ptas./litro)
2. Queso (ptas.fkg)
3. Mantequilla (ptas.fkg)
1997
85
2.100
900
1998
89
2.300
1.200
1999
97
2.400'
1.400
Tomando como perodo base 1997 obtener la'serie de los nmeros ndices
complejos sin ponderar de Sauerbeck del precio de los productos lcteos
consumidos en la familia.
'1
11
1
1
NMEROS NDICES 207
Solucin:
En primer lugar se obtienen los ndices simples de los tres componentes:
ndices simples 1997 1998 1999
P1, = P!t X 100
85 89 97
-X 100 = 100
85
X 100 = 104,7 - X 100 = 114,1
P10
85 85
P
2
,=Pzr x 100
2.100 2.300 2.400
--X 100= 100 --
0
X 100 = 109,5 ~ X 100 = 1143
Pzo
2.100 2.10 2.100 '
p = p
3
, X 100
900 1.200 1.400
-X 100 = 100
900
X 100 = 133,3
900
X 100 = 155,6
3t
900
P3o
.En segundo lugar se aplica la expresin 4.6 para las tres componentes
siendo la serie de los ndices de Sauerbeck:
Aos
1997
1998
1999
1 N p.,
P,=- L __.!..X 100
N i=l P;o
1 3 Pw 1
- L - X 100 =-. 300 = 100
3 i= 1 Pw 3
1 3 P;, 1
- L -X 100 = - 347 5 = 115 8
3 i=l Pw 3 ' '
1 3 P;, 1
- L - X 100 =-. 384 o= 128 o
3 =1 Pw 3 ' '
Observando esta serie de ndices complejos sin ponderar vemos que el
precio de los productos lcteos ha aumentado un 28 por 100 en el perodo
1997-1999.
b) ndice media agregativa simple o de Bradstreet-Dutot
El concepto de media agregativa se emplea slo en la elaboracin de
nmeros ndices. En el ndice de Sauerbeck se obtiene una media aritmtica
de ndices de precios simples relativos ya que los ndices simples son cocientes
de precios de los perodos de comparacin con el base. La media agregativa
208 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
se define como el cociente entre la media aritmtica simple de los N precios
en el momento t de comparacin y la misma media en el perodo b,ase o:
1 N N
N .I Pit .I Pit
p = = l X 100 = X 100
BD 1 N N
N i ~ l Pio ; ~

Pio
[4.7]
Ejemplo 4.3
Obtener el ndice de Bradstreet-Dutot para los datos del ejemplo 4.2
tomando como periodo base 1997.
Solucin:
En primer lugar obtenemos el numerador y denominador de la expresin
[ 4. 7] sumando simplemente las columnas del ejemplo 4.2:
Ao
1997
1998
1999
3
I P;,
p = ~ X 100
BD 3
L P;o
i=l
3.085
--X 100 = 100
3.085
3.589
3.08S X 100 = 116,3
3.897
3
_
085
X 100 = 126,3
4.4.3. ndices complejos de precios
ponderads
Este tipo de ndices son los ms representativos del fenmeno que se
pretende estudiar y por tanto son los que se utilizan realmente. Los ndices
complejos sin ponderar tienen el grave inconveniente que a todos los compo-
nentes se les da el mismo peso cuando en los casos reales de los fenmenos
NMEROS NDICES 209
econmicos esto no ocurre. Lo que se gastan las familias en leche es mucho
mayor que lo que se gastan en queso o mantequilla, por ejemplo.
Otro grave inconveniente que tiene el ndice de la media agregativa es que
al sumar precios absolutos, no relativos, depende de las unidades de medida
de la variable. As si el precio de la mantequilla en vez de expresarse en kilos
se refiere a 250 gramos, evidentemente el sumatorio vara y el ndice agregativo
tambin. Estos problemas se eliminan con la construccin de ndices complejos
y ponderados que vamos a ver seguidamente.
a) ndice de precios de Laspeyres
La distinta tipologa de ndices de precios complejos y ponderados surge
en relacin con los coeficientes de ponderacin que se utilizan para cada
componente. Estos coeficientes asignan a cada elemento la importancia rela-
tiva que tiene dentro del conjunto. Los ndices de precios que pueden elaborarse
son muy variados si tenemos en cuenta el circuito de las transacciones econ-
micas: precios de salida de fbrica, al por mayor, al consumidor, etc. Las
ponderaciones que se utilicen estarn basadas en el valor de las transacciones en
la fase comercial que se considere. Si son precios al por mayor, ser el valor de
las transacciones entre mayoristas y minoristas; si son precios al consumidor
sern los valores de los intercambios entre el comercio minorista y los con-
sumidores.
El ndice de precios de Laspeyres utiliza como coeficientes de ponderacin
el valor de las transacciones en el periodo base. En economa entendemos por
valor el producto del precio por la cantidad: Vio = Pio qio Luego si en la
expresin 4.6 que es el complejo sin ponderar introducimos estos coeficientes
de ponderacin W; = Pio q
0
para cada componente tendremos:
El ndice de precios de Laspeyres tiene la ventaja de que las ponderaciones
Pio q
0
del periodo base se mantienen fijas para todos los perodos considerados;
pero por contra aparece el inconveniente de que su representatividad dismi-
nuye a medida que nos alejamos de dicho perodo.
b) ndice de precios de Paasche
Este ndice surge cuando en una media de ndices simples se introduce
como coeficientes de ponderacin la expresin W; = P;o q
1
; o sea las cantidades
210 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
del perodo de comparacin q;, se valoran con precios del perodo base P;o:
P;r Pit
L., - W L., - Pioqit L., Pitqit
p = i=1 Pio X 100 = i=1 Pio X 100 = .:...i=,..,;l:...___ X 100 [4.9]
P N N N
L W L Pio q, L Pio q,
i=1 i=1 i=1
En la expresin [4.9] puede observarse que las ponderaciones ya no son
fijas sino variables. El ndice de Paasche tiene la ventaja de que los pesos
relativos de los distintos componentes se actualizan en cada perodo, con el
agravante de complejidad y costes de tener que contabilizar precios y canti-
dades en cada perodo, mientras que en la expresin [ 4.8] slo se actualizan
peridicamente los precios P;r
e) ndice de precios de Edgeworth
En este ndice se utiliza como coeficientes de ponderacin la suma de los
utilizados en los casos de Laspeyres y Paasche:
Luego su expresin ser:
P;, Pit
L., - W L., - (pio qio + Pio q,)
p = i=1 Pio X
100
= i=l Pio X 100 =
E N N
L W L (pio qio + Pio q,)
i=1 i=1
N
L p,(qio + q,)
.:...i=:-:'
1
:..._ ____ X 100
N
[4.10]
L P;o(qio + q,)
i= 1
La expresin [4.10] tambin puede adquirir la forma siguiente que es ms
prctica para su clculo:
N N
2: p,qo + 2: p,q,
p = i= 1 i= 1 X 100
E N N
[4.11]
L Pio qio + L Pio q,
i=1 i=l
NMEROS NDICES 211
d) ndice de precios de Fisher
Este ndice se define como la media geomtrica de los ndices de Laspeyres
y Paasche:
[4.12]
Ejemplo 4.4
Adems de los precios de la leche, el queso y la mantequilla, para el perodo
1997-1999 del Ejemplo 4.2, tenemos las cantidades que ha consumido la fami-
lia en dicho perodo concentrndose la informacin estadstica en la siguiente
tabla:
1997 1998 1999
Artculos
Precio
Cantidad
Precio
Cantidad
Precio
Cantidad
(ptas.) (ptas.) (ptas.)
l. Leche 85 600 litros 89 650 litros 97 700 litros
2. Queso 2.100 30 kg 2.300 40 kg. 2.400 45 kg
3. Mantequilla 900 15 kg 1.200 18 kg 1.400 20 kg
Utilizando los datos del anterior cuadro obtener los ndices de precios de
Laspeyres, Paasche, Edgeworth y Fisher de 1999 tomando como perodo base
1997.
Solucin:
En primer lugar vamos a obtener una tabla de clculos donde se incluyan
los valores de los numeradores y denominadores de las expresiones [4.8], [4.9]
y [4.11].
Artculos
Pi97 qi97 Pi99 qi91 Pi99 qi99 Pi97 %99
l. Leche 51.000 58.200 67.900 59.500
2. Queso 63.000 72.000 108.000 94.500
3. Mantequilla 13.500 21.000 28.000 18.000
Sumas 127.500 151.200 203.900 172.000
212 CASAS-SNCHEZ, J. M. y SANTOS-PE:f.l'AS, J.
3
L Pi99. qi9? 151.200
PL = ;
1
X 100 = 127.500 X 100 = 118,6
L Pi9? qi9?
i= 1
3
L Pi99. qi99 203.900
Pp = ;
1
X 100 = 172.000 X 100 = 118,5
L Pi97. qi99
i=1
3 3
L Pi99 qi9? + L Pi99 qi99
p =i=1 i=1 151.200+203.900
E
3 3
X
100
= 127.500 + 172.000 X
100
=
L Pi9? qi9? + L Pi9? . qi99
i= 1 i=1
355.100
=
299
.
500
X 100 = 118,6
PF = J118,6 X 118,5 = 118,5
4.5. ndices de cantidades o cunticos
Para cualquier magnitud, y por supuesto para las cantidades, siempre se
podrn elaborar nmeros ndices simples (se analiza un slo componente),
complejos sin ponderar (utilizando cualquier tipo de media sin ponderar en
los ndices simples relativos o utilizando el concepto de media agregativa).
Luego en los ndices complejos sin ponderar siempre se podrn construir
ndices de Sauerbeck y de Bradstreet-Dutot cuando exista homogeneidad entre
los componentes incluidos en el ndice. Para no ser repetitivos al tratar las
cantidades vamos a formular slo los ndices complejos ponderados de Las-
peyres, Paasche, Edgeworth y Fisher.
En economa existe una gran variedad de cantidades, pero las ms rele-
vantes son los volmenes producidos por las empresas de una serie de artculos
que son demandados bien por las propias empresas (bienes intermedios o de
produccin) o por las familias (bienes de consumo fmal). Los ndices cunticos,
complejos y ponderados miden la evolucin de estas magnitudes a lo largo
del tiempo establecindose los adecuados coeficientes de ponderacin.
NMEROS NDICES 213
ndice cuntico de Laspeyres
Los coeficientes de ponderacin que se introducen en la frmula de la
media aritmtica de ndices cunticos simples son W = qio Pio siendo q
0
las
unidades producidas o consumidas del componente i en el perodo base y Pio
puede ser el precio final de venta si nos referimos a cantidades vendidas o
consumidas o puede ser el valor aadido por unidad producida si nos referimos
a un ndice de cantidades producidas. Hay que tener en cuenta que el valor
aadido por unidad es equivalente a un precio que nos da la verdadera
importancia relativa del componente. La formulacin ser:
Esta expresin de Laspeyres es la que ms se utiliza, ya que nos da la
evolucin de la cantidad en trminos reales o constantes al utilizar los precios
del perodo base.
ndice cuntico de Paasche
En este caso los coeficientes de ponderacin, con el mismo sentido econ-
mico del ndice de Laspeyres, de precio fmal o valor aadido por unidad, segn
sean cantidades consumidas o producidas, sern W; = q
0
P;r La formulacin
ser la siguiente:
N q N q. N
" ____!!_ w,. " lt "
L.., L.., -q;oPir L.., qitPir
Qp = i=1 /io X 100 = i=1N qio X 100 = .:..,:,.,.::1'--- X 100
[4.14]
L W L qioPit L
i= 1 i= 1 i= 1
En la expresin [4.14] de Paasche puede observarse que se utilizan los
precios de cada perodo de comparacin, al variar t.
ndice cuntico de Edgeworth
En este caso, igual que ocurra en el ndice de precios, el coeficiente
de ponderacin es la suma de los utilizados por Laspeyres y Paasche:
W = q
0
Pio + q
0
Pir Su desarrollo ser:
214 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
N N N
L q,(po + P;,) L qitPio + L
i = 1 X 100 = ....:i __ ---!.::i X 100
N N N
[4.15]
L qio (pio + Pit) L qio Pio + L
i=1 i=1 i=1
ndice cuntico de Fisher
Como sabemos ser la media geomtrica de los ndices cunticos de Las-
peyres y Paasche:
[4.16]
Ejemplo 4.5
De la tabla de precios y cantidades del Ejemplo 4.4 obtener los ndices
cunticos Qv Qp, QE y QF de 1998 tomando como perodo base 1997.
Solucin:
Los datos que hay que manejar de la mencionada tabla son:
1997 1998
Artculos
PiO qo P;, q,
l. Leche 85 600 89 650
2. Queso 2.100 30 2.300 40
3. Mantequilla 900 15 1.200 18
Con estos datos obtenemos los numeradores y denominadores de las Ex-
presiones [4.13], [4.14] y [4.15].
Artculos
q;o Pto q,.P;o q,o Pi< q;,Ptt
1. Leche 51.000 55.250 53.400 57.850
2. Queso 63.000 84.000 69.000 92.000
3. Mantequilla 13.500 16.200 18.000 21.600
Sumas 127.500 155.450 140.400 171.450
QL=
Qp=
NMEROS NDICES
3
I qit Pio
155.450
i= 1
X 100 =
127
.
500
X 100 = 122,00
3

qioPio
i= 1
3
I
qit Pit
171.450
i= 1
X 100 =
140
.
400
X 100 = 122,12
3
I qioPit
i= 1
3 3
L qitPio + L
QE = i;1
155.450 + 171.450
X
100
= 127.500 + 140.400 X
100
=
L qioPio + L
i= 1 i= 1
326.900
267
.
900
X 100- 122,02
QF = jQL Qp = j122 X 122,12 = 122,06
Ejemplo 4.6
215
En una industria auxiliar del automvil se fabrican tres componentes. La
estadstica de las unidades producidas en los aos 1998 y 1999 y de los valores
afiadidos (v.a.) por unidad expresados en pesetas son los siguientes:
1998 1999
Componentes
qo v.a.junidad = P
1
o q, v.a.junidad = p,.,
1 5.000 20 6.000 25
2 8.000 10 10.000 12
3 6.000 30 10.000 35
Obtener los ndices de produccin de Laspeyres y Paasche de 1999 con
base 1998 = 100.
Solucin:
Seguidamente obtenemos los numeradores y denominadores de QL y Qp:
216
Componentes
1
2
3
Sumas
CASAS-SNCHEZ, J. M. y SANTOS-PE"AS, J.
qo Pro qo p, q,po q,p,
100.000 125.000 120.000 150.000
80.000 96.000 100.000 120.000
180.000 210.000 300.000 350.000
360.000 431.000 520.000 620.000
3
L qitPio 520.000
QL = ~ l X 100 =
36
0.000 X 100 = 144,4
L qioPio
=l
3
L q;,Pit
Qp
= i =3 1 620.000
X 100 =
43
l.OOO X 100 = 143,9
L qioPit
=l
4.6. Propiedades que cumplen los ndices
complejos y ponderados de precios
y cantidades
Al estudiar de una forma genrica los nmeros ndices se coment que
deberan de cumplir una serie de propiedades ideales: existencia, identidad,
inversin, circular y de proporcionalidad. As como los ndices simples las
cumplen en su gran mayora, los complejos y ponderados no cumplen algunas
de ellas.
En el cuadro siguiente se resume el cumplimiento de las propiedades
indicadas en el apartado 4.2 para los diferentes ndices.
Existencia Identidad Inversin Circular
Proporcio-
nalidad
Sanerbeek S S No No S
Bradstreet-Dutot S S S S S
Laspeyres S S No No S
Paasche S S No No S*
Edgeworth S S S No S*
Fisher S S S No S*
NMEROS NDICES 217
La propiedad de proporcionalidad en los ndices de Paasche, Edgeworth
y Fisher se verifica pero con cierta limitacin en el campo econmico, pues al
variar los precios en una cierta proporcin k difcilmente las cantidades per-
manecern constantes. Luego para que se verifique esta propiedad en estos
tres ndices ser necesario que las cantidades no varen frente a los cambios
de precios.
En resumen, el ndice de Bradstreet-Dutot es el que cumple todas las
propiedades pero su utilizacin es muy limitada por tratarse de un ndice no
ponderado.
El ndice ms utilizado ser el de Laspeyres, pues de los ponderados es el
nico que cumple la propiedad de proporcionalidad.
El ndice de Laspeyres, tanto de precios como cuntico, es el ms utili-
zado en los indicadores generales de precios y produccin que elaboran
todos los pases. Su diseo y posterior clculo exige una rigurosa seleccin
de sus componentes para que sea representativo del fenmeno que se pre-
tende estudiar a travs de su estructura de coeficientes de ponderacin que
como sabemos se refieren al perodo base. Ahora bien, la actividad econ-
mica est sujeta a cambios continuos con lo que a medida que en la serie de
nmeros ndices nos alejamos del perodo base, la estructura de los coeficien-
tes de ponderacin es cada vez menos representativa con lo que hay que fijar
un nuevo perodo base y establecer con las investigaciones adecuadas una
nueva estructura de ponderaciones. En los enlaces de series de nmeros
ndices que tienen distinta base nos apoyamos en la propiedad de inversin
que como se ha indicado anteriormente no la cumple el ndice de Laspeyres;
pero se acta en la prctica como si se cumpliera ante la necesidad de
efectuar dichos empalmes.
,
4.7. lndices en cadena
Los ndices estudiados anteriormente y, en concreto, el de Laspeyies y el
de Paasche, frecuentemente los ms utilizados para hacer un estudio a corto
plazo, pero si el estudio es a largo plazo estos ndices no son los ms adecua-
dos, pues las ponderaciones quedan desfasadas con el paso del tiempo y no
corresponden a la situacin actual y la base se aleja perdiendo actualidad y
en consecuencia calidad.
Para evitar esto se introducen los ndices en cadena, que se obtienen a partir
de una generalizacin de enlaces o emplames de ndices para los cuales la base
de cada ndice es siempre el perodo de comparacin del ndice precedente, es
decir:
1 ~ = 1 ~ Ii ~ t
218 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
lo cual nos permite obtener una serie de ndices referidos todos ellos a la
misma base.

J; = J!. Ji
J; = J! Ji
Ejemplo 4.7
Los precios de un determinado artculo han sido 20, 22, 26, 28 y 32 euros
para el perodo 1998-2002, respectivamente. Obtener la serie de ndices refe-
ridos al ao base 1998 y el ndice para esos precios.
Solucin:
Aplicando la definicin de ndice en cadena mediante la generalizacin de
valores tenemos:
22
J1999 ==- = 105 5o/
1998 20 ' o
2000- 1999 2000- 22 26- o
J1998- J1998.J1999- 20.22-130 Vo
2001 - 1999 2000 2001 - 22 26 28- o
J 1998 - J 1998. J 1999. J 2000 - 20. 22. 26 - 140 Vo
2002- 1999 2000 2001 2002 - 22 26 28 32- o
J1998- J1998 .J1999 J2oooJ2001-
20

22

26

2
8- 160 Yo
Al mismo resultado se llegan mediante
32
J2002 = - = 160 o/
1998 20 o
4.8. Cambio de base en una misma
de nmeros ndices
Si se tiene una serie de nmeros ndices cuyo perodo base es cero: J!,
J;, ... , ... , J:, puede interesarnos cambiar la base o si est muy alejada en el
tiempo del perodo t de comparacin. Este cambio del perodo base no
implica efectuar un profundo estudio para determinar nuevos coeficientes de
,
:.
NMEROS NDICES 219
ponderacin en el caso de los ndices complejos, sino simplemente apoyarse
en las propiedades de inversin y circular que nos permiten obtener el coefi-
ciente tcnico que transforma la serie dada en la nueva con un perodo base
distinto.
Supongamos que la serie dada con perodo base o se quiere transformar
en una nueva con un perodo base t' que est ms cercano en el tiempo al
perodo actual de comparacin. Est claro que en la serie dada existira un
nmero ndice que corresponde al nuevo perodo base que se ha elegido t'.
Pues bien, este es el elemento fijo que nos sirve de enlace tcnico en la
transformacin de una serie en otra. Al considerar los tres perodos (t', t, o),
la propiedad circular nos dice:
[4.17]
De la expresin [ 4.17] nos interesa despejar la nueva serie de ndices con
el nuevo perodo base t', o sea:
1
J' J' = ,.-- = J'
Q ( Q
[4.18]
La expresin [4.18] surge de la propiedad de inversin que dice = 1 (el
producto de dos ndices en los que se han invertido los perodos de compa-
racin y base es igual a la unidad). Despejando en la expresin [4.18]:
[4.19]
La expresin [4.19], al ser un cociente de ndices expresados en tantos por
100, nos da resultados en tantos por uno. es el trmino general de la serie
dada de nmeros ndices y vara desde J: = 100 hasta
Es decir, si tenemos la serie de nmeros ndices referidos al perdo base
O y queremos efectuar un cambio de base del perodo o al nuevo perodo base
t', tendramos la serie J:,:
Perodo
o
1
t'
ndice
o
o
l
o
Ji
o
t'
o
I'
o
ndice 1:,


[:,
:: = 100
[:,
220 CASAS-SNCHEZ, J. M. y SANTOS-PE:&AS, J.
en donde:
J
i - I ~ O 1 ,
t' - t' ' i = ' ' ... , t ' ... , t
o
el trmino J ~ es fijo ya que es el valor que toma la serie dada justo en t', que
es el nuevo perodo base.
Se denomina coeficiente de transformacin o coeficiente de enlace tcnico de
la serie dada en base O a la nueva serie en base t', al cociente:
[4.20]
luego para pasar una serie en base O a un nuevo perodo base t', bastar
multiplicar cada uno de los elementos de la serie original, por el coeficiente
de transformacin a la nueva base t', es decir, por J ~ ..
Ejemplo 4.8
Dada la siguiente serie de nmeros ndices con perodo base o, efectuar un
cambio de base al perodo 5.
Perodo (t) Indices (n)
o 100
1 108
2 112
3 114
4 115
5 117
6 119
7 123
Solucin:
El problema se puede resolver de dos maneras:
a) Aplicando la expresin [4.19] expresada en tantos por 100:
NMEROS NDICES
t
t ~ X 100
5 I ~
1 100
1 = ~ =- x 100 = 85 5
5
I ~ 117 '
I! 108
J
1
= - = - X 100 = 92 3
5
I ~ 117 '
1
2
112
]
2
= ~ = - X 100 = 95 7
5
I ~ 117 '
I! 114
]
3
= - = -- X 100 = 97 4
5
I ~ 117 '
1
4
115
J
4
= ~ = - X 100 = 98 3
5
I ~ 117 '
I ~ 117
1
5
=-=-X 100 = 1000
5
I ~ 117 '
I ~ 119
J6 =- = - X 100 = 101 7
5
I ~ 117 '
1
7
123
J7 = ~ =- X 100 = 105 1
5
I ~ 117 '
221
b) Aplicando a la serie dada el coeficiente de transformacin que en este
caso ser, segn la expresin [ 4.20]:
I ~ lOO
]
0
= - = - = O 855
5
I ~ 117 '
I ~ = r. X 0,855
100 X 0,855 = 85,5
108 X 0,855 = 92,3
112 X 0,855 = 95,8
114 X 0,855 = 97,5
115 X 0,855 = 98,3
117 X 0,855 = 100,0
119 X 0,855 = 101,7
123 X 0,855 = 105,2
222 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Hay que resaltar que, en los cambios de base de una serie de nmeros
ndices, el coeficiente de transformacin se aplica a todos y cada uno de los
componentes de la serie.
4. 9. Renovacin y enlace de series
de nmeros ndices con distintas bases
Renovacin de componentes y de coeficientes de ponderacin
en los nmeros ndices complejos
En el mundo de la economia los nmeros ndices representan fenmenos
complejos: la evolucin general de los precios del conjunto de bienes y servi-
cios que adquieren las familias o unidades de consumo final, la evolucin del
Producto Interior Bruto de un pas, el comportamiento de un mercado de
valores mobiliarios (ndices burstiles), etc. Por tanto, el proceso de elabora-
cin de un nmero ndice complejo y ponderado implica la adopcin de una
serie de decisiones: eleccin de los componentes que entrarn a formar parte
del ndice para que ste sea representativo del conjunto, eleccin del perodo
base y tipo de ndice que se va a utilizar (Laspeyres, Paasche, etc.) teniendo
en cuenta el coste asociado a la formacin elegida. Precisamente teniendo en
cuenta el coste es la formulacin de Laspeyres la ms empleada ya que, como
vimos, sus coeficientes de ponderacin, cuya determinacin requiere costossi-
mos anlisis y toma de datos, estn referidos al perodo base. Luego a medida
que nos alejamos de dicho perodo, como la actividad econmica est sujeta
a una constante evolucin por cambios en los hbitos de consumo y en los
procesos tecnolgicos, el conjunto de los componentes y sus coeficientes de
ponderacin dejan de ser representativos del fenmeno objeto de estudio. La
solucin es someter al ndice a una profunda revisin de forma peridica,
volviendo a elegir los componentes ms representativos y sus nuevos coeficien-
tes de ponderacin.
Enlace o empalme de series de nmeros ndices con distinta base
La necesidad de la renovacin peridica, justificada como se ha sealado
anteriormente por una variacin del contexto socioeconmico que pretende
medir, nos lleva a contar con dos series de ndices que tienen perodos base
distintos y hay que enlazarlos o empalmados para poder estudiar el fenmeno
comparando su evolucin con una nica base. El perodo base que se mantiene
es el de la serie que lo tiene ms cercano al momento actual de comparacin
aplicando el coeficiente de enlace o empalme a la serie ms antigua.
NMEROS NDICES 223
El concepto o definicin de este coeficiente de enlace es el mismo que
hemos dado en los cambios de base dentro de una misma serie, aplicndose
ahora slo a los elementos de la serie que tenga la base ms antigua, ya que
nos interesa hacer el estudio de la evolucin con la base ms moderna que es
la ms representativa. Si la serie con base ms antigua es 1 ~ 1 ~ 1;, ... , 1 ~ ... ,
1 ~ y 1 ~ coincide con el perodo base de la serie ms moderna, el coeficiente de
enlace ser:
1 ~ 100
1 ~ =e= 7
o o
que es idntico a la expresin [ 4.20].
Ejemplo 4.9
Para un conjunto de artculos, se tienen dos series de nmeros ndices de
precios de Laspeyres que son las siguientes:
Aos
1987
1988
1989
1990
1991
1992
1993
1994
Base 1980
250
260
280
290
Base 1990
100
115
122
127
135
Enlazar las dos series con base 1990.
Solucin:
El coeficiente de enlace ser:
1980 - 1 i ~ ~ g - 100-
11990 -: 11990 - 290 - 0,345
1980
Aplicando este coeficiente de enlace a la serie ms antiga con base 1980,
la serie enlazada ser:
224 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Aos
1987 250 X 0,345 = 86,3
1988 260 X 0,345 = 89,7
1989 280 X 0,345 = 96,6
1990 290 X 0,345 = 100
1991 115
1992 122
1993 127
1994 135
Obsrvese que el coeficiente de enlace slo se aplica a la serie con base en
1980 para que quede conectada con la que tiene base ms actualizada que es
la de 1990. Tambin hay que resaltar que se acta como si el ndice de precios
de Laspeyres cumpliese la propiedad circular aunque sabemos que no es cierto.
4. 1 O. Repercusin y participacin en las
variaciones de un ndice
Frecuentemente nos interesa conocer la repercusin que tiene la subida de
precios de uno o varios artculos en el ndice general, por ello aqu vamos a
considerar un ndice tipo Laspeyres y examinaremos la repercusin y par-
ticipacin de un producto en las variaciones del ndice.
Sabemos que un ndice de Laspeyres tiene la forma:
N
I p,q.
I' = :...,i =,.,.,1:....--_
o N
L Pioqio
=1
N Pit
I P-p.q.
i=1 io
=l
donde w; son las ponderaciones de cada ndice 1;,! dentro del ndice general,
expresadas en tantos por uno.
Si suponemos que en las diferentes magnitudes simples (precios) se produ- '
cen variaciones, expresadas por:
entonces el nuevo ndice ser:
1
!
NMEROS NDICES
N
L (p, + Ap,)qio
I' + Al' = :....; =....:
1
'---;-o-----
o o N
L Pioqio
=l
N
L (I;,! +
=1
225
Y restando ambas expresiones, tendremos la variacin del ndice general:
N
L Apitqio N
i=N1 = L M;,!W
L Pioqio i=o
i=1
de donde se deduce que la repercusin R; producida por la variacin de la
i-sima componente en el ndice general ser:
Ap.q.
R= '''=M'
i N i,o W
L Pioqio
i= 1
Evidentemente la suma de todas las repercusiones individuales de cada
componente ser:
N N
L R= L M;,!w;
i=1 i=1
que coincide con la variacin total del ndice general.
La variacin en porcentaje del ndice general ser:
N N
M' Ap,q. L M;,!W
_o lOO= 1-1 lOO= _i=-::1:------
t N N
0
L Pit'qio L I;,!W
=1 =l
La repercusin en porcentaje de la componente i-sima en el ndice general
ser:
R. Ap. q.
___!lOO= " lOO=
N
L Pit'qio
i=l
226
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Tambin se verifica que la suma porcentual para todas las componentes
ser igual a la variacin porcentual del ndice ,
Para terminar, definimos la particpacin, en trmmos porcentuales, de cada
componente i-sima en el ndice general como:
Evidentemente se verifica que:
N
L P;= 100
i=1
4. 11. ndices de valor y deflactacin
de series econmicQs
4. 11 .l. ndices de valor
En economa se produce un gran nmero de bienes y servicios que son
adquiridos por las familias, las empresas, el gobierno, etc. Estos bienes Y
servicios gozan de una gran heterogeneidad y para agregarlos .hay que some-
terlos a un proceso de homogeneizacin a travs de la obtenctn de su valor
aplicando un sistema de precios. Este proceso de de
bienes por sus respectivos precios nos transforma cantidades fstcas heter?g:-
neas (leche, pescado, fruta, automviles, ordenadores, etc.) en valores economt-
cos que son homogneos al estar expresados en la misma unidad de cuenta
(pesetas, dlares, marcos, etc.), y por tanto o
Los ndices de valor nos permiten estudiar la evolucin a lo largo del
tiempo la cuantificacin monetaria de un conjunto de bienes. Este v.alor se
llama nominal o en pesetas corrientes o de cada a.o cuando los prectos son
los del perodo de comparacin:
N
v; = L Pitqit
i= 1
El valor en el perodo base ser:
N
Vo = L Pioqio
i=1
[4.21]
[4.22]
, '' ..
NMEROS NDICES
El ndice complejo de valor para N componentes ser:
N
L Pitqit
1 = ..:..,i =,...:1:....___
v
1
N
L Pioqio
i= 1
227
[4.23]
La evolucin de la expresin 4.23 a lo largo del tiempo est motivada por
las variaciones conjuntas de los precios y las cantidades no pudiendo aislarse
la influencia de cada una. En economa interesa analizar la evolucin del valor
del conjunto de mercancas N bajo la ptica de lo que se denomina a precios
constantes, o sea, sin que se produzcan variaciones en los precios de los dis-
tintos componentes. Para conseguirlo se realiza la operacin conocida como
deflactacin de series de valores expresados en precios o pesetas corrientes de
cada a.o.
4.11.2. Deflactacin de series econmicas
Como se ha indicado anteriormente para poder comparar el valor de un
conjunto de bienes en dos perodos distintos, interesa aislarlo de la subida,
inflacin, o de la bajada, deflacin, de sus respectivos precios. Todos sabemos
que el problema que tienen la mayoras de los gobiernos en los distintos pases
es el control de la inflacin, ya que distorsiona las relaciones entre los distintos
agentes econmicos. Con las subidas de precios que no sean debidas a una
mejora en la calidad de los bienes y los servicios, el poder adquisitivo de la
moneda disminuye, ya que con un billete de 5.000 ptas. en 2000 no pueden
comprarse las mismas cosas que en 1990. Para poder efectuar anlisis compa-
rativos de una serie de valor entre distintos perodos hay que pasarla de
pesetas corrientes o de cada ao a pesetas constantes o del perodo que se
considere como base. Esto es lo que se denomina deflactar la serie dividiendola
por el ndice de precios que se considere ms adecuado. El ndice elegido recibe
el nombre de deflactor de la serie.
Veamos a continuacin el papel que juegan los ndices de precios que ms
se utilizan como son los de Laspeyres y Paasche como deflactores de series
econmicas.
Si la expresin [4.21], que es una serie de valor a precios corrientes, se
divide por un ndice de precios de Laspeyres tendremos:
228 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
[4.24]
Segn nos indica la expresin [ 4.24] podemos concluir que al deflactar una
serie de valor a precios corrientes por un ndice de precios de Laspeyres no
nos da una serie de valor a precios constantes, sino V" Qp que es el producto
del valor en el ao base por un ndice cuntico de Paasche. Luego P L no es
un verdadero deflactor, aunque en la prctica se utiliza como tal ya que es el
ndice que se suele elaborar siendo el nico disponible.
El que s es un verdadero deflactor es el ndice de Paasche ya que:
[4.25]
es decir:
Serie de valores monetarios .
. . = Serie de valores reales (preCios constantes)
ndice de precios ..
La expresin [ 4.25] nos da el valor actual de un conjunto de mercancas
1, 2, ... , i, ... , N a precios constantes Pia del ao base.
Segn seala serie econmica que se desea deflactar as habr que elegir el
ndice de precios ms adecuado. Si se desea expresar la renta disponible de las
familias en pesetas constantes de un determinado ao, el deflactor adecuado
ser el ndice de precios de consumo (IPC); si se desea deflactar una serie del
valor de un conjunto de productos industriales, su deflactor adecuado ser un
ndice de precios industriales (IPI), etc.
Ejemplo 4.10
La renta disponible de una familia durante cinco perodos de tiempo
expresada en pesetas corrientes ha sido la siguiente 250.000, 275.000, 300.000,
325.000 y 350.000. Para el mismo perodo el ndice de precios de consumo ha
NMEROS NDICES 229
sido el siguiente: 100, 105, 107, 110 y 112. Obtener la serie de la renta dispo-
nible en pesetas constantes del primer perodo.
Solucin:
En las expresiones [4.24] y [4.25] al dividir la serie econmica dada V, por
los ndices de precios, stos estn expresados en tantos por uno; luego la serie
de la renta disponible expresada en pesetas corrientes se divide por la serie
de los ndices de precios expresados en tantos por uno: 1,00; 1,05; 1,07; 1,10
y 1,12:
Renta disponible en pesetas constantes
250.000/1,00 = 250.000
275.000/1,05 = 261.905
300.000/1,07 = 280.374
325.000/1,10 = 295.455
350.000/1,12 = 312.500
4.12. ndice de precios de consumo (IPC)
1
El ndice de Precios de Consumo (IPC) es el indicador general ms cono-
cido por la influencia y efecto que produce en el mundo econmico, se elabora
y se publica mensualmente y su objetivo es medir la evolucin del nivel de
precios de los bienes y servicios consumidos por todos los hogares residentes
en Espaa.
Todo IPC debe de tener dos cualidades:
- la representatividad, y
- la comparabilidad temporal
El nivel de representatividad del IPC vendr determinado por el grado de
adaptacin de este ndice a la realidad econmica del momento. As pues los
bienes y serVicios seleccionados debern ser los ms consumidos por la mayo-
ra de la poblacin, los establecimientos donde se recogen los precios deben
de ser los ms visitados y la importancia o ponderacin de los diferentes bienes
y servicios debe responder a las tendencias de consumo de los hogares.
La segunda cualidad se refiere a la comparabilidad temporal, lo cual quiere
decir que todos los elementos que definen el IPC deben permanecer estables
1
Se reproducen los conceptos y definiciones en la Metodologa del I.N.E. Ao
2002.
230 CASAS-SNCHEZ, J. M. y SANTOS-PE1'1AS, J.
a lo largo del tiempo excepto, lgicamente, los precios que se recogen men-
sualmente. As pues, se consigue que cualquier variacin en el IPC sea debida
solamente a cambios en los. precios de los bienes y servicios que fueron
seleccionados.
A continuacin, resumimos la Metodologa del ndice de Precios de Consu-
mo con base 2001, elaborada por el Instituto Naconal de Estadstica (INE).
4.12. l. Caractersticas principales
a) Perodo base
Es aquel cuyos precios sirven de referencia para medir la evolucin de los
mismos durante el perodo de vigencia del sistema. El perodo base es el ao
2001, lo cual quiere decir que todos los ndices que se calculen estarn referidos
a este ao, y adems la media aritmtica de los ndices mensuales para este
ao base se hace igual a 100.
b) Perodo de referencia de las ponderaciones
Es el perodo durante el cual se desarrolla la ECPF (Encuesta Continua
de Presupuestos Familiares) que nos proporciona la informacin bsica, sobre
los gastos de las familias en bienes y servicios de consumo, para la obtencin
de las ponderaciones. Este nuevo sistema se ha realizado con la informacin
obtenida de la ECPF, que nos proporciona informacin bsica sobre gastos
de las familias en bienes y servicios de consumo, durante el perodo segundo
trimestre de 1999 al primer trimestre de 2001 (1 de abril de 1999 al 31 de
marzo de 2001 ).
e) Campo de consumo, cesta de la compra y ponderaciones
El campo de consumo del IPC est constituido por todos los bienes y
servicios que los hogares destinan al consumo, quedando excluidos los gastos
en bienes de inversin, los autoconsumos, los autosuministros y los alquileres
imputados.
Los bienes y servicios en la ECPF han sido clasificados segn la clasifica-
cin internacional de consumo COICOP (Classificastion of Individual Con-
suption by Purpose), de tal manera que cada parcela de consumo de la ECPF
estar representada en el IPC por uno o ms artculos, de manera que la
evolucin de sus precios represente la de todos los elementos que integran
dicha parcela.
r
C"CC'
'
l

1
l
l

NMEROS NDICES
231
Se define la cesta de la compra como el conjunto de bienes y servicios para
los que se recogen los precios mensualmente, y cuya evolucin representa la
de todos los precios de consumo de la economa. La seleccin se realiza segn
la importancia de cada uno, medida a partir del gasto realizado por las
familias residentes en Espaa y que se obtiene de la ECPF. El nmero to-
tal de artculos que componen esta nueva cesta de la compra es de 484,
agrupados en 12 grupos, 37 subgrupos, 80 clases y 117 subclases. Adems se
mantienen las 57 rbricas existentes y se ampla el nmero de grupos especiales
hasta 27.
La muestra para la recogida de la informacin necesaria se ha diseado
teniendo en cuenta:
- seleccin de municipios
- seleccin de zonas comerciales y establecimientos
- determinacin del nmero de observaciones.
En resumen la muestra de municipios est formada por 141 municipios
para artculos de alimentacin y 157 para el resto, recogiendo aproximada-
mente 180.000 precios mensuales.
Cada uno de los artculos estn perfectamente descritos y muy bien espe-
cificados con el fin de facilitar al agente encuestador su identificacin y per-
mitir la correcta recogida de los precios.
Las ponderaciones, representan la importancia relativa que tiene cada
artculo de la cesta de la compra frente a los dems, as pues, si designamos
por W; la ponderacin del artculo i-simo, esta se obtiene como cociente del
gasto realizado en las parcelas representadas por dicho artculo durante el
perodo al que hace referencia la ECPF y el gasto total realizado en ese
perodo.
w. = _G_a_s_to_re_a_h_'z_a_d_o_e_n_l_a_s-=-p_a_rc_e_la_s_r_e-=-p_re_s_e_n_ta_d_a_s_,p'-o_r_e_l_a_r_t_cul_o_i
' Gasto total
Las ponderaciones permanecen fijas a lo largo del perodo de vigencia del
sistema de ndice de precios de consumo. Un mismo artculo puede tener
ponderaciones diferentes en las distintas agrupaciones geogrficas-provincias,
comunidades autnomas y total Nacional, segn el gasto que refleja la ECPF
en cada uno de estos conjuntos.
En las Tablas 4.1, 4.2, 4.3 y 4.4 aparecen las diferentes agrupaciones y las
ponderaciones de los diferentes artculos. En la Tabla 4.5 se dan las pondera-
ciones por grupos de artculo para las diferentes Comunidades Autnomas.
Anlogamente se tienen las restantes ponderaciones para las Comunidades
Autnomas. Ver metodologa INE.
232 CASAS-SNCHEZ,J. M. y SANTOS-PE'AS, J.
TABLA 4.1. Nmero de artfculos por grupo del JPC-Base 2001
01. Alimentos y bebidas no alcohlicas
02. Bebidas alcohlicas y tabaco
03. Vestido y calzado
04. Vivienda
05. Menaje
06. Medicina
07. Transporte
08. Comunicaciones
09. Ocio y cultura
10. Enseanza
11. Hoteles, cafs y restaurantes
12. Otros
Total
Fuente: INE.
Ponderacin
171
12
67
18
60
13
31
3
40
8
24
37
484
TABLA 4.2. Ponderaciones por grupos, subgrupos, clases y subclases de artculos
del IPC-Base 2001 para el total Nacional.
Ponderaciones
Grupos Subgrupos Clases
01 Alimentos y bebidas no alcohlicas 218,63
011 Alimentos 206,452
0111 Pan y cereales 33,784
01111 Arroz
01112 Pan
01113 Pasta alimenticia
01114 Pastelera, bollera y masas cocinadas
01115 Harinas y cereales
0112 Carnes 56,460
01121 Carne de vaca
01122 Carne de ternera y aojo
01123 Carne de porcino
01124 Carne de ovino
01125 Carne. de ave
01126 Charcutera
01127 Preparados de carne
01128 Otras carnes y casquera
0113 Pescados, crustceos y moluscos 31,238.
01131 Pescado fresco y congelado
01132 Crustceos y moluscos
01133 Pescado en conserva y preparados
0114 Productos lcteos, quesos y huevos 30,829
01141 Leche
01142 Otros productos lcteos
01143 Quesos
Subclases
1,125
18,639
1,328
10,880
1,811
1,222
11,236
4,683
7,701
8,892
17,910
2,984
1,832
17,163
7,655
6,420
12,869
7,689
7,807
NMEROS NDICES 233
TABLA 4.2. (Continuacin)
Ponderaciones
Grupos Subgrupos Clases Subclases
01144 Huevos 2,463
0115 Aceites y grasas 8,152
01151 Mantequilla y margarina 0,597
01152 Aceites 7,554
0116 Frutas 17,813
01161 Frutas frescas 15,093
01162 Frutas en conserva y frutos secos 2,720
0117 Legumbres, hortalizas y patatas 17,602
01171 Legumbres y hortalizas frescas 9,480
01172 Legumbres.y hortalizas secas 1,249
01173 Legumbres y hortalizas congeladas y
en conserva 3,549.
01174 Patatas y sus preparados 3,324
0118 Azcar, chocolates y confituras 7,192
01181 Azcar 1,339
01182 Chocolates y configuras 5,853
01/9 Otros productos alimenticios 3,383
012 Bebidas no alcoh6licas 12,178
0121 Caf, cacao e infUsiones 4,062
01211 Caf, cacao e infusiones 4,062
0]22 Agua mineral, refrescos y zumos 8,116
01221 Agua mineral, refrescos y zumos 8,116
02 Bebidas alcohlicas y tabaco 32,17
021 Bebidas alcoh6licas 8,999
0211 Espirituosos y licores 1,755
02111 Espirituosos y licores 1,755
0212 Vinos 4,445
02121 Vinos 4,445
0213 Cerveza 2,799
02131 Cerveza 2,799
022 Tabaco 23,171
0221 Tabaco 23,171
02211 Tabaco 23,171
03 Vestido y calzado 99,28
031 Vestido 79,258
0311 Prendas de vestir 76,337
03111 Prendas exteriores de hombre 27,476
03112 Prendas interiores de hombre 1,729
03113 Prendas exteriores de mujer 33,508
03114 Prendas interiores de mujer 2,863
03115 Prendas de vestir de nio y beb 10,761
0312 Complementos y reparaciones de prendas
de vestir 2,921
03121 Complementos y reparaciones de pren-
das de vestir 2,921
234 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
TABLA 4.2. (Continuacin)
Ponderaciones '
Grupos Subgrupos Clases
032 Calzado y sus reparaciones 20,023
0321 Calzado 19,833
03211 Calzado de hombre
03212 Calzado de mujer
03213 Calzado de nio y beb
0322 Reparacin de calzado 0,189
03221 Reparacin de calzado
04 Vivienda
041 Alquiler de vivienda
0411 Alquiler de vivienda
04111 Alquiler de vivienda
042 Conservacwn de la vivienda
0421 Materiales para la conservacin de la vi-
vienda
04211 Materiales para la conservacin de la
vivienda
0422 Servicios para la conservacin de la vi-
vienda
04221 Servicios para la conservacin de la vi-
. vienda
043 Otros servicios relacionados con la vi-
vienda
0431 Distribucin de agua
04311 Distribucin de agua
0432 Recogida de basura, alcantarillado y
otros servicios
04321 Recogida de basura, alcantarillado y
otros servicios
044 Electricidad, gas y otros combustibles
0441 Electricidad
04411 Electricidad
0442 Gas
04421 Gas
0443 Otros combustibles
04431 Otros combustibles
OS Menaje
051 Muebles y otros enseres
0511 Muebles y otros enseres
05111 Muebles
05112 Otros enseres
052 Artculos textiles para el hogar
0521 Artfculos textiles para el hogar
05211 Artculos textiles para el hogar
053 Electrodomisticos y reparaciones
0531 Electrodomsticos y reparaciones
110,26
22,073
17,146
29,991
41,049
63,571
19,547
5,626
10,795
22,073
3,373
13,774
8,725
21,266
25,426
11,484
4,139
19,54?
5,626
10,795
Subclases
7,406
8,758
3,669
0,189
22,073
3,373
13,774
8,725
21,266
25,426
11,484
4,139
16,557
2,990
5,626
NMEROS NDICES
TABLA 4.2. (Continuacin)
Ponderaciones
05311 Frigorficos, lavadoras y lavavajillas
05312 Cocinas y hornos
05313 Aparatos de calefaccin y de aire acon-
dicionado
05314 Otros electrodomsticos
05315 Reparacin de electrodomsticos
054 Utensilios de cocina y menaje
0541 Utensilios de cocina y menaje
05411 Cristalera, vajilla y cubertera
05412 Otros utensilios de cocina y menaje
055 Herramientas y accesorios para cada y
jardin
0551 Herramientas y accesorios para casa y
jardin
05511 Herramientas y accesorios para casa y
jardn
056 Otros bienes y servicios para el hogar
0561 Artfculos no duraderos para el hogar
05611 Artculos de limpieza para el hogar
05612 Otros artculos no duraderos para el
hogar
0562 Servicio domstico y otros servicios para
el hogar
05621 Servicio domstico y otros servicios
para el hogar
Grupos Subgrupos Clases
1,972
1,972
1,820
1,82
23,810
15,736
8,074
06 Medicina 28,062
061 Medicamentos, otros productos farmacu-
ticos y material teraputico
0611 Medicamentos, otros productos farmacu-
ticos y material teraputico
06111 Medicamentos y otros productos far-
macuticos
06112 Material teraputico
062 Servicios mdicos, dentales y paramdicos
no hospitalarios
0621 Servicios mdicos y paramdicos no hos-
pitalarios
06211 Servicios mdicos y paramdicos no
hospitalarios
0622 Servicios dentales
06221 Servicios dentales
063 Servicios hospitalarios
0631 Servicios hospitalarios
06311 Servicios hospitalarios
16,203
16,203
10,841
4,344
6,498
1,018
1,018
235
Subclases
4,606
1,833
2,464
1,038
0,855
0,782
1,190
1,820
12,546
3,191
8,074
10,779
5,425
4,344
6,498
1,018
:,
r
1'
1
1
236
1
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
NMEROS NDICES 237
1
1
1
TABLA 4.2. (Continuacin)
TABLA 4.2. (Continuacin)
Ponderaciones Ponderaciones
Grupos Sub grupos Clases Subclases Grupos Subgrupos Clases Subclases
07 Transporte 155,76
071 Vehculos 71,769
0915 Reparacin de equipos audiovisuales, Jo-
0711 Automviles 69,286
togrficos e infonnticos 0,672
07111 Automviles 69,286
1
09151 Reparacin de equipos audiovisuales,
0712 Otros vehculos 2,483
fotogrficos e informticos 0,672
07121 Otros vehculos 2,483
092 Artculos recreativos y deportivos; floriste-
072 Bienes y servicios relativos a los vehculos 72,912
ria y mascotos 10,379
0721 Repuestos y accesorios de mantenimiento 1,383
0921 Artculos recreativos y deportivos 6,146
07211 Repuestos y accesorios de manteni-
09211 Juegos y juguetes 5,467
miento 1,383
09212 Otros artculos recreativos y deportivos 0,679
0722 Carburantes y lubricantes 53,075
0922 Floristerfa y mascotas 4,233
07221 Carburantes y lubricantes 53,075
09221 Floristera y mascotas 4,233
0723 Servicios de mantenimiento y reparaciones 15,255
093 Servicis recreativos, deportivos y cultu-
07231 s_ervicios de mantenimiento y repara-
rales 14,526
c10nes 15,255
0931 Servicios recreativos y deportivos 5,713
0724 Otros servicios relativos a los vehculos 3,198
09311 Servicios recreativos y deportivos 5,713
07241 Otros servicios relativos a los vehculos 3,198
0932 Servicios culturales 8,813
073 Servicios de transprote 11,079
09321 Servicios culturales 8,813
0731 Transporte por ferrocarril 1,585
094 Libros, prensa y papeleria 17,200
07311 Transporte por ferrocarril 1,585
0941 Libros 7,098
0732 Transporte por carretera 5,945
09411 Libros 7,098
07321 Transporte por carretera 5,945
0942 Prensa y revistas 7,792
0733 Transporte areo 1,934
094 21 Prensa y revistas 7,792
07331 Transporte areo 1,934
0943 Material de papelerfa 2,310
0734 Otros servicios de transporte 1,615
09431 Material de papelera 2,310
07341 Otros servicios de transporte 1,615
095 Viaje organizPdo 11,507
0951 Viaje organizado 11,507
08 Comunicaciones 25,729
09511 Viaje organizado 11,507
081 Comunicaciones 25,729
0811 Servicios postales 0,311
10 Enseanza 17,444
08111 Servicios postales 0,311
101 Enseanza 17,444
0812 Equipos y servicios telefnicos 25,417
1011 Educacin infantil y primaria 3,447
08121 Equipos y servicios telefnicos 25,417
10111 Educacin infantil y primaria 3,447
1012 Enseanza secundaria 3,59
09 Ocio y cultura 67,263
'l
10121 Enseanza secundaria 3,590
091 Equipos y soportes audiovisuales, fotogr-
1013 Enseanza superior 5,913
ficos e informticos 13,651
J
10131 Enseanza superior 5,913
0911 Equipos de imagen y sonido 4,721 i
1014 Otras enseanzas 4,494
09111 Equipos de imagen y sonido 4,721
J
10141 Otras enseanzas
4,494
0912 Equipos fotogrficos y cinematogrficos 0,788 ' 1
09121 Equipos fotogrficos y cinematogrficos 0,788
1 11 Hoteles, cafs y restaurantes 112,708
"
0913 Equipos infonnticos 4,333
.,
111 Restaurantes, bares y cafeteras 106,217
09131 Equipos informticos 4,333
l
1111 Restaurantes, bares y cafeteras 106,217
0914 Soporte para el registro de imagen y so- 1
11111 Restaurantes, bares y cafeteras
106,217
nido 3,136

112 Hoteles y otros alojamientos 6,490
09141 Soporte para el registro de imagen y
1121 Hoteles y otros alojamientos 6,490
sonido 3,136
11211 Hoteles y otros alojamientos
6,490
238 CASAS-SNCHEZ, J. M. y SANTOS-PE:&AS, J.
TABLA 4.2. (Continuacin)
Ponderaciones
Grupos Subgrupos Clases
12 Otros bienes y servicios 69,124
121 Bienes y serivicios para el cuidado per-
sonal 22,531
1211 Servicios para el cuidado personal 10,241
12111 Servicios para el cuidado personal
1212 Artculos para el cuidado personal 12,290
12121 Artculos para el cuidado personal
122 Artfculos de uso personal 5,173
1221 Joyera, bisutera y relojeria 3,342
12211 Joyera, bisutera y relojera
1222 Otros artculos de uso personal 1,831
12221 Otros artculos de uso personal
123 Servicios sociales 2,314
1231 Servicios sociales 2,314
12311 Servicios sociales
124 Seguros 34,693
1241 Seguros para la vivienda 4,447
12411 Seguros para la vivienda
1242 Seguros mdicos 6,725
12421 Seguros mdicos
1243 Seguros de automvil 18,534
12431 Seguros de automvil
1244 Otros seguros 4,986
12441 Otros seguros
125 Servicios financieros 0,278
1251 Servicios financieros 0,278
12511 Servicios financieros
126 Otros servicios 4,135
1261 Otros servicios 4,135
12611 Otros servicios
Fuente: INE.
TABLA 4.3. Ponderaciones por rbricas del1PC-Base 2001 para
el total Nacional
Grupos
01. Cereales y derivados
02. Pan
03. Carne de vacuno
04. Carnedeovino
05. Carne de porcino
06. Carne de ave
07. Otras carnes
08. Pescado fresco y congelado
Ponderacin
15,144
18,639
12,458
4,683
7,701
8,892
22,727
17,163
Subclases
10,241
12,290
3,342
1,831
2,314
4,447
6,725
18,534
4,986
0,278
4,135
NMEROS NDICES 239
TABLA 4.3. (Continuacin)
Grupos Ponderacin
09. Crustceos, moluscos y preparados de pescado 14,074
10. Huevos
2,463
11. Leche
12,869
12. Productos lcteos
15,496
13. Aceites y grasas
8,152
14. Frutas frescas
15,093
15. Frustas en conserva y frutos secos
2,720
16. Legumbres y hortalizas frescas
9,480
17. Preparados de legumbres y hortalizas 4,799
18. Patatas y sus preparados
3,324
19. Caf, cacao e infusiones
4,062
20. Azcar
1,339
21. Otros preparados alimenticios 9,236
22. Agua mineral, refrescos y zumos 8,116
23. Bebidas alcohlicas
8,999
24. Tabaco
23,171
25. Prendas de vestir de hombre 29,205
26. Prendas de vestir de mujer 36,371
27. Prendas de vestir de nio y beb
10,761
28. Complementos y reparaciones de prendas de vestir 2,921
29. Calzado de hombre
7,406
30. Calzado de mujer
8,758
31. Calzado de nio
3,669
32. Reparacin de calzado
0,189
33. Viviendas en alquiler
22,073
34. Calefaccin, alumbrado y distribucin de agua 49,774
35. Conservacin de la vivienda 38,412
36. Muebles y revestimientos de suelo 19,225
37. Textiles y accesorios para el hogar 5,948
38. Electrodomsticos y reparaciones 10,795
39. Utensilios y herramientas para el hogar 3,792
40. Artculos no duraderos para el hogar 17,214
41. Servicios para el hogar
12,520
42. Servicios mdicos y similares 18,584
43. Medicamentos y material teraputico 16,203
44. Transporte personal 163,215
45. Transporte pblico urbano
5,824
46. Transporte pblico interurbano 5,255
47. Comunicaciones
25,729

48. Objetos recreativos
24,030
49. Publicaciones
11,879
1 50. Esparcirnien to
14,526

j
51. Educacin infantil y primaria
4,684
l
52. Educacin secundaria
4,828
J 53. Educacin universitaria 6,337
J
54. Otros gastos de enseanza 5,761
55. Artculos de uso personal
21,053

56. Turismo y hostelera
124,214
.,
57. Otros bienes y servicios .
18,043
J
]
Fuente: INE.
j

<D\
o
Q.
o
Q.
<D
()
0\
()
e
o
..WF<i"21"<i
TABLA 4.5. Ponderaciones por grupos de art(culos del IPC-Base 2001 para el total Nacional y Comunidades Aut6nomas
Castilla-
Nacional Andaluca Aragn Asturias Baleares Canarias Cantabria Len
General Base 2001 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
Alimentos y bebidas no alcohlicas 218,630 237,973 217,498 216,700 197,884 222,791 218,708 239,175
Bebidas alcohlicas y tabaco 32,170 39,351 32,209 28,867 33,463 30,286 29,773 28,359
Vestido y calzado 99,280 103,535 111,695 107,895 90,989 83,964 121,718 108,934
Vivienda 110,260 101,803 116,334 110,829 107,832 104,409 118,695 116,057
Menaje 63,571 64,405 71,807 63,748 64,870 66,637 60,357 66,059
Medicina 28,062 26,154 26,677 26,505 34,479 35,364 31,268 22,897
Transporte 155,760 160,406 140,750 161,305 176,282 166,754 148,845 146,555
Comunicaciones 25,729 24,501 27,971 26,439 28,310 25,811 27,022 28,200
Ocio y cultura 67,263 59,043 69,054 61,244 59,098 75,953 61,839 57,476
Enseanza 17,444 9,918 14,492 15,684 21,213 19,949 10,611 14,979
Hoteles, cafs y restaurantes 112,708 109,565 107,059 113,830 105,972 107,128 103,265 108,095
Otros bienes y servicios 69,124 63,346 64,454 66,956 79,609 60,954 67,898 63,216
Comunidad Extre- Comunidad Comunidad Pas
Catalua valenciana madura Galicia de Madrid de Murcia Navarra Vasco La Rioja
General Base 2001 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
Alimentos y bebidas no alcoh-
licas 213,766 210,876 253,461 234,773 193,122 215,028 188,242 210,050 223,861
Bebidas alcohlicas y tabaco 29,941 34,961 34,889 31,828 28,580 43,577 25,754 28,387 34,453
Vestido y calzado 88,982 93,447 113,631 114,926 92,276 99,212 113,839 99,091 98,757
Vivienda 119,976 102,352 94,792 96,466 119,264 99,950 102,932 107,540 113,123
Menaje 58,404 67,061 65,962 70,672 57,335 73,416 79,493 65,400 65,625
Medicina 29,908 31,235 27,263 27,493 27,724 23,432 30,582 25,661 29,285
Transporte 149,067 162,910 156,063 162,053 153,954 172,502 169,382 147,368 138,750
Comunicaciones 25,521 27,872 25,389 22,499 26,820 23,384 22,248 24,192 26,364
Ocio y cultura 78,205 67,081 54,409 59,243 75,371 62,120 73,700 66,435 69,940
Enseanza 25,203 11,637 8,307 14,240 24,751 8,819 18,605 21,520 15,161
Hoteles, cafs y restaurantes 107,177 115,320 104,772 99,956 128,098 105,462 111,291 132,728 119,611
Otros bienes y servicios 73,849 75,248 61,060 65,850 72,706 73,096 63,932 71,627 65,070
Fuente: INE.
TTIRWG;Hq
,

Castilla-
La Mancha
1.000
239,250
32,699
111,472
111,728
60,819
27,610
159,386
24,867
53,067 z
8,745 e
107,531
S::
ti1
62,826
o
tzl
Ceuta y

Melilla
-
(")
1.000
ti1
CZl
290,189
50,038
117,779
105,805
60,037
17,557
98,189
29,219
58,617
5,051
99,268
68,251
N
.::..
-
t;:n;c c:n:c t::e t::e
"' "' "' 11' 11' 11' tiJ CI'J CI'J \1'.) 00 00
~ ~ ~ ~ ~ ~
N ............... ......,. .....
01010101010
010000\VIW
o-NV->00000\
TABLA 4.6. fndice General Nacional. Sistemas IPC-Base 1992
Ao Enero Febrero Marzo Abril Mayo Junio Juilio Agosto
1954 3,289 3,289 3,289 3,277 3,280 3,267
1955 3,365 3,376 3,389 3,408 3,410 3,401 3,401 3,408
1956 3,489 3,532 3,566 3,604 3,621 . 3,609 3,598 3,604
1957 3,848 3,869 3,889 3,906 3,916 3,906 3,967 4,023
1958 4,309 4,313 4,397 4,491 4,520 4,514 4,544 4,574
1959 4,794 4,817 4,843 4,873 4,888 4,860 4,860 4,868
1960 4,930 4,926 4,920 4,924 4,909 4,905 4,903 4,913
1961 5,020 4,979 4,957 4,970 4,957 4,930 4,930 4,938
1962 5,038 5,061 5,105 5,177 5,243 5,270 5,270 5,257
1963 5,560 5,604 5,713 5,709 5,741 5,635 5,695 5,754
1964 5,842 5,846 5,864 5,886 5,901 5,980 6,109 6,205
1965 6,657 6,771 6,824 6,874 6,902 6,871 6,880 6,915
1966 7,197 7,191 7,191 7,260 7,366 7,380 7,376 7,389
1967 7,593 7,652 7,684 7,791 7,818 7,750 7,755 7,868
1968 8,110 8,110 8,193 8,265 8,238 8,261 8,193 8,198
1969 8,301 8,251 8,301 8,399 8,399 8,301 8,366 8,392
1970 8,646 8,613 8,679 8,727 8,670 8,703 8,867 9,007
1971 9,285 9,278 9,376 9,475 9,533 9,573 9,573 9,590
1972 10,082 10,074 10,172 10,172 10,222 10,246 10,386 10,493
1973 10,895 10,912 11,002 11,158 11,322 11,494 11,617 11,808
1974 12,423 12,465 12,736 13,015 13,179 13,236 13,393 13,614
1975 14,762 14,903 15,000 15,264 15,452 15,494 15,740 15,987
1976 16,807 16,997 17,391 17,743 18,556 18,442 18,556 18,713
1977 20.542 20.849 21,348 21,736 21.926 22.539 23.278 24,033
m
::J
o
()
<D
o.
<D
en
<D
....,
([)"
CJ)
o
o
<D
-
~ <D
::J
-+
<D
en
o.
<D
<D
::J
o
()
<D
Septiem. Octubre
3,269 3,286
3,431 3,459
3,630 3,662
4,080 4,166
4,646 4,689
4,894 4,909
4,943 4,956
4,942 4,961
5,289 5,340
5,741 5,757
6,266 6,369
6,981 7,018
7,366 7,411
7,890 7,922
8,185 8,211
8,408 8,440
9,048 9,138
9,704 9,811
10,641 10,714
12,012 12,202
13,828 13,975
16,241 16,241
19,065 19,329
24,368 24,747
Noviem.
3,314
3,474
3,713
4,234
4,732
4,926
4,962
5,038
5,477
5,829
6,516
7,169
7,540
8,087
8,265
8,515
9,162
9,944
10,731
12,217
14,361
16,347
19,690
24,947
11
~ M
Diciem.
3,344
3,485
3,779
4,279
4,787
4,969
4,969
5,047
5,547
5,851
6,592
7,210
7,589
8,087
8,320
8,605
9,188
10,074
10,814
12,350
14,558
16,610
19,894
25,144
'-<
z
e
S:
ti:l
~
o
tzl
~
......
(")
ti:l
tzl
N
""""
w
tv
TABLA 4.6. (Continuacin)
t
Ao Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiem. Octubre Noviem. Diciem.
1978 25,545 25,796 26,127 26,677 26,944 27,216 27,806 28,291 28,524 28,785 28,911 29,303
1979 29,806 30,037 30,349 30,807 31,167 31,442 32,121 32,437 32,864 33,305 33,385 33,872
1980 34,804 35,115 35,304 35,645 35,892 36,449 36,964 37,397 37,795 38,098 38,487 39,025 (")
1981 39,818 40,020 40,817 41,223 41,415 41,451 42,263 42,778 43,118 43,603 43,981 44,647
>
Vl
1982 45,572 45,927 46,378 46,988 47,668 48,126 48,744 49,082 49,139 49,631 49,793 50,901
>
'{'
1983 51,761 52,021 52,337 53,056 53,276 53,588 53,779 54,501 54,937 55,682 56,249 57,122
Vl
>-
1984 58,007 58,227 58,696 58,973 59,292 59,712 60,629 61,050 61,174 61,543 61,859 62,278 z
1985 63,438 63,898 64,296 64,959 65,163 65,052 65,422 65,520 66,239 66,580 67,093 67,371
(")
::t:
1986 69,308 69,617 69,852 70,022 70,217 70,862 71,570 71,773 72,516 72,787 72,620 72,930
tt1
.N
1987 . 73,489 73,802 74,231 74,399 74,307 74,325 75,078 75,045 75,737 76,187 76,012 76,284
1988 76,768 76,978 77,536 77).66 77,262 77,562 78,586 79,363 80,060 80,150 80,105 80,742

1989 81,680 81,738 82,260 82,481 82,598 83,048 84,396 84,590 85,485 85,830 85,969 86,304 '<
1990 87,144 87,697 88,018 88,218 88,211 88,483 89,672 90,065 91,013 91,821 91,729 91,955
Vl
1991 93,025 92,895 93,197 93,399 93,664 93,934 95,100 95,453 96,233 96,838 96,985 97,038

...,
1992 98,576 99,233 99,592 99,485 99,745 99,726 100,050 100,962 101,795 101,856 101,921 102,227 o
Vl
1993 103,185 103,218 103,581 104,035 104,322 104,581 104,955 1Q5,583 106,180 106,576 106,755 107,262 .;;
1994 108,346 108,385 108,743 109,171 109,394 109,512 109,941 110,651 110,988 111,229 111,422 111,914
tt1
z.
1995 113,074 113,628 114,290 114,896 114,942 115,051 115,069 115,394 115,848 116,064 116,372 116,748 >
JI'
1996 117,462 117,782 118,200 118,871 119,281 119,181 119,340 119,678 119,970 120,134 120,141 120,497

1997 120,847 120,765 120,825 120,869 121,045 121,041 121,263 121,798 122,401 122,356 122,599 122,925
1998 123,215 122,927 122,984 123,289 123,450 123,530 123,986 124,318 124,410 124,421 124,309 124,653
1999 125,111 125,185 125,737 126,202 126,198 126,225 126,772 127,312 127,557 127,509 127,714 128,290
2000 128,712 128,894 129,405 129,943 130,159 130;553 131,346 131,897 132,238 132,576 132,906 133,366
2001 133,413 133,851 134,415 135,113 135,624 136,081 136,415 136,745 136,726 136,584 136,483 136,978
Fuente: INE. Estos datos tienen carcter oficial a los efectos regulados por la Ley 29/94, de 24 de noviembre, de Arrendamientos Urbanos.
246 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
e) Actualizacin de rentas entre dos meses ambos anteriores a enero
de 2002 o ambos posteriores a enero de 2002
La expresin a utilizar para actualizar rentas utilizando el IPC, en ambos
casos es:
Ejemplo 4.11
IPC mes final
Renta actualizada = Renta inicial x -----'---
/PC mes inicial
[4.27]
Se desea actualizar la renta de una vivienda de 600 , utilizando el IPC,
desde agosto de 1998 a diciembe de 2001.
Solucin:
Sabemos que
Renta inicial antes de actualizar = 600
IPC agosto 1998 (Tabla 4.6) = 124,318
IPC diciembre 2001 (Tabla 4.6) = 136,483
Utilizando la expresin [4.27] tenemos:
136,483
Renta actualizada = 600 x
124
,
318
= 658,71
d) Actualizacin de rentas desde meses anteriores a enero de 2002 a enero
de 2002 y meses posteriores
Para ello hay que utilizar el ndice de la Ley de Arrendamientos Urbanos
(ndice LAU), que se obtiene multiplicando el IPC general del mes por el
coeficiente LAUde ese mismo mes, as pues se tendra la Tabla 4.8.
TABLA 4.8. indices LAU para el ao 2002
Mes Coeficientes LA U IPC ao 2002
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Fuente: INE.
1,357700
1,361911
1,356739
1,351849
1,351895
1,353461
1,366497
1,368930
1,361919
1,353368
1,349495
1,350862
101,262
101,350
102,188
103,575
103,948
ndice LA U 2002
137,490
138,036
138,642
140,018
140,527
NMEROS NDICES
La expresin a utilizar ser:
ndice LAU mes final
5
Renta actualizada = Renta inicial ---------
IPC mes inicial
Ejemplo 4.12
247
[4.28]
Se desea actualizar el alquiler de una vivienda de 700 con el IPC, desde
enero de 2001 a marzo de 2002.
Solucin:
Sabemos que
Renta inicial antes de actualizar = 700
IPC de enero de 2001(Tabla 4.6) = 133,413
ndice LAUde marzo de 2002 (Tabla 4.8) = 138,642
Utilizando la expresin [ 4.28] tenemos:
138,642
Renta actualizada = 700 x
133 413
= 727,435
'
El IPC es el indicador de la inflacin o prdida del poder adquisitivo de
las rentas disponibles de las familias ya que slo incluye bienes y servicios
destinados al consumo final de los hogares. En el IPC no se contempla las
subidas de precios de los bienes y servicios de naturaleza intermedia adquiri-
dos por los sectores en el proceso productivo.
La inflacin subyacente es el IPC sin los alimentos no elaborados ni los
productos energticos.
4. 13. ndices de Precios de Consumo
Armonizado (IPCA)
6
Es un indicador estadstico cuyo objetivo es proporcionar una medida
comn de la inflacin que permita realizar comparaciones internacionales.
Para llegar a este ndice, y a lo largo de un perodo transitorio, ao 1996, se
realizaron las modificaciones y ajustes necesarios sobre los IPC de cada pas
' Esta expresin no es vlida para comparar perodos inferiores a un ao.
6
Metodologa INE.
248
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
miembro de UE hasta conseguir un ndice con unas caractersticas esenciales
comunes a todos los pases. El primer ndice, despus del perodo ,transitorio,
se refiere a enero de 1997 con base en 1996
7

El IPCA de cada pas cubre las parcelas que superan el uno por mil del
gasto total de gasto de la cesta de la compra naCional, siendo excluidos del
IPCA los servicios mdicos y la enseanza reglada.
Adems la ponderacin de algunas parcelas no se incluye totalmente, es el
caso de los seguros, para los que solo se consideran los gastos ligados a las
primas netas, los autom6viles, de los cuales se elimina los gastos correspon-
dientes a ventas entre consumidores, o los medicamentos y productos farmacu-
ticos, que solo incluyen los no subvenCionados. As pues, despus de estas
exclusiones, la ponderaCin total eliminada de la estructura del IPC espaol
es aproximadamente del 5%.
El IPCA est formado por doce grandes grupos cuyas respectivas ponde-
raCiones aparecen en la Tabla 4.9.
TABLA 4.9. Grupos y ponderaciones que integran el IPCA
Grupos
01. Alimentos y bebidas no alcohlicas
02. Bebidas alcohlicas y tabaco
03. Vestido y calzado
04. Vivienda
05. Menaje
06. Medicina
07. Transporte
08. Comunicaciones
09. Ocio y cultura
10. Enseanza
11. Hoteles, cafs y restaurantes
12. Otros
Fuente: INE.
Ponderaciones %
27,5
3,2
11,4
11,2
6,5
0,8
14,6
1,6
6,9
0,1
11,8
4,4
La frmula que se utiliza para obtner el IPCA, es la misma que para
obtener el IPC espaol, la frmula de Laspeyres:
I =" w.I. 11
i
donde el ndice de cada artculo I; se obtiene como coCiente de las medias
aritmticas de sus preCios. Las ponderaCiones W; permanecen fijas mes a mes.
7
El Reglamento del Consejo.nmero 2494/95 de 23 de octubre de 1995 establece las directrices
para la obtencin de ndices comparables.
NMEROS NDICES 249
A partir de las IPCA de los quince pases miembros, la ofiCina de estadstica
de la Unin Europea (EUROSTAT) obtiene un indice de Precio de Consumo
de la Uni6n Europea como media ponderada de los IPCA de dichos ndices.
,
4. 14. Otros lndices o Indicadores de Coyuntura
elaborados
Adems del IPC, que sin duda es el indicador ms relevante ya que la
subida generalizada de los preCios al consumo tiene una enorme repercusin
en los mbitos soeioeconmicos, existen otra serie de ndices que nos comple-
tan el panorama coyuntural de nuestra economa.
a) fndice de Producci6n Industrial (IPI)
8
Es un ndice de naturaleza cuntica que mide la evoluCin mensual de la
actividad productiva de las ramas industriales, excluida la construcCin. Mide
la evoluCin conjunta de la cantidad y de la calidad, eliminando la influencia
de los precios.
Para su obtenCin se elabora una encuesta continua de periodicidad men-
sual dirigida a ms de 9.000 establecimientos.
El organismo responsable de su elaboraCin es el INE, en donde puede
encontrarse la metodologa completa.
b) fndice de Precios Industriales (IPRJ)
9
Completa con el anterior la panormica coyuntural de la industria en
nuestro pas. Mide la evoluCin mensual de los precios de los productos
industriales, fabricados y vendidos en el mercado interior, en el primer paso
de su comerCializaCin, es decir, de los preCios de venta a salida de fbrica
obtenidos por los establecimientos industriales en las transacCiones que stos
efectan, excluyendo los gastos de transporte, comerCializacin e IV A fac-
turado.
, Para su obtencin se realiza una encuesta continua de periodicidad men-
sual, que investiga todos los meses ms de 6.000 establecimientos indus-
triales.
8
ndice de Produccin Industrial (IPI). Base 1990. INE.
9
ndice de Precios Industriales (IPRI). Base 1990. INE.
250 CASAS-SNCHEZ, J. M. y SANTOS-P>IAS, J.

e) ndices de Comercio al por Menor (ICM)
10
'
El objetivo principal de estos ndices de Comercio al por Menor es conocer
las caractersticas fundamentales de las empresas dedicad.ts al comercio al por
menor en Espaa, permitiendo medir a corto plazo, la ev )lucin de la activi-
dad en el sector.
d) ndice de Precios Hoteleros (IPH)
11
Es una medida de la evolucin mensual de los precios que los empresarios
hoteleros aplican a sus clientes.
Para su obtencin se utiliza la Encuesta de Ocupacin en Alojamientos
Tursticos: Establecimientos Hoteleros. Se investigan mensualmente alrededor
de 8.500 establecimientos hoteleros.
e) ndices de cotizacin burstil
Miden las fluctuaciones de las cotizaciones de las acciones que se registran
diariamente en los diferentes mercados burstiles, haciendo referencia a la
cotizacin de los valores en el momento de cierre de la sesin. A partir de las
cotizaciones de cada valor se elaboran ndices de grupos (bancos, alimentacin,
construccin, etc.). Estos ndices, convenientemente ponderados segn el volu-
men, y utilizando frmulas tipo Laspeyres nos llevan a obtener el ndice
general de la bolsa o un ndice tipo IBEX-35.
10
ndice de Comercio al por Menor (ICM). Base 2001. INE.
11
ndice de Precios Hoteleros (IPH). Base 2001. INE.
Ejercicios
l. Los precios y cantidades anuales producidos en cierta factora han resul-
tado ser, para el perodo 1990-1994, los siguientes:
Ao t Precio p
1
Cantidad q
1
1990 200 35
1991 210 38
1992 225 39
1993 235 36
1994 250 40
Determinar en tantos por uno:
a) La variacin relativa de precios con base 1991.
b) Los ndices cunticos con base 1991 y 1990.
e) El valor del producto en pesetas constantes de 1991 como base.
Solucin:
a)

= 1!.!_ nmero ndice simple de precios con base 1991,
P91
t = 90,91, ... , 94.
b)

= _!l!.._ y

=.!!!... (t = 90, 91, 92, 93, 94)
q91 q90
e) = P91qt
Recogidos en una tabla resultan ser:
Ao Precio relativo ndice cuntico ndice cuntico


0,9523809 0,9210526 1
91 1 1 1,0857143
1992 1,0714286 1,0263158 1,1142857
1993 1,1190476 0,9473684 1,0285714
1994 1,1904762 1,0526316 1,1428571
Valor

7.350
7.980
8.190
7.560
8.400
252 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
2. El nmero ndice de produccin en tantos por uno en el ao 1994, con
base 1980, fue 2,38. Sabiendo que en 1980 la produccin fue de kilogra-
mos del producto, calcular la produccin en toneladas mtricas (1 tm = 1.000
kg) en el ao 1994.
Soluci6n:
Q
94
= 2 38 = q
94
= q
94
=> q94 = 3.200. 2,38 = 7.616 kg
80
' q
80
3.200 kg
= 7,616 tm
3. Una marca de electrodomsticos fabrica, en cierta cadena industrial,
cuatro tipos de exprimidores automticos que reciben el nombre de modelo
A, B, C y D. En los aos 1997, 1998 y 1999, los precios recomendados de
venta y el nmero de unidades de cada modelo producidas se recogen en
esta tabla:
1997 1998
Modelo
Precio N.
0
de Precio N.
0
de Precio
A
B
e
D
(u.m.)
35
40
50
65
unidades
5.000
3.000
1.500
1.000
Se pide en tantos por uno:
(u.m.) unidades (u.m.)
37 5.200 40
45 2.500 47
55 1.700 58
68 1.200 70
a) Los ndices de precios de Laspeyres con base 1997.
b) Los ndices de precios de Paasche con base 1997.
e) Los ndices cunticos de Laspeyres con base 1997.
1999
N.
0
de
unidades
5.400
2.500
1.800
1.300
d) El valor en pesetas constantes de 1997 de la produccin en los tres
aos.
e) El valor en u.m. corrientes.
f) El ndice de precios de Fisher con base 1997.
1
NMEROS NDICES 253
Soluci6n:
a) 4
I Pi, t qi,
97
35.5.000 + 40. 3.000 + 50. 1.500 + 65. 1.000
Pi, 9
7
=
1
35. 5.000 + 40 3.000 + 50 1.500 + 65 1.000
b)
qi,97 .
= + 120.000 + 75.000 + 65.000 = 1 si t = 1997
435.000 '
98 - 37. 5.000 + 45. 3.000 + 55. 1.500 + 68. 1.000
p L,
97
- 435.000
185.000 + 135.000 + 82.500 + 68.000
435.000
470.500 .
-
43
-
5
.-
00
-
0
1,0816092 Sl t = 1998
40. 5.000 + 47.3.000 + 58. 1.500 + 70. 1.000
p99 - --------:--::-::-:-:-------
L,
97
- 435.000
200.000 + 141.000 + 87.000 + 70.000
435.000
1,1448276 si t = 1999
4
I Pitqit
t i=l
PP,91 = _:4:____::____
I Pi, 91qit
i=l
35 . 5.000 + 40. 3.000 + 50. 1.500 + 65 . 1.000
435.000
= 1, si t = 1997
37 . 5.200 + 45 . 2.500 + 55 . l. 700 + 68 . 1.200
p98 -
P,
97
- 35 5.200 + 40 2.500 + 50 1.700 + 65 1.200
192.400 + 112.500 + 93.500 + 81.600
182.000 + 100.000 + 85.000 + 78.000
480.000 . 998
-
44
-
5
.-
00
-
0
1,0786517, Sl t = 1
254
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
e)
p99 = 40 o 5.400 + 47 o 2.500 + 58 o 1.800 + 70 o 1.300
P,
97
35 5.400 + 40 2.500 + 50 1.800 + 65 1.300
216.000 + 117.500 + 104.400 + 91.000
189.000 + 100.000 + 90.000 + 84.500
528.900
=
463
_
500
1,1411003, si t = 1999
4
L ql,tP1,97
t 1= 1
QL, 97 =
4
= 1, si t = 1997
L ql, 97P1, 97
1=1
445.000
435
_QQQ = 1,0229885, SI t = 1998
463.500
=
435
_
000
= 1,0655172, si t = 1999
d) ,Y= V
97
+ V
98
+ V
99
= 1.343.500 u.m. de 1997
donde
4
v97 = L PI, 97ql, 97 = 435.000 u.m. de 1997
1= 1
4
v98 = L Pt, 97ql, 98 = 445.000 u.m. de 1997
1=1
4
v99 = L PI, 97ql, 99 = 463.500 u.m. de 1997
1=1
e) V = Vg7 + Vg
8
+ Vg
9
= 1.535.000 u.m. corrientes
donde
4
Vg7 = L P1, 99q1, 9
7
= 498.000 u.m. de 1999
1= 1
4
Vg8 = L PI, 99ql, 98 =
i= 1
= 40. 5.200 + 47. 2.500 + 58. 1. 700 + 70. 1.200 =
= 208.000 + 117.500 + 98.600 + 84.000= 508.100 u.m. de 1999
f)
NMEROS NDICES
4
Vg
9
= L P
1
,
99
q
1
,
99
= 528.900 u.m. de 1999
1= 1 o
P},
97
= jPi.
97

97
= 1, si t = 1997
j1,08160921,07865l7 = 1,0801294, si t = 1998
j1,14482761,1411003 = 1,1429624, si t = 1999
255
4. Una nave industrial ha sido alquilada para su explotacin al precio de
750.000 u.m. en el ao 1996. Si el ndice de precios al consumo ha evolucio-
nado de este modo:
Ao
t
1996
1997
1998
1999
ndice de Precios al Consumo (Base 1996)
r91 en tantos por uno
1
1,06
1,11
1,20
Cul ser el precio de alquiler para 1999, si en ese ao se revis el precio
de acuerdo con los incrementos de precios al consumo?
Solucin:
Ser el nuevo precio para 1999:
750.000 = 750.000 1,2 = 900.000 u.m.
5. Demostrar que: P L Qp = P P QL = P F QF siendo P L y QL los ndices de
Laspeyres de precios y cantidad, P P y Qp los ndices de Paasche de
y cantidad respectivamente, y P F y QF los ndices de Fisher de precros y
cantidad.
256
Solucin:
De donde
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
L qitPit
Qp=....:i __
L qioPit
L qitPio
QL=...:.i __
L qioPio
L Pitqi;
:;. PLQP = _,i__
L Pioqio
L Pitqio L Pitqit
i ...!.i__
L Pioqit'
i
6. El intercambio comercial entre dos paises A y B, se recogen en la infor-
macin siguiente (en miles de u.m.)
A export a B
1990 1994
Productos
Precio Cantidad Precio Cantidad
1 10 500 15 500
2 25 150 32 200
3 30 400 35 500
NMEROS NDICES 257
B export a A
1990 1994
Productos
Precio Cantidad Precio Cantidad
1'
2'
Se pide:
15 600 20 750
35 200 45 400
a) Calcular los ndices de precios de Laspeyres y Paasche de exportacin
de A y B, y deBa A, con base 1990 (en tantos por uno).
b) Calcular los ndices cunticos respectivos (en tantos por uno).
e) Existe dficit o supervit comercial para el pas A, en 1990 y 1994?
Solucin:
a) ndice de Precios de Exportacin de A a B
p94 = 15. 500 + 32. 150 + 35. 400 7.500 + 4.800 + 14.000
L,
90
10 500 + 25 150 + 30 400 5.000 + 3.750 + 12.000
26.300
= 20.750 1,2674699
p94 = 15. 500 + 32. 200 + 35. 500 7.500 + 6.400 + 17.500
P,
90
10 500 + 25 200 + 30 500 5.000 + 5.000 + 15.000
31.400
= 25.000
1
'
256
ndices de Precios de Exportacin de B a A
p'94 = 20. 600 + 45. 200 = 12.000 + 9.000 = 21.000 ,.....,
L,
90
15" 600 + 35 200 9.000 + 7.000 16.000 -
1

3125
p'94 = 20. 750 + 45. 400 = 15.000 + 18.000 = 33.000 ,.....,
P,
90
15 750 + 35 400 11.250 + 14.000 25.250-
1

3069307
258
CASAS-SNCHEZ, J. M. y SANTOS-PE]\AS, J.
b) ndices Cunticos de Exportacin de A a B
94 -25.000
QL,
90
-
20
.
750
- 1,2048193
94 - 31.400
Qp, 90 - 26.300- 1,1939163
ndices Cunticos de Exportacin de B a A
25.250

'
94
= -- 1 578125
L,
90
16.000 '
t94 - 33.000
Qp, 90- 21.000- 1,5714286
e) Valor exportado de A aBen 1990: V
90
= 20.750, en miles de u.m. de 1990.
Valor exportado deBa A en 1990: 16.000, en miles de u.m. en 1990.
Luego, en 1990 hubo supervit para A valorado en 4.750, miles de u.m.
de 1990.
Valor exportado de A aBen 1994: V
94
= 31.400, en miles de u.m. de 1994.
Valor exportado deBa A en 1994:

= 33.000, en miles de u.m. de 1994.
Luego, en 1994 hubo dficit para A valorado en 1.600, miles de u.m. de
1994.
7. Una moneda se deprecia anualmente en un 8% respecto del ao prece-
dente. Disponemos de los valores (en millones de u.m.) del patrimonio de cierta
compaa; estos son:
,
Ao t
1 1990
1991 1992 1993 1994
Valor Vr (en millones de u.m.) 30 38 40 46 35
Deflactar estos valores teniendo en cuenta la depreciacin anual de la
moneda Utilizada.
NMEROS NDICES 259
Solucin:
El valor de 1 milln de u.m. de 1990 ser de valor diferente que 1 milln
de u.m. de 1991 o 1992, etc. Concretamente se deprecia en un 8 % cada ao
respecto del anterior; luego el valor de 1 milln de u.m. de 1990, pasa a ser:
a) 0,92 millones de u.m. en el ao 1991, pues 0,92 =
b) 0,8464 millones de u.m. en el ao 1992, pues 0,8464 = 0,92
2
=
e) 0,778688 millones de u.m. en el ao 1993, pues 0,778688 = 0,92
3
=
d) 0,7163929 millones de u.m. en el ao 1994, pues 0,7163929 = 0,92
4
=
Luego, en millones de u.m. constantes de 1990, la valoracin del patrimo-
nio de la compaa es:
Ao t 1990 1991 1992 1993 1994
Valor Vr (en millones de
u.m. de 1990) 30 32,2 32,1632 31,14752 32,954073
Donde:
v; =

= Vr(0,92)f-
1990
, t = 1990, 1991, 1992, 1993 y 1994.
Siendo el ndice de precios que produce la depreciacin de la moneda en
el ao t en base 1990.
8. El ndice de precios al consumo en tantos por uno, en tres aos consecu-
tivos ha sido:
Ao t 1992 1993 1994
IPc:-1 1,05 1,04 1,032
Obtener el ndice medio en estos tres aos.
Solucin:
El ndice medio pedido, al que denotamos IPC, debe de verificar que:
1994 1994
fl IPC:_
1
= fl IPC = (IPC)
3
t= 1992 t= 1992
260 CASAS-SNCHEZ, J. M. y SANTOS-PE:firAS, J.
Luego:
1994
IPC=
3
TI JPC!-1
t= 1992
1,0406406 (media geomtrica de los ndices anuales)
De este modo el ndice de precios al consumo en el perodo 91-94 ser:
ya que
JPC1994 = (IPC)3
1991
Jpc
1994 = pc1992 pc1993. JPC1994 = JPC. JPC. IPC = (IPC)3
1991 1991. 1992 1993
Es decir, la evolucin de los precios al consumo en tres aos consecutivos
ha elevado los precios de 1991 a 1994 una cantidad igual al producto de los
tres ndices de la tabla; pero esta elevacin de precios habra resultado la
misma, a efectos de 1994, si hubiramos tenido un ndice constante interanual
igual al promedio geomtrico IPC.
Captulo 5
Estudio clsico o descriptivo
de las series temporales
5. 1. Introduccin
En el presente captulo, igual que ha ocurrido con la elaboracin de. los
nmeros ndices, vamos a seguir tratando de estudiar los fenmenos econmi-
cos (el consumo familiar, la inflacin, los tipos de inters, el paro, etc.) a lo
largo de la variable tiempo. As como con los nmeros ndices se estudia la
evolucin de una magnitud en una serie de perodos de tiempo, con el estudio
descriptivo de las series tratamos de hacer predicciones del fenmeno en
estudio teniendo en cuenta sus caractersticas histricas o del pasado. Lo
denominamos estudio clsico o descriptivo de las series temporales ya que se
ha venido empleando en exclusividad desde la segunda mitad del siglo XIX
hasta 1970 en que aparece un nuevo enfoque debido a los estadsticos Box y
Jenkins con sus conocidos modelos univariantes de series temporales. Estos
modelos se estudian en profundidad en los cursos de Econometra ya que
requieren un conocimiento previo de procesos estocsticos y de las distribu-
ciones de probabilidad que siguen dichos procesos.
En el tratamiento clsico o descriptivo que se desarrollar en el presente
captulo se emplear el mtodo tradicional de aislar lo que se conoce con el
nombre de componentes de una serie econmica temporal.
5.2. Concepto de serie temporal y definicin
de sus componentes
Se defme como serie temporal (tambin denominada histrica, cronolgica
o de tiempo) a un conjunto de datos, correspondientes a un fenmeno econ-
262
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
mico, ordenados en el tiempo. As sern series temporales las ventas de nuestra
empresa en cada uno de los ltimos diez aos, los costes financieros, la renta
disponible de nuestros clientes potenciales, etc. Es fundamental que los datos
estn ordenados en el tiempo de forma que cada observacin deber estar
asociada a un determinado perodo. Luego en esencia una serie de tiempo es
una distribucin de frecuencias bidimensional (y, t) donde la variable end-
gena y
1
es la magnitud en estudio y la exgena o independiente es el tiempo
t. Pero slo existe una sola variable y
1
que constituye lo que se conoce como
modelo univariante de serie temporal que se autoexplica por su propio pasado,
no existiendo ninguna variable explicativa o exgena que nos permita estable-
cer una relacin causa-efecto como se estudi en la regresin y correlacin. Se
estudia el pasado histrico de y
1
(sus componentes) de forma descriptiva y bajo
el supuesto de que su estructura va a permanecer constante se hacen predic-
ciones para el futuro.
En la representacin grfica de las series temporales se utilizan los ejes
cartesianos de la misma forma que se vio en la regresin bidimensional. En el
eje de abscisas se representa el tiempo t y los valores de la magnitud observada
y
1
en ordenadas con lo que se obtiene una serie de puntos (t, y
1
) que, al unirlos
nos dan un impacto grfico de la serie del que se puede sacar unas primeras
conclusiones de la evolucin histrica de la magnitud.
Ejemplo 5.1
La cifra de las ventas trimestrales de un supermercado en el perodo
1990-1994, expresadas en millones de pesetas constantes de 1990, han sido los
siguientes: 60, 70, 50, 80, 70, 80, 60, 100, 50, 60, 30, 70, 40, 50, 25, 60, 90, 95,
80, 110. Efectuar su representacin grfica comentando la evolucin de la serie.
Solucin:
En el grfico 5.1 sobre el eje de abscisas se han llevado los 20 trimestres
de los cinco aos considerados y en el de ordenadas el valor de las ventas
expresadas en millones de pesetas. Puede observarse que las ventas oscilan de
unos trimestres a otros y que en 1991 (trimestres 5, 6, 7 y 8) aumentan en
relacin con los de 1990 (trimestres 1, 2, 3 y 4). En 1992 (trimestres 9, 10, 11
y 12) la magnitud baja de nivel comparada con los datos de -los trimestres de
los dos aos anteriores ocurriendo lo mismo en 1993 (trimestres 13, 14, 15 y
16). En cambio la magnitud recupera unos niveles que estn por encima de
todos los anteriores en 1994 (trimestres 17, 18, 19 y 20).
En el estudio clsico de las series temporales se considera que la concrecin
de la magnitud en un determinado valor y en un determinado perodo es
consecuencia de la actuacin de cuatro componentes o fuerzas: la tendencia
Yt
110
100
90
80
70
60
50
40
30
20
10
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 263
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 t
GRAFICO 5.1. Serie de tiempo de las ventas trimestrales de un supermercado.
secular, las variaciones cclicas, las variaciones estacionales y las variaciones
accidentales. O sea el que las ventas del 19.
0
trimestre del ejemplo 5.1 sean 80
millones de pesetas tiene su origen en la actuacin conjunta de estas cuatro
componentes. Vamos a definirlas.
- Tendencia (T): Es una componente de la serie que refleja su evolucin
a largo plazo. Este largo plazo ser distinto segn sea la naturaleza de la serie,
pero cuantos ms perodos se tengan mejor ser el anlisis. En el ejemplo 5.1
la tendencia se obtendra teniendo en cuenta la evolucin de las ventas a lo
largo de todo el perodo de cinco aos. En el grfico 5.2 se representa por una
lnea recta creciente, ya que puede observarse que al considerar todo el con-
junto de observaciones las de los ltimos trimestres superan, en lneas gene-
rales, las alcanzadas en los anteriores. Esta componente, en el conjunto de
toda serie, puede ser de naturaleza estacionaria o constante (se representara
por una paralela al eje de abscisas), de naturaleza lineal (creciente o decreciente
segn que el coeficiente angular de la recta sea positivo o negativo), de natu-
raleza parablica, de naturaleza exponencial, u otras posibles.
- Las variaciones cclicas (C): Es una componente de la serie que recoge
las oscilaciones peridicas de amplitud superior a un ao. Estas oscilaciones no
son regulares y se presentan en los fenmenos econmicos cuando se dan de
forma alternativa etapas de prosperidad o de depresin. En el grfico 5.2 se
264 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
observa una variacin cclica en las venta del supermercado con una amplitud
de unos dos aos y medio (la amplitud se mide trazando una pan:.lela al eje
de abscisas equidistante en los extremos de las ondas del ciclo y contando los
perodos de tiempo existentes entre los puntos consecutivos que surgen al
cortar dicha paralela al grfico del ciclo C). La cada de las ventas del super-
mercado en los aos 1992 y 1993 tiene su origen en la recesin econmica que
sufri nuest:o pas en los mencionados aos y que afect al consumo familiar.
Pero la tendencia creciente de la serie hace que en 1994 las ventas alcancen
niveles superiores, en pesetas constantes, a los que existan en 1990 y 1991.
- Las variaciones estacionales (E): Es una componente de la serie que
recoge las oscilaciones que se producen en perodos de repeticin iguales o
inferiores a un ao. Su nombre proviene precisamente de las estaciones clima-
tolgicas: invierno, primavera, verano y otoo. Si se considera el ao como el
perodo marco o de repeticin pueden observarse las fluctuaciones de la mag-
nitud a lo largo de sus trimestres como ocurre en el ejemplo 5.1, de sus meses,
de sus cuatrimestres, etc. Si el perodo de repeticin es el mes pueden obser-
varse las fluctuaciones en sus distintos das; decenas, etc. (por ejemplo, debido
a la disponibilidad monetaria de los individuos, el consumo de gasolina para
los automviles aumenta en la primera decena del mes y disminuye en la
ltima). Si es una semana existen una serie de comportamientos fluctuantes a
lo largo de sus das provocados por las costumbres, hbitos individuales: hacer
las compras los viernes y sbados, ir a los espectculos, etc. Pueden ponerse
multitud de ejemplos en los que se dan las variaciones estacionales como una
serie de oscilaciones que suelen ser repetitivas y regulares en perodos cortos.
En cambio las oscilaciones cclicas no guardan regularidad y se dan en pero-
dos largos superiores al ao.
El origen de las variaciones estacionales puede estar en factores f s i o ~
naturales como son las estaciones climatolgicas o en factores culturales y de
tradicin: fiestas navideas, vacaciones, horarios comerciales, etc. El clima
afecta a la venta de una serie de productos: los helados y refrescos se venden
fundamentalmente en verano y la ropa de abrigo en invierno. Si nos fijamos
en las fluctuaciones trimestrales de las ventas del supermercado del ejemplo
5.1 puede observarse que de forma regular son mayores sistemticamente en
los segundos y cuartos trimestres en comparacin con los primeros y terceros.
Ello es debido a la estacionalidad de las compras de las familias. En verano
estn las vacaciones y la clientela del supermercado se desplaza a otros lugares
de esparcimiento quedando la poblacin de la zona de influencia del mercado
muy disminuida. En el cuarto trimestre se da un aumento sensible por las
compras navideas. En el primer trimestre el consumo se retrae por la famosa
cuesta de enero al haberse quedado agotadas las disponibilidades y la paga
extra en el mes de diciembre. El segundo trimestre se suele comportar con un
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 265
cierto nivel de recuperacin respecto al primero. En consecuencia podemos
concluir que las ventas del supermercado a los hogares fluctuan de acuerdo
con factores de tipo cultural y de tradicin (vacaciones, fiestas navideas, etc.).
- Las variaciones accidentales (A): Es una componente de la serie tempo-
ral que recoge las fluctuaciones errticas que se dan por la ocurrencia de
fenmenos imprevisibles (un pedido extraordinario a nuestra empresa, una
huelga, una catstrofe, etc.). Tambin reciben el nombre de variaciones irregu-
Iarest residuales o errticas. Adems de los fenmenos imprevisibles o extra-
ordinarios tambin existen perqueas variaciones de origen aleatorio cuyas
causas pueden ser mltiples. En el ejemplo 5.1 una variacin accidental pro-
ducida por una causa extraordinaria (un gran pedido de una fbrica para que
el supermercado facilite las cestas de Navidad de su personal) es el enorme
salto de la magnitud que en el octavo trimestre pasa a ser 100 millones de
pesetas. En cambio las variaciones accidentales son muy pequeas y afectan a
cada valor de la magnitud teniendo su origen en mltiples causas.
En el grfico 5.2, aunque los valores de las componentes de la serie tem-
poral del ejemplo 5.1 son desconocidos, se realiza una representacin terica
de las mismas. La tendencia T la representamos por una recta creciente a lo
largo de todo el perodo de forma que el crecimiento constante para cada valor
de t vendr dado por el coeficiente angular de dicha recta. La otra componente
que tambin se manifiesta a largo plazo es la variacin cclica C. Las variaciones
estacionales E tienen una gran importancia y sus oscilaciones siguen los pe-
rodos trimestrales de forma repetitiva. Las de menor importancia cuantitativa
son las variaciones accidentales A ya que en trminos genricos son pequeas
fluctuaciones debidas a una multitud de causas si se excepta el movimiento
extraordinario del perodo nmero ocho debido a un fenmeno nico y no usual
(el gran pedido de cestas de navidad que ha realizado la fbrica).
Ahora cabe hacerse una pregunta bsica: Cmo actuan los cuatro com-
ponentes para que como resultado den los distintos valores de la serie obser-
vada? En el estudio clsico de las series temporales se han manejado dos
hiptesis de trabajo:
- Los valores observados de cualquier serie temporal son el resultado de
la adicin de las cuatro componentes:
Yt = T+ C +E+ A [5.1]
La expresin [5.1] se conoce con el nombre de esquema o hiptesis aditiva
para descomponer la serie observada en sus cuatro componentes. Si nos
centramos en los datos del ejemplo 5.1 significa que los valores observados de
las ventas (60, 70, 50, 80, 70, etc.) son el resultado de sumar la componente
tendencia}, la cclica, la estacional y la accidental.
266
Yt
110
100
90
80
70
60
50
40
30
20
10
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
e
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
GRFICO 5.2. Representacin terica de las componentes de la serie temporal
del ejemplo 5.1.
- Los valores observados de cualquier serie temporal son el resultado de
la multiplicacin de las cuatro componentes:
Yt = T x ex Ex A [5.2]
Esta expresin [5.2] admite variantes para recoger el supuesto de que la
componente accidental o errtica es independiente de las dems y no sigue
ninguna regularidad peridica como ocurre con los dems. Esta independencia
implica que la componente A aparezca de forma aditiva:
Yt = T x ex E+ A ' [5.3]
Los mtodos que se utilizan para aislar las componentes de las series
temporales estn basados en algunos de los anteriores esquemas aunque no
puede establecerse una generalizacin del problema ya que no en todas las
series temporales aparecen todas las componentes. As, por ejemplo, si la serie
tiene periodicidad anual est exenta de las variaciones estacionales. Para re-
solver el problema de cul debe ser el esquema o hiptesis a utilizar en cada
caso, si aditiva o multiplicativa, habr que efectuar un anlisis previo de la
serie por mtodos grficos o analticos. Estos procedimientos se basan en el
comportamiento de la componente estacional. Si por ejemplo se realiza una
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 267
representacin grfica de la serie y se observa que las oscilaciones aumentan
a lo largo de los perodos con una tendencia creciente, puede afirmarse que
est actuando el esquema multiplicativo. Si las oscilaciones son regulares, no
expansivas a lo largo de la serie, puede concluirse que est actuando un
esquema aditivo. Una forma analtica de determinar el esquema de trabajo
ms adecuado es obtener las diferencias absolutas y relativas de los valores
observados entre perodos consecutivos (Yt+
1
- Yt y Y;.
1
). Seguidamente
se calculara los coeficientes de variacin de estas dos series y si el de la
primera (Yt+
1
- Yt) es inferior u ~ el de la segunda Yt+
1
, se dir que la hiptesis
Yt
aditiva es la ms adecuada. Por el contrario, si el coeficiente de variacin del
cociente es ms pequeo diremos que el esquema vlido es el multiplicativo.
No obstante estos posibles anlisis previos con la componente estacional,
debemos concluir que la inmensa mayora de las magnitudes econmicas se
adaptan perfectamente al esquema multiplicativo. Seguidamente vamos a ver
los distintos mtodos para aislar o determinar los componentes de una serie
temporal.
5.3. Determinacin de la tendencia
La tendencia es una componente fundamental en el estudio de las series
temporales ya que nos proporciona el hilo conductor de la evolucin del
fenmeno a largo plazo. Su determinacin slo debe efectuarse cuando se
disponga de una larga serie de observaciones (se aconseja a partir de doce o
quince aos), ya que en otro caso se podran obtener conclusiones errneas.
De los mltiples mtodos que se han ideado para tratar de aislar la tendencia
de las dems componentes vamos a tratar los ms sencillos y conocidos.
a) Mtodo grfico
Es el mtodo ms sencillo para obtener una lnea de tendencia de una serie
temporal sin necesidad de hacer operaciones aritmticas. Por esta razn es el
ms impreciso, aunque puede darnos una primera aproximacin al sentido de
la tendencia. El mtodo tiene las siguientes fases:
- Se efecta la representacin grfica de la serie observada Yt
- Se unen mediante segmentos rectilneos todos los puntos altos de la
serie obtenindose la lnea poligonal de cimas.
- Idem con los puntos bajos obtenindose la lnea poligonal de fondos.
- Se trazan perpendiculares al eje de abscisas por los puntos de cima y
de fondos.
268 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
- La tendencia viene dada por la lnea amortigUada que une los puntos
medios de los segmentos, es decir la lnea de tendencia tiene, por orde-
nadas la media aritmtica de las ordenadas de las dos lneas anteriores.
Ejemplo 5.2
La serie trimestral de las ventas de una empresa son las siguientes expre-
sadas en millones de pesetas.

T
1991 1992 1993 1994
l. o
50 20 50 70
2.0 80 50 70 100
3.0 70 40 50 90
4.0 60 30 40 60
Representar la tendencia de forma grfica.
Solucin:
En el grfico 5.3 pueden observarse los siguientes elementos: a) La repre-
sentacin grfica de la serie observada. b) La lnea poligonal e de cimas
Yt
100
90
80
70
60
50
40
30
20
10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
GRF1CO 5.3. Serie de tiempo de las ventas trimestrales de un supermercado.
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 269
o puntos altos. e) La lnea poligonal de fondos F o de puntos bajos. d) Los
puntos medios de los segmentos de unin (P
1
, P
2
, P
3
, P
4
, P
5
, P
6
y P
7
) de las
lneas e y F. e) Y, por ltimo la lnea que une dichos puntos medios que nos
indica la direccin de la tendencia que es predominantemente creciente.
b) Mtodo de las medias mviles
Es un mtodo de naturaleza mecnica que consiste en sustituir la serie
temporal observada por una amortiguada o suavizada obtenida por el clculo
reiterado de valores medios y ql!e nos representa la tendencia. Su aplicacin
consiste en lo siguiente:
- Partimos de la serie temporal observada y
1

- Se obtienen sucesivas medias aritmticas para cada y


1
con un nmero
de observaciones anteriores y posteriores que se ha fijado de antemano.
Si el nmero de observaciones utilizado es impar la media ji
1
obtenida
coincide (est centrada) con el perodo t. Si el nmero utilizado es par
la ji
1
no coincide con el perodo t (est descentrada) y hay que volver
a calcular una nueva media aritmtica y
1
utilizando los y
1
con lo que
se obtiene una serie de medias mviles centradas con los perodos de
tiempo. Las observaciones que se utilizan para obtener las medias
aritmticas suele coincidir con los perodos inferiores al ao que con-
tiene la serie (por ejemplo sern tres si son cuatrimestres, cuatro si son
trimestres, doce si son meses, etc.); si el perodo de repeticin fuese la
semana, las medias se obtendran con todos sus das.
- La serie formada por ji
1
o por y
1
, segn sea impar o par el nmero de
observaciones utilizadas, nos indica la lnea amortiguada de la ten-
dencia.
Ejemplo 5.3
Las ventas trimestrales de una fbrica de calzado expresadas en millones
de pesetas para los aos 1992, 1993 y 1994 son las siguientes:

Trim
1992 1993 1994
l. er trimestre 150 155 160
2. o trimestre 165 170 180
3!' trimestre 125 135 140
4. o trimestre 170 165 180
270 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Obtener las series de tendencia por el mtodo de las medias mviles em-
pleando tres y cuatro observaciones. Comentar las ventajas e de
utilizar ms o menos observaciones en el clculo de las medias aritmticas.
Solucin:
Empleando tres observaciones
Como se ha indicado anteriormente la ventaja es que al ser datos impares
la serie de medias mviles est centrada con los perodos de las observaciones.
El inconveniente es que al ser trimestres deberan tomarse cuatro observacio-
nes para promediar todas las variaciones de las cuatro estaciones con objeto
de eliminarlas (no se olvide que nuestro objetivo es aislar la componente
tendencia! de todas las dems). No obstante como ejercicio vamos a emplear
slo tres observaciones de forma sucesiva ya que al ser impares la serie ji
1
queda automticamente centrada con los distintos perodos o valores de t.
150 + 165 + 125 -
3 = 146,6
- Yz + Y3 + Y4
Y3 =
3
165 + 125 + 170 -
3 = 153,3
- Y3 + Y4 + Ys
Y4 =
3
125 + 170 + 155
3 = 150
_ Y4 + Ys + Y6
Ys =
3
170 + 155 + 170
3 = 165
- Ys + Y6 + Y1
Y6 =
3
155+170+135 -
3 = 153,3
_ Y6 + Y1 + Ys
Y?= 3
170 + 135 + 165 -
3 = 156,6
_ Y1 + Ys + Y9
Ys =
3
135 + 165 + 160 -
3 = 153,3
_ Ys + Y9 + Y1o
Y9 =
3
165 + 160 + 180 -
3 = 168,3
- Y9 + Y1o + Y11
Y1o =
3
160 + 180 + 140
3 = 160
- Y1o + Y11 + Y12
Y11 =
3
180 + 140 + 180 -
3 = 166,6
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 271
Puede observarse que en esta nueva serie de medias mviles cada ji
1
se
obtiene del anterior sin ms que suprimir el primer valor y aadir el siguiente.
Tambin observamos que para el perodo uno y el doce no existe ningn valor
de ji., con lo que a medida que se aumenta el nmero de observaciones
utilizados para obtener las medias mviles, ms valores se pierden por los
extremos, aunque frente a este incoveniente existe la ventaja de obtener una
serie ms amortiguada o suave para indicar la tendencia. Esta viene dada
grficamente teniendo los puntos determinados por ji
2
, ji
3
, ... , ji
11
como puede
observarse en el grfico 5.4.
Yt
y,
200
175
150
125
100
Yt
2 3 4 5 6 7 8 9 10 11 12
GRFICO 5.4. Representaci6n de la tendencia a travs de las medias m6viles y, obtenidas
con tres observaciones.
Empleando cuatro observaciones
En este ejemplo al ser datos trimestrales, lo ms correcto es emplear cuatro
observaciones para obtener las sucesivas medias mviles. El inconveniente es
que al ser un nmero par de datos la primera serie ji,. est descentrada respecto
a los perodos de tiempo y hay que volver a promediar los distintos ji,. dos a
dos para obtener una nueva serie de medias mviles y, que se corresponden
con los perodos de los datos observados. La serie ji,. descentrada ser:
272 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
_ = y1 + y
2
+ y3 + y4 = 150 + 165 + 125 + 170 =
152
,
5
Y2,s 4 4
- = Y2 + Y3 + Y4 + Ys = 165 + 125 + 170 + 155 = 153,75
Y3,s 4 4
_ = y
3
+ y
4
+ y
5
+ y
6
= 125 + 170 + 155 + 170 =
155
Y4,s 4 4
_ = y4 + y 5 + y6 + y 1 = 170 + 155 + 170 + 135 =
157
,
5
Ys,s 4 4
_ = Ys + y6 + y 1 +Ya= 155 + 170 + 135 + 165 =
156
,
25
Y6,s 4 4
_ = y6 + y 1 + Ya + y9 = 170 + 135 + 165 + 160 =
157
,
5
Y1,s 4 4
_ _ y
1
+Ya + y
9
+ y
10
= 135 + 165 + 160 + 180 =
160
Ys,s- 4 4
- =Ya + Y9 +Y lO+ Yu = 165 + 160 + 180 + 140 = 16125
Y9,s 4 4 '
_ = y
9
+ y
10
+ y
11
+ y
12
= 160 + 180 + 140 + 180 =
165
Y!O,S 4 4
En esta serie de medias mviles con cuatro observaciones (nmero par)
puede verse que dichas medias se corresponden con perodos ficticios, no
existen en la serie observada que son t' = 2,5; 3,5; ... ; 10,5. O sea, que la pnmera
media aritmtica 152,5 corresponde a un perodo irreal que est justo entre el
perodo dos y el tres; la segunda 153,75 est en un t' = 3,5 que est entre el
tres y el cuatro, etc. Para centrar estas medias con los perodos de las
observaciones se vuelven a promediar los valores Yr dos a dos obtemndose
la serie Yr que est centrada en los perodos observados t:
= = hs + hs = 152,5 + 153,75 = 153 125
Y3 2 2 '
= = hs + Y4,5 = 153,75 + 155 = 154 375
Y4 2 2 '
ESTUDIO CLSICO O DESCRIPTIVO DE LAS' SERIES TEMPORALES 273
- +-
= Y4,5 Ys,s
Ys =
2
155 + 157,5 = 6 25
2 15 '
Y
= = Ys,s + hs = 157,5 + 156,25 = 156 875
6
2 2 '
= = hs + Y?_5 = 156,25 + 157,5 =
156 875
y
1
2 2 '
= = Y?_5 + .Ya,s = 157,5 + 160 =
1 8 75
Ya 2 2 5 '
- +-
= Ya.s Y9,s
Y9 =
2
160 + 161,25
2 = 160,625
= = Y9,s + YlO,s = 161,25 + 165 = 163 125
YlO 2 2 '
Esta serie Yr centrada en los perodos tes la que nos representa la tendencia
como se indica en el grfico 5.5. Puede verse que se han perdido cuatro
observaciones: las de los dos primeros perodos y las de los dos ltimos. Si la
comparamos con la serie Yr que nos indica la tendencia utilizando tres valores
observados vemos que es mucho ms suave o amortiguada ya que sus
mximos y mnimos son 163,125 y 153,125 mientras que en aqulla son 168,3
y 146,6; pero en sta se pierden cuatro valores y en aqulla slo dos.
En resumen se debe resaltar que el mtodo mecnico de las medias mviles
tiene como objetivo aislar la componente tendencial de todas las dems me-
diante la suavizacin o amortiguamiento de la serie observada. Al ir prome-
diando los valores observados de forma sucesiva se eliminan los efectos de las
otras componentes cuando existan: variaciones estacionales, accidentales y
cclicas. Si los datos se observan en perodos inferiores al ao, en el supuesto
de que el perodo de repeticin sea ste (meses, trimestres, cuatrimestres, etc.)
es conveniente que para calcular las medias mviles se emplean tantas obser-
vaciones como estaciones consideradas (12 para los meses, 4 para los trimes-
tres, 3 para los cuatrimestres, etc.) ya que se consigue una adecuada elimina-
cin de la componente estacional que normalmente se presentar de una forma
regular en dichos perodos. Hay que tener presente centrar la serie de medias
mviles cuando los datos sean pares ya que cualquier dato se debe correspon-
der con toda exactitud con su perodo correspondiente.
Otra cuestin muy distinta es cuando los datos de la serie son anuales y
queremos obtener la tendencia a travs de las medias mviles. Al ser observa-
ciones de perdo anual no existe componente estacional ya que no se dan
274
Yt
Yt
200
175
150
125
100
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Yt
2 3 4 5 6 7 8 9 10 11 12
GRFICO 5.5. Representacin de la tendencia a travs de medias mviles ji
1
obtenidas
con cuatro observaciones.
perodos inferiores al ao. Cuntos aos se deben tomar para calcular las
medidas mviles? Lo ideal es tomar los mismos aos que tenga la amplitud
del ciclo completo pero no siempre es fcil determinarlo. Lo que suele hacerse
es obtener varias series de medidas mviles con distinto nmero de observa-
ciones (tres aos, cinco, siete, etc.) y elegir la que est ms suave o amortiguada
observando sus valores extremos.
Como se ha indicado en la introduccin al presente captulo el objetivo
fundamental del estudio de las series de tiempo es hacer predicciones de la
correspondiente magnitud. El principal inconveniente del mtodo mecnico de
las medias mviles es que no permite efectuar dichas predicciones ya que no
obtenemos la estimacin de la tendencia a travs de una funcin matemtiea
sino a travs de una serie amortiguada. Este hecho hace que se utilice poco
para determinar la tendencia cuando se quieran realizar pronsticos de evo-
lucin de cara al futuro; pero s se utiliza cuando queremos obtener ndices
de variacin estacional como se ver en el prximo epgrafe al estudiar dicha
componente. Los programas de ordenador para desestacionalizar series de
tiempo estn basados en el principio de las medias mviles.
__ _ ~
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 275
e) El mtodo analtico de los mnimos cuadrados
Este mtodo tiene la ventaja, en comparacin con el de las medias mviles,
de que expresa la tendencia a travs de una funcin matemtica que relaciona
la magnitud que se est estudiando con el tiempo t que acta como variable
independiente. El ajuste lo realizamos por el mtodo de los mnimos cuadrados
que ya se estudi en la regresin entre dos variables estadsticas. En primer
lugar conviene representar grficamente la serie temporal observada con ob-
jeto de decidir qu tipo de funcin es la ms adecuada: de tipo lineal, para-
blico, etc. Aqu slo vamos a tratar el ajuste lineal ya que representa a la
mayora de los fenmenos econmicos. Como ya sabemos el mtodo mnimo
cuadrtico consiste en minimizar la suma de los cuadrados de las diferencias
entre los valores observados en los distintos perodos y los estimados por la
ecuacin de la recta:.
Y
1
=a+ bt [5.4]
siendo las ecuaciones normales:
n n
L y
1
= na+ b L
; 1 ; 1
[5.5]
n n n
L Yrt=a L t+b L t
2
;1 ;1 ; 1
donde n es el total de observaciones que coincide con el nmero de perodos
de tiempo.
El sistema de ecuaciones normales [5.5] se simplifica efectuando un cambio
de variable t' = t- 0
1
si el nmero de perodos es impar siendo 0
1
el valor
que ocupa el lugar central de la serie de instantes o perodos t, y t' = 2(t - o;)
n
cuando es par de forma que L t' = O. El origen de trabajo o; es en el caso
';1
de los pares la media aritmtica de los dos valores que ocupan los dos lugares
centrales de la serie de perodos t. Haciendo este cambio de variable el siste-
n
ma [5.5] al ser L t' =O queda reducido a:
1'=1
n
L y
1
=na
t=1
[5.6]
t= 1 t'= 1
276 CASAS-SNCHEZ, J. M. y SANTOS-PE:ril"AS, J.
Despejando los parmetros de la recta que son las incgnitas del sistema
queda:
n
L Yt
t= 1
a=--
n
n
L Yl

n
t'2
t'= 1
que nos permite establecer la recta estimada:
Yr =a+ bt'
[5.7]
[5.8]
[5.9]
y deshaciendo el cambio de variable tendremos la ecuacin que nos da la
tendencia:
Yr = a + b(t - Or)
Yr = a + 2b(t - o;)
[5.10]
[5.11]
segn que el nmero de instantes o perodo sea impar o par respectivamente.
Cuando las observaciones estn en perodos inferiores al ao (meses, tri-
mestres, cuatrimestres, etc.) antes de hacer el ajuste conviene calcular las
medias anuales para eliminar la componentes estacional que nos puede dis-
torsionar el mismo empleando en las expresiones [5.7] y [5.8] dicha media Yr
en vez de los datos observados Yr Esta operacin se efecta como se indica
en el ejemplo 5.4. Si las observaciones son anuales se utilizan directamente
dichos datos ya que no existe el problema estacional.
Como se ha indicado al principio la gran ventaja de este mtodo es que
nos permite hacer predicciones de cara al futuro de la magnitud en estudio,
puesto que basta sustituir en las expresiones [5.10] y [5.11] eJ valor de t gor
esos perodos futuros que nos interesan. Tambin podemos dar una medida
de fiabilidad de dichas predicciones a travs del coeficiente de determinacin
que en este caso ser:
2 _ (Sryt
R - 2 2
sr.Sy
r
[5.12]
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 277
siendo:
n
I t'Yr
st'y = - (l'.Y)
r n
[5.13]
n
t'2
s;.
n
[5.14]
[5.15]
El significado de las anteriores expresiones ya se estudi en su momento
cuando la regresin y correlacin lineal simple entre dos variables estadsticas.
La nica diferencia es que aqu la variable independiente no es una magnitud
econmica sino el tiempo.
Ejemplo 5.4
En los datos de la serie temporal del ejemplo 5.3 obtener la tendencia lineal
ajustando la correspondiente recta por el mtodo de los mnimos cuadrados.
En la funcin estimada hacer una prediccin de las ventas medias trimestrales
para 1997 comentando la fiabilidad de la misma.
Soluci6n:
a) Estimaci6n de la tendencia
La tendencia vendr dada por la recta Yr =a+ bt siendo Yr la media anual
de las observaciones trimestrales del ejemplo 5.3:
150 + 165 + 125 + 170
4 = 152,5
- Ys + Y6 + Y1 + Ya
Y2 =
4
155 + 170 + 135 + 165
4 = 156,25
- Y9 + Y1o + Yu + Y12
Y3 =
4
160 + 180 + 140 + 180
4 = 165,00
278
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Como el nmero de perodos es impar para facilitar los clculos hacemos
el siguiente cambio de variable:
t' = t - o, = t - 1993
obtenindose la siguiente tabla:
t' ji, o t'
(2
-2
t ji, Y,
1992 152,50 -1 -152,50 1 23.256,25
1993 156,25 o o o 24.414,06
1994 165,00 1 165,00 1 27,225,00
3 3 3 3 3
I .Y,= 473,75 I t'= o I y,. t' = 12,5 I t'2 = 2 I y;= 74.895,31
t=l t'== 1 t=l t'=l t=l
Aplicando las expresiones 5. 7 y 5.8 tenemos
3
ji, 473 75
t=l ,. - 5792
a=--=---1 ,
3 3
3
ji. t'
b
= t= 1 t = 12,5 = 6 25
3 2 '
t'2
t'=1
Luego:
ji,= a+ bt' = 157,92 + 6,25t'
Deshaciendo el cambio de variable segn la expresin [5.10] tendremos la
siguiente estimacin de la tendencia:
ji,= 157,92 + 6,25(t - 1993) = 157,92 - 12.456,25 + 6,25t =
= - 12.298,33 + 6,25t
b) Prediccin de las ventas para 1997
Se obtienen sustituyendo en la tendencia estimada el parmetro t por 1997:
YI997 = -12.298,33 + 6,25 X 1997 =
= -12.298,33 + 12.481,25 = 183 millones de pesetas
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 279
Luego la prediccin de las ventas medias trimestrales para 1997 es de 183
millones ?e pesetas. Multiplicando por cuatro tendremos los de todo el ao:
183 x 4 = 732 millones de pesetas
e) Fiabilidad de la prediccin
Para conocer la fiabilidad de la prediccin calculamos el coeficiente de
determinacin a travs de las expresiones [5.12], [5.13], [5.14] y [5.15].
12,5 473,75
=--0--=416
3 3 '
3
t'2
s
2
= - (l')
2
= - 0
2
= o 66
t' 3 3 '
3
-2
2
=
1
y, _
2
74.895,31 ( )
2
S-=--- y = - 1579 =
3 3 '
= 24.965,10 - 24.932,41 = 32,69
2
(s,.
1
y (4,16f 17,30
R = = = --= O 7939
s;.. s; 0,66 x 32,69 21,79 '
t
Se observa que el coeficiente de determinacin est en el mnimo aceptable
con lo que el grado de fiabilidad de la prediccin no es muy elevado.
Como ya se indic al definir la componente tendencia!, sta puede seguir
un modelo estacionario o de media constante, siendo una paralela a la altura
de la ordenada en origen ya que el coeficiente angular de la recta sera cero.
La estimacin de media constante se realizara por mnimos cuadrados a
travs de la expresin [5.7]. La [5.8] sera nula. Puede seguir un modelo lineal
y como hemos visto la estimamos globalmente ajustando una recta por el
mtodo de los mnimos cuadrados.
Si la tendencia es exponencial seguir un modelo de la forma:
[5.16]
280 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Tomando logaritmos neperianos en la expresin [5.16] el modelo de ten-
dencia exponencial pasa a ser lineal en el logaritmo neperiano de la variable:
In y
1
=(a+ bt)lne =a+ bt [5.17]
En la expresin [5.17] se aplica el mtodo de los mnimos cuadrados como
ya conocemos para estimar a y b.
En la estimacin de la tendencia y con objeto de hacer predicciones en
perodos ms cortos que los que se suelen emplean en los ajustes de funciones
de forma global, se emplean los alisados exponenciales de la serie observada.
Aunque estos mtodos de anlisis de la tendencia no los vamos a desarrollar
indicaremos que el suavizado de la variable observada se obtiene calculand
una media ponderada con los datos de los distintos perodos anteriores a t y
la observacin de dicho perodo. Las observaciones ms cercanas a t son las
que ms se ponderan.
5.4. Determinacin de las variaciones
estacionales
Cuando se defini esta componente se estableci que eran oscilaciones de
la magnitud en estudio en perodos de repeticin de un ao (cuatrimestres,
trimestres y meses) o inferiores (por ejemplo el perodo de repeticin puede
ser el mes y sus componentes las semanas, etc.). Cuando se pretende en los
fenmenos econmicos analizar su evolucin real hay que eliminar la compo-
nente estacional ya que sus fluctuaciones pueden distorsionarla. Este proceso
recibe el nombre de desestacionalizacin de la serie observada. Por ejemplo si
se observan las ventas trimestrales del supermercado del ejemplo 5.1 vemos
que en 1990 al pasar del tercer trimestre al cuarto aumentan en 30 millones.
Qe ha ocurrido?, este aumento se debe a la eficacia publicitaria y de
personal de la empresa o a que en el cuarto trimestre estn las fiestas de
Navidad y el consumo familiar aumenta? Est claro que si se observa la serie
el segundo y cuarto trimestre son estacionalmente altos y el primero y el
tercero son estacionalmente bajos. Luego si se quiere analizar la evolucin real
de las ventas del supermercado hay que desestacionalizar la serie con lo que
se podrn comparar los distintos trimestres.
Antes de proceder a la determinacin de las variaciones estacionales hay
que asegurarse de que existen haciendo una representacin grfica de los
valores observados y viendo la regularidad en las oscilaciones. En ciertas
ocasiones la estacionalidad no tiene regularidad variando de posicin y am-
plitud en las oscilaciones de un perodo de repeticin a otro. Por otro lado
hay que determinar si la que acta es la hiptesis aditiva, multiplicativa o
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 281
mixta (multiplicativa en los componentes a largo plazo y aditiva en las varia-
. dones accidentales). En los dos mtodos que se van a explicar seguidamente
para determinar las variaciones estacionales se establecen las hiptesis de que
la estacionalidad es regular o estable en el tiempo y lo que acta es el esquema
multiplicativo, al que se adaptan la mayora de los fenmenos econmicos, en
el mtodo de las medias mviles y el aditivo cuando se hace un ajuste mnimo
cuadrtico para determinar los componentes a largo plazo.
a) Mtodo de la raz6n a la media m6vil para determinar la componente
estacional en una serie temporal
Este mtodo aisla la componente estacional mediante la eliminacin suce-
siva de las dems componentes. En la aplicacin del mtodo se siguen los
siguientes pasos:
- Se determina la tendencia por el mtodo de medias mviles centradas
en los perodos LY
1
).
- Se divide (hiptesis multiplicativa de actuacin de las componentes) la
serie observada y
1
por su correspondiente media mvil centrada con lo
que estamos eliminando de forma conjunta las componentes del largo
plazo (tendencia y ciclo). Se est considerando que la tendencia a travs
de las medias mviles nos representa tambin a la componente cclica
con lo que se est eliminando de la serie observada el conjunto T x C:
Yr
TxC
TxCxExA
------=E xA
TxC
[5.18]
Como se observa en la expresin [5.18] en la serie observada, una vez que
se ha eliminado la componente mixta tendencia-ciclo (T x C) sigue quedando
la componente accidental A. Luego el paso siguiente ser:
- Con objeto de eliminar la componente accidental de la serie ~ se
Yr
calculan las medias aritmticas a nivel de cada estacin (la media de
todos los cuatrimestres, trimestres, meses, etc.). Si las observaciones son
trimestrales tendremos cuatro medias (M
1
, M
2
, M
3
y M
4
); si son cuatri-
mestrales sern tres; si son mensuales sern doce, etc. Estas medias nos
representan de forma aislada la importancia de la componente estacional.
- Obtencin de los ndices de variacin estacional: Se calcula la media
aritmtica anual MA de las medias estacionales M
1
, M
2
, M
3
, que ser la
base de los ndices de variacin estacional expresados en tantos por 100:
M M
2
/
1
M ~ x 100, /
2
= MA x 100; ... ;etc.
282 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Habr tantos ndices como estaciones o medias estacionales tengan las
observaciones y nos indicarn la importancia de la variacin $!Stacional al
pasar a un perodo a otro. Si un ndice expresado en tantos por 100 nos da
80 quiere decir que por el mero hecho de ser esa estacin la magnitud en
estudio es un 20 por 100 ms baja de su tendencia media. Una vez obtenidos
los ndices de variacin estacional puede desestacionalizarse la serie observada
dividiendo cada valor de la correspondiente estacin por su ndice correspon-
diente expresado en tantos por uno.
Ejemplo 5.5
De la serie de ventas trimestrales del ejemplo 5.3 obtener los ndices de
varicin estacional por el mtodo de la razn a la media mvil. Desestacio-
nalizar con dichos ndices la serie observada.
Solucin:
Las medias mviles centradas utilizando las cuatro observaciones, y
1
, ya
estn calculados en el ejercicio 5.3 y son las siguientes:

T
1992 1993 1994
1.0
- 156,25 160,625
2.0 - 156,875 163,125
3.0 153,125 156,875 -
4.0 154,375 158,75 -
Esta serie nos representa las variaciones de los componentes a largo plazo
T x C. Dividiendo la serie observada y
1
del ejercicio 5.3 por y
1
tenemos:

1992 1993 1994

T
l. o
- 155/156,25 160/160,625
2.0
- 170/156,875 180/163,125
3.0
125/153,125 135/156,875 -
4.0
170/154,375 165/158,75 -
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 283
Realizando las sucesivas divisiones queda:

T
1992 1993 1994
l. o
- 0,9921 0,9970
2.0 - 1,0837 1,1035
3.0 0,8163 0,8606 -
4.0 1,1012 1,0400 -
Esta serie recoge de forma aislada la componente estacional pero todava
unida a la accidental que no ha sido eliminada. En definitiva es un ndice
expresado en tantos por uno en el que la base de comparacin es la tendencia
y el ciclo representados por las medias mviles centradas en los perodos de
tiempo. Estos ndices brutos ya nos arrojan mucha informacin sobre la
componente estacional. Puede observarse que los trimestres primero y tercero
son estacionalmente bajos al ser los ndices menores a la unidad y los segundos
y cuartos son altos al superar la mitad. Estas variaciones presentan regularidad
ya que se mantienen en los distintos aos.
Las variaciones accidentales las eliminamos obteniendo las medias aritm-
ticas de los cuatro trimestres:
0,9921 + 0,9970
M = = 09945
1 2 '
1,0837 + 1,1035
Mz =
2
= 1,0936
0,8163 + 0,8606
M3 =
2
= 0,8385
1,1012 + 1,0400
M4 =
2
= 1,0706
A partir de las anteriores medias calculamos la media aritmtica anual que
ser la base para obtener los ndices de variacin estacional:
M
1
+M
2
+M
3
+M
4
M A = ---='-------"'-
4
--"---...:!:
0,9946 + 1,0936 + 0,8385 + 1,0706
- 4 = 0,9993
i
284
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Tomando como base de comparacin esta media aritmtica anual obtenemos
los verdaderos ndices de variacin estacional expresados en ~ a n t o s por uno:
M
1
0,9946
11
= MA = 0,9993 =
0

9953
M
2
1,0936
12 = MA = 0,9993 = 1,0944
M
3
0,8385
13 = MA = 0,9993 = 0,8391
M
4
1,0706
14
= MA =O 9993 =
1

0714
'
Expresados en tantos por 100 sern:
1 = 99,53; 12 = 109,44
13 = 83,91; 14 = 107,14
El 11 significa que en los primeros trimestres las ventas realizadas prcti-
camente no estan sujetas a las variaciones estacionales ya que el ndice es
prcticamente la unidad en tantos por uno 100 en tantos por 100; slo
descienden un insignificante 0,47 por 100. El 1
2
significa que por el hecho de
ser segundos trimestres, con independencia de la poltica comercial que siga
la empresa, las ventas aumentan en un 9,44 por 100. El 1
3
significa que en los
terceros trimestres la estacionalidad afecta de forma significativa las ventas de
la empresa ya que bajan un 16,09 por 100. Por ltimo observando el 1
4
vemos
que la estacionalidad en dicho trimestre es alcista empujando a las ventas en
un 7,14 por 100.
Por ltimo vamos a desestacionalizar la serie observada en el ejemplo 5.3.
Como estamos dentro de la hiptesis multiplicativa para eliminar la influencia
estacional en las ventas observadas las dividimos en cada estacin por su
respectivo ndice de variacin estacional expresado en tantos por uno:
~
'
T
1992 1993 1994
Lo
150/0,9953 155/0,9953 160/0,9953
2.0
165/1,0944 170/1,0944 180/1,0944
3.0
125/0,8391 135/0,8391 140/0,8391
4.0
170/1,0714 165/1,0714 180/1,0714
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 285
Efectuando las divisiones queda la siguiente serie de ventas desestaciona-
lizada:
~
Aos
1992 1993 1994
Trimestres
Lo
150,71 155,73 160,76
2.0
150,77 155,34 164,50
3.0 148,97 160,89 166,85
4.0 158,67 154,00 168,00
La anterior serie representa las ventas de la empresa prescindiendo de las
oscilaciones estacionales pudindose comparar los datos de los distintos pe-
rodos. Se llega a la conclusin que existe una tendencia real alcista con
pequeas oscilaciones motivadas por causas accidentales.
b) Mtodo de la tendencia por ajuste mnimo cuadrtico para determinar
la componente estacional en una serie temporal bajo la hiptesis aditiva
1
Nuestro objetivo sigue siendo aislar la componente estacional de la serie
por eliminacin sucesiva de todos los dems. La diferencia con el mtodo de
la razn a la media mvil es que en este caso las componentes a largo plazo
(tendencia junto con ciclo) las obtenemos mediante un ajuste por mnimos
cuadrados de las medias aritmticas anuales ji
1
y se acta bajo la hiptesis
aditiva. Luego los pasos a seguir son los siguientes:
- Se calculan las medias anuales de los datos observados y
1
: ji
1
, ji
2
, ji
3
, .
Si las observaciones son trimestrales estas medias se obtienen con cua-
tro datos, si son mensuales con doce, etc. Sera el caso de que el perodo
de repeticin es el ao. Si es otro las medias se obtendran con sus
componentes.
- Se ajusta una recta por mnimos cuadrados ji
1
=a+ bt empleando el
proceso y formulacin [5.7] y [5.8] que ya se estudi en su momento
que nos representa a la tendencia. Sabemos que el coeficiente angular
b de la recta nos mide el incremento medio anual de la tendencia que
influir de distinta forma al pasar de una estacin a otra como se ver
ms adelante.
- Se calculan con los datos observados las medias estacionales (M
1
, M
2
,
M
3
, , etc.) con objeto de eliminar la componente accidental. Estas
medias aritmticas son brutas ya que siguen incluyendo los componen-
1
Existe tambin el mtodo de la razn a la tendencia que es equivalente al de las medias
mviles y actan con la hiptesis multiplicativa.
286 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
tes a largo plazo (tendencia y ciclo) y tienen que someterse a una
correccin de las mismas.
- Empleando el incremento medio anual dado por el coeficiente se ob-
tienen las medias estacionales corregidas de las componentes a largo
plazo (M'
1
, M ~ , M ~ , ... , etc.) bajo el esquema aditivo (se resta):
M'
1
= M
1
ya que estamos en la primera estacin y no est influida por
la tendencia con lo que no hay que restar nada.
1 b
M ~ = M
2
- ya que hemos pasado de la primera es-
n.o de estacwnes
tacin a la segunda hay que restar la parte proporcional del
incremento anual de la tendencia.
2b
M ~ = M
3
- ya que como M ~ pertenece a la tercera
n.
0
de estaciones
estacin han transcurrido dos estaciones luego hay que restar de
la media sin corregir M
3
dos proporciones del incremento anual
2b
de la tendencia, o sea o d .
n. e estaciOnes
Para la r-sima estacin la media estacional corregida de la tendencia
interestacional ser:
M' = M ___ (.:....r_-_l...:....)b __
' ' n.o de estaciones
- Los ndices de variacin estacional se obtienen con la misma sistem-
tica utilizada en el mtodo de la razn a la media mvil: con las medias
estacionales corregidas se obtiene la media aritmtica anual M'A que
sirve de base para calcular los ndices:
M'
l = M ~ X 100;
M'
1
2
= M ~ x lOO; ... ,etc.
Obtenidos estos ndices de variacin estacional estamos en condiciones
de desestacionalizar la serie como se ha efectuado anteriormente.
Ejemplo 5.6
Con los datos de la serie temporal del ejercicio 5.3 obtener los ndices de
variacin estacional por el mtodo de ajustar una recta a las medias anuales.
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 287
Solucin:
El ajuste de la recta por mnimos cuadrados est resuelto en el ejemplo 5.4
siendo:
Yr = 12.296,33 + 6,25t
El incremento medio anual es b = 6,25.
Con los datos observados en el ejemplo 5.3 calculamos las medias estacio-
nales sin corregir de la componente extraestacional (T + C). De esta forma
eliminamos la componente accidental:
150 + 155 + 160
M
1
=
3
= 155
M
165+170+180 -
2 = 3 = 171,6
M = 125 + 135 + 140 _ _
3 3 . - 133,3
170 + 165 + 180 -
M
4
=
3
= 171,6
Seguidamente se obtienen las medias aritmticas estacionales corregidas de
la parte que les corresponde a cada una del incremento medio anual de la
tendencia:
M ~ = M
1
= 155
M' lb _
2 = M2- 4 = 171,6- 1 X 1,5625 = 170,1041
2b
M ~ = M 3 - 4 = 133,3 .,.... 2 X 1,5625 = 130,2083
3b -
M ~ = M4- 4 = 171,6- 3 X 1,5625 = 166,9791
La media aritmtica anual para que sirva de base en el clculo de los
ndices de variacin estacional ser:
M'A = M ~ + M ~ + M ~ + M ~ = 155 + 170,1041 + 130,2085 + 166,9771
.4 4
= 155,5673
288 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Los ndices de variacin estacional expresados en tantos por uno son:
= M ~ =
155
= 09964
11
M' A 155 5673 '
M'
1 =--3
3
M'A
'
170,1041 = 1 0934
155,5673 '
~ ~ ~ ~ ~ ~ ~ = 0,8370
= M ~ = 166,9791 =
1 0733 14
M' A 155 5673 '
'
Puede observarse que si se comparan estos ndices con los obtenidos por
el mtodo de la razn a la media mvil son prcticamente iguales (existen
pequeias diferencias a partir del tercer decimal) lo que indica que la estacio-
nalidad es muy regular y no expansiva con lo que es indiferente el mtodo
que se aplique.
5.5. Determinacin de las variaciones
cclicas
Cuando hemos definido esta componente se ha dicho que recoge las osci-
laciones peridicas de larga duracin. El problema es que estos movimientos
no suelen ser regulares como los estacionales y su determinacin encierra
dificultades de forma que como se ha apuntado en los casos prcticos se suelen
tratar conjuntamente con la tendencia llamando componente extraestacional al
efecto de (T x C) si estamos en el marco multiplicativo o (T + C) si es el
aditivo. A pesar de estas dificultades se puede tratar de aislar el ciclo bajo la
hiptesis multiplicativa dejndolo como residuo con la eliminacin de la ten-
dencia y la variacin estacional. Los pasos seran:
- Estimar la tendencia.
- Calcular los ndices de variacin estacional.
- Se desestacionaliza la serie observada. . ,
- Se elimina la tendencia dividiendo cada valor desestacionalizado por la
serie de tendencia.
Expresando el proceso en forma de cociente sera:
y TxExCxA
__ t_= =CxA
TXE TxE
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 289
El proceso finalizara intentando eliminar la componente accidental A y
determinando el perodo de los ciclos que nos llevara a un tratamiento de
anlisis armnico que superara el nivel descriptivo que estamos dando al
tratamiento clsico de las series temporales.
l. En el ejemplo 5.4 hemos estimado la siguiente tendencia:
y, = -12.342,08 + 6,25t
Ejercicios
Suponiendo que esta tendencia lineal recoge el efecto o componente
extraestacional (representa la tendencia y el ciclo conjuntamente); predecir el
valor de los trimestres primero y segundo del ao 2002 teniendo en cuenta la
variacin estacional bajo la hiptesis aditiva y admitiendo que la componente
accidental es irrelevante.
Solucin:
Primero hacemos la prediccin trimestral media que ser:
h
002
= -12.342,08 + 6,25 x 2.002 =
= 170 millones de ventas medias trimestrales
Teniendo en cuenta los ndices de variacin estacional del ejemplo 5.6
tenemos:
y
1
= 170 x 0,9964 = 169,38 millones de ptas.
y
2
= 170 x 1,0934 = 185,87 millones de ptas.
y
3
= 170 x 0,8370 = 142,29 millones de ptas.
y
4
= 170 x 1,0733 = 182,46 millones de ptas.
2. La fbrica de calzado del ejemplo 5.3 ha tenido las siguientes ventas anuales
en los ltimos seis aos (perodo 1996-2001) expresadas en millones de pesetas:
Aos
1996
1997
1998
1999
2000
2001
Ventas (millones de ptas.)
540
565
580
610
625
660
' ...no
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 291
Predecir las rentas en 2004 y su nivel de fiabilidad comparando los resul-
tados con los obtenidos en el ejercicio 5.4.
Solucin:
Como el nmero de perodos es par hacemos el siguiente cambio de variable:
t' = 2(t- O;)
siendo:
1 1998 + 1999
o = = 1998 5
t 2 '
En este caso como las observaciones son anuales no existe el problema de
la estacionalidad no teniendo que obtener ningn tipo de media anual reali-
zndose el ajuste con las ventas anuales.
t ( = 2(t - 1998,5)
y, y,(
(2
y
1996 -5
540 -2.700 25 291.600
1997 -3
565 -1.695 9 319.225
1998 -1
580 -580 1 336.400
1999 1 610 610 1 372.100
2000 3 625 1.875 9 390.625
2001 5 660 3.300 25 435.600
6 6 6 6 6
I t' =O I y,= 3.58o
I Yl = 810 I r2 = 7o
I y = 2.145.55o
t'=l r=l t=l t'=l t=l
Empleando las expresiones 5. 7 y 5.8 tenemos:
6
t ~ y, 3.580 ~
a = --= --= 596 66
6 6 '
6
" t'
t:--1 y, 810
b=--=-= 1157
6
70 '
I t'2
t'=l
292
CASAS-SNCHEZ, J. M. y SANTOS-PE"&AS, J.
Luego la estimacin de la tendencia para predecir las ventas de 2004 es:
'
y
1
= a + bt' = 596,66 + 11,57t'
Deshaciendo el cambio de variable tenemos
Yt = 596,66 + 11,57 2(t- 1998,5) =
= 596,66-46.245,29 + 23,14t = -45.648,63 + 23,14t
La prediccin de las ventas anuales para 2004 ser:
y
2004
= -45.648,63 + 23,14 X 2004 =
;=: - 45.648,63 + 46.372,56 = 723,93 millones de ptas.
El nivel de fiabilidad nos lo da el coeficiente de determinacin:
R2 = (Sty/ = = 18.225 = 0,988
S
2
11 66 X 1580,64 18.440,7
t Yr '
Siendo los clculos de la covarianza y varianzas:
6
r2
. t'=l 72 70 11 (?
S
2 = ---r =-- O= oo
t' 6 6 '
6
y;
s2 = _ y2 =
2

145

550
- (596,66f = 1588,51
6 6
Si se comparan estos resultados con los obtenidos en el ejemplo 5.4
vamos que all la prediccin fue de 732 millones de pesetas con un coeficiente
de determinacin del 0,7939. En cambio al haber utilizado aqu el doble de
observaciones (seis en vez de tres) la fiabilidad ha aumentado enormemente.
Luego la prediccin de 723,93 millones de ventas para 2004 es la que deben
considerar los directivos de la empresa en su toma de decisiones.
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 293
3. !Jn. concesionario de una determinada marca de automviles ha vendido
los stgwentes vehculos en los ltimos tres aos:

T
1999 2000 2001
l. o
6 10 14
2.0 12 15 25
3.0
4 7 12
4.0
5 12 16
Obtener:
a) Los ndices de variacin estacional aplicando el mtodo de la tendencia
por mnimos cuadrados bajo la hiptesis aditiva (si se trabajara con
la hiptesis multiplicativa habra que aplicar el mtodo de la razn a
la media mvil o bien el mtodo de la razn a la tendencia por
mnimos cuadrados, que no se ha explicado en esta obra).
b) Desestacionalizar la serie observada y
1

e) Predecir el nmero de automviles vendidos para cada trimestre de


2003.
Soluci6n:
a) Obtencin de los ndices de variacin estacional:
- Se calculan las medias anuales:
- _ Yt + Y2 + Y3 + Y4
Yt-
4
6 + 12 + 4 + 5
4 = 6,75
- _ Ys + Y6 + Y1 + Ys
Y2-
4
10 + 15 + 7 + 12
4 = 11,00
- _ Y9 + Yto + Ytt + Y12
Y3- 4
14 + 25 + 12 + 16
4 = 16,75
- Se estima la tendencia ajustando una recta por mnimos cuadrados.
Para ello, al ser datos impares se hace el cambio de variable
t' = t- 0
1
= t- 2ooo.
294 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
t t'=t-2000
Yt
t'yt
t'2
-2
Yt
1992 -1 6,75 -6,75 1 45,56
1993 o 11,00 o o 121,00
1994 1 16,75 16,75 1 280,56
3 3 3 3 3
t' =o y
1
= 34,5 y
1
= 10 (2 = 2 .v; = 447,12
t'- t-1 1=1 1'=1 t= 1
Aplicando las expresiones [5.7] y [5.8] tenemos:
3 3
L Yt 34 5
a= t=1 = -' = 11,5
n 3
L t'Yt. 10
b = !.=_!_____ = - = 5
n 2
t'2
t'= 1
Luego la recta con el cambio de variable ser:
y
1
= a + bt' = 11,5 + 5t'
Deshaciendo el cambio se tendr la estimacin de la tendencia (ser la esti-
macin de la componente extraestacional, o sea tendencia y ciclo ya que no
los diferenciamos):
y
1
= 11,5 + 5(t - 2000) = 11,5 - 10.000 + 5t = -9.988,5 + 5t
El parmetro b o coeficiente angular nos da el incremento anual
sufre y
1
al pasar de un ao a otro (como sabemos Y
1
es la medta anual obtemda
con los cuatro trimestres).
- Se calculan las medias estacionales sin corregir por filas en los datos
observados Yr
. 6 + 10 + 14
M
1
=
3
= 10
12 + 15 + 25
M
2
=
3
= 17,33
4 + 7 + 12
M
3
=
3
= 7,66
= 5 + 12 + 16 = 11 00
M4 3 ,
\
- Las anteriores medias se corrigen de la tendencia empleando de forma
adecuada (restando al estar en la hiptesis aditiva) el incremento medio
anual de tendencia (b):
ESTUDIO CLSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 295
M
1
= 10
1b 1x5 _
M
2
- 4 = 17,33--
4
- = 16,083
2b 2 X 5
M;= M
3
- 4 = 7,66- -
4
-= 5,16
3 b 3 X 3,33

4
=7,25
- Por ltimo los ndices de variacin estacional se obtienen en tantos
por uno tomando como base la media anual corregida:
M' +M' +M' +M'
M'A = 1 2 3 4
10 + 16,083 + 5,16 + 7,25
4 = 9,625
4
M' 10 16,083
11
9,625 =
1
'
039
;
12
= M'A = 9,625 =
1

671
M' 5 1,25
13
9,625 =
0
'
537
;
14
= M'A = 9,625 =
0

753
b) Desestacionalizacin de la serie observada: a cada valor observado se le
resta (por ser el esquema aditivo) su correspondiente componente esta-
cional, que es:
Ek = Mk- Et
donde k = 1, 2, 3, 4 denota el trimestre considerado, y Et es la compo-
nente extraestacional o media de los valores ajustados por la recta
y = a + b (i = 1, 2, ... , 12) en los ndices i = 1, 5 y 9 para el primer
trimestre, i = 2, 6 y 10 para el segundo trimestre, i = 3, 7 y 11 para el
tercero y finalmente i = 4, 8 y 12 para el cuarto trimestre.
La recta ajustada a los 12 datos es:
y = a
01
+ b(i - a
10
)
donde
138
a01 = 12 = 11,5
1.047
a11 = U = 87,25
a
10
= 6,5
650
a20 = 12 = 54,16
m11 a
11
- a
10
a
01
87,25 - 6,5 11,5
b = - = 2 = 2 = 1,048
m
20
a
20
- a
10
54,16 - 6,5
296 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y sustituyendo tenemos:
de donde:
y = 11,5 + 1,048 (i - 6,5)
Ef = 11,5 + 1,048(5 - 6,5) = 9,9266
E! = 11,5 + 1,048(6 - 6,5) = 10,9755
E; = 11,5 + 1,048(7 - 6,5) = 12,0245
E: = 11,5 + 1,048(8 - 6,5) = 13,0734
y de aqu, como Ek = Mk- Et resulta:
E
1
= 0,0734, E
2
= 6,3578, E
3
= -4,3578 y E
4
= -2,0734
La serie desestacionalizada ser:
~
T
1999 2000 2001
1.0
y- E= 6 y
5
- E
1
10 y
9
- E
1
14
2.0
Y2- E2 ~ 6 Y6- E2 ~ 9 Y1o- E2 ~ 19
3.0
Y3- E3 ~ 8 Y7- E
3
11 Yu- E3 ~ 16
4.0
Y4- E4 ~ 7 Ya- E4 ~ 14 y
12
- E
4
18
e) Para predecir el nmero de automviles que se van a vender en 2003
empleamos la tendencia lineal estimada para el ao 2003, admitiendo la
hiptesis de que la tendencia permanece estable:
Yt996 = -9.988,5 + 5 X 2003 =
= 26,5 ~ 27 automviles como media anual de los trimestres
Como la hiptesis es aditiva, solo queda aadir la componente estacional
Ek al valor ji
1996
para as obtener las predicciones trimestrales en 1996:
Y2oo3 1 a = YJ996 + E ~ 27
ji2003,2.0 = jil996 + E2 ~ 33
Y2003,3.0 = jil996 + E3 ~ 22
Y2oo3 4 = YJ996 + E ~ 24
automviles, respectivamente.
\
6. 1. Introduccin
Captulo 6
Fenmenos aleatorios
y sucesos
El propsito de este captulo ser dar unos conceptos bsicos y fundamen-
tales para poder introducir en el captulo siguiente el concepto y teora de la
probabilidad.
Cuando estudibamos la Estadstica Descriptiva, decamos que dentro de
la Estadstica podamos considerar dos grandes ramas, perfectamente diferen-
ciadas, no slo por los objetivos que se persiguen, sino tambin por los
mtodos que se utilizan. Estas son: la Estadstica Descriptiva o Deductiva y la
Inferencia Estadstica o Estadstica Inductiva.
La Inferencia Estadstica la utilizaremos cuando la observacin de la po-
blacin no es exhaustiva, sino que slo observamos un subconjunto o muestra
de la misma, de tal manera que los resultados o conclusiones obtenidas de la
muestra los generalizamos a la poblacin. La muestra se toma para obtener
un conocimiento o informacin de la poblacin, pero nunca nos proporciona-
r una informacin exacta sino que incluir un cierto nivel de incertidumbre.
As, por ejemplo, supongamos que un nuevo producto se lanza al mercado y
seleccionamos una muestra de comercios para realizar una cierta evaluacin
sobre la reaccin hacia ese producto por parte del consumidor, con el fin de
poder conocer la posible demanda y si el producto sera consumido a nivel
nacional.
Evidentemente y basndonos en la informacin que nos proporcionar esa
muestra es imposible conocer con exactitud la reaccin de la poblacin com-
pleta y cualquier medida sobre el comportamiento del consumidor contendr
inevitablemente incertidumbre.
298 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Pero sin embargo, s ser posible, a partir de la muestra, hacer afirmaciones
sobre la naturaleza de esa incertidumbre, que vendr expresada en el lenguaje
de Probabilidad, siendo por ello un concepto necesario y muy importante en
la inferencia estadstica, ya que nos permitir pasar de las afirmaciones hechas
con certeza a partir de la muestra a pronosticar en trminos de probabilidad
situaciones en la poblacin.
Si consideramos la definicin de Estadstica dada por V. Barnett (1982)
la Estadstica es la ciencia que estudia cmo debe emplearse la informacin
y cmo dar una gua de accin en situaciones prcticas que envuelven incer-
tidumbre observamos que aparece el trmino situaciones prcticas que en-
vuelven incertidumbre que equivale a lo que nosotros llamaremos experimen-
tos aleatorios, de gran inters en el clculo de probabilidades y en la Estadstica
en general.
6.2. Fenmenos aleatorios
La idea de experimento se utilizar con cierta frecuencia en este y en los
prximos los primeros captulos. Un experimento es cualquier situacin u
operacin en la cual se puede presentar uno o varios resultados de un conjunto
bien definido de posibles resultados, por ejemplo, registrar el valor de una
accin de bolsa en un instante determinado, lo cual puede dar lugar a un
conjunto de posibles resultados, lanzar una moneda al aire, o un dado, etc.
En la actividad diaria nos encontramos con ciertos tipos de fenmenos o
experimentos que se pueden reproducir un gran nmero de veces, en condi-
ciones similares dando lugar a un conjunto de dos o ms posibles resultados.
Estos experimentos pueden ser de dos tipos determinsticos y aleatorios.
Diremos que el experimento es determinstico cuando al repetirlo bajo
idnticas condiciones iniciales se obtienen siempre los mismos resultados. Por
ejemplo, si tenemos una regla milimetrada y una barra metlica, un experi-
mento puede consistir en preguntarle a un individuo la medida en milmetros
de la barra. Si repetimos, varias veces, el experimento bajo idnticas condicio-
nes y obtenemos la misma medida en milmetros diremos que se trata de un
experimento determinstico.
Sin embargo, si el experimento lo repetimos bajo idnticas condiciones
. .
iniciales y no se obtienen siempre los mismos resultados diremos que estamos
ante un experimento aleatorio. Por ejemplo:
- El lanzamiento de una moneda observando la sucesin de caras y
cruces que se presentan.
- El lanzamiento simUltneo de dos dados observando la sucesin de
resultados.
FENMENOS ALEATORIOS Y SUCESOS
299
- El cambio diario del valor del dlar observando la sucesin de valores
en pesetas.
- El nmero de llamadas a un telfono durante perodos de cinco minutos.
- El preguntar la intencin del voto.
- Entrevistar a una persona para determinar la marca que prefiere de un
producto determinado, etc.
Para ser ms precisos podemos citar, como caractersticas de un experi-
mento aleatorio, las siguientes:
1.
0
El experimento se puede repetir indefinidamente bajo idnticas condi-
ciones.
2. Cualquier modificacin mnima en las condiciones iniciales de la re-
peticin puede modificar completamente el resultado final del experi-
mento.
3.
0
Se puede determinar el conjunto de los posibles resultados del ex-
perimento, pero no se puede predecir previamente un resultado par-
ticular. .
4.o Si el experimento se repite un nmero grande de veces, entonces apa-
rece algn modelo de regularidad estadstica en los resultados obte-
nidos.
El significado de las tres primeras caractersticas no tiene dificultad alguna,
y la cuarta nos indica que cuando el experimento se realiza un nmero grande
de veces tienden a estabilizarse los resUltados del experimento aleatorio, en el
sentido de que cada uno de los posibles resultados tiende a salir un nmero
similar de veces.
As pues, si el experimento aleatorio consiste en el lanzamiento de una
moneda perfecta al aire, en donde todos los posibles resultados son cara o
cruz, y realizamos 100 repeticiones (lanzamientos) podremos comprobar que
el nmero de veces que aparece cara sera similar al de cruz, es decir, la
frecuencia relativa de cara tendera a aproximarse a 1/2. Anlogamente sucede
si en una urna introducimos 2 bolas blancas y 3 negras, idnticas salvo en su
color, sin mirar sacamos una bola anotamos el color y la devolvemos a la
urna y realizamos esta operacin un nmero grande de veces, entonces podre-
mos comprobar que las frecuencias relativas de obtener bola blanca tender
a estabilizarse hacia 2/5 y la de bola negra hacia 3/5.
6.3. Espacio muestra!
Asociado a todo experimento aleatorio tendremos el conjunto de los po-
sibles resultados que se pueden obtener cuando tiene lugar el experimento
aleatorio.
i
il
n
!1
. ,"j
'
300 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
A cada uno de los posibles resultados del experimento aleatorio se le llama
resultado bsico o elemental, comportamiento individual o punto muestra); y el
registro sistemtico de los resultados obtenidos en sucesiones de experimentos
aleatorios da lugar a un conjunto de datos estadsticos. Los resultados bsicos
elementales sern definidos de tal manera que no puedan ocurrir dos simul-
tneamente, pero s ocurrir uno necesariamente.
Al conjunto de todos los resultados elementales del experimento aleatorio
le llamaremos conjunto universal, espacio muestra) o espacio de comportamien-
tos y lo designaremos por E.
Ejemplo 6.1
Consideremos el experimento aleatorio consistente en lanzar un dado al
aire.
Los resultados bsicos o elementales sern que aparezca un 1, 2, 3, 4, 5
6. No pueden ocurrir dos resultados conjuntamente, sino que necesariamente
debe ocurrir uno.
El espacio muestral es el conjunto formado por los seis posibles resultados
elementales:
E= {1, 2, 3, 4, 5, 6}
El conjunto de posibles resultados elementales de un experimento aleato-
rio, y por tanto el espacio muestral, depender de cmo sea observado o del
enfoque que le demos al experimento. As pues, se podrn asociar diferentes
espacios muestrales a un mismo experimento aleatorio. En efecto, considere-
mos el ejemplo siguiente:
Ejemplo 6.2
Sea el experimento aleatorio consistente en lanzar dos veces una moneda
al aire.
Si deseamos observar las caras y cruces obtenidas en una repeticin del
experimento, entonces el espacio muestral correspondiente, que lo designare-
mos por E, tendr los cuatro puntos siguientes:
E= {(HH), (H1), (TH), (TT)}; H =cara, T =cruz
donde HT, por ejemplo, indica que en el primer lanzamiento ha aparecido cara
y en el segundo cruz.
Pero si en el experimento aleatorio no nos interesan los resultados indivi-
FENMENOS ALEATORIOS Y SUCESOS 301
duales, sino que deseamos observar el nmero de caras en los dos lanzamien-
tos, entonces tendremos un segundo espacio muestral E
1
:
E
1
= {0, 1, 2}
donde 1, por ejemplo, indica que se ha obtenido solamente una cara en los
dos lanzamientos.
Luego hemos visto que un experimento aleatorio puede tener diferentes
espacios muestrales, dependiendo de la,observacin que nos interese del expe-
rimento. En este ejemplo concreto existe una correspondencia entre los puntos
de ambos espacios muestrales, as pues:
E
1
-+E
O-+ (TT)
1 -+ (HT), (TH)
2 -+(HH)
Los espacios muestrales asociados a un experimento aleatorio pueden ser
de tres clases:
- Espacio muestral finito.
- Espacio muestral infinito numerable.
- Espacio muestral continuo.
Veamos en qu consiste cada uno de ellos .
Espacio muestra) finito
Un espacio muestral diremos que es finito, cuando tiene un nmero finito
de elementos. Por ejemplo, los espacios muestrales asociados a los experimen-
tos aleatorios descritos en los ejemplos 6.1 y 6.2.
Espacio muestra) infinito numerable
Un espacio muestral ser infinito numerable si tiene un nmero infinito
numerable de elementos; o dicho de otra forma, si se puede establecer una
aplicacin biyectiva entre los elementos del espacio muestral y la sucesin
de nmeros naturales.
Tambin se suele llamar espacio muestra) discreto indistintamente a los
casos finito e infinito numerable.
302
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ejemplo 6.3
Sea el experimento aleatorio consistente en lanzar un ~ a hasta que s ~ a
obtenido el 1, y que estamos interesados en todas las postbtlidades, es dectr,
el 1 puede ser obtenido en el primer lanzamiento, o bien en el segundo
lanzamiento pero despus de haber obtenido un 2, o un 3, o un 4, ? un 5, o
un 6, o bien en el tercer lanzamiento pero despus de haber obtemdo (2, 2),'
(2, 3), (2, 4), (2, 5) o (2, 6), etc.
El espacio muestra! ser:
E= {(1),
(2, 1), (3, 1), (4, 1), (5, 1), (6, 1)
(2, 2, 1), (2, 3, 1), (2, 4, 1), (2, 5, 1), (2, 6, 1),
(3, 2, 1), (3, 3, 1), (3, 4, 1), (3, 5, 1), (3, 6, 1),
(4, 2, 1), (4, 3, 1), (4, 4, 1), (4, 5, 1), (4, 6, 1),
.....................................................................................
(2, 2, 2, 1), (2, 2, 3, 1), (2, 2, 4, 1), (2, 2, 5, 1), (2, 2, 6, 1), ............... }
Si el experimento aleatorio consiste eri lanzar el dado hasta que aparezca
e11, o sea, que puede aparecer el 2, 3, 4, 5 6 pero no el 1, entonces el espacio
muestra! correspondiente sera:
El = {(1), (1, 1), (1, 1, 1), (1, 1, I, 1), (1, 1, 1, 1, 1), ... }
en donde por 1 representamos cualquier nmero diferente al l.
Pero los elementos del espacio muestra! E, nos estn indicando el nmero
de lanzamientos que podemos hacer con el dado antes de que nos aparezca
el 1, por tanto podremos establecer una correspondencia con la sucesin de
nmeros naturales y tendremos este otro espacio muestra! E2
E
2
= {1, 2, 3, 4, 5, 6, 7, 8, ... }
cuyos elementos nos indican el nmero de tiradas para que aparezca el 1 por
primera vez.
Los espacios muestrales obtenidos en este ejemplo son infinitos numerables
o simplemente numerables.
Espacio muestral continuo
Si el espacio muestra! tiene un nmero infinito no numerable de elementos,
diremos que es de tipo continuo. Es decir, si no se puede establecer una
correspondencia biunvoca entre los elementos del espacio muestra! Y la suce-
sin de nmeros naturales.
FENMENOS ALEATORIOS Y SUCESOS 303
Ejeinplo 6.4
Supongamos que el experimento aleatorio consiste en tirar una bola muy
perfecta sobre el suelo totalmente pulido y horizontal de una habitacin y
estamos interesados en la posicin que ocupar esa bola sobre la superficie
del suelo. Es evidente pensar que la bola pueda quedarse parada en cualquier
punto de la superficie del suelo, luego el espacio muestra! correspondiente ser:
E = {toda la superficie del suelo de la habitacin}
y es de tipo continuo, no pudiendo establecer correspondencia alguna entre
los puntos de la superficie del suelo de la habitacin y la sucesin de nmeros
naturales.
6.4. Sucesos
En muchos casos cuando realizamos un experimento aleatorio no nos intere-
san, directamente, los resultados elementales del experimento aleatorio, sino que
lo que nos puede interesar es algn subconjunto de esos resultados elementa-
les, es decir un conjunto contenido en el espacio muestral. Por ejemplo, en el
caso del lanzamiento de un dado nos puede interesar saber si el resultado ha
sido un nmero impar, que ocurrir si al realizar el experimento aleatorio ha
aparecido 1, 3 5, es decir, nos interesa el subconjunto A = {1, 3, 5} del espacio
muestra! E = {1, 2, 3, 4, 5, 6}. A tales subconjuntos se les llaman sucesos.
Luego un suceso S es un subconjunto del espacio muestra!, es decir, un
subconjunto de resultados elementales del experimento aleatorio. Y diremos
que ocurre o se presenta el suceso, cuando al realizarse el experimento aleatorio
da lugar a uno de los resultados elementales pertenecientes al subconjunto que
define el suceso.
Podemos considerar cuatro tipos de sucesos, segn el nmero de elementos
que entren a formar parte del suceso:
a) Suceso elemental, suceso simple o punto muestral es cada uno de los
resultados posibles del experimento aleatorio; luego un suceso elemen-
tal consta de un solo elemento del espacio muestra! E. Es decir los
sucesos elementales son subconjuntos del espacio muestra! formados
por un solo elemento.
b) Suceso compuesto, es el que consta de dos o ms sucesos elementales.
e) Suceso seguro, cierto o universal, es el que consta de todos los sucesos
elementales del espacio muestra! E, es decir, coincide con el espacio
muestral E, por ello lo notaremos tambin por E.
304
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
A este suceso se le llama seguro o cierto porque ocurre siempre, ya
que al realizar el experimento aleatorio se obtendr con seguridad uno
de los posibles resultados o sucesos elementales de E, y por tanto
ocurrir E.
d) Suceso imposible, es el que no tiene ningn elemento del espacio mues-
tra! E, y por tanto no ocurrir nunca. Lo notaremos por c/J.
Ejemplo 6.5
Supongamos el experimento aleatorio de lanzar un dado al aire y observar
el nmero que aparece.
El espacio muestral ser el formado por todos los posibles resultados, o
sea, que aparezca 1, 2, 3, 4, 5 6 6, y lo indicaremos como
E = {1, 2, 3, 4, 5, 6}
Algunos posibles sucesos sern:
A
1
= que aparezca el 1 = {1}
A
2
= que aparezca el 2 = {2}
A
3
=que aparezca el 3 = {3}
A
4
=que aparezca el4 = {4}
As = que aparezca el 5 = {5}
A
6
=que aparezca el 6 = {6}
A
1
= que aparezca nmero par = {2, 4, 6}
A
8
= que aparezca un nmero menor que 3 = {1, 2}
A
9
=que aparezca un nmero mayor que 4 = {5, 6}
A
10
= que aparezca un nmero mayor que 6 = 4J
etc.
Los sucesos A
1
, A
2
, A
3
, A
4
, As, A
6
son simples, pues constan de un solo
elemento o resultado posible del experimento.
El suceso A
1
, ocurrir si ocurre el suceso A
2
, A4 o A6, o sea, si aparece
un 2, un 4 6 un 6, luego ser un suceso compuesto, pues consta de dos o ms
sucesos elementales.
Anlogamente los sucesos A
8
y A
9
son compuestos.
El suceso A
10
sera el suceso imposible, pues no tiene ningn elemento del
FENMENOS ALEATORIOS Y SUCESOS 305
espacio muestral, por tanto no ocurrir nunca, pues no es posible obtener un
nmero mayor que 6 en el lanzamiento del dado.
Ejemplo 6.6
Consideremos un experimento aleatorio que consiste en lanzar tres veces
una moneda al aire. Si realizamos una vez el experimento y deseamos observar
las caras y cruces obtenidas, entonces el espacio muestral correspondiente ser
el formado por todos los posibles resultados:
E= {(HHH), (HH1), (HTH), (THH), (HTI), (TH1), (ITH), (TTI)}
donde, por ejemplo, el resultado (HTH) significa que en el primer lanzamiento
ha aparecido cara, en el segundo cruz y el tercero cara.
Sern posibles sucesos, por ejemplo, los siguientes:
A
1
= {(HHT), (THH), (THT)}
A
2
= {(HHH), (TTH)}
A
3
= {(HTH), (THH), (TTH)}
A
4
= {(THH)}
en donde los sucesos A
1
, A
2
y A
3
son compuestos ya que constan de dos o
ms elementos, el suceso A
4
es simple o elemental, y el suceso cierto o seguro
sera el propio espacio muestral E, pues contiene todos los posibles resultados
del experimento.
Sin embargo, si consideramos el suceso A que incluye el resultado (HHTT),
tendremos que
A=cp
sera un suceso imposible, en este experimento aleatorio, ya que estamos con-
siderando tres lanzamientos de una moneda al aire, y como vemos no contiene
ningn elemento o resultado de los incluidos en el espacio muestral E, siendo
por tanto imposible que se verifique un suceso cuyos elementos no pertenecen
al espacio muestral E.
6.5. Operaciones con sucesos
Con los sucesos operaremos de manera similar a como lo hacamos con
los conjuntos y las operaciones se definen de manera anloga.
306 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Los sucesos que consideramos, evidentemente, sern los correspondientes
a un experimento aleatorio y por tanto sern subconjuntos del ,espacio mues-
tra! E.
Suceso contenido en otro
Dados dos sucesos A y B de un experimento aleatorio, diremos que el
suceso A est contenido en B, y lo indicaremos por A e B, si cada suceso
elemental perteneciente a A pertenece tambin a B, es decir si siempre que
ocurre el suceso A, tambin ocurre el suceso B.
Considerando el experimento aleatorio del lanzamiento de un dado, si
designamos por:
A= que aparezca el 2 el 4 = {2, 4}
B = que aparezca un }lmero par = {2, 4, 6}
el suceso A e B, pues los resultados o. sucesos elementales 2 y 4 de A, perte-
necen a B.
Diremos tambin que A implica a B y lo denotaremos por A => B.
Igualdad de sucesos
Dados dos sucesos A y B, diremos que son iguales, si siempre que ocurre
el suceso A tambin ocurre el suceso B, y siempre que ocurre el suceso B
ocurre el suceso A, y lo indicaremos por A = B. Es decir se verifica:
A=B <o>
AeB}
Be A
Sean los sucesos:
A= obtener un nmero par al lanzar un dado= {2, 4, 6}
B = obtener un mltiplo de 2 = {}
aqu se verifica que:
luego A= B.
A e B pues siempre que ocurre A ocurre B,
Be A pues siempre que ocurre B ocurre A,
FENMENOS ALEATORIOS Y SUCESOS 307
Unin de sucesos
Dados dos sucesos A y B, se define la unin de ambos sucesos A y B,
como otro suceso, que indicaremos por A u B, compuesto por los resulta-
dos o sucesos elementales pertenecientes a A, o a B, o a los dos a la vez, as
pues:
A u B = al suceso que se presenta cuando A B, o ambos ocurren.
Grficamente lo representaremos utilizando el diagrama de Venn, como se
ve en el grfico 6.1.
E
A u B = zona sombreada
GRFICO 6.1. Unin de sucesos.
Sean los sucesos:
A = obtener, en el lanzamiento de un dado, un nmero impar = {1, 3, 5}
B =obtener, con el lanzamiento de un dado, un nmero mayor que 4 = {5, 6}
el suceso unin ser:
A u B = {1, 3, 5} u {5, 6} = {1, 3, 5, 6}
o sea, obtener un 1, un 3, un 5 un 6 en el lanzamiento del dado.
En general, dados n sucesos A
1
, A
2
, , An, su unin A
1
u A
2
u A
3
u u An
es otro suceso formado por los resultados o sucesos elementales que pertene-
cen al menos a uno de los sucesos A; (i = 1, 2, ... , n).
308 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Anlogamente al caso de dos sucesos, representaremos por
n
U A
1
= al suceso que se presentar cuando al menos
i=l uno de los sucesos A; ocurre.
De manera anloga podramos definir la unin de sucesos para un nmero
infinito numerable o no numerable de sucesos.
Interseccin de sucesos
Dados dos sucesos A y B, se define la interseccin de ambos sucesos A y
B, como otro suceso, que indicaremos por A n B, compuesto por los resultados
o sucesos elementales que pertenecen simultneamente a A y a B, es decir:
A n B = suceso que se presenta cuando A y B ocurren a la vez.
Grficamente aparece en el grfico 6.2:
E
A B
A n B = zona sombreada
GRFICO 6.2. Jntersecci6n de sucesos.
Considerando los dos mismos sucesos que hemos utilizado como ejemplo
en el caso de la unin, ahora, para el caso de la interseccin, tendremos:
A n B = {1, 3, 5} n {5, 6} = {5}
En general, dados n sucesos A
1
, A
2
, ... , A., su interseccin
r
FENMENOS ALEATORIOS Y SUCESOS 309
es otro suceso, formado por los resultados o sucesos elementales que pertene-
cen a todos los sucesos A; (i = 1, 2, ... , n).
Representaremos por
n
n A; = al suceso que se presentar cuando todos los sucesos A
1
i= 1
ocurren.
Sucesos disjuntos, incompatibles o excluyentes
Dados dos sucesos A y B, diremos que son disjuntos, incompatibles o
mutuamente excluyentes si su interseccin A n B = <jJ; es decir, si no tienen
ningn suceso elemental en comn, o bien, dicho de otra forma, si al verificarse
uno de los sucesos no se verifica el otro, o sea, la ocurrencia de uno excluye
la posibilidad de que ocurra el otro.
En el grfico 6.3 tenemos su representacin.
A B
GRFICO 6.3. Sucesos disjuntos.
En el ejemplo que venimos considerando sean los sucesos
A = obtener un nmero par al lanzar un dado = {2, 4, 6}
B =obtener un nmero impar al lanzar un dado= {1, 3, 5}
A n B = {2, 4, 6} n {1, 3, 5} = </J
luego A y B son excluyentes, pues su interseccin es el conjunto o suceso vaco.
310 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Sistema exhaustivo de sucesos
S los sucesos A
1
, A
2
, A
3
, A" son tales que verifican que la unin de
todos ellos
es igual al espacio muestra! E, diremos que forman una coleccin o sistema
exhaustivo de sucesos; y s adems verifican que
A; n Aj = </J, V i # j (i, j = 1, 2, ... , n)
entonces diremos que forman un sistema competo de sucesos o una particin
de E.
En general, dados n sucesos A
1
, A
2
, , A" diremos que son mutuamente
excluyentes, disjuntos o incompatibles dos a dos, s cada pareja de sucesos son
mutuamente excluyentes, es decir, s
A;nAj = </J, Vi =f.j (i,j = 1, 2, ... , n)
S consideramos el conjunto de todos los sucesos elementales que consti-
tuyen un espacio muestra!, podemos decir que forman una coleccin de sucesos
mutuamente excluyentes y exhaustivo, ya que de todos ellos slo debe de
ocurrir uno y no pueden ocurrir dos simultneamente.
Suceso complementario o contrario
Dado un suceso A, se define el suceso complementario o contrario de A,
como otro suceso que ocurre cuando no ocurre el suceso A. O bien, es el
suceso constituido por los sucesos elemel!!_ales del espacio muestra! E que no
pertenecen a A. Lo representaremos por A.
En el grfico 6.4 tenemos su representacin.
Si consideramos el suceso
A= obtener, en el lanzamiento de un dado, un nmero par.= {2, 4, 6} ,
el suceso complementario ser:
A= {1, 3, 5} =obtener en el lanzamiento de un dado un nmero impar.
Los sucesos A y A constituyen tambin un sistema completo de sucesos.
FENMENOS ALEATORIOS Y SUCESOS 311
A = zona sombreada
GRFICO 6.4. Suceso complementario.
Diferencia de sucesos
Dados dos sucesos A y B, se define la diferencia de ambos sucesos A y B,
que representaremos por A - B, como otro suceso constituido por los sucesos
elementales que pertenecen a A y no pertenecen a B. Se puede expresar:
A-B=AnB
Anlogamente
B-A=BnA
Observemos que
A-B=f.B-A
Sus representaciones aparecen en el grfico 6.5.
Diferencia simtrica de sucesos
Dados dos sucesos A y B, se define la diferencia simtrica de ambos sucesos
A y B, que la representaremos por A ti B, como otro suceso constituido por
los sucesos elementales que pertenecen a A, o a B pero que no pertenecen
simultneamente a ambos.
312 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
E
B
A - B = zona sombreada
E
A
B- A = zona sombreada
GRFICO 6.5. Diferencia de sucesos.
La representacin grfica de la diferencia simtrica de sucesos aparece en
el grfico 6.6.
E
A B = zona sombreada

GRFICO 6.6. Diferencia simtrica de sucesos.
FENMENOS ALEATORIOS Y SUCESOS 313
Como ejemplo, consideremos los siguientes sucesos:
A = obtener, en el lanzamiento de un dado, un 1, un 2 un 4 = {1, 2, 4}
B = obtener, en el lanzamiento de un dado, un 2, un 5 un 6 = {2, 5, 6}
la diferencia simtrica ser:
A .1. B = (A n B) u (B nA) = ({1, 2, 4} n {1, 3, 4}) u ({2, 5, 6} n {3, 5, 6}) =
= {1, 4} u {5, 6} = {1, 4, 5, 6}
efectivamente, el suceso que nos da la diferencia simtrica est constituido por los
sucesos elementales que pertenecen a A B pero no a la interseccin de ambos.
6.5. l. Propiedades de las operaciones
con sucesos
Los sucesos asociados a un experimento aleatorio verifican las siguientes
propiedades:
l. E = </J, </J = E, A = A
2. . E u A = E, </J u A = A, A u A = E,
E nA = A, <P n A = </J, A n A = </J,
3. Propiedad idempotente
4. Propiedad conmutativa:
5. Propiedad asociativa:
AuA=A
AnA=A
AuB=BuA
AnB=BnA
A
1
u (A
2
u A
3
) = (A
1
u A
2
) u A
3
A
1
n (A
2
n A
3
) = (A
1
nA
2
) nA
3
6. Propiedad distributiva:
A
1
u (A
2
n A
3
) = (A
1
u A
2
) n (A
1
u A
3
)
A
1
n (A
2
u A
3
) = (A
1
n A
2
) u (A
1
n A
3
)
7. Propiedad simplificativa:
Au(AnB) =A
An(AuB)=A
314
CASAS-SNCHEZ, J. M. y SANTOS-PE"AS, J.
8. Leyes de Morgan:
(A u B) = A n B; en general

A;) = iQl A;
(AnB) = AuB; en general ( A;)=

A;
Ejemplo 6.7
Sean A
1
, A
2
y A
3
tres sucesos del espacio E de un
aleatorio. Expresar las siguientes afirmaciones utlhzando los sucesos antena-
res.
l. Los tres sucesos ocurren.
2. Ninguno de los tres sucesos ocurre.
3. Exactamente uno de los sucesos ocurre.
4. Exactamente dos de los sucesos ocurren.
5. Ocurre A
2
o A
3
pero no A
1
.
6. Ocurre A
1
, y A
2
o A
3
pero no ambos.
Teniendo en cuenta los conceptos anteriores tendremos:
1. Los tres sucesos ocurren, o sea ocurre el A
1
, el A
2
y el A3, lo expresa-
remos por la interseccin:
2. Ninguno de los tres sucesos ocurre
Al l A2 l A3 = (Al u A2 u A3)
3. Exactamente uno de los sucesos ocurre, o sea, puede ocurrir el suceso
A
1
, pero ni el A
2
ni el A
3
, o bien ocurrir el A
2
, pero ni A1 ni el A3, 6
tambin puede ocurrir el A
3
, pero ni el A
1
ni el A
2
, y lo expresaremos
como:
4. Exactamente dos de los sucesos ocurren, o sea, puede ocurrir los
sucesos A
1
y A
2
pero no A
3
, o bien ocurrir el A
1
y eLA
3
pero no A2,
o tambin A
2
y A
3
pero no A
1
, y lo expresaremos como:
{(A l A2) l A3) u {(A l A3) l A2} u {(A2 l A3) l A}
5. El suceso que ocurra A
2
o A
3
pero no el A
1
lo expresaremos como:
FENMENOS ALEATORIOS Y SUCESOS 315
6. El suceso que ocurra A
1
, y A
2
o A
3
pero no ambos simultneamente
lo expresaremos como:
6.6. Sucesiones de sucesos
Llamaremos sucesin de sucesos, a una familia de sucesos A
1
, A
2
, A
3
, ... en
la que los sucesos aparecen ordenados por el subndice n. La representaremos
por {An}, n = 1, 2, 3, ...
Sucesin creciente
Una sucesin de sucesos {An} diremos que es creciente si se verifica:
y la representaremos por {An j}.
Sucesin decreciente
Una sucesin de sucesos {An} diremos que es decreciente si se verifica:
y la representaremos por {An!}.
Lmite de una sucesin
Si tenemos una sucesin creciente {An j} el lmite ser:
00
lm An = U An
n-J.oo n==l
y si tenemos una sucesin decreciente el lmite ser:
00
lm An = n An
n-too n=l
316
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Ms generalmente, para cualquier sucesin de sucesos {An} defmimos los
lmites inferior y superior:
A0 = lm inf An = "
1
(Dn A k)
A
0
= lm sup An = nol (Qn Ak)
Veamos qu significado tienen estos sucesos:
A
0
= lim inf An = lJ ( rl Ak) =
1
= (A
1
11 A
2
11 A
3
... )u (A
2
11 A
3
11 A
4
.)u (A
3
11 A
4
11 As ... ) u ...
Si tenemos un resultado o suceso elemental s E A
0
, esto implicar que el
suceso elemental s pertenecer a uno de los parntesis de la expresin anterior,
lo cual implica tambin que pertenece a la infinidad de sucesos Ak
quiz a un nmero fmito. As pues si perteneciera por primera vez al tercer
parntesis, ello significara que pertenece a los sucesos A
3
, A
4
, As, ... excepto
a los sucesos A
1
y A
2
.
Luego el lmite inferior A
0
de la sucesin es un suceso constituido por los
resultados o sucesos elementales que pertenecen a todos los sucesos de la
sucesin excepto quiz a un nmero fmito de sucesos.
Anlogamente
A
0
= lm sup An = nol (Qn Ak) =
= (A
1
u A
2
u A
3
... ) 11 (A
2
u A
3
u A
4
... ) 11 (A
3
u A
4
u As ... ) 11 ...
si tenemos un resultado o suceso elemental sE A
0
, esto implicar que el suceso
elemental s pertenecer a toda la infmidad de los parntesis de la expresin
anterior, y por tanto a una infinidad de sucesos Ak.
As pues diremos que el lmite superior A
0
de la sucesin es un suceso
constituido por todos los resultados o sucesos elementales que pertenecen a
una infinidad de sucesos de la sucesin.
En el supuesto de que se verifique:
A
0
= lm inf An = lm sup An = A
0
=A
diremos que la sucesin es convergente, y se suele expresar como:
An -+ A, o lim An = A
n-+ oo
FENMENOS ALEATORIOS Y SUCESOS 317
;
6. 7. Algebra de sucesos
Como hemos venido observando los sucesos los consideramos como con-
juntos, siendo vlido para los sucesos todo lo estudiado en la teora de
conjuntos, con la siguiente tabla de correspondencias:
Teora de sucesos
-Suceso.
- Suceso elemental.
- Suceso seguro o espacio muestral.
- Sucesos incompatibles.
- Suceso contrario.
- Suceso imposible.
- Unin de sucesos.
- Interseccin de sucesos.
- Un suceso A implica a B.
Teora de conjuntos
- Subconjunto del conjunto universal.
- Punto del conjunto universal.
- Conjunto universal.
- Conjuntos disjuntos.
- Conjunto complementario.
- Conjunto vaco.
- Unin de conjuntos.
- Interseccin de conjuntos.
- El conjunto A est contenido en B.
Para llegar a la construccin axiomtica del Clculo de Probabilidades, .
necesitamos dar unas estructuras algebraicas bsicas construidas sobre los
sucesos de la misma manera que se construan sobre los conjuntos.
Llamaremos coleccin de conjuntos a un conjunto cuyos elementos son
conjuntos. As pues el conjunto de las partes de E, Sil = W>(E), que es el
conjunto formado por todos los subconjuntos de E, o por todos los sucesos
contenids en el espacio muestra} E, ser una coleccin de conjuntos o sucesos.
Luego una coleccin de sucesos es un conjunto cuyos elementos a su vez son
conjuntos o sucesos.
Para llegar a la estructura de lgebra de Sucesos o lgebra de Boole,
partimos de una coleccin d: sucesos, Sil= W'(E), entre cuyos elementos tene-
mos definidas las operaciones:
- unin de sucesos,
- interseccin de sucesos, y
- complementario de un suceso,
que adems, verifican las propiedades que indicamos al exponer las operacio-
nes con sucesos.
Diremos que la coleccin de sucesos, d, no vaca, tiene estructura de
lgebra de Sucesos o lgebra de Boole, si Sil es una clase cerrada frente a las
operaciones de complementario, unin e interseccin de sucesos en nmero
finito, es decir si se verifican las condiciones siguientes:
I. V A E Sil se verifica que su complementario AE d.
II. V A
1
, A
2
E Sil se verifica que A
1
u A
2
E d.
318
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Estas dos condiciones son suficientes para definir el lgebra de Sucesos,
pues la condicin 1, nos pone de manifiesto que la operacin complementaria
de un suceso es cerrada, ya que si un suceso pertenece a la coleccin de suce-
sos .sfl, tambin pertenece a ella su complementario. Anlogamente la condi-
cin 11, indica que la operacin unin de sucesos es cerrada, pues si dos
sucesos pertenecen a stl, tambin pertenecer el suceso unin.
Lo relativo a que la interseccin sea cerrada y que el nmero de sucesos
sea finito se obtiene como consecuencia de las condiciones anteriores, como
ahora indicaremos.
De las dos condiciones anteriores, se deducen las siguientes consecuencias:
l. El espacio muestral E E stl.
En efecto, sea un suceso A E stl entonces:
por la condicin 1 se verifica que AE stl_;_
por la condicin 11 se verifica que A u A E stl,
pero A u A = E, luego E E stl
2. Si los sucesos A y B E stl, se verifica que A n B E stl.
En efecto, como A, B E stl,
por la condicin 1 se verifica que A_ E sf!.:. y B E stl;
por la condicin 11 se verifica que A u B E stl;
de nuevo, en virtud de la condicin 1:
(A u B) E stl
pero segn las leyes de Morgan:
(A u B) = A n B = A n B E stl
3. El suceso imposible, c/J E stl.
La demostracin es anloga a la consecuencia l.
4. Si los sucesos A
1
, A
2
, A
3
, ... , A. E stl se verifica que
n
A
1
u A
2
u A
3
u u A.= U A E stl
i=l
n
A
1
n A
2
n A
3
n nA.= n A E stl
i= 1
Para demostrar esto, bastar aplicar sucesivamente la condicin 11 y
la consecuencia 3, respectivamente.
Lo cual prueba que, efectivamente, las operaciones unin e interseccin de
un nmero finito de sucesos son cerradas.
FENMENOS ALEATORIOS Y SUCESOS 319
Si hacemos la extensin al caso de un nmero infinito numerable de
sucesos, ent,onces nos aparece una nueva estructura algebraica que recibe el
nombre u-Algebra o Campo de Borel.
Diremos que ~ conjunto o coleccin de sucesos no vaco, stl = \P(E), tiene
estructura de u-Aigebra o Campo de Borel, si se verifican las dos condiciones
siguientes:
l. Si V A E stl se verifica que su complementario A E stl.
11. Si V A
1
, A
2
, A
3
, ... E stl se verifica que
00
A
1
u A
2
u A
3
u = U A E stl
i=l
Aplicando las Leyes de Morgan tambin se deduce que la interseccin de
un nmero infinito numerable de sucesos pertenecientes a stl, tambin perte-
nece a stl.
Antes de concluir este apartado hemos de indicar que cuando el espacio
muestral E es finito todos los subconjuntos de E se pueden considerar como
sucesos. Pero esto no ocurre cuando el espacio muestra! es infinito, pues en
este caso es muy difcil considerar el conjunto formado por todos los subcon-
juntos posibles, existiendo subconjuntos que no pueden considerarse como
sucesos. Por ello nos vamos a referir a espacios muestrales finitos o infinitos
numerables en donde no tendremos dificultad para fijar los sucesos.
En el caso de un espacio muestral finito nos basaremos en la estructura de
lgebra de Boole, en donde podemos realizar las operaciones de unin, inter-
seccin y complementario de sucesos, teniendo la certeza de que son opera-
ciones cerradas, es decir que nos darn sucesos pertenecientes al conjunto o
coleccin stl
1
.
Si el espacio muestra! es infmito numerable entonces recurriremos a la
estructura de u-lgebra o Campo de Borel, en donde las operaciones de unin,
interseccin y complementario de sucesos son cerradas aplicndolas una infi-
nidad numerable de veces, es decir dan sucesos que pertenecen a la misma
coleccin de sucesos stl.
Resumiendo podemos decir que a partir del espacio muestral E hemos
llegado a definir la coleccin de sucesos stl que tiene la estructura de lgebra
de Sucesoso lgebra de Boole si el espacio muestra! es finito, o bien tiene la
estructura de u-lgebra si el espacio muestral es infinito.
Al par (E, stl) en donde E es el espacio muestra! y stl, una u-lgebra, sobre
E, le llamaremos espacio o conjunto medible, en el cual ser posible establecer
una medida o probabilidad, como despus veremos.
1
Se puede demostrar gue toda lgebra de Boole construida sobre un espacio muestra! de
dimensin flnita es una a-Algebra.
ll
1
r
il

'
l
11
li
d .

320 CASAS-SNCHEZ, J. M. y SANTOS-PE'I'IAS, J.
6.8. Mtodos de enumeracin o conteo
En este apartado daremos algunas tcnicas tiles para contar el nmero
de resultados o sucesos de un experimento aleatorio, que despus sern de
gran aplicacin para resolver ejercicios y problemas de probabilidades.
6.8.1. Tablas de doble entrada
La tabla de doble entrada, como su propio nombre indica, es til para
relacionar dos pruebas, indicndonos los resultados que integran el espacio
muestral al realizar los correspondientes experimentos, pudiendo indicar sobre
la tabla determinados sucesos en los que estemos interesados.
Ejemplo 6.8
Consideremos el experimento aleatorio consistente en lanzar dos dados al
aire. La correspondiente tabla de doble entrada sera:
1
2
3
4
5
6
2
1 2
* *
3 4
* *
5
*
6
*
*
*
*
*
*
en donde los asteriscos representan los resultados posibles, que en este caso
son 36 parejas, cuya primera componente es la de la columna marginal y la
segunda componente es la fila marginal.
Cuando estemos interesados en algn resultado concreto, por ejemplo,
nmero de resultados o sucesos elementales en los que aparece una pareja que
sume 6, no tenemos nada ms que observar los valores marginales y
FENMENOS ALEATORIOS Y SUCESOS
321
los cinco resultados que aparecen dentro de la regin recuadrada,
0
bten observando dentro de la tabla las parejas que sumen 6.
En generaL con m elementos a
1
, a
2
, a
3
, , a y n elementos b b b b
. m 1' 2' 3, ... , n'
es posible formar m n pares, (a,, b.) tales que cada par tiene al menos algn
elemento diferente de cada grupo.
6.8.2. Principio de multiplicacin
Si tenemos los conjuntos e
1
, e
2
, . , ek, que tienen respectivamente
n, n2, ... , nk elementos podemos formar en total n
1
n
2
. n
3
..... nk,
donde en cada k-upla el primer elemento pertenece a e ' el segundo a e el
t e 1
'1 . 1 2
ercero a
3
.. y e u timo a ek.
En el caso particular de que n
1
= n
2
= = nk = n, el nmero posible
de k-uplas ser nk. As pues en el ejemplo anterior del lanzamiento de
dos dados al aire el nmero de posibles parejas hemos visto que ha sido
6
2
= 36.
Este principio es de utilidad en el caso de un experimento aleatorio
puesto por otros k experimentos aleatorios. En efecto, sea E el espacio mues-
tra} correspondiente al experimento aleatorio compuesto y sean E E E
1 k . ' , 2' ... , k
os muestrales a los experimentos que integran el
expenmento. compuesto, siendo n
1
, n
2
, ... , nk el nmero de posibles resultados
de los espaCios muestrales E
1
, E
2
, , Ek, respectivamente entonces el nmero
de posibles resultados para el espacio muestral E ser n:. n
2
..... nk.
6.8.3. Diagramas de rbol
. Este diagrama nos permite indicar de manera sencilla el conjunto de po-
sibles resultados en un exprimento aleatorio, siempre y cuando los resultados
del experimento puedan obtenerse en diferentes fases sucesivas. Para ello
bastar con seguir todos los recorridos posibles del diagrama de rbol.
Ejemplo 6.9
Sea el experimento aleatorio compuesto consistente en lanzar al aire un
dad_o y despus tres veces consecutivas una moneda, de manera que un
posible resultado de este experimento aleatorio recoger el resultado del
dado y los resultados posibles del lanzamiento de la moneda. El espacio
muestral correspondiente tendr 6 2 2 2 = 48 resultados posibles, segn el
principio de multiplicacin.
322 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
El diagrama de rbol correspondiente ser:
Tirada Primera tirada Segunda tirada
del de de
dado moneda moneda
H
H
T
H
T
T
H
H
T
2
T
H
H
T
6
H
T
T
Tercera tirada
de
moneda
H
T
H
T
H
T
H
T
H
T
H
T
H
T
H
T
H
T
H
T
H
T
H
T
FENMENOS ALEATORIOS Y SUCESOS
El espacio muestral ser:
E = {(1, H, H, H), (1, H, H, T), (1, H, T, H), (1, H, T, T)
(1, T, H, H), (1, T, H, T), (1, T, T, H), (1, T, T, T)
(2, H, H, H), (2, H, H, T), (2, H, T, H), (2, H, T, T)
(2, T, H, H), (2, T, H, T), (2, T, T, H), (2, T, T, T)
(3, H, H, H), (3, H, H, T), (3, H, T, H), (3, H, T, T)
(3, T, H, H), (3, T, H, T), (3, T, T, H), (3, T, T, T)
(4, H, H, H), (4, H, H, T), (4, H, T, H), (4, H, T, T)
(4, T, H, H), (4, T, H, T), (4, T, T, H), (4, T, T, T)
(5, H, H, H), (5, H, H, T), (5, H, T, H), (5, H, T, T)
(5, T, H, H), (5, T, H, T), (5, T, T, H), (5, T, T, T)
(6, H, H, H), (6, H, H, T), (6, H, T, H), (6, H, T, T)
(6, T, H, H), (6, T, H, T), (6, T, T, H), (6, T, T, T)}
que efectivamente tiene 48 sucesos.
6.8.4. Combinaciones, variaciones
y permutaciones
Combinaciones
323
Llamaremos combinaciones de m elementos tomados de n en n, al nmero
de subconjuntos den elementos que se pueda formar con los m elementos del
conjunto inicial; de manera que dos subconjuntos sern distintos si difieren,
al menos, en uno de sus elementos. Las representaremos por:
e = e = (m) = m( m - 1)(m - 2)
00
o (m - n + 1) = __ m_!_
m,n m n n! n!(m- n)!
Las diferentes combinaciones n-arias que se pueden formar a partir de m
elementos, van a diferir, unas de otras, por lo menos en un elemento, es decir
los diferentes subconjuntos se diferenciarn por lo menos en un elemento.
Combinaciones con repeticin
Si en los subconjuntos anteriormente formados se pueden repetir los ele-
mentos entonces tenemos las combinaciones con repeticin. Es decir, a partir
de los m elementos, formamos subconjuntos de n elementos, tales que dos
de sus elementos, tres, cuatro, ... , hasta n elementos, pueden ser el mismo.
El nmero total de subconjuntos de este tipo sern las combinaciones con
i
,
i
]
324 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
repeticin, que las representamos por:
C' = C'" = (m+ n - 1) = (m+ n - 1)!
m, n m n n!(m- 1)!
Variaciones
Dado un conjunto de m elementos, llamaremos variaciones de orden n, a
los distintos subconjuntos que se pueden formar con los m elementos, tomados
den en n; de manera que dos subconjuntos sern distintos si difieren, bien en
algn elemento, o bien en el orden de colocacin cuando tienen los mismos
elementos. Los representaremos por:
m!
V. =m (m- 1) (m- 2) ... (m- n + 1) = ( )'
m,n m-n.
Variaciones con repeticin
Si en los subconjuntos anteriores se pueden repetir los elementos, o sea, que
dos de sus elementos, tres, cuatro, ... hasta los n elementos pueden ser el mismo,
entonces tenemos las variaciones con repeticin, que las representaremos por:
Permutaciones
V' =m"
m,n
Llamaremos permutaciones de orden n, a las distintas ordenaciones que se
pueden obtener con los n-elementos, tomados de n en n; de manera que dos
permutaciones formadas a partir de los mismos elementos slo se diferenciarn
en el orden de colocacin de sus elementos. Las representaremos por:
P.= n! = 123 ... (n- 1)n
Permutaciones con repeticin
Las permutaciones de n elementos, k-distintos, de los cuales uno se repite
x
1
veces, otro se repite x
2
veces, etc., de manera que x
1
+ + xk = n reciben
el nombre de permutaciones con repeticin de n elementos. Las representamos
' ..
por:
n!
px1. xz, ... , Xk = -----
" xl!x2! ... xk!
donde
Ejercicios
l. Una empresa contrata hombres y mujeres que podemos clasificar en
menores o mayores de 25 aos. Expresar los cinco sucesos que corresponden
al perftl de contratado:
a) Hombre contratado.
b) Menor de 25 aos.
e) Mujer mayor de 25 aos.
) Hombre mayor de 25 mujer menor de 25 aos.
e) Mujer mayor de 25 aos y hombre menor de 25 aos.
Soluci6n:
a) Podemos denotar A al suceso {hombre contratado}.
b) Llamando B al suceso {menor de 25 aos contratado}, el suceso pedido
es: B.
e) AnB = AuB
) (A n B) u (A n B) = ~ B
e) (A n B) n (A n B) = ifJ
2. Un sistema productivo requiere, para su funcionamiento, el trabajo de
produccin y de control de calidad. De hecho, trabajan 2 productores, aunque
con uno solo de ellos se puede producir, y 1 controlador de calidad. Se pide
caracterizar los sucesos:
a) Un da se produce.
b) Un da se controla la calidad.
e) Un da funciona el sistema productivo (produce y controla).
) Un da se produce, pero no se controla la calidad.
e) Un da no se produce ni se controla.
f) Un da slo se produce o slo se controla.
326 CASAS-SNCHEZ, J. M. y J.
Solucin:
Sean los sucesos:
Suceso P
1
: el productor 1 acude al trabajo un da.
Suceso P
2
: el productor 2 acude al trabajo un da.
Suceso C: el controlador acude al trabajo un da.
Con esta notacin de los sucesos P
1
, P
2
y C, los sucesos pedidos son:
a) P
1
uP
2
b) e
e) (P
1
uP
2
) n C
d) (P
1
uP
2
)n C = (P
1
uP
2
)- C
e) P
1
nP
2
nC=(P
1
uP
2
uC)
f) [(P
1
u P 2) n CJ u [(P 1 u P 2) n C] = (P t u P 2) A C
3. En una empresa hay 2 subdirectores ncionales y 1 subdirector extranjero.
De entre ellos (los tres subdirectores) se promociona uno a director. La em-
presa dispone de tres directores, 2 nacionales y 1 extranjero, a los cuales se
aade el director promocionado. Obtener un sistema completo de sucesos del
subdirector promocionado; tambin, un sistema completo de los directores
resultantes.
Solucin:
Sistema completo de sucesos: s. y s. (subdirector nacional y subdirector
extranjero).
Sistema completo de sucesos: D. y D. (director nacional y director
extranjero).
4. Sean los sucesos:
S
1
: Se lanzar al mercado un nuevo producto.
S
2
: Habr crecimiento econmico nacional.
S
3
: Se contratar a ms empleados en la empresa.
Los tres referidos a una fecha futura. Determinar el suceso S, consistente
en que se den dos de ellos exactamente.
Solucin:
FENMENOS ALEATORIOS Y SUCESOS
5. En el ejercicio anterior, determinar los sucesos:
a) Sa: No se da ninguno de los sucesos S
1
, S
2
y S
3
.
b) Sb: Se da uno exactamente.
e) Se: Se dan los tres sucesos.
Solucin:
a) Sa = S
1
nS
2
nS
3
= (S
1
uS
2
uS
3
)
b) sb =(S \ s2 \ S3) u {5\ \ s2 \ S3) u {S \ s2 \ S3)
e) Sc=S
1
nS
2
nS
3
.
6. Simplificar los sucesos:
a) [(A n B) u C] n [(B n C) u A] = S
1
b) [(A u B) n CJ nA= S
2
Solucin:
a) S
1
= [(A u C) n (Bu C)] n [(Bu A) n (A u C)] =
= (A u C) n (A u B) n (B u C) =

327
expresado ste ltimo suceso como unin de sucesos incompatibles o disjuntos.
b) s2 = [(A u B) nA] n e= [(AnA) u (B n A)J n e =
= [ <P u {B n A)J n e = (B nA) n e = A n B n c.
7. Una compaa de seguros de automviles, asegura vehculos segn el sexo
del propietario, su edad (inferior a 30 o mayor o igual a esa edad), el tipo de
vehculo (utilitario o de lujo) y la antigedad del vehculo (menos de 3 aos
o de antigedad mayor o igual). Cuntas plizas seran necesarias para
asegurar cualquier caso posible?
Solucin:
Por el principio de multiplicacin los distintos tipos de plizas, son en
nmero: 2 2 2 2 = 2
4
= 16, por haber 2 sexos, 2 intervalos de edad, 2 tipos
de vehculos y 2 tipos de antigedad.
328
CASAS-SNCHEZ, J. M. y SANTOS-PE:t'l"AS, J.
8. Calcular los lmites de las sucesiones de sucesos en forma de intervalos:
a) [n! 1' 1)
b) [O, 1 + 2n 1)
e) [n2 1'
1
+ n ! 1]
Solucin:
a) La sucesin es creciente,
lm [ !
1
, 1) = V [n !
1
, 1) = (0, 1).
n ...... oo n n-1
b) La sucesin es decreciente,
lm [o, 1 +
2

1
) = 0 [o, 1 +
2
n
1
) = [O, 1].
n-+oo n n-1
e) No es creciente ni decreciente,
"'"'[1 1] "'( 1] A
0
= n U -
2
-,1 +-- = n O, 1 +-- =(0, 1].
n=lk=nk+1 k+1 n=l n+1
Como:
' ,
A
0
= A
0
=> lm [-
1
-, 1 + -
1
-] = A
0
= A
0
= (0, 1].
n-+oo n
2
+ 1 n + 1
9. Una lnea de ferrocarril tiene 22 estaciones. Cuntos billetes diferentes
pueden imprimirse con origen y destino distinto?
FENMENOS ALEATORIOS Y SUCESOS 329
Solucin:
El nmero de billetes diferentes que pueden imprimirse con origen y des-
tino distinto ser:
(
22) 22! 2221
v22,2 = c22,2. p 2 = 2 2! = 2! 20! 2! = -2-2 = 22. 21 = 462 tipos de billetes
10. En una divisin de una empresa hay 12 empleados. Cuntos grupos de
tres empleados pueden formarse como jefes, y en cuntos entrar un empleado
concreto?
Solucin:
(
12) 12! 12. 1110
a) cl2,3= 3 =3!9!= 6 =21110=220posiblesgruposde
3 jefes
(
11) 1110
b) C
11
,
2
=
2
= -
2
- = 55 grupos que inclurn a un empleado con-
creto.
11. En el parking de la UNED hay 13 plazas de garaje alineadas para un
Departamento y existen dos plazas de garaje prefijadas para el director y el
subdirector de un Departamento. Si adems hay 11 profesores, de cuntas
formas pueden colocarse sus coches?
Solucin:
P
11
= 11! = 39.916.800 colocaciones
12. Una empresa textil vende sus telas en lotes de 3 rollos. Sabiendo que
dispone de 11 tipos de estampados diferentes, cuntos posibles lotes puede
ofrecer?
Solucin:
C' = (11 + 3 - 1) = (13) = = 13. 12. 11 = 286 lotes
11

3
3 3 10!3! 6
330
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
13. En el ejercicio anterior, cuntos posibles lotes pueden formarse con '2
rollos iguales y 1 de distinto color?
Solucin:
V
11
,
2
= C
11
,
2
P
2
= ( ~ ) 2 = 110 lotes diferentes
14. En el diseo de un parking alineado de 13 plazas, se reservan 2 plazas
grandes para el director y el subdirector, y 11 medianas para los profes?res,
pero ahora pueden ordenarse alineadas arbitrariamente, cuntas postbles
ordenaciones pueden disearse?
Solucin:
11 2
13! d o
P = --= 78 or enacwnes
13 11!2!
15. . Si se disponen seis bombos, que contienen cada uno 5 nmeros diferen-
tes del O al 4 y se extrae un nmero de cada uno de los bombos ordenados
de izquierda a derecha, cuntos boletos pueden salir ordenando los dgitos
extrados en el mismo orden en que se disponen los bombos?
Solucin:
VS.
6
= 5
6
= 15.625 boletos
16. En el ejercicio 13, la empresa textil dispone de 11 tipos de rollos de tela
estampados diferentes. Un lote consiste en 3 rollos. Cuantos lotes puede
ofrecer que incluya un rollo determinado?
Solucin:
(
11 + 2- 1) (12)
C'
11
,
2
=
2
=
2
= 66 lotes.
Captulo 7
Probabilidad
7.1. Introduccin
En el captulo anterior hemos introducido, entre otros, los conceptos de
experimento aleatorio, sucesos, operaciones con sucesos, etc. Indicbamos que
cuando un experimento aleatorio se repite un gran nmero de veces los posibles
resultados tienden a presentarse un nmero muy parecido de veces, lo cual
indica que la frecuencia con que aparece cada resultado tiende a estabilizarse.
El concepto o idea que generalmente se tiene del trmino probabilidad es
adquirido casi de manera intuitiva, siendo suficiente para manejarlo en la vida
corriente. Pero debido a la gran importancia del concepto en s, a la gran
aplicacin y desarrollo que ha recibido en los ms variados campos de la
ciencia (fsica, economa, biologa, etc.) es por lo que se considera imprescin-
dible su estudio, y a l vamos a dedicar este captulo dando la terminologa
y estructura bsica necesaria para poder llegar a dar una teora sobre la
probabilidad.
Ahora nos va a interesar una medida numrica de la posibilidad de que
ocurra un suceso A cuando se realiza el experimento aleatorio. A esta medida
la llamaremos probabilidad del suceso A y la representaremos por P(A).
La probabilidad es una medida sobre la escala O a 1; correspondiendo el
valor cero al suceso imposible, o sea el que no ocurre nunca, y el valor 1 al
suceso seguro. Para los restantes sucesos, daremos una probabilidad compren-
dida entre O y 1, de tal manera que ser tanto ms probable que ocurra un
suceso cuanto mayor sea su probabilidad. As pues, frecuentemente decimos
que el hecho de que ocurra un accidente de automvil es ms probable en
ciertas pocas del ao que en otras.
332 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Hechas estas indicaciones, nos surge la necesidad de dar un concepto de
probabilidad, de tal forma que podamos asignar probabilidades ados diferen-
tes sucesos de un experimento aleatorio. Este concepto de probabilidad no
ser nico, ya que se pueden considerar diferentes enfoques o puntos de vista,
as pues, aqu expondremos el punto de vista objetivo y el subjetivo. Dentro
del enfoque objetivo se puede considerar una definicin clsica o a priori de
la probabilidad y otra frecuentista o a posteriori.
7 .2. Definicin clsica de la probabilidad
Consideremos un experimento aleatorio, cuyo correspondiente espacio
muestral E est formado por un nmero n, finito, de posibles resultados
distintos y con la misma posibilidad de ocurrir {e
1
, e
2
, e
3
, , en}. Entonces si
n
1
resultados constituyen el subconjunto o suceso A
1
, n
2
resultados consti-
tuyen el suceso A
2
, y nk resultados constituyen el suceso Ak de tal manera
que:
y las probabilidades de los sucesos A
1
, A
2
, ... , Ak sern:
Es decir, la probabilidad de cualquier suceso A es igual al cociente entre
el nmero de resultados favorables o resultados que integran el suceso A y el
nmero total de elementos o posibles resultados del espacio muestra! E. Luego
una frmula para calcular la probabilidad de un suceso cuando todos los
posibles resultados tienen la misma probabilidad de ocurrir ser:
Nmero de casos favorables de A
P(A) = -----------,--
Nmero de casos posibles de E
que se conoce con el nombre de regla de Laplace para espacios muestrales
finitos.
Veamos ahora cmo se aplica la regla de Laplace para algn caso concreto.
Supongamos el experimento aleatorio lanzar un dado al aire, en donde
el dado se supone que es perfecto y el lanzamiento totalmente imparcial,
teniendo todos los posibles resultados la misma posibilidad de aparecer; y cuyo
correspondiente espacio muestra! es:
PROBABILIDAD
333
Cada uno de los posibles resultados tendr la misma posibilidad, es decir
todas las caras del dado tienen la misma posibilidad de aparecer y ser un
1/6; siendo este valor la probabilidad de cada uno de los sucesos elementales
que integran el espacio muestra!:
1
P(e
1
) = P(1) = 6
1
P(e
2
) = P(2) = 6
1
P(e
6
) = P(6) = 6
que se interpreta como el cociente entre el nmero de casos favorables para
cada resultado o suceso elemental que es 1, y el nmero total de posibles
resultados que es 6.
Si ahora consideramos un suceso
A = {1, 3, 5} = que aparezca cara impar
la probabilidad del suceso A ser:
P(A) = Nmero de casos favorables = = !
Nmero de casos posibles 6 2
Si el suceso considerado fuera:
A= {5, 6} =que aparezca un resultado mayor que 4
. 2 1
P(A) =- =-
6 3
No siempre resulta tan fcil y directa la aplicacin de la regla de Laplace,
pues los sucesos del espacio muestra! deben ser distintos y tener todos ellos
la misma posibilidad de ocurrir. Supongamos, por ejemplo, que realizamos un
experimento aleatorio que consiste en lanzar al aire dos monedas simultnea-
mente y estamos interesados en conocer la probabilidad de que aparezcan dos
cruces. Para ello empezaramos por obtener los posibles resultados que se
pueden presentar al lanzar las dos monedas al aire que seran:
-Dos caras.
- Dos cruces.
- Una cara y una cruz.
334
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y como uno de estos resultados es el suceso, dos cruces, cuya probabilidad nos
interesa, se podra decir que la probabilidad buscada es 1/3. Pero esto no es
cierto ya que los tres resultados no tienen la misma posibilidad de ocurrir,
pues el resultado cara-cruz puede aparecer tambin como cruz-cara, siendo ,
por tanto el espacio muestra! o conjunto de posibles resultados
E = {HH, HT, TH, TT}
todos distintos con la misma posibilidad de ocurrir. La probabilidad correcta
del suceso, dos cruces, sera 1/4.
Ms concretamente, si consideramos el espacio muestra! finito E= {e1, e2,
... , e.}, para que se pueda aplicar la regla de Laplace es necesario que todos
los sucesos elementales sean equiprobables, es decir:
y como
n
P(E) = P(e;) = 1

resulta que:
1
P(e;) = -, Vi= 1, 2, 3, ... , n
n
y si designamos por A = {e
1
, e
2
, ... , ek} el suceso formado por k sucesos
elementales, siendo k :::;; n, tendremos:
k k nmero de casos favorables
P(A) = L P(e ) = - =

1
i n nmero de casos posibles
Observemos que la probabilidad verifica las siguientes condiciones:
1.0 La probabilidad de cualquier suceso es siempre un nmero no nega-
tivo comprendido entre O y l. En efecto, dicha probabilidad viene
dada por en donde n; es menor que n, y ambos son no negativos.
n
2.0 La probabilidad del suceso seguro, E, vale 1, pues en este caso n; ser
igual a n, ya que el suceso seguro E o espacio muestral contiene todi!
n
los posibles resultados y la probabilidad ser ;; = l. Por la
probabilidad de obtener un resultado inferior a 9 al lanzar un dado
ser l.
Anlogamente la probabilidad del suceso imposible, </J, es cero. Por
ejemplo, la probabilidad de obtener un 8 al lanzar un dado ser cero.
PROBABILIDAD 335
3.
0
La probabilidad de la unin de varios sucesos incompatibles o ex-
cluyentes es igual a la suma de las probabilidades de cada uno de los
sucesos. En efecto, sean los sucesos A
1
, A
2
, ... , A" compuestos cada
uno de ellos por n
1
, n
2
, ... , n, resultados elementales del espacio muestra]
E, y tales que A; n Ai -:f. </J, V i, j = 1, ... , r, entonces resulta que como
tendremos:
n
1
+ n
2
+ .. + n, _ n
1
n
2
n,
---=---=----_.:_ - + - + ... + -
n n n n
P(A
1
u A
2
u .. u A,) = P(A
1
) + P(A
2
) + .. + P(A,)
Esta defmicin de la probabilidad clsica fue una de las primeras que se
dieron, alrededor del ao 1900, y se conoce con el nombre de regla de Laplace
ya que se le atribuye a l. Tambin se le suele llamar probabilidad a priori,
pues para calcularla . es necesario conocer, antes de realizar el experimento
aleatorio, el correspondiente espacio muestra! y el nmero de resultados o
sucesos elementales que entran a formar parte del suceso cuya probabilidad
pretendemos determinar; pudiendo calcular la probabilidad de cualquier suce-
so antes de realizar el experimento aleatorio.
La aplicacin de la definicin clsica de probabilidad puede presentar
dificultades de aplicacin en algunos casos. Concretamente, cuando el espacio
muestra! es infinito, o bien cuando los posibles resultados de un experimento
no son igualmente probables. Por ejemplo, en un proceso de fabricacin de
un determinado tipo de piezas, pueden aparecer algunas piezas defectuosas,
siendo la mayora buenas, y en este caso si quisiramos determinar la proba-
bilidad de que una pieza fuera defectuosa no podramos utilizar la definicin
clsica de probabilidad, pues necesitaramos conocer previamente el resultado
del proceso de fabricacin (experimento aleatorio). Otro ejemplo sera el de-
terminar la probabilidad de que una mujer muera antes de una determinada
edad, etc.
Para resolver, entre otros, estos problemas se hace. una extensin de la
definicin de probabilidad, de manera que se pueda aplicar con menos restric-
ciones. Llegando a la definicin frecuentista de la probabilidad.
7 .3. Definicin frecuentista de la probabilidad
Dados dos sucesos incompatibles A
1
y A
2
tales que A
1
u A
2
=A e: E
entonces cada vez que se presente el suceso A, se presentar necesariamente
uno y slo uno de los sucesos A
1
o A
2
, y si realizamos n repeticiones del
336 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
experimento aparecer n' veces el suceso A de tal forma que
siendo:
n
1
: el nmero de veces que aparece A
1
y
n
2
: el nmero de veces que aparece A
2

Luego tendremos que:
Esta propiedad se puede generalizar al caso de n sucesos incompatibles.
La teora frecuentista de la probabilidad asegura que existe el siguiente
lmite cuando n tiende a infinito:
n.
1m ....! = P(A;), i = 1, 2, 3, ... , k
n-+c:.o n
siendo P(A.) la probabilidad del suceso A;.
Luego ia definicin frecuentista de la probabilidad consiste en definir la
probabilidad como el lmite cuando n tiende a infinito de la proporcin o
frecuencia relativa del suceso.
En general,. si realizamos un experimento aleatorio cuyo correspondiente
espacio muestra! es E y designamos por A cualquier suceso perteneciente ~
espacio muestra] E y repetimos en las mismas condiciones, n veces el expen-
mento aleatorio, tendremos que la frecuencia relativa del suceso A ser:
n(A)
n
en donde n(A) es el nmero de veces que ha aparecido el suceso A en las n
repeticiones del experimento.
Cuando el nmero n de repeticiones del experimento se hace muy grande,
0 sea, cuando n tiende a infinito, la frecuencia relativa converge hacia un valor
que llamaremos probabilidad del suceso A, P(A), o sea:
P(A) = lm n(A)
n-+co n
Pero como es imposible llegar a este .lmite, ya que no podemos repetir el
experimento un nmero infinito de veces, lo que s podemos hacer es repetir
PROBABILIDAD
337
el experimento muchas veces y observaramos que las frecuencias relativas
tienden a estabilizarse. Pero esta estabilizacin es relativa, pues en algunos
casos las frecuencias relativas tienden a estabilizarse muy pronto, es decir, con
pocas repeticiones del experimento aleatorio se observa la estabilizacin y sin
embargo en otros casos la estabilizacin de las frecuencias relativas es ms
lenta, teniendo que repetir muchas veces el experimento aleatorio para que
aparezca esa estabilizacin. As pues, consideremos un experimento aleatorio
que consiste en lanzar una moneda equilibrada al aire, o sea, una moneda muy
perfecta, siendo los posibles resultados cara (H) o cruz (T); si repetimos 200
veces el experimento obtenemos los resultados de la tabla 7.1.
TABLA 7.1.
Resultados de 200 lanzamientos de una moneda al aire.
Nmero de
Nmero de caras
Suma
Frecuencia
lanzamientos
cada 10
acumulada
relativa
lanzamientos
de caras
de caras
1
o
o
o
10
6
6
0,600
20
2
8
0,400
30
6 14
0,467
40
5 19
0,475
50
6
25 0,500
60
6 31
0,517
70
7
38 0,543
80
5 43
0,537
90
3
46
0,511
100
5
51 0,510
110
5
56 0,509
120
7
63 0,525
130
5
68 0,523
140
4
72
0,514
150
3
75
0,500
160
3
78 0,487
170
5
83 0,488
180
6
89 0,494
190
6
95 0,500
200
6 101
0,505
La cuarta columna de la tabla 7.1 nos da la frecuencia relativa de aparicin
del suceso cara. Por ejemplo, cuando hemos realizado 40 repeticiones del
experimento la frecuencia relativa de caras es
19 .
40 = 0,475
338
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y cuando se han realizado 170 repeticiones la frecuencia relativa es
'

170 '
lo cual nos indica que cuando el nmero n repeticiones ?el
aumenta la amplitud de las variaciones Es decrr,. la frecuencta
rlativa tiende a estabilizarse o a presentar regulandad estadstica en torno a
un valor, en nuestro ejemplo, 0,5, a medida que n crece.
Si representamos grficamente la primera y cuarta de la 7.1,
llevando en el eje de abscisas el nmero de lanzanuentos y en el eje de
ordenadas la frecuencia relativa de las caras, grfico 7.1, observamos que
efectivamente la amplitud de las variaciones decrece cuando n aumenta, ten-
diendo a fluctuar alrededor del valor 0,5.
0,9
0,8
--------------------
. -------------------------------------------- ------------------ -------
---------------- ----------------------
-------------------------
-------------------------------------
---------------------------------------------------
------------------ ------------------------ ------------------
----------------
- ------- --------------------------
.. ------------------------------------
------------
----------------------
----------------- ----------------
------------------------------
.. ---------------------
---------------------------- ----------------- -------------------
-------------------------------
----------------------------
---------------------------------------
-----------------------
------------------------
------------------------
--------
-- --- --------------
----- ------------
o o 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200
Nmero de lanzamientos
' .
GRFICO 7.1. Representacin grfica del nmero de lanzamientos de una moneda al aire
y frecuencia relativa de las caras.
Este valor 0,5, al cual tiende la frecuencia relativa cuando el nmero de
repeticiones se hace muy grande, es la del cara.
El hecho de que las frecuencias relativas tiendan a estabilizarse en torno
del valor 0,5 es debido a que la moneda que hemos utilizado estaba totalmente
PROBABILIDAD 339
equilibrada, o sea, era imparcial, y los dos posibles sucesos, cara y cruz, son
igualmente probables.
Si la moneda hubiera sido doblada o golpeada, al repetir muchas veces el
experimento aleatorio (lanzamiento al aire de la moneda) nos poda haber
llevado a un valor diferente del 0,5, como podan haber sido del 0,61, 0,48,
O, 71, ... siendo stos los valores alrededor de los cuales se hubieran estabilizado
las frecuencias relativas, resultando entonces que la probabilidad del suceso
cara no hubiera sido 0,5, sino que sera 0,61, 0,48, 0,71, ...
A esta defmicin frecuentista de la probabilidad se le llama tambin proba-
bilidad a posteriori ya que slo podemos dar la probabilidad de un suceso des-
pus de repetir y observar, un nl1mero grande de veces, el experimento aleatorio
correspondiente. Algunos autores tambin las llaman probabilidades tericas.
7 .4. Interpretacin subjetiva de la probabilidad
Hemos visto que tanto la defmicin clsica como la frecuentista de la
probabilidad se basan en las repeticiones del experimento aleatorio, pero hay
muchos experimentos que no se pueden repetir bajo las mismas condiciones,
y por tanto habr muchas situaciones donde la interpretacin objetiva de la
probabilidad no puede ser aplicada, teniendo que recurrir a un punto de vista
alternativo que no depende de las repeticiones del experimento aleatorio sino
que consiste en considerar la probabilidad como un concepto subjetivo que
expresa el grado de creencia o confianza individual sobre la posibilidad de que
el suceso ocurri. Es decir, la probabilidad subjetiva representa un juicio
personal sobre el resultado de un experimento aleatorio, pudiendo ser muy
diferente del juicio personal o probabilidad subjetiva asignada por otra per-
sona. Luego la probabilidad subjetiva es la evaluacin personal de la proba-
bilidad de un fenmeno aleatorio.
Con el fin de aclarar lo que entendemos por grado de creencia o confianza
individual consideremos el siguiente ejemplo, que va a consistir en un partido
de ftbol entre dos equipos A y B que juegan por primera vez; no disponemos
de informacin sobre resultados anteriores puesto que es la primera vez que
van a jugar, solo se tiene informacin sobre algunos jugadores de ambos
equipos. Como no han jugado en ocasiones anteriores no podemos atribuirle
probabilidad objetiva al posible resultado del partido, es decir como no existen
resultados de partidos anteriores, no podemos asignarle probabilidad de tipo
frecuentista o a posteriori ni de tipo clsico o a priori a los tres posibles
resultados del partido:
- que gane el equipo A,
- que gane el equipo B, o
- que empaten.
340 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Sin embargo, basndonos en el conjunto de la posible informacin qm:'
podamos tener acerca de los diferentes jugadores o aun sin ella, se puede emitir
un juicio personal o grado de creencia sobre el posible resultado, que sera la
probabilidad subjetiva que se asigna a cada posible resultado. As pues un
determinado observador puede asignar las siguientes probabilidades subje-
tivas.
Probabilidad de que gane el equipo A = 0,7
Probabilidad de que gane el equipo B = 0,2
Probabilidad de que empaten = 0,1
Otro observador puede asignar diferentes probabilidades subjetivas:
Probabilidad de que gane el equipo A = 0,3
Probabilidad de que gane el equipo B = 0,2
Probabilidad de que empaten = 0,5
Siendo, por tanto, posible que diferentes observadores tengan diferentes
grados de creencia sobre los posibles resultados emitiendo juicios personales
o probabilidades subjetivas diferentes e igualmente vlidas.
De esta forma hemos emitido un juicio (un nmero) que refleja nuestra
opinin sobre el posible resultado, y que es la probabilidad subjetiva asignada
a ese resultado. Siendo este nmero o probabilidad subjetiva una propiedad
caracterstica que depende del propio observador.
Para el objetivista las cosas suceden de diferente forma: admite que la
probabilidad es una propiedad caracterstica de cada acontecimiento y no
depende del observador, limitn.dose ste a calcular su valor a partir de un
conjunto de informacin impuesto por el propio acontecimiento e indepen-
diente del observador. Es decir, dos observadores diferentes pueden dar para
un mismo suceso dos valores distintos desde el punto de vista subjetivo, sin
embargo, esto no puede ocurrir en el punto de vista objetivo, pues en este caso
. uno de los dos o ambos han medido malla probabilidad y un ser infinitamente
inteligente dara el valor exacto.
En lo sucesivo nos referiremos a la probabilidad objetiva aunque en algn
apartado, como por ejemplo en teora de la decisin podremos utilizar poo-
babilidades subjetivas, pero entonces lo indicaremos expresamente
1

1
Como autores representantes del punto de vista objetivo tenemos: Gournot, Borel, Berstein,
Keynes, Kolmogorov, Jeffreys, Von-Misses y Reichenbard.
Como representantes del punto de vista subjetivo: Ramsey, De Finetti, Koopman, Savage,
Good, etc.
PROBABILIDAD
341
7 .5. Definicin axiomtica de la probabilidad
La de la probabilidad es quizs la ms simple de
las defimcwnes y Ciertamente es la menos controvertida ya que, esen-
cialmente, es una definicin basada en un conjunto de axiomas que establecen
los requisitos mnimos para dar una definicin de probabilidad. La ventaja
fundamental de la definicin axiomtica de la probabilidad es que nos permite
a un. desar.rollo riguroso y matemtico de la probabilidad. Esta aproxi-
maCin de la probabilidad fue introducida, inicialmente, por el
matemtico ruso A. N. Kolmogorov y posteriormente aceptada por estadsti-
cos y matemticos en general
2

. J?ado el espacio muestra} E y la cr-lgebra .st1 = Ql>(E), diremos que una
funCin de conjunto P definida sobre .st1 y con valores en [0, 1],
P: .st1 --+ [0, 1]
es una probabilidad, si satisface los siguientes axiomas de Kolmogorov:
A.l. P(A) O, para cualquier suceso A E .st1.
A.II. P(E) = 1.
Dada una sucesin numerable de sucesos incompatibles, A
1
, A
2
, E .st1,
se verifica que
o bien
. Si la funcin de conjunto P asigna el valor p == P(A) al suceso A, entonces
diremos que p o P(A) es la probabilidad del suceso A.
La terna formada por el espacio muestra} E, la cr-lgebra .st1 y la probabi-
lidad P, (E, .st1, P), recibe el nombre de espacio probabilstico.
2
Un axioma es una afirmacin que se admite como verdadera; mientras que un teorema es
una ser deducida ? de otras propiedades y teoremas previos.
En la defrmon axiOmtica de la probabilidad, admlluemos como verdaderas varias afirmaciones
simples sobre la probabilidad, y estas afirmaciones sern los axiomas de probabilidad.
342 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
7 .5. 1 . Teoremas elementales o consecuencias
de los axiomas '
Los siguientes resultados se deducen directamente de los axiomas de pro-
babilidad de Kolmogorov.
Teorema 7.1
probabilidad del suceso imposible es nula
L P(ifl)=O
Demostracin:
Sabemos que
Euifl=E y Enifl=ifl
Por el axioma III (A.III), resulta que
P(Eu ifl) = P(E) + P(ifl) = 1
y como por el axioma II (A.II), P(E) = 1,
P(E) + P( ifl) = 1 + P( ifl) = 1
resulta que
P(ifl) =O
Es decir, la probabilidad del suceso imposible es cero, pero si para cual-
quier suceso A resulta que P(A) = O, diremos que A es un suceso nulo, pero
esto no implica que A = ifl. Anlogamente sucede con el suceso E, pues si para
cualquier suceso A se verifica que P(A) = 1, diremos que A es un suceso casi
seguro, pero esto no implica que A = E.
Un diagrama grfico de la demostracin viene dado por el grfico 7.2.
PROBABILIDAD
A.ll A.III A.ll
l l l
r---
1 + P (0) = P (E) + P (0) = : P (E u 0) :
, _________ 1
GRAFICO 7.2. Demostracin del teorema 7.1.
Teorema 7.2
Para cualquier A E d se verifica que la probabilidad de su
complementario P(A) es
P(A) = 1 - P(A)
Demostracin:
Teniendo en cuenta que:
AuA=E y AnA= 4J
Aplicando los axiomas A.II y A.III tenemos:
1 = P(E) = P(A u A) = P(A) + P(A)
de donde se deduce que
P(A) = 1 - P(A)
343
344 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
o bien que
P(A) = 1 - P(A)
Un diagrama grfico de la demostracin viene dado por el grfico 7.3.
AuA=E
A. m A.ll
t t
P(A) +P(A)
- ----- -_---- --- :
: P(A u A) =P(E):
'--------------
=
GRFICO 7.3. Demostracin del teorema 7.2.
Teorema 7.3
La probabilidad P es montona no decreciente, es decir
V A, B E .sfl, con A e B => P(A) :::;; P(B)
y adems
P(B - A) = P(B) - P(A)
Demostraci6n:
Observando el diagrama de Venn del grfico 7.4.
PROBABILIDAD
B
GRFICO 7.4. Diagrama de Venn.
si, A e B, entonces podemos expresar B como
B = Au(B- A)
pero A y B - A son disjuntos, luego por A.III tendremos:
P(B) = P[A u (B - A)] = P(A) + P(B - A) =>
=> P(B - A) = P(B) - P(A)
y como por el axioma A.I,
P(B- A)?: O
resulta que
P(B) - P(A) ?: O
de donde
P(B);;?; P(A)
y consecuentemente
P(A),:;; P(B)
345
E
346
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Teorema 7.4
Para cualquier suceso A E .54., se verifica que P(A) l.
Demostracin:
Ya que A e: E, por el teorema 7.3 resulta que
P(A) P(E) = 1 P(A) 1
Teorema 7.5
l
Para dos sucesos cualesquiera A, B E .s4. se verifica que
P(A u B) = P(A) + P(B) - P(A n B)
Demostracin:
Observando el diagrama de Venn del grfico 7.5 podremos escribir
y como los sucesos
GRFICO 7.5. Diagrama de Venn.
A = (A n B) u (A n B)
B = (A n B) u (A n B)
A u B = (A n B) u (A n B) u (A n B)
(A n B), (A n B), (A n B)
E
PROBABILIDAD
son disjuntos, por el axioma A.III tendremos que:
P(A) = P(A n B) + P(A n B)
P(B) = P(A n B) + P(A n B)
P(A u B) = P(A n B) + P(A n B) + P(A n B)
347
[7.1]
[7.2]
[7.3]
De las expresiones [7.1] y [7.2], sumando miembro a miembro y pasando
al primer miembro P(A n B) tendremos
P(A) + P(B) - P(A n B) = P(A n B) + P(A n B) + P(A n B) [7.4]
Y la expresin [7.3] con la [7:4] resulta que los segundos miem-
bros son Iguales, luego se verifica que:
P(A u B) = P(A) + P(B) - P(A n B)
Este teorema se puede generalizar a ms de dos sucesos, as pues para el
caso de tres sucesos A, B, C E sil tendremos
P(A u Bu C) = P(A) + P(B) + P(C)- P(A n B)- P(A n C)- P(B n C) +
+ P(AnBnC)
En general paran sucesos A
1
, A
2
, , An E sil se verifica que
Teorema 7.6
Para dos sucesos cualesquiera A y B E sil se verifica que
P(A u B) P(A) + P(B)
Demostracin:
Es una consecuencia inmediata del teorema 7.5.
348 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
En general podemos escribir que
En el caso de que los sucesos fueran disjuntos entonces se verifica la
igualdad
Teorema 7.7
Dada una sucesin creciente de sucesos {A
1
, A
2
, A
3
, }que abrevia-
damente representaremos por {A. j} entonces se verifica que:
lm P(A.) = p( lm A.) = P( A.)
n-oo n-1
Demostracin:
Denotemos por
<Xl
A = A
1
u A
2
u A
3
u = lm A. = U A.
n-+o:::J n=l
con lo cual
P(A) = P(lm A.) = P( A.)
n-+oo n-1
Como la sucesin es creciente se verifica
A
1
e A
2
e A
3
e ...
y los sucesos
A
1
, A
2
- A
1
, A
3
- A
2
, A4- A3, ... , A.- An-l ...
son disjuntos entre s y tales que:
A. = A
1
u (A
2
- A
1
) u (A
3
- A
2
) u {A
4
- A
3
) u u (A. - A.-
1
) [7.5]
tomando lmites cuando n tiende a infinito tenemos:
lm A.= A
1
u (A
2
- A
1
) u (A3 - Az) u
PROBABILIDAD
349
y por el axioma A.III
P(lm A.)= P(A1) + P(A
2
- A
1
) + P(A
3
- A
2
) + =
n-+ oo
= lm [P{A1) + P(A2 - A1) + P(A
3
- A
2
) + + P(A.- A._
1
)] =
n-+ oo
= lm P[A1 u (A2 - A
1
) u (A
3
- A
2
) u .. u (A,. - A._
1
)]
n-+oo
y teniendo en cuenta la expresin [8.5] resulta que:
con lo que queda demostrado.
Teorema 7.8
Dada una sucesin decreciente de sucesos {A
1
, A
2
, A
3
, ... } o abrevia-
damente {A.J}, entonces se verifica que:
Demostracin:
Designamos por
00
A = A1 n A2 n A
3
n .. = lm A. = n A.
n-+oo n=l
[7.6]
y consecuentemente
Como la {A.!} es decreciente, entonces la sucesin de sus sucesos
complementarios {A. j} es creciente y, consecuentemente, el complementario
del suceso A representado en la expresin [7.6], aplicando las leyes de Morgan,
ser:
A = A1 u A2 u A
3
u = lm A. =
00
u :A.
350
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y segn el teorema 7.7
P(A) = P(lm An) = P( U An)
n-+oo n=l
y por el teorema 7.2
P(A) = 1 - P(A) = 1 - lm P(AJ = 1 - lm [1 - P(An)] = lm P(An)
n-+ oo
n-+ oo n-+ oo
luego
P(A) = lm P(AJ = P(lm An) = P( 0 An)
n-+oo n-+oo n-1
como queramos demostrar.
Ejemplo 7.1
Sean los sucesos A, By e con probabilidades
y tales que
Obtener
l. P[(A nB)],
2. P(AnB),
3. P[(A uB)],
4. P(AnB)y
1 1 1
P(A)=l, P(B)=3 y P(C)=
1
P(AnB) =6
Ane=qy
Bne=qy
5. P[AuBuC].
Solucin:
l. Teniendo en cuenta el teorema 7.2, tenemos:
--- 1 5
P[(A n B)] = 1 - P(A n B) = 1 - - = -
6 6
PROBABILIDAD
2. Segn vimos en el teorema 7.5, tenamos la expresin:
Luego
A= (AnB)u(AnB)
P(A) = P[(A n B) u (A n B)] = P(A n B) + P(A u B)
1 1 -
- =- + P(AnB)
2 6
- . 1 1 2 1
P(A n B) = 2 - 6 = 6 = 3
3. Aplicando el teorema 7.2, tenemos:
P[(A u B)] = 1 - P(A u B)
Pero segn el teorema 7.5
1 1 1 2
P(A u B) = P(A) + P(B) - P(A n B) = - + - - - = -
2 3 6 3
Por tanto, sustituyendo se tiene:
--- 2 1
P[(A u B)] = 1 - - = -
3 3
4. Teniendo en cuenta las leyes de Morgan, sabemos que:
luego
5. Sabemos que:
Pero
- - --- 1
P(A n B) = P(A u B) = -
3
Ane=qy
Bne=qy
(A u B) n e = (A n C) u (B n C) = qy
351
352 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
luego (A u B) y C son sucesos disjuntos y teniendo en cuenta el axioma
A.III resulta:
2 1 11
P(A u Bu C) = P[(A u B) u C] = P(A u B) + P(C) = 3 + =
12
Ejemplo 72
Analizadas las estadsticas de visitantes a los museos de una ciudad durante
el ao 2000 se ha observado que 1.000.000 de personas han visitado el total
de museos. En particular se sabe que 700.000 personas han visitado el museo
A y 500.000 han visitado el museo B, y no se tiene informacin del resto.
Obtener:
l. La probabilidad de que un visitante visite el museo A.
2. La probabilidad de que un visitante visite el museo B.
3. La probabilidad de que visite los dos museos A y B.
4. La probabilidad de que visite al menos uno de los dos museos.
Solucin:
Designamos por A el suceso de visitar el museo A, anlogamente por B el
suceso de visitar el museo B, y llamamos C al suceso visitar otros museos.
l. Teniendo en cuenta la definicin de probabilidad, tenemos que:
2. Anlogamente
- 700.000 - o 7
P(A) - 1.000.000 - '
500.000
P(B) = = 0,5
1.000.000
3. El suceso que visite los dos museos A y B lo designamos por A n B,
luego tenemos que calcular P(A n B).
Sabemos que
Luego
A= (A nB)u(AnB)
B = (A n B) u (A n B)
P(A nB) P(A nB) + P(A nB) = P(A) = 0,7
P(A n B) P(A n B) + P(4 n B) = P(B) = 0,5
Por tanto podemos decir que
P(A nB) 0,5
PROBABILIDAD
Pero por el teorema 7.5 tenemos
P(A u B) = P(A) + P(B) - P(A n B)
Y por el teorema. 7 .4,
Luego
Resulta que
P(A uB) 1
P(A) + P(B) - P(A n B) 1
O, 7 + 0,5 - P(A n B) 1
0,2 P(AnB)
0,2 P(A nB) 0,5
353
4. El suceso que visite al menos uno de los museos lo representamos
por A u B, luego tenemos que calcular P(A u B).
Razonando de manera anloga al apartado anterior tenemos:
luego
Ejemplo 7.3
0,7 = P(A) :( P(A) + P(A nB) = P(A u B) :( 1
0,5 = P(B) :( P(B) + P(A n B) = P(A u B) :( 1
0,7 P(A u B) 1
La probabilidad de que un estudiante A apruebe el examen final de Esta-
dstica es 0,7, la de otro estudiante Bes 0,5 y la probabilidad de que aprueben
los dos estudiantes es 0,4. Obtener las probabilidades de los siguientes sucesos:
l. Que al menos uno de los dos apruebe el examen.
2. Que ninguno apruebe el examen.
3. Solamente uno apruebe el examen.
Solucin:
Designamos por:
- Suceso A: el estudiante A aprueba.
- Suceso B: el estudiante B aprueba.
354
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Entonces
P(A) = 0,7
P(B) = 0,5
P(A nB) = 0,4
1. El suceso que al menos uno de los dos apruebe el examen ser:
A
1
= AuB
luego
P(A
1
) = P(A u B) = P(A) + P(B)- P(A n B) = 0,7 + 0,5 - 0,4 = 0,8
2. El suceso que ninguno apruebe el examen ser:
A
2
=AnB=AuB
Luego
P(A
2
) = P(A u B) = 1 - P(A u B) = 1 - 0,8 = 0,2
3. El suceso que solamente uno apruebe el examen ser
A
3
= (A n B) u (A n B) = A 6. B
pero como estos sucesos (A n Ji) y (A n B) son disjuntos
P(A
3
) = P(A n B) + P(A n B)
Sabemos que
A= (AnB)u(AnB) => P(A) = P(AnB) + P(AnB)
B = (A n B) u (A n B) => P(B) = P(A n B) + P(A n B)
de donde se deduce que
P(AnB) = P(A)- P(AnB)
P(AnB) = P(B)- P(AnB)
y sustituyendo en la expresin de P(A
3
) tenemos:
P(A
3
) = P(A) - 2 P(A n B) + P(B) = O, 7 - 2 0,4 + 0,5 = 0,4
PROBABILIDAD 355
7 .6. Probabilidad condicionada
En los apartados anteriores hemos introducido el concepto de probabi-
lidad considerando que la nica informacin sobre el experimento era el
espacio muestral. Sin embargo, hay situaciones en las que se incorpora infor-
macin suplementaria respecto de un suceso relacionado con el experimento
aleatorio en cuestin cambiando su probabilidad de ocurrencia. As pues, el
hecho de introducir ms informacin, como puede ser que otro suceso ha
ocurrido, conduce a que determinados resultados no pueden haber ocurrido,
variando el espacio de resultados y cambiando consecuentemente sus proba-
bilidades.
Consideremos dos sucesos relacionados de tal manera que la probabilidad
de que ocurra un suceso depende de si el otro suceso ha ocurrido o no. Por
ejemplo, sea un experimento que consiste en observar si el dlar sube (aumenta
de valor) frente a la peseta. Designamos por A el suceso el dlar sube frente
a la peseta .en el mercado espaol antes de que nuestro mercado abra a las
nueve de la maana y sea B el suceso el dlar sube en el mercado americano
despus de abrir. Ambos sucesos, A y B estn relacionados, ya que los
mercados se movern probablemente en la misma direccin muchos das, pero
no necesariamente todos los das. Por lo tanto la P(B) de que el dlar subira
frente a la peseta en el mercado americano no es igual que la probabilidad de
que ocurra el suceso B (que el dlar suba en el mercado americano despus
de abrir) cuando se conoce que el dlar ha subido en el mercado espaol,
suceso A.
Por ejemplo, supongamos que el dlar sube frente a la peseta el 70% de
los das en el mercado espaol y el 60 % de los das en ambos mercados, el
americano y el espaol, es decir:
P(A) = 0,7
P(AnB) = 0,6
Entonces, si se sabe que el dlar sube, frente a la peseta, en el mercado
espaol, la probabilidad de que habiendo sucedido esto suba en el mercado
americano ser:
A este cociente
P(AnB) 6
P(A) = 7 0,86
P(AnB)
P(A)
356 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
se le llama probabilidad condicionada del suceso B, cuando el suceso A ha
ocurrido y se denota de la forma
P(AnB)
P(B/ A) = P(A)
Definicin 7.1. Probabilidad condicionada.
Dados un espacio probabilstico (E, .stJ., P) asociado a un experimento
aleatorio, y un suceso A E .stJ., tal que P(A) > O. Para cualquier suceso B
E .stJ., se define la probabilidad condicionada de B dado A o probabilidad
de B condicionada a A como sigue
3
P(A n B)
P(B/A) = P(A) , P(A) > O
[7.7]
Se puede probar fcilmente que la probabilidad condicionada cumple los tres
axiomas de Kolmogorov. En efecto:
A. l.
A. U.
P(A n B)
V B E .stJ., P(B/ A) = P(A) ~ O
pues el cociente entre dos cantidades no negativas es otra no ne-
gativa.
Adems, como:
BnAcA
P(BnA)
= P(B nA) ::::; P(A) = P(A) ::::; 1
Luego:
O::::; P(B/A)::::; 1
P(E/A) = 1
En efecto:
_ P(E n A) = P(A) =
1
P(E/A) - P(A) P(A)
3
Observemos que si P(A) =O, entonces no tiene sentido esta definicin, pues la P(B/A) se
hace infinito. Esto se puede evitar haciendo una definicin ms rigurosa (Wilks, pg. 25).
')
\
PROBABILIDAD
357
A.III. Sea {A;} una sucesin de sucesos disjuntos dos a dos, entonces
En efecto:
(
oo ) P[(.D A;) nA] P[_U (A nA)]
p U AjA = ---_1_ --- = ~ - = ~ 1 - - - - - - - =
i=l P(A) P(A)
Y como los sucesos A1 nA; A
2
nA, ... son disjuntos dos a dos se verifica que
y sustituyendo, resulta:
p( U AjA)= f P(A; nA)
i=l i=l P(A)
<XJ
L P(AjA)
i=l
Este axioma tambin se verifica para el caso de que tengamos un nmero
finito de sucesos en .stJ..
Luego efectivamente se verifican los axiomas de Kolmogorov.
Partiendo de la definicin de la probabilidad condicionada P(B/A), dada
por la expresin [7.7], podemos escribirla en forma de producto, llegando a
obtener la regla de multiplicacin de probabilidades o probabilidad compuesta,
dada por:
P(A n B) = P(A) P(B/ A)
[7.8]
Anlogamente, considerando la probabilidad condicionada P(A/B):
P(A/ B) = P(A n B) P(B) > O
P(B) '
tendramos que:
P(A n B) = P(B) P(A/ B) [7.9]
de donde igualando las expresiones [7.8] y [7.9] tendremos:
P(A)P(B/A) = P(B)P(A/B) [7.10]
358 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
La definicin de probabilidad condicionada dada por la expresin [7.7] se
puede extender a cualquier nmero finito de sucesos del espacio mues,tral. As
pues, para el caso de tres sucesos A, B y C tendremos:
P(AnBn C)
P(A/B n C) = P(B n C) , P(B n C) > O
o bien:
P(AnBn C)
P(A n B/C) = P(C) , P(C) >O
Ejemplo 7.4
Una entidad bancaria pretende introducir un sistema casi automtico de
concesin de prstamos para autoconsumo de importe mximo 10.000 euros,
y para ello analiza su fichero de los prstamos, de caractersticas parecidas,
que han sido concedidos en los ltimos aos llegando a obtener la siguiente
informacin:
- El 5 % de los prstamos que se concedieron en ese perodo presentaron
algn problema en el pago.
- El 70 % de las peticiones de prstamo que se haban hecho en el
perodo analizado, se informaron favorablemente, cuando no ha habido
incumplimiento de pagos segn se sabe en la actualidad, y se concedie-
ron de acuerdo con los baremos exigidos en aquella poca por el banco.
En la actualidad el 80 % de las solicitudes de este tipo de prstamos
cumplen automticamente las condiciones fijadas por el banco, informndose
favorablemente. Determinar la probabilidad de que estas peticiones que son
informadas favorablemente no presenten ningn problema en el momento de
la cancelacin del prstamo.
Solucin:
Designemos los siguientes sucesos:
A: Suceso incumplimiento en el pago, P(A) = 0,05.
B: Suceso informe favorable de la solicitud, P(B) = 0,80.
B/A: Suceso informe favorable cuando no ha habido incumplimiento de
pago, P(B/A) = 0,7.
A/B: Suceso cumplimiento en el pago cuando el informe ha sido favorable.
La probabilidad que se pide es: P(A/B), la cual se obtendr utilizando la
expresin:
P(A) P(B/A) = P(B) P(A/B)
PROBABILIDAD
359
de donde se tiene que:
P(A/B) = P(A) P(B/A) = 0,95 0,7 = 0,665
P(B) 0,8 0,8 -
0

83

Ejemplo 7.5
. El dueo de_ una tienda de ropa para hombres ha observado el comporta-
miento de sus clientes durante un largo perodo de tiempo. Como consecuencia
de ese perodo de observacin afirma que la probabilidad de que un cliente
que entra a la tienda compre una camisa es 0,4, pero de los que compran una
camisa el 50% compran tambin una corbata, y solamente un 10% compran
la corbata cuando no han comprado la camisa. Obtener las probabilidades de
que los clientes compren lo siguiente:
l. Una camisa y una corbata.
2. Una corbata.
3. Una camisa o una corbata.
4. Una corbata pero no una camisa.
Solucin:
Consideraremos los dos sucesos bsicos:
C: Compra una camisa.
B: Compra una corbata.
Sabemos que
P(C) = 0,4
P(B/C) = 0,5
P(B/C) = 0,1
El espacio muestra] para este experimento aleatorio ser:
E= {CnB, CnB, CnB, CnB}
Las probabilidades de los sucesos que nos piden son:
l. Probabilidad de comprar una camisa y una corbata:
P(C n B) = P(C) P(B/C) = 0,4 0,5 = 0,2
360
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
2. Probabilidad de comprar una corbata
P(B) = P[( e n B) u (C n B)] = P( e n B) + P(C n B) =
= 0,2 + 0,06 = 0,26
ya que
P(C n B) = P(C) P(B/C) = 0,6 0,1 = 0,06
3. Probabilidad de comprar una camisa o una corbata
P(euB) = P[(enB)u(enB)u(enB)] =
= P( e n B) + P( e n B) + P(C n B) =
= 0,2 + 0,2 + 0,06 = 0,46
pues
P(enB) = P(C)P(B/C) = 0,40,5 = 0,2
o bien, directamente
P(e u B) = P(e) + P(B)- P(e n B) = 0,4 + 0,26- 0,2 = 0,46
4. Probabilidad de comprar una corbata pero no una camisa:
P(C n B) = P(C). P(B/C) = 0,6 0,1 = 0,06
El correspondiente rbol de probabilidad sera:
CnB P(CnB)=0,2
CnB P(CnB)=0,2
- () \
B
Prc)
C)"" '
rlB
""O
,6
CnB P(CnB)=0,06.
P(ii/Cj""0,9
B
CnB P(C n ii) = 0,54
T
PROBABILIDAD 361
7 .6.1. Teorema de la probabilidad compuesta
o producto
Sean n-sucesos A
1
, A
2
, ... , An E d, y tales que
entonces se verifica q ~ e
P(A
1
n A
2
n n An) =
= P(A
1
)P(A
2
/A
1
)P(A
3
/A
1
nA
2
) ... P(AjA
1
n ... nAn_
1
) [7.11]
Demostracin:
Veamos en primer lugar que las probabilidades condicionadas que inter-
vienen estn definidas, para ello podemos escribir:
y teniendo en cuenta el Teorema 8.3, tendremos:
lo cual prueba que efectivamente las probabilidades que intervienen en las
probabilidades condicionadas de la expresin [7.11] estn bien definidas, es
decir, son mayores que cero las probabilidades de los sucesos que condicionan.
Para demostrar la expresin [7.11], lo haremos por recurrencia, partiendo
del caso de dos sucesos A
1
, A
2
, sabemos que:
de donde:
Anlogamente, para tres sucesos tendremos:
P(A
1
n A
2
n A
3
) = P[(A
1
n A
2
) n A
3
] = P(A
1
n A
2
) P(A
3
/A
1
n A
2
)
= P(A
1
) P(A
2
/A
1
) P(A
3
/A
1
n A
2
)
362 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
y en general se tiene:
P(A
1
n nA,.)= P[(A
1
n nAn_
1
)nAJ
= P(A
1
n n An_
1
) P(A,jA1 n n An-1)
= P(A
1
) P(A
2
/A
1
) P(A
3
/A
1
n A
2
) P(A,jA
1
n n An_
1
)
7.6.2. Teorema de la probabilidad total
Sean n-sucesos disjuntos, A
1
, A
2
, , An E .stt, con
P(AJ > O, = 1, 2, ... , n
y tales que forman un sistema completo de sucesos, es decir, que
n
U A;=E
i= 1
Entonces para cualquier suceso B E .stt, cuyas probabilidades condi-
cionadas P(B/A;) son conocidas, se verifica que:
n
P(B) = L P(AJ. P(B/A;) [7.12]
i= 1
Demostracin:
Sabemos que:
n
U (B n A;), unin de sucesos disjuntos
i=l
luego

!1
t
1
PROBABILIDAD
363
Ejemplo 7.6
Una empresa constructora dedicada a la construccin y venta de viviendas
en tres grandes municipios de Madrid M
1
, M
2
y M
3
, vende en el municipio
M
1
el 60 % de las viviendas, en el municipio M
2
el 30 % y en el municipio M
3
el 10% de las viviendas construidas. De experiencias anteriores tanto de esta
empresa como de otras se sabe que un determinado porcentaje de familias no
efectan el pago de las letras mensuales que previamente haban aceptado,
siendo este porcentaje del 2 %, del 4 % y del 6 %, en cada municipio respec-
tivamente. Determinar la probabilidad de que una familia cualquiera pague
sus letras.
Solucin:
Sean los sucesos:
M
1
: la familia es del municipio M
1
M
2
: la familia es del municipio M
2
M
3
: la familia es del municipo M
3
B: la familia paga las letras.
Del enunciado se deduce:
P(M
1
) = 0,6, P(M
2
) = 0,3, P(M
3
) = 0,1,
P(B/M
1
) = 0,02, P(B/M
2
) = 0,04, P(B/M
3
) = 0,06
y consecuentemente:
P(B/M
1
) = 0,98, P(B/M
2
) = 0,96, P(B/M
3
) = 0,94
Podemos aplicar el teorema de la probabilidad total, pues los tres sucesos
forman un sistema completo de sucesos, ya que los tres sucesos son disjuntos,
pues cada familia que compra una vivienda es solo de uno de los tres muni-
cipios y la unin de los tres sucesos nos da el suceso seguro E. Luego tendre-
mos que la probabilidad de que una familia cualquiera pague sus letras ser:
3
P(B) = L P(M J. P(B/M J = P(M 1). P(B/M 1) + P(M 2). P(B/M 2) + P(M 3). P(B/M3)
i=l
= 0,6. 0,98 + 0,3. 0,96 + 0,1 0,94 = 0,97
364 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
7.6.3. Teorema de Boyes
Admitimos las mismas hiptesis de partida del teorema de la proba-
bilidad total. Es decir, sean n-sucesos disjuntos A
1
, ... , An E .stl, con
P(A;) > O y tales que forman un sistema completo de sucesos, entonces
para cualquier suceso B E .stl, se verifica:
P(A;) P(B/ AJ
n
P(AJB) =
L P(A;)P(B/A;)
i=l
Demostracin:
Teniendo en cuenta las expresiones [7.8] y [7.9], tenemos que:
P(AnB) = P(AJP(B/AJ = P(B)P(AJB)
y de aqu deducimos que
P(AJB) = P(AJP(B/AJ
P(B)
[7.13]
y teniendo en cuenta el valor dado a P{B), en el teorema de la probabilidad
total [7.12], resulta:
P(AJB) =
P(A;) P(B/AJ
n
L P(AJP(B/A)
i=l
Examinando ambos teoremas se pone de manifiesto que el teorema de
Bayes, en cierto modo, responde a la inversa de como lo hace el teorema de
la probabilidad ttal, pues en este ltimo se han realizado los sucesos A; y
entonces hacemos inferencia sobre la realizacin del suceso B, sin embargo, en
el teorema de Bayes de la realizacin del suceso B inferimos sobre la realiza- '
cin de cada A.
En ambos teoremas partimos de un sistema completo de sucesos A. i = 1
2, ... , n, los cuales pueden ser interpretados como hiptesis, a sus
P(AJ se les llama probabilidades a priori, ya que son las que se asignan
inicialmente a los sucesos A, y a las probabilidades P(B/AJ se les considera
como verosimilitudes del suceso B admitiendo la hiptesis A;. Estas verosimi-
,
PROBABILIDAD 365
litudes nos permiten modificar nuestro grado de creencia original, obteniendo
la probabilidad a posteriori P(AJB). En resumen, diremos que es muy corriente
llamar a las probabilidades que aparecen en la expresin [7.13] del teorema
de Bayes como sigue:
P(AJ: Probabilidades a priori, se asignan inicialmente al suceso.
P(AJB): Probabilidades a posteriori.
P(B/A;): Verosimilitudes.
Podemos decir que el teorema de Bayes, adems de ser una aplicacin de
las probabilidades condicionadas, es fundamental para el desarrollo de la
estadstica bayesiana, la cual utiliza la interpretacin subjetiva de la probabi-
lidad, es decir, considera que la probabilidad viene afectada por la experiencia
previa, la cual va a influir en nuestro grado de creencia y consecuentemente
en la probabilidad que le asignamos al suceso en cuestin, y sta sera una
probabilidad subjetiva.
Ejemplo 7.7
Un banco analiza las fechas de los cheques que emiten sus clientes y llega
a la conclusin de que las personas que tienen fondos en su cuenta corriente
emiten cheques con fecha posterior, solamente en un 0,2 % de los casos. Sin
embargo, el 95 % de las personas que no tienen fondos en su cuenta corriente
emiten cheques con fecha posterior. Tambin se conoce que en general la
proporcin de cheques que llegan a la ventanilla del banco y que tienen fondo
es del 92 %. En un determinado instante se recibe un cheque en caja con fecha
atrasada, determinar la probabilidad de que ese cheque sea de un cliente que
no tiene fondos en su cuenta.
Solucin:
A
1
: El cheque que se recibe es de un cliente sin fondos.
A
2
: El cheque que se recibe es de un cliente con fondos.
B: El cheque que se recibe tiene fecha atrasada.
Del enunciado tenemos que:
P{A
1
) = 0,08; P(A
2
) = 0,92; P(B/A
1
) = 0,95; P(B/A2) = 0,002
Nos piden P(AjB) que ser segn la expresin [8.12] del teorema de
Bayes:
P{A
1
) P(B/ A
1
)
P(AjB) = P(A
1
) P(B/A
1
) + P(A
2
) P(B/A
2
)
0,08 0,95
0,98
0,08. 0,95 + 0,92. 0,002
366 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
7.7. Independencia de sucesos
En el apartado 7.6 definamos la probabilidad del suceso B condicionada
por el suceso A, P(B/A), y considerbamos que la informacin que se tiene del
suceso A tiene algn efecto sobre la probabilidad del suceso B, de tal manera
que podremos decir:
Cuando P(B/A) > P(B) entonces el suceso A favorece al B, y
Cuando P(B/A) < P(B) entonces el suceso A desfavorece al B.
Si admitimos que la ocurrencia del suceso A no tiene ningn efecto sobre
el suceso B, y consecuentemente la P(B/A) es igual a la probabilidad marginal,
P(B), es decir
P(B/A) = P(B)
entonces el suceso B es independiente del suceso A, surgiendo as el concepto
de independencia estocstica o independencia de sucesos.
Diremos que dos sucesos A y B son independientes si se verifica una
cualquiera de las siguientes condiciones equivalentes:
l. P(B/A) = P(B), si P(A) >O.
2. P(A/B) = P(A), si P(B) >O.
3. P(A n B) = P(A) P(B).
Estas tres condiciones son equivalentes, en efecto:
P(AnB)
P(B/A) = P(A) , si P(A) >O
si B es independiente de A,
de donde
P(A nB)
P(B/A) = P(B) = P(A)
P(A n B) = P(A) P(B)
pero, tambin sabemos que
P(AnB)
P(A/B) = P(B) , si P(B) > O
de donde
P(A n B) = P(B) P(A/B)
[7.14]
[7.15]
1
1
PROBABILIDAD 367
igualando las expresiones [7.14] y [7.15],
P(A) P(B) = P(B) P(A/B)
luego
P(A) = P(A/B)
y las tres condiciones son equivalentes.
Por tanto, podemos decir que si el suceso B es independiente del suceso
A, entonces el suceso A tambin es independiente del suceso B, lo que equivale
a decir que ambos sucesos son mutuamente independientes.
La definicin de independencia se puede extender a ms de dos sucesos.
As pues, diremos que los sucesos A, B y C son independientes si se verifican
las siguientes condiciones.
l. P(A n B) = P(A) P(B).
2. P(A n C) = P(A) P(C).
3. P(B n C) = P(B) P(C)
4. P(A n B n C) = P(A) P(B) P(C).
Las tres primeras condiciones indican la independencia dos a dos, y para
que sean los tres sucesos independientes en su conjunto o mutuamente iilde-
pendientes se tiene que verificar tambin la cuarta condicin.
En general, diremos que n-sucesos A
1
, A
2
, ... , An son mutuamente indepen-
dientes, o en su conjunto, si se verifican para
..
las siguientes condiciones:
P(A n Ai) = P(A) P(A)
P(A n Ai n Ak) = P(AJ P(Ai) P(Ak)
El nmero de condiciones sern:
(;) + (;) + ... + (:) = 2"- n- 1
368 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
ya que del binomio de Newton tenemos:
2" = (1 + )" = f (n)
x=O X
= + G) + xt2 (:)
= 1 + n + f (n)
x=2 X
Si solo se verifican las G) primeras condiciones entonces diremos que son
independientes dos a dos.
Ejemplo 7.8
En una gran ciudad se venden tres peridicos, y se sabe por diferentes
estudios que el 20 % leen el peridico A, el 30 % el peridico B, el 40 % el
peridico e, el 6 % leen el A y el B, el 7 % leen el B y e y el 12 % leen el A
y C. Decir si son independientes los sucesos leer cada uno de los peridicos.
Soluci6n:
Sean los sucesos:
A: Leer el peridico A.
B: Leer el peridico B.
C: Leer el peridico C.
Las respectivas probabilidades son:
P(A) = 0,2, P(B) = 0,3, P(e) = 0,4
P(A n B) = 0,06, P(B n C) = 0,07, P(A n C) = 0,12
P(A nB) 0,06
P(A/B) = P(B) = 0,
3
= 0,2 = P(A) => A y B independientes
P(An C) O 12
P(A/C) = P(C) = ,
4
= 0,3 "# P(A) => A y e no independientes
PROBABILIDAD 369
P(B/C) = P(B n C) = 0,0
7
= 0,175 "# P(B) => By e no
P(C) 0,4
Una consecuencia inmediata de la definicin de independencia de sucesos
la podemos dar mediante el siguiente teorema.
Teorema 7.9
Si A y B son dos sucesos independientes entonces tambin lo son los
sucesos
A y B, A y B y A y B
Demostraci6n:
Si A y B son independientes entonces se verifica que
y tendremos:
P(A/B) = P(A)
P(B/A) = P(B)
P(A n B) = P(A) P(B)
P(A/B) = 1 - P(A/B) = 1 - P(A) = P(A) => A y B independientes
P(B/A) = 1 - P(B/A) = 1 - P(B) = P(B) => A y B independientes
- - P(A n B) P(AuB) 1 - P(A u B)
P(A/B) = P(B) = P(B) = P(B)
1 - [P(A) + P(B) - P(A n B)] =
P(B)
1 - P(A) - P(B) + P(A) P(B) =
P(B)
[1 - P(A)] [1 - P(B)] =
P(B)
= P(A) P(B) = P(A) => A y B independientes
P(B)

l. En una divisin empresarial trabajan 18 hombres y 12 mujeres. Se selec-
cionan 3 persona al azar y con igual probabilidad para cada trabajador. Hallar
la probabilidad de que todas las personas seleccionadas sean mujeres.
Solucin:
Sean los sucesos: S;: ser mujer la seleccionada en la i-sima extraccin,
i = 1, 2, 3.
3
El suceso cuya probabilidad nos piden es: n S;.
i=l
Aplicando la regla del producto:
Hemos aplicado la regla de Laplace para el clculo de cada probabilidad,
de S
1
, (S
2
1 S
1
) y (S
3
I S
1
n S2).
El suceso (S
2
I S
1
) indica que en la segunda seleccin se obtiene a una mujer,
siempre que en la primera seleccin se obtuvo otra mujer que no podr ser
seleccionada en sucesivas extracciones. El suceso (S
3
IS
1
11 S
2
) indica que se
selecciona una mujer, supuesto que previamente se seleccionaron otras dos que
no podrn volver a ser seleccionadas en la tercera extraccin.
2. En un pedido de 10 electrodomsticos se sabe que uno de ellos est
defectuoso de fbrica. En un da se venden 3 de ellos. Calcular la probabilidad
de que se vendan tres en buen estado.
Solucin:
Sean los sucesos: Bi: el i-simo electrodomstico vendido est en Buen
estado, i = 1, 2, 3.
El suceso cuya probabilidad nos piden es B
1
11 B
2
11 B
3

1
1
l,
-1
PROBABILIDAD 371
Razonando de modo similar al ejercicio anterior,
3. Un lote de 5 piezas tiene una defectuosa. En el envo del lote de la fbrica
al comerciante, se pierde una de las 5 piezas en el transporte. De las cuatro
piezas que llegan se examina una de ellas y resulta ser no defectuosa. Cul
es la probabilidad de que la pieza perdida sea la defectuosa?
Solucin:
De fbrica hay 4 buenas y 1 defectuosa.
Se pierde una en el transporte, con lo que pueden llegar:
A
1
= 4 buenas, con probabilidad 1/5,
P(A
1
) = 1/5.
A
2
= 3 buenas y 1 defectuosa, con probabilidad 4/5,
P(A
2
) = 4/5.
Se selecciona una pieza de A
1
o A
2
y resulta ser buena (Suceso que
llamamos B). La pro habilidad pedida es:
P(A
1
IB).
Es decir si la seleccionada al final es buena, la probabilidad del suceso A1
es la de qu; haya al final 4 buenas y por ello la 5. perdida era defectuosa.
A
1
y A
2
son dos sucesos mutuamente excluyentes y exhaustivos. Por ello
podemos aplicar la frmula de Bayes con n = 2,
P(A
1
IB) = P(A
1
) P(BIA
1
) + P(A
2
) P(BIA
2
)
1/5 1 1/5 1
1/5. 1 + 4/5. 3/4 1/5 + 3/5 4
Podemos deducir tambin que:
1 3
P(A
2
1 B) = 1- P(A1 I B) = 1- = 4'
372 CASAS-SNCHEZ, J. M. y SANTOS-PEl'TAS, J.
es decir, si la pieza examinada del lote que se recibe es buena, la probabilidad
de que se haya perdido en el transporte una pieza buena, es 3/4.
4. Una empresa dispone de tres factoras que producen 1.000, 2.000 y 4.000
productos respectivamente. La proporcin de productos que no superan el
control de calidad es de 0,01; 0,02 y 0,03 respectivamene.
Calcular:
a) La probabilidad de que un producto de la empresa no supere el control
de calidad.
b) Si se observa un producto y supera el control de calidad, cul es la
probabilidad de que haya sido fabricado en la 3.a factora?
Soluci6n:
a) Cualquier producto ha sido fabricado en la La, 2.a o r factora y slo
en una de ellas. Llamamos F
1
, F
2
y F
3
al suceso El producto ha sido
fabricado en la I.R, 2.a 3.a factora respectivamente.
Llamamos e al SUCeSO SUpera el Control de calidad de la empresa y C ser
su complementario.
Por el teorema de la probabilidad total,
P(C) = P(F
1
)P(CIF
1
) + P(F
2
)P(CIF
2
) + P(F
3
)P(CIF3) =
1.000 2.000 4.000
= 7.000 o 0,01 + 7.000 o 0,02 + 7.000 o 0,03 =
1 4 12 17
=-+-+-=-
700 700 700 700
4
b) P(F l C) = P(F3)P(e!F3) = P(F3)[1- P(CIF3)] = 7 (
1
-
0
'
03
)
3
P(C) 1 - P(C) 17
4
-70,97
388

700
1
-700
Apli_cando la definicin de probabilidad condicionada, y usando la propie-
dad P(S) = 1 - P(S), y el apartado a) de este mismo ejercicio.
A

('
Y

f
il
PROBABILIDAD 373
5. En una exposicin nutica se han presentado 30 embarcaciones de recreo
y 38 de tipo industrial, pesquero o de servicios (polica, Cruz Roja, etc.). Un
visitante ha hecho un pedido de 2 embarcaciones distintas, entre las expuestas.
Sabiendo que cada embarcacin tiene la misma probabilidad de que se ad-
quiera, y adems que una de la 2 embarcaciones pedidas es de recreo, calcular
la probabilidad de que la otra tambin sea de recreo.
Soluci6n:
I.Jamamos R; al suceso consistente en pedir una embarcacin de recreo en
i-simo lugar, sin reemplazo de otra similar a la exposicin antes del siguiente
pedido unitario i + 1.
Nos piden la probabilidad del suceso:
29
P(R
2
IR
1
) =
67
(por la regla de Laplace),
o bien por la definicin de probabilidad condicionada
P(R1 n R2) e3o 2/ e6s 2 /
P(R2IR
1
) = P(R) =e . e . = (30)/(68) =
1 30.1 68,1
1 1
30 29/68 o 67
2 2 29
30/68 67"
6. En un pas, la probabilidad de que una empresa industrial contamine, si
hay ley ecolgica, es de 0,01. La probabilidad de que se promulgue una ley
ecolgica es 0,5, y la probabilidad de que una empresa industrial contamine
es 0,1. Calcular:
a)
b)
e)
d)
La probabilidad de que la empresa no contamine y haya ley ecolgica.
La probabilidad de que contaminando la empresa, haya ley ecolgica.
La probabilidad de que no habiendo ley ecolgica, la empresa no
contamine.
La probabilidad de que habiendo ley ecolgica, la empresa no conta-
mine.
374 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Soluci6n:
Llamamos L al suceso Se promulga ley ecolgica, y e al la
empresa contamina. Datos del problema:
P(eiL)=0,01 ; P(L)=0,5 ; P(e)=0,1
a) P( e 11 L) = P(L) P(CIL) = 0,5 [1 - P( CIL)] = 0,5 [1 - 0,01] =
= 0,5 . 0,99 = 0,495
b) P(L 11 C) P(L) - P( e 11 L) 0,5 - 0,495 0,005 1
P(LI C) = P(C) = P(C) = 0,1 = (},1 = 20
- - P(e 11L) 0,405 0,405 0,405 405 81
e) P(eiL) = P(L) = 1- P(L) = 1-0,5 = 0:S = 500 = 100 =
0
'
81
Puesto que:
1- P(C) = P(C) = P(e11L) + P(e11L) = 0,495 + P(e11L) =>
= p( e 11 L) = o,9 - o,495 = 0,405.
- P(e11L) 0,495 495 99
d) P(eiL) = P(L) = 0:S = 500 = 100 =
0
'
99

De este ejemplo terico se deduce que de no haber ley ecolgica a haberla,
la probabilidad de que la empresa no contamine aumenta del 81% (aparta-
do e)) al 99 % (apartado d)).
7. Una estantera del jefe de contabilidad de una empresa tiene 10 libros de
facturacin de bienes de consumo familiar y 11 libros de facturas de bienes de
servicios y maquinaria para otras empresas. Al pasar el servicio de limpiezas
deja en desorden esta clasificacin. El jefe de contabilidad, al consultar un libro
de facturas del primer grupo de 10 observa que est mal clasificado pues
corresponde al segundo grupo. Cul es la probabilidad de que sea el nico
libro mal clasificado del primer grupo de 10 libros?
Soluci6n:
Si llamamos A
1
al suceso el primer grupo tiene un solo libro mal clasifi-
cado y B al suceso al extraer un libro del primer grupo, el libro est mal
clasificado, la probabilidad pedida es:
PROBABILIDAD 375
P(A
1
11 B) P(A
1
) P(B 1 A
1
)
P( A
1
1 B) = = --:-
1
-=-
0
..:........!"----:...._:_____:.:_
P(B) I P(A) P(B 1 A)
i=O
llamando A al suceso el primer grupo tiene i libros mal clasificados,
i =O, 1, 2, ... , 10. {A;}{2
0
es una coleccin de sucesos mutuamente excluyentes
y exhaustiva, por lo que aplicamos el teorema de la probabilidad total:
P(B) = P(A) P(B 1 A;) = (ya que P(B 1 A0 ) = O)
10 (11)( 10 )
i 10- i i
110
--- 0,000059
1.847.560
8. Un editor cuenta con dos procesadores de texto, A y B. Las probabilida-
des de que fallen son la misma, P, para A y B, pero el procesador A admite
un fallo, mientras que B admite dos fallos antes de averiarse. Qu probabili-
dad tiene el suceso A se avera antes que B? Determinarla si P = 0,05.
376 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Solucin:
Sean FA y F B los sucesos falla A y falla B dos veces. Sus probabilidades
son:
y
respectivamente. El suceso cuya probabilidad se pide es: FA n FB.
donde hemos supuesto la independencia de los sucesos FA y F B y de aqu:
P(FAnFB) = P- PP
2
= P- P
3
=
= P(1 - P
2
) = 0,049875 (si P = 0,05)
9. Una publicidad sobre cierto producto consta de 10 pginas con precios.
Antes de proceder a su reproduccin impresa, un experto en mrketing ha
detectado un error tipogrfico en el precio de un accesorio del producto,
adems de que asegura que es el nico error. Un empleado descuid anotar
dnde estaba el error por lo que debe revisar las pginas. Si ha revisado 2
pginas y no tienen error, cul es la probabilidad de que el error est en una
3.a pgina?
Solucin:
1
Llamamos E al suceso el error est en la 3.a pgina que revisa P(E) = 8
(aplicando la regla de Laplace).
' Como suceso condicionado, sea D el suceso no hay error en las dos
pginas revisadas, y as la probabilidad pedida es:
9 8 1
P(E n D) 10 9 8 1
P(EID) = P(D) ~ s
10 9
ya que D = D
1
n D
2
siendo D; =no hay error en la i-sima pgina revisada
(i = 1, 2). Por ello:
PROBABILIDAD 377
y
10. Un tetraedro regular tiene 4 caras (tringulos equilteros) numeradas
con los nmeros 1, 2, 3 y 4 respectivamente. Se lanza al aire y se observa la
cara inferior (base) al detenerse. El tetraedro est bien construido y por ello
la probabilidad de cada cara es la misma. Son independientes en probabilidad
los sucesos S
1
= {1 o 2}, S
2
= {1 o 3} y S
3
= {2 o 3}?
Solucin:
pero:
Luego son sucesos (S
1
, S
2
y S
3
) estocsticamente dependientes o dependientes
en probabilidad. Aunque, eso s, son independientes dos a dos.
11. Una empresa distribuye productos agrcolas, ganaderos y pesqueros,
para la alimentacin. Su calidad puede ser de primera o no. Las probabilidades
de que un artculo agrario, ganadero o pesquero, sea de primera calidad, son
respectivamente 0,6, 0,5 y 0,7. Las proporciones de productos agrcolas, gana-
deros y pesqueros son del 45 %, 35% y 20 %, respectivamente.
378
CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Se pide:
a) La probabilidad de que un producto de primera calidad de la empresa,
sea agrario.
b) dem, sea ganadero.
e) dem, sea pesquero.
Solucin:
Sean los sucesos A, G y P (productos Agrarios, Ganaderos y Pesqueros).
Sea I el suceso el producto es de primera calidad.
Sabemos que:
P(I 1 A) = 0,6}
P(II G) = 0,5
P(IIP) = 0,7
P(A) = 0,45}
P(G) = 0,35
P(P) = 0,2
Adems A, G y P constituyen una coleccin de sucesos mutuamente
excluyentes y exhaustiva. Por todo ello, aplicando el teorema de Bayes,
tenemos:
P(A) P(I 1 A) 0,45 0,6 _ 0,27 _ 270 _ 54 _ 18 _ .i_
a) P(A 1 /) = P(I) = 0,585 - 0,585 - 585 - 117 - 39 - 13.
P(I) = P(A)P(IIA) + P(G)P(IIG) + P(P)P(IIP) =
= 0,45. 0,6 + 0,35. 0,5 + 0,2. 0,7 = 0,27 + 0,175 + 0,14 = 0,585
P(G) P(I 1 G) 0,175 35
b) P(G 1 /) = P(I) = 0,585 = 117
P(P)P(II P) 0,14 140 28
e) P(P l I) = P(I) = 0,585 = 585 = 117
o tambin poda calcularse as:
54 35 28
P(P 1 /) = 1 - P(A 1 /) - P(G 1 I) = 1 -m -
117
=m
dado que P u A u G es el suceso universal, y los sucesos P, A y G son disjuntos
dos a dos.
PROBABILIDAD 379
12. En un taller hay 3 mquinas la primera se avera al mes con probabi-
lidad 0,04, la segunda con 0,06, y la tercera con 0,1. Sus averas son indepen-
dientes en probabilidad. Se pide:
a) Probabilidad de que se avere una sola mquina en el mes.
b) Probabilidad de que se averen las tres mquinas.
e) Probabilidad de que se averen la primera y segunda, pero no la
tercera.
Solucin:
Teniendo en cuenta que si los sucesos I, JI y /JI son independientes en
probabilidad, tambin lo son cualquier combinacin de ellos o sus comple-
mentarios tomados de 3 en 3. (Vase el ejercicio 15).
a) El suceso a calcular su probabilidad, es:
A = (In JI n JI!) u (in JI n JI/) u (f n JI n JI/)
donde representamos por /, JI o JI/ a los sucesos se avera la mquina
primera, segunda o tercera, respectivamente.
P(A) = P(I n JI n JI/) + P(i n JI n /JI) + P(i n JI n /JI) =
= P(I) P(I I) P(JI I) + P(I) P(JI) P(JI I) + P(I) P(I I) P(JI /) =
= 0,04. 0,94. 0,9 + 0,96. 0,06. 0,9 + 0,96. 0,94. 0,1 =
= 0,03384 + 0,05184 + 0,09024 = 0,17592
b) P(I n JI n JI/) = P(I) P(JI) P(IJI) = 0,04 0,06 0,1 = 0,00024
e) P(I n JI n JI!) = P(I) P(II) P(JII) = 0,04 0,06 0,9 = 0,00216
13. De un producto de consumo bsico ofrecido por una empresa, se sabe
que la probabilidad de satisfacer las exigencias del posible cliente es 0,901, la
de que un cliente vuelva a serlo es 0,91, y la probabilidad de satisfacer al cliente
si ste ha vuelto a serlo (cliente), es de 0,99. Se pide:
a) La probabilidad de que habiendo satisfecho al cliente, ste vuelva a
serlo (cliente).
b) La probabilidad de que no habiendo satisfecho al cliente, ste vuelva
a ser cliente.
380 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
Solucin:
Llamamos S al suceso cliente satisfecho y V al suceso vuelve a adquirir
el producto.
P(V)P(SIV) 0,91 0,99
a) P(VIS) = P(S) = 0,
901
!:!:: 0,999889.
- P(V)P(SIV) 0,91 0,01
b) P(VIS} = P(S) = 0,0
99
!:!:: 0,0919191.
La satisfaccin del cliente prcticamente asegura que vuelva a ser cliente,
mientras que si no se le satisface no vuelve a serlo (cliente) en ms del 90%
de los casos.
14. Probar, que si los sucesos A y B son independientes en probabilidad,
tambin lo son:
a) A y B.
b) A y B.
e) A y B.
Solucin:
A y B son independientes si y slo si P(A 11 B) = P(A) P(B).
a) A y B son independientes si y slo si verifican
P(A 11 B) = P(A) P(B).
Como B = (A 11 B) v (A 11 B), unin de sucesos disjuntos. Luego
P(B) = P(A11B) + P(A11B) =>
P(A 11 B) = P(B) - P(A 11 B) = P(B) - P(A) P(B) =
= [1 - P(A)] P(B) = P(A) P(B),
al ser A y B independientes en probabilidad.
PROBABILIDAD 381
a)
b) A y B independientes => B y A independientes => B y A inde-
pendientes => A y B independientes.
b) - a) -
e) A y B independientes => A y B independientes => A y B inde-
pendientes.
15. Probar, que si los sucesos A, By C son independientes en probabilidad,
tambin lo son:
a) A, By C.
b) A, By C.
-- -
e) A, By C.
d) Ay B11C.
e) A y BvC.
f) A y BAC.
g) A y B- C.
h) AyC-B.
Solucin:
{
A y B independientes
A y C independientes
a) A, B y C independientes B C . d di
y m epen entes
y adems: P(A 11 B 11 C) = P(A) P(B) P( C).
Por el ejercicio 14, entonces: A y' B independientes
A y e independientes
B y C independientes y adems:
B 11 C = (A 11 B 11 C) v (A 11 B 11 C),
382 CASAS-SNCHEZ, J. M. y SANTOS-PEAS, J.
unin disjunta, por lo que de la axiomtica de Kolmogorov (axioma III),
P(B n C) = P(A n B n C) + P(A n B n C) =>
P(A n B n C) = P(B n C) - P(A n B n C) = P(B) P(C) - P(A) P(B) P(C) =
= [1 - P(A)] P(B) P(C) = P(A) P(B) P(C),
por lo que A, B y C son independientes en probabilidad.
b) A, B y e independientes ,:;_ A, B y C independientes => B, A
a)-- --
Y e independientes => B, A y e independientes => A, B y e indepen-
dientes.
b) --
e) A, B y e independientes => A, B y e independientes => e, A
y B independientes ,:;_ e, A y B independientes => A, B y e
independientes.
d) P[A n (B n C)] = P(A) [P(B) P(e)] = P(A) P(B n e).
e) P[A n (Bu C)] = P[(A n B) u (A n C)] =
= P(A n B) + P(A n C) - P(A n B n C) =
= P(A)P(B) + P(A)P(C)- P(A)P(B)P(C) =
= P(A) [P(B) + P(C)- P(B)P(C)] = P(A)[P(B) + P(C)- P(B n C)J =
= P(A) P(B u C).
f) P[A n (BLl C)] = P{A n [(B n C) u (jj n C)]} =
= P[(A n B n e) u (A n B n C)] =
= P(A n B n C) + P(A n B n C) = P(A) P(B) P(C} + P(A) P(B) P( C) =
= P(A)[P(B) P(C) + P(B) P(C)] = P(A) P[(B n C) u (B n C)] =
= P(A) P(B Ll C).
g) P[A n (B- C)] = P(A n B n C) = P(A)P(B n C) = P(A)P(B- e).
g)
h) A, B y e independientes => A, e y B independientes => A y e - B
independientes.
PROBABILIDAD 383
16. Un sistema de seguridad tiene una probabilidad 0,05 de que se produzca
un peligro al da. La probabilidad de que se active el sistema un da, habiendo
peligro es de 0,99. La probabilidad de que se active el sistema un da, no
habiendo peligro es del 0,02. Calcular:
a) La probabilidad de que habindose activado el sistema de seguridad,
haya efectivamente peligro.
b) La probabilidad de que haya peligro pero no se active el sistema.
Solucin:
Llamamos: P al suceso Se produce peligro un da.
Datos:
A al suceso Se activa el sistema de seguridad.
P(P) = 0,05
f(A 1 f.) = 0,99
P(A 1 P) = 0,02
a) _ P(P) P(AIP) = 0,0495 = 495 = ,...,
7226277
P(P 1 A) - P(A) 0,0685 685 137 - O, .
P y P son una colecccin de sucesos mutuamente excluyentes y ex-
haustivos por lo que podemos hacer uso del Teorema de la Probabi-
lidad Total:
P(A) = P(P) P(AIP) + P(P) P(AIP) = 0,05 0,99 + 0,95 0,02 =
= 0,0495 + 0,019 = 0,0685
b) P(P nA) = P(P) P(AIP) = P(P) [1 - P(AIP)] = 0,05 (1 - 0,99) =
= 0,05. 0,01 = 0,0005
Bibliografa
ARANDA, J., GMEZ, J.: lntroducci6n a la Estadstica Econ6mica y Empresarial.
DM PPU, 1992.
ARNAIZ, G.: lntroducci6n a la Estadstica Te6rica. Lex Nova, 1986.
BARO, S.: Estadstica Descriptiva. Parramn, 1985.
CALOT, G.: Curso de Estadstica Descriptiva. Paraninfo, 1982.
CASA ARUTA, E.: 200 Problemas de Estadstica Descriptiva. Vicens Vives, 1990.
CASAS, J., CALLEALTA, J., NUEZ, J., TOLEDO, l., UREA, C.: Curso Bsico de
Estadstica Descriptiva. Instituto Nacional de Administracin Pblica,'
1986.
CASAS, J., SANTOS, J.: Introducci6n a la Estadfstica para Economa y Adminis-
traci6n de Empresas. Ed. Centro de Estudios Ramn Areces, 1996.
COQUILLAT, F.: Estadfstica Descriptiva: Metodologa y Clculo. Tebar Flores,
1991.
DUR, J. M.; LPEZ, J. M.: Fundamentos de Estadstica. Ariel, 1988.
ESCUDER, R.: lntroducci6n a la Estadstica Econ6mica. Tebar Flores, 1986.
FREMANO, L.: Elementos de Estadstica Aplicada. Euramrica, 1971.
INE: Metodologa. ndice de Precios de Consumo. Base, 1992.
KAZMIER-DfAZ, M.: Estadstica Aplicada en Administraci6n y Economa.
McGraw Hill, 1992.
LBEZ URQUA, J.: Estadstica Intermedia: Descriptiva, Probabilidades y Te6-
rica, Muestreo, Actuarial. Vicens-Vives, 1989.
MONTIEL, A., Rius, F., BARN, F.: Elementos Bsicos de Estadstica Econ6mica
y Empresarial, Prentice Hall, 1997.
PEA, D., ROMO, S. lntroducci6n a la Estadstica para las Ciencias Sociales,
McGraw-Hill, 1997.
386 BIBLIOGRAFA
PREZ SUREZ, R.: Anlisis de Datos Econmicos J. Mtodos Descriptivos.
Pirmide, 1993.
PULIDO, A., SANTOS, J .. : Estadstica Aplicada para ordenadores personales.
Pirmide, 1998.
SIERRA BRAVO, R.: Ciencias Sociales: Anlisis Estadstico y Modelos Matem-
ticos. Paraninfo, 1981.
URIEL, E., MUlZ, M.: Estadstica Econmica y Empresarial. AC, 1988.
WONNACOTI, T.: Fundamentos de Estadstica para Administracin y Economa.
Limusa, 1981.
LffiROS DE EJERCICIOS
BARO, J.: Estadstica Descriptiva. Aplicaciones Econmico-Empresariales. Parra-
mon, 1985.
CASA ARUTA, E.: 200 Problemas de Estadstica Descriptiva. Vicens-Vives, 1979.
CASAS, J. M., GARdA, C., RIVERA, L. F., ZAMORA, A. I.: Problemas de Es-
tadstica Descriptiva. Probabilidad e Inferencia.
FERNNDEZ, C, FUENTES, F.: Curso de _Estadstica Descriptiva, Terico y Prc-
tica. Ariel, 1995.
GARCA BARBANCHO, A.: Ejercicios de Estadstica Descriptiva para Economis-
tas. Ariel, 1975.
LPEZ ORTEGA, J.: Problemas de Estadstica para Ciencias Econmicas y Em-
presariales: Clculo de Probabilidades. Tebar, 1994.
MU1\ioz V ZQUEZ, A. y otros: Problemas de Estadstica Descriptiva, 1992.
MURGUI, J. S., AYBAR, C., y otros: Estadstica para Economa y Administracin
de Empresas: Aplicaciones y Ejercicios. Puchades, 1992.