Вы находитесь на странице: 1из 68

Universidad de Morón - Facultad de Ciencias Económicas y Empresariales UM

LICENCIATURA EN
ADMINISTRACIÓN

Estadística
Módulo I - Estadística Descriptiva

Autora Lic. Irene Alicia Montagut


ÍNDICE

Unidad 1: Conceptos Básicos 5


Desarrollo de la Unidad 7
Ideas Previas 7
Primeras Definiciones 8
Aclaraciones Importantes 10

Unidad 2: Series de Frecuencias 13


Pasos a Seguir Para Generar una Serie de Frecuencias 16
Métodos para Confeccionar una Serie de Frecuencias 16
Serie Simple 16
Serie de Datos Agrupados 18

Unidad 3: Medidas de Posición de Series de Frecuencias 23


Medidas Caracteristicas 25
Media Aritmética 26
Modo 29
Mediana 30
Cuantiles (o Fractiles) 33
Cuartiles 33
Deciles 35
Percentiles 35
Media Armónica 36
Media Geométrica 36
Síntesis de las Principales Fórmulas vistas en Estadística Descriptiva 37

Unidad 4: Medidas de Dispersión de Series de Frecuencias 39


Medidas de Dispersión 41
Medidas de Dispersión Absolutas 41
Rango 41
Desvio Estandar 42
Varianza 42
Desvío Medio 42
Desvío Modal 43
Desvío Mediano 43
Medidas de Dispersión Relativas 43
Coeficiente de Variabilidad 43
Coeficiente de Variabilidad Media 44
Coeficiente de Variabilidad Modal 44
Coeficiente de Variabilidad Mediano 44
Aplicaciones de las Medidas de Dispersión 45

Universidad de Morón 3
ESTADÍSTICA

Unidad 5: Series Cronológicas 47


Definición 49
Etapas que Abarca su Estudio 49
Movimientos Sistemáticos 50
1 - Variables 50
2 - Tabulación 50
3 - Representación Gráfica 53
4 - Análisis de sus Componentes 53
Tendencia 53
Estacionalidad 55
Movimientos Cíclicos o Componente Cíclica 58
Movimientos Aleatorios 58

Unidad 6: Regresión y Correlación Bivariada 61


Ideas Previas 63
Coeficiente de Correlación 66

4 Licenciatura en Administración
UNIDAD 1

CONCEPTOS BÁSICOS

Contenidos

Definición de estadística. Aplicación. Población, subconjuntos poblacionales. Variables,


clasificación. Etapas del estudio estadístico.

Objetivos

Que el alumno logre:

• Conocer el significado de Estadística y sus áreas de aplicación.


• Incorporar el concepto de variables.
• Reconocer los distintos tipos de variable.
• Internalizar el concepto de población, reconocer sus posibles subconjuntos y el alcance del
estudio de cada uno de ellos.
• Definir las distintas etapas del estudio estadístico y lo que abarca cada una de ellas.
ESTADÍSTICA

6 Licenciatura en Administración
UNIDAD 1

CONCEPTOS
BÁSICOS 1
DESARROLLO DE LA UNIDAD En esta Unidad

Desarrollo de la Unidad 7
Para introducirnos en la materia, veamos algo importante.
Ideas Previas 7
Las primeras preguntas que aparecen al comenzar el estudio de esta materia
Primeras Definiciones 8
son:
Aclaraciones Importantes 10
- ¿Qué es la Estadística?
- ¿Qué aspectos abarca?
- ¿Cuál es la utilidad que puede ofrecerme en mi profesión?
Las respuestas son diversas. Más adelante intentaremos algunas.

IDEAS PREVIAS
Antes de dar una definición de los principales conceptos de la estadística
o de hablar de sus objetivos, daremos algunos ejemplos de sus campos de
aplicación.
Así si se aborda el estudio del precio de los campos en una cierta zona, al
tener el registro de los precios por hectárea que se hubiese obtenido en los
últimos cinco años por sus ventas, algunas de las preguntas que podrían
plantearse respecto de ese suceso, serán:
1. ¿Cuál fue el precio promedio?
2. ¿Hubo algún precio que se repitió en mayor número de veces que otro?
3. ¿Más de cuánto es el valor por hectárea que correspondió al 50% de
las transacciones registradas? ¿Menos de cuánto al 20% de ellas?
4. ¿A lo largo del tiempo el valor, tuvo un crecimiento o decrecimiento
sostenido?
5. ¿Existieron en cada año, meses en los que sistemáticamente los
precios fueran más altos?
¿O más bajos? ¿En que proporción?
6. ¿El precio obtenido en cada momento, estuvo relacionado con el precio
del dólar? ¿O con el precio del girasol a futuro? ¿O con el de algún otro
bien?
7. ¿Podemos encontrar alguna expresión que nos permita estimar el precio
de la hectárea para el próximo año? ¿Será confiable esa estimación?

Universidad de Morón 7
ESTADÍSTICA

Bien, las respuestas a estas preguntas y a muchísimas más, podrán obtenerse aplicando las
La técnicas que nos brinda la ESTADÍSTICA.
ESTADÍSTICA Primero diremos que:
es una rama de
La estadística es una rama de la matemática aplicada que comprende métodos y
la matemática
aplicada que algoritmos por medio de los cuales se podrá recolectar, organizar, elaborar y analizar
comprende información respecto de un conjunto de entes con el fin de extraer conclusiones válidas de
métodos y su comportamiento o relaciones.
algoritmos por Luego veremos que de esta misma definición surgen los pasos a seguir para lograr el objetivo
medio de los buscado.
cuales se podrá En cuanto a los aspectos que abarca la estadística, estos dependen de la etapa del estudio
recolectar,
correspondiente.
organizar,
Así tendremos tres etapas:
elaborar
y analizar • Etapa descriptiva.
información • Etapa analítica.
respecto de • Etapa inferencial.
un conjunto de
entes con el Analicemos que es lo que veremos en cada una de ellas.
fin de extraer
conclusiones
Etapa Descriptiva
válidas de su
comportamiento
o relaciones. Series de frecuencias.
Series cronológicas.
Regresión y correlación bivariada.

Etapa Analítica

Probabilidad, concepto, Teorías para su cálculo. Teoremas fundamentales.


Modelos probabilísticos, discretos y continuos.
Modelos no paramétricos (este tema no lo trataremos en esta unidad).

Etapa Inferencial

Muestras. Métodos de muestreo


Teoría de la estimación.
Teoría de la decisión.

PRIMERAS DEFINICIONES
Previo al desarrollo de cada tema, creemos conveniente explicar el significado de algunos de
los vocablos de mayor uso.

Población

Conjunto formado por la totalidad de los elementos que son objeto de un estudio determinado.
Como se verá no siempre es fácil acceder a toda la población, es por eso que muy

8 Licenciatura en Administración
UNIDAD 1: Conceptos Básicos

frecuentemente se trabaja con subconjuntos de ella, los que pueden ser de distinta naturaleza.
Aclaración: el estudio de toda la población constituye lo que llamamos un “censo”.

1
Series

Son subconjuntos poblacionales, pero los elementos que las componen no son elegidos
aplicando algún método que garantice su representatividad respecto de la población, es por
eso que los resultados obtenidos a través de su estudio no pueden generalizarse, sólo son
válidos dentro de esa serie.

Ejemplo Un ejemplo de esto sería, registrar las edades de todas las personas que habitan
tres manzanas determinadas de una ciudad. Con esa información podría calcularse, POBLACIÓN
Conjunto
la edad promedio, la más frecuente, más de cuantos años tiene la mitad de las
formado por
personas consideradas y otro buen número de valores que darían un panorama
la totalidad de
de las características del suceso en estudio. Pero cuidado, éstos sólo se refieren los elementos
al grupo de personas testeadas, se cometería un enorme error si se usaran esos que son objeto
valores para asignárselos a toda la población de la ciudad. de un estudio
determinado.

Muestras
SERIES
También son subconjuntos poblacionales, pero sus elementos son elegidos aplicando técnicas Son
subconjuntos
específicas llamadas “Métodos de muestreo” lo que hace que en general representen a la
poblacionales,
población, por lo que los valores obtenidos a partir de su estudio puedan usarse para estimar pero los
o decidir respecto de medidas poblacionales. elementos que
las componen
no son elegidos
Variables aplicando algún
método que
Son entidades cuantitativas. Ellas registran los datos que pueden tomar sucesos cuyos valores
garantice su
representatividad
se expresan numéricamente.
respecto de la
Estas variables pueden ser: población, es
• Variables discretas: son aquellas en las que existen valores entre los cuales no puede por eso que
haber un valor intermedio. los resultados
Ejemplo Por ejemplo si nos referimos al número de clientes entre 6 clientes y 9 obtenidos
clientes podría haber 7 ó 8. Pero si tenemos 7 y 8 no habrá un número de a través de
clientes intermedio. su estudio
no pueden
• Variables continuas: son las variables que siempre admiten la existencia de un valor
generalizarse,
intermedio entre cualquier par de valores. sólo son válidos
Así si el tema es el peso de los artículos de nuestro stock podrá haber uno que pese dentro de esa
320 gramos y otro cuyo peso sea de 321 gramos, pero está claro que también podría serie.
existir otro cuyo peso sea de 320,17 gramos. Aclaremos que si bien desde el punto de
vista teórico esto es correcto, en la práctica, sobre todo en problemas comerciales, se
determinará la precisión con que se trabajará, ya sea por la necesidad del problema o
por la limitación que impongan los instrumentos de medición.
Insistamos con el tema a partir de otro

Universidad de Morón 9
ESTADÍSTICA

Ejemplo Si trabajáramos en un laboratorio con una balanza muy precisa, un


MUESTRAS producto podría pesar, por caso: 32,17649 gramos, pero ¿nos servirá
También son
tanta precisión en las situaciones que mayoritariamente se presentan en la
subconjuntos
poblacionales, actividad comercial? Posiblemente no. Es por eso que en cada caso hay que
pero sus determinar, desde el principio, el número de decimales con que conviene
elementos trabajar.
son elegidos
aplicando
técnicas ACLARACIÓN
específicas No obstante la diferencia existente entre variables discretas y continuas, a los fines
llamadas prácticos, estas se terminan trabajando como si fueran discretas. Esto puede deberse
“Métodos de a las limitaciones impuestas por los instrumentos de medición, a la naturaleza y
muestreo” lo necesidad del problema, a la existencia de convenios que fijen la precisión con que
que hace que deben registrarse las mediciones, etc.
en general
representen a la
población, por lo
que los valores
Atributos
obtenidos a partir
de su estudio
puedan usarse También llamados “variables cualitativas”, son entidades que registran, mediante sustantivos
para estimar o o adjetivos, las distintas formas que puede tomar un suceso no numérico.
decidir respecto
de medidas Ejemplo Deudores incobrables, Deudores morosos, País de procedencia de un producto.
poblacionales. No nos confundamos al hablar de este tipo de variables, sí podremos saber cuántos
Deudores incobrables tiene la empresa, pero la categorización está dada por sus
VARIABLES propiedades, ser deudores y ser incobrables.
Son entidades
cuantitativas.
Ellas registran
los datos
que pueden ACLARACIONES IMPORTANTES
tomar sucesos
cuyos valores A lo largo de este trabajo iremos explicando distintas técnicas con las que se podrán resolver
se expresan
los diversos problemas que se vayan planteando. Habrá que tener en cuenta distintas
numéricamente.
situaciones.

ATRIBUTOS 1. Definir con claridad y precisión aquello que queremos estudiar. Este problema a estudiar
También es lo que se denomina “suceso estadístico¨.
llamados Ejemplo Precio en pesos por m2 de las propiedades vendidas en el último trimestre
“variables
en una ciudad. En este ejemplo luego habrá que determinar si nos interesa
cualitativas”,
son entidades un barrio determinado, o las propiedades de cierta antigüedad o de
que registran, determinada categoría.
mediante Por lo tanto a las definiciones ya dadas agreguemos:
sustantivos o • El SUCESO CUANTITATIVO es el susceptible de ser expresado numéricamente.
adjetivos, las • El SUCESO CUALITATIVO sólo admite expresión sustantiva o nominal.
distintas formas
que puede tomar
2. Dejar aclarado de dónde se tomará la información; cámaras empresariales, relevamientos
un suceso no
propios.
numérico.

10 Licenciatura en Administración
UNIDAD 1: Conceptos Básicos

3. Determinar cuál será la técnica más adecuada para elaborar dicha información.

1
Este paso es el más difícil, ya que requiere que conozcamos cuáles son los métodos más
usuales y así podamos elegir el que más conviene para obtener lo que buscamos.
Es muy importante entonces poder determinar: ¿cuál es la técnica que más conviene?, ¿cómo
habrá que ordenar la información para responder correctamente? Veamos algunos ejemplos
para aclarar ideas.
Si en una empresa, se tiene registrado el número de artículos de cierta marca, vendidos
mensualmente a lo largo de los últimos tres años. ¿Cómo ordenamos estos datos?
Depende de qué es aquello a lo que hay que responder.
• Si lo que se quiere saber es el promedio mensual de ventas o,
• conocer menos de cuántos artículos se vendieron el 30 % de los meses considerados, o
• algún otro valor que aproximadamente muestre como se distribuyó la variable “ventas
mensuales” en los tres años en estudio, habrá que organizar la información generando
una “Serie de frecuencias”.
Pero si las preguntas fueran otras, por ejemplo,
• “La tendencia de las ventas, en el tiempo registrado ¿fue creciente, decreciente o
constante?, y, en cualquiera de esos casos, ¿será posible encontrar una función que la
explique?
• También si se quisiera saber si esas ventas estuvieron afectadas por la estacionalidad
y, de ser así, poder cuantificar su efecto.
• Si el problema planteado fuera, bajo ciertas circunstancias, poder estimar las ventas
mensuales para un período futuro, en cualquiera de esos casos, la técnica a aplicar
sería presentar los datos bajo la forma de una “Serie cronológica”.
Podríamos seguir agregando otros ejemplos, pero creemos que los dados son suficientes
para remarcar la idea de que no sólo hay que conocer el manejo de las distintas técnicas, sino
también tener muy en claro cual es el significado de los valores que resultan de la aplicación
de cada una de ellas.
Otro aspecto que queremos resaltar es evitar el error, muy frecuente, de generalizar resultados
parciales. Un célebre filósofo, Disraeli, decía que “existen tres tipos de mentiras, las mentiras,
las mentiras crueles y la Estadística”. Lamentablemente esto es muchas veces cierto.
Benjamín Disraeli KG, FRS, PC (Londres, 21 de diciembre de 1804 - 19 de abril de
1881, Curzon Street, Londres), conocido también como Conde de Beaconsfield o Lord
Beaconsfield, fue un político, escritor y aristócrata británico, que ejerció dos veces como
Primer Ministro del Reino Unido, fue Líder de la Muy Leal Oposición de Su Majestad y tres
veces Ministro de Hacienda del Reino Unido. 1
Todos hemos visto avisos publicitarios del tipo:
“La utilización, durante tres meses, de la crema cosmética TAL, produce una reducción del
80% en las arrugas faciales”. E infinidad de otros semejantes.
Y todos esos números, generalmente falsos, son la resultante de expresar como si valieran Benjamin
Disraeli
para toda la población, valores obtenidos en el estudio de subconjuntos no representativos.

Veamos algunas aplicaciones de todo lo antedicho.

Actividad Propuesta Unidad 1 del Módulo IV

1 Fuente: http://es.wikipedia.org/wiki/Benjamin_Disraeli

Universidad de Morón 11
ESTADÍSTICA

12 Licenciatura en Administración
UNIDAD 2

SERIES DE FRECUENCIAS

Contenidos

Series de frecuencias, concepto, clasificación y objeto de su estudio.

Objetivos

Al terminar de estudiar esta unidad, podrá:

• Organizar los datos bajo la forma de una serie (distribución) de frecuencias;


• Clasificar las series de frecuencias;
• Conocer cuándo se usa esta técnica y qué valores pueden calcularse a partir de ella;
• Representarlas gráficamente, mediante polígonos de frecuencias absolutas, acumuladas y
sus correspondientes histogramas;
• Conocer la existencia de otros tipos de representaciones gráficas.
ESTADÍSTICA

14 Licenciatura en Administración
UNIDAD 2

SERIES DE
FRECUENCIAS

En esta unidad nos referiremos a cuestiones de la etapa del estudio estadístico


2
En esta Unidad
que trabaja con valores empíricos.
Estos pueden ser mediciones, información relevada, datos obtenidos de Pasos a seguir para Generar 16
organismos oficiales, de cámaras empresariales, de publicaciones. una Serie de Frecuencias
Es importante que los datos se tomen de una fuente confiable. Métodos para Confeccionar
Según se organice la información se tendrán: una Serie de Frecuencias 16
• Serie de frecuencias. Serie Simple 16
• Series cronológicas o de tiempo. Serie de Datos Agrupados 18
• Series de datos pareados.

Las series de frecuencias consisten en un método de trabajo que permite


transformar colecciones desordenadas de mediciones en bruto, en otras
organizadas; mediante las cuales se pueden calcular valores que permitan
comprender distintos aspectos que presenta el suceso en estudio.
Pero aún corriendo el riesgo de repetir lo ya explicado, creemos conveniente
insistir sobre ciertas preguntas:
1.a ¿Cuándo es necesario usar esta técnica?
1.b ¿Qué información se necesita tener para poder aplicarla?
1.c ¿Qué puede calcularse a través de ella?
1.d ¿Qué aplicación puede darse a los valores obtenidos?

Veamos las respuestas.


1.a Cuando se considere que para encontrar la respuesta buscada, pueda
convenir reducir la información y obtener medidas que sintéticamente
expliquen el movimiento general de la variable.
1.b Información cuantitativa, es decir mediciones expresadas
numéricamente.
1.c Sus “Medidas características” (valores que abreviadamente indican
cómo se distribuye la variable).
1.d Los valores ordenados en una serie de frecuencias también nos
permitirán realizar representaciones gráficas que facilitarán la
visualización del problema.

Universidad de Morón 15
ESTADÍSTICA

PASOS A SEGUIR PARA


GENERAR UNA SERIE DE FRECUENCIAS
Primero: Definir el conjunto sobre el que se hará el estudio.
Segundo: Definir LA VARIABLE y su magnitud, (ejemplo: unidad monetaria, edad, litros).
Tercero: Definir EL NIVEL DE PRECISIÓN (ejemplo con cuantos decimales se va a trabajar).
Cuarto: Tener en claro cual es el OBJETO de estudio.
Quinto: Es importante, explicitar LA FUENTE de donde se obtienen los datos.
Sexto: ORGANIZAR LOS DATOS, lo que en principio se hace ordenando los valores de la
variable en forma creciente.

MÉTODOS PARA CONFECCIONAR


UNA SERIE DE FRECUENCIAS

SERIE SIMPLE
Dado un suceso cuantitativo, esta técnica consiste en tabular los valores que presenta en
forma creciente y en la misma tabla asignar a cada uno de esos valores el número de veces
que él se repite, es decir, lo que llamamos su “frecuencia absoluta”.

NOTA
Como en general en matemática es usual designar a las variables con las últimas letras
de nuestro alfabeto, por ejemplo “x”. En nuestra tabla la columna en la que se colocarán
ordenados en forma creciente los valores de la variable estará encabezada por la letra
“x”. Pero para saber si nos referimos al primer, al segundo o al enésimo valor de la
variable, a la “x” se le agregará el subíndice “i”, de este modo x3, indicará que estamos
hablando del tercer valor de “x” que figura en la tabla. El mismo criterio se aplicará en
la columna de frecuencias.

La suma de nuestras frecuencias absolutas es el “Tamaño de la Serie” y usualmente lo


denominamos con la letra N.
Veamos algunos ejemplos.

Ejercicio 2.1 Se tienen 20 personas, elegidas aleatoriamente entre los integrantes de una
oficina.
Se define la variable X: Edad en años.
El nivel de precisión es el año.
Se quiere estudiar las características más representativas de la variable en
análisis.
La fuente, relevamiento propio.
Se genera una tabla, en cuya primera columna se colocan en forma creciente
los valores que toma la variable, y en la segunda el número de veces que
cada valor de variable se repite.

16 Licenciatura en Administración
UNIDAD 2: Series de Frecuencias

x = edad en años.
xi fi

2
3 2
7 4
12 1
18 5
21 4
34 4
N = 20

OBSERVEMOS EN ESTA SERIE ORDENADA:


El primer valor de variable x1 =3.
El cuarto valor x4=12.
La variable tomó 6 valores es decir de x1 a x6.
¿Cuantas veces se repitió x1=3? Dos veces, por eso la frecuencia f1=2.

Representando gráficamente:

Ejercicio 2.2 En un comercio minorista se registran las ventas semanales, en decenas de


miles de pesos, siendo:
x: “Ventas semanales en decenas de miles de pesos”.
f: “Número de semanas correspondiente a cada valor de ventas” (frecuencia absoluta).
xi fi
84 5
126 9
240 6
278 5
310 3
355 5

Al sumar las frecuencias absolutas, en este ejemplo, se obtiene 33, eso significa que se han
registrado las ventas de 33 semanas. O sea que tenemos una serie de tamaño N=33.
Esta tabla en la que los valores de la variable se registraron uno por uno constituye una “Serie
simple”.

Universidad de Morón 17
ESTADÍSTICA

Representando
gráficamente:

SERIE DE DATOS AGRUPADOS


Pero puede ocurrir que el problema sea tal que convenga reunir sus valores en grupos de
comportamiento similar, se generará así una “Serie de datos agrupados”. Por ejemplo si
la variable x fuera: “Edad de los clientes” y se considerara que en el problema que se está
estudiando no sería demasiado diferente el comportamiento de un cliente de 30 años que el
de otro de 34, los valores de la variable podrían agruparse en intervalos, uno de los cuales
sería [30, 34).

NOTA
Recuerde la notación vista en materias matemáticas anteriores.
La expresión [30,34) es un intervalo semiabierto en 34, es decir que se computarían
todas las edades desde 30 hasta 34, pero sin incluir esta última.

Estos intervalos se llaman también “Clases” o “Intervalos de clase”.


Cada intervalo tiene una cota inferior, límite inferior que simbolizamos como “li” y otra superior
“Li”. Si se tienen intervalos cerrados a izquierda y abiertos a derecha, el límite superior no
incluido en un intervalo sea el nuevo límite inferior del próximo intervalo.
Se llama “amplitud de cada intervalo” a la diferencia entre su límite superior y el inferior, y
en general se denota con la letra “c”.
Aclaremos que existe bastante anarquía en la literatura estadística respecto de la forma de
designar a los distintos elementos que intervienen en ella, pero estos son los criterios que
seguiremos en esta materia. Tratamos de usar los de aplicación más frecuente.
Antes de dar otro ejemplo, digamos que en las series de datos agrupados, cada intervalo
estará representado por su “Marca de clase” que es el promedio entre sus límites.

Ejercicio 2.3 Una pequeña compañía se servicios de remises quiere estudiar la cantidad
de kilómetros diarios recorridos por la totalidad de sus unidades en un mes.
Las mediciones ya ordenadas se registran en la siguiente tabla, siendo:

x: “Número diario de kilómetros recorridos”.

18 Licenciatura en Administración
UNIDAD 2: Series de Frecuencias

f: “Número de días correspondiente a cada valor de la variable.

2
[li , Li) fi xi (marca de clase)
70 hasta menos de 80 2 75
80 “ “ 90 3 85
90 “ “ 100 3 95
100 “ “ 110 8 105
110 “ “ 120 7 115
120 “ “ 130 5 125
130 “ “ 140 3 135

[li , Li) fi xi
[70,80) 2 75
[80,90) 3 85
[90,100) 3 95
[100, 110) 8 105
[110, 120) 7 115
[120, 130) 5 125
[130, 140) 3 135

Representando gráficamente:

Ejercicio 2.4 Se mide la superficie en metros cuadrados de 200 propiedades comerciales


para su tasación e incorporación a la cuenta patrimonio del activo de una
empresa.

Se define la variable x: metros cuadrados de superficie.


Se confecciona una tabla en la que los valores de la variable se agrupan:

[ li Li ] fi
[40,60) 6
[60,80) 15
[80,100) 15
[100.120) 30
[120,140) 14
[140, 160) 20
C = 20
N = 100

Universidad de Morón 19
ESTADÍSTICA

¿Como leemos esta tabla?


Veamos que hay 6 propiedades cuya superficie alcanzó de 40 hasta casi 60 m2.
Hay 30 propiedades con una superficie entre 100 y casi 120 m2.

NOTA
podríamos preguntarnos porqué elegimos amplitud 20m2 en cada intervalo.
La elección de la amplitud de los intervalos depende de la naturaleza del problema que
se trata. Así si quien encarga el estudio considera que un inmueble de 80 y 87 tienen
características similares para los que se busca analizar establecerá un intervalo de
amplitud 7.

ACLARACIÓN
no necesariamente todos los intervalos deben tener igual amplitud, si el problema lo
permite es conveniente que la amplitud sea la misma para todos los intervalos.
Pero hay veces en que la naturaleza del problema exige agrupar los valores de variable
con distinta amplitud, así por ejemplo si se aplicara el viejo criterio de calificar a los
alumnos en, Aplazados, Regulares, Buenos, Distinguidos, Sobresalientes, al llevarlo a
valores de variable, siendo esta el puntaje numérico obtenido en la calificación, podría
generarse una serie del siguiente tipo:

Puntaje Intervalos
Menos de 4 [0,4) Aplazados
Entre 4 y 5 [4, 5] Regulares
Entre 6 y7 [6, 7] Buenos
Entre 8 y 9 [8, 9] Distinguidos
10 10 Sobresalientes

Repasemos
Los intervalos de clase pueden ser de distinto tipo, cerrados, abiertos, semi-abiertos.
[ li Li ] CERRADO, la variable toma los valores de ambos límites, además de los
comprendidos entre ellos.
[ li Li ) SEMI ABIERTO, la variable no toma el valor de uno de los límites, en este caso el
superior.
( li , Li) ABIERTO, la variable nunca toma los valores de los límites.

Donde: li = cota inferior o límite inferior.


Li = cota superior o límite superior.

Cada CLASE tiene un límite superior e inferior; y además, una frecuencia absoluta
asociada a ella.
Se llama AMPLITUD de un intervalo a la diferencia entre su cota superior y su cota inferior
(c)

20 Licenciatura en Administración
UNIDAD 2: Series de Frecuencias

Resumiendo lo visto para Series de frecuencias.

2
CLASIFICACIÓN DE LAS
SIMPLE
SERIES DE FRECUENCIAS
DE DATOS AGRUPADOS

Terminamos con la parte teórica de esta unidad. Ahora en la Actividad propuesta de esta unidad
del Módulo de Trabajos prácticos encontrará ejercicios de aplicación. Trate de resolverlos y si
se le presenta alguna dificultad consulte con su tutor.
Se llama
AMPLITUD de
un intervalo a la
diferencia entre
su cota superior
Actividad Propuesta Unidad 2 del Módulo IV y su cota inferior
(c)

Universidad de Morón 21
ESTADÍSTICA

22 Licenciatura en Administración
UNIDAD 3

MEDIDAS DE POSICIÓN
DE SERIES DE FRECUENCIAS
Contenidos

Medidas características, concepto, clasificación


Medidas de posición. Media aritmética. Modo. Mediana. Cuantiles.

Objetivos

Que el alumno logre:

• Calcular cuáles son las medidas características de una serie de frecuencias.


• Conocer el significado de las medidas de posición.
• Definir y calcular, la media aritmética, el modo, la mediana, los cuantiles.
• Explicar el significado de los valores de cada uno de ellos.
ESTADÍSTICA

24 Licenciatura en Administración
UNIDAD 3

MEDIDAS DE POSICIÓN
DE SERIES DE FRECUENCIAS

Antes de comenzar con las explicaciones, creemos conveniente advertirle


3
En esta Unidad
algo. Esta unidad puede presentar dificultad en la comprensión de algunos
temas, por eso le sugerimos ir despacio, tratar de entender cada definición, Medidas Caracteristicas 25
analizar cada uno de los ejercicios resueltos e intentar luego rehacerlos por su Media Aritmética 26
cuenta. Creemos que así podrá sortear esas dificultades, pero de no poderlo Modo 29
no dude en consultar con su tutor. Mediana 30
Comencemos a desarrollar los temas propuestos. Cuantiles (o Fractiles) 33
Cuartiles 33
Deciles 35
Percentiles 35
MEDIDAS CARACTERISTICAS Media Armónica 36
Media Geométrica 36
¿Recuerda en sus estudios anteriores como hacía para saber si su rendimiento Síntesis de las
en una materia había sido, malo, regular, bueno o excelente? Principales Fórmulas vistas
Ud. calculaba el valor de un promedio. Esa es una medida característica. en Estadística Descriptiva 37
Medidas características: Valores que dan una idea aproximada del
funcionamiento de un suceso.
Ya hemos dicho anteriormente, que las medidas características de una serie
de frecuencias son valores que, en forma sintética, nos dan información de
cómo se distribuye su variable. Pero el significado de esa información depende
de cuál sea la medida que utilicemos, ya que éstas pueden ser:

• Medidas de posición.
• Medidas de dispersión.
• Medidas de forma.

En esta unidad veremos las “Medidas de posición”, que son siempre


valores de variable. Si la variable es “pesos”, todas las medidas de posición MEDIDAS
son “pesos”. CARACTERÍSTICAS son
valores que dan una idea
• Media Aritmética. aproximada del funcionamiento
• Media Geométrica. de un suceso.
• Media Armónica
• Modo.
• Mediana.
• Cuantiles (Cuartiles, deciles, quintiles, percentiles)

Universidad de Morón 25
ESTADÍSTICA

NOTA 1: Notación
Se adoptará, por convención para medidas características de series y muestras:
LETRAS LATINAS. Para medidas características poblacionales: LETRAS GRIEGAS.

NOTA 2
Consideraremos aquí sólo las más comunes, a saber: la media aritmética, el modo y
la mediana.

MEDIA ARITMÉTICA
Es un promedio ponderado de los valores que toma la variable.
Quizás sea la medida más usada.
Con respecto a las otras medidas de posición que se verán más adelante tienen la ventaja
de que:
• En su cálculo entran todos los valores de la serie.
• Es susceptible de manejo algebraico.
• Es única en cada serie.
• En general, es la medida de mayor representatividad de la serie.
Pero su desventaja es que está muy influenciada por los valores extremos, lo que hace que
deje de ser una medida representativa cuando la variable presenta gran dispersión.
Un ejemplo sencillo ayudará a entender esta idea.

Ejemplo Si un comercio vende un mes 800 unidades de un articulo determinado, y en el


mes siguiente 4000, el valor de ventas mensuales de 2400 artículos, que es el
promedio entre las ventas de los meses considerados, no estaría reflejando las
ventas mensuales.

En ese ejemplo como hay una gran diferencia entre 800 y 4000 se dice que hay una gran
dispersión y esos son los casos en los que dijimos que la media aritmética no es una medida
representativa.

Notación

La forma de designarla es muy variada. Pero la más usada es aquella que toma la letra que
se utilizó para la variable, con un segmento superpuesto. Así si para denotar la variable se
usó la letra x, resulta

Media aritmética: x

26 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias

Fórmula de la media aritmética


n

3
∑ ax *.fb
i=1
i ij i jk
x=
N

Ejercicio 3.1 Retomemos un problema anterior.


En un comercio minorista se registran las ventas semanales, en decenas de
miles de pesos, siendo:

x: “Ventas semanales en decenas de miles de pesos”.


f: “Número de semanas correspondiente a cada valor de ventas”(Frecuencia absoluta).

xi fi
84 5
126 9
240 6
278 5
310 3
355 5
N = 33

En primer lugar agregamos una columna en la que iremos anotando los productos de cada
valor de variable por su correspondiente frecuencia absoluta.

xi fi xi. fi
84 5 420
126 9 1134
240 6 1440
278 5 1390
310 3 930
355 5 1775
n

N = 33
∑ ax *.bf = 7089
i=1
1ij 1 jk

7089
La media aritmética x= = 214,80 decenas de miles de pesos.
33

Por lo que, la respuesta al problema sería: “En los 33 meses considerados las ventas
mensuales promedio fueron de 214,80 decenas de miles de pesos.”

Universidad de Morón 27
ESTADÍSTICA

Ejercicio 3.2 Cálculo de la media aritmética en una serie de datos agrupados.

Si en el ejemplo 3, se quisiera estimar el promedio de kilómetros diarios recorridos


por el total de sus unidades en un mes determinado, también habría que calcular la
media aritmética. Hagámoslo. Recordemos entonces el enunciado total del problema y
agreguemos los mimos cálculos: xi . fi.
Recuerde que en el caso de las series da datos agrupados, cada intervalo está representado
por su punto medio que se denomina MARCA DE CLASE.

[li , Li) fi xi xi . fi
[70,80) 2 75 150
[80,90) 3 85 255
[90,100) 3 95 285
[100, 110) 8 105 840
[110, 120) 7 115 805
[120, 130) 5 125 625
[130, 140) 3 135 405
n

N = 31
∑ ax *.bf =
i=1
1ij 1 jk 3365

Vemos que al hacer las sumas obtuvimos

N = 31

∑ ax *.bf =
i=1
1ij 1 jk 3365

3365
Media aritmética x= =108.55 km diarios.
31

En los dos ejemplos anteriores hemos calculado sus respectivas Medias aritméticas,
nos podríamos preguntar ¿serán valores que realmente representan a cada una de esas
series? La respuesta la tendremos, cuando más adelante, estudiemos el Coeficiente de
variabilidad.

NOTA muy
importante:
Observe que el valor
de la media aritmética
no necesariamente
coincide con un valor
de la serie.

28 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias

MODO

3
Es el o los valores de variable de mayor frecuencia absoluta.
Decimos que es el punto de máxima concentración de la serie.
En una serie puede haber más de un modo. Si hay uno solo, la serie es unimodal, si dos es
bimodal, si hay más se llama multimodal. Esto de debe a que en la serie podría haber más
de un valor de variable con frecuencia absoluta máxima, por lo que en ese caso habrá más
de un modo.
En general es una medida que se elige cuando es única.
Para conocer su valor, en las Series simples, bastará con mirar la columna de frecuencias
absolutas, en ella buscar el valor máximo, y el valor de variable correspondiente es el modo
o valor modal.
MODO
Es el o los
Ejercicio 3.3 Retomemos el Ejemplo 2, que decía que en un comercio minorista se valores de
registran las ventas semanales, en decenas de miles de pesos. Vemos que variable de
la frecuencia absoluta máxima es 9 y el valor de variable correspondiente es mayor frecuencia
126, por lo tanto: absoluta.
Decimos que
es el punto
Modo mo= l26 decenas de miles de pesos.
de máxima
Lo que significa que, en el período estudiado, el valor de ventas mensuales que más se concentración de
repitió fue de 126 decenas de miles de pesos. la serie.

Ejercicio 3.4 Consideremos ahora el problema es calcularlo en una Serie de datos


agrupados.
Para hacerlo creemos conveniente seguir, ordenadamente, los siguientes
pasos.
Usaremos el ejemplo 3.2, del cual recordamos una vez más su tabla:

[li , Li) fi xi
[70,80) 2 75
[80,90) 3 85
[90,100) 3 95
[100, 110) 8 105
[110, 120) 7 115
[120, 130) 5 125
[130, 140) 3 135

a) Determinar la “Clase modal”, que será aquella que tenga la mayor frecuencia
absoluta.
En nuestro ejemplo, la mayor frecuencia absoluta es f4 =8, por lo que la clase modal
será el intervalo [100, 110).
b) Calcular d1, que es la diferencia entre la frecuencia absoluta de la clase modal y
frecuencia absoluta de la clase inmediata anterior. d1 = 8-3=5
c) Calcular d2 que es la diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase inmediata posterior. d2= 8-7=1
d) Recordemos que con la letra c, indicamos la amplitud de clase. De modo que si
ponemos: cmo, eso significará “amplitud de la clase modal”.

Universidad de Morón 29
ESTADÍSTICA

e) Análogamente ya que con li denotamos el límite inferior de una clase, cuando


colocamos lmo estamos indicando el límite inferior de la clase modal. En el ejemplo,
lmo = 100.

Creemos que ya estamos en condiciones de entender la expresión que nos permitirá


calcular el modo en una serie de datos agrupados.

d
mo = lmo + d +1 d * C mo
1 2

Aplicando a esta expresión a los valores de este ejemplo, quedará:


5
mo = 100 + .10 = 108,33 km
5+1

Lo que significa que en el mes estudiado, el recorrido diario que más se repitió fue de
aproximadamente 108,33 km.
Por lo tanto, sintetizando tenemos:
d1
mo = lcmo + * Cmo
d1 + d2

d1 = fmo - fmo - 1

d2 = fmo - fmo + 1

Propiedades del Modo

• En su cálculo no intervienen todos los valores de la serie.


• No siempre es único.
• Puede calcularse en series donde hay intervalos no acotados.
• El modo puede calcularse en una serie de atributos.

MEDIANA
MEDIANA
Es el valor de variable que separa a la serie en dos partes de igual número de elementos.
Es el valor de
Para inducir la comprensión del significado de esta medida tomemos un ejemplo sencillísimo.
variable que
separa a la serie Si tenemos una sucesión de números ordenados en forma monótona creciente: 3, 3, 5, 5, 7,
en dos partes de 7, 7, 9, 11, 16, 16; vemos que en ella existe un valor central, el 7, que deja a cada lado de
igual número de él cinco elementos, ese valor central es la mediana de la serie. Observemos que los valores
elementos. que están bajo la mediana son menores o iguales que ella, y los que están a su derecha son
mayores o iguales.
Veamos cómo se calcula la mediana: me, en una serie de frecuencias.
Nuevamente nos convendrá ordenarnos en pasos:

30 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias

Ejercicio 3.5

3
a) Definir una nueva medida la “Frecuencia acumulada” Fi. Sus sucesivos valores se van
obteniendo sumando renglón a renglón las frecuencias absolutas Retomemos el ejemplo
del comercio minorista en el cual se registran las ventas semanales, en decenas de miles
de pesos, siendo:

xi: “ Ventas semanales en decenas se miles de pesos”.


fi: “Número de semanas correspondiente a cada valor de ventas”. (Frecuencia absoluta).
Fi: Frecuencia acumulada.

xi fi Fi
84 5 5
126 9 14
240 6 20
278 5 25
310 3 28
355 5 33
N = 33

Obsérvese que la última Fi siempre debe coincidir con N.

N
b) Hacer
2
33
En el ejemplo: = 16,5
2

c) Buscar la primera frecuencia acumulada que supere lo que nos dio ese cociente.
En el ejemplo es 20.

d) El valor de variable correspondiente es la mediana. Así en este ejercicio quedará:


me = 240 decenas de miles.
Lo que significa que en la mitad de los meses consideraros, las ventas mensuales fueron
menores o iguales que 240 decenas de miles. Esto quiere decir, también, que en los
restantes meses las ventas fueron mayores o iguales que ese valor.

Veamos ahora como se calcula la mediana a partir de una serie de datos agrupados.

Universidad de Morón 31
ESTADÍSTICA

Ejercicio 3.6 Retomemos el ejemplo de los remises y calculamos la frecuencia acumulada


Fi.

[li , Li) fi xi Fi
[70,80) 2 75 2
[80,90) 3 85 5
[90,100) 3 95 8
[100, 110) 8 105 16
[110, 120) 7 115 23
[120, 130) 5 125 28
[130, 140) 3 135 31

N = 31, obsérvese que aquí también la última frecuencia acumulada coincide con N.

Siendo xi: “Número diario de kilómetros recorridos”;


fi “número de días correspondiente a cada valor de la variable.”

N
a) Se hace ; Para nuestro ejemplo 31/2 = 15,5.
2

Una vez calculado este cociente, se busca la primera frecuencia acumulada cuyo
valor exceda lo que nos dio la división. El intervalo al que le corresponda esa frecuencia
acumulada será la clase mediana.
Para nuestro ejemplo es el intervalo [100, 110) cuya Fi es 16.

b) Aplicando a los subíndices el mismo criterio que cuando estudiamos el Modo, acá
resultará que lme es el límite inferior de la clase mediana. Análogamente denotaremos
con fme a la frecuencia absoluta de la clase mediana y con cme a la amplitud de la clase
mediana.
Para nuestro ejemplo lme = 100; fme = 8; cme = 10.

c) Siendo que Fme indica frecuencia acumulada de la clase mediana, acá introduciremos
un nuevo símbolo
Fme-1 que significa “frecuencia acumulada hasta la clase inmediata anterior a la
clase mediana”.

Fme-1 = 8

32 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias

Ya podemos dar la función que nos permitirá calcular la mediana en una serie de datos
agrupados
N

3
- Fme - 1
2
me = lme + . C me
f_me

Ejercicio 3.7 Volvamos al ejemplo de los remises.

Una pequeña compañía se servicios de remises quiere estudiar la cantidad de kilómetros


diarios recorridos por la totalidad de sus unidades en un mes. Las mediciones ya ordenadas
se registran en la tabla que figura en la página anterior. Siendo x: “Número diario de
kilómetros recorridos,”. f “ número de días correspondiente a cada valor de la variable
N
N = 31 =15,50
2

La primer frecuencia acumulada que excede este valor es 16 por lo que la clase mediana
es [100, 110) o sea que el lme= 100. Además la Fme-1= 8, f me= 8 y c me = 10.
Entonces quedará:
15,50 - 8
me = 100 + .10 =109,375 km
8

Lo que significa que en la mitad del mes las unidades recorrieron hasta 109,375 km y en
la otra mitad su recorrido diario fue mayor o igual que ese valor.

CUANTILES (o FRACTILES)
Son valores de variable que separan a la serie en un número determinado de partes de igual
número de elementos. CUANTILES
Se clasifican en: son valores
de variable
• Cuartiles.
que separan
• Deciles. a la serie en
• Quintiles. un número
• Percentiles determinado
Conceptualmente son estadísticos muy similares a la mediana. La diferencia está en que de partes de
así como la mediana separa a la serie en dos partes, los Cuartiles la separan en cuatro, los igual número de
Deciles en10, los Quintiles en 50 y percentiles en 100. elementos.

Cuartiles

Son tres Q1, Q,2, Q3.

Pasos a seguir para calcularlos:

N
Ubicar la clase. Para Q1 hay que hacer
4

Universidad de Morón 33
ESTADÍSTICA

Y la clase Q1 será aquella cuya frecuencia acumulada sea la primera que excede eses
cociente.
N
Para ubicar la clase Q2 la cuenta es 2 .
4
N
Para la clase Q3 es 3 .
4
En todos los casos la clase correspondiente será aquella cuya frecuencia acumulada sea la
primera que excede al cociente.

Ejercicio 3.8 Para cerrar el tema, retomemos el ejercicio de la empresa de remises:

Una pequeña compañía se servicios de remises quiere estudiar la cantidad de kilómetros


diarios recorridos por la totalidad de sus unidades en un mes. Las mediciones ya ordenadas
se registran en la siguiente tabla. Siendo x: “Número diario de kilómetros recorridos,”. f “
número de días correspondiente a cada valor de la variable.

[li , Li) fi xi Fi
[70,80) 2 75 2
[80,90) 3 85 5
[90,100) 3 95 8
[100, 110) 8 105 16
[110, 120) 7 115 23
[120, 130) 5 125 28
[130, 140) 3 135 31
31
Para ubicar la clase Q1 haremos = 7,75
4

Y como la primera frecuencia acumulada que supera este valor es 8 quiere decir que
la clase Q1 es [90, 100); entonces lq1:es el límite inferior de esa clase, conservando la
notación ya vista o sea 90.
FQ -1 será la frecuencia acumulada de la clase anterior, es decir: 5.
1
CQ1 será la amplitud de la clase, es decir: 10.
fQ1 será la frecuencia del intervalo [90,100), es decir: 3.
Luego:
N/4 - FQ -1
Q1 = lq1 + 1
* CQ1
fQ1

7,75 - 5
Q1 = 90 + . 10 = 99,16 km
3

Este valor indica que la cuarta parte de los días del mes considerado, los móviles recorrieron
una distancia menor o igual que 99,16 km. Atención: esto nos indica también que el 75%
de los días, el recorrido fue igual o mayor que ese valor.

Actividad Propuesta
Le sugerimos tratar de calcular el Q.2

34 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias

Deciles

3
Son nueve, D1, D2, D3. D4. D5. D6, D7, D8, D9
La técnica para calcular el valor de cada uno de ellos es similar a la usada para calcular los
cuartiles.
En primer lugar hay que localizar la clase correspondiente. Así para localizar la clase:

D1 se hace N/10
D2 se hace 2N/ 10
D3 se hace 3N/10
Dj se hace j.N/ 10

La clase que le corresponde a cada uno de los deciles será aquella cuya frecuencia acumulada
sea la primera que excede el cociente correspondiente.
La formula general para calcularlos será:

jN
- FDj -1
10
Dj = lDj + . cDj
fDj
La clase que
le corresponde
Atención
a cada uno
j puede tomar valores de 1 a 9. de los deciles
será aquella
Acá no podremos usar los ejemplos ya vistos para calcular deciles, por que son series de cuya frecuencia
tamaño insuficiente. Más adelante pondremos otra serie de mucho mayor tamaño y en ella acumulada
calcularemos todas las medidas características. sea la primera
que excede
el cociente
correspondiente.
Percentiles

Como ya habíamos dicho antes, los percentiles son estadísticos muy similares a la mediana,
a los cuartiles y a los deciles. La diferencia está en que estos separan a los valores de variable
en 100 partes de igual número de elementos.
Los percentiles son noventa y nueve. Percentil: P1, P2, P3, ---------------P99
Para calcularlos, el método es el mismo que el que se aplicó en los Cuartiles anteriores.
Primero, ubicación de cada una de las clases, y luego aplicar la fórmula:

j. N -F
pj -1
100 . Cpj
Pj = lpj +
Fpj

Esto se verá con claridad cuando los calculemos en un ejemplo.

Universidad de Morón 35
ESTADÍSTICA

Aclaración Importante
Los temas precedentes así como los que se verán en la unidad próxima, o sea aquellos
referidos al cálculo de los estadísticos de las Series de Frecuencias, admiten ser
tratados usando otra técnica, la función generatriz de los momentos y con ella
calcular momentos absolutos y centrados de distinto orden con los cuales obtendríamos
algunas de las medidas acá calculadas. Pero teniendo en cuenta que prácticamente
estamos comenzando el estudio de la Estadística, creímos que sería más conveniente,
por ser más sencillo, encararlos como lo hicimos.

La media geométrica y la media armónica no se tratarán en esta unidad, por considerar que
presentan dificultades algebraicas que exceden este trabajo y además no son de aplicación
para los alumnos de este curso.
Presentamos de todos modos las fórmulas que permiten calcularlas.

MEDIA ARMÓNICA
Es la inversa de la media aritmética de la inversa de la variable, multiplicado por su frecuencia.

N
mg = n
1 .f
S
i=1 xi
i

Se usa en general, en sucesos en los que la variable y las frecuencias tienen un crecimiento
inverso (cuando crece la variable y decrece su frecuencia). No puede aplicarse en una serie
1
en la que uno de los valores de la variable es 0 (cero). Así si xr = 0 ¿ ?
xr
Un ejemplo sencillo: para recorrer una distancia, a mayor velocidad, menor tiempo en recorrerlo.

MEDIA GEOMÉTRICA
N n

mh = p x . fi
i=1 i

Aclaración:
con π denotamos un operador matemático llamado “productoria”.

Una de sus aplicaciones es en Matemática Financiera, cuando se busca conocer la tasa


promedio en una colocación a interés compuesto en sucesivos períodos.

Terminamos con la parte teórica de esta unidad. Ahora en la Actividad propuesta de esta unidad
del Módulo de Trabajos prácticos encontrará ejercicios de aplicación. Trate de resolverlos y si
se le presenta alguna dificultad consulte con su tutor.

36 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias

SÍNTESIS DE LAS
PRINCIPALES FÓRMULAS

3
VISTAS EN ESTADÍSTICA DESCRIPTIVA

Frecuencia absoluta fi
n

Tamaño de la serie N = S fi
i=1

fi
Frecuencia relativa
N
Frecuencia acumulada Fi = Fi-1 + fi

Medidas de Posición

Media Aritmética ∑ ax *.fb


i=1
i ij i jk
x=
N
N n
Media Geométrica mh = p x . fi
i=1 i

N
mg =
Media Armónica
n
1 .f
S
i=1 xi
i

clasemo = [li ; Ls ] fi max

d1
mo = lcmo + * Cmo
Modo d1 + d2

d1 = fmo - fmo - 1

d2 = fmo - fmo + 1

N
claseme = [li ; Ls ] Fi ≤
2
Mediana N
- Fme - 1
2
me = lme + . C me
f_me

Actividad Propuesta Unidad 3 del Módulo IV

Universidad de Morón 37
ESTADÍSTICA

38 Licenciatura en Administración
UNIDAD 4

MEDIDAS DE DISPERSIÓN
DE SERIES DE FRECUENCIAS
Contenidos

Medidas de dispersión: Desvío estándar, Varianza, Desviación media, Desviación modal,


Desviación mediana. Coeficientes de variabilidad.

Objetivos

Que el alumno logre:

• Conocer el significado de las medidas de dispersión.


• Clasificarlas en absolutas y relativas.
• Incorporar los algoritmos que permitan calcularlas.
• Interpretar el significado de sus valores.

Aquí vale un comentario similar al que hicimos al iniciar el desarrollo de la Unidad anterior. No
se apresure, no se amilane ante una dificultad para comprender algo, vuelva a releerlo, rehaga
los ejercicios resueltos y recuerde que siempre puede recurrir al tutor.
ESTADÍSTICA

40 Licenciatura en Administración
UNIDAD 4

MEDIDAS DE DISPERSIÓN
DE SERIES DE FRECUENCIAS 4
MEDIDAS DE DISPERSIÓN En esta Unidad

Medidas de Dispersión 41
Son valores que cuantifican el alejamiento de los valores que toma la variable
Medidas de
respecto de un valor central que puede ser la Media aritmética, el Modo o la
Dispersión Absolutas 41
Mediana; por lo cual tendremos distintas medidas de dispersión según sea el
Rango 41
estadístico que tomemos de referencia.
Desvio Estandar 42
Varianza 42
También se subdividen en:
Desvío Medio 42
• Medidas de dispersión absolutas.
Desvío Modal 43
• Medidas de dispersión relativas.
Desvío Mediano 43
Medidas de
43
MEDIDAS DE DISPERSIÓN ABSOLUTAS Dispersión Relativas
Coeficiente de Variabilidad 43
Coeficiente de
• Rango (o amplitud total).
Variabilidad Media 44
• Desvío estándar.
Coeficiente de
• Varianza.
Variabilidad Modal 44
• Desviación media o desvío medio.
Coeficiente de
• Desviación modal o desvío modal.
Variabilidad Mediano 44
• Desviación mediana, desvío mediano.
Aplicaciones de las
Medidas de Dispersión 45

Rango
En realidad esta medida de dispersión escapa a la definición general.
Se entiende por Rango a la diferencia entre el mayor y el menor valor de
variable, en una Serie simple, y a la diferencia entre el último límite superior y
el primer límite inferior en una Serie de datos agrupados.
MEDIDAS DE DISPERSIÓN
Son valores que cuantifican el
Es decir,
alejamiento de los valores que
toma la variable respecto de un
En una serie simple, R = xn – x1 valor central que puede ser la
Media aritmética, el Modo o la
En una serie de datos agrupados, R = Ln - l1 Mediana; por lo cual tendremos
distintas medidas de dispersión
Esta medida sólo sirve como primera señal del comportamiento de la variable. según sea el estadístico que
tomemos de referencia.
Nos dirá si sus valores extremos están muy alejados. En cada caso en

Universidad de Morón 41
ESTADÍSTICA

particular habrá que determinar si ese alejamiento obedece a circunstancias anómalas, por
Se entiende por ej producción fuera de control, o no. De ser afirmativa la respuesta, habrá que estudiar las
RANGO a la causas que lo producen.
diferencia entre
el mayor y el
menor valor de
variable, en una Desvío Estandar
Serie simple, y
a la diferencia Notación: S. Es una medida de dispersión respecto de la media aritmética.
entre el último Para calcularla,
límite superior y a) A cada valor de variable se le resta la media aritmética. Como los resultados de estas
el primer límite restas pueden ser positivos o negativos, con el fin de positivarlos (es decir hacerlos
inferior en una
siempre positivos) se los eleva al cuadrado.
Serie de datos
b) A cada una de las diferencias cuadráticas obtenida se la multiplica por su correspondiente
agrupados.
frecuencia absoluta.
c) Se suman todos los productos y esta suma se promedia dividiéndola por N.
d) Al cociente obtenido se le extrae la raíz cuadrada, y su valor positivo es el desvío
estándar buscado.

n
S ( xi - x )2 * fi
i=1
S=+
N

Varianza
Lo que
representa la
VARIANZA es Notación: S2.
el promedio
de los desvíos Como lo indica la notación, es el cuadrado del desvío estándar.
cuadráticos a la
n
Media aritmética, S ( xi - x )2 * fi
ponderados i=1

por su Por lo que para calcularla se usa S2 =


N
correspondiente
Lo que representa la varianza es el promedio de los desvíos cuadráticos a la Media aritmética,
frecuencia
absoluta. ponderados por su correspondiente frecuencia absoluta.

Desvío Medio
Notación: DM.

También es una medida respecto de la media aritmética, pero para positivizar los resultados,
las diferencias entre cada valor de variable y la media aritmética se toman en valor absoluto.

n
S xi - x * fi
i=1
DM =
N

42 Licenciatura en Administración
UNIDAD 4: Medidas de Dispersión de Series de Frecuencias

Desvío Modal

4
Notación: Dmo.

Mide alejamiento de los valores de la variable respecto del modo, cuantificados y tomados
en valor absoluto.
n
S xi - mo * fi
i=1
Dmo =
N

Desvío Mediano
Notación: Dmed.

Concepto equivalente al de los dos desvíos anteriores, pero respecto de la mediana.


n
S xi - me * fi
i=1
Dmed =
N

Aclaración:
en algunos textos será que en lugar de dividir por N lo hacen por N-1, con esto se
obtiene la correspondiente medida de dispersión ajustada.

Al terminar de definir todas las medidas de dispersión explicaremos la aplicación de cada una
de ellas.

MEDIDAS DE DISPERSIÓN RELATIVAS


Estas medidas a diferencia de las anteriores dan como resultado un número y no una
cantidad asociada a la variable.

• Coeficiente de variabilidad.
• Coeficiente de variación media.
• Coeficiente de variación modal.
• Coeficiente de variación mediana.

Coeficiente de Variabilidad
Notación: CV.

Es un número que indica la relación que existe entre el desvío estándar (S) y la media
aritmética.

S
CV =
x

Universidad de Morón 43
ESTADÍSTICA

Coeficiente de Variabilidad Media


Notación: CVM.

Este coeficiente cuantifica la relación existente entre el desvío medio (DM) y la media
aritmética

DM
CVM =
x

Coeficiente de Variabilidad Modal


Notación: CVmo.

Es el número que indica cual es la relación existente entre el desvío modal (Dmo) y el modo

Dmo
CVmo =
mo

Coeficiente de Variabilidad Mediano


Notación: CVmed.

Concepto similar al anterior pero con respecto a la mediana.

Dmed
CVmed =
me

44 Licenciatura en Administración
UNIDAD 4: Medidas de Dispersión de Series de Frecuencias

APLICACIONES DE LAS
MEDIDAS DE DISPERSIÓN

4
a) Cuando se quiere determinar si una serie es homogénea respecto de su media aritmética,
es decir los valores de la variable son próximos al valor de la media aritmética, se calcula su
CV, si éste es aproximadamente menor o igual que 0,30 significa que esa media aritmética
es una medida eficiente para representarla.
Recordemos que cuando definimos media aritmética, dijimos que no siempre es una
medida de elección, ya que pierde representatividad cuando los valores de variable están
muy dispersos.
b) Si el objetivo es decidir, al comparar dos o más series, cual de ellas es la más homogénea,
se calculan sus respectivos CV y lo será aquella que tenga menor CV.
c) Dada una serie, si en ella se quiere determinar entre “media aritmética”, “modo” y “mediana
“ cual de ellas es la que mejor la representa, se calculan sus correspondientes “CVM”.
“CVmo” y “CVmed” y será más representativa la que tenga menor coeficiente de variabilidad.

Terminamos con la parte teórica de esta unidad. Ahora en la Actividad propuesta de esta unidad
del Módulo de Trabajos prácticos encontrará ejercicios de aplicación. Trate de resolverlos y si
se le presenta alguna dificultad consulte con su tutor.

Actividad Propuesta Unidad 4 del Módulo IV

Universidad de Morón 45
ESTADÍSTICA

46 Licenciatura en Administración
UNIDAD 5

SERIES CRONOLÓGICAS

Contenidos

Definición. Movimientos. Cálculo de sus componentes. Función de pronóstico.

Objetivos

Que el alumno logre:

• Reconocer qué son las series cronológicas.


• Discriminar los casos correctos de uso de las mismas.
• Identificar sus componentes.
• Calcular la función tendencia en las series lineales.
• Inferir la existencia de movimientos estacionales en una serie.
• Calcular los factores que permitan cuantificar su influencia.
• Estimar valores futuros con la aplicación de la función Pronóstico.
• Reconocer las limitaciones de dichas estimaciones.
ESTADÍSTICA

48 Licenciatura en Administración
UNIDAD 5

SERIES
CRONOLÓGICAS 5
DEFINICIÓN En esta Unidad

Definición 49
Son tabulaciones en las que los valores de la variable que representa el
Etapas que Abarca su Estudio 49
problema, se ordenan según su aparición en el tiempo.
Movimientos Sistemáticos 50
Antes de optar por este método para organizar las mediciones que resultan
1 - Variables 50
de estudiar un suceso, veamos algunas preguntas que podrían plantearse:
2 - Tabulación 50
3 - Representación Gráfica 53
a) ¿Cuándo conviene usar esta técnica?
b) ¿Qué información es necesario tener para poder aplicarla? 4 - Análisis de
sus Componentes 53
c) ¿Qué puede calcularse a partir de ella?
Tendencia 53
d) ¿Qué aplicación puede darse a los valores obtenidos?
Estacionalidad 55

Intentemos respuestas Movimientos Cíclicos


o Componente Cíclica 58
a) Esta técnica estadística se usa cuando lo que se estudia, es la evolución
Movimientos Aleatorios 58
de un suceso aleatorio a lo largo de un tiempo determinado.
b) Se hace necesario tener información sobre mediciones sucesivas,
que tanto pueden corresponder a momentos puntuales (“Producción
diaria de una industria”) como a períodos (“Ventas mensuales de una
empresa”).
c) A partir de ellas podemos calcular funciones, que aproximadamente
representen el movimiento general de las mediciones y coeficientes
que cuantifiquen movimientos particulares.
d) Las aplicaciones son diversas. Veamos algunas:
- Estudiar la conveniencia o necesidad de modificar estrategias. Así,
por ejemplo, si la serie mostrara que las ventas tienen una tendencia
decreciente, analizar si será necesario, por ejemplo, actualizar el
producto, incrementar la publicidad o modificar la financiación.
- Mediante la “Función de pronóstico” estimar valores futuros de la
variable, pero sin olvidar las limitaciones de esta función.

Esta técnica estadística se


ETAPAS QUE ABARCA SU ESTUDIO usa cuando lo que se estudia,
es la evolución de un suceso
1- Descomponer a la serie en elementos simples, los sistemáticos (que aleatorio a lo largo de un
son aquellos que admiten una expresión analítica, ya sea una función tiempo determinado.

Universidad de Morón 49
ESTADÍSTICA

o un coeficiente) y los aleatorios que son movimientos puntuales que no presentan


regularidad, por lo cual no son susceptibles de ser expresados analíticamente.
2- Buscar las relaciones dinámicas que ligan a esos elementos. Aclaremos que no siempre
será posible encontrar una ley que los vincule, si se encuentra y puede expresarse en
forma funcional, entonces se habrá conocido la estructura de la serie en estudio.

MOVIMIENTOS SISTEMÁTICOS
Para abordar su estudio es conveniente que sigamos los siguientes pasos:
1 - Definición y notación de las variables intervinientes.
2 - Tabulación de la información.
3 - Representación gráfica.
4 - Análisis de sus componentes. Cálculo de las expresiones que representan a las
sistemáticas.

Expliquemos cada paso

1 - VARIABLES
1 - En estas series tenemos dos variables:
a) La “variable tiempo” que se designa con la letra “t”. Cada valor de t, se denota ti,
donde el subíndice “i” nos indica a que valor de t nos estamos refiriendo.
Aquí es necesario aclarar algo. Las mediciones del tiempo pueden estar dadas solo en
forma periódica, por ejemplo “Ventas anuales”, o en forma periódica y subperiódica, por
ejemplo “Ventas mensuales a lo largo de 5 años”.
b) La otra variable, es la específica del problema, se denota “y”.

Daremos dos ejemplos, y veremos qué en el primer ejemplo t7 es el valor de la variable t


correspondiente al año séptimo; y en el segundo ejemplo t13 corresponde a enero del segundo año.

2 - TABULACIÓN
Es una forma de ordenar la información en columnas, en la primera se registran los valores de
la variable “y”. En la segunda los de “t”. Puede anteponerse otra columna en la que se registra
el año.

Ejercicio 5.1 Un caso que tiene sólo mediciones periódicas.

En un comercio se registran los valores de las ventas anuales, desde al año 2003 hasta el
año 2011, expresadas en millones de pesos (a moneda constante).

Aplicamos el punto 1: Definición y notación de las variables intervinientes.


ti: años.
yi: Ventas anuales en millones de pesos.

50 Licenciatura en Administración
UNIDAD 5: Series Cronológicas

Aplicamos el punto 2: Tabulamos.

5
Año yi ti
2003 3 1
2004 4 2
2005 4 3
2006 3 4
2007 6 5
2008 8 6
2009 9 7
2010 7 8
2011 10 9

Ejercicio 5.2 Un caso que tiene mediciones periódicas y subperiódicas.

Para estudiar las ventas trimestrales de una empresa, se registraron sus valores desde
el segundo trimestre del año 2001 hasta el primer trimestre del 2011. Esos valores,
expresados en millones de pesos (a moneda constante), se muestran en la tabla siguiente.

Aplicamos el punto 1: Definición y notación de las variables intervinientes.


ti: tiempo en trimestres.
yi: Ventas trimestrales en millones de pesos a moneda constante.

Aplicamos el punto 2: Tabulamos

Año Trimestre yi ti
II 2 1
2001 III 1 2
IV 1 3
I 2 4
II 3 5
2002
III 5 6
IV 6 7

Universidad de Morón 51
ESTADÍSTICA

Año Trimestre yi ti
I 5 8
II 5 9
2003
III 8 10
IV 12 11
I 9 12
II 10 13
2004
III 11 14
IV 14 15
I 10 16
II 10 13
2005
III 13 8
IV 15 19
I 12 20
II 14 21
2006
III 14 22
IV 17 23
I 13 24
II 14 25
2007
III 15 26
IV 19 27
I 13 28
II 13 29
2008
III 16 30
IV 17 31
I 14 32
II 12 33
2009
III 15 34
IV 17 35
I 14 36
II 12 37
2010
III 12 38
IV 15 30
2011 I 15 40

NOTA
Obsérvese que en el año 2001 comenzamos a tener información solo desde el segundo
trimestre, ya que no siempre tenemos información completa.

52 Licenciatura en Administración
UNIDAD 5: Series Cronológicas

3 - REPRESENTACIÓN GRÁFICA
La representación gráfica de estas series se hace en un sistema de coordenadas ortogonales
En la abscisa se registran los valores de la variable tiempo “t”. En la ordenada los de la
variable específica “y”.

4 - ANÁLISIS DE SUS COMPONENTES


Recordemos que en pasos anteriores dijimos que las Series de tiempo tienen componentes
simples en las que pueden descomponerse. También aclaramos que estas podían ser
sistemáticas o aleatorias.

Las sistemáticas son:


• Tendencia,
• Estacionalidad y
• Componente Cíclica.

Expliquemos el significado de cada una.

Tendencia
Es una función que explica el movimiento de la serie a lo largo de un gran número de períodos.
TENDENCIA
Cuando la representación gráfica muestra que los puntos están aproximadamente, alrededor
es una función
de una recta, esto indica que existe una distribución lineal por lo que la función de tendencia que explica el
será de la forma: movimiento
de la serie a
y = a0 + a1 . t lo largo de un
gran número de
Habrá que calcular los valores de a0, y a1 que generen la recta óptima que será aquella que más períodos.

Universidad de Morón 53
ESTADÍSTICA

se aproxime a los puntos empíricos. Para calcularla se aplica el método de los cuadrados
mínimos.
Este consiste en encontrar la recta en la que la suma de las diferencias cuadráticas entre
las ordenadas empíricas y las correspondientes teóricas sea mínima. Aplicando técnicas de
Análisis Matemático se llega al siguiente sistema:

{
n n

S
i=1
yi = a0 . n + a1 S ti
i=1
(1)

n n n

S yi . ti = a0 S ti + a1 S ti2 (2)
i=1 i=1 i=1

Resolviendo ese sistema de ecuaciones se obtienen el valore de a0, también el de a1 los que
nos definen a la recta buscada.
Para aclarar todo esto, creemos conveniente hacer un ejercicio.

Retomemos el Ejercicio 5.1

Agregamos las columnas necesarias para obtener las sumas que requiere el sistema:
Año yi ti yi.ti ti2
2003 3 1 3 1
2004 4 2 8 4
2005 4 3 12 9
2006 3 4 12 16
2007 6 5 30 25
2008 8 6 48 46
2009 9 7 63 49
2010 7 8 56 64
2011 10 9 90 81
n n n n n

S
i=1
S yi = 54
i=1
S t = 45
i=1 i
S yi . ti = 322
i=1
S t 2 = 285
i=1 i

Esto lo necesitamos para la ecuación (1)

Esto lo necesitamos para la ecuación (2)


Con lo cual el sistema queda:

{ 54 = a0 . 9 + a1 . 45

322 = a0 . 45 + a1 . 285

n: El coeficiente de a0 está dado por la cantidad de valores de variable que se tiene.

Resolviendo el sistema obtenemos

ao = 2,70 a1 = 0,86

54 Licenciatura en Administración
UNIDAD 5: Series Cronológicas

Con lo que la recta de tendencia buscada es y = 2,70 + 0,86t

5
Estacionalidad
También llamada “movimientos estacionales”.
Son cambios que se dan en subperíodos, con la característica que son aproximadamente
similares para subperíodos equivalentes de distintos períodos.
¿Qué significa esto? Primero, que es condición necesaria que la información esté dada no
sólo en períodos sino también en subperíodos y además que haya cierta recurrencia. Por
ejemplo, si las mediciones estuvieran dadas en años y trimestres, y se observara que en
general en los segundos trimestres de casi todos los años los valores de la variable son
mayores que en los otros trimestres del mismo año, y que en los primeros son menores, nos
estarían indicando que el suceso en estudio está afectado por la estacionalidad.
Cuando observamos que existe la influencia de la estacionalidad hay que encontrar cómo
cuantificarla, es decir expresar numéricamente la forma en que incide en cada uno de los
subperíodos.
Lo que indica esta incidencia es el “Factor de estacionalidad” que se denota con la letra
griega épsilon e.
Calcular su valor no es fácil, por eso aconsejamos seguir los siguientes pasos:
a) Calcular los “promedios móviles”.
b) Determinar el cociente entre cada valor empírico y su correspondiente promedio móvil,
este cociente será el factor de estacionalidad buscado.

Ejercicio 5.3 En él vemos que la información está dada en períodos: años; y subperíodos:
cuatrimestres.

Aplicamos el punto 1: Definición y notación de las variables intervinientes.

ti: tiempo en cuatrimestres.


yi: Ventas cuatimestrales, por eso hablamos de yi3, ya que por cada año vamos a tener
tres cuatrimestres, y este corresponde al III cuatrimestre del 2011.

Universidad de Morón 55
ESTADÍSTICA

Aplicamos el punto 2: Tabulamos.

Año Cuatrimestre yi ti yi yi / yi3


I 3 1 - -
2008 II 1 2 3 0,3
III 5 3 3,33 1,5
I 4 4 4 1
2009 II 3 5 4,66 0,65
III 7 6 4,66 1,5
I 4 7 4,33 0,92
2010 II 2 8 4,66 0,43
III 8 9 5,33 1,5
I 6 10 6,33 0,95
2011 II 5 11 7 0,71
III 10 12 7,33 1,36
2012 I 7 13 - -

Para calcular los promedios móviles hay que tener en cuenta el número de subperíodos que
hay en cada período. En nuestro ejemplo ese número es 3. A este número de subperíodos
se lo denota con la letra “s”.Reiteramos, en nuestro ejemplo s= 3.
Luego se toman los tres primeros valores de la variable “y”, se promedian y el resultado
se le asigna al subperíodo central de los tres considerados, con lo cual no se tiene el
promedio móvil para el primer valor y1.; nótese que los mismo sucede con los últimos tres
valores donde el promedio móvil queda asignado al tiempo central y por lo tanto al último
no le corresponde promedio móvil.
En el ejemplo, para obtener
• el primer promedio móvil se toman los tres primeros valores de “y”, que además son
todos los que corresponden al año 2008:
(3+1+5):3=3 (corresponde a t2)
• el segundo promedio móvil, se “baja” un subperíodo, quedando:
(1+5+4):3=3,33 (corresponde a t3)
• el tercer promedio móvil, se vuelve a “bajar “ otro subperíodo, resultando:
(5+4+3):3=4 (corresponde a t4)

Se sigue reiterando el proceso, para cada promedio se toman tres valores sucesivos, de
la variable pero dejando el primero del promedio anterior y tomando el valor de “y” del
subperíodo siguiente. Observar que en el ejercicio quedan sin promedio el primer y el
último subperíodo, como ya dijimos.
Ya tenemos calculados los promedios móviles, pero nuestro objetivo es conocer los valores
de los factores de estacionalidad correspondiente a cada subperíodo. Para eso hay que
dividir cada valor de la variable por el promedio móvil del mismo subperíodo. Volvamos al
ejemplo.
Miremos la columna seis de la tabla
• En la primera fila no hay promedio móvil, por lo que no se podrá calcular su factor
de estacionalidad.
• En la segunda fila se hace 1/3= 0,33
• En la tercera fila 5/3,33=1,50

56 Licenciatura en Administración
UNIDAD 5: Series Cronológicas

Así sucesivamente para cada yi.


Ya tenemos calculados los factores de estacionalidad correspondiente a cada valor de ti.

5
El paso siguiente es encontrar los valores que representen en general, la estacionalidad
que corresponde a todos los primeros cuatrimestres, a todos los segundos, a todos los
terceros. Estos se llaman “factores de estacionalidad ajustados”.
Sus respectivos valores se obtienen:
• Para los primeros cuatrimestres, se promedian los factores de estacionalidad de
todos los primeros cuatrimestres;
• Para los segundos, lo mismo pero con los de los segundos;
• Igual para los terceros…

Factor de estacionalidad ajustado correspondiente a los primeros cuatrimestres


(1+0,92+0,95)/ 3 = 0,95 Este valor se coloca en la séptima columna en todos los
primeros cuatrimestres.

Año Cuatrimestre yi ti yi3 yi / yi3 = e e


I 3 1 - - 0,95
2008 II 1 2 3 0,3 0,523
III 5 3 3,33 1,5 1,465
I 4 4 4 1 0,95
2009 II 3 5 4,66 0,65 0,523
III 7 6 4,66 1,5 1,465
I 4 7 4,33 0,92 0,95
2010 II 2 8 4,66 0,43 0,523
III 8 9 5,33 1,5 1,465
I 6 10 6,33 0,95 0,95
2011 II 5 11 7 0,71 0,523
III 10 12 7,33 1,36 1,465
2012 I 7 13 - - 0,95

Factor de estacionalidad ajustado correspondiente a los segundos cuatrimestres


(0.3+0.65+0,43+0.71)/ 4= 0,523 Ídem en todos los segundos cuatrimestres.

Factor de estacionalidad ajustado correspondiente a los terceros cuatrimestres


(1.50+1,50+1.50+1,36)/ 4= 1,465 Ídem en todos los terceros cuatrimestres.

¿Qué significa realmente los promedios móviles?


Son valores teóricos, aquellos que le hubieran correspondido a la variable si el suceso en
estudio no estuviera afectado por la estacionalidad.

¿Qué significa realmente los factores de estacionalidad?


Cuando el factor de estacionalidad es menor que 1 significa que la estacionalidad actuó
deprimiendo los valores de las variables respecto de los que teóricamente le hubieran
correspondido. Cuando es mayor que 1 significa que en ese subperíodo, la influencia de
la estacionalidad hizo que la variable tomará valores superiores a los que teóricamente le
hubieran correspondido. ¿Y cuando es próximo a 1? Significa que en ese subperíodo la
estacionalidad no influyó.

Universidad de Morón 57
ESTADÍSTICA

Movimientos Cíclicos o Componente Cíclica


Recordemos que estos movimientos son otra de las componentes sistemáticas en las
que puede descomponerse una serie de tiempo. Es frecuente que en varias actividades
económicas existan períodos de crecimiento que a lo largo de algunos años las conduzcan
a un máximo rendimiento, seguidos de decrecimientos progresivos que pueden terminar
en períodos críticos. Todas estas variaciones se producen abarcando varios períodos y su
representación gráfica tiene forma ondulatoria. Estos cambios no se dan siempre, pero cuando
ocurren se dice que la serie cronológica en estudio está afectada por movimientos cíclicos.
Como ejemplo tenemos lo que pasó en la República. Argentina, con el turismo receptivo entre
los años 1940 a 2011, según el impacto del valor de la divisa extranjera.

MOVIMIENTOS ALEATORIOS
Son movimientos no sistemáticos, vale decir no son susceptibles de ser expresados
analíticamente. Se caracterizan por ser variaciones fuertes, no continuadas en el valor de la
variable, a veces pueden ser previsibles y otras no.

Ejemplo Si en un año, en una zona rural hay una gran sequía o una importante inundación,
su producción agropecuaria será muy inferior a la esperada según lo indicada por
la tendencia, y esto no era previsible. Pero tomando otro ejemplo, si en una ciudad
se desarrolla un evento deportivo muy importante como puede ser una Olimpíada o
un torneo internacional de algún deporte, es de esperar que la ocupación hotelera
aumente fuertemente en ese tiempo, y esto es previsible.

Resumiendo, los movimientos aleatorios, son variaciones fuertes, puntuales, no continuadas,


Los previsibles o no.
MOVIMIENTOS Al comenzar el estudio de estas series, dijimos que una de sus aplicaciones, es la de estimar
ALEATORIOS, valores de la variable para tiempos que no figuran en ella mediante la función de pronóstico.
son variaciones Pero es imprescindible tener en cuenta que, esas estimaciones no siempre son confiables,
fuertes, ya que los valores futuros pueden estar influenciados por un sinfín de variables exógenas, no
puntuales, no siempre previsibles.
continuadas,
previsibles o no.
Ejemplo Cambios, ya sean en las condiciones de mercado, en la política económica, en
circunstancias sociales internas o externas, en fenómenos atmosféricos o en otros
muchos, difíciles de enumerar.

Resumiendo, insistimos, para que los valores obtenidos mediante la función de pronóstico
sean creíbles es necesario que las variables exógenas permanezcan aproximadamente
estables y que el período a pronosticar no esté alejado del último de la serie.
Hechas todas estas consideraciones, veamos la función de pronóstico.

Notación: Npr.

Cuando la serie no presenta estacionalidad, se determina el valor de “t” que corresponde al


período a pronosticar y en la función de tendencia se le asigna a “t” ese valor.

58 Licenciatura en Administración
UNIDAD 5: Series Cronológicas

Ejercicio 5.4 Tomemos el ejemplo 12:

5
Si se quisieran estimar las ventas para el año 2012, en él resulta t= 11.

La función de tendencia calculada fue y = 2,70 + 0,86t

Por lo que Npr11 = 2,70 + 0,86 . 11


= 12,16 millones de pesos.

La respuesta será: Para el año 2012, se esperan ventas por aproximadamente


12 millones de pesos, a condición de que no haya cambios importantes en las
condiciones de entorno.
Si la serie tuviera estacionalidad, el procedimiento es similar, la diferencia está en que a
la función de tendencia habrá que multiplicarla por el factor de estacionalidad ajustado
correspondiente.
Para ponderar la comprensión de la teoría, plantearemos algunas preguntas:
1) ¿Qué información es necesario tener para poder cuantificar el efecto de la
estacionalidad?
2) ¿Cuáles son las componentes sistemáticas de una serie de tiempo?
3) ¿Podría dar un ejemplo, de su entorno social o laboral de un movimiento estacional?
4) ¿Los movimientos cíclicos se dan dentro de un período o abarcan varios de ellos?
5) Piense en una situación que hiciera que no fueran confiables los valores estimados
con la función de pronóstico.

Terminamos con la parte teórica de esta unidad sobre series de Tiempo. Ahora en la
Actividad propuesta de esta unidad del Módulo de Trabajos prácticos encontrará ejercicios
de aplicación. Trate de resolverlos y si se le presenta alguna dificultad consulte con su tutor.

Actividad Propuesta Unidad 5 del Módulo IV

Universidad de Morón 59
ESTADÍSTICA

60 Licenciatura en Administración
UNIDAD 6

REGRESIÓN Y
CORRELACIÓN BIVARIADA
Contenidos

Cálculo de las funciones de regresión. Cálculo del coeficiente de correlación.

Objetivos

Que el alumno logre:

• Entender el significado de la correlación entre dos variables.


• En el caso de correlación lineal, calcular las funciones de regresión y conocer su aplicación.
• Definir y calcular el coeficiente de correlación, conocer qué valores puede tomar y el
significado de los mismos.
• Resolver casos en los que corresponda usar esta técnica.
ESTADÍSTICA

62 Licenciatura en Administración
UNIDAD 6

6
REGRESIÓN
Y CORRELACIÓN
BIVARIADA
IDEAS PREVIAS En esta Unidad

Ideas Previas 63
En esta Unidad se nos presentará un enfoque distinto al estudiado en las
Coeficiente de Correlación 66
unidades anteriores. En ellas teníamos una variable y nos interesaba saber
ya sea como se distribuía y cuales eran los valores que la caracterizaban, en
el caso de las series de frecuencias o como se movía a lo largo del tiempo, en
las cronológicas. Ahora vamos a tener dos variables cada una con sus valores
y buscaremos conocer si existe alguna vinculación entre ellos.
Continuando con el estilo aplicado anteriormente, comencemos por
plantearnos algunas preguntas

1) ¿Qué necesitamos tener para organizar la información usando la


técnica correspondiente a este tema?
2) ¿Qué podremos calcular con ella
3) ¿Qué aplicación le daremos a lo calculado?

Veamos las respuestas:

1) El suceso en estudio debe tener 2 variables “x” e “y” que pueden


estar expresadas en la misma o en distintas magnitudes. Además es
necesario tener valores pareados de ambas. Vale decir, a cada valor
de “x” su correspondiente valor de “y”.

2) El objetivo es analizar si existe relación entre los valores de ambas


variables, y de existir encontrar la función o las funciones que lo
representen, estas se llaman “funciones de regresión”. Una vez
calculadas hay que cuantificar la “fuerza” con que ellas representan
esa relación, para ello se calcula el “Coeficiente de correlación”.
(También se lo llama “Coeficiente de correlación de Pearson”)
Karl Pearson (Londres 27 de marzo de 1857- Londres, 27 de abril de
1936) fue un prominente científico, matemático y pensador británico, que
estableció la disciplina de la estadística matemática. Desarrolló una
intensa investigación sobre la aplicación de los métodos estadísticos
Karl
en la biología y fue el fundador de la bioestadística.
Pearson
Fuente: http://es.wikipedia.org/wiki/Karl_Pearson

Universidad de Morón 63
ESTADÍSTICA

3) Las funciones de regresión calculadas nos permitirán estimar el valor de una de las
El ESTUDIO variables que le corresponde a un determinado valor de la otra, y el coeficiente de
DE LA correlación nos dirá si esa estimación es confiable.
REGRESIÓN Y
CORRELACIÓN
Podemos resumir lo anterior y decir que el estudio de la regresión y correlación entre dos
ENTRE DOS
VARIABLES variables es el conjunto de técnicas que partiendo de datos pareados de las mismas busca
es el conjunto encontrar la función o las funciones que describan la relación entre ellas y también calcular la
de técnicas que fuerza con que esas funciones describen la relación.
partiendo de ¿Por qué dijimos la o las funciones?
datos pareados Por que puede ocurrir que haya una sola variable independiente, siendo la otra dependiente o
de las mismas que ambas puedan ser alternativamente independientes.
busca encontrar Veamos distintos casos para entenderlo mejor.
la función o las
funciones que
describan la CASO 1 Una empresa inmobiliaria desea estudiar si el número de sus ventas mensuales
relación entre están relacionadas con las tasas que pagan los bancos por inversiones financieras.
ellas y también Para ello registra las ventas efectuada en los últimos 14 meses y las tasas
calcular la correspondientes a cada uno de ellos. Tenemos:
fuerza con que
esas funciones x: tasa bancaria mensual (x es la variable independiente);
describen la
y: número de ventas mensuales (y es la variable dependiente).
relación.

Por lo que habrá que calcular una sola función de regresión, la que permita estimar el valor
de “y”

CASO 2 En una empresa se estudia la relación existente entre el gasto publicitario mensual
y las ventas correspondientes a esos mismos meses. Puede ocurrir que el objetivo
sea estimar las ventas mensuales correspondientes a un determinado gasto
publicitario. Así:

x : gasto publicitario ( x es la variable independiente);


y : ventas mensuales ( y es la variable dependiente).

Pero si el fin fuera estimar cual sería el gasto necesario a efectuar para alcanzar
determinadas ventas mensuales. Ocurriría:

x: ventas mensuales ( x es la variable dependiente);


y: gasto publicitario ( y es la variable independiente).

En este caso tendremos que calcular dos funciones de regresión


• La que permita estimar el valor de “y”;
• la que permita estimar el valor de “x”

Posibles ejemplos en los que podrían aplicarse estas técnicas

Ejemplo 1 En una empresa se registra el número de horas pagadas mensualmente a sus


operarios (variable “x”) y la producción en número de artículos en esos mismos
meses (variable “y”).

64 Licenciatura en Administración
UNIDAD 6: Regresión y Correlación Bivariada

Ejemplo 2 En el Departamento de Relaciones Humanas de una compañía se seleccionan


aleatoriamente 39 empleados y se registra la calificación obtenida por cada uno

6
de ellos en el examen de admisión (x) y la obtenida en el examen de evaluación
efectuado después de tres años de trabajo (y).

Ejemplo 3 El gerente de una empresa comercial, quiere estudiar si existe una relación
positiva entre el gasto mensual publicitario (x) y las ventas correspondiente a
cada mes inmediato posterior (y) .

Ejemplo 4 En una Cámara de negocios inmobiliarios desean determinar si las altas tasas
de interés pagadas por los bancos en los depósitos a plazo fijo (x) inciden en el
volumen de sus ventas (y)

Creemos que estos ejemplos son suficientes para tener en claro el objetivo de este tema.
Veamos ahora los pasos a seguir para obtener lo buscado.

• Ordenar la información en una tabla de dos columnas. La primera encabezada por “x”,
la segunda por “y”
• Hacer el “Diagrama de dispersión”, éste es el conjunto de puntos que resulta de
representar gráficamente en un sistema de coordenadas ortogonales cada par ordenado
(xi , yi). Si esos puntos están dispuestos en el plano, próximos a una recta, significa que
existe correlación lineal, por lo que las funciones de regresión serán de la forma

y = ao + a1 x Esta es la recta de regresión de “y” en “x”


x = bo + b1 y Esta es la recta de regresión de “x” en “y”

1) Hay que calcular los valores de ao , a1 , bo y b1, que definirán a las rectas optimas, para
ello se aplica el método de los cuadrados mínimos el que gracias a técnicas de análisis
matemático genera los siguientes sistemas de ecuaciones
• Para calcular a0, a1 • para calcular b0,b1

{ {
n n n n

S yi = a0 . n + a1 S xi
i=1 i=1
S xi = b0 . n + b1 S yi
i=1 i=1

n n n n n n

S xi . yi = a0 S xi + a1 S xi
i=1 i=1 i=1
2
S xi . yi = b0 S yi + b1 S yi2
i=1 i=1 i=1

Al representar gráficamente las rectas obtenidas, éstas se cortarán en un punto llamado


“BARICENTRO” (para algunos autores VARICENTRO), cuyas coordenadas son la
media aritmética de x, la media aritmética de y:

y∩x=(x,y)

Al hacer un ejercicio completo va a quedar mucho más claro.

Universidad de Morón 65
ESTADÍSTICA

COEFICIENTE DE CORRELACIÓN

Notación: “r” (En algunos programas informáticos se lo denota “R” )

Objetivo de su cálculo: cuantificar la intensidad de la correlación entre dos variables

Forma de calcularlo:

y = +_ a1 . b1

Aclaraciónes Importantes
1) Siempre el signo de a1 es igual al signo de b1 (esto tiene una justificación
matemática);
2) Si ambos son positivos, significa que existe correlación directa, por lo que “r” toma el
signo positivo de la raíz. Si ambos son negativos entonces r es negativo lo que indica
que las variables tienen correlación inversa (cuando una crece, la otra decrece).

Posibles valores del coeficiente de correlación.

-1 ≤r≤1

Eso significa que r puede tomar cualquier valor real en el intervalo [ -1, 1 ].

Si r= -1 → que existe correlación lineal perfecta e inversa entre las variables consideradas.
Si r= 0 → que no existe correlación lineal.
Si r= 1 → que existe correlación lineal perfecta y directa.

Lo que significa que cuanto más cerca de -1 ó de 1 esté el valor de r, nos indica que las
variables están mejor correlacionadas, .por lo que las estimaciones efectuadas serán más
confiables.

Ejercicio 7.1 Para estudiar cual es la incidencia en las ventas que tiene el número de
personas contratadas temporalmente para promocionarlas en forma directa
se registran, a lo largo de 9 meses , el número de personas contratadas en
cada uno de ellos, y el porcentaje de incremento en las ventas en los meses
correspondientes-

Sea x= número de personas contratadas mensualmente;


y= porcentaje mensual de incremento en las ventas.

Luego de registrados los valores de las variables, añadiremos las columnas necesarias
para poder plantear los sistemas que figuran en la página anterior.

66 Licenciatura en Administración
UNIDAD 6: Regresión y Correlación Bivariada

x yi xi - yi xi2 y i2
3 2 6 9 4

6
2 2 4 4 4
6 8 48 36 64
7 12 84 49 144
2 4 8 4 16
3 5 15 9 25
8 16 128 64 256
5 10 50 25 100
4 8 32 16 64

En la tabla vemos: n = 9
n n n n n

i=1
S xi = 40 S
i=1
yi = 67 S
i=1
xi . yi = 375 S
i=1
xi2 = 216 S yi2 = 677
i=1

{ 67 = a0 . 9 + a1 . 40

375 = a0 . 40 + a1 . 216
{ 40 = b0 . 9 + b1

375 = b0 . 67 + b1 . 677

Resolviendo estos sistemas se obtienen los valores siguientes



a 0= -1,53 a1= 2,02 b0= 1,24 b1= 0,43

Con lo que las rectas de regresión buscadas resultan

y = 1,53 + 2,82x x = 1,24 + 0,43y

Al representar gráficamente las rectas de regresión calculadas, éstas se cortan en un


punto que, recordemos, se llama baricentro. Para calcular sus coordenadas buscamos las
medias de las variables. (Recordemos que para hacerlo dividimos las respectivas sumas
por el número de datos de cada una).

x = 40 = 4,44
y = 67 =7,44 por lo que las rectas se cortarán
9 9
en el punto ( 4,44; 7,44 )

Realizamos tablas de valores para la representación gráfica:

Dejamos en manos del alumno la representación de estas funciones.

Universidad de Morón 67
ESTADÍSTICA

Aplicación de lo calculado:

1) Se desea estimar cual sería el incremento porcentual en las ventas, un mes en el que se
contratarán 5 personas;
2) ¿Cuál será el número aproximado de personas que deberían contratarse para obtener en
un mes un incremento del 8%?
3) Justificando la respuesta, decir si las estimaciones son confiables.

Respuestas:

1) Hay que estimar el valor de “y” para x=5


y(5) = -1,53 + 2,02 . 5
= 8,57 %

2) Hay que estimar el valor de x para y=8


x(8) = 1,24 + 0,43 . 8
= 4,69 lo que significa que aproximadamente habrá que contratar 5 empleados.

3) Habíamos visto que la confiabilidad de la estima depende de la intensidad con que las
variables estén correlacionadas y que para cuantificarla hay que calcular “r”:

R=+ 2,02 . 0,43 = 0.93

Este valor tan próximo a 1 indica que la correlación es muy fuerte por lo que los valores
estimados son confiables.

Aclaraciónes Importantes
1) Cuando más adelante veamos los temas de Inferencia Estadística contaremos con
nuevas herramienta que nos permitirán decidir con mayor rigor si aceptamos o no
los valores estimados.
2) Tanto en el ejercicio que pusimos como ejemplo como en los que daremos para
resolver se ha trabajado con una información reducida, y de la que no sabemos
que sea realmente representativa de la población .Lo primero se debe a razones
didácticas, facilitar la operatoria. En lo que respecta a la representatividad veremos
cómo conseguirla cuando veamos las Técnicas de muestreo.

Terminamos con la parte teórica de esta unidad que son de gran aplicación. Ahora en la
Actividad propuesta de esta unidad del Módulo de Trabajos prácticos encontrará ejercicios
de aplicación. Para simplificar lo operativo existen buenos programas informáticos, En alguno
de ellos varía algo la notación, pero son cambios menores. Cuando esté a su alcance use la
computadora.

Actividad Propuesta Unidad 6 del Módulo IV

68 Licenciatura en Administración

Вам также может понравиться