Академический Документы
Профессиональный Документы
Культура Документы
LICENCIATURA EN
ADMINISTRACIÓN
Estadística
Módulo I - Estadística Descriptiva
Universidad de Morón 3
ESTADÍSTICA
4 Licenciatura en Administración
UNIDAD 1
CONCEPTOS BÁSICOS
Contenidos
Objetivos
6 Licenciatura en Administración
UNIDAD 1
CONCEPTOS
BÁSICOS 1
DESARROLLO DE LA UNIDAD En esta Unidad
Desarrollo de la Unidad 7
Para introducirnos en la materia, veamos algo importante.
Ideas Previas 7
Las primeras preguntas que aparecen al comenzar el estudio de esta materia
Primeras Definiciones 8
son:
Aclaraciones Importantes 10
- ¿Qué es la Estadística?
- ¿Qué aspectos abarca?
- ¿Cuál es la utilidad que puede ofrecerme en mi profesión?
Las respuestas son diversas. Más adelante intentaremos algunas.
IDEAS PREVIAS
Antes de dar una definición de los principales conceptos de la estadística
o de hablar de sus objetivos, daremos algunos ejemplos de sus campos de
aplicación.
Así si se aborda el estudio del precio de los campos en una cierta zona, al
tener el registro de los precios por hectárea que se hubiese obtenido en los
últimos cinco años por sus ventas, algunas de las preguntas que podrían
plantearse respecto de ese suceso, serán:
1. ¿Cuál fue el precio promedio?
2. ¿Hubo algún precio que se repitió en mayor número de veces que otro?
3. ¿Más de cuánto es el valor por hectárea que correspondió al 50% de
las transacciones registradas? ¿Menos de cuánto al 20% de ellas?
4. ¿A lo largo del tiempo el valor, tuvo un crecimiento o decrecimiento
sostenido?
5. ¿Existieron en cada año, meses en los que sistemáticamente los
precios fueran más altos?
¿O más bajos? ¿En que proporción?
6. ¿El precio obtenido en cada momento, estuvo relacionado con el precio
del dólar? ¿O con el precio del girasol a futuro? ¿O con el de algún otro
bien?
7. ¿Podemos encontrar alguna expresión que nos permita estimar el precio
de la hectárea para el próximo año? ¿Será confiable esa estimación?
Universidad de Morón 7
ESTADÍSTICA
Bien, las respuestas a estas preguntas y a muchísimas más, podrán obtenerse aplicando las
La técnicas que nos brinda la ESTADÍSTICA.
ESTADÍSTICA Primero diremos que:
es una rama de
La estadística es una rama de la matemática aplicada que comprende métodos y
la matemática
aplicada que algoritmos por medio de los cuales se podrá recolectar, organizar, elaborar y analizar
comprende información respecto de un conjunto de entes con el fin de extraer conclusiones válidas de
métodos y su comportamiento o relaciones.
algoritmos por Luego veremos que de esta misma definición surgen los pasos a seguir para lograr el objetivo
medio de los buscado.
cuales se podrá En cuanto a los aspectos que abarca la estadística, estos dependen de la etapa del estudio
recolectar,
correspondiente.
organizar,
Así tendremos tres etapas:
elaborar
y analizar • Etapa descriptiva.
información • Etapa analítica.
respecto de • Etapa inferencial.
un conjunto de
entes con el Analicemos que es lo que veremos en cada una de ellas.
fin de extraer
conclusiones
Etapa Descriptiva
válidas de su
comportamiento
o relaciones. Series de frecuencias.
Series cronológicas.
Regresión y correlación bivariada.
Etapa Analítica
Etapa Inferencial
PRIMERAS DEFINICIONES
Previo al desarrollo de cada tema, creemos conveniente explicar el significado de algunos de
los vocablos de mayor uso.
Población
Conjunto formado por la totalidad de los elementos que son objeto de un estudio determinado.
Como se verá no siempre es fácil acceder a toda la población, es por eso que muy
8 Licenciatura en Administración
UNIDAD 1: Conceptos Básicos
frecuentemente se trabaja con subconjuntos de ella, los que pueden ser de distinta naturaleza.
Aclaración: el estudio de toda la población constituye lo que llamamos un “censo”.
1
Series
Son subconjuntos poblacionales, pero los elementos que las componen no son elegidos
aplicando algún método que garantice su representatividad respecto de la población, es por
eso que los resultados obtenidos a través de su estudio no pueden generalizarse, sólo son
válidos dentro de esa serie.
Ejemplo Un ejemplo de esto sería, registrar las edades de todas las personas que habitan
tres manzanas determinadas de una ciudad. Con esa información podría calcularse, POBLACIÓN
Conjunto
la edad promedio, la más frecuente, más de cuantos años tiene la mitad de las
formado por
personas consideradas y otro buen número de valores que darían un panorama
la totalidad de
de las características del suceso en estudio. Pero cuidado, éstos sólo se refieren los elementos
al grupo de personas testeadas, se cometería un enorme error si se usaran esos que son objeto
valores para asignárselos a toda la población de la ciudad. de un estudio
determinado.
Muestras
SERIES
También son subconjuntos poblacionales, pero sus elementos son elegidos aplicando técnicas Son
subconjuntos
específicas llamadas “Métodos de muestreo” lo que hace que en general representen a la
poblacionales,
población, por lo que los valores obtenidos a partir de su estudio puedan usarse para estimar pero los
o decidir respecto de medidas poblacionales. elementos que
las componen
no son elegidos
Variables aplicando algún
método que
Son entidades cuantitativas. Ellas registran los datos que pueden tomar sucesos cuyos valores
garantice su
representatividad
se expresan numéricamente.
respecto de la
Estas variables pueden ser: población, es
• Variables discretas: son aquellas en las que existen valores entre los cuales no puede por eso que
haber un valor intermedio. los resultados
Ejemplo Por ejemplo si nos referimos al número de clientes entre 6 clientes y 9 obtenidos
clientes podría haber 7 ó 8. Pero si tenemos 7 y 8 no habrá un número de a través de
clientes intermedio. su estudio
no pueden
• Variables continuas: son las variables que siempre admiten la existencia de un valor
generalizarse,
intermedio entre cualquier par de valores. sólo son válidos
Así si el tema es el peso de los artículos de nuestro stock podrá haber uno que pese dentro de esa
320 gramos y otro cuyo peso sea de 321 gramos, pero está claro que también podría serie.
existir otro cuyo peso sea de 320,17 gramos. Aclaremos que si bien desde el punto de
vista teórico esto es correcto, en la práctica, sobre todo en problemas comerciales, se
determinará la precisión con que se trabajará, ya sea por la necesidad del problema o
por la limitación que impongan los instrumentos de medición.
Insistamos con el tema a partir de otro
Universidad de Morón 9
ESTADÍSTICA
ATRIBUTOS 1. Definir con claridad y precisión aquello que queremos estudiar. Este problema a estudiar
También es lo que se denomina “suceso estadístico¨.
llamados Ejemplo Precio en pesos por m2 de las propiedades vendidas en el último trimestre
“variables
en una ciudad. En este ejemplo luego habrá que determinar si nos interesa
cualitativas”,
son entidades un barrio determinado, o las propiedades de cierta antigüedad o de
que registran, determinada categoría.
mediante Por lo tanto a las definiciones ya dadas agreguemos:
sustantivos o • El SUCESO CUANTITATIVO es el susceptible de ser expresado numéricamente.
adjetivos, las • El SUCESO CUALITATIVO sólo admite expresión sustantiva o nominal.
distintas formas
que puede tomar
2. Dejar aclarado de dónde se tomará la información; cámaras empresariales, relevamientos
un suceso no
propios.
numérico.
10 Licenciatura en Administración
UNIDAD 1: Conceptos Básicos
3. Determinar cuál será la técnica más adecuada para elaborar dicha información.
1
Este paso es el más difícil, ya que requiere que conozcamos cuáles son los métodos más
usuales y así podamos elegir el que más conviene para obtener lo que buscamos.
Es muy importante entonces poder determinar: ¿cuál es la técnica que más conviene?, ¿cómo
habrá que ordenar la información para responder correctamente? Veamos algunos ejemplos
para aclarar ideas.
Si en una empresa, se tiene registrado el número de artículos de cierta marca, vendidos
mensualmente a lo largo de los últimos tres años. ¿Cómo ordenamos estos datos?
Depende de qué es aquello a lo que hay que responder.
• Si lo que se quiere saber es el promedio mensual de ventas o,
• conocer menos de cuántos artículos se vendieron el 30 % de los meses considerados, o
• algún otro valor que aproximadamente muestre como se distribuyó la variable “ventas
mensuales” en los tres años en estudio, habrá que organizar la información generando
una “Serie de frecuencias”.
Pero si las preguntas fueran otras, por ejemplo,
• “La tendencia de las ventas, en el tiempo registrado ¿fue creciente, decreciente o
constante?, y, en cualquiera de esos casos, ¿será posible encontrar una función que la
explique?
• También si se quisiera saber si esas ventas estuvieron afectadas por la estacionalidad
y, de ser así, poder cuantificar su efecto.
• Si el problema planteado fuera, bajo ciertas circunstancias, poder estimar las ventas
mensuales para un período futuro, en cualquiera de esos casos, la técnica a aplicar
sería presentar los datos bajo la forma de una “Serie cronológica”.
Podríamos seguir agregando otros ejemplos, pero creemos que los dados son suficientes
para remarcar la idea de que no sólo hay que conocer el manejo de las distintas técnicas, sino
también tener muy en claro cual es el significado de los valores que resultan de la aplicación
de cada una de ellas.
Otro aspecto que queremos resaltar es evitar el error, muy frecuente, de generalizar resultados
parciales. Un célebre filósofo, Disraeli, decía que “existen tres tipos de mentiras, las mentiras,
las mentiras crueles y la Estadística”. Lamentablemente esto es muchas veces cierto.
Benjamín Disraeli KG, FRS, PC (Londres, 21 de diciembre de 1804 - 19 de abril de
1881, Curzon Street, Londres), conocido también como Conde de Beaconsfield o Lord
Beaconsfield, fue un político, escritor y aristócrata británico, que ejerció dos veces como
Primer Ministro del Reino Unido, fue Líder de la Muy Leal Oposición de Su Majestad y tres
veces Ministro de Hacienda del Reino Unido. 1
Todos hemos visto avisos publicitarios del tipo:
“La utilización, durante tres meses, de la crema cosmética TAL, produce una reducción del
80% en las arrugas faciales”. E infinidad de otros semejantes.
Y todos esos números, generalmente falsos, son la resultante de expresar como si valieran Benjamin
Disraeli
para toda la población, valores obtenidos en el estudio de subconjuntos no representativos.
1 Fuente: http://es.wikipedia.org/wiki/Benjamin_Disraeli
Universidad de Morón 11
ESTADÍSTICA
12 Licenciatura en Administración
UNIDAD 2
SERIES DE FRECUENCIAS
Contenidos
Objetivos
14 Licenciatura en Administración
UNIDAD 2
SERIES DE
FRECUENCIAS
Universidad de Morón 15
ESTADÍSTICA
SERIE SIMPLE
Dado un suceso cuantitativo, esta técnica consiste en tabular los valores que presenta en
forma creciente y en la misma tabla asignar a cada uno de esos valores el número de veces
que él se repite, es decir, lo que llamamos su “frecuencia absoluta”.
NOTA
Como en general en matemática es usual designar a las variables con las últimas letras
de nuestro alfabeto, por ejemplo “x”. En nuestra tabla la columna en la que se colocarán
ordenados en forma creciente los valores de la variable estará encabezada por la letra
“x”. Pero para saber si nos referimos al primer, al segundo o al enésimo valor de la
variable, a la “x” se le agregará el subíndice “i”, de este modo x3, indicará que estamos
hablando del tercer valor de “x” que figura en la tabla. El mismo criterio se aplicará en
la columna de frecuencias.
Ejercicio 2.1 Se tienen 20 personas, elegidas aleatoriamente entre los integrantes de una
oficina.
Se define la variable X: Edad en años.
El nivel de precisión es el año.
Se quiere estudiar las características más representativas de la variable en
análisis.
La fuente, relevamiento propio.
Se genera una tabla, en cuya primera columna se colocan en forma creciente
los valores que toma la variable, y en la segunda el número de veces que
cada valor de variable se repite.
16 Licenciatura en Administración
UNIDAD 2: Series de Frecuencias
x = edad en años.
xi fi
2
3 2
7 4
12 1
18 5
21 4
34 4
N = 20
Representando gráficamente:
Al sumar las frecuencias absolutas, en este ejemplo, se obtiene 33, eso significa que se han
registrado las ventas de 33 semanas. O sea que tenemos una serie de tamaño N=33.
Esta tabla en la que los valores de la variable se registraron uno por uno constituye una “Serie
simple”.
Universidad de Morón 17
ESTADÍSTICA
Representando
gráficamente:
NOTA
Recuerde la notación vista en materias matemáticas anteriores.
La expresión [30,34) es un intervalo semiabierto en 34, es decir que se computarían
todas las edades desde 30 hasta 34, pero sin incluir esta última.
Ejercicio 2.3 Una pequeña compañía se servicios de remises quiere estudiar la cantidad
de kilómetros diarios recorridos por la totalidad de sus unidades en un mes.
Las mediciones ya ordenadas se registran en la siguiente tabla, siendo:
18 Licenciatura en Administración
UNIDAD 2: Series de Frecuencias
2
[li , Li) fi xi (marca de clase)
70 hasta menos de 80 2 75
80 “ “ 90 3 85
90 “ “ 100 3 95
100 “ “ 110 8 105
110 “ “ 120 7 115
120 “ “ 130 5 125
130 “ “ 140 3 135
[li , Li) fi xi
[70,80) 2 75
[80,90) 3 85
[90,100) 3 95
[100, 110) 8 105
[110, 120) 7 115
[120, 130) 5 125
[130, 140) 3 135
Representando gráficamente:
[ li Li ] fi
[40,60) 6
[60,80) 15
[80,100) 15
[100.120) 30
[120,140) 14
[140, 160) 20
C = 20
N = 100
Universidad de Morón 19
ESTADÍSTICA
NOTA
podríamos preguntarnos porqué elegimos amplitud 20m2 en cada intervalo.
La elección de la amplitud de los intervalos depende de la naturaleza del problema que
se trata. Así si quien encarga el estudio considera que un inmueble de 80 y 87 tienen
características similares para los que se busca analizar establecerá un intervalo de
amplitud 7.
ACLARACIÓN
no necesariamente todos los intervalos deben tener igual amplitud, si el problema lo
permite es conveniente que la amplitud sea la misma para todos los intervalos.
Pero hay veces en que la naturaleza del problema exige agrupar los valores de variable
con distinta amplitud, así por ejemplo si se aplicara el viejo criterio de calificar a los
alumnos en, Aplazados, Regulares, Buenos, Distinguidos, Sobresalientes, al llevarlo a
valores de variable, siendo esta el puntaje numérico obtenido en la calificación, podría
generarse una serie del siguiente tipo:
Puntaje Intervalos
Menos de 4 [0,4) Aplazados
Entre 4 y 5 [4, 5] Regulares
Entre 6 y7 [6, 7] Buenos
Entre 8 y 9 [8, 9] Distinguidos
10 10 Sobresalientes
Repasemos
Los intervalos de clase pueden ser de distinto tipo, cerrados, abiertos, semi-abiertos.
[ li Li ] CERRADO, la variable toma los valores de ambos límites, además de los
comprendidos entre ellos.
[ li Li ) SEMI ABIERTO, la variable no toma el valor de uno de los límites, en este caso el
superior.
( li , Li) ABIERTO, la variable nunca toma los valores de los límites.
Cada CLASE tiene un límite superior e inferior; y además, una frecuencia absoluta
asociada a ella.
Se llama AMPLITUD de un intervalo a la diferencia entre su cota superior y su cota inferior
(c)
20 Licenciatura en Administración
UNIDAD 2: Series de Frecuencias
2
CLASIFICACIÓN DE LAS
SIMPLE
SERIES DE FRECUENCIAS
DE DATOS AGRUPADOS
Terminamos con la parte teórica de esta unidad. Ahora en la Actividad propuesta de esta unidad
del Módulo de Trabajos prácticos encontrará ejercicios de aplicación. Trate de resolverlos y si
se le presenta alguna dificultad consulte con su tutor.
Se llama
AMPLITUD de
un intervalo a la
diferencia entre
su cota superior
Actividad Propuesta Unidad 2 del Módulo IV y su cota inferior
(c)
Universidad de Morón 21
ESTADÍSTICA
22 Licenciatura en Administración
UNIDAD 3
MEDIDAS DE POSICIÓN
DE SERIES DE FRECUENCIAS
Contenidos
Objetivos
24 Licenciatura en Administración
UNIDAD 3
MEDIDAS DE POSICIÓN
DE SERIES DE FRECUENCIAS
• Medidas de posición.
• Medidas de dispersión.
• Medidas de forma.
Universidad de Morón 25
ESTADÍSTICA
NOTA 1: Notación
Se adoptará, por convención para medidas características de series y muestras:
LETRAS LATINAS. Para medidas características poblacionales: LETRAS GRIEGAS.
NOTA 2
Consideraremos aquí sólo las más comunes, a saber: la media aritmética, el modo y
la mediana.
MEDIA ARITMÉTICA
Es un promedio ponderado de los valores que toma la variable.
Quizás sea la medida más usada.
Con respecto a las otras medidas de posición que se verán más adelante tienen la ventaja
de que:
• En su cálculo entran todos los valores de la serie.
• Es susceptible de manejo algebraico.
• Es única en cada serie.
• En general, es la medida de mayor representatividad de la serie.
Pero su desventaja es que está muy influenciada por los valores extremos, lo que hace que
deje de ser una medida representativa cuando la variable presenta gran dispersión.
Un ejemplo sencillo ayudará a entender esta idea.
En ese ejemplo como hay una gran diferencia entre 800 y 4000 se dice que hay una gran
dispersión y esos son los casos en los que dijimos que la media aritmética no es una medida
representativa.
Notación
La forma de designarla es muy variada. Pero la más usada es aquella que toma la letra que
se utilizó para la variable, con un segmento superpuesto. Así si para denotar la variable se
usó la letra x, resulta
Media aritmética: x
26 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias
3
∑ ax *.fb
i=1
i ij i jk
x=
N
xi fi
84 5
126 9
240 6
278 5
310 3
355 5
N = 33
En primer lugar agregamos una columna en la que iremos anotando los productos de cada
valor de variable por su correspondiente frecuencia absoluta.
xi fi xi. fi
84 5 420
126 9 1134
240 6 1440
278 5 1390
310 3 930
355 5 1775
n
N = 33
∑ ax *.bf = 7089
i=1
1ij 1 jk
7089
La media aritmética x= = 214,80 decenas de miles de pesos.
33
Por lo que, la respuesta al problema sería: “En los 33 meses considerados las ventas
mensuales promedio fueron de 214,80 decenas de miles de pesos.”
Universidad de Morón 27
ESTADÍSTICA
[li , Li) fi xi xi . fi
[70,80) 2 75 150
[80,90) 3 85 255
[90,100) 3 95 285
[100, 110) 8 105 840
[110, 120) 7 115 805
[120, 130) 5 125 625
[130, 140) 3 135 405
n
N = 31
∑ ax *.bf =
i=1
1ij 1 jk 3365
N = 31
∑ ax *.bf =
i=1
1ij 1 jk 3365
3365
Media aritmética x= =108.55 km diarios.
31
En los dos ejemplos anteriores hemos calculado sus respectivas Medias aritméticas,
nos podríamos preguntar ¿serán valores que realmente representan a cada una de esas
series? La respuesta la tendremos, cuando más adelante, estudiemos el Coeficiente de
variabilidad.
NOTA muy
importante:
Observe que el valor
de la media aritmética
no necesariamente
coincide con un valor
de la serie.
28 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias
MODO
3
Es el o los valores de variable de mayor frecuencia absoluta.
Decimos que es el punto de máxima concentración de la serie.
En una serie puede haber más de un modo. Si hay uno solo, la serie es unimodal, si dos es
bimodal, si hay más se llama multimodal. Esto de debe a que en la serie podría haber más
de un valor de variable con frecuencia absoluta máxima, por lo que en ese caso habrá más
de un modo.
En general es una medida que se elige cuando es única.
Para conocer su valor, en las Series simples, bastará con mirar la columna de frecuencias
absolutas, en ella buscar el valor máximo, y el valor de variable correspondiente es el modo
o valor modal.
MODO
Es el o los
Ejercicio 3.3 Retomemos el Ejemplo 2, que decía que en un comercio minorista se valores de
registran las ventas semanales, en decenas de miles de pesos. Vemos que variable de
la frecuencia absoluta máxima es 9 y el valor de variable correspondiente es mayor frecuencia
126, por lo tanto: absoluta.
Decimos que
es el punto
Modo mo= l26 decenas de miles de pesos.
de máxima
Lo que significa que, en el período estudiado, el valor de ventas mensuales que más se concentración de
repitió fue de 126 decenas de miles de pesos. la serie.
[li , Li) fi xi
[70,80) 2 75
[80,90) 3 85
[90,100) 3 95
[100, 110) 8 105
[110, 120) 7 115
[120, 130) 5 125
[130, 140) 3 135
a) Determinar la “Clase modal”, que será aquella que tenga la mayor frecuencia
absoluta.
En nuestro ejemplo, la mayor frecuencia absoluta es f4 =8, por lo que la clase modal
será el intervalo [100, 110).
b) Calcular d1, que es la diferencia entre la frecuencia absoluta de la clase modal y
frecuencia absoluta de la clase inmediata anterior. d1 = 8-3=5
c) Calcular d2 que es la diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase inmediata posterior. d2= 8-7=1
d) Recordemos que con la letra c, indicamos la amplitud de clase. De modo que si
ponemos: cmo, eso significará “amplitud de la clase modal”.
Universidad de Morón 29
ESTADÍSTICA
d
mo = lmo + d +1 d * C mo
1 2
Lo que significa que en el mes estudiado, el recorrido diario que más se repitió fue de
aproximadamente 108,33 km.
Por lo tanto, sintetizando tenemos:
d1
mo = lcmo + * Cmo
d1 + d2
d1 = fmo - fmo - 1
d2 = fmo - fmo + 1
MEDIANA
MEDIANA
Es el valor de variable que separa a la serie en dos partes de igual número de elementos.
Es el valor de
Para inducir la comprensión del significado de esta medida tomemos un ejemplo sencillísimo.
variable que
separa a la serie Si tenemos una sucesión de números ordenados en forma monótona creciente: 3, 3, 5, 5, 7,
en dos partes de 7, 7, 9, 11, 16, 16; vemos que en ella existe un valor central, el 7, que deja a cada lado de
igual número de él cinco elementos, ese valor central es la mediana de la serie. Observemos que los valores
elementos. que están bajo la mediana son menores o iguales que ella, y los que están a su derecha son
mayores o iguales.
Veamos cómo se calcula la mediana: me, en una serie de frecuencias.
Nuevamente nos convendrá ordenarnos en pasos:
30 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias
Ejercicio 3.5
3
a) Definir una nueva medida la “Frecuencia acumulada” Fi. Sus sucesivos valores se van
obteniendo sumando renglón a renglón las frecuencias absolutas Retomemos el ejemplo
del comercio minorista en el cual se registran las ventas semanales, en decenas de miles
de pesos, siendo:
xi fi Fi
84 5 5
126 9 14
240 6 20
278 5 25
310 3 28
355 5 33
N = 33
N
b) Hacer
2
33
En el ejemplo: = 16,5
2
c) Buscar la primera frecuencia acumulada que supere lo que nos dio ese cociente.
En el ejemplo es 20.
Veamos ahora como se calcula la mediana a partir de una serie de datos agrupados.
Universidad de Morón 31
ESTADÍSTICA
[li , Li) fi xi Fi
[70,80) 2 75 2
[80,90) 3 85 5
[90,100) 3 95 8
[100, 110) 8 105 16
[110, 120) 7 115 23
[120, 130) 5 125 28
[130, 140) 3 135 31
N = 31, obsérvese que aquí también la última frecuencia acumulada coincide con N.
N
a) Se hace ; Para nuestro ejemplo 31/2 = 15,5.
2
Una vez calculado este cociente, se busca la primera frecuencia acumulada cuyo
valor exceda lo que nos dio la división. El intervalo al que le corresponda esa frecuencia
acumulada será la clase mediana.
Para nuestro ejemplo es el intervalo [100, 110) cuya Fi es 16.
b) Aplicando a los subíndices el mismo criterio que cuando estudiamos el Modo, acá
resultará que lme es el límite inferior de la clase mediana. Análogamente denotaremos
con fme a la frecuencia absoluta de la clase mediana y con cme a la amplitud de la clase
mediana.
Para nuestro ejemplo lme = 100; fme = 8; cme = 10.
c) Siendo que Fme indica frecuencia acumulada de la clase mediana, acá introduciremos
un nuevo símbolo
Fme-1 que significa “frecuencia acumulada hasta la clase inmediata anterior a la
clase mediana”.
Fme-1 = 8
32 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias
Ya podemos dar la función que nos permitirá calcular la mediana en una serie de datos
agrupados
N
3
- Fme - 1
2
me = lme + . C me
f_me
La primer frecuencia acumulada que excede este valor es 16 por lo que la clase mediana
es [100, 110) o sea que el lme= 100. Además la Fme-1= 8, f me= 8 y c me = 10.
Entonces quedará:
15,50 - 8
me = 100 + .10 =109,375 km
8
Lo que significa que en la mitad del mes las unidades recorrieron hasta 109,375 km y en
la otra mitad su recorrido diario fue mayor o igual que ese valor.
CUANTILES (o FRACTILES)
Son valores de variable que separan a la serie en un número determinado de partes de igual
número de elementos. CUANTILES
Se clasifican en: son valores
de variable
• Cuartiles.
que separan
• Deciles. a la serie en
• Quintiles. un número
• Percentiles determinado
Conceptualmente son estadísticos muy similares a la mediana. La diferencia está en que de partes de
así como la mediana separa a la serie en dos partes, los Cuartiles la separan en cuatro, los igual número de
Deciles en10, los Quintiles en 50 y percentiles en 100. elementos.
Cuartiles
N
Ubicar la clase. Para Q1 hay que hacer
4
Universidad de Morón 33
ESTADÍSTICA
Y la clase Q1 será aquella cuya frecuencia acumulada sea la primera que excede eses
cociente.
N
Para ubicar la clase Q2 la cuenta es 2 .
4
N
Para la clase Q3 es 3 .
4
En todos los casos la clase correspondiente será aquella cuya frecuencia acumulada sea la
primera que excede al cociente.
[li , Li) fi xi Fi
[70,80) 2 75 2
[80,90) 3 85 5
[90,100) 3 95 8
[100, 110) 8 105 16
[110, 120) 7 115 23
[120, 130) 5 125 28
[130, 140) 3 135 31
31
Para ubicar la clase Q1 haremos = 7,75
4
Y como la primera frecuencia acumulada que supera este valor es 8 quiere decir que
la clase Q1 es [90, 100); entonces lq1:es el límite inferior de esa clase, conservando la
notación ya vista o sea 90.
FQ -1 será la frecuencia acumulada de la clase anterior, es decir: 5.
1
CQ1 será la amplitud de la clase, es decir: 10.
fQ1 será la frecuencia del intervalo [90,100), es decir: 3.
Luego:
N/4 - FQ -1
Q1 = lq1 + 1
* CQ1
fQ1
7,75 - 5
Q1 = 90 + . 10 = 99,16 km
3
Este valor indica que la cuarta parte de los días del mes considerado, los móviles recorrieron
una distancia menor o igual que 99,16 km. Atención: esto nos indica también que el 75%
de los días, el recorrido fue igual o mayor que ese valor.
Actividad Propuesta
Le sugerimos tratar de calcular el Q.2
34 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias
Deciles
3
Son nueve, D1, D2, D3. D4. D5. D6, D7, D8, D9
La técnica para calcular el valor de cada uno de ellos es similar a la usada para calcular los
cuartiles.
En primer lugar hay que localizar la clase correspondiente. Así para localizar la clase:
D1 se hace N/10
D2 se hace 2N/ 10
D3 se hace 3N/10
Dj se hace j.N/ 10
La clase que le corresponde a cada uno de los deciles será aquella cuya frecuencia acumulada
sea la primera que excede el cociente correspondiente.
La formula general para calcularlos será:
jN
- FDj -1
10
Dj = lDj + . cDj
fDj
La clase que
le corresponde
Atención
a cada uno
j puede tomar valores de 1 a 9. de los deciles
será aquella
Acá no podremos usar los ejemplos ya vistos para calcular deciles, por que son series de cuya frecuencia
tamaño insuficiente. Más adelante pondremos otra serie de mucho mayor tamaño y en ella acumulada
calcularemos todas las medidas características. sea la primera
que excede
el cociente
correspondiente.
Percentiles
Como ya habíamos dicho antes, los percentiles son estadísticos muy similares a la mediana,
a los cuartiles y a los deciles. La diferencia está en que estos separan a los valores de variable
en 100 partes de igual número de elementos.
Los percentiles son noventa y nueve. Percentil: P1, P2, P3, ---------------P99
Para calcularlos, el método es el mismo que el que se aplicó en los Cuartiles anteriores.
Primero, ubicación de cada una de las clases, y luego aplicar la fórmula:
j. N -F
pj -1
100 . Cpj
Pj = lpj +
Fpj
Universidad de Morón 35
ESTADÍSTICA
Aclaración Importante
Los temas precedentes así como los que se verán en la unidad próxima, o sea aquellos
referidos al cálculo de los estadísticos de las Series de Frecuencias, admiten ser
tratados usando otra técnica, la función generatriz de los momentos y con ella
calcular momentos absolutos y centrados de distinto orden con los cuales obtendríamos
algunas de las medidas acá calculadas. Pero teniendo en cuenta que prácticamente
estamos comenzando el estudio de la Estadística, creímos que sería más conveniente,
por ser más sencillo, encararlos como lo hicimos.
La media geométrica y la media armónica no se tratarán en esta unidad, por considerar que
presentan dificultades algebraicas que exceden este trabajo y además no son de aplicación
para los alumnos de este curso.
Presentamos de todos modos las fórmulas que permiten calcularlas.
MEDIA ARMÓNICA
Es la inversa de la media aritmética de la inversa de la variable, multiplicado por su frecuencia.
N
mg = n
1 .f
S
i=1 xi
i
Se usa en general, en sucesos en los que la variable y las frecuencias tienen un crecimiento
inverso (cuando crece la variable y decrece su frecuencia). No puede aplicarse en una serie
1
en la que uno de los valores de la variable es 0 (cero). Así si xr = 0 ¿ ?
xr
Un ejemplo sencillo: para recorrer una distancia, a mayor velocidad, menor tiempo en recorrerlo.
MEDIA GEOMÉTRICA
N n
mh = p x . fi
i=1 i
Aclaración:
con π denotamos un operador matemático llamado “productoria”.
Terminamos con la parte teórica de esta unidad. Ahora en la Actividad propuesta de esta unidad
del Módulo de Trabajos prácticos encontrará ejercicios de aplicación. Trate de resolverlos y si
se le presenta alguna dificultad consulte con su tutor.
36 Licenciatura en Administración
UNIDAD 3: Medidas de Dispersión de Series de Frecuencias
SÍNTESIS DE LAS
PRINCIPALES FÓRMULAS
3
VISTAS EN ESTADÍSTICA DESCRIPTIVA
Frecuencia absoluta fi
n
Tamaño de la serie N = S fi
i=1
fi
Frecuencia relativa
N
Frecuencia acumulada Fi = Fi-1 + fi
Medidas de Posición
N
mg =
Media Armónica
n
1 .f
S
i=1 xi
i
d1
mo = lcmo + * Cmo
Modo d1 + d2
d1 = fmo - fmo - 1
d2 = fmo - fmo + 1
N
claseme = [li ; Ls ] Fi ≤
2
Mediana N
- Fme - 1
2
me = lme + . C me
f_me
Universidad de Morón 37
ESTADÍSTICA
38 Licenciatura en Administración
UNIDAD 4
MEDIDAS DE DISPERSIÓN
DE SERIES DE FRECUENCIAS
Contenidos
Objetivos
Aquí vale un comentario similar al que hicimos al iniciar el desarrollo de la Unidad anterior. No
se apresure, no se amilane ante una dificultad para comprender algo, vuelva a releerlo, rehaga
los ejercicios resueltos y recuerde que siempre puede recurrir al tutor.
ESTADÍSTICA
40 Licenciatura en Administración
UNIDAD 4
MEDIDAS DE DISPERSIÓN
DE SERIES DE FRECUENCIAS 4
MEDIDAS DE DISPERSIÓN En esta Unidad
Medidas de Dispersión 41
Son valores que cuantifican el alejamiento de los valores que toma la variable
Medidas de
respecto de un valor central que puede ser la Media aritmética, el Modo o la
Dispersión Absolutas 41
Mediana; por lo cual tendremos distintas medidas de dispersión según sea el
Rango 41
estadístico que tomemos de referencia.
Desvio Estandar 42
Varianza 42
También se subdividen en:
Desvío Medio 42
• Medidas de dispersión absolutas.
Desvío Modal 43
• Medidas de dispersión relativas.
Desvío Mediano 43
Medidas de
43
MEDIDAS DE DISPERSIÓN ABSOLUTAS Dispersión Relativas
Coeficiente de Variabilidad 43
Coeficiente de
• Rango (o amplitud total).
Variabilidad Media 44
• Desvío estándar.
Coeficiente de
• Varianza.
Variabilidad Modal 44
• Desviación media o desvío medio.
Coeficiente de
• Desviación modal o desvío modal.
Variabilidad Mediano 44
• Desviación mediana, desvío mediano.
Aplicaciones de las
Medidas de Dispersión 45
Rango
En realidad esta medida de dispersión escapa a la definición general.
Se entiende por Rango a la diferencia entre el mayor y el menor valor de
variable, en una Serie simple, y a la diferencia entre el último límite superior y
el primer límite inferior en una Serie de datos agrupados.
MEDIDAS DE DISPERSIÓN
Son valores que cuantifican el
Es decir,
alejamiento de los valores que
toma la variable respecto de un
En una serie simple, R = xn – x1 valor central que puede ser la
Media aritmética, el Modo o la
En una serie de datos agrupados, R = Ln - l1 Mediana; por lo cual tendremos
distintas medidas de dispersión
Esta medida sólo sirve como primera señal del comportamiento de la variable. según sea el estadístico que
tomemos de referencia.
Nos dirá si sus valores extremos están muy alejados. En cada caso en
Universidad de Morón 41
ESTADÍSTICA
particular habrá que determinar si ese alejamiento obedece a circunstancias anómalas, por
Se entiende por ej producción fuera de control, o no. De ser afirmativa la respuesta, habrá que estudiar las
RANGO a la causas que lo producen.
diferencia entre
el mayor y el
menor valor de
variable, en una Desvío Estandar
Serie simple, y
a la diferencia Notación: S. Es una medida de dispersión respecto de la media aritmética.
entre el último Para calcularla,
límite superior y a) A cada valor de variable se le resta la media aritmética. Como los resultados de estas
el primer límite restas pueden ser positivos o negativos, con el fin de positivarlos (es decir hacerlos
inferior en una
siempre positivos) se los eleva al cuadrado.
Serie de datos
b) A cada una de las diferencias cuadráticas obtenida se la multiplica por su correspondiente
agrupados.
frecuencia absoluta.
c) Se suman todos los productos y esta suma se promedia dividiéndola por N.
d) Al cociente obtenido se le extrae la raíz cuadrada, y su valor positivo es el desvío
estándar buscado.
n
S ( xi - x )2 * fi
i=1
S=+
N
Varianza
Lo que
representa la
VARIANZA es Notación: S2.
el promedio
de los desvíos Como lo indica la notación, es el cuadrado del desvío estándar.
cuadráticos a la
n
Media aritmética, S ( xi - x )2 * fi
ponderados i=1
Desvío Medio
Notación: DM.
También es una medida respecto de la media aritmética, pero para positivizar los resultados,
las diferencias entre cada valor de variable y la media aritmética se toman en valor absoluto.
n
S xi - x * fi
i=1
DM =
N
42 Licenciatura en Administración
UNIDAD 4: Medidas de Dispersión de Series de Frecuencias
Desvío Modal
4
Notación: Dmo.
Mide alejamiento de los valores de la variable respecto del modo, cuantificados y tomados
en valor absoluto.
n
S xi - mo * fi
i=1
Dmo =
N
Desvío Mediano
Notación: Dmed.
Aclaración:
en algunos textos será que en lugar de dividir por N lo hacen por N-1, con esto se
obtiene la correspondiente medida de dispersión ajustada.
Al terminar de definir todas las medidas de dispersión explicaremos la aplicación de cada una
de ellas.
• Coeficiente de variabilidad.
• Coeficiente de variación media.
• Coeficiente de variación modal.
• Coeficiente de variación mediana.
Coeficiente de Variabilidad
Notación: CV.
Es un número que indica la relación que existe entre el desvío estándar (S) y la media
aritmética.
S
CV =
x
Universidad de Morón 43
ESTADÍSTICA
Este coeficiente cuantifica la relación existente entre el desvío medio (DM) y la media
aritmética
DM
CVM =
x
Es el número que indica cual es la relación existente entre el desvío modal (Dmo) y el modo
Dmo
CVmo =
mo
Dmed
CVmed =
me
44 Licenciatura en Administración
UNIDAD 4: Medidas de Dispersión de Series de Frecuencias
APLICACIONES DE LAS
MEDIDAS DE DISPERSIÓN
4
a) Cuando se quiere determinar si una serie es homogénea respecto de su media aritmética,
es decir los valores de la variable son próximos al valor de la media aritmética, se calcula su
CV, si éste es aproximadamente menor o igual que 0,30 significa que esa media aritmética
es una medida eficiente para representarla.
Recordemos que cuando definimos media aritmética, dijimos que no siempre es una
medida de elección, ya que pierde representatividad cuando los valores de variable están
muy dispersos.
b) Si el objetivo es decidir, al comparar dos o más series, cual de ellas es la más homogénea,
se calculan sus respectivos CV y lo será aquella que tenga menor CV.
c) Dada una serie, si en ella se quiere determinar entre “media aritmética”, “modo” y “mediana
“ cual de ellas es la que mejor la representa, se calculan sus correspondientes “CVM”.
“CVmo” y “CVmed” y será más representativa la que tenga menor coeficiente de variabilidad.
Terminamos con la parte teórica de esta unidad. Ahora en la Actividad propuesta de esta unidad
del Módulo de Trabajos prácticos encontrará ejercicios de aplicación. Trate de resolverlos y si
se le presenta alguna dificultad consulte con su tutor.
Universidad de Morón 45
ESTADÍSTICA
46 Licenciatura en Administración
UNIDAD 5
SERIES CRONOLÓGICAS
Contenidos
Objetivos
48 Licenciatura en Administración
UNIDAD 5
SERIES
CRONOLÓGICAS 5
DEFINICIÓN En esta Unidad
Definición 49
Son tabulaciones en las que los valores de la variable que representa el
Etapas que Abarca su Estudio 49
problema, se ordenan según su aparición en el tiempo.
Movimientos Sistemáticos 50
Antes de optar por este método para organizar las mediciones que resultan
1 - Variables 50
de estudiar un suceso, veamos algunas preguntas que podrían plantearse:
2 - Tabulación 50
3 - Representación Gráfica 53
a) ¿Cuándo conviene usar esta técnica?
b) ¿Qué información es necesario tener para poder aplicarla? 4 - Análisis de
sus Componentes 53
c) ¿Qué puede calcularse a partir de ella?
Tendencia 53
d) ¿Qué aplicación puede darse a los valores obtenidos?
Estacionalidad 55
Universidad de Morón 49
ESTADÍSTICA
MOVIMIENTOS SISTEMÁTICOS
Para abordar su estudio es conveniente que sigamos los siguientes pasos:
1 - Definición y notación de las variables intervinientes.
2 - Tabulación de la información.
3 - Representación gráfica.
4 - Análisis de sus componentes. Cálculo de las expresiones que representan a las
sistemáticas.
1 - VARIABLES
1 - En estas series tenemos dos variables:
a) La “variable tiempo” que se designa con la letra “t”. Cada valor de t, se denota ti,
donde el subíndice “i” nos indica a que valor de t nos estamos refiriendo.
Aquí es necesario aclarar algo. Las mediciones del tiempo pueden estar dadas solo en
forma periódica, por ejemplo “Ventas anuales”, o en forma periódica y subperiódica, por
ejemplo “Ventas mensuales a lo largo de 5 años”.
b) La otra variable, es la específica del problema, se denota “y”.
2 - TABULACIÓN
Es una forma de ordenar la información en columnas, en la primera se registran los valores de
la variable “y”. En la segunda los de “t”. Puede anteponerse otra columna en la que se registra
el año.
En un comercio se registran los valores de las ventas anuales, desde al año 2003 hasta el
año 2011, expresadas en millones de pesos (a moneda constante).
50 Licenciatura en Administración
UNIDAD 5: Series Cronológicas
5
Año yi ti
2003 3 1
2004 4 2
2005 4 3
2006 3 4
2007 6 5
2008 8 6
2009 9 7
2010 7 8
2011 10 9
Para estudiar las ventas trimestrales de una empresa, se registraron sus valores desde
el segundo trimestre del año 2001 hasta el primer trimestre del 2011. Esos valores,
expresados en millones de pesos (a moneda constante), se muestran en la tabla siguiente.
Año Trimestre yi ti
II 2 1
2001 III 1 2
IV 1 3
I 2 4
II 3 5
2002
III 5 6
IV 6 7
Universidad de Morón 51
ESTADÍSTICA
Año Trimestre yi ti
I 5 8
II 5 9
2003
III 8 10
IV 12 11
I 9 12
II 10 13
2004
III 11 14
IV 14 15
I 10 16
II 10 13
2005
III 13 8
IV 15 19
I 12 20
II 14 21
2006
III 14 22
IV 17 23
I 13 24
II 14 25
2007
III 15 26
IV 19 27
I 13 28
II 13 29
2008
III 16 30
IV 17 31
I 14 32
II 12 33
2009
III 15 34
IV 17 35
I 14 36
II 12 37
2010
III 12 38
IV 15 30
2011 I 15 40
NOTA
Obsérvese que en el año 2001 comenzamos a tener información solo desde el segundo
trimestre, ya que no siempre tenemos información completa.
52 Licenciatura en Administración
UNIDAD 5: Series Cronológicas
3 - REPRESENTACIÓN GRÁFICA
La representación gráfica de estas series se hace en un sistema de coordenadas ortogonales
En la abscisa se registran los valores de la variable tiempo “t”. En la ordenada los de la
variable específica “y”.
Tendencia
Es una función que explica el movimiento de la serie a lo largo de un gran número de períodos.
TENDENCIA
Cuando la representación gráfica muestra que los puntos están aproximadamente, alrededor
es una función
de una recta, esto indica que existe una distribución lineal por lo que la función de tendencia que explica el
será de la forma: movimiento
de la serie a
y = a0 + a1 . t lo largo de un
gran número de
Habrá que calcular los valores de a0, y a1 que generen la recta óptima que será aquella que más períodos.
Universidad de Morón 53
ESTADÍSTICA
se aproxime a los puntos empíricos. Para calcularla se aplica el método de los cuadrados
mínimos.
Este consiste en encontrar la recta en la que la suma de las diferencias cuadráticas entre
las ordenadas empíricas y las correspondientes teóricas sea mínima. Aplicando técnicas de
Análisis Matemático se llega al siguiente sistema:
{
n n
S
i=1
yi = a0 . n + a1 S ti
i=1
(1)
n n n
S yi . ti = a0 S ti + a1 S ti2 (2)
i=1 i=1 i=1
Resolviendo ese sistema de ecuaciones se obtienen el valore de a0, también el de a1 los que
nos definen a la recta buscada.
Para aclarar todo esto, creemos conveniente hacer un ejercicio.
Agregamos las columnas necesarias para obtener las sumas que requiere el sistema:
Año yi ti yi.ti ti2
2003 3 1 3 1
2004 4 2 8 4
2005 4 3 12 9
2006 3 4 12 16
2007 6 5 30 25
2008 8 6 48 46
2009 9 7 63 49
2010 7 8 56 64
2011 10 9 90 81
n n n n n
S
i=1
S yi = 54
i=1
S t = 45
i=1 i
S yi . ti = 322
i=1
S t 2 = 285
i=1 i
{ 54 = a0 . 9 + a1 . 45
322 = a0 . 45 + a1 . 285
ao = 2,70 a1 = 0,86
54 Licenciatura en Administración
UNIDAD 5: Series Cronológicas
5
Estacionalidad
También llamada “movimientos estacionales”.
Son cambios que se dan en subperíodos, con la característica que son aproximadamente
similares para subperíodos equivalentes de distintos períodos.
¿Qué significa esto? Primero, que es condición necesaria que la información esté dada no
sólo en períodos sino también en subperíodos y además que haya cierta recurrencia. Por
ejemplo, si las mediciones estuvieran dadas en años y trimestres, y se observara que en
general en los segundos trimestres de casi todos los años los valores de la variable son
mayores que en los otros trimestres del mismo año, y que en los primeros son menores, nos
estarían indicando que el suceso en estudio está afectado por la estacionalidad.
Cuando observamos que existe la influencia de la estacionalidad hay que encontrar cómo
cuantificarla, es decir expresar numéricamente la forma en que incide en cada uno de los
subperíodos.
Lo que indica esta incidencia es el “Factor de estacionalidad” que se denota con la letra
griega épsilon e.
Calcular su valor no es fácil, por eso aconsejamos seguir los siguientes pasos:
a) Calcular los “promedios móviles”.
b) Determinar el cociente entre cada valor empírico y su correspondiente promedio móvil,
este cociente será el factor de estacionalidad buscado.
Ejercicio 5.3 En él vemos que la información está dada en períodos: años; y subperíodos:
cuatrimestres.
Universidad de Morón 55
ESTADÍSTICA
Para calcular los promedios móviles hay que tener en cuenta el número de subperíodos que
hay en cada período. En nuestro ejemplo ese número es 3. A este número de subperíodos
se lo denota con la letra “s”.Reiteramos, en nuestro ejemplo s= 3.
Luego se toman los tres primeros valores de la variable “y”, se promedian y el resultado
se le asigna al subperíodo central de los tres considerados, con lo cual no se tiene el
promedio móvil para el primer valor y1.; nótese que los mismo sucede con los últimos tres
valores donde el promedio móvil queda asignado al tiempo central y por lo tanto al último
no le corresponde promedio móvil.
En el ejemplo, para obtener
• el primer promedio móvil se toman los tres primeros valores de “y”, que además son
todos los que corresponden al año 2008:
(3+1+5):3=3 (corresponde a t2)
• el segundo promedio móvil, se “baja” un subperíodo, quedando:
(1+5+4):3=3,33 (corresponde a t3)
• el tercer promedio móvil, se vuelve a “bajar “ otro subperíodo, resultando:
(5+4+3):3=4 (corresponde a t4)
Se sigue reiterando el proceso, para cada promedio se toman tres valores sucesivos, de
la variable pero dejando el primero del promedio anterior y tomando el valor de “y” del
subperíodo siguiente. Observar que en el ejercicio quedan sin promedio el primer y el
último subperíodo, como ya dijimos.
Ya tenemos calculados los promedios móviles, pero nuestro objetivo es conocer los valores
de los factores de estacionalidad correspondiente a cada subperíodo. Para eso hay que
dividir cada valor de la variable por el promedio móvil del mismo subperíodo. Volvamos al
ejemplo.
Miremos la columna seis de la tabla
• En la primera fila no hay promedio móvil, por lo que no se podrá calcular su factor
de estacionalidad.
• En la segunda fila se hace 1/3= 0,33
• En la tercera fila 5/3,33=1,50
56 Licenciatura en Administración
UNIDAD 5: Series Cronológicas
5
El paso siguiente es encontrar los valores que representen en general, la estacionalidad
que corresponde a todos los primeros cuatrimestres, a todos los segundos, a todos los
terceros. Estos se llaman “factores de estacionalidad ajustados”.
Sus respectivos valores se obtienen:
• Para los primeros cuatrimestres, se promedian los factores de estacionalidad de
todos los primeros cuatrimestres;
• Para los segundos, lo mismo pero con los de los segundos;
• Igual para los terceros…
Universidad de Morón 57
ESTADÍSTICA
MOVIMIENTOS ALEATORIOS
Son movimientos no sistemáticos, vale decir no son susceptibles de ser expresados
analíticamente. Se caracterizan por ser variaciones fuertes, no continuadas en el valor de la
variable, a veces pueden ser previsibles y otras no.
Ejemplo Si en un año, en una zona rural hay una gran sequía o una importante inundación,
su producción agropecuaria será muy inferior a la esperada según lo indicada por
la tendencia, y esto no era previsible. Pero tomando otro ejemplo, si en una ciudad
se desarrolla un evento deportivo muy importante como puede ser una Olimpíada o
un torneo internacional de algún deporte, es de esperar que la ocupación hotelera
aumente fuertemente en ese tiempo, y esto es previsible.
Resumiendo, insistimos, para que los valores obtenidos mediante la función de pronóstico
sean creíbles es necesario que las variables exógenas permanezcan aproximadamente
estables y que el período a pronosticar no esté alejado del último de la serie.
Hechas todas estas consideraciones, veamos la función de pronóstico.
Notación: Npr.
58 Licenciatura en Administración
UNIDAD 5: Series Cronológicas
5
Si se quisieran estimar las ventas para el año 2012, en él resulta t= 11.
Terminamos con la parte teórica de esta unidad sobre series de Tiempo. Ahora en la
Actividad propuesta de esta unidad del Módulo de Trabajos prácticos encontrará ejercicios
de aplicación. Trate de resolverlos y si se le presenta alguna dificultad consulte con su tutor.
Universidad de Morón 59
ESTADÍSTICA
60 Licenciatura en Administración
UNIDAD 6
REGRESIÓN Y
CORRELACIÓN BIVARIADA
Contenidos
Objetivos
62 Licenciatura en Administración
UNIDAD 6
6
REGRESIÓN
Y CORRELACIÓN
BIVARIADA
IDEAS PREVIAS En esta Unidad
Ideas Previas 63
En esta Unidad se nos presentará un enfoque distinto al estudiado en las
Coeficiente de Correlación 66
unidades anteriores. En ellas teníamos una variable y nos interesaba saber
ya sea como se distribuía y cuales eran los valores que la caracterizaban, en
el caso de las series de frecuencias o como se movía a lo largo del tiempo, en
las cronológicas. Ahora vamos a tener dos variables cada una con sus valores
y buscaremos conocer si existe alguna vinculación entre ellos.
Continuando con el estilo aplicado anteriormente, comencemos por
plantearnos algunas preguntas
Universidad de Morón 63
ESTADÍSTICA
3) Las funciones de regresión calculadas nos permitirán estimar el valor de una de las
El ESTUDIO variables que le corresponde a un determinado valor de la otra, y el coeficiente de
DE LA correlación nos dirá si esa estimación es confiable.
REGRESIÓN Y
CORRELACIÓN
Podemos resumir lo anterior y decir que el estudio de la regresión y correlación entre dos
ENTRE DOS
VARIABLES variables es el conjunto de técnicas que partiendo de datos pareados de las mismas busca
es el conjunto encontrar la función o las funciones que describan la relación entre ellas y también calcular la
de técnicas que fuerza con que esas funciones describen la relación.
partiendo de ¿Por qué dijimos la o las funciones?
datos pareados Por que puede ocurrir que haya una sola variable independiente, siendo la otra dependiente o
de las mismas que ambas puedan ser alternativamente independientes.
busca encontrar Veamos distintos casos para entenderlo mejor.
la función o las
funciones que
describan la CASO 1 Una empresa inmobiliaria desea estudiar si el número de sus ventas mensuales
relación entre están relacionadas con las tasas que pagan los bancos por inversiones financieras.
ellas y también Para ello registra las ventas efectuada en los últimos 14 meses y las tasas
calcular la correspondientes a cada uno de ellos. Tenemos:
fuerza con que
esas funciones x: tasa bancaria mensual (x es la variable independiente);
describen la
y: número de ventas mensuales (y es la variable dependiente).
relación.
Por lo que habrá que calcular una sola función de regresión, la que permita estimar el valor
de “y”
CASO 2 En una empresa se estudia la relación existente entre el gasto publicitario mensual
y las ventas correspondientes a esos mismos meses. Puede ocurrir que el objetivo
sea estimar las ventas mensuales correspondientes a un determinado gasto
publicitario. Así:
Pero si el fin fuera estimar cual sería el gasto necesario a efectuar para alcanzar
determinadas ventas mensuales. Ocurriría:
64 Licenciatura en Administración
UNIDAD 6: Regresión y Correlación Bivariada
6
de ellos en el examen de admisión (x) y la obtenida en el examen de evaluación
efectuado después de tres años de trabajo (y).
Ejemplo 3 El gerente de una empresa comercial, quiere estudiar si existe una relación
positiva entre el gasto mensual publicitario (x) y las ventas correspondiente a
cada mes inmediato posterior (y) .
Ejemplo 4 En una Cámara de negocios inmobiliarios desean determinar si las altas tasas
de interés pagadas por los bancos en los depósitos a plazo fijo (x) inciden en el
volumen de sus ventas (y)
Creemos que estos ejemplos son suficientes para tener en claro el objetivo de este tema.
Veamos ahora los pasos a seguir para obtener lo buscado.
• Ordenar la información en una tabla de dos columnas. La primera encabezada por “x”,
la segunda por “y”
• Hacer el “Diagrama de dispersión”, éste es el conjunto de puntos que resulta de
representar gráficamente en un sistema de coordenadas ortogonales cada par ordenado
(xi , yi). Si esos puntos están dispuestos en el plano, próximos a una recta, significa que
existe correlación lineal, por lo que las funciones de regresión serán de la forma
1) Hay que calcular los valores de ao , a1 , bo y b1, que definirán a las rectas optimas, para
ello se aplica el método de los cuadrados mínimos el que gracias a técnicas de análisis
matemático genera los siguientes sistemas de ecuaciones
• Para calcular a0, a1 • para calcular b0,b1
{ {
n n n n
S yi = a0 . n + a1 S xi
i=1 i=1
S xi = b0 . n + b1 S yi
i=1 i=1
n n n n n n
S xi . yi = a0 S xi + a1 S xi
i=1 i=1 i=1
2
S xi . yi = b0 S yi + b1 S yi2
i=1 i=1 i=1
y∩x=(x,y)
Universidad de Morón 65
ESTADÍSTICA
COEFICIENTE DE CORRELACIÓN
Forma de calcularlo:
y = +_ a1 . b1
Aclaraciónes Importantes
1) Siempre el signo de a1 es igual al signo de b1 (esto tiene una justificación
matemática);
2) Si ambos son positivos, significa que existe correlación directa, por lo que “r” toma el
signo positivo de la raíz. Si ambos son negativos entonces r es negativo lo que indica
que las variables tienen correlación inversa (cuando una crece, la otra decrece).
-1 ≤r≤1
Eso significa que r puede tomar cualquier valor real en el intervalo [ -1, 1 ].
Si r= -1 → que existe correlación lineal perfecta e inversa entre las variables consideradas.
Si r= 0 → que no existe correlación lineal.
Si r= 1 → que existe correlación lineal perfecta y directa.
Lo que significa que cuanto más cerca de -1 ó de 1 esté el valor de r, nos indica que las
variables están mejor correlacionadas, .por lo que las estimaciones efectuadas serán más
confiables.
Ejercicio 7.1 Para estudiar cual es la incidencia en las ventas que tiene el número de
personas contratadas temporalmente para promocionarlas en forma directa
se registran, a lo largo de 9 meses , el número de personas contratadas en
cada uno de ellos, y el porcentaje de incremento en las ventas en los meses
correspondientes-
Luego de registrados los valores de las variables, añadiremos las columnas necesarias
para poder plantear los sistemas que figuran en la página anterior.
66 Licenciatura en Administración
UNIDAD 6: Regresión y Correlación Bivariada
x yi xi - yi xi2 y i2
3 2 6 9 4
6
2 2 4 4 4
6 8 48 36 64
7 12 84 49 144
2 4 8 4 16
3 5 15 9 25
8 16 128 64 256
5 10 50 25 100
4 8 32 16 64
En la tabla vemos: n = 9
n n n n n
i=1
S xi = 40 S
i=1
yi = 67 S
i=1
xi . yi = 375 S
i=1
xi2 = 216 S yi2 = 677
i=1
{ 67 = a0 . 9 + a1 . 40
375 = a0 . 40 + a1 . 216
{ 40 = b0 . 9 + b1
375 = b0 . 67 + b1 . 677
x = 40 = 4,44
y = 67 =7,44 por lo que las rectas se cortarán
9 9
en el punto ( 4,44; 7,44 )
Universidad de Morón 67
ESTADÍSTICA
Aplicación de lo calculado:
1) Se desea estimar cual sería el incremento porcentual en las ventas, un mes en el que se
contratarán 5 personas;
2) ¿Cuál será el número aproximado de personas que deberían contratarse para obtener en
un mes un incremento del 8%?
3) Justificando la respuesta, decir si las estimaciones son confiables.
Respuestas:
3) Habíamos visto que la confiabilidad de la estima depende de la intensidad con que las
variables estén correlacionadas y que para cuantificarla hay que calcular “r”:
Este valor tan próximo a 1 indica que la correlación es muy fuerte por lo que los valores
estimados son confiables.
Aclaraciónes Importantes
1) Cuando más adelante veamos los temas de Inferencia Estadística contaremos con
nuevas herramienta que nos permitirán decidir con mayor rigor si aceptamos o no
los valores estimados.
2) Tanto en el ejercicio que pusimos como ejemplo como en los que daremos para
resolver se ha trabajado con una información reducida, y de la que no sabemos
que sea realmente representativa de la población .Lo primero se debe a razones
didácticas, facilitar la operatoria. En lo que respecta a la representatividad veremos
cómo conseguirla cuando veamos las Técnicas de muestreo.
Terminamos con la parte teórica de esta unidad que son de gran aplicación. Ahora en la
Actividad propuesta de esta unidad del Módulo de Trabajos prácticos encontrará ejercicios
de aplicación. Para simplificar lo operativo existen buenos programas informáticos, En alguno
de ellos varía algo la notación, pero son cambios menores. Cuando esté a su alcance use la
computadora.
68 Licenciatura en Administración