Вы находитесь на странице: 1из 14

FACULTAD DE CIENCIAS EMPRESARIALES

ASIGNATURA: ESTADSTICA PARA EL ANLSIS ECONMICO I

1 Prctica de Informtica
Temas 1 y 2: Distribuciones de frecuencias unidimensionales.
Distribuciones de frecuencias bidimensionales. Regresin.

Tema 1. Distribuciones de Frecuencias Unidimensionales


EJERCICIO 1

La siguiente tabla muestra la evolucin de la tasa de actividad (media anual) en Andaluca


expresadas en porcentajes:

Ao Tasa de Responda a las siguientes cuestiones


actividad
1990 47,2 a) Clasifique la variable que representa a la tasa de actividad.
1991 47,2 b) Represente los datos mediante un diagrama de barras.
1992 47,2 c) Halle la media aritmtica, geomtrica y armnica, as como la
1993 47,1 mediana, la moda.
1994 47,4 d) Comente la representatividad de la media.
1995 47,4 e) Halle:
1996 48,2 - Los puntos que dividen a la distribucin en 4 grupos
1997 48,7 de igual frecuencia.
1998 48,7 - Los puntos que dividen a la distribucin en 10 grupos
1999 49,1 de igual frecuencia.
2000 49,5 - El percentil 15.
2001 49,7 f) Calcule e interprete los coeficientes de asimetra y de curtosis
FUENTE:EPA, (INE) de la distribucin.

Solucin del Ejercicio 1

a) La variable que representa a la tasa de actividad es de carcter cuantitativa. Concretamente,


corresponde a una variable cuantitativa en escala de razn o proporcin.

b) Lo primero que debemos hacer es escribir los datos que disponemos en una hoja en blanco en
Ms Excel. En nuestro caso, podemos copiar y pegar en la celda B2 la tabla proporcionada,
quedando as:

1
Para la representacin grfica que se nos pide, seleccionamos la columna que contienen los
datos que queremos presentar (C2:C14), incluido el ttulo de sta. A continuacin nos iremos al
a la pestaa Insertar

Elegimos la categora de grfico que deseemos, en nuestro caso Columnas. Y dentro de


dicha categora la opcin concreta que nos interese, en nuestro caso en 2-D la primera
Columna agrupada. Para elegir entre las diversas opciones, podemos leer el comentario que
aparece cuando pasamos el cursor sobre cada una de las opciones (en cualquier caso depender
de los datos que dispongamos y de lo que queramos mostrar) y pulsamos..

Una vez que ha salido la representacin grfica, aparece la pestaa diseo, donde aparecen
las siguientes opciones: tipo, datos, diseo grfico, estilos de diseo y ubicacin.

2
Para seleccionar los Rtulos del eje de categoras (X): pulsamos el botn derecho del
ratn sobre el grfico, y pulsamos Seleccionar datos. En la nueva pantalla, podemos editar
tanto el eje de categoras (X) como el eje de las Y.

Pulsamos en el boton editar seleccionamos los aos, es decir B3:B14, y pulsamos


Aceptar:

Pulsamos Aceptar:

3
Ahora podemos (aunque es opcional) escribir o modificar los distintos campos de la
ventana para mejorar la apariencia del grfico, pulsando en las etiquetas correspondientes.

c), d), e) y f) Para calcular los distintos estadsticos que se piden procederemos siempre de la
misma forma. En primer lugar preparamos una tabla que contenga los distintos apartados del
problema para ir rellenando cada una de las celdas deseadas mediante la pestaa Frmulas..

En esta ventana podemos seleccionar Estadstica o Todas dentro de Seleccionar una


categora. En la lista de funciones que aparece ms abajo buscamos la funcin deseada:

4
1. Promedio() para la media aritmtica.
2. Media.armo() para la media armnica.
3. Media.geom() para la media geomtrica.
4. Moda.uno() para la moda.
5. Mediana() para la mediana.
6. Cuartil() para un cuartil.
7. Percentil.inc() para calcular un percentil.
8. Coeficiente.asimetra() para el coeficiente de asimetra.
9. Curtosis() para el coeficiente de curtosis.
10. Var.p() y Desvest.p() para la varianza y la desviacin tpica respectivamente.

As, el contenido de las celdas vacas debe quedar como sigue:

a)
Media aritmtica = =PROMEDIO(C3:C14)
Media geomtrica = =MEDIA.GEOM(C3:C14)
Media armnica = =MEDIA.ARMO(C3:C14)
Mediana = =MEDIANA(C3:C14)
Moda = =MODA.UNO(C3:C14)

b) Varianza = =VAR.P(C3:C14)
Des. Tpica = =DESVEST.P(C3:C14)
CV = =F9/F2

e) Q1 = =PERCENTIL.INC(C3:C14;0,25)
Q2 = Mediana= =PERCENTIL.INC(C3:C14;0,50)
Q3 = =PERCENTIL.INC(C3:C14;0,75)

Deciles Tasa
10% =PERCENTIL.INC(C3:C14;E17)
20% =PERCENTIL.INC(C3:C14;E18)
30% =PERCENTIL.INC(C3:C14;E19)
40% =PERCENTIL.INC(C3:C14;E20)
50% =PERCENTIL.INC(C3:C14;E21)
60% =PERCENTIL.INC(C3:C14;E22)
70% =PERCENTIL.INC(C3:C14;E23)
80% =PERCENTIL.INC(C3:C14;E24)
90% =PERCENTIL.INC(C3:C14;E25)

Percentil 15 = =PERCENTIL.INC(C3:C14;0,15)

f) Asimetra = =COEFICIENTE.ASIMETRIA(C3:C14)
Curtosis = =CURTOSIS(C3:C14)

Cuyos resultados son:

5
Comentarios:

1. Ntese que la media armnica es menor que la geomtrica y que sta a su vez es menor
que la aritmtica.
2. La mediana no coincide con la media aritmtica. Esto es debido a la asimetra de la
distribucin.
3. Para analizar la representatividad de la media hemos calculado CVPearson como:
S 0,939192
CV Pearson = = = 0,0195 lo que indica que la media es muy
X 48,15
representativa.
4. El coeficiente de asimetra es positivo luego la distribucin es asimtrica positiva o
asimtrica a la derecha.
5. El coeficiente de curtosis es negativo lo que indica que la distribucin es platicrtica.

6
Tema 2. Distribuciones de Frecuencias Bidimensionales. Regresin.
EJERCICIO 2

La siguiente tabla proporciona 10 valores correspondientes a las siguientes variables tomadas de


cierta cadena de supermercados:

Y = Ventas mensuales (en miles de )


X1 = Nmero de horas que permanece abierto el supermercado al da
X2 = Inversin mensual en publicidad (en miles de )

Y X1 X2
12 8 0,5
5 10 0,2
25 11 2,0
7 8 0,1
6 7 0,2
14 9 1,0
50 12 5,0
21 8 2,0
33 10 2,0
5 9 0,3

Dado que estamos interesados en estudiar la relacin de la variable ventas mensuales en


funcin, por un lado, del nmero de horas que permanece abierto el supermercado, y por otro
lado, de la inversin realizada en publicidad con el objetivo de realizar predicciones fiables.
Responda a las siguientes cuestiones:
a) Estimar los diferentes modelos de regresin lineal bidimensional posibles para
predecir las ventas mensuales.
b) Estudiar la fiabilidad de los ajustes propuestos.
c) Pronosticar el volumen de ventas de un supermercado que permanece abierto 8
horas diarias.
d) Pronosticar el volumen de ventas de un supermercado que dedica mensualmente
3.000 a publicidad.
e) Calcular la varianza debida a la regresin y la varianza residual de los modelos
utilizados para hacer las predicciones.

Solucin del Ejercicio 2

En primer lugar copiaremos los datos disponibles en una hoja en blanco de Ms Excel:

7
Resolveremos los distintos apartados para el ajuste lineal en el que se calcula el nivel de
ventas (Y) en funcin de la Horas que permanece abierto el establecimiento (X1), esto es la
regresin: Y = a + bX 1 y, posteriormente, procederemos de la misma forma a calcular el
segundo ajuste lineal en el que se calcula el nivel de ventas (Y) en funcin de la Inversin
mensual en publicidad (X2).

En primer lugar, aunque no lo piden, siempre es recomendable representar la nube de puntos


para confirmar visualmente si el ajuste lineal es apropiado.

Seleccionamos los datos de las variables Y y X1 con sus correspondientes ttulos (B1:C11) y
accedemos a la pestaa Inserta, y en la opcin grfico, pulsamos dispersin. y el primer
subtipo de grfico (viene seleccionado por defecto):

Pinchamos dos veces para poder ponerle ttulo al eje de valores (Y), eliminar el ttulo del
grfico y colocar la leyenda abajo:

8
En dicha nube de puntos se puede apreciar una clara tendencia lineal y creciente de las
ventas a medida que aumenta el nmero de horas que permanece abierto el establecimiento.

Adems, si desesemos representar la recta de regresin en el grfico anterior podemos ir a


la pestaa diseo de la herramienta del grfico, y modificar el diseo, y aadir los nmeros
3 9, que incluyen la recta de regresin.

Pasemos pues a resolver el apartado a). Para ello usaremos la herramienta Regresin que est
incluida en las Herramientas para anlisis. Herramientas para anlisis es un programa
complementario de MS Excel. Est disponible al instalar Microsoft Office o Excel pero antes
de utilizar la herramienta Regresin en Excel, se debe cargar Herramientas para anlisis.

Para hacerlo en Excel 2010, siga estos pasos:

1. En la pestaa Archivo, haga clic en Opciones.

9
2. En el cuadro de Opciones pulsa Complementos.
3.

4. Pulsar en el botn ir.

10
5. En el cuadro Complementos, haga clic para seleccionar Herramientas para anlisis y, a
continuacin, haga clic en Aceptar (si Herramientas para anlisis no aparece en el
cuadro Complementos disponible, haga clic en Examinar para buscarlo)
6. Una vez realido lo anterior, nos debemos ir a la pestaa Datos y debe de aparecer una
nueva opcin Anlisis de Datos

NOTA:
Para hacerlo en Excel 2003 y en versiones anteriores de Excel, siga estos pasos:

1. En el men Herramientas, haga clic en Complementos.


2. En el cuadro Complementos, haga clic para seleccionar Herramientas para anlisis
y, a continuacin, haga clic en Aceptar (si Herramientas para anlisis no aparece en
el cuadro Complementos disponible, haga clic en Examinar para buscarlo)

7. Una vez que aparece debemos de pulsar Anlisis de datos

8. En dicha ventana, seleccionaremos de men la opcin Regresin y aceptamos,


apareciendo la siguiente ventana:

11
9. En Rango Y de entrada incluiremos el rango de nuestra variable ventas. Para ello
picharemos en su cuadrado con una flecha roja. De igual manera procederemos con
Rango X de entrada. En Opciones de salida podemos elegir En una hoja nueva o en
algn lugar de la hoja sobre la que estamos trabajando (Rango de salida). En nuestro
caso seleccionaremos en una hoja nueva que titularemos RegresinYX1:

10. Tras aceptar, iremos a la hoja que se acaba de crear con el ttulo RegresinYX1 donde
nos encontraremos lo siguiente:

En la primera tabla encontramos el coeficiente de correlacin lineal R = 0.7306 que nos


indica una dependencia moderada y positiva entre las ventas y las horas que permanece
abierto. De hecho, el coeficiente de determinacin lineal R 2 = 0.5338 nos confirma que la
bondad del ajuste es del 53.38%, valor muy inferior al deseado para considerarlo un ajuste
fiable.

De la segunda tabla nos interesa la columna Suma de cuadrados pues en ella encontramos
los datos necesarios para calcular la varianza explicada y la varianza residual. Antes hay que
notar que Excel no proporciona directamente estos valores sino que nos indica el valor
correspondiente a la suma de los cuadrados de las desviaciones respecto a la media.
Podremos obtener las varianzas pedidas dividiendo por el nmero total de datos, en nuestro
caso N = 10, las Sumas de los cuadrados anteriormente presentadas. Obteniendo las
Varianzas Total, Explicada y Residual de la siguiente manera:

(y i y)2
1961,6
VARIANZA TOTAL: s 2y = i =1
= = 196,16
N 10

12
N

(y ti y) 2
1047,22
VARIANZA EXPLICADA: s y2t = i =1
= = 104,72
N 10
N

(y i yti ) 2
914,37
VARIANZA RESIDUAL: sry2 = i =1
= = 91,437
N 10

Tambin, de la tercera tabla nos interesa la columna Coeficientes en donde encontramos la


pendiente y la ordenada del origen de la recta de regresin. As, la recta de regresin que
explica Y en funcin de X1 es Y = -46,2593 + 6,9630X1 . A partir de ella, y con idea de
pronosticar el volumen de ventas de un supermercado que permanece abierto 8 horas diarias,
bastar con sustituir X 1 = 8 en la recta. Por ejemplo, en la celda B20 podemos escribir
=B17+8*B18 y obtener y (8) = 9.44 millones de euros.

Para realizar la regresin lineal entre las Ventas mensuales (Y) y la Inversin mensual en
publicidad (X2) procedemos de igual forma obteniendo los siguientes resultados:

El coeficiente de correlacin lineal en esta ocasin es mucho mejor que el anterior pues
R = 0.97 que nos indica una dependencia alta y positiva entre las ventas y la inversin en
publicidad. El coeficiente de determinacin lineal R 2 = 0.9409 nos confirma que la bondad
del ajuste es del 94.09%.

Ahora, las Varianzas Total, Explicada y Residual valen:


N

(y i y) 2
1961,6
VARIANZA TOTAL: s y2 = i =1
= = 196,16
N 10
N

(y ti y)2
1845,7565
VARIANZA EXPLICADA: s 2yt = i =1
= = 184,58
N 10
N

(y i yti ) 2
115,8434
VARIANZA RESIDUAL: sry2 = i =1
= = 11,58
N 10

La recta de regresin que explica Y en funcin de X2 es Y = 5,2535 + 9,4335X 2 . A partir


de ella, y con idea de pronosticar el volumen de ventas de un supermercado que invierte
3000 euros en publicidad, bastar con sustituir X 2 = 3 en la recta. Por ejemplo, en la celda
B20 podemos escribir =B17+3*B18 y obtener y (3) = 33.55 millones de euros.

13
Observacin. Ntese que en Herramientas/Anlisis de datos podemos encontrar otros
paquetes muy tiles. Cabe destacar el llamado Estadstica Descriptiva, que nos calcula los
principales estadsticos descriptivos de una variable (media, mediana, moda, varianza,
desviacin estndar y los coeficientes de asimetra y curtosis, entre otros).

Por tanto, parte del ejercicio 1 se poda haber resuelto con esta herramienta. No obstante, es
importante notar que la varianza y la desviacin estndar que calcula esta herramienta es la
muestral (var.s(-) y desvest.s(-)) mientras que lo que se pidi en el ejercicio 1 eran la
varianza y la desviacin tpica poblacionales (var.p(-) y desvest.p(-)).

PROBLEMAS PARA PROFUNDIZAR

EJERCICIO 1
Para estudiar la cuanta de los salarios de los trabajadores de una empresa se seleccionan
aleatoriamente 15 trabajadores de la misma, obteniendo los siguientes valores expresados en
cientos de euros: 15, 18, 20, 135, 175. 22, 10, 123, 132, 19, 145, 20, 166, 18, y 232.
a) Calcular la media, la varianza y la mediana.
b) Calcular el coeficiente de asimetra y el de curtosis, interpretando los resultados obtenidos.
c) Calcular la media y la varianza para el caso en el que el empresario decida aumentar los
salarios de todos los trabajadores en 100 euros.
d) Calcular la media y la varianza para el caso en el que el empresario decida aumentar los
salarios de todos los trabajadores un 10%.
EJERCICIO 2
La siguiente tabla refleja el gasto familiar y el nivel de ingresos (en ) de varias economas
domsticas de cierta localidad:
GASTOS 610 720 800 840 950 1000
INGRESOS 1120 1200 1310 1470 1500 1750

a) Realizar la nube de puntos, representando en el eje de abscisas los ingresos y en el eje


de ordenadas los gastos.
b) Obtener un modelo de regresin lineal que explique los gastos en funcin de los
ingresos. Dar una medida de la fiabilidad del modelo.
c) Estimar los gastos que tendra una familia con unos ingresos de 1.650 .
d) Calcular la varianza debida a la regresin y la varianza residual del modelo.

14

Вам также может понравиться