Академический Документы
Профессиональный Документы
Культура Документы
1 Prctica de Informtica
Temas 1 y 2: Distribuciones de frecuencias unidimensionales.
Distribuciones de frecuencias bidimensionales. Regresin.
b) Lo primero que debemos hacer es escribir los datos que disponemos en una hoja en blanco en
Ms Excel. En nuestro caso, podemos copiar y pegar en la celda B2 la tabla proporcionada,
quedando as:
1
Para la representacin grfica que se nos pide, seleccionamos la columna que contienen los
datos que queremos presentar (C2:C14), incluido el ttulo de sta. A continuacin nos iremos al
a la pestaa Insertar
Una vez que ha salido la representacin grfica, aparece la pestaa diseo, donde aparecen
las siguientes opciones: tipo, datos, diseo grfico, estilos de diseo y ubicacin.
2
Para seleccionar los Rtulos del eje de categoras (X): pulsamos el botn derecho del
ratn sobre el grfico, y pulsamos Seleccionar datos. En la nueva pantalla, podemos editar
tanto el eje de categoras (X) como el eje de las Y.
Pulsamos Aceptar:
3
Ahora podemos (aunque es opcional) escribir o modificar los distintos campos de la
ventana para mejorar la apariencia del grfico, pulsando en las etiquetas correspondientes.
c), d), e) y f) Para calcular los distintos estadsticos que se piden procederemos siempre de la
misma forma. En primer lugar preparamos una tabla que contenga los distintos apartados del
problema para ir rellenando cada una de las celdas deseadas mediante la pestaa Frmulas..
4
1. Promedio() para la media aritmtica.
2. Media.armo() para la media armnica.
3. Media.geom() para la media geomtrica.
4. Moda.uno() para la moda.
5. Mediana() para la mediana.
6. Cuartil() para un cuartil.
7. Percentil.inc() para calcular un percentil.
8. Coeficiente.asimetra() para el coeficiente de asimetra.
9. Curtosis() para el coeficiente de curtosis.
10. Var.p() y Desvest.p() para la varianza y la desviacin tpica respectivamente.
a)
Media aritmtica = =PROMEDIO(C3:C14)
Media geomtrica = =MEDIA.GEOM(C3:C14)
Media armnica = =MEDIA.ARMO(C3:C14)
Mediana = =MEDIANA(C3:C14)
Moda = =MODA.UNO(C3:C14)
b) Varianza = =VAR.P(C3:C14)
Des. Tpica = =DESVEST.P(C3:C14)
CV = =F9/F2
e) Q1 = =PERCENTIL.INC(C3:C14;0,25)
Q2 = Mediana= =PERCENTIL.INC(C3:C14;0,50)
Q3 = =PERCENTIL.INC(C3:C14;0,75)
Deciles Tasa
10% =PERCENTIL.INC(C3:C14;E17)
20% =PERCENTIL.INC(C3:C14;E18)
30% =PERCENTIL.INC(C3:C14;E19)
40% =PERCENTIL.INC(C3:C14;E20)
50% =PERCENTIL.INC(C3:C14;E21)
60% =PERCENTIL.INC(C3:C14;E22)
70% =PERCENTIL.INC(C3:C14;E23)
80% =PERCENTIL.INC(C3:C14;E24)
90% =PERCENTIL.INC(C3:C14;E25)
Percentil 15 = =PERCENTIL.INC(C3:C14;0,15)
f) Asimetra = =COEFICIENTE.ASIMETRIA(C3:C14)
Curtosis = =CURTOSIS(C3:C14)
5
Comentarios:
1. Ntese que la media armnica es menor que la geomtrica y que sta a su vez es menor
que la aritmtica.
2. La mediana no coincide con la media aritmtica. Esto es debido a la asimetra de la
distribucin.
3. Para analizar la representatividad de la media hemos calculado CVPearson como:
S 0,939192
CV Pearson = = = 0,0195 lo que indica que la media es muy
X 48,15
representativa.
4. El coeficiente de asimetra es positivo luego la distribucin es asimtrica positiva o
asimtrica a la derecha.
5. El coeficiente de curtosis es negativo lo que indica que la distribucin es platicrtica.
6
Tema 2. Distribuciones de Frecuencias Bidimensionales. Regresin.
EJERCICIO 2
Y X1 X2
12 8 0,5
5 10 0,2
25 11 2,0
7 8 0,1
6 7 0,2
14 9 1,0
50 12 5,0
21 8 2,0
33 10 2,0
5 9 0,3
En primer lugar copiaremos los datos disponibles en una hoja en blanco de Ms Excel:
7
Resolveremos los distintos apartados para el ajuste lineal en el que se calcula el nivel de
ventas (Y) en funcin de la Horas que permanece abierto el establecimiento (X1), esto es la
regresin: Y = a + bX 1 y, posteriormente, procederemos de la misma forma a calcular el
segundo ajuste lineal en el que se calcula el nivel de ventas (Y) en funcin de la Inversin
mensual en publicidad (X2).
Seleccionamos los datos de las variables Y y X1 con sus correspondientes ttulos (B1:C11) y
accedemos a la pestaa Inserta, y en la opcin grfico, pulsamos dispersin. y el primer
subtipo de grfico (viene seleccionado por defecto):
Pinchamos dos veces para poder ponerle ttulo al eje de valores (Y), eliminar el ttulo del
grfico y colocar la leyenda abajo:
8
En dicha nube de puntos se puede apreciar una clara tendencia lineal y creciente de las
ventas a medida que aumenta el nmero de horas que permanece abierto el establecimiento.
Pasemos pues a resolver el apartado a). Para ello usaremos la herramienta Regresin que est
incluida en las Herramientas para anlisis. Herramientas para anlisis es un programa
complementario de MS Excel. Est disponible al instalar Microsoft Office o Excel pero antes
de utilizar la herramienta Regresin en Excel, se debe cargar Herramientas para anlisis.
9
2. En el cuadro de Opciones pulsa Complementos.
3.
10
5. En el cuadro Complementos, haga clic para seleccionar Herramientas para anlisis y, a
continuacin, haga clic en Aceptar (si Herramientas para anlisis no aparece en el
cuadro Complementos disponible, haga clic en Examinar para buscarlo)
6. Una vez realido lo anterior, nos debemos ir a la pestaa Datos y debe de aparecer una
nueva opcin Anlisis de Datos
NOTA:
Para hacerlo en Excel 2003 y en versiones anteriores de Excel, siga estos pasos:
11
9. En Rango Y de entrada incluiremos el rango de nuestra variable ventas. Para ello
picharemos en su cuadrado con una flecha roja. De igual manera procederemos con
Rango X de entrada. En Opciones de salida podemos elegir En una hoja nueva o en
algn lugar de la hoja sobre la que estamos trabajando (Rango de salida). En nuestro
caso seleccionaremos en una hoja nueva que titularemos RegresinYX1:
10. Tras aceptar, iremos a la hoja que se acaba de crear con el ttulo RegresinYX1 donde
nos encontraremos lo siguiente:
De la segunda tabla nos interesa la columna Suma de cuadrados pues en ella encontramos
los datos necesarios para calcular la varianza explicada y la varianza residual. Antes hay que
notar que Excel no proporciona directamente estos valores sino que nos indica el valor
correspondiente a la suma de los cuadrados de las desviaciones respecto a la media.
Podremos obtener las varianzas pedidas dividiendo por el nmero total de datos, en nuestro
caso N = 10, las Sumas de los cuadrados anteriormente presentadas. Obteniendo las
Varianzas Total, Explicada y Residual de la siguiente manera:
(y i y)2
1961,6
VARIANZA TOTAL: s 2y = i =1
= = 196,16
N 10
12
N
(y ti y) 2
1047,22
VARIANZA EXPLICADA: s y2t = i =1
= = 104,72
N 10
N
(y i yti ) 2
914,37
VARIANZA RESIDUAL: sry2 = i =1
= = 91,437
N 10
Para realizar la regresin lineal entre las Ventas mensuales (Y) y la Inversin mensual en
publicidad (X2) procedemos de igual forma obteniendo los siguientes resultados:
El coeficiente de correlacin lineal en esta ocasin es mucho mejor que el anterior pues
R = 0.97 que nos indica una dependencia alta y positiva entre las ventas y la inversin en
publicidad. El coeficiente de determinacin lineal R 2 = 0.9409 nos confirma que la bondad
del ajuste es del 94.09%.
(y i y) 2
1961,6
VARIANZA TOTAL: s y2 = i =1
= = 196,16
N 10
N
(y ti y)2
1845,7565
VARIANZA EXPLICADA: s 2yt = i =1
= = 184,58
N 10
N
(y i yti ) 2
115,8434
VARIANZA RESIDUAL: sry2 = i =1
= = 11,58
N 10
13
Observacin. Ntese que en Herramientas/Anlisis de datos podemos encontrar otros
paquetes muy tiles. Cabe destacar el llamado Estadstica Descriptiva, que nos calcula los
principales estadsticos descriptivos de una variable (media, mediana, moda, varianza,
desviacin estndar y los coeficientes de asimetra y curtosis, entre otros).
Por tanto, parte del ejercicio 1 se poda haber resuelto con esta herramienta. No obstante, es
importante notar que la varianza y la desviacin estndar que calcula esta herramienta es la
muestral (var.s(-) y desvest.s(-)) mientras que lo que se pidi en el ejercicio 1 eran la
varianza y la desviacin tpica poblacionales (var.p(-) y desvest.p(-)).
EJERCICIO 1
Para estudiar la cuanta de los salarios de los trabajadores de una empresa se seleccionan
aleatoriamente 15 trabajadores de la misma, obteniendo los siguientes valores expresados en
cientos de euros: 15, 18, 20, 135, 175. 22, 10, 123, 132, 19, 145, 20, 166, 18, y 232.
a) Calcular la media, la varianza y la mediana.
b) Calcular el coeficiente de asimetra y el de curtosis, interpretando los resultados obtenidos.
c) Calcular la media y la varianza para el caso en el que el empresario decida aumentar los
salarios de todos los trabajadores en 100 euros.
d) Calcular la media y la varianza para el caso en el que el empresario decida aumentar los
salarios de todos los trabajadores un 10%.
EJERCICIO 2
La siguiente tabla refleja el gasto familiar y el nivel de ingresos (en ) de varias economas
domsticas de cierta localidad:
GASTOS 610 720 800 840 950 1000
INGRESOS 1120 1200 1310 1470 1500 1750
14