Вы находитесь на странице: 1из 8

Estudios de Economa y Empresa

71.501 Fundamentos de Estadstica


Semestre 11-12/enero 11

Nombre y apellidos del estudiante

Prueba de evaluacin continuada 1. Estadstica Descriptiva y Muestreo.

Presentacin
Presentacin de la prueba

En esta primera prueba de evaluacin continuada se introducen los conceptos ms importantes de la


estadstica descriptiva. Se tratarn los diferentes tipos de datos existentes, su representacin grfica y la
utilidad de los descriptores que aportan informacin sobre las caractersticas de los datos como son las
medidas de centro como la media y medidas de desviacin como la varianza. Tambin introduciremos las
diferencias entre poblacin y muestra as como los elementos que se tienen que tener en cuenta a la hora de
seleccionar las muestras representativas.

Objetivos y competencias
Objetivos

Los aspectos ms importantes tratados en esta evaluacin son:

Saber plantear qu es la estadstica y para qu sirve

Saber diferenciar entre los diferentes tipos de variables que nos encontramos

Conocer como se pueden representar grficamente las variables y decidir cul es la mejor opcin en
cada caso

Saber aplicar las principales medidas que nos dan informacin de las variables

Saber qu es una muestra y como conseguir que sea representativa

Competencias

Las competencias que se trabajarn en esta primera PEC son:

Capacitar para generar conocimiento econmico relevante a partir de datos, aplicando los
instrumentos numricos pertinentes.

Capacidad para valorar crticamente situaciones empresariales concretas y establecer posibles


evoluciones de empresas y mercados.

Capacitar para utilizar y aplicar tecnologas de la informacin y la comunicacin en los mbitos


acadmicos y profesional.

Criterios de evaluacin

Las preguntas cortas cuentan (si se razonan) un 40% y los problemas (que se tienen que desarrollar) un 60%.
Se tienen que razonar las respuestas y se tiene que demostrar fluidez utilizando el lenguaje de la asignatura.
Esto incluye tanto los problemas como las preguntas.

71501_solPEC1.doc 1/8
PEC1. Estadstica Descriptiva y Muestreo

Formato y fecha de entrega


El nombre del fichero que contenga la PEC 1 resuelta del estudiante Miquel Suri Castells y de la asignatura
de Fundamentos de Estadstica tendr el siguiente formato: 01501_PEC1_suria_castillos.doc o bien
01501_PEC1_suria_castillos.pdf. Recordad que los apellidos se escribirn sin acentos y que este mismo
nombre tiene que figurar en el espacio correspondiente de la primera pgina y en el pie de pgina de todo el
documento de respuestas.

Las pruebas de evaluacin continuada se tienen que entregar en el buzn especfico de Entrega de
actividades que se encuentra en el apartado Evaluacin del aula en un nico fichero en formato WORD o
PDF. El ltimo da para entregar esta actividad es el 23 de marzo de 2011.

Enunciado

PREGUNTAS CORTAS

1. Los usuarios de un servicio durante un ao se distribuyen por edades segn la siguiente tabla:

Edad 14 15 16 17 18 19 20 21
Nm. usuarios 19 21 23 28 32 15 19 25

Calculad manualmente la media y la desviacin tpica de la edad de los usuarios del centro.

Nota: Ved Ficha 11. Medidas de Centro y de Dispersin.

Solucin:

Para calcular la media y la desviacin tpica, hacemos:

14 19 15 21 16 23 17 28 18 32 19 15 20 19 21 25
X 17,533
(19 21 23 28 32 15 19 25)

19 (14 17,533)2 25 (21 17,533) 2


Varianza= 4,913
(19 25) 1

Desviacin tpica= 4,913 2, 217

2. Siguiendo con el ejercicio anterior:

Qu tipo de grfico utilizarais para representar la variable edad? Razonad la respuesta. No hace
falta que representis grficamente esta variable, slo hay que indicar el grfico que hara falta en
este caso concreto razonando la respuesta.

Nota: Ficha 21. Representacin Grfica.

Solucin:

Esta variable en nuestro caso es una variable cuantitativa discreta, por lo tanto, tal y como hemos
visto en los apuntes, utilizaramos un diagrama de barras para representarla grficamente.

71501_PEC171501_solPEC1.doc 2 /8
PEC1. Estadstica Descriptiva y Muestreo

3. Trece alumnos de caractersticas parecidas se asignan, al azar, a tres mtodos de aprendizaje,


obteniendo los resultados siguientes en el examen posterior:

Mtodo 1 Mtodo 2 Mtodo 3


7,72 8,01 8,01
7,98 7,93 8,32
7,85 8,15 8,12
7,87 8,09 8,28
8,23

Introducid los datos en el programa MINITAB y, utilizando este programa, representad mediante un
diagrama de puntos la variable resultado para cada uno de los diferentes mtodos. A la vista del
grfico, creis que el mtodo condiciona los resultados del examen? Por qu?

Nota: Ved Ficha 21. Representacin Grfica.

Solucin:

Suponemos que hemos introducido los datos en Minitab de la siguiente manera:

C1 C2 C3

7,72 8,01 8,01


7,98 7,93 8,32
7,85 8,15 8,12
7,87 8,09 8,28
8,23

Ahora haremos un diagrama de puntos de la variable resultado para cada uno de los diferentes
mtodos de aprendizaje.

Consideraremos la siguiente orden: Graph > Dotplot > Multiple Ys > Simple. Hacemos OK y en Graph
Variables pondremos C1 C2 C3.

Una vez hecho esto, obtendremos el siguiente grfico:

Dotplot of C1; C2; C3

C1
C2
C3
7,76 7,84 7,92 8,00 8,08 8,16 8,24 8,32
Data

71501_PEC171501_solPEC1.doc 3 /8
PEC1. Estadstica Descriptiva y Muestreo

Si en lugar de introducir los datos en Minitab como antes, los hemos introducido de la siguiente
manera:
C1 C2
7,72 1
7,98 1
7,85 1
7,87 1
8,01 2
7,93 2
8,15 2
8,09 2
8,01 3
8,32 3
8,12 3
8,28 3
8,23 3

donde ahora la variable C1 hace referencia a la variable resultado y la variable C2 hace referencia a
los diferentes mtodos de aprendizaje, el diagrama de puntos se har de la siguiente manera.

Consideraremos la siguiente orden: Graph > Dotplot > One Y > With Groups. Hacemos OK y en
Graph Variables pondremos C1 y en Categorical Variables for grouping pondremos C2. Ahora,
tenemos que ir a la pestaa que aparece abajo donde pone Multiple Graphs y tenemos que ir a
Multiple Variables y en Show Graph Variables, tenemos que escoger, In separate panels of the
same graph y en Same Scales for Graphs tenemos que escoger, Same X, including same bins.

Una vez hecho esto, obtendremos el siguiente grfico:

Dotplot of C1

1
C2

2
3
7,76 7,84 7,92 8,00 8,08 8,16 8,24 8,32
C1

Tal y como podemos ver, se trata del mismo grfico que hemos obtenido antes. A la vista del grfico,
parece que los resultados sern diferentes dependiendo del mtodo de aprendizaje.

De hecho, si consideramos la siguiente orden: Stat > Basic Statistics > Display Descriptive Statistics.
En Variables ponemos la variable resultado y en By Variables ponemos el mtodo de aprendizaje,
tenemos:

Descriptive Statistics: C1

Variable C2 N N* Mean SE Mean StDev Minimum Q1 Median Q3


C1 1 4 0 7,8550 0,0533 0,1066 7,7200 7,7525 7,8600 7,9525
2 4 0 8,0450 0,0479 0,0957 7,9300 7,9500 8,0500 8,1350
3 5 0 8,1920 0,0565 0,1264 8,0100 8,0650 8,2300 8,3000

Variable C2 Maximum
C1 1 7,9800
2 8,1500
3 8,3200

71501_PEC171501_solPEC1.doc 4 /8
PEC1. Estadstica Descriptiva y Muestreo

4. El nmero de personas que conviven en el hogar con el encuestado en una muestra de 25


encuestados son 1, 3, 1, 1, 1, 0, 1, 2, 0, 1, 0, 0, 1, 0, 2, 3, 1, 0, 0, 2, 1, 1, 1, 4, 1. Construid la
distribucin de frecuencias y haced el diagrama de barras.

Nota: Podis hacer el ejercicio manualmente o utilizando el MINITAB.


Nota: Ved Ficha 11. Medidas de Centro y de Dispersin

Solucin:

Utilizando el MINITAB, consideramos la siguiente orden: Stat > Table > Tally individual variable.
Ahora, en Variables pondremos PERSONAS (PERSONAS es una variable que hemos introducido
anteriormente en el MINITAB y representa los datos proporcionados por el ejercicio, es decir,
1,3,1,...,1,4,1).

Tally for Discrete Variables: PERSONES

PERSONES Count Percent CumPct


0 7 28,00 28,00
1 12 48,00 76,00
2 3 12,00 88,00
3 2 8,00 96,00
4 1 4,00 100,00
N= 25

Ahora queremos hacer el diagrama de barras. Para obtener dicho diagrama, hacemos Graph > Bar
Chart.

Chart of PERSONES

12

10

8
Count

0
0 1 2 3 4
PERSONES

EJERCICIO 1

A continuacin, trabajaremos con un archivo de datos de un estudio de demanda turstica en la Costa Brava
(COSTABRAVA.MTW). El archivo contiene slo una pequea parte de las variables que se obtuvieron con un
determinado cuestionario. La encuesta se hizo durante los meses de junio y septiembre. El tamao de la
muestra fue de 1500 para toda la Costa Brava y se reparti por localidades y meses en funcin del grado de
ocupacin. En este archivo slo hay 81 visitantes en Palafrugell y 139 en Playa de Aro, 220 en total.

A continuacin, describiremos las variables que encontraris en la base de datos:

ID: Cdigo del encuestado

LOCALIDA: localidad de realizacin de la encuesta (9=Palafrugell 12=Playa de Aro)

TRANSP: medio de transporte empleado (1=Automvil 2=Caravana 4=Autocar 5=Tren 6=Avin chrter
7=Avin de lnea regular 9=Otras)

71501_PEC171501_solPEC1.doc 5 /8
PEC1. Estadstica Descriptiva y Muestreo

ALOJAMI: Alojamiento en la Costa Brava (1=Hotel o pensin 2=Camping 3=Apartamento 4=Vivienda en


propiedad 5=Vivienda de familiares o amigos 6=Otros)

VAL_GLOB: Valoracin global de la visita a la Costa Brava

SEXO: Sexo del encuestado (1=Hombre 2=Mujer)

EDAD: Edad del encuestado

INGR_EUR: Ingresos mensuales limpios en euros

DIASTOTA: Duracin de la estancia

VAL_TRAN: Valoracin de la tranquilidad

EUR_ORI: Pago que ha efectuado el turista en su pas de origen

ORIGEN: Lugar de origen (1=Catalua 20=Resto de Espaa 21=Francia 22=Italia 23=Alemania


24=Reino Unido e Irlanda 25=Blgica 26=Pases Bajos 53=Otros Pases

NUMFAMIL: Nmero de familiares que acompaan al encuestado

Nota: Ved Ficha 11. Medidas de Centro y de Dispersin


Nota: Ved Ficha 21. Representacin Grfica.

a) Haced un grfico y una representacin estadstica adecuada de la variable NUMFAMIL. Comentad


las principales caractersticas de la distribucin de datos.

Solucin:

Tally for Discrete Variables: NUMFAMIL


NUMFAMIL Count Percent CumPct
0 72 33,18 33,18
1 43 19,82 53,00
2 27 12,44 65,44
3 39 17,97 83,41
4 23 10,60 94,01
5 10 4,61 98,62
7 1 0,46 99,08
14 2 0,92 100,00
N= 217
*= 3

Chart of NUMFAMIL
80

70

60

50
Count

40

30

20

10

0
0 1 2 3 4 5 7 14 *
NUMFAMIL

Por lo que podemos ver, parece que mucha gente (un 33,18%) visita la Costa Brava sola o bien sin
ningn familiar, seguida de aqullos que parece que viven en pareja o en pareja y con hijos.

71501_PEC171501_solPEC1.doc 6 /8
PEC1. Estadstica Descriptiva y Muestreo

b) Haced una representacin grfica adecuada de la variable edad. Indicad las medidas de posicin y
dispersin de esta variable e interpretadlas. Hay alguna medida de posicin y/o dispersin que no
se pueda interpretar? Por qu?

Solucin:

Una representacin grfica adecuada en este caso es un diagrama de caja. Para ello, hacemos:
Graph > Boxplot > One Y > Simple.

Boxplot of EDAD
90

80

70

60
EDAD

50

40

30

20

10

A continuacin, indicaremos las principales medidas de posicin y dispersin de esta variable.

Descriptive Statistics: EDAD

Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3


EDAD 219 1 38,36 1,07 15,78 16,00 25,00 36,00 48,00

Variable Maximum
EDAD 82,00

Debemos tener en cuenta que si hay valores atpicos, slo se pueden interpretar las medidas de
posicin y dispersin robustas, puesto que las medidas no robustas como la media y la varianza
pueden verse distorsionadas por estos valores atpicos.

Por lo que podemos ver, el grueso de visitantes de la Costa Brava es gente de edad media, ya que la
mediana de edad es de 36 aos. Los datos son bastante homogneos puesto que el rango
intercuartilico es de 23 aos (48-25=23).

c) Representad grficamente la variable edad para los diferentes grupos de la variable sexo en un
mismo grfico. Creis que hay relacin entre la variable edad y el sexo? Por qu?

A continuacin haremos un diagrama de caja de la variable edad para cada uno de los diferentes
grupos de la variable sexo en un mismo grfico. Consideraremos la siguiente orden: Graph >
Boxplot > One Y > With Groups. Ahora en Graph Variables pondremos la variable edad y en
Categorical Variables for grouping pondremos la variable sexo. Para representar estos dos diagramas
de caja en un mismo grfico, marcaremos la opcin Multiple Graphs y aqui en Multiple Variables en
Show Graph Variables marcaremos In separate panels of the same graph y en Same scales for grahs
marcaremos Same Y. Si adems queremos que no nos salgan los valores perdidos (puesto que no
tiene sentido en este caso hacer un diagrama de caja para los valores perdidos) iremos a: Data
options, Group options y desmarcaremos la opcin include missing as a group.

Una vez hecho esto, obtendremos el siguiente grfico:

71501_PEC171501_solPEC1.doc 7 /8
PEC1. Estadstica Descriptiva y Muestreo

Boxplot of EDAD
90

80

70

EDAD 60

50

40

30

20

10
1 2
SEXO

A la vista de los resultados no parece que haya mucha diferencia de edad entre hombres y mujeres.

EJERCICIO 2

Dos personas que han acabado los estudios de dos carreras diferentes, A y B, reciben ofertas de trabajo de
11.420 y 12.320 euros anuales respectivamente. La distribucin de los salarios para la primera oferta con la
carrera A tiene una media de 10.220 euros y una desviacin tpica de 510 euros y, con la carrera B, la media
es de 10.820 y la desviacin tpica de 900 euros.

Nota: Ved Ficha 11. Medidas de Centro y de Dispersin

a) Cul de las dos personas tiene una oferta mejor en relacin con los salarios de su profesin?

Solucin:

Para saber cul de las dos personas tiene una oferta mejor en relacin con los salarios de su
profesin tenemos que tipificar:
:

11.420 10.220 1200


ZA 2,353
510 510

12.320 10.820 1500


ZB 1,667
900 900
Por tanto, la primera persona (persona A) tendr una oferta mejor.

b) En cul de las dos profesiones estn ms dispersos relativamente los sueldos?

Solucin:

Para saber esto lo que debemos hacer es calcular el coeficiente de variacin.

510
CVA 0,050
10.220

900
CVB 0,083
10.820

Por lo que podemos ver, los sueldos estn un poco ms dispersos relativamente en la profesin B.

71501_PEC171501_solPEC1.doc 8 /8

Вам также может понравиться