Вы находитесь на странице: 1из 8

Cuaderno de prcticas de Estadstica

Nombre . Grupo. Titulacin

Este cuaderno se entregar al profesor del grupo reducido (prcticas) el ltimo da de clase. Es imprescindible entregarlo para poder acceder al examen de prcticas.

El profesor pasar lista y pedir los cuadernos por orden. No se recogern cuadernos en otro momento.

El cuaderno se presentar escrito a mano o impreso, salvo por los grficos o tablas que haya que adjuntar que sern necesariamente impresos y sacados de Statgraphics. Se puede ir haciendo durante las prcticas de la asignatura en aula informtica. En las prcticas se realizarn en ocasiones ejercicios similares pero con otras bases de datos. En ese caso es preciso realizar el ejercicio tal como se pide en este cuaderno fuera de las horas de prcticas.

Primera parte Estadstica Descriptiva. Ficheros altsexo.sf3 y Paises95.sf3

Fichero altsexo.sf3. Contiene datos de peso, altura y sexo de 117 estudiantes.

1. Realizar un histograma para las variables Peso y Altura. 2. Realizar un histograma para la variable altura nicamente para hombres. Seleccionar los hombres (Sexo=0) 3. Realizar un Box-plot simple para Altura 4. Realizar un Box-plot simple para Peso 5. Realizar un Box-plot simple para Altura slo para hombres. 6. Realizar un Box-plot simple para Peso slo para mujeres. 7. Realizar un Box-plot mltiple para Altura separando por sexo 8. Calcular la media, mediana, rangos, desviacin tpica, varianza, mximo y mnimo de las variables Altura y Peso. 9. Calcular la media, mediana, rangos, desviacin tpica, varianza, mximo y mnimo de las variables Altura y Peso para hombres y para mujeres por separado 10. Grfico de dispersin del Peso frente a la Altura. 11. Coeficiente de correlacin entre las dos variables.

Fichero Pases95 12. 13. 14. 15. 16. 17. 18. 19. 20. Box-plot mltiple de Esperanza de Vida masculina por religiones Grfico de barras de Religiones Grfico de sectores (pie chart) de Religiones. Grfico de dispersin de Esperanza de vida Femenina y masculina. Correlacin entre Esperanza de vida Femenina y masculina. Creacin de la variable DIFESP=Esperanza de vida Femenina-Esp Vida Masculina Media, mediana, desviacin tpica y rango de DIFESP Box-plot mltiple de DIFESP por religiones. Grfico de dispersin de Esperanza de vida Femenina y masculina para pases catlicos. Seleccionar Religin=Catlicos. 21. Matriz de correlaciones para las variables PIB, DIFESP, hijos promedio, natalidad, mortalidad. 22. Crear una nueva variable Cristianos que valga 1 si el pas es Catlico, Protestante u Ortodoxo y 0 en otro caso. 23. Correlacin entre Esperanza de vida Femenina y Esp Vida Masculina para pases cristianos.

Segunda Parte: Probabilidad


24. 25. 26. 27. 28. Dibuja la funcin de densidad de una N(2,10) y una N(3,4). Dibuja la funcin de densidad de una Exponencial con media 5. Dibuja tres funciones de densidad diferentes indicando las que has elegido. Dibuja la funcin de masa de probabilidad para una binomial de n=15 p=0,1 Calcula las siguientes probabilidades: a. X es N(3,4): i. P(X<5) = ii. P(X=0)= iii. P(X>6)= iv. P(5<X<6)= b. X es exponencial de media 5 i. P(X<4)= ii. P(X=0)= iii. P(X>5)= iv. P(x<4<5)= c. X es binomial n=10 p=0.06 i. P(X=1)= ii. P(X=0)= iii. P(X=<2)= iv. P(X>1)= d. Elige una distribucin de probabilidad continua y calcula tres probabilidades. 29. Genera 100 nmeros aleatorios de una N(170,10) y calcula la media, mediana, desviacin tpica, mnimo y mximo. Dibuja el histograma de los nmeros aleatorios.

Tercera Parte: Inferencia. Ficheros altsexo.sf3


30. Para la variable PESO. a. Haz el histograma b. Ajusta una distribucin Normal. Valor de la Normal estimada. c. Contraste de Bondad de ajuste Chi cuadrado. P-valor del contraste. Es adecuada una distribucin normal? d. Calcula la probabilidad de que una persona pese ms de 50kg e. Calcula la probabilidad de que una persona pese ms de 90kg f. Calcula la probabilidad de que una persona pese entre 50 y 80kg g. Ajstale a la variable PESO una distribucin exponencial e indica Por qu sabemos que no es adecuada? 31. Calcula un intervalo de confianza para la media del peso que has estimado en el apartado anterior, 32. Una empresa ha puesto en marcha un procedimiento de mejora de calidad ya que reciba reclamaciones en el 10% de los servicios prestados. Despus de la actuacin

han recibido 2 reclamaciones en los 40 servicios prestados. Ha disminuido la proporcin de reclamaciones? Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones 33. Se disea un experimento para aumentar la tasa de filtracin de un compuesto en una planta qumica que es de 5 litros por segundo. Tras las modificaciones tomamos una muestra de 10 filtrados obtenindose una velocidad media de 5.8 litros por segundo y una desviacin tpica estimada de 1 Hemos conseguido aumentar la tasa de filtracin? Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones 34. En dos plantas una misma empresa se emplean tcnicas diferentes para producir un compuesto qumico. Estamos interesados en la cantidad de impurezas que se generan por ambas tcnicas. En la primera planta se toman 30 muestras con una media de 4,5gr/l de impurezas y una desviacin estimada de 2. En la otra, con 30 muestras se obtiene un promedio de 3.8 y una desviacin estimada de 1.3. Son equivalentes los procesos? Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones 35. En una encuesta sobre la energa nuclear realizada a 500 personas el 60% dice estar en contra. Se realiza esa misma encuesta a 200 estudiantes de ingeniera industrial obtenindose un 40% de personas en contra. Estn ms a favor de la energa nuclear los ingenieros industriales que el resto de la poblacin? Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones

36. El gasto promedio de las compras en un gran almacn era de 89 Euros antes de la crisis. Se toma una muestra de 200 carritos y se obtiene una media de 65 euros con una desviacin tpica de 10,6 euros. Se nota el efecto de la crisis?. Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones 37. En la sucursal de Majadahonda de esos grandes almacenes se toma una muestra de 100 carritos con un gasto medio de 70,8 euros y desviacin tpica de 10,6. En la de Villaverde la muestra es de 150 carritos y el gasto medio resulta ser de 61,1 con una desviacin tpica de 8 euros. Hay diferencias entre ambos supermercados?. Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones 38. El peso ideal de los hombres de 1.80 es de 75 kg. Tomamos una muestra de hombres de 135 de 1.80 en Espaa y el peso medio resulta ser 80.5 kg con una desviacin tpica de 5kg. Podemos decir que los espaoles estn ms gordos de la cuenta? Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones. 39. Con los datos del fichero altsexo.sf3, Contraste si hay diferencia de altura media entre hombres y mujeres. Indica el tipo de contraste que has utilizado, el p-valor obtenido y las conclusiones. 40. Lo mismo para el PESO

Cuarta parte: Control de Calidad Ficheros practica_graficos.sf3 y practica_graficos_atributos.sf3

41. Datos del fichero Practica_graficos sf3. La variable llenado contiene el nivel de llenado de envases en una factora. Se han tomado 20 muestras de tamao 5 cada una. Un total de 100 observaciones. Calcula la capacidad del proceso mediante grficos X media y R. Para ello: 41.1 Indica las muestras fuera de control en cada una de las iteraciones y exclyelas. 41.2 Indica el valor final estimado de la distribucin Normal que sigue una observacin cuando el proceso est bajo control. 41.3 Calcula la capacidad del proceso. 41.4 Haz los tres apartados anteriores con un grfico X media y s.

42. La variable llenado en lnea contiene 50 muestras de tamao 4 (200 observaciones) del llenado de envases. Realiza la monitorizacin del proceso SABIENDO QUE LAS CONDICIONES DEL PROCESO BAJO CONTROL SON LAS OBTENIDAS EN 41.2 43. Fichero practica_graficos_atributos.sf3. Las variables Chips defectuosos y nmero de chips. Indican el nmero de chips defectuosos en muestras de tamao 50. Realiza un grfico de control de calidad por atributos para la proporcin de defectuosos en cada muestra. Indica el valor estimado del nmero de defectuosos y la capacidad del proceso. 44. Lo mismo para el nmero de defectos.

45. Las variables Bujas def y numBujias son la cantidad de bujas defectuosos en muestras de tamao nmero de bujas. Realiza un grfico de control para el nmero de defectos normalizando por tamao de grupo y sin normalizar por tamao de grupo. Calcula la capacidad del proceso.

Quinta parte Regresin. Ficheros practica regresion1.sf3, practica regresin2.sf3, practica regresin 2.sf3, practica regresin 4.sf3,altsexo.sf3, practica regresin 5.sf3
46. Con los datos del fichero practica regresin1.sf3 Rellena la siguiente tabla Variable Variable Transformacin Transformacin necesaria para necesaria para X Y Ecuacin estimada de regresin

X1 X2 X3 X4 X5 X6

Y1 Y2 Y3 Y4 Y5 Y6

47. Datos practica regresin 2.sf3. Explicar Peso en funcin de Altura. Se pide 1. Escribir la ecuacin de regresin. Indicar si es preciso transformar o no, 2. Construir un intervalo de confianza al 95% para la pendiente. 3. Es significativa la altura para determinar el peso de una persona? 4. Cuantificar el efecto de un incremento de la altura sobre el peso. 5. Diagnosis del modelo. El grfico de residuos Es adecuado? 6. Qu peso estimado tendr una persona de 180cm?

48. El mismo ejercicio para explicar el peso del cerebro de mamferos en funcin del peso del cuerpo. Preguntas 1 a 5 idnticas.

6. Qu tamao de cerebro previsto tendr un mamfero de 80Kg? 49. Regresin Mltiple. Datos practica regresin 3.sf3. Se va a explicar Y en funcin de las variables X. 1. Grfico de dispersin mltiple. Hay que transformar? 2. Escribir la ecuacin de regresin de Y explicada por las cuatro variables X. 3. Construir un intervalo de confianza para los coeficientes de las variables X1 y X2 4. Son significativas estas variables? Por qu? 5. Cunto se incrementa la variable Y cuando cada una de estas dos variables (manteniendo constantes todas las dems) se incrementan en un 1%? 6. Calcular el valor de Y cuando cada uno de los regresores Xs toma un valor de 15.000.

Regresin Mltiple. Datos practica regresin 4.sf3 El fichero contiene dos conjuntos de datos. El primero de cata de quesos (Variables Sabor, Actico, Lctico yH2S) est analizado en el enunciado de la prctica de Multicolinealidad. Para el segundo se va explicar el Ratio Global de funcionamiento de sucursales de una empresa en funcin de Beneficios, Cartera de Clientes y Tasa de Inversin. Se pide: 1. Grfico de los datos para comprobar las hiptesis. 2. Ajuste de las regresiones simples para ver si las variables son significativas. 3. Ajuste de las regresiones dobles para ver si hay variables colineales. 4. Ajuste de la regresin triple. 6. Ajuste de la regresin mltiple utilizando Stepwise en versin Forward 7. Eleccin del modelo adecuado.

50. Variable cualitativas dicotmicas Fichero de datos altsexo.sf3. El fichero contiene datos de pesos alturas y sexo de 117 estudiantes. 1. Ajusta una regresin para explicar el peso en funcin de altura y el sexo. Esta variable vale 1 para las mujeres y 0 para los hombres. Escribe la regresin y analiza el efecto de la variable sexo sobre el peso.

2. Analiza la significatividad de la variable sexo. Hay diferencias de peso para un hombre y una mujer de la misma altura? Cuantifcala.

51. Variables cualitativas politmicas. Fichero de datos practica regresin 5.sf3 El fichero contiene las variables coste de produccin: coste por unidad producida salarios: coste por hora trabajada energas: costes energticos materia prima: coste de las materias primas maquinaria: coste de depreciacin de la maquinaria utilizada en la produccin. Se va a explicar El Coste de produccin en funcin de las dems variables. Se pide: 1. Ajustar un modelo de regresin mltiple para explicar coste de produccin en funcin de salarios, energas, materia prima y maquinaria. Indicar si ha habido que transformar y aspecto del grfico de residuos. 2. Indicar si hay multicolinealidad en el modelo. La empresa trata de situar sus factoras en emplazamientos preferenciales en funcin de la disponibilidad y coste de la materia prima utilizada en la produccin. Las factoras se dividen en tres grupos (estrella, base, neutra) dependiendo de su emplazamiento. Estos tres grupos aparecen en la variable situacin del fichero de datos. 3. Creacin de variables dummies para modelizar la variable politmica. Debes crear 3 variables dummies -llmalas Estrella, Base y Neutra- que tomen el valor 1 en caso de que la ubicacin sea del tipo correspondiente al nombre y cero en otro caso. 4. Introduce las 3 variables dummies en el modelo ajustado en el apartado 1. el programa dar error porque ese modelo no se puede estimar por tener multicolinealidad perfecta. Introduce nicamente 2 variables dummies y escribe y analiza la regresin. Quita la variable Neutra.

Вам также может понравиться