Вы находитесь на странице: 1из 5

REGRESION SIMPLE Problema: Los datos de la siguiente tabla representan las estaturas (X, cm) y los pesos (Y,

kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se observ el peso de una persona seleccionada de entre el grupo con dicha estatura, resultando: X Y 152 155 152 155 157 152 157 165 162 178 183 178 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82

Con estos datos y mediante la ayuda de statgraphics vamos a plantear una ecuacin de regresin simple que nos permita pronosticar los pesos conociendo las tallas. RESULTADOS **La ecuacin de regresin estimada es: Y= -75,4427 + 0,867581X PESO = -75,4427 + 0,867581*ESTATURA **Coeficiente de correlacin: R= 0,937885 **Coeficiente de determinacin: R=0.879628 **Utilizando la ecuacin de regresin para estimar o predecir valores de la variable Y: Para una talla de 180 se obtiene un peso de 80,72188 kg. ** Cunto se espera que pese (en promedio) una persona que mide 1.60 m? Sustituyendo el valor de inters en la ecuacin: Y= -75,4427 + 0,867581X Se obtiene: Y= -75,4427 + 0,867581(160) = 63,37026 Kg. -

REGRESION MULTIPLE Problema: El ejemplo numrico que se desarrolla a continuacin est basado en un estudio estadstico de los costos administrativos en los bancos comerciales en Guatemala. (Los datos bsicos se muestran en el Cuadro.) La variable dependiente para el anlisis ser el nivel anual de los Gastos Generales y de Administracin en los diferentes bancos del sistema. Si se examina el Cuadro, se podr apreciar que estos costos varan enormemente de un banco a otro. Nuestro problema consistir, por tanto, en encontrar una lista de variables que nos permitan explicar esta variacin observada. A un nivel muy elemental, por supuesto, dicha variacin no tiene realmente ningn misterio, ya que los bancos varan mucho en cuanto a su tamao, y es ms bien de esperarse que los bancos ms grandes tengan tambin costos administrativos ms altos por el slo hecho de ser ms grandes. Nuestra tarea ser traducir esta nocin intuitiva en un concepto operativo, y para esto debemos tratar de expresar el tamao de un banco en trminos de algunas variables numricas. Las variables escogidas para este propsito fueron el Total de Activos del banco y el nmero de sucursales o agencias que operan. Con esto, y como una aproximacin para el anlisis, la recta de regresin sera la siguiente: = b0 + b1X1 + b2X2 Donde X1 = Activos Totales del banco, y X2 = Nmero de Agencias del banco.

Cuadro 2 Bancos Comerciales Privados en Guatemala (1991). Gastos Total Agencias Generales Activo y de Promedio Admn. G&T 48.8 INDUSTRIAL 43.2 OCCIDENTE 39.4 del CAFE 29.8 del AGRO 26.2 AGRICOLA MERC. 24.8 INTERNACIONAL 24.0 831.5 1204.0 1153.5 499.6 466.6 522.3 376.6 30 18 20 25 30 12 12

INMOBILIARIO 21.5 431.3 20 CONSTRUBANCO 18.3 282.2 10 del EJERCITO 15.6 311.8 13 LLOYDS 14.3 284.5 7 METROPOLITANO 12.9 339.0 8 BANEX 12.5 462.8 3 del QUETZAL 8.8 205.0 12 PROMOTOR 6.0 162.4 3 CITIBANK 5.9 45.8 1 CONTINENTAL 3.6 113.7 4 REFORMADOR 1.7 237.3 7 UNO 1.0 170.8 5 Fuente: Superintendencia de Bancos, Boletn de Estadsticas Bancarias (Guatemala, 4 Trimestre, 1992). RESULTADOS Con la ayuda de statgraphics se obtiene la siguiente ecuacin de regresin: GASTOS GENERALES = -1,22001 + 0,0275095*ACTIVOS TOTALES DEL BANCO + 0,660975*NUMERO DE AGENCIAS = -1,22 + 0,0275X1 + 0,661X2 R2 = 0,9018

DISEO COMPLETAMENTE AL AZAR (ANOVA). Problema: Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas. Para ello, cada spray se aplica a un grupo de 100 moscas, y se cuenta el nmero de moscas muertas, expresado en porcentajes. Se hacen seis rplicas y los resultados obtenidos se muestran enseguida. NUMERO DE REPLICAS 3 4 67 68 61 75 70 58

MARCA DE SPRY 1 2 3

1 72 55 64

2 65 59 74

5 62 53 51

6 73 50 69

USANDO STATGAPHICS: A) Formule la hiptesis adecuada. B) Existe diferencia entre la efectividad promedio de los sprays? C) muestre las grficas de medias y los diagramas de caja. Interprtelos. D) Verifique los supuestos de normalidad y de igual varianza entre las marcas. RESULTADOS Factor de inters: efectividad de los sprays manifestada en su marca Niveles del factor: k=3 Replicas por nivel: ni=6 Variable de estudio: y= porcentaje de moscas muertas A) Las hiptesis serian: H0: 1 = 2 = 3 HA: i j para algunos i, j=1,2,3 B) = 0,05 Tenemos que Pvalue > Donde Pvalue=0,0931 por tanto se acepta H0, es decir, que no existe diferencias significativas entre la efectividad promedio de los sprays. C) Al observar los diagramas de caja se nota claramente que los diagramas de las 3 marcas no se encuentran tan separados, lo cual nos sirve para ratificar la aceptacin de la hiptesis nula, pero al hacer un test de rangos mltiples, aparece una diferencia entre las marcas 1 y 2, lo cual puede deberse a que el Pvalue realmente no esta tan alejado del valor de . D) **En la prueba de normalidad tenemos que Pvalue > normalidad. Donde Pvalue=0,74 **En el test de Bartlett Tenemos que Pvalue > homogneas. Donde Pvalue=0,551 por tanto hay

por tanto hay varianzas

DISEO EN BLOQUES COMPLETOS AL AZAR Problema A) Se estn comparando tres soluciones de lavado diferentes a fin de estudiar su efectividad para retardar el crecimiento de bacterias en contenedores de leche de 5 galones. El anlisis se hace en un laboratorio y solo pueden realizarse 3 ensayos en un da. Puesto que los das podran representar una potencial fuente de variabilidad, el experimentador decide usar un diseo de bloques aleatorizados. Se hacen observaciones en cuatro das, cuyos datos se muestran en seguida. Analizar los datos de este experimento (usar = 0,05 ) y sacar las conclusiones apropiadas.
DIAS SOLUCION 1 2 3 1 13 16 5 2 22 24 4 3 18 17 1 4 39 44 22

RESULTADOS Factor: soluciones de lavado Factor bloque: das Variable de estudio: Y= efectividad de las soluciones de lavado ** Las hiptesis a usar sern: PARA LOS TRATAMIENTOS: H0: 1 = 2 = 3 HA: i j para algunos i, j=1, 2,3 PARA LOS BLOQUES: H0: B1=B2=B3=B4 HA: Bi Bj para algunos i,j=1,2,3,4 CONCLUSIONES DEL EJERCICIO. ** En ambos casos se rechaza la hiptesis nula, ya que Pvalue < , lo que significa que existe por lo menos una pareja de soluciones diferentes. Esto fue comprobado al observar el diagrama de medias, donde se evidencia claramente que la solucin 3 es diferente a la 1 y a la 2. Tambin se comprueba dicha teora al realizar el test de rangos mltiples, que es aun ms exacto y claro que el diagrama de medias. **En la prueba de normalidad tenemos que Pvalue > normalidad. Donde Pvalue=0,3981 **En el test de Bartlett Tenemos que Pvalue > homogneas. Donde Pvalue=0,88 por tanto hay

por tanto hay varianzas

Вам также может понравиться