Вы находитесь на странице: 1из 4

DISEO DE EXPERIMENTOS EN INGENIERA DE SOFTWARE.

Tarea No. 1 Fecha lmite de entrega: 5 de septiembre de 2011 Equipos de 3 a 4 integrantes (ni menos ni ms) 1. Supngase que en el proceso de realizacin de un programa, siempre se desea estimar el nmero final de lneas de cdigo (LOC), con base en las lneas de cdigo que se tienen en la primera versin del programa. Para obtener un modelo estadstico que permita realizar esta estimacin, se analizaron 10 programas escritos en Pascal que arrojaron los siguientes resultados: LOC primera versin
130.00 650.00 99.00 150.00 128.00 302.00 95.00 945.00 368.00 961.00

LOC final
186.00 699.00 132.00 272.00 291.00 331.00 199.00 1890.00 788.00 1601.00

Las siguientes actividades estn enfocadas a la investigacin de si un modelo de regresin lineal es adecuado. Al final de este ejercicio se debe tener un reporte con todas las grficas y tablas necesarias para el entendimiento del problema. Por favor cuida la ortografa y redacta lo ms claro posible. Cuando realices una prueba de hiptesis, escribe la hiptesis nula y la alternativa que se estn probando. a) Establece cuales son las variables aleatorias dependiente e independiente, justifica tu respuesta. b) Captura los datos en el software Statgraphics o en el SPSS. c) Realiza el diagrama de dispersin apropiado y comenta acerca de si es conveniente o no ajustar un modelo de regresin lineal. d) Ajusta el modelo de regresin lineal. e) Suponiendo que se satisfacen los supuestos del modelo estadstico de regresin lineal, determina un intervalo de confianza del 95% para la pendiente 1 de la recta. f) Prueba si la regresin es significativa al 5%, utilizando al menos dos pruebas o mtodos diferentes. g) Calcula las estimaciones de la variable dependiente en los valores muestrales de la variable independiente. Usa el modelo ajustado. h) Calcula el coeficiente de determinacin e interprtalo en el contexto del problema. Para que todas las pruebas de hiptesis anteriores y sus conclusiones sean vlidas, es necesario probar los supuestos del modelo de regresin lineal. A continuacin se te proporciona la lista de actividades enfocadas a dichas pruebas.

Prof. Felipe R. Tuz Poot

Pgina 1

a) Determina si existe homocedasticidad en los residuos (puedes usar las salidas del software pero debes describir lo que significa). b) Mediante un mtodo grfico determina si los residuos tienen una distribucin normal.

2. Un nuevo paquete de software de consulta para computadora se dise con el objetivo de lograr un acceso y un mantenimiento ms eficientes de los conjuntos de datos a gran escala. La eficiencia se mide en trminos del nmero de operaciones de entrada/salida (E/S) de disco (llamadas bloques de almacenamiento) necesarias para acceder al conjunto de datos y darle mantenimiento; cuanto menor sea el nmero de bloques ledos, con mayor rapidez se efectuar la operacin. A fin de evaluar el desempeo del nuevo sistema de software, se registr el nmero de operaciones de E/S de disco necesarias para acceder a un conjunto de datos a gran escala, para cada uno de una muestra de 15 conjuntos de datos de diversos tamaos (donde el tamao se mide como el nmero de registros contenidos en el conjunto de datos). Los resultados se presentan en la tabla. Realice un anlisis de regresin lineal simple completo de los datos. Qu puede inferir a partir de los resultados? Establezca y justifique sus conclusiones. Conjunto de datos
1 2 3 4 5 6 7 8

Nmero de Registros X, millares


350 200 450 50 400 150 350 300

Nmero de E/S a disco Y, millares


36 20 45 5 40 18 38 32

Conjunto de datos
9 10 11 12 13 14 15

Nmero de Registros X, millares


150 500 100 400 200 50 250

Nmero de E/S a disco Y, millares


21 54 11 43 19 7 26

3. Una fraccin importante del esfuerzo que se invierte en la creacin de software comercial para computadora tiene que ver con la prueba de programas. Se emprendi un estudio con el fin de evaluar la utilidad potencial de diversas variables relacionadas con productos y procesos para identificar el software propenso a errores (IEEE Transactions on Software Engineering, abril de 1985). Se ajust un modelo de lnea recta, el cual relaciona el nmero y de defectos en un mdulo con el nmero x de operandos nicos en el mdulo, a los datos obtenidos de una muestra de mdulos de software. El coeficiente de determinacin para este anlisis fue r2 = 0.74. a) Interprete el valor de r2 b) Con base en este valor, Inferira usted que el modelo de lnea recta es un predictor til del nmero y de defectos en un mdulo?. Explique y justifique su respuesta. 4. Como parte de la evaluacin de un sistema de computadora, un gerente de sistemas quiere predecir el tiempo de respuesta de las terminales de la computadora. El tiempo de respuesta de una terminal se define como el tiempo (en segundos) que la computadora tarda en responder a un comando enviado desde una terminal oprimiendo una de las teclas de funcin de programa de la terminal. Aunque son muchas las Prof. Felipe R. Tuz Poot Pgina 2

variables que influyen en el tiempo de respuesta de las terminales, el gerente de sistemas va a modelar dicho tiempo como una funcin del nmero de usuarios simultneos (es decir, el nmero de usuarios que estn accediendo a la unidad central de procesamiento en el momento en el que se enva el comando). El gerente ha recabado los datos de muestra que se presentan en la tabla. Realice un anlisis de regresin lineal simple completo de estos datos. Nmero de usuarios simultneos, X
1 2 3 4 5

Tiempo de respuesta de la terminal Y, segundos


0.22 0.59 1.01 1.36 1.42

5. Un socilogo que trabaja en una institucin correccional est interesado en estudiar la relacin entre inteligencia y delincuencia. Un ndice de delincuencia (su rango es de 0 a 50) se formula considerando ambas, la severidad y la frecuencia de crmenes cometidos, mientras que la inteligencia es medida con el IQ. La siguiente tabla proporciona los ndices de delincuencia (ID) e IQ para una muestra de 18 convictos menores.
DI (Y) 26.20 33.00 17.50 25.25 20.30 31.90 21.10 22.70 10.70 IQ (X) 110 89 102 98 110 98 122 119 120 DI (Y) 22.10 18.60 35.50 38.00 30.00 19.70 41.10 39.60 25.15 IQ (X) 92 116 85 73 90 104 82 134 114

a) Elabora el diagrama de dispersin del par de variables (DI, IQ). b) Dados 1 0.249 y 0 52.273 , traza la lnea de regresin estimada sobre el diagrama de dispersin. c) Qu explicacin le daras al hecho de que cuando IQ = 0, Y 52.273 , cuando se sabe que el ndice de delincuencia no puede ser mayor que 50?. d) Halla un intervalo de confianza de 95% para la verdadera pendiente 1 usando el hecho de que

MSE 7.704 y que

S xx 16.192 . n 1

Prof. Felipe R. Tuz Poot

Pgina 3

e) Interpreta este intervalo de confianza con respecto a la prueba H0: 1 = 0, para un nivel = 0.05. f) Nota que el convicto menor con IQ = 134 y DI = 39.6 parece estar fuera de lugar en los datos. Decide si este outlier tiene algn efecto sobre la estimacin de la relacin IQ-DI, observando la grfica de la lnea de ajuste resultante cuando el outlier es removido (observa que 1 0.444 y 0 70.846 , cuando el outlier es quitado). g) Prueba la hiptesis H0: 1 = 0 cuando el outlier es removido, dado que

MSE 4.933 ,

S xx 14.693 y n = 17 (usa = 0.05). n 1

h) Con estos datos, puedes concluir que el ndice de delincuencia decrece cuando el IQ crece? Justifica tu respuesta. 6. Las cantidades de un compuesto qumico y, que se disuelve en 100 gramos de agua a diferentes temperaturas x, se registraron como sigue:
x ( C) 0 15 30 45 60 75
0

8 12 25 31 44 48

y gramos 6 10 21 33 39 51

8 14 24 28 42 44

Nota: Son tres valores de Y para cada nivel de X.

a) Determina la ecuacin de la recta de mnimos cuadrados. b) Grafica en un mismo eje de coordenadas el diagrama de dispersin y la lnea estimada. c) Estima la cantidad de compuesto qumico que se disuelve en 100 gramos de agua a 50 0C. d) Determina un intervalo de confianza del 99% para 0. e) Determina un intervalo de confianza del 99% para 1. f) Determina un intervalo de confianza del 99% para la cantidad promedio de producto qumico que se disolver en 100 gramos de agua a 50 0C. g) Grafica la lnea de regresin estimada y las bandas de confianza del 95% para la respuesta media Y / x . h) Determina un intervalo de prediccin del 99% para la cantidad de producto qumico que se disolver en 100 gramos de agua a 50 0C. Nota: Los ejercicios 4 y 6 son opcionales. Pueden usar algn software estadstico para auxiliarse pero no se aceptarn trabajos que contengan resultados sin explicacin alguna (no se vale hacer un copy and paste del paquete estadstico sin hacer comentarios). La verificacin de supuestos por medio de grficos de residuales deber ser interpretada en todos los casos describiendo qu supuesto se verifica y cul es la conclusin que se obtiene. Cuando haya dudas, consulten mtodos analticos para resolverla. Los equipos que se conformen sern los mismos que debern seguir trabajando hasta cerrar el curso.

Prof. Felipe R. Tuz Poot

Pgina 4

Вам также может понравиться