Вы находитесь на странице: 1из 38

UNIVERSIDAD POLITECNCIA DE MADRID FACULTAD DE INFORMTICA DEPARTAMENTO DE LENGUAJES Y SISTEMAS INFORMTICOS E INGENIERA DEL SOFTWARE

Trabajo Tutelado

RETOS EN LA GESTIN DE PROYECTOS DE DATA MINING

Tutora : Dra. Ernestina Menasalvas Ruz Alumno : Marco Antonio Gutirrez F.

Madrid, Agosto 2007

ndice
1 Introduccin y Motivacin...................................................................................................... 4

1.1 1.2 1.3 1.4


2

Relevancia de la gestin de proyectos de Data Mining .................................................. 4 Problemas de la gestin de proyectos de Data Mining .................................................. 6 Hechos y Casos de Fracasos .......................................................................................... 8 Objetivos del Trabajo Tutelado ................................................................................... 10

Related work ...................................................................................................................... 11

2.1

Gestin de Proyectos .................................................................................................. 11 Ciclo de vida del proyecto.................................................................................... 14 reas de conocimiento para la gestin de proyectos ........................................... 16 Framework para la gestin de proyectos ............................................................. 17 Elementos crticos en la gestin de proyectos...................................................... 17

2.1.1 2.1.2 2.1.3 2.1.4 2.2

Gestin de Proyectos de Software............................................................................... 20 Descripcin de RUP ............................................................................................. 21 Dimensiones y disciplinas de RUP ........................................................................ 21 Ciclo de vida de RUP ............................................................................................ 23 Disciplina de gestin de proyectos de RUP........................................................... 23 Elementos crticos en la gestin de proyectos de software .................................. 23

2.2.1 2.2.2 2.2.3 2.2.4 2.2.5 2.3

Gestin de Proyectos de Data Mining.......................................................................... 25 Metodologa CRISP-DM ....................................................................................... 25 Mapeo desde el modelo genrico al especializado.............................................. 26 Modelo de referencia CRISP-DM ......................................................................... 27

2.3.1 2.3.2 2.3.3


3

Conclusiones ...................................................................................................................... 30

3.1.1 3.1.2 3.1.3


4

En relacin a la gestin de proyectos de data mining .......................................... 30 Anlisis de metodologas hacia la gestin de proyectos de data mining ............... 31 Tendencias en la gestin de proyectos de data mining ........................................ 33

Referencias ........................................................................................................................ 35

ndices de Figuras
Figura 1-1 Industrias y Campos de Aplicacin de Data Mining (basado en www.Kdnuggets.com) .................. 5 Figura 1-2 de proyectos CRM considerados Fallidos (KDnuggets.com, 2007) ............................................... 9 Figura 1-3 Grupo de procesos que interactan en un proyecto ................................................................... 13 Figura 1-4 Detalle esquemtico de cada nodo de la matriz ......................................................................... 14 Figura 1-5 Dimensiones de Competencias del Project Management ........................................................... 14 Figura 1-6 Ciclos de vida de proyectos de software .................................................................................... 15 Figura 1-7 Framework para la gestin de proyectos ................................................................................... 17 Figura 1-8 Rational Unified Process ........................................................................................................... 20 Figura 1-9 Roles, actividades y artefactos .................................................................................................. 22 Figura 1-10 Ciclo de vida de RUP .............................................................................................................. 24 Figura 1-11 Metodologa Data Mining CRISP-DM ...................................................................................... 25 Figura 1-12 Fases de un proceso de Data Mining ...................................................................................... 28 Figura 1-13 Resolucin de problemas y la tcnica de fault-finding .............................................................. 32

Indices de Tablas
Tabla 1-1 Grupos de procesos y reas de conocimiento............................................................................. 13 Tabla 1-2 Tareas genricas y salidas del modelo de referencia CRISP-DM ................................................ 30 Tabla 1-3 Mapeo de PMBOK, RUP, CRISP-DM ......................................................................................... 32 Tabla 1-4 Mapeo de procesos, disciplinas y fases ...................................................................................... 33

1
1.1

Introduccin y Motivacin
Relevancia de la gestin de proyectos de Data Mining

El xito de las organizaciones en el siglo veintiuno esta cada vez ms asociado al uso eficiente del conocimiento y la informacin para el logro de sus objetivos, de ah que a este periodo de la historia se le conozca como la Era de la Informacin la Sociedad del Conocimiento. La sobrevivencia en esta era, donde la competencia es un factor clave, requiere de las organizaciones un conocimiento profundo de los patrones de comportamiento de sus clientes y un acceso selectivo a aquella informacin oculta en la gran cantidad de datos almacenados en sus repositorios [King, 2005]. La necesidad de las organizaciones, de obtener un mayor conocimiento del mercado en general y de sus clientes, las ha llevado al desarrollo de la disciplina conocida como Data Mining (DM). En sus inicios, [Fayyad et al., 1996] se consider al Data Mining como un paso crucial del proceso de descubrimiento de conocimiento en bases de datos (KDD), sin embargo hoy en da el trmino Data Mining es el proceso de KDD en si mismo [Wasilewska et al., 2007]. El uso de Data Mining en organizaciones de diversa ndole ha ido aumentando gradualmente en la ltima dcada [Piatetsky-Shapiro, 2007] y ha pasado de ser una herramienta utilizada para conocer ms a los clientes a convertirse en el conductor de las estrategias empresariales [Ingebretsen, 2003]. Data Mining ha sido introducida exitosamente en el sector pblico y privado, en un amplio rango de aplicaciones. En el sector pblico DM fue usado inicialmente para detectar abusos y fraudes financieros [Chan et al, 99]; en la actualidad se utiliza en procesos que incluyen CRM, investigacin de mercado, anlisis de la cadena de abastecimiento, anlisis mdico y diagnostico, anlisis financiero y deteccin de fraudes [KDNuggets, 2007]. Adicionalmente, es interesante constatar como las reas industriales y campos de aplicacin del Data Mining han experimentado una importante variacin en los ltimos 5 aos. Al comparar las estadsticas que presenta KDnuggets, en su sitio web, respecto a este tema es posible ver el rea de CRM ocupando un lugar muy importante en el 2006 versus su inexistencia en el ao 2001; as tambin el rea de banking pasa de ser la ms importante, a convertirse en un rea sin relevancia en el ao 2006 (ver Figura 1-1). Piatetsky-Shapiro en el 2007 sostiene que el uso de las herramientas de Data Mining se ha potenciado en los ltimos 10 aos debido a factores tales como el fuerte surgimiento del comercio electrnico, los progresos en biologa y los requerimientos de la seguridad antiterrorista entre otros. Asimismo, este autor enfatiza en un anlisis de las 10 palabras utilizadas con mayor frecuencia entre 1996 y 2005, por los especialistas en DM en el sitio www.KDnuggets.com, que las palabras data y Mining ocupan el primer y segundo lugar respectivamente. Sin embargo, la palabra que llega a ocupar el tercer lugar en 1996 es universidad, mientras que en el 2005 la nueva palabra que aparece en su reemplazo es negocios, reflejando el cambio de enfoque de uso con fines de investigacin a utilizacin con fines comerciales [Piatetsky-Shapiro, 2007]. Asimismo, la consultora Gartner, en diciembre de 2006, da a conocer el conjunto de tecnologas que
4

tendran mayor impacto en el mediano y largo plazo, y considera la Gestin de la informacin Empresarial (GIE) en el tercer lugar. Gartner destaca adems, que para el 2007 el 20% de las principales empresas de Fortune utilizaran esquemas de administracin GIE en apoyo a la Arquitectura Orientada al Servicio (SOA).

Figura 1-1 Industrias y Campos de Aplicacin de Data Mining (basado en www.Kdnuggets.com)

A pesar que las organizaciones ya han entendido la relevancia de los proyectos de data mining para alcanzar un mejor posicionamiento competitivo, existen hoy serias problemticas asociadas a la puesta en marcha y administracin de proyectos de esta naturaleza [Brachman, 1996]; [Richardson and Butler 2006]; [Becker, 2005]. Investigadores del rea de DM y personal de empresas estn conscientes de las problemticas que se enfrentan en el desarrollo de proyectos de esta naturaleza; sin embargo, no existe consenso entre los investigadores en el rea de gestin de proyectos de Tecnologas de Informacin acerca de lo que constituye un proyecto fallido, aunque en general se distinguen dos tipos de problemticas, las econmicas y aquellas relacionadas con los requerimientos, costos y parmetros de tiempo [Becker and Ghedini, 2005]. Es decir, si un proyecto no genera el retorno esperado, si los costos asociados a su implementacin exceden lo presupuestado, constituira una falla econmica; no obstante, aquel que no entrega las caractersticas prometidas a tiempo y dentro de los presupuestos, tambin sera un proyecto fallido, cuya causa puede darse por una mala implementacin y gestin. Un reporte de Extreme Chaos [Standish Groups, 2004] manifiesta que en los Estados Unidos se gastan ms de 250 billones de dlares cada ao en cerca de 175.000 proyectos de aplicaciones de tecnologas de la informacin. Indica adems, que el costo promedio de un proyecto en una compaa grande es de aproximadamente 2,3 millones de dlares, en una compaa mediana de 1,3 millones de dlares y de 0,4 millones en una pequea empresa. Pero, sin embargo,
5

muchos de estos proyectos fallan en sus resultados. Las estadsticas ms abrumadoras en este reporte sealan que el 31,1% de los proyectos serian cancelados antes de ser completados, el 52,7% de los proyectos costaran 189% ms que su presupuesto original y eso no considera la prdida del costo de oportunidad de los recursos. El mismo reporte de Extreme Chaos en el ao 2001, [Standish Groups, 2001], indica que la tasa de xito de los proyectos de TI aument alrededor del 75% sobre la tasa del ao 1994 y entre las principales razones que se esgrimen fue el uso de: Mejores herramientas y Monitoreo y control del progreso de los proyectos y administradores de proyectos con mejores habilidades. 1.2 Problemas de la gestin de proyectos de Data Mining

A pesar del fuerte desarrollo de herramientas y tcnicas de DM y del creciente uso en las organizaciones pblicas y privadas, para el logro de sus objetivos estratgicos, los resultados obtenidos no reflejan la gran inversin y difusin de dichas herramientas. Existen variadas razones que ayudan a explicar esta paradoja. [Becker ,2005] sostiene que muchos de los problemas que enfrentan los proyectos de DM se pueden asociar a: dificultades para definir objetivos compatibles con lo que pueden revelar los datos que se encuentran disponibles; al esfuerzo concentrado en la fase de preparacin de datos; la experimentacin con parmetros y transformaciones de datos en la fase de minera; falta de apoyo metodolgico, sobrecarga de rehacer el trabajo, dificultad de administrar y relacionar recurso y resultados de una aplicacin de DM. Adicionalmente, existen problemas que se producen al inicio del proceso y se arrastran durante toda la ejecucin del proyecto. Jean Que Louie [Louie, 2003] Presidente de Nautilus Systems, Inc., menciona que los desarrolladores de proyectos en el rea de DM cometen serios errores al considerar vlidas las siguientes cuatro falacias del Data Mining [Larose, 2005]: Falacia 1: Hay herramientas de Data Mining que pueden convertir nuestros repositorios de datos y dar respuestas a nuestros problemas. Falacia 2: El proceso del Data Mining es autnomo, requiere poco o nada del cuidado humano. Falacia 3: El Data Mining se paga solo muy rpidamente. Falacia 4: Los paquetes de software de Data Mining son intuitivos y fciles de usar. A la lista de arriba, el autor agrega dos falacias comunes adicionales: Falacia 5: Data Mining identificar las causas de los problemas del negocio o de la investigacin. Falacia 6: Data Mining limpiar una base de datos sucia automticamente. Las falacias presentadas por el autor [Larose, 2005] permiten entender las principales problemticas que conlleva un proyecto de Data Mining en la organizacin. Una buena administracin, gestin y puesta en marcha de los mismos permite evitar las prdidas de tiempo y recursos tras su implementacin y permitir obtener mejores resultados para las metas propuestas por parte de la empresa.
6

Segn seala [Pyle, 2004] en su artculo This Way Failures Lies, no todos los proyectos de minera son exitosos y agrega adems que aunque hay muchas vas hacia el xito de la minera de datos, las trayectorias a la fallas se siguen demasiado a menudo. Los profesionales de la minera de datos que se dirigen hacia el fracaso, parecen seguir patrones (reglas), o peores prcticas, as como quienes intentan seguir el xito, buscan las mejores prcticas. Existen nueve simples reglas, que se deben evitar, para no fracasar en un proyecto de minera de datos: Regla 1: Hacer Data Mining directamente de los datos que se recogen. Regla 2: Modelar el problema en trminos de datos. Regla 3: Enfocarse solamente en la manera ms obvia de enmarcar el problema. Regla 4: Confiar en su propio juicio. Regla 5: Encontrar los mejores algoritmos (no buscar el que se ajusta mejor al proyecto). Regla 6: Confiar en la memoria (no documentar). Regla 7: Utilizar la intuicin como elemento fundamental en lugar de estndar. las prcticas

Regla 8: Reducir al mnimo la interaccin entre los profesionales de data mining y los encargados del negocio. Regla 9: Reducir al mnimo la preparacin de los datos. [Pyle, 2004] enfatiza que necesario entender que Data Mining es parte, y ms an, una pequea parte, de un proceso de negocios mucho mayor y que adems puede ser una parte esencial de un proyecto de Data Mining, pero al incorporar los resultados de la minera de datos con todas las otras partes relacionadas del proyecto corporativo es igualmente, sino la mas, importante para el xito final. Standish Groups (2001), en el extreme report sostiene que los 10 principales factores considerados ms relevantes por los ejecutivos de IT, para el xito de proyectos de data mining son los siguientes: el involucramiento del usuario, el apoyo de los ejecutivos mximos, un claro planteamiento de los requerimientos, una adecuada planificacin, expectativas realistas, pequeos hitos del proyecto, staff competente, apropiabilidad por parte del equipo, visin y objetivos claros y un staff enfocado que trabaja duro. Asimismo, [Becker, 2005], sostiene que una gestin efectiva del proyecto es una factor clave de xito de proyectos de KDD. En este sentido los mismos autores mencionan la documentacin sistemtica de conocimientos, experimentos, datos y resultados previos como un medio invaluable para mantener un seguimiento del estatus actual del proyecto. La literatura destaca la importancia de la utilizacin de herramientas de aceptacin generalizada y profesionales para la gestin de proyectos en general y de proyectos de data mining en particular. En dicho contexto se hace relevante la incorporacin sistemtica y la adecuacin de metodologas de gestin de proyectos integrales aceptadas universalmente para la administracin de proyectos de Data Mining. En este

sentido destacan como herramientas de uso generalizado para gestionar proyectos el PMBOK y RUP. 1.3 Hechos y Casos de Fracasos

El desarrollo de proyectos de Data Mining ha evolucionado desde una disciplina reservada al medio cientfico y universitario a constituirse en una de las armas estratgicas ms importantes en el mundo de los negocios. Esta evolucin incluye nuevas reas de investigacin, tales como Web Mining, Redes Sociales, y Multimedia Mining [Piatesky, 2007]. Lo anterior, se puede observar a travs de algunas de las estadsticas obtenidas del sitio www.kdnuggets.com, que fueron presentadas por Piatesky-Sahpiro en un artculo el ao 2007, que se muestra que el nmero de trabajos ofrecidos en KDnuggets (ver Figura N 1.1) en el ao 1997 se concentraban en el sector acadmico, y que los trabajos solicitados para el sector Industrial comenzaron a ser significativamente mayores a partir del ao 2000 seguido de una baja y una importante recuperacin desde el 2003 en adelante.

Figura N 1.1 Trabajos ofrecidos en KDnuggets (Extrado de Piatesky-Sahpiro, 2007)

Sin embargo, estos avances del Data Mining en las reas de negocios no han estado exentos de problemas, errores y fracasos. Es posible mencionar casos donde proyectos de gran envergadura han fallado y debido a diversas problemticas. [Kelley, 2003] presenta tambin algunas de las principales fallas en proyectos de DataWarehouse y Data Mining e identifica los once tipos de problemas que se pueden asociar a fallas de proyectos de esta naturaleza: 1. El proyecto sobrepasa el presupuesto inicial 2. El proyecto se sale de la programacin inicial

3. Funciones y capacidades no implementadas en el proyecto 4. Usuarios insatisfechos 5. Desempeo del proyecto inaceptable 6. Disponibilidad de las aplicaciones limitada y pobre 7. Inhabilidad para expandirse 8. Mala calidad de datos y reportes 9. Muy complejo para ser usado por los usuarios 10. Costos no justificados inicialmente en el proyecto 11. La administracin no reconoce los beneficios del proyecto

Como ejemplo de las problemticas que se enfrentan en la gestin de proyectos de Data Mining es posible mencionar los variados intentos para desarrollar aplicaciones en reas comerciales, especficamente en la ejecucin de proyectos de CRM. El sitio KDnuggets.com realiza permanentemente encuestas a profesionales en Data Mining y en el ao 2001 consult respecto a la experiencia con proyectos CRM y su percepcin sobre el porcentaje de fracasos. Como resultado alrededor del 73% de los que respondieron consideran que entre el 40 y el 100% fueron proyectos fallidos y de ellos un 11% respondi que entre un 81 y un 100% de los proyectos fallaron (ver Figura 1-2)
Encuesta KDnuggets
En su experiencia, que % de proyectos de CRM fallaron? 11% [118 votes total]

0 - 20 (13) 21 - 40 (19)

16%
33% 29% 11%

41 - 60 (39)
61 - 80 (34) 81 - 100 (13)

Figura 1-2 de proyectos CRM considerados Fallidos (KDnuggets.com, 2007)

En la actualidad existe una gran variedad de campos de aplicacin de proyectos de Data Mining y como mencionan Platetsky-Shapiro, Djeraba, Getoor, Grossman, Feldman y Zaki (2006) los mayores desafos se encuentran en dos grandes reas de investigacin que involucran reas de uso y datos: 1) Hacer minera del comportamiento de los usuarios en la interaccin con datos multimedia y el uso del conocimiento extrado en este proceso para anticipar el futuro comportamiento o para diagnsticos mdicos o condiciones sicolgicas de los usuarios es un tema que requiere de atencin 2) Cruzar la brecha semntica entre datos de multimedia y semnticos donde la dificultad es
9

extraer automticamente el significado del contenido multimedia de manera que la explotacin usando informacin semntica pueda ser hecha a la medida de aplicaciones individuales (ej. Seguridad, marketing, negocios, otras.) Estos autores tambin sugieren que las investigaciones actuales se enfocan principalmente en tareas nicas tales como ranking o prediccin de links, pero en los escenarios reales de anlisis de datos se requieren una mezcla de todas las capacidades. Finalmente, los desafos que enfrenta el desarrollo de proyectos de Data Mining residen en la necesidad de abordar problemticas complejas que no se enfocan solo en reas tradicionales de los negocios sino que irn mas all hacia temas que implican la esencia del comportamiento social y humano y es aqu donde es necesario contar con metodologas integrales y de un nivel multidimensional donde los errores y las fallas en la gestin de los proyectos tienen un efecto catastrfico. 1.4 Objetivos del Trabajo Tutelado

Analizados los problemas que conlleva la gestin de los proyectos de data mining y teniendo en cuenta las buenas prcticas, el tiempo de desarrollo y la aplicacin de metodologas en gestin de proyectos en dominios como la ingeniera del software, se plantea como objetivo central de este trabajo tutelado el anlisis de la gestin de proyectos y su posible adaptacin para la gestin de Proyectos DM. Este objetivo considera la revisin de los avances y desarrollos en el rea de la gestin de proyectos con particular nfasis en proyectos de software. Asimismo, se estudiarn los fracasos y las buenas prcticas en la gestin de proyectos de Data Mining. Con el propsito de alcanzar el objetivo propuesto en este trabajo se plantea un anlisis en profundidad de la disciplina de gestin de proyectos basada fundamentalmente en los conceptos del PMBOK y su aplicacin en diversas areas del conocimiento. Paralelamente, se estudiaran las herramientas y metodologas actualmente usadas para gestionar proyectos de Data Mining y las principales problemticas que se aprecian en los procesos de concepcin, diseo, implementacin y puesta en marcha. Consecuentemente, las siguientes secciones de este documento muestran en primer lugar un anlisis de la gestin de proyectos, su ciclo de vida, areas de conocimiento, frameworks utilizadas y los elementos crticos en la gestin de proyectos. En segundo lugar se presenta un anlisis de la gestin de proyectos de software en el que se detalla la metodologa RUP, su ciclo de vida, las disciplinas de gestin de proyectos de RUP y los elementos crticos en la gestin de proyectos de software. Posteriormente, se analiza la gestin de proyectos de Data Mining considerando la metodologa CRISP-DM, se presenta el mapeo desde el modelo genrico al especializado y posteriormente se presenta el modelo de referencia. El documento termina con las consecuencias extradas en relacin ala gestin de proyectos de DM, un anlisis comparativo de metodologas hacia la gestin de proyectos de DM y finalmente las tendencias en la gestin de proyectos de Data Mining.

10

2 2.1

Related work Gestin de Proyectos

La prctica del Project Management ha evolucionado durante la mitad del ltimo siglo para formar parte de todas las industrias y gobiernos a nivel mundial. El trabajo denominado Project Management State of the Art [Russell, 2004] presenta una visin general de la disciplina, y ciertas tendencias de la gestin de proyectos, respecto de su continua evolucin. Para poner un proyecto en perspectiva se requiere una definicin [Charvat, 2003]. Una de las definiciones de proyecto ms aceptadas y utilizadas en la industria es la del Project Management Institute (PMI) [PMBOK, 2004]. Organizacin que ha definido Proyecto como un esfuerzo temporal que se lleva a cabo para crear un producto, servicio o resultado nico. Adicionalmente, el PMI ha desarrollado el Project Management Body of Knowledge [PMBOK, 2004], con la finalidad de identificar los fundamentos de la Gestin de Proyectos generalmente reconocidos como buenas prcticas en las organizaciones. En donde identificar significa proporcionar una descripcin general en contraposicin a una descripcin exhaustiva; por su parte, generalmente reconocido apunta a que los conocimientos y las practicas descritos son aplicables a la mayora de los proyectos, la mayor parte del tiempo, y que existe un amplio consenso sobre su valor y utilidad; en tanto que, buenas prcticas dice relacin con que existe un acuerdo general en que la correcta aplicacin de estas habilidades, herramientas y tcnicas puede aumentar las posibilidades de xito de una amplia gama de proyectos [Phillips, 2004]. Por otro lado, los autores de Effective Project Management: Traditional, Adaptive, Extreme [Wysocki, 2003], definen que un proyecto es una secuencia de actividades nicas, complejas, y conectadas que tienen una meta o propsito y que se deben terminar en un tiempo especfico, dentro de presupuesto, y de acuerdo con las especificaciones. Como seala el PMBOK Guide, la gestin de proyectos es: la aplicacin de conocimientos, habilidades, herramientas y tcnicas a las actividades de un proyecto para satisfacer los requisitos del proyecto. La gestin de proyecto incluye: Identificar los requerimientos, adems supone establecer un equilibrio entre demandas contrapuestas a travs de objetivos claros y posibles de realizar, equilibrar demandas concurrentes de calidad, alcance, tiempo y costo, y adaptar las especificaciones, los planes y el enfoque de los stakeholder (necesidades y expectativas). A partir de lo anterior y segn [PMBOK, 2004], se desprende que los proyectos estn compuestos de procesos, en donde cada proceso es una serie de acciones que producen un resultado, procesos que, a su vez, son realizados por personas. En [Phillips, 2004] se ha identificado dos categoras que interactan a lo largo del proyecto. Los procesos de gestin de proyectos (universales a todos los proyectos y controlan

11

el ciclo de vida del proyecto), relacionados con la descripcin y la organizacin del trabajo del proyecto; y los procesos orientados al producto (son nicos al producto en creacin): relacionados con especificar y crear el producto del proyecto, que varan segn el campo de aplicacin. La Gestin de Proyectos se materializa mediante la aplicacin e integracin de los siguientes cinco Grupos de Procesos de Gestin de Proyectos [Phillips, 2004]. Los grupos de procesos tienen dependencias claras y se llevan a cabo siguiendo la misma secuencia en cada proyecto. Son independientes de los enfoques de las reas de aplicacin o de la industria. Los cinco grupos de procesos componen proyectos y fases de proyectos. Cada uno tiene un conjunto de acciones que llevan el proyecto a su finalizacin [PMBOK, 2004]: Iniciacin: reconocimiento de que un proyecto o una fase de un proyecto deben comenzar; y compromiso de su puesta en marcha. Planificacin: inventar y mantener un esquema de trabajo para conseguir los objetivos del negocio que motivaron la realizacin del proyecto. Ejecucin: coordinar a las personas y dems recursos para la puesta en marcha del plan del proyecto. Control: asegurar que los objetivos del proyecto estn cumplindose, mediante la supervisin y medicin de los progresos y tomando acciones correctivas cuando es necesario. Finalizacin: aceptacin formal de los resultados de un proyecto o fase y realizacin ordenada de su cierre. Dentro de los 5 grupos mencionados, hay 2 categoras de procesos: centrales (son lgicos en orden y siguen una progresin algo rigurosa) y los facilitadores (son ms flexibles, apoyan los procesos centrales) [Phillips, 2004]. Al interior de cada uno de estos cincos grupos de procesos, se gestan procesos adicionales que pertenecen a diversas reas de conocimiento requeridas para la gestin de proyectos. Estos procesos representan la utilizacin de las mejores prcticas en materia de aplicacin de mtodos y tcnicas para disminuir los riesgos y asegurar el xito del proyecto [Competency PMBOK, 2001].

12

Executing
Project Integration Mgmt Project Plan Execution

Project Quality Mgmt Quality Assurance

Level of Activity

Planning

Project HR Mgmt Team Development

Project Communication Mgmt Information Distribution


Project Procurement Mgmt Solicitation Source Selection Contract Admin

Initiating

Closing

Controlling

Phase Start

Time

Phase End

Figura 1-3 Grupo de procesos que interactan en un proyecto

Cada rea del conocimiento est constantemente evolucionando respecto de sus tcnicas, mtodos y aplicacin, esto hace que la gestin de proyectos este en mejoramiento permanente. En la Tabla 1-1 se presenta en forma matricial lo expuesto anteriormente, y en la Figura 1-4 el detalle esquemtico de cada nodo de la matriz.

Grupo de rea Procesos del Conocimiento

Grupo de Procesos de Iniciacin


Desarrollar el acta de constitucin del Proyecto Desarrollar el enunciado de alcance del proyecto

Grupo de Procesos de Planificacin


Desarrollar el plan de gestin del proyecto

Grupo de Procesos de Ejecucin


Dirigir y Gestionar la Ejecucin del Proyecto

Grupo de Procesos de Seguimiento y Control


Supervisar y controlar el trabajo del proyecto Control Integrado de Cambios Verificar el alcance Controlar el alcance

Grupo de Procesos de Cierre


Cerrar el proyecto

Gestin de la Integracin del Proyecto Gestin del Alcance del Proyecto

Planificar el alcance. Definir el alcance Crear EDT Definir las actividades. Establecer una secuencia de las actividades. Estimar los recursos de las actividades. Estimar la duracin de las actividades. Desarrollar el cronograma Estimar los costos Preparar el presupuesto de los costos Planificar la calidad Realizar un aseguramiento de la calidad Adquirir al equipo del proyecto Desarrollar al equipo del proyecto Distrinuir la informacin

Controlar el cronograma

Gestin del Tiempo del Proyecto

Gestin de los Costos del Proyecto Gestin de la Calidad del Proyecto Gestin de los RRHH del Proyecto
Gestin de las Comunicaciones del Proyecto

Controlar los Costos

Realizar un control de calidad Gestionar el equipo del proyecto

Planificar los RRHH

Planificar las comunicaciones

Informar el rendimiento Gestionar a los interesados

Gestin de los Riesgos del Proyecto

Planificar la gestin riesgos Identificar los riesgos Realizar un analisis cualitativo de los riesgos Realizar un analisis cuantitativo de los riesgos Planificar las respuestasa los riesgos

Realizar un seguimiento y Control a los riesgos

Gestin de las Adquisiones del Proyecto

Planificar las compras y adquisiones Planificar la contratacin

Solicitar respuestas de vendedores Seleccionar vendedores

Administrar el contrato

Cierre del contrato

Tabla 1-1 Grupos de procesos y reas de conocimiento

13

Figura 1-4 Detalle esquemtico de cada nodo de la matriz

Competency PMBOK, 2001] muestra en la Error! No se encuentra el origen de la referencia. las dimensiones de competencias del Project Management.

Figura 1-5 Dimensiones de Competencias del Project Management

2.1.1 Ciclo de vida del proyecto Cada proyecto suele descomponerse temporalmente en fases o etapas [Phillips, 2004], [Charvat, 2003], [Wysocki, 2003], [Charvat, 2002], [Hughes, 1999], [Royce, 1998]. Con ello se busca: un mejor control de la gestin y adecuados enlaces con las operaciones habituales de la organizacin. Adems, cada fase supone la realizacin completa de uno o varios entregables. Un entregable es un producto tangible y comprobable [Gua PMBOK, 2004]. La conclusin de una fase supone revisar sus entregables y la ejecucin del proyecto para: determinar si el proyecto debe continuar y para detectar y corregir errores con un costo aceptable.

14

De all, que los proyectos se dividen en fases, puesto que en cada fase las personas involucradas son diferentes [Competency PMBOK, 2001], y las actividades que se ejecutan son tambin de diferentes ndoles. Adems, cada fase termina con un entregable que es el inicio de la siguiente fase. Los ciclos de vida de un proyecto generalmente se definen en funcin del trabajo tcnico que se debe realizar en cada etapa; cundo se deben generar los productos entregables en cada fase; cmo se revisa, verifica y valida cada producto entregable; y quin est involucrado en cada fase para controlar y aprobar cada una de ellas. En la Figura 1-6 se presenta una comparacin de ciclos de vida de proyectos de software [McGilvray, 2007].

Typical Project Life Cycle Rational Project Process (RUP)

Justification

Planning

Requirements and Analysis

Design

Development and Testing

Deployment

Post Production Support

Inception

Elaboration

Construction

Transition

RUP Modified Siebel eRoadmap Implementation Methodology Accelerated SAP Methodology (ASAP) Oracle Application Integration Methodology (AIM)

Inception

Elaboration

Construction

Transition

Operational Support

Define

Discover

Design

Configure

Validate

Deploy

Sustain

Project Preparation

Business Blueprint

Realization

Final Preparation

Go-Live and Support

Definition

Operations Analysis

Solution Design

Build

Transition

Production

Figura 1-6 Ciclos de vida de proyectos de software

Las fases siguen una secuencia lgica que asegura una adecuada definicin del producto del proyecto [Charvat, 2003]. Se debe diferenciar entre los objetivos del proyecto y los objetivos del producto, servicio o resultado que dicho proyecto entrega [PMBOK, 2004]. Objetivos del proyecto: son aquellos asociados a los parmetros de tiempo (programa), costo (presupuesto y flujo de gastos) y calidad (aseguramiento de la calidad de los procesos) y otros que se definan en el contrato. Objetivo del producto, servicio o resultado: son aquellos asociados a los requerimientos del Cliente y especificaciones tcnicas que definen el producto, servicio o resultado a entregar.

15

2.1.2 reas de conocimiento para la gestin de proyectos Los grupos de procesos actan recprocamente el uno con el otro y con los procesos de otras reas del conocimiento (tcnicos y de gestin). Generalmente cada proceso ocurre por lo menos una vez en cada fase del proyecto [Charvat, 2003], [Phillips, 2004] y [PMBOK, 2004]. 1. Alcance (iniciacin, planificacin y definicin; verificacin - control de cambios). Involucra los procesos necesarios para asegurar que el proyecto incluye todo el trabajo requerido, y slo el trabajo requerido para completar el proyecto exitosamente. 2. Tiempo (definicin -secuenciamiento- desarrollo cronograma- estimacin duracin de actividades; control del cronograma). Involucra los procesos requeridos para asegurar el oportuno trmino del proyecto. 3. Costos (planificacin recursos- estimacin- asignacin del presupuesto; control de costos). Involucra los procesos requeridos para asegurar que el proyecto es completado dentro del presupuesto aprobado. 4. Calidad (planificacin, aseguramiento, seguimiento y control). Involucra los procesos requeridos para asegurar que el proyecto cumpla los objetivos para los cuales fue emprendido. 5. Recursos humanos (planificacin organizacin y asignacin personal; desarrollo del equipo). Involucra los procesos que organizan y dirigen el equipo del proyecto. 6. Comunicaciones (planificacin, distribucin de informacin, informes de realizacin, cierre administrativo). Involucra los procesos relacionados con la generacin, recoleccin, distribucin, almacenamiento y disposicin final de la informacin del proyecto, en tiempo y forma. 7. Riesgos (planificacin de la gestin (identificacin, anlisis cualitativo y cuantitativo, plan de respuesta; supervisin y control). Involucra los procesos relacionados con la gestin de riesgos del proyecto. 8. Adquisiciones (planificacin-peticin ofertas, -seleccin proveedores- administracin del contrato; conclusin del contrato). Involucra los procesos requeridos para comprar o adquirir bienes, servicios o resultados, as como para contratar procesos de direccin. 9. Integracin (Desarrollo, ejecucin del plan, control integrado de cambios). Involucra los procesos requeridos para asegurar que los distintos elementos del proyecto estn adecuadamente coordinados.

16

2.1.3 Framework para la gestin de proyectos Dentro de cada proceso, las herramientas y las tcnicas, tales como juicio experto, dirigen e influyen las salidas de un proceso. Una salida deficiente influenciar probablemente todos los procesos hacia atrs negativamente. Los procesos de un proyecto se pueden modificar para cumplir con los requisitos particulares y para resolver las necesidades y las demandas del proyecto. Algunos procesos podran no ser considerados para mejorar las condiciones de integracin y los requisitos de un proyecto dado. A veces, un proceso se puede quitar de un proyecto. Un proceso que no se termina no significa necesariamente que no era necesario [PMBOK, 2004] y [Phillips, 2004].
Process Groups Knowledge Areas PM Processes
Plan Development Plan Execution Change Control

Project Integration Management

Initiating

Project Scope Management Project Time Management Project Cost Management

Planning

Executing

Project Quality Management Project Procurement Management

Quality Planning Quality Assurance Quality Control

Controlling

Project Communications Management Project Risk Management Project Human Resource Management
Organization Planning Staff Acquisition Team Development

Closing

Time
Figura 1-7 Framework para la gestin de proyectos

2.1.4 Elementos crticos en la gestin de proyectos La metodologa de PMBOK describe un conjunto de prcticas generalmente aceptadas por los expertos y que utilizan para la gestin de todo tipo de proyectos, incluyendo el desarrollo de software y el despliegue de proyectos [PMBOK, 2004]. Esta metodologa define un proyecto como Un esfuerzo temporal emprendido para crear un nico producto o servicio. Y la gestin de proyecto como La aplicacin de conocimientos, habilidades, herramientas y tcnicas a las actividades de un proyecto para responder a sus requerimientos. En forma resumida se puede decir que el PMBOK se estructura en grupos lgicos de gestin de proyectos, donde una dimensin describe reas de conocimiento mientras que en la otra se describen los 39 procesos de gestin de
17

proyectos organizados en cincos grupos de procesos. Una de las caractersticas de esta metodologa es que en ella cada rea de conocimiento describe conocimientos y prcticas de gestin de proyectos en trmino de uno o ms procesos, a su vez, cada proceso se describe en trminos de entradas, salidas, herramientas y tcnicas. Las entradas y salidas son documentos y las herramientas y tcnicas son mecanismos aplicados a las entradas para crear salidas. PMBOK no prescribe un ciclo de vida especfico para los proyectos, slo seala que el ciclo de vida de un proyecto se puede dividir en fases, de acuerdo a su alcance y dominio de aplicacin. Un elemento que complica a las metodologas para la gestin de proyectos diferentes de PMBOK es que ellas se orientan a un slo proyecto, sin tomar en cuenta que muchos otros proyectos de la organizacin compiten por los mismos recursos y atencin. Adicionalmente, de acuerdo al anlisis y revisin realizado previamente, estas metodologas en general son abstractas y de alto nivel, no contienen la suficiente narrativa, no son funcionales ni se adaptan a las reas operacionales, ignoran los estndares de la industria y las buenas prcticas, lucen impresionantes pero les falta integracin con el negocio, utilizan terminologas no estndares, compiten por recursos similares sin orientarse al problema, no tienen mtricas de rendimiento y son difciles de completar debido a la burocracia y administracin. Una metodologa adecuada para la gestin de proyectos debe proveer a los administradores de proyectos de la organizacin de una perspectiva del framework para la gestin de proyectos y las metodologas presentes en la misma. La implantacin exitosa de una metodologa de gestin de proyecto es en s un proyecto y la parte ms difcil es hacerla parte de la cultura organizacional, ya que no basta con que toda la organizacin comience a utilizar una nueva metodologa simplemente pegando las planificaciones a un muro y esperando los resultados. La implantacin de una metodologa puede tomar meses. Muchos ciclos de vida de los proyectos requieren: Automatizacin y flujos de trabajo, facilidades de uso, apropiada metodologa de documentacin, y la aceptacin de toda la organizacin. Uno de los pasos ms importantes para una exitosa a implantacin de una metodologa para la gestin de proyectos es la planificacin y las siguientes preguntas pueden permitir orientar una buena implantacin en la etapa de la planificacin: Conseguiremos agregar valor con esta metodologa? Cmo construimos las competencias del proyecto? Los procesos de gestin de proyecto y las prcticas son los apropiados? Hemos elegido la metodologa correcta? Es lo bastante flexible para cualquier tamao del proyecto? Como la organizacin aprende y mejora continuamente desde la metodologa?

18

Podremos medir los beneficios del proyecto? Cmo los sabemos? Obtenemos una productividad ptima durante el ciclo de vida? Los expertos en gestin de proyectos sugieren tener una cierta modestia antes de poner en marcha la metodologa y ellos se preguntan Quin puede hablar autoritariamente en todos los asuntos que conciernen a la implantacin de la metodologa de proyecto?. Respecto al punto anterior, ellos argumentan que el ciclo de vida del proyecto distingue a un proyecto de un no-proyecto y que para comprender las disciplinas genricas de gestin de proyectos, los administradores de proyectos y los ejecutivos deben tratar con todos los asuntos que afectan a las etapas de ciclo de vida en todo tipo de proyectos. Por lo tanto ello ser un reto que requiere de anlisis y entendimiento y mantener una visin conceptual coherente de las disciplinas que a este nivel es difcil. La utilizacin de un framework para la gestin de proyecto permite que la gestin de proyectos opere y flucte de organizacin en organizacin donde un proyecto siga la cultura y practicas esperadas de la organizacin y opere para entregan soporte a la organizacin y sus propsitos. Asimismo, un proyecto debera seguir una secuencia lgica de fases hasta completarse. Las fases son diferentes de proyecto a proyecto ya que el trabajo del proyecto se diferenciar de uno al siguiente. El proyecto se debera segmentar en fases para tener secciones ms pequeas, manejables y proporcionar entregables para apoyar las operaciones continuas. Al conjunto de fases del proyecto (como un todo) se le denomina el ciclo de vida del proyecto y este define el comienzo, medio y termino de un proyecto. En las fases iniciales, un proyecto tiene ms riesgos e incertidumbres, es ms susceptible a cambios, fallas e influencias de los stakeholder. Estos stakeholders son individuos, negocios o comunidades que tienen un inters en el logro del proyecto. Tpicamente, estn involucrados en el proceso del proyecto y sus expectativas conducen los requerimientos del proyecto. Es esencial explorar los stakeholder tempranamente en el ciclo de vida del proyecto para eliminar la necesidad de cambios cuando el stakeholder se incluya ms tarde en el proyecto. Los costos y demandas de recursos alcanzan son mnimos al inicio y alcanzan su peak al final del trabajo del proyecto, para luego disminuir. Un elemento fundamental que aparece en la gestin de proyectos es la estructura organizacional, la que influye directamente a lo largo del proyecto ya que determina los procedimientos que debe seguir el administrador de proyectos y el nivel de autoridad (poder) que posee. Similarmente, un administrador de proyectos debe considerar las influencias sociales, econmicas y ambientales y debe tener orientacin externa de estas reas (estndares y regulaciones). Los estndares son pautas que generalmente se siguen pero no son impuestas. Las regulaciones son leyes y demandas de la industria, que son impuestas por los gobiernos.

19

2.2

Gestin de Proyectos de Software

Muchas organizaciones desean estandarizar sus prcticas de ingeniera de software [Luckey, 2006] y [Booch et al, 1998] al igual que sus prcticas en gestin de proyectos [Phillips, 2004]. El Rational Unified Process o RUP [RationalUnifiedProcess, 2007], presenta un enfoque prescriptivo para la estandarizacin de las mejores prcticas de la ingeniera de software, y el Project Management Institute (PMI) Guide to the Project Management Body of Knowledge [PMBOK, 2004] ofrece un enfoque descriptivo para estandarizar las mejores prcticas en la gestin de proyectos en una organizacin. Esencialmente RUP se enfoca en las mejores prcticas de la gestin de proyectos en el contexto del desarrollo del software y del despliegue de proyectos; mientras que las mejores prcticas del PMBOK son genricas y aplicables para la gestin de proyectos en cualquier domino de aplicacin desde el desarrollo de un proyecto de data mining hasta la implementacin de nuevos procesos de negocios en una organizacin. As, desde la perspectiva de un dominio de aplicacin, la disciplina de gestin de proyectos del RUP es una instancia especifica de las mejores prcticas de la gestin de proyectos del PMBOKs, [ePMbook, 2007].

Figura 1-8 Rational Unified Process

Las mejores prcticas en la gestin de proyectos del RUP identificadas en [Charbonneau, 2004] son aquellas presentadas en la disciplina Project Management (PM) del RUP (ver Figura 1-8); otras mejores prcticas ms o menos relacionadas al PM se describen en las otras disciplinas de RUP (tales como en el modelamiento del
20

negocio, anlisis y diseo de requerimientos, implementacin, pruebas, despliegue, ambiente y administracin de configuracin y cambios). 2.2.1 Descripcin de RUP RUP es un proceso de ingeniera de software, que describe quin hace qu, cundo y cmo en el desarrollo de software y el despliegue del proyecto [Rational Unified Process, 2007]. Este proceso tiene la caracterstica de ser conducido por los casos de uso, se centrada en la arquitectura, se conduce por los riesgos [Ravindranath, 2007], y es iterativo. En el desarrollo de un proyecto guiado mediante RUP [Ambler et al., 2005], los requerimientos funcionales estn expresados en forma de casos de uso, los que conducen al desarrollo de una arquitectura ejecutable de aplicaciones. Por lo tanto, el proceso focaliza los esfuerzos del equipo en la construccin de los comportamientos ms importantes y los elementos estructurales de las aplicaciones (es decir, lo elementos de la arquitectura), antes de construir los elementos menos importantes. La disminucin de los elementos de riesgos importantes conduce a una definicin temprana del mbito y de las primeras iteraciones de su ciclo de vida. Por ltimo, RUP realiza particiones del ciclo de vida del desarrollo de software en iteraciones que producen versiones incrementales ejecutables del software. RUP implementa las siguientes mejores prcticas de ingeniera de software [Kroll, 2003] y [RationalUnifiedProcess, 2007]: 1. Desarrollo iterativo 2. Gestin de requerimientos 3. Uso de arquitecturas componentes 4. Modelamiento visual 5. Calidad continuamente verificable 6. Gestin de cambio 2.2.2 Dimensiones y disciplinas de RUP RUP implementa las mejores prcticas, presentadas anteriormente, en un proceso de bidimensional. Una dimensin describe Disciplinas mientras que la otra dimensin describe Fases dentro del ciclo de vida de los procesos (ver Figura 1-8). Las disciplinas RUP representan roles individuales, para los miembros o subgrupos dentro de equipo de desarrollo. Las disciplinas son: Modelamiento del negocio, requerimientos, anlisis y diseo, implementacin, pruebas, despliegue, gestin de proyecto, mbito, gestin de la configuracin y cambios [RationalUnifiedProcess, 2007].

21

Requerimientos
Planeamiento

Anlisis y Diseo
Administracin Del Ambiente Implementacin

Organized by
Discipline

Planeamiento Inicial

Evaluacin Distribucin

Prueba

Software Engineering Process

Concepts

Activity

Work Guideline

in

out

Role Workflow
Described by

Tool Mentor Artifact

Workflow Details

Artifact Guideline

Checkpoints

Template

Report

Figura 1-9 Roles, actividades y artefactos

La Figura 1-9, grafica los roles, artefactos y actividades y adems otros elementos complementarios de RUP [RationalUnifiedProcess, 2007]. Dentro de RUP, cada disciplina se expresa en trmino de roles (quien desarrolla la tarea), actividades (como ellos desarrollan las tareas) y artefactos (que actividades se realizar). Un rol define el comportamiento y las responsabilidades de un individuo o un grupo de individuos, responsables de las actividades y los artefactos. Una actividad es una tarea de la cual un rol es responsable y se puede solicitar su desarrollo. Estas tambin describen los pasos requeridos para crear o actualizar uno o muchos artefactos. Un artefacto es una entrada y/o salida a una actividad [Ambler et al., 2005]. Otros elementos complementarios a los tres primordiales son aquellos, tales como conceptos, guas de trabajo, gestores de herramienta, reportes, guas de artefactos, plantillas y puntos de control.

22

2.2.3 Ciclo de vida de RUP El ciclo de vida de RUP es iterativo, y las dimensiones de su ciclo de vida se dividen en cuatro fases: Concepcin, Elaboracin, Construccin y Transicin. Cada fase tiene una clara definicin de un conjunto de objetivos y trminos con hitos principales. Los hitos al final de cada fase son: 1. Objetivo del ciclo de vida en el final de la Concepcin. 2. Arquitectura del ciclo de vida en el final de la Elaboracin. 3. Capacidad operacional inicial en el final de la Construccin. 4. Lanzamiento del producto en el final de la Transicin. El objetivo de la Concepcin es definir el alcance del proyecto; El de la Elaboracin es construir una arquitectura ejecutable para la aplicacin. El de la Construccin es dar forma a lo que ser sostenido por estructura de la arquitectura completando la mayora de las capacidades y caractersticas de la aplicacin. Y finalmente, el objetivo de la Transicin es entregar la aplicacin a los usuarios finales. A su vez, cada fase de RUP se divide en iteraciones, cada una de las cuales finaliza con un hito menor. 2.2.4 Disciplina de gestin de proyectos de RUP De las disciplinas del RUP sealadas anteriormente, son de mayor inters aquellas relacionadas a las disciplinas de Project Management (PM). RUP define su disciplina de gestin de proyecto de software como el arte de balancear los objetivos contrapuestos, la gestin del riesgo, y la superacin de apremios y restricciones para la entrega exitosa de un producto que cumpla las necesidades de los clientes (que son aquellos que han solicitado el desarrollo del software) y de los usuarios del software. La disciplina de gestin de proyecto de RUP provee: Un marco para la gestin de proyectos orientados al desarrollo de software; guas prcticas para la planificacin, direccin de personal, ejecucin, monitoreo y supervisin de proyectos; adems, provee un marco para la gestin de riesgos. Esta disciplina est enfocada principalmente en los aspectos ms importantes de un proceso de desarrollo iterativo: gestionar los riesgos; planificar un proyecto iterativo, en todo su ciclo de vida y para cada una de las iteraciones en particular; supervisar el progreso de un proyecto iterativo, y sus mtricas. 2.2.5 Elementos crticos en la gestin de proyectos de software La gestin de proyectos de software ha utilizado en los ltimos aos el framework RUP que es una metodologa de proyectos adaptable utilizada por las organizaciones para el desarrollo de software. Los procesos derivados pueden ser muy livianos y hasta muy
23

complejos para grandes proyectos. Esta metodologa promete aumentar la productividad del equipo y proveer las mejores prcticas de desarrollo de software para el equipo del proyecto, mediante un conjunto de componentes (pautas, plantillas y las mejores prcticas de miles de proyectos de desarrollo) para el desarrollo de proyectos rpidos y entregables de calidad. El framework lo componen 4 fases, 8 iteraciones (mnimas), 9 flujos de trabajo, 57 actividades, 270 actividades detalladas (aproximadamente), 114 artefactos y 38 roles (hasta 38 personas). Una de las caractersticas relevantes de RUP es que provee una terminologa comn para el equipo de proyecto.
Rational Unified Process (RUP) Software Life Cycle
Workflow
Project Management
1. Conceive new project 2. Evaluate project scope and risk 3. Develop software 4. development plan 5. Monitor and control 6. project 7. Plan for next iteration 8. Manage iteration 9. Close out phase 10.Close out project

Environment
1. Prepare environment for project 2. Prepare environment for an iteration 3. Prepare guidelines for an iteration 4. Support environment during an iteration

Configuration And Change Management


1. Plan project configuration and change control 2. Create a project configuration management environment 3. Change and deliver configuration items 4. Manage baselines and releases 5. Monitor and report configuration status 6. Manage change requests

Business Modeling
1. Assess business status 2. Describe current business 3. Identify business processes 4. Refine business process definitions 5. Design business process realizations 6. Refine roles and responsibilities 7. Explore process automation 8. Develop a domain modeling
1. 2. 3. 4. 5. 6. Support specifications Business glossary Business rules Business use case model Business object model Target organization assessment 7. Business vision 8. Business architecture document 9. Supplementary business specification 10.Business use case 11.Business use case realization 12.Organization unit 13.Business entity 14.Business worker 15.Business modeling guidelines 16.Review record 17.Analysis model 1. 2. 3. 4.

Requirements
1. Analyze the problem 2. Understand stakeholder needs 3. Define the system 4. Manage the scope of the system 5. Refine the system definition 6. Manage changing requirements

Analysis and Design


1. Define a candidate architecture 2. Refine the architecture 3. Analyze behavior 4. Design components 5. Design real time components 6. Design the database 7. Perform architectural synthesis

Implementation
1. Structure the implementation model 2. Plan the integration 3. Implement components 4. Integrate each subsystem 5. Integrate the system 1. 2. 3. 4.

Test
Plan test Design test Implement test Execute tests in integration test stage 5. Execute tests in system test stage 6. Evaluate test 1. 2. 3. 4. 5. 6.

Deployment
Plan deployment Develop support material Manage acceptance tests Produce deployment unit Package product Provide access to download site 7. Beta test product

Activity (57)

Artifact (117)

1. Test plan 2. Software architecture document 3. Iteration assessment 4. Business case 5. Software development plan 6. Iteration plan 7. Problem resolution plan 8. Risk management plan 9. Product acceptance plan 10.Measurement plan 11.Work order 12.Status assessment 13.Project measurements 14.Review record 15.Requirements Attributes 16.Vision 17.Risk list 18.Change requests

1. Development case 2. Development organization assessment 3. Project specific templates 4. Manual style guide 5. Use case modeling guidelines 6. Requirements management plan 7. Business modeling guidelines 8. User interface guidelines 9. Test guidelines 10.Design guidelines 11.Programming guidelines 12.Tools 13.Tool support assessment 14.Tool guidelines 15.Support environment

1. Project measurements 2. Deployment unit 3. Configuration audit findings 4. Configuration management plan 5. Project repository 6. Change request 7. Workspace (integration) 8. Work order (completed) 9. Workspace (development)

1. Software architecture document 2. Requirements management plan 3. Stakeholder requests 4. Glossary 5. Vision 6. Use case model 7. Supplementary specifications 8. Use case 9. Software requirements specification 10.User interface prototype 11.Use case storyboard

1. Component 2. Reference architecture 3. Software architecture document 4. Use case realization 5. Analysis model 6. Design model 7. Design subsystem 8. Design package 9. Design class 10.Interface 11.Capsule 12.Protocol 13.Data model 14.Deployment model 15.Integration build plan 16.Test component

1. Integration build plan 2. Component 3. Implementation subsystem 4. Software architecture document 5. Integration build plan 6. Test component

1. Change requests 2. Test plan 3. Test model 4. Test case 5. Test procedure 6. Test script 7. Test class 8. Test packages 9. Test component 10.Test subsystem 11.Test results 12.Test evaluation summary 13.Workload analysis document

1. Installation component 2. End-user artifacts 3. Support material 4. Deployment plan 5. Release notes 6. Bill of materials 7. Training material 8. Test results 9. Change request 10.Development infrastructure 11.Deployment unit 12.Product

1. Project manager

Worker (38)

1. 2. 3. 4. 5. 6. 7. 8. 9.

Process engineer Technical writer System analyst Business process analyst User interface designer Test designer Architect Tool specialist System administrator

1. 2. 3. 4.

Configuration manager System integrator Change control manager Project member

Business process analyst 1. System analyst Business designer 2. Use case specifier Stakeholders 3. User interface designer Business reviewer

1. 2. 3. 4.

Architect Designer Database designer Capsule designer

1. 2. 3. 4.

Architect System integrator Code reviewer Implementer

1. 2. 3. 4.

Test designer Designer Implementer Tester

1. 2. 3. 4. 5.

Implementer Technical writer Deployment manager Graphic artist Course developer

Figura 1-10 Ciclo de vida de RUP

RUP define la gestin de proyectos de software como el arte de balancear los objetivos, administrar riesgos y superar restricciones para entregar un producto que cumpla con las necesidades de los clientes y usuarios Sin embargo estn fuera del alcance de RUP los siguientes temas de gestin de proyectos: Administracin de RRHH (Contrataciones, capacitacin, entrenamiento) Administracin de presupuestos (definicin, destinos y otros) Administracin de Contratos (con proveedores y clientes) Para una correcta utilizacin de RUP, primero se debe determinar los requerimientos del entorno de gestin de proyectos de la organizacin, y luego decidir los cambios posibles de realizar.

24

2.3

Gestin de Proyectos de Data Mining

2.3.1 Metodologa CRISP-DM La metodologa de Data Mining CRISP-DM que est definida en trminos de un modelo jerrquico de procesos, consiste de un conjunto de tareas descritas en 4 niveles de abstraccin (desde lo general a los especifico): Fases, Tareas Genricas, Tareas Especializadas e Instancias de procesos (ver Error! No se encuentra el origen de la referencia.)

Figura 1-11 Metodologa Data Mining CRISP-DM

En el nivel superior, el proceso de Data Mining se organiza en cuatro fases, cada una de ellas comprende varias tareas genricas de segundo nivel. Este segundo nivel es llamado genrico porque pretende ser lo ms amplio posible de manera que cubra una vasta gama de situaciones de Data Mining. A su vez las tareas deben ser lo ms completas y estables posible. Completa significa que cubre el proceso entero de Data Mining y todas las posibles aplicaciones de Data Mining. Estable significa que el modelo debe ser vlido aun para desarrollos inesperados como nuevas tcnicas de modelamiento. El tercer nivel comprende las tareas especializadas, se describen como las acciones de las tareas genricas se deben efectuar en situaciones especficas. Por ejemplo, en el segundo nivel puede haber una tarea llamada limpiar datos, en cambio en el tercer nivel se describe como esta tarea se lleva a cabo en diferentes situaciones, tales como limpiar valores numricos versus limpiar valores categricos o si el tipo de problema es clustering o modelamiento predictivo.

25

La descripcin de fases y tareas como pasos discretos efectuados en orden especfico representa una secuencia idealizada de eventos. En la prctica, muchas de las tareas pueden llevarse a cabo en distinto orden y a menudo ser necesario volver atrs repetidamente a las tareas previas (backtracking) y repetir ciertas acciones. Este modelo de proceso no intenta capturar todas las posibles rutas a travs del proceso de Data Mining, porque esto requerira un modelo de procesos demasiado complejo. El cuarto nivel, la instancia de los procesos, es un registro de acciones, decisiones y resultados del contrato actual de Data Mining. Una instancia de proceso es organizada de acuerdo a las tareas definidas en los niveles superiores, pero grafica que est ocurriendo realmente en un compromiso en particular, ms que lo que pasa en general. En el modelo de referencia y gua de usuario, considerado en a metodologa CRISP-DM distingue entre el modelo de referencia y la gua de usuario. El modelo de referencia presenta una visin general de las fases, tareas y sus salidas y describe que hacer en un proyecto de data mining. Por el contrario la gua de usuario es ms detallada, y da consejos para cada fase y cada tarea dentro de una fase y adems explicita como hacer un proyecto de Data Mining. Este documento cubre, para el modelo de referencia y la gua de usuario, hasta el nivel genrico. 2.3.2 Mapeo desde el modelo genrico al especializado El contexto de Data Mining conduce a un mapeo entre el nivel genrico y el especializado en CRISP-DM. Actualmente, se distinguen cuatro diferentes dimensiones de contextos de data mining: El dominio de la aplicacin es el rea especfica de cmo toma lugar un proyecto de data mining. El tipo de problema de data mining describe las clases especificas de objetivos que el proyecto debe tratar. Los aspectos tcnicos cubren temas especficos en data mining que describen diferentes desafos (tcnicos) que usualmente ocurren durante data mining. Las dimensin de las herramientas y tcnicas, especifica que herramientas de data mining y/o tcnicas sern aplicadas durante el proyecto. Mapeo con contexto Se distinguen dos tipos de mapeos entre los niveles genricos y especializados en CRISP-DM: Mapeo para el presente

26

Si slo se aplica el modelo genrico de proceso para realizar un nico proyecto de data mining y se intenta mapear las tareas genricas y sus descripciones como lo requiere el proyecto; se trata entonces de un solo mapeo para un probable un uso nico. Mapeo para el futuro Si sistemticamente se especializa el modelo genrico de proceso de acuerdo a un contexto pre-definido (o sistemticamente se analiza y consolida experiencias de un proyecto para especializar un modelo de procesos que se podra utilizar a futuro en contextos comparables) se esta tratando explcitamente de escribir un proceso especializado en trminos de CRISP-DM. Cual sea el tipo de mapeo ms apropiado para sus propsitos, depender de su contexto de data mining y las necesidades de la Organizacin. Cmo mapear? La estrategia bsica para mapear el modelo de proceso genrico a nivel especializado es el mismo para ambos tipos de mapeo y comprende: Analizar su contexto especfico. Remover cualquier dato no aplicable en su contexto. Agregar cualquier detalle especfico a su contexto. Especializar (o instanciar) contextos genricos de acuerdo a las caractersticas concretas de su contexto. Posiblemente redefinir los contenidos genricos para entregar significados ms explcitos en su contexto por el bien de la claridad.

2.3.3 Modelo de referencia CRISP-DM El modelo de proceso actual para data mining entrega una visin general del ciclo de vida de un proyecto de data mining. Contiene las fases de un proyecto, sus tareas respectivas y relaciones entre estas. En este nivel de descripcin, no es posible identificar todas las relaciones que pueden existir entre las tareas de data mining, dado que dependen de las metas, el background y los intereses de los usuarios y en especial de los datos.

27

Figura 1-12 Fases de un proceso de Data Mining

El ciclo de vida de un proyecto de data mining comporta 6 fases. La Figura 1-12 muestra que las fases de un proceso de data mining no son secuenciales, dado que se requiere una movilidad de avance y retroceso entre las diferentes fases. Depende de los resultados de cada fase, la definicin de que fase o que tarea en particular de cada fase se realizar a continuacin. Las flechas indican las dependencias ms importantes y frecuentes entre las fases. El circulo externo en la figura, simboliza la naturaleza cclica de data mining. Data mining no es slo una simple solucin lineal. Las lecciones aprendidas durante el proceso y la solucin pueden gatillar nuevas preguntas enfocadas al negocio. Subsecuentemente, el proceso de data mining traer beneficios provenientes de experiencias de otros proyectos. En las siguientes lneas se describe cada fase brevemente: Business understanding Esta fase inicial se enfoca en el entendimiento del los objetivos del proyecto y los requerimientos, desde una perspectiva de negocio, luego se convierte este conocimiento en una definicin de problema de data mining y un plan preliminar diseado para alcanzar estos objetivos.

28

Data understanding La fase de data understanding comienza con una recoleccin inicial de los datos y contina con actividades de familiarizacin de los mismos, a fin de: identificar los problemas de calidad de los datos; revelar los primeros descubrimientos en los datos o detectar subconjuntos interesantes; y formar hiptesis de posible informacin oculta. Data preparation La fase de data preparation cubre todas las actividades de construccin del conjunto final de datos (datos que se utilizarn en la herramienta de modelamiento) a partir de los datos originales. Las tareas de data preparation pueden realizarse muchas veces y no en un orden prescrito. Las tareas incluyen seleccin de tablas, registros y atributos; junto con transformacin y limpieza de datos para las herramientas de modelamiento. Modeling En esta fase, varias herramientas de modelamiento son seleccionadas y aplicadas, y sus parmetros se ajustan para valores ptimos. Tpicamente, hay muchas tcnicas para el mismo tipo de problema de data Mining, algunas de ellas tienen requerimientos especficos en la forma de los datos; por eso, a veces es necesario volver a la fase de data preparation. Evaluation En esta etapa del proyecto se ha construido un modelo (o modelos) de aparente alta calidad desde la perspectiva del anlisis de los datos. Antes de comenzar el deployment final del modelo, es importante evaluar y revisar los pasos ejecutaros para construir el modelo que busca alcanzar los objetivos del negocio. Un objetivo clave es determinar si hay temas de negocio importantes que no han sido considerados. Al final de esta fase, se tomar una decisin de cmo emplear los resultados de data mining. Deployment Generalmente la creacin del modelo no es el fin del proyecto, aunque el propsito del modelo es incrementar el conocimiento de los datos, el conocimiento ganado se debe organizar y presentar de una forma que el cliente pueda usarlo. A veces involucra la aplicacin de modelos vivos, dentro los procesos de toma de decisiones de la organizacin, por ejemplo, una personalizacin en tiempo real de un sitio Web. Sin embargo, dependiendo de los requerimientos, la fase de deployment puede ser tan simple como la generacin de un reporte o tan compleja como la implementacin de un proceso de data mining repetible en la empresa. En muchos casos, es el cliente, no el analista de datos, quien lleva a cabo los pasos de deployment. Sin embargo, aunque el analista no lleve a cabo el deployement, es importante que el cliente entienda que acciones debe ejecutar para hacer uso de los modelos creados. En la tabla siguiente se presenta el resumen de las tareas genricas y salidas del modelo de referencia CRISP-DM.

29

Business Understanding
Determine Business Objectives Background Business objectives Business success criteria
Assess Situation Inventory of resources Requirements, assumptions & constraints Risks & contingencies Terminology Costs & benef its

Data Understanding
Collect Initial Data Initial data collection report Describe Data Data description report
Explore Data Data exploration report

Data Preparation
Data set Data set description Select Data Rationale f or inclusion/ exclusion
Clean Data Data cleansing report

Modelling
Select Modelling Techniques Modelling technique Modelling assumptions Generate Text Design Text design Build Model Parameter settings Models Model description
Assess Model Model assessment Revised parameter settings

Evaluation
Evaluate Results Assessment of Data Mining results w.r.t. Business Success Criteria Approved models
Review Process Review of process

Deployment
Plan Deployment Deployment plan Plan Monitoring and Maintenance Monitoring & maintenance plan Produce Final Report Final report Final presentation
Review Project Experience documentation

Verify Data Quality Data quality report

Construct Data Derived attributes Generated records


Integrate Data Merged data

Determine Next Steps List of possible actions Decision

Determine Data Mining Goals Data Mining goals Data Mining success criteria
Produce Project Plan Project Plan Initial assignment of tools & techniques

Format data Ref ormatted data

Tabla 1-2 Tareas genricas y salidas del modelo de referencia CRISP-DM

Conclusiones

3.1.1 En relacin a la gestin de proyectos de data mining La gestin de proyectos es un rea de creciente inters para los acadmicos y profesionales del rea tecnolgica, sin embargo aun existen muchas dificultades para lograr una gestin exitosa de proyectos [Schwalbe, 2007]. En este sentido es innegable el aporte a la sistematizacin de la disciplina de gestin de proyectos de la metodologas PMBOK [PMBOK, 2004] la que se ha constituido en el marco de referencia y estndar para la gestin integral de proyectos. Data Mining es un proceso creativo que requiere de un nmero significativo de diferentes habilidades y conocimientos. Aunque actualmente se asocia la metodologa CRISP-DM con la gestin de proyectos de Data Mining, esta presenta problemas para gestionar integralmente los proyectos. Por lo anterior, es posible decir que no hay un framework estndar para desarrollar este tipo de proyectos, que el xito o fracaso de un proyecto depende altamente de la persona que lo lleva a cabo, y que su prctica exitosa no necesariamente es repetible en la organizacin. Es posible decir tambin que un proceso de Data Mining exitoso requiere una metodologa y una efectiva gestin del proyecto, y que esto va a depender de la mezcla apropiada de herramientas y analistas expertos. El reto para este trabajo es proponer un framework unificado para la gestin de proyectos de data mining, cuyo proceso sea altamente creativo e iterativo, y que posea mltiples actividades paralelas. Lo anterior se fundamenta en las fallas que se han

30

producido en la gestin de proyectos de Data Mining al utilizar la metodologa CRISPDM. Algunas de estas fallas son: A veces los expertos en Data Mining obvian las fases de planificacin y documentacin (porque consumen mucho tiempo). Se presentan fallas de comunicacin entre los miembros del equipo debido a que se basan en falsos supuestos para realizar el trabajo o porque re-hacen algo que estaba hecho. Existen dificultades para trabajar con el modelo genrico propuesto por CRISPDM. Las fases no son estrictamente secuenciales. Con CRISP-DM no resulta fcil evaluar la personas, los plazos y costos del proyecto Sin embargo, un punto a favor de CRISP es el modelo estructurado de documentacin (entregables) que propone y que resulta fcil escribir modelos de procesos especializados basados en checklist genricos. El reto en el trabajo futuro est en proponer una framework unificado para la gestin de proyectos de Data Mining cuyo proceso es altamente creativo, iterativo y que posee muchas actividades paralelas. . 3.1.2 Anlisis de metodologas hacia la gestin de proyectos de data mining Las metodologas analizadas en este trabajo presentan caractersticas diversas en su planificacin, organizacin, direccin, ejecucin, control y seguimiento. Asimismo, sus mbitos de aplicacin parecen ser diversos. A continuacin se caracterizan y comparan las metodologas principales analizadas en este estudio y se presentan los principales resultados y conclusiones. Problem resolution and fault-finding technique La identificacin de un problema en la gestin de proyectos de data mining requiere conocer las causas que lo originaron y a partir de ello es posible, entonces encontrar una solucin. Si este anlisis se realiza considerando los problemas que la literatura tradicionalmente asocia a los proyectos de data mining es posible identificar posibles soluciones. El cuadro siguiente (ver Figura 1-13) muestra como a partir de un conjunto de problemas mencionados los investigadores de gestin de proyectos surgen interesantes patrones que facilitan la identificacin de soluciones.

31

Problems Identified
Requirements not included Not a quality product Product does not work Too much maintenance

Caused by
Ineffective user requirements Poor testing Poor change control Waterfall approach (i.e. lengthy)

Solved by
Change control process Test plan User guides & documentation Iterative methodology

Difficult to use Performance is poor No user documentation Client wont accept product
Over schedule

Poor communications No user involvement Scope creep No documentation developed


Training

Service level agreements

Figura 1-13 Resolucin de problemas y la tcnica de fault-finding

El cuadro de la Tabla 1-3 identifica los elementos fundamentales para realizar una comparacin de las tres principales metodologas para la gestin de proyectos estudiadas en esta investigacin y clasifica las caractersticas de cada metodologa para cada elemento.
ELEMENTOS Tipo de Proyecto Project Lifecycle PMBOK Cualquier tipo de proyecto Dividido en fases. Tipicamente en 4 o 5, a veces ms de 9. El termino de cada fase esta dado por uno o ms entregables. RUP Proyectos de desarrollo de software Dividido en 4 fases. Cada una de ellas dividida en una o ms iteraciones, que incluyen actividades de todas las disciplinas en distinta intensidad. Cada iteracion produce una versin ejecutable del software, aplicacin o sistema. Hito mayor CRISP-DM proyectos de Data Mining Divido en 6 fases no secuenciales, se requiere que se pueda mover entre las diferentes fases. Dependiendo de las resultados de cada fase, se define que fase o que tarea en particular de cada fase se realizar despus. Se puede pasar de una fase a otra, no hay hitos de termino de fase. Salida(Output) Tareas genericas que deben ser instanciadas a un proyecto en particular. Para cada tarea se definen las salidas (output) y las actividades a realizar. Salida(Output) No existe un termino (hito) definitivo para cada fase, ya que es posible devolverse y volver a ejecutar una fase. Fase Secuencia entre fases.

End of Phase End of Phase Artifact Activity

Hito (Milestone)

Entregable Artefacto El proceso se describe en terminos de Las actividades se describe en terminos de entredas, salidas, herramientas y tecnicas. artefactos de entrada, artifactos resultantes y pasos con mentores de herramietnas y pautas. Entrada Artefacto de entrada Salida Artefacto resultante Salida de la fase, Stage Gates o Kill Point Revisin de los hitos del ciclo de vida

Input Artifact Output Artifact End of Phase Review

Structural Activity Grouping Temporal Activity Grouping

Area del Conocimiento Grupo de Procesos

Disciplina Workflow

Tabla 1-3 Mapeo de PMBOK, RUP, CRISP-DM

La Tabla 1-4, lista las areas de conocimiento del pmbok en comparacin con las disciplinas de RUP y las fases de Crisp-dm.

32

PMBOK Knowledge Area Project Integration Management

RUP Disciplines Project Management Requirements Deployment Configuration & Change Management Project Management Requirements Configuration & Change Management Project Management Project Management Project Management Configuration & Change Management

CRISP-DM Fases Business Understanding Evaluation Deployment Business Understanding

Project Scope Management

Project Time Management Project Time Management Project Quality Management

Project Human Resource Management Project Communications Management Project Risk Management Project Procurement Management

Project Management Project Management Project Management Requirements

Business Understanding Business Understanding Business Understanding Data Understanding Data Preparation Modeling Evaluation Business Understanding Business Understanding Evaluation Business Understanding Business Understanding

Tabla 1-4 Mapeo de procesos, disciplinas y fases

3.1.3 Tendencias en la gestin de proyectos de data mining Un Proyecto de Data Mining debe dirigir las actividades, tanto de gestin como tcnicas, involucradas en el proceso de transformacin de necesidades de conocimiento en patrones de Data Mining, para que el conocimiento aporte valor al proceso operacional o estratgico que lo requiera. Cabe destacar, que el valor del conocimiento depende en cada momento de la misin del rea de negocio al que pertenece el proceso dentro de la organizacin. Por lo tanto, se puede sealar que las actividades principales de un Proyecto de Data Mining involucran: 1. Descubrir los objetivos primordiales del rea de negocio en la que se enmarca el proyecto. 2. Establecer las actividades y las necesidades de conocimiento de esa rea en un particular momento del tiempo. Estos criterios nos permitirn evaluar los resultados obtenidos y en todo caso marcan el fin del proyecto. 3. Transformar las necesidades de conocimiento, en conocimiento a travs de un proceso de descubrimiento del mismo. Las tareas tcnicas involucradas en este proceso vienen descritas por Crisp-dm. 4. Identificar los factores de xito del Proyecto de Data Mining: requiere establecimiento de metas y de requisitos. Evaluar si las metas requieren de un proceso de gestin, que a lo largo del proyecto evale la factibilidad de

33

conseguir los resultados esperados. Esas actividades tienen que ser definidas, y son: validacin, verificacin entre otras. 5. Establecer secuencialidad en las tareas: definir el ciclo de vida para el proyecto que depender de las caractersticas del mismo en cada momento en particular.

El presente documento corresponde al trabajo tutelado cuyo objetivo es ir a desarrollo de una propuesta de tesis doctoral que denominaremos: Un framework unificado para la gestin de proyectos de data mining.

34

Referencias

[Ravindranath, 2007] C. Ravindranath Pandian, Appliend Software Risk Management: A guide for Software Project Manager, Auerbach, 2007. [Luckey, 2006] Teresa Luckey,PMP,MBA, and Joseph Phillips,PMP, Software Project Management for Dummies, Wiley Publishing, Inc., 2006. [Gua PMBOK, 2004] Project Management Institute, Inc., Gua de los Fundamentos de la Direccin de Proyectos, Tercera Edicin, Project Management Institute Inc., 2004 [Phillips, 2004] Joseph Phillips, PMP Project Management Professional Study Guide, McGraw-Hill, 2004. [PMBOK, 2004] Project Management Institute, Inc., A Guide to the Project Management Body of Knowledge (PMBOK Guide) - Third Edition. Project Management Institute, Inc., 2004. [Charvat, 2003] Jason Charvat, Project Management Methodologies: Selecting, Implementing, and Supporting Methodologies and Processes for Projects, John Wiley & Sons, Inc., 2003. [Wysocki, 2003] Robert K. Wysocki and Rudd McGary, Effective Project Management, Third Edition, John Wiley & Sons, Inc., 2003. [Charvat, 2002] Jason Charvat, Project Management Nation: Tools, Techniques, and Goals for the New and Practicing IT Project Manager, John Wiley & Sons, Inc., 2002. [Jalote, 2002] Pankaj Jalote, Software Project Management in Practice, Pearson Education, Inc., 2002. [Competency PMBOK, 2001] Project Management Institute Inc., Project Manager Competency Development Framework Exposure Draft, Project Management Institute, Inc., 2001. [WBS PMBOK, 2001] Project Management Institute Inc., Practice Standard for Work Breakdown Structures, Project Management Institute, Inc., 2001. [Hughes, 1999] Bob Hughes and Mike Cotterell, Software Project Management, Second Edition, McGraw-Hill, 1999. [Royce, 1998] Walker Royce, Software Project Management: A unified Framework, Addison-Wesley, 1998.

35

[PMBOK Guide, 2004] Project Management Institute, Inc (2004): A Guide to the Project Management Body of Knowledge (PMBOK Guide) - Third Edition. Four Campus Boulevard, Newtown Square, Pennsylvania USA, 2004 edition. [Russell, 2004] Russell D. Archibald, Project Management State of the Art - 2004, Fellow PMI and APM/IPMA, MSc, PMP PMB 90A, 521 Logan Ave., Laredo, TX 78040-6633 [Wysocki, 2003] Robert K. Wysocki, Ph.D. with contributions by Rudd McGary, Ph.D., PMP: Effective Project Management Traditional, Adaptive, Extreme. Third Edition, Published by Wiley Publishing, Inc., Indianapolis, Indiana, 2003. [Chapman, 2000] Pete Chapman, Julian Cliton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer and Rdiger Wirth: CRISP-DM: Step-by-Step. , 2000. [Charvat, 2002] Janson Charvat: Project Management Nation: Tools, Techniques and Goals for the New and Practicing IT Project Manager, John Wiley & Sons, Inc. 2002. [Kappelman, 2006] Leon A Kappelman; Robert McKeeman; Lixuan Zhang: EARLY WARNING SIGNS OF IT PROJECT FAILURE: THE DOMINANT DOZEN. Information Systems Management; Fall 2006; 23, 4; ABI/INFORM Global pg. 31 [McGilvray, 2007] Danette McGilvray; Data Quality and the Project Life Cycle; Granite Falls Consulting, Inc., Published: July 10, 2007, www.gfalls.com. [Wasilewska et al., 2007] Wasilewska, Menasalvas, E, Scharff, A model PM fro preprocessing and data Mining Proper Process. In Transaccin on Rouge Sets VI, pp 397-399, Springer-verlag Berlin Heidelberg [Fayyad et al., 1996] Fayyad, Piatetsky-Shapiro, Smyth, From Data Mining to Knowledge Discovery: An Overview, Advances in Knowledge Discovery and Data Mining, Fayyad, Piatetsky-Shapiro, Smyth, Uthurusamy, editors, AAAI Press / The MIT Press,Menlo Park, CA, 1996, pp.1-34. [Piatetsky-Shapiro, 2007] Gregory Piatetsky-Shapiro, Data mining and knowledge discovery 1996 to 2005: overcoming the hype and moving from university to business and analytics. Published online: 27 January 2007, Springer Science+Business Media, LLC 2007. [Ingebretsen, 2003] Ingebretsen, M. (2003) Mining for Gold, Using data resources to meet key corporates objetives and Launch, PM Network, pp. 29 -34 [KDnuggets, 2007] Portal www.gartner.com [en http://www.gartner.com/ [Consulta: 20 de agosto de 2007]. lnea] disponible en:

[Louie, 2003] Jen Que Louie, President of Nautilus Systems, Inc. (www.nautilussystems.com), testimony before the U.S. House of Representatives Subcommittee on

36

Technology, Information Policy, Intergovernmental Relations, and Census, Congressional Testimony, March 25, 2003. [Larose, 2005] Daniel T. Larose, Discovering Knowledge In Data: An Introduction to Data Mining, John Wiley & Sons, Director of Data Mining, Central Connecticut State University, 2005. [Gartner, 2007] Portal www.kdnuggets.com/ [en lnea] http://www.kdnuggets.com/ [Consulta: 10 de agosto de 2007]. disponible en:

[Brachman, 1996] Brachman, R. & Anand, T. (1996) The process of knowledge discovery in databases: a human-centered approach, in: U. Fayyad, et al. (Eds.), Advances in Knowledge Discovery and Data Mining, AAAI Press, Menlo Park, 1996, pp. 3657. [Becker, 2005] Becker K. & Ghedini, C., A documentation infrastructure for the management of data mining projects, Information and Software Technology 47 , pp. 95 111, 2005 [Kelley, 2003] Kelley Ch, Adelman, S., Where can I find sources about failed data mining projects and the reason for their failure?, DM Review Online Published in April 2003. DMReview.com [Pyle, 2004] Pyle, D. This Way Failure Lies, DB2 Magazine, Vol 1, issue1. 2004 [Richardson, 2006] Richardson G. & Butler, C., Readings in Information Technology Project Management, Thomson Learning, United States, pp. 40-41, 2006 [Standish Groups, 2004] Standish Groups The Chaos Report 2004, Extreme CHAOS, summary online at http://www.standishgroup.com/, retrieved 30 agosto 2007. [Charbonneau, 2004] Serge Charbonneau, Software Project Management - A Mapping between RUP and the PMBOK, Xelaration Software Corporation, IBM Corporation 2004 [ePMbook, 2007] Portal www.epmbook.com [en lnea] disponible en: http://www.epmbook.com/, Simon Wallace, 1999 2007 [Consulta: 30 de agosto de 2007]. [RationalUnifiedProcess, 2007] Portal www.ts.mah.se, [en lnea] disponible en: http://www.ts.mah.se/RUP/RationalUnifiedProcess/, [Consulta: 30 de agosto de 2007]. [Ambler et al., 2005] Scott W. Ambler, John Nalbone and Michael J. Vizdos, The Enterprise Unified Process: Extending the Rational Unified Process, Prentice Hall PTR, 2005. [Kroll, 2003] Per Kroll and Philippe Kruchten, Rational Unified Process Made Easy: A Practitioner's Guide to the RUP, Addison Wesley, 2003.

37

[Booch et al, 1998] Grady Booch, Robert C, Martin and James Newkirk , ''Object Oriented Analysis and Design with Applications'', 2d. ed., Addison Wesley Longman, Inc., 1998. [Markov, 2007] Zdravko Markov and Daniel T. Larose, Data Mining The Web: Uncovering Patterns in Web Content, Structure, and Usage, John Wiley & Sons, Inc., 2007. [Myatt, 2007] Glenn J. Myatt, Making Sense of Data: A Practical Guide to Exploratory Data Analysis and Data Mining, John Wiley & Sons, Inc., 2007. [Larose, 2006] Daniel T. Larose, Data Mining Methods and Models, John Wiley & Sons, Inc., 2006. [Larose, 2005] Daniel T. Larose, Discovering Knowledge in Data An Introduction to Data Mining, John Wiley & Sons, Inc., 2005. [Berry, 2004] Michael J.A. Berry, Gordon S. Linoff, Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management, Second Edition, Wiley Publishing, Inc., Indianapolis, Indiana, 2004. [Kudyba, 2004] Stephan Kudyba Ph.D., Managing Data Mining: Advice from Experts, CyberTech Publishing, 2004. [Wang, 2003] John Wang, Data Mining: Opportunities and Challenges, Idea Group Inc., 2003. [Parr, 2001] Olivia Parr Rud, Data Mining Cookbook: Modeling Data for Marketing, Risk, and Customer Relationship Management, John Wiley & Sons, Inc., 2001. [Schwalbe, 2007] Kathy Schwalbe, Project Management, Information Technology, Fifth Edition, Thomson Course Technolgy, 2007.

38

Вам также может понравиться