Facultad de Ciencias e Ingenieras Fsicas y Formales
Informe de Trabajo Construccin de cubos OLAP utilizando Business Intelligence Development Studio
Alumnos: Solange Griselly Ramos Cooper Pedro Michael Yallerco Bentura Enrique Giancarlo Mendoza Mayta Materia: Inteligencia de Negocios Docente: Dr. Guillermo Calderon Ruiz
Ingeniera de Sistemas Arequipa Per 2013
INTRODUCCIN El presente trabajo aborda el tema de diseo de cubos OLAP, este trmino que por sus siglas en ingles indican OnLine Analitical Processing fue acuado por Edgar Frank Codd, quien propuso disponer los datos en un vector multidimensional para suplir la necesidad de obtener resultados a sentencias de bsqueda ms rpidos. Por lo tanto, un cubo Olap no es ms que la representacin abstracta de una base de datos multidimensional utilizada como mecanismo de anlisis de datos que permite una rpida ejecucin de sentencias SQL de tipo SELECT en altas cantidades de datos. Actualmente los cubos Olap se clasifican en tres tipos, Rolap, Molap y Holap, que bsicamente se diferencian por el lugar donde reside la fuente de datos. En ROLAP los datos residen en la misma base de datos relacional, esto hace que el rendimiento pueda ser lento; por otro lado en MOLAP los datos fuente residen en el mismo formato multidimensional, esto optimiza las consultas, pero requiere ms espacio de disco y diferente software; finalmente HOLAP es una combinacin de los dos anteriores, es decir, algunos datos se almacenan en estructuras multidimensionales y otros en la base de datos relacional, esto requiere un buen trabajo de anlisis para identificar que datos deben ir donde. En este trabajo se implementar el diseo de una solucin ya modelada, para esto se utilizar el entorno Business Intelligence Development Studio de Microsoft Visual Studio 2008, se hablar un poco sobre esta herramienta y se har paso a paso la construccin del cubo, luego se explicar el funcionamiento de la solucin y finalmente se plantearn tres preguntas que sern respondidas con la solucin implementada.
OBJETIVOS Entender cmo es que esta solucin proporciona informacin til para la toma de decisiones a nivel Estratgico. Aprender sobre la construccin de un cubo OLAP en Microsoft Visual Studio 2008. Entender cmo funciona el mecanismo de Procesamiento Analtico en Lnea.
DESARROLLO Business Intelligence Development Studio Ubicacin Nota Semana Anterior Ubicacin Descarga Semana Anterior Business Intelligence Development Studio es el entorno de Microsoft Visual Studio 2008 con mejoras especficas para soluciones de Inteligencia de Negocios, adems es el entorno principal que se utiliza para desarrollar soluciones empresariales que incluyan proyectos de Analysis Services, Integration Services y Reporting Services. Cada tipo de proyecto proporciona plantillas para crear los objetos necesarios para las soluciones de Inteligencia de Negocios y ofrece varios diseadores, herramientas y asistentes para trabajar con los objetos. Business Intelligence Development Studio permite desarrollar cubos de Procesamiento analtico en lnea (OLAP) y modelos de minera de datos en SQL Server Analysis Services. La superficie de diseo de Business Intelligence Development Studio se especializa en funcin del objeto con el que se trabaja en Analysis Services. Por ejemplo, existe un diseador para trabajar con cubos, denominado Diseador de cubos. El Explorador de soluciones, que se encuentra a la derecha de la superficie de diseo, proporciona un mecanismo para navegar entre superficies de diseo y administrar los elementos de un proyecto. Business Intelligence Development Studio tambin contiene una ventana de implementacin que muestra el progreso de una implementacin y una ventana Propiedades que permite cambiar las propiedades de los objetos seleccionados.[1] Business Intelligence Development Studio es el entorno que se utilizar para desarrollar el cubo OLAP en SQL Server Analysis Services de este trabajo.
NOTA Microsoft Visual Studio 2010 no admite proyectos de Business Intelligence Development Studio Integration Services, Reporting Services y Analysis Services para SQL Server 2008 y SQL Server 2008 R2.
Figura 1 Entorno de Business Intelligence Development Studio. Conexin a origen de datos Para disear un cubo OLAP es necesario tener un origen de datos, la fuente de datos con la que se trabaj fue una base de datos relacional creada previamente, administrada en SQL Server y sigue el siguiente modelo.
Figura 2 Modelo Relacional. Ubicacin Nota Semana Anterior Ubicacin Descarga Semana Anterior Este modelo soluciona un problema planteado que se encuentra en el Anexo 1. Para realizar la conexin de origen de datos se utilizar el Asistente para Orgenes de Datos. Crear una nueva conexin.
Figura 3 Asistente para orgenes de datos. Configurar la conexin indicado el nombre del servidor y el de la base de datos con la que se trabajar. Comprobar conexin.
Figura 4 Configuracin de conexin. Para finalizar la conexin es necesario proporcionar un nombre al origen de datos.
Figura 5 Finalizacin del asistente de origen de datos. Luego seleccionar los objetos de a base de datos relacional que van a incluirse en la vista del origen de datos, esto con el Asistente para vistas del origen de datos. Se puede observar la vista previa de las tablas que aparecern en la vista.
Figura 6 Asistente para vistas de origen de datos. Finalmente, se crear el siguiente diagrama.
Figura 7 Diseo de vista de origen de datos
Construccin del cubo OLAP Para construir un nuevo cubo se necesita seleccionar la vista del origen de datos y las tablas del cubo, para establecer sus propiedades.
NOTA Tambin se puede crear un cubo vaco (sin origen de datos) o generando tablas en el origen de datos.
Seleccionar la tabla o las tablas que se utilizarn para el grupo de medidas, luego en la siguiente ventana seleccionar las medidas que se desean considerar en el cubo.
Figura 8 Asistente para cubos. Seleccin de tabla de medidas Ubicacin Nota Semana Anterior Ubicacin Descarga Semana Anterior
Figura 9 Asistente para cubos. Seleccin de medidas. Al inicio no existen dimensiones, pero el asistente para la creacin de cubos sugiere la creacin de dimensiones simples.
Figura 10 Asistente para cubos. Seleccin de dimensiones.
Finalmente, asignar un nombre al cubo. Se puede observar la vista previa de los grupos de medida y las dimensiones como se observa en la siguiente figura.
Figura 11 Finalizacin del asistente para cubos. A continuacin mostrar el diseo del cubo.
Figura 12 Estructura del cubo. Hechos y dimensiones. En la pestaa Examinador, se puede modelar el cubo segn las dimensiones que se tengan.
Figura 13 Examinador de datos. Ahora existe un inconveniente en las dimensiones creadas, solo se recuper un atributo por dimensin que fueron las PK de las tablas iniciales, entonces se proceder a crear dimensiones manualmente para recuperar las dems columnas en cada dimensin. Primero eliminar las dimensiones que se crearon con el cubo, luego utilizar el Asistente para dimensiones para crear nuevas. Para crear dimensiones se debe selecciona la vista de origen de datos y las tablas de dimensin para luego estableces la propiedades.
Figura 14 Estructura del cubo. Hechos y dimensiones. Para cada dimensin, seleccionar los atributos de dimensin y habilitarlos para que se muestren como jerarquas.
Figura 15 Asistente para dimensin. Seleccin de atributos de dimensin. Luego se puede observar el diseo final de la dimensin.
Figura 16 Estructura de dimensin. Para poder observar los datos de la tabla de la dimensin, se debe procesar la dimensin.
Figura 17 Procesar Dimensin. En el progreso del proceso se puede observar los atributos de la dimensin, as como el nmero de filas que fueron ledas de la tabla.
Figura 18 Confirmacin de finalizacin de proceso. Una vez terminado el proceso, agregar la dimensin al diseo del cubo en la pestaa Uso de dimensiones.
Figura 19 Adicin de nueva dimensin al diseo del cubo. Examinar cubo Dirigirse al explorador de soluciones hasta llegar al diseo del cubo, luego en la pestaa Examinador podemos empezar a manipular los datos segn se desee. Ubicacin Nota Semana Anterior Ubicacin Descarga Semana Anterior Por ejemplo, en la siguiente imagen se puede observar los ingresos por cada departamento en los meses de enero de los 5 aos, de esta forma se puede comparar los ingresos de cada ao por dicho mes.
Figura 19 Examinador de datos. Utilidad del cubo OLAP Los sistemas OLAP es una de las soluciones que responden a la gran demanda que existe de sistemas de informacin por parte de los gerentes y analistas empresariales, ya que permiten obtener respuestas rpidas a consultas complejas adems de analizar datos desde distintas perspectivas. Este modelo de datos simplifica a los usuarios formular consultas complejas, arreglar los datos en un reporte, cambiar de datos resumidos a datos detallados y filtrar o rebanar los datos en subconjuntos significativos.[2] A continuacin se plantearn preguntas de un analista empresarial referidas a la solucin OLAP que se pidi en el documento que se encuentra en el Anexo 1 y que fue desarrollada en este trabajo. 1. Cmo ha sido el beneficio obtenido en ROPA JUVENIL del departamento de Arequipa en verano de este ao, con respecto al verano de aos anteriores? Ubicacin Nota Semana Anterior Ubicacin Descarga Semana Anterior
Figura 20 Anlisis de dato Beneficio segn dimensiones Mes, Ao, Producto y Departamento. Como se puede observar, la figura indica que hubo un ligero crecimiento de Beneficios en cuanto a la venta Ropa Juvenil desde el ao 2008 hasta el ao 2012 en los meses de Enero y Febrero.
2. Cul es el menor y mayor margen de ELECTRODOMESTICOS de las tiendas de todos los departamentos por ao?
Figura 21 Anlisis del dato Margen segn dimensiones Departamento y Ao.
Como se puede observar, el menor margen de ganancia fue en CUZCO en el ao 2009 con 2.29% sobre el margen de ganancia total en los 4 aos y el mayor es de PIURA en el ao 2009 con 2.68% sobre el margen de ganancia total en los 4 aos.
3. Se desea saber si es conveniente invertir ms en marketing.
Como podemos observar el Costo de Marketing es relativamente proporcional al Beneficio, por lo que se podra concluir que seguir invirtiendo o aumentar la inversin en Marketing dara resultados positivos en los Beneficios para la empresa.
CONCLUSIONES El Procesamiento Analtico en Lnea es una buena alternativa de solucin a los problemas que se presentan en los niveles estratgicos de las empresas, ya que los gerentes o analistas empresariales necesitan obtener respuestas rpidas a consultas complejas en grandes cantidades de datos, ms an este tiempo de respuesta se puede optimizar implementando los diferentes tipos de cubos OLAP que existe segn las necesidades del usuario. El entorno Business Intelligence Development Studio de Microsoft Visual Studio 2008 permite implementar soluciones OLAP de una forma sencilla y rpida, gracias a sus diferentes tipos de asistentes que ofrece como Asistente para Administrar conexin de Datos, Asistente para crear Vista de Origen de Datos, Asistente para Cubos, Asistente para dimensiones, etc.
REFERENCIAS BIBLIOGRFICAS [1] Analysis Services en Business Intelligence Development Studio (Analysis Services - Datos multidimensionales) (2013, Octubre 26) [En lnea]. Disponible en: http://technet.microsoft.com/es-es/library [2] Procesamiento Analtico en Lnea (OLAP) (2013, Octubre 26) [En lnea]. Disponible en: http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/OLAPMonog.pdf