Вы находитесь на странице: 1из 6

Diseño de almacén de datos para el análisis eficiente de la información de

incidentes informáticos y mantenimientos.

Ing. Corso Cynthia, Ing. Luque Claudio, Ing. Ciceri Leonardo, Sr Donnet
Matías

Grupo de Investigación, Desarrollo y Transferencia de Sistemas de Información


Facultad Regional Córdoba
Universidad Tecnológica Nacional
Maestro M. López esq. Cruz Roja.
cynthia@bbs.frc.utn.edu.ar/cluque@prominente.com.ar/leocic@bbs.frc.utn.edu.ar/55017@sistemas
.frc.utn.edu.ar

Resumen informáticos en el contexto de laboratorio


de sistemas”, cuyo código es UTN 1683
El objetivo de este proyecto de homologado por la Secretaría de Ciencia,
investigación es la caracterización de Tecnología y Posgrado de la Universidad
incidentes informáticos y mantenimientos Tecnológica Nacional.
en el contexto de un laboratorio Actualmente este proyecto forma parte
informático. Para ello se propone la del grupo de I&D GIDSI (Grupo de
utilización en conjunto de herramientas Investigación, Desarrollo y Transferencia
de la Inteligencia de Negocios y la de Sistemas de Información) radicado en
Minería de Datos, con el propósito de la UTN-Facultad Regional Córdoba.
analizar de manera exhaustiva los
incidentes informáticos y Introducción
mantenimientos. En este trabajo se
describe un modelo de Data Mart para la Uno de los pilares fundamentales para
determinación de perfiles de los determinar la confiabilidad de los
incidentes informáticos y mantenimientos recursos informáticos es el uso de
con el fin de instrumentar estrategias que indicadores de carácter estadístico. El
permitan disminuir los niveles de cálculo de muchos de ellos requiere
incidencias, como así también optimizar información histórica de los incidentes
la gestión de mantenimientos. informáticos presentados y que en la
actualidad la mayoría de las
organizaciones registra y almacena en
Palabras clave: Data Mart, Inteligencia grandes bases de datos. Gracias al
de Negocios, Incidente Informático, crecimiento tecnológico, la capacidad de
Mantenimiento almacenamiento de los dispositivos
informáticos se ha incrementado de
Contexto manera significativa, lo que hace que el
volumen de información que manejan las
Este trabajo presenta el resultado de los organizaciones complejiza el proceso de
avances del proyecto de investigación análisis e interpretación de los datos.
Generación de Modelo Descriptivo para Surge entonces, la necesidad de
la prevención de incidentes de equipos implementar un mecanismo capaz de
determinar las características propias de Mart “se refiere a una vista del Data
los incidentes informáticos, analizando la Warehouse orientada solo a un aspecto de
existencia de posibles relaciones de la organización.” Contiene menos
comportamiento que permita la definición volumen de datos que un Data Warehouse
clara de ciertos perfiles de incidentes y es el objeto del procesamiento analítico
informáticos. El estudio de incidentes es por parte del usuario final.
interesante complementarlo con el La implementación de un Data Mart no es
análisis de los mantenimientos. [1] La una condición excluyente para la
posibilidad de poder clasificar los posterior aplicación de técnicas de
mantenimientos correctivos realizados a Minería de Datos. [4] Sin embargo, el
los equipos informáticos posibilita la mismo brinda una estructura óptima de
creación de planes especiales de carácter datos que facilita no solo el análisis de la
preventivo aumentando la disponibilidad información de manera detallada sino que
del servicio prestados por estos. también un contexto apropiado para la
Por este motivo resulta interesante generación de modelos de conocimiento.
disponer de una serie de mecanismos que La Minería de Datos es un proceso de
permitan el acceso de una serie de descubrimiento de nuevas relaciones y
técnicas de pre procesamiento, análisis de tendencias significativas en grandes
los datos en línea y generación de volúmenes de datos.
modelos de los datos contenidos en En este trabajo se expone el diseño
grandes almacenes de datos y que sea un conceptual del Data Mart para el
complemento para la gestión eficiente de tratamiento integral de incidentes
incidentes informáticos y mantenimiento. informáticos y mantenimientos, guiados
La Inteligencia de Negocios en conjunto bajo los lineamientos de una determinada
con la Minería de Datos resultan ser un metodología.
complemento ideal permitiendo y El proceso de desarrollo de un almacén de
facilitando el análisis de los datos y la datos es diferente al desarrollo de
detección de tendencias y asociaciones sistemas operacionales clásicos, es por
entre variables que son interesantes para ello que existen diversas metodologías
un estudio exhaustivo e integral de los entre las más conocidas son la propuesta
incidentes informáticos y mantenimiento. por Ralph Kimball y Bill Inmon. Para el
Para dar soporte a un gran volumen de desarrollo del Data Mart la metodología
información se necesita del diseño e seleccionada fue la de Kimball que
implementación de un almacén de datos. describe un flujo de tareas de alto nivel
[2] La definición clásica de un almacén que son consideradas necesarias para el
de datos fue acuñada por Immon como diseño, desarrollo e implementación de
una colección de datos históricos, un almacén de datos.
orientados por temas, no volátiles, El diseño del Data Mart está
integrados, diseñados para apoyar el condicionado por la identificación de los
proceso de toma de decisiones de una requisitos de negocio. Estos mismos han
organización. sido relevados mediante el
Los almacenes de datos se clasifican en establecimiento de entrevistas y reuniones
dos tipos: Corporativos (Data Warehouse) dirigidas al personal directivo y de las
y Departamentales (Data Mart). Este áreas operativas involucradas. El
trabajo hace foco en los almacenes de propósito de las mismas es la detección
datos de tipo Departamental comúnmente de información estratégica, operativa e
conocidos como Data Mart. [3] Un Data indicadores que el Data Mart debe
responder. A continuación se enumeran contiene el valor de la medida analizada
algunos de los principales indicadores para dicha combinación de dimensiones.
detectados: Las variables o medidas son aquellas
 Número de incidentes informáticos a características del negocio que pueden ser
través del tiempo. cuantificadas y son seleccionadas para el
 Número de incidentes informáticos por análisis. Por ejemplo: ventas, compras,
aula y año. costos entre otros se corresponden con los
 Reincidencia de incidentes por equipo datos numéricos.
informático a través del tiempo. Las dimensiones se definen como los
 Reincidencia de incidentes atributos categóricos que caracterizan a
informáticos por equipo informático y una variable. El tiempo se considera una
componente a través del tiempo. dimensión más del modelo, puesto que
 Número de incidentes informáticos los análisis de las cifras de un negocio se
reportados que no fueron incidentes por especifican para un periodo de tiempo
área de reporte y tipo de diagnóstico. concreto.
 Número de mantenimientos por equipo Tomando como base la tabla de
informático, por componente de hardware indicadores relacionados con los
a través del tiempo. Incidentes Informáticos y
 Tiempo transcurrido entre la Mantenimientos, se elabora el Modelo
realización del mantenimiento y el reporte Conceptual del Data Mart que finalmente
de incidencia informático. se traducirá en tablas de Dimensiones y
Uno de los ejes principales en la Hechos. Para lograr este modelo se
propuesta de Ralph Kimball es el Modelo cumplimentó los siguientes pasos:
de Datos Dimensional. Establecimiento de nivel de granularidad:
Una de las principales motivaciones que En esta fase del proceso se trató de
da origen a la creación un nuevo modelo establecer cuál ha de ser el grado de
de datos radica en las carencias sobre el detalle de las celdas que constituirán el
bajo rendimiento de las consultas en el cubo OLAP (On-Line Analytical
modelo relacional, que fundamentalmente Processing). En una primera
está orientado a transacciones que aproximación se pretende establecer una
manejan pocos registros granularidad que permita el nivel de
simultáneamente. [3] Otra de las detalle más preciso que los datos puedan
limitaciones es la propia estructura de la ofrecer y de hecho esto es un principio a
base de datos, las consultas realizadas en tener en cuenta para un buen diseño. Un
los DSS (Sistema de Soporte de Decisión) exceso de detalle puede provocar que el
son muy complejas y su definición no sistema tenga que manejar una cantidad
está fijada de antemano. de datos que bien sea excesiva desde un
En el modelo de datos multidimensional, principio, o bien crezca de una manera
los datos se organizan en torno a los que provoque que las consultas se
conceptos de la empresa y la estructura de vuelvan demasiado lentas y poco
datos manejada en este modelo son operativas.
matrices multidimensionales o cubos. Un En este caso de estudio tanto los
cubo consiste en un conjunto de celdas, incidentes informáticos como los
de tal manera que cada una está mantenimientos están registrados por día
identificada por la combinación de los y hora. En un primer análisis de las
miembros de las diferentes dimensiones y consultas requeridas pueden ser llevadas a
cabo con la granularidad original de los
datos tal como son facilitados por el Resultados y Objetivos
laboratorio informático.
Selección de Dimensiones: una tabla de El objetivo central de esta investigación
dimensión permite almacenar detalles es aumentar la disponibilidad de los
acerca de los hechos del negocio que se servicios prestados por los equipos
desea analizar y estudiar. Por lo general informáticos de un laboratorio mediante
las columnas de una tabla de dimensión la optimización los procesos de
se utilizan para crear informes o para mantenimiento. Para cumplimentar este
mostrar resultados de consultas. objetivo se procede a la caracterización y
Las tablas de dimensiones contienen clasificación de incidentes informáticos y
generalmente una llave o clave simple y mantenimientos aplicando recursos de
atributos que la describen. Inteligencia de Negocios y la Minería de
Identificación de Medidas y Tabla de Datos.
Hechos: este último paso consistió en Los resultados alcanzados hasta el
identificar las medidas que surgen del momento relacionados con el diseño y
proceso de negocio a estudiar. Una desarrollo del Data Mart son:
medida es un atributo (campo) de una • Establecimiento de los requisitos del
tabla que se desea analizar, agrupando sus negocio dirigido al Responsable del
datos, usando los criterios de corte Laboratorio de Sistemas y del usuario
conocidos como dimensiones. Las final.
medidas generalmente se vinculan con el • Identificación de indicadores que para
nivel de granularidad. este caso de estudio se definió una
La tabla de hechos se caracteriza por codificación para indicar si pertenece al
almacenar medidas que son interesantes subproceso de Gestión de Incidente
para nuestro negocio asociadas a los Informático o al de Gestión de
incidentes informáticos y mantenimientos Mantenimiento.
y que serán medio de análisis para las • Identificación de Fuentes de origen de
diferentes perspectivas o dimensiones. datos.
• Diseño e implementación de
Líneas de Investigación, herramienta web para la gestión integral
Desarrollo e Innovación de incidentes informáticos y
mantenimientos que facilita la etapa de
• Herramientas de Inteligencia de recolección de datos y su posterior
Negocios. tratamiento y procesamiento.
• Metodologías para el diseño e • Realización de Modelo Conceptual del
implementación de Almacén de Datos. Data Mart en el que se enfatiza cada una
• Técnicas para la categorización de de las dimensiones de análisis y de los
datos. indicadores del modelo (hechos). La
• Herramientas OLAP para la propuesta de dicho modelo se resume en
implementación y explotación de cubos el siguiente gráfico.
OLAP.
• Metodología para el tratamiento
integral de incidentes y mantenimientos.
• Minería de Datos
así como en la categorización interna que
posee la U.T.N.
Una de los integrantes está desarrollando
su tesis para la obtención del título
Magister en Ingeniería en Sistema de
Información, cuya temática está
relacionada con la temática del proyecto.
Además colaboran de manera activa en
este proyecto tres becarios, dos alumnos y
un graduado.

Referencias
[1] Gómez Torrejano Manuel de Jesús,
Aplicación de Minería de Datos para
Fig 1. Diseño Conceptual de DM describir la ocurrencia de fallas en los
equipos y sistemas, 2009.
La diagramación de actividades [2] Inmon W, Building the Data
propuestas a corto plazo son las que se Warehouse, 2005.
detallan a continuación: [3] Di Vasta Concettina, DataWarehouse
• Análisis y selección de herramienta de (Almacenes de Datos).Métodos de Diseño
Inteligencia de Negocios para la gestión e de DataWarehouse, Universidad Central,
implementación del Data Mart. Venezuela, 2014.
• Diseño del Modelo Físico del Data [4] Yalán Castillo Julio, Palomino
Mart, en la que se prevé la especificación Panoira Luis, Implementación de un Data
de las estructuras necesarias para soportar Mart como una solución de Inteligencia
las necesidades de información. de Negocios para el área de logística de
• Definición de los procesos de T-Impulso, Revista de Ingeniería de
extracción, transformación y carga que Sistemas e Informática, ISSN:1816-3823,
facilitarán el poblamiento del Data Mart. 2012.
• Fase Explotación en este proceso se [5] Bosquet Isabel Dapena, San Roque
definirá como se utilizará el Data Mart, Antonio Muñoz, Sistemas de Información
especificando reportes y gráficos orientados a la toma de decisiones: el
multidimensionales necesarios para dar enfoque multidimensional, Anales de
respuesta a los indicadores detectados. mecánica y electricidad, p18-23,2005
[6] Quintana Ramírez María José, Orallo
Formación de Recursos Humanos José Hernández, Extracción Automática
de conocimiento en Base de Datos e
Este proyecto está conformado por Ingeniería de Software, España, 2005.
docentes-investigadores pertenecientes a [7] Basilio Serra Araujo, Aprendizaje
la carrera de grado de Ingeniería en Automático: conceptos básicos y
Sistemas de Información y un graduado. avanzados. Aspectos prácticos usando
Todos los integrantes docentes del PID software Weka, Pearson Educación,
han participado del proceso de Madrid, 2006.
categorizaciones en investigación dentro [8] Rodríguez Sanz Miguel, Análisis y
del Programa de Incentivos del MECyT; Diseño de un Data Mart para el
seguimiento académico de alumnos en un
entorno universitario, 2010.
[9] Kimball Ralph, The Datawarehouse
Staging Toolkit, IDG Books, 2004.

Вам также может понравиться