Вы находитесь на странице: 1из 11

1.2. Componentes de la Inteligencia de Negocios.

Minera de Datos.
Administracin del Conocimiento.
Aplicaciones Analticas.
Sistemas de Reportes.
Multidimensionalidad.
Data Warehouse.

1.2.1. Minera de Datos.


Desde un punto de vista acadmico el trmino data mining es una etapa dentro de un
proceso mayor llamado extraccin de conocimiento en bases de datos en el entorno
comercial. Lo que en verdad hace el data mining es reunir las ventajas de varias reas.
Desde los aos sesenta los estadsticos manejaban trminos como data fishing, data
mining o data archaeology, a principios de los aos ochenta, Rakesh Agrawal, Gio
Wiederhold, Robert Blum y Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar
los trminos de data mining. A finales de los aos ochenta slo existan un par de empresas
dedicadas a esta tecnologa; en 2002 existen ms de 100 empresas en el mundo que
ofrecen alrededor de 300 soluciones. El data mining es una tecnologa compuesta por
etapas que integra varias reas y que no se debe confundir con un gran software.
Actualmente existen aplicaciones o herramientas comerciales de data mining muy
poderosas que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto.
Aplicaciones de uso
Podemos decir que "en data mining cada caso es un caso". Sin embargo, en trminos
generales, el proceso se compone de cuatro etapas principales:
1.
2.
3.
4.

Determinacin de los objetivos.


Pre procesamiento de los datos.
Determinacin del modelo.
Anlisis de los resultados.

Web mining
Una de las extensiones del data mining consiste en aplicar sus tcnicas a documentos y
servicios del Web, lo que se llama web mining. Las herramientas de web mining analizan y
procesan estos logs para producir informacin significativa, por ejemplo, cmo es la
navegacin de un cliente antes de hacer una compra en lnea. Debido a que los contenidos
de Internet consisten en varios tipos de datos, como texto, imagen, vdeo, metadatos o
hiperligas, investigaciones recientes usan el trmino multimedia data mining (minera de
datos multimedia) como una instancia del web mining (Zaiane y otros, 1998) para tratar ese
tipo de datos.
Normalmente, el web mining puede clasificarse en tres dominios de extraccin de
conocimiento de acuerdo con la naturaleza de los datos:

1.
2.
3.

Web content mining (minera de contenido web). Es el proceso que consiste en la


extraccin de conocimiento del contenido de documentos o sus descripciones.
Web structure mining (minera de estructura web). Es el proceso de inferir
conocimiento de la organizacin del WWW y la estructura de sus ligas.
Web usage mining (minera de uso web). Es el proceso de extraccin de modelos
interesantes usando los logs de los accesos al web.

Text mining
El text mining se refiere a examinar una coleccin de documentos y descubrir informacin
no contenida en ningn documento individual de la coleccin; en otras palabras, trata de
obtener informacin sin haber partido de algo.
En ocasiones se confunde el text mining con la recuperacin de la informacin
(Information Retrieval o IR) (Hearst, 1999). sta ltima consiste en la recuperacin
automtica de documentos relevantes mediante indexaciones de textos, clasificacin,
categorizacin, etc. Generalmente se utilizan palabras clave para encontrar una pgina
relevante.

1.2.2. Administracin del Conocimiento.


La administracin del conocimiento implica la conversin del conocimiento tcito (el que
sabe un trabajador especfico) en explcito (conocimiento documentado y replicable) para
convertirlo en un activo estratgico de la organizacin.
Dicho en otras palabras implica la adecuada utilizacin de datos e informacin para
transformarlos en conocimiento y entendimiento.
El conocimiento responde a preguntas que empiezan con Cmo?, es decir, todo aquello
que generalmente slo algunos miembros de la organizacin saben y lo tienen en su
cabeza pero no ha sido transformado en un conocimiento explcito.
Los procesos y Subprocesos clave de la Administracin de Conocimiento definidos por el
CSC son los siguientes:

1. Alineacin y consolidacin estratgica de capitales:


a) Definicin de Sistemas Referenciales
b) Estructuracin y Operacionalizacin de Capitales
c) Estrategia de Administracin del Conocimiento y Desarrollo de Capitales
Articuladores
2. Administracin del Capital Agente
a) Administracin del Aprendizaje Organizacional
b) Desarrollo de Prcticas de Valor
c) Desarrollo de Competencias Claves
3. Administracin del Capital Instrumental
a) Mtodos y Herramientas para instrumentar las estratgicas de Administracin del
Conocimiento
b) Seleccin e Implementacin de Plataformas Tecnolgicas para la Administracin
del Conocimiento
c) Desarrollo de la Base de Conocimiento
Con el fin de ampliar ms este concepto, se presentan diferentes enfoques desde el punto
de vista de una organizacin:

En resumen, se detall el trmino de administracin del conocimiento como un sistema de


administracin de la informacin en la organizacin.

1.2.3. Aplicaciones Analticas.


1. Caractersticas de las aplicaciones analticas.
Una aplicacin analtica no es solo un juego de informes creados al azar. Tiene cuatro
caractersticas importantes las cuales son:
1- Integradas lgicamente: significa que algn grado de lgica comercial es incluido en
la aplicacin que ayude a los usuarios a navegar a travs de una serie de tareas.
2- Informes Interactivos que permitan a los usuarios acceder, analizar y actuar: Esto
significa que los usuarios pueden penetrar con una vista de nivel ms alto de un reporte a
niveles ms bajos o inferiores para adicionar informacin.
3- Informacin Integrada: Arquitectnicamente una aplicacin analtica es un objeto
soportado por un repositorio de almacenamiento de datos de la empresa.
4- Direccin de un dominio comercial: Las aplicaciones analticas son definidas por los
requerimientos de informacin de la actividad comercial, como las ventas, servicios o
infraestructura.
2. Elementos de una aplicacin analtica.
Una aplicacin analtica est compuesta por seis elementos primordiales los cuales son:
1. Visualizacin y percepcin: La visualizacin consiste en un ambiente grafico
amigable al usuario, en la referente a la percepcin se enfatiza en la navegacin de las
reas de trabajo.
2. Reportes y Anlisis: Los reportes en vistas de informacin predefinidas, que pueden
presentarse como estticas o como documentos interactivos, el anlisis incorpora
sofisticados clculos, algoritmos estadsticos, y visualizaciones avanzadas para analizar
grandes y complejos volumen de informacin.
3. El servidor de anlisis: es generalmente el responsable de procesar peticiones
utilizando run-time de metadatos definidos y guardndolos en el almacn del servidor.
4. Lgica de negocios: Ya se ha mencionado un tipo de lgica comercial, las reglas de
navegacin de los usuarios es paso a paso a travs de reportes, vistas, acciones.
5. Modelo de Datos: es el cerebro de aplicaciones analticas, a menudo trabajando en
conjunto con la capa semntica de BI, los modelos de datos son usados en las definiciones
de los cubos de OLAP.

6. El mapeo de las fuentes: Se definen las transformaciones requeridas para llevar los
datos fuentes dentro del modelo de datos designado.
3. Dashboards y Scorecards
Los scorecards y dashboards proporcionan la informacin del rendimiento empresarial a
travs de sus distintas reas.
La popularidad de dashboard est creciendo porque proporciona una interfaz sumamente
intuitiva para supervisar y analizar los datos, existen tres tipos de Dashboards los cuales
son:
1.
Operacional: Los usuarios pueden intervenir en los procesos y actividades
comerciales para solucionar un problema o capitalizar una oportunidad.
2. Tctico: Mide el progreso y actuacin de los departamentos o equipos del proyecto
contra metas establecidas a travs de un gerente.
3. Estratgico: Contiene la mtrica que se emplear en la estrategia corporativa. Estos
Dashboards son en forma de cascada donde en cada nivel y se tiene una versin diferente
de mtrica moldeada a su dominio comercial.

1.2.4. Sistemas de Reportes.


Los sistemas de reportes tienen como objetivo principal mostrar una visin general de la
situacin de la empresa. Consecuentemente, estos muestran la situacin de
las operaciones regulares de la empresa para que los directivos puedan controlar,
organizar, planear y dirigir. Los reportes se pueden visualizar, exportar a otros formatos
como PDF, HTML, XML, etc. y tambin se pueden imprimir en papel.
El Jasper Report es una librera para la generacin de informes. Est escrita en java y es
libre. http://jasperforge.org/ El funcionamiento consiste en escribir un xml donde se recogen
las particularidades del informe. Este xml lo tratan las clases del Jasper para obtener una
salida. Esta salida puede ser un PDF, XML, HTML, CSV, XLS, RTF, TXT. Otra ventaja de
utilizar Jasper Report es que se integra perfectamente con el JFreeChart que es una librera
libre para la generacin de todo tipo de graficas.
Para generar el xml lo recomendable es bajarse la herramienta iReport que es un editor
grfico que est implementado en java y se integra perfectamente con el Jasper Report.

El sistema de reportes jasper reports ofrece muchas herramientas que son de gran utilidad
proporciona todo lo necesario para disear informes de una complejidad media, y la curva
de aprendizaje para comenzar a tener resultados productivos no es muy elevada. Adems
los informes se puede realizar directamente sobre los xml descriptores o podemos utilizar
la herramienta ireport para disearlo grficamente.
Un ejemplo bsico:
Para generar un reporte con jasper report debemos seguir los siguientes pasos:
-

Generar un fichero .jrxml en el que se configura cmo queremos el informe.


Compilar el fichero .jrxml para obtener un fichero .jasper.
Rellenar los datos del informe. Esto generar un fichero .jrprint.
Exportar el fichero .jrprint al formato que deseemos (pdf, etc). Esto
generar el fichero en cuestin.

1.2.5. Multidimensionalidad.
La multidimensionalidad dentro de la inteligencia de negocios ayuda a representar los datos
en forma cercana a la intuicin del usuario y al mismo tiempo resolver problemas
planteados en sistemas relacionales.
La informacin multidimensional se puede encontrar en hojas de clculo, bases de datos,
etc. Es una herramienta de B.I. que es capaz de reunir informacin dispersa en toda la
empresa e incluso en diferentes fuentes para as proporcionar a los departamentos la
accesibilidad, poder y flexibilidad que necesitan para analizar la informacin. Por ejemplo,
un pronstico de ventas de un nuevo producto en varias regiones no est completo si no
se toma en cuenta tambin el comportamiento histrico de las ventas de cada regin y la
forma en que la introduccin de nuevos productos se ha desarrollado en cada regin en
cuestin. Se representan los datos como una matriz.
-

En los ejes estn los criterios de anlisis.


En los cruces estn los valores a analizar.
A esta estructura se le llama Cubo o Hipercubo.

Los Cubos o Hipercubos constan de:


- Dimensiones:
- Criterios de anlisis de los datos.
- Macro-objetos del problema.
- Variables independientes.
- Ejes en el hipercubo.
- Medidas:
- Valores o indicadores a analizar.
- Datos asociados a relaciones entre los objetos
- problema.
- Variables dependientes.
- Variables en la interseccin de las dimensiones.
Las bases de datos multidimensionales se utilizan principalmente para crear
aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad
es que por cada dimensin tienen un campo (o columna), y otro campo por
cada mtrica o hecho
1.2.6. Data Warehouse. Las caractersticas de los data warehouse se representan en la
siguiente grfica:

Data warehouse
Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y
depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo su
anlisis desde infinidad de pespectivas y con grandes velocidades de respuesta. La
creacin de un datawarehouse representa en la mayora de las ocasiones el primer paso,
desde el punto de vista tcnico, para implantar una solucin completa y fiable de Business
Intelligence.
La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se
almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc). Este tipo de persistencia de la informacin es homognea y fiable, y
permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno
diferente a los sistemas operacionales).

El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se traduce
literalmente como almacn de datos. No obstante, y como cabe suponer, es mucho ms
que eso. Segn defini el propio Bill Inmon, un datawarehouse se caracteriza por ser:
Integrado: los datos almacenados en el datawarehouse deben integrarse en una
estructura consistente, por lo que las inconsistencias existentes entre los diversos
sistemas operacionales deben ser eliminadas. La informacin suele estructurarse
tambin en distintos niveles de detalle para adecuarse a las distintas necesidades
de los usuarios.
Temtico: slo los datos necesarios para el proceso de generacin del conocimiento
del negocio se integran desde el entorno operacional. Los datos se organizan por

temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por
ejemplo, todos los datos sobre clientes pueden ser consolidados en una nica tabla
del datawarehouse. De esta forma, las peticiones de informacin sobre clientes
sern ms fciles de responder dado que toda la informacin reside en el mismo
lugar.
Histrico: el tiempo es parte implcita de la informacin contenida en un
datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado
de la actividad del negocio en el momento presente. Por el contrario, la informacin
almacenada en el datawarehouse sirve, entre otras cosas, para realizar anlisis de
tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que
toma una variable en el tiempo para permitir comparaciones.
No voltil: el almacn de informacin de un datawarehouse existe para ser ledo,
pero no modificado. La informacin es por tanto permanente, significando la
actualizacin del datawarehouse la incorporacin de los ltimos valores que
tomaron las distintas variables contenidas en l sin ningn tipo de accin sobre lo
que ya exista.
Otra caracterstica del datawarehouse es que contiene metadatos, es decir, datos sobre los
datos. Los metadatos permiten saber la procedencia de la informacin, su periodicidad de
refresco, su fiabilidad, forma de clculo... etc.
Los metadatos sern los que permiten simplificar y automatizar la obtencin de la
informacin desde los sistemas operacionales a los sistemas informacionales.
Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido, son:
Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su
propio lenguaje de negocio, indicando qu informacin hay y qu significado tiene.
Ayudar a construir consultas, informes y anlisis, mediante herramientas de
Business Intelligence como DSS, EIS o CMI.
Dar soporte a los responsables tcnicos del datawarehouse en aspectos de
auditora, gestin de la informacin histrica, administracin del datawarehouse,
elaboracin de programas de extraccin de la informacin, especificacin de las
interfaces para la realimentacin a los sistemas operacionales de los resultados
obtenidos... etc.
Por ltimo, destacar que para comprender ntegramente el concepto de datawarehouse, es
importante entender cual es el proceso de construccin del mismo, denominado ETL
(Extraccin, Transformacin y Carga), a partir de los sistemas operaciones de una
compaa:
Extraccin: obtencin de informacin de las distintas fuentes tanto internas como
externas.
Transformacin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la
informacin.

Carga: organizacin y actualizacin de los datos y los metadatos en la base de datos.

Una de las claves del xito en la construccin de un datawarehouse es el desarrollo de


forma gradual, seleccionando a un departamento usuario como piloto y expandiendo
progresivamente el almacn de datos a los dems usuarios. Por ello es importante elegir
este usuario inicial o piloto, siendo importante que sea un departamento con pocos
usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se puedan obtener
y medir resultados a corto plazo.
Principales aportaciones de un datawarehouse
Proporciona una herramienta para la toma de decisiones en cualquier rea funcional,
basndose en informacin integrada y global del negocio.
Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para
encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor aadido
para el negocio de dicha informacin.
Proporciona la capacidad de aprender de los datos del pasado y de predecir
situaciones futuras en diversos escenarios.
Simplifica dentro de la empresa la implantacin de sistemas de gestin integral de la
relacin con el cliente.
Supone una optimizacin tecnolgica y econmica en entornos de Centro de
Informacin, estadstica o de generacin de informes con retornos de la inversin
espectaculares.

Вам также может понравиться