Академический Документы
Профессиональный Документы
Культура Документы
INTELLIGENCE
DATAWAREHOUSING Y
DATAMINING
QU ES BUSINESS INTELLIGENCE?
* Conjunto de estrategias y herramientas enfocadas a la
administracin y creacin de conocimiento mediante el
anisis de datos existentes en una organizacin.
* Abarca la comprensin del funcionamiento actual de la
empresa, y la anticipacin de acontecimientos futuros,
con el objetivo de ofrecer conocimientos para respaldar
las decisiones empresariales.
QU ES BUSINESS INTELLIGENCE?
DATAWAREHOUSE
* Es un gran almacn de datos para consultar
* Es un repositorio de datos de muy fcil acceso, alimentado
de numerosas fuentes, transformadas en grupos de
informacin sobre temas especficos de negocios, para
permitir nuevas consultas, anlisis, toma de y decisiones.
* Tiene gran capacidad de almacenamiento, pues los datos
pueden ser de grandes periodos de tiempo.
DATAWAREHOUSE
-Emplea el concepto de Metadatos (datos que describen
otros datos). Por ejemplo, en una biblioteca se usan
fichas que especifican autores, ttulos, casas
editoriales y lugares para buscar libros. As, los
metadatos ayudan a ubicar datos.
-Cumple el principio de arquitectura fundamental que es
separar los sistemas transaccionales de los
informacionales en dos entornos de manera que el
anlisis de los datos existentes no intefiera con el
procesamiento y registro de nuevos datos.
Etapas en la construccin
de un DWH
1. Captura de los datos de las fuentes
seleccionadas (extraer de otras fuentes
-excel, documentos, etc- datos al DWH)
2. Tratamiento, conversin y transformacin
de los datos (operaciones de limpieza,
homogeneizacin, etc) En esta etapa se
considera lo siguiente
Etapas en la construccin
de un DWH
-Detectar y corregir errores (duplicados, eliminar valores sin
sentido)
-Consistencia del uso de valores (codificacin igual de los
valores por ejemplo DD/M/AAAA)
-Tratamiento de la ausencia de valores (por default)
-Codificar campos (ej. Pasar de fechas de nacimiento a
intervalos de edades)
-Reestructurar y aadir nuevos campos (enriquecer el
sistema)
Herramientas de
datamining
Estadsticas: regresin, anlisis
multivariable, anlisis cluster
Simblicas: rboles de decisin,
reglas
Tcnicas de inteligencia artificial:
redes neuronales, algoritmos
Metodologa de un proceso
de datamining
Muestreo: seleccin de muestra de datos para
reducir costos y tiempos.
Exploracin: determinar tendencias
principales, rango de variables, frecuencia de
valores
Modificacin: transformacin y filtrado de
variables para adecuarse a los requisitos del
problema o cuestin que se quiere analizar
Metodologa de un proceso
de datamining
Modelizacin del comportamiento: empleando
redes neuronales, rboles, etc.
Evaluacin: comprobacin de la validez del
modelo obtenido.
Presentacin grfica de los resultados
Herramientas de datamining y
datawarehouse
Oracle
IBM
KNIME
SPSS Clementine (software)
SAS Enterprise Miner
RapidMiner
Weka
KXEN
Orange
BENEFICIOS
Con los sistemas de datawarehousing y
datamining los directivos pueden disponer de
la informacin necesaria en poco tiempo y con
validez y dedicarse a su anlisis.
Permiten conocer el comportamiento de los
clientes logrando la eficacia en operaciones
de marketing y comunicaciones.
Se pueden detectar tendencias y previsiones
de cara al futuro.