Cul es la diferencia entre un almacn de datos y una base de
datos administrada por un SGBD? La base de datos administrada por un sistema gestor de bases de datos contiene datos que comnmente son producto de las acciones ejecutadas en un sistema de informacin, por lo tanto podemos decir que los datos en ella almacenados corresponden a una temtica especfica o bien proviene de orgenes definidos.
Los almacenes de datos (datawarehouse) es una coleccin de datos de una o ms fuentes reunidas en una sola ubicacin para mejorar las actividades de minera de datos en comparacin a lo que un SGBD puede realizar. 2. Qu significa exploracin de datos? Es una etapa de la minera de datos en la que se seleccionan los datos que van a pasar a ser parte del datawarehouse y se omiten aquellos que son considerados como defectuosos o que no sirven a los propsitos de la actividad que se est realizando. 3. Qu diferencia existe entre exploracin de datos y minera de datos? Minera de datos es el proceso o metodologa completo donde se transforman grandes volmenes de datos en informacin de utilidad para la toma de decisiones. Sin embargo la exploracin de datos es solamente una parte del proceso aunque de gran importancia porque en ella se discierne entre los datos relevantes y aquellos que no lo son. 4. Qu diferencia existe entre las tareas que realizan herramientas como los EES, DSS, ERP, OLAP y las herramientas para Data Mining? Aunque en conjunto coadyuvan al tratamiento, almacenamiento y generacin de informacin tienen grandes diferencias. Por ejemplo los DSS son herramientas de Business Intelligence que normalmente requieren de un motor OLAP para el anlisis de datos. Un ERP es un sistema de informacin integral de las actividades del negocio pero no ofrece todas las herramientas para el anlisis y procesamiento de informacin para la toma de decisiones. 5. Suponiendo que va a hacer uso de un almacn de datos, cul es la estructura que utilizara y cmo concibe su diseo. Creo que ms que una estructura (como las que se manejan en los SGBD) lo que sera necesario utilizar sera una metodologa basada en la herramienta que se seleccione. Normalmente la herramienta debera ofrecer una interfaz de extraccin de datos, una de almacenamiento (datawarehouse) y varias herramientas de preprocesamiento y anlisis de datos para obtener informacin estadstica relevante.