Вы находитесь на странице: 1из 10

UNIVERSIDAD LAICA ELOY ALFARO DE MANAB EXTENSIN

EN EL CARMEN

INGENIERA EN SISTEMAS

INTEGRANTES

KELVIN DAYAN MUOZ ALMEIDA

JAVIER ALEXIS ZAMBRANO CHOEZ

DOCENTE

ING. SORAIDA ZAMBRANO

SEMESTRE

8VO

MATERIA

SISTEMAS COORPORATIVOS DE GESTIN

FECHA

MARTES 15 DE AGOSTO DEL 2017

AO LECTIVO

2017 - 2018
NDICE

INTRODUCCIN ................................................ Error! Bookmark not defined.

DESARROLLO ................................................................................................... 4

MANEJO DE HERRAMIENTAS ETL (PENTAHO).......................................... 4

MDULOS DE LA PLATAFORMA PENTAHO ............................................ 5

LAS CARACTERSTICAS GENERALES SON ............................................ 5

INTRODUCCIN A LA MINERA DE DATOS ................................................ 7

BASES DE DATOS PARA LA MINERA DE DATOS. ................................. 8

CONCLUSIONES ........................................................................................... 9

BIBLIOGRAFA ............................................................................................. 10
INTRODUCCIN

Pentaho es un conjunto de programas libres, que abordan las distintas fases de


la inteligencia de negocios. En la actualidad se la est conociendo como la suite
de inteligencia de negocio, por ser OpenSource, gracias a su versatilidad,
facilidad de uso e integracin con prcticamente cualquier origen y base de
datos.

Es un proyecto iniciado por una comunidad OpenSource, que provee una


alternativa de soluciones de BI en distintas reas como: arquitectura, soporte,
funcionalidad e Implantacin. Estas soluciones al igual que su ambiente de
implantacin estn basados en JAVA, hacindolo flexible en cubrir amplias
necesidades empresariales. La integracin funcional de diversos proyectos de
OpenSource permite ofrecer soluciones en reas como: anlisis de informacin,
reportes, Tableros de mando, flujos de trabajo y minera de datos.

Pentaho se compone de un servidor OLAP (Pentaho Analysis Services, un motor


de presentacin (Pentaho Reporting) un mdulo de anlisis predictivo (Pentaho
Data Mining), una plataforma de presentacin de datos (Pentaho Dashboard) y
un conector para el acceso al lago de datos manejado por Hadoop (Pentaho para
Apache Hadoop).

Gracias a que es un OpenSource, provee la arquitectura e infraestructura a la


vez que forma un proceso centralizado bajo un marco de trabajo orientado a la
solucin de problemas empleando componentes de BI y permitiendo desarrollos
completos para atender a soluciones de Inteligencia de Negocios.

Y es que nuestro mundo es muy cambiante y hay que adaptarse rpidamente.


As aquellos que se han quedado anclados en la virtualizacin saben que hablar
de virtualizacin como novedad es como hablar de sistema operativo como
novedad, un sinsentido. Hay que mirar ms all de la infraestructura y dirigir
nuestros esfuerzos cada vez ms al negocio.
DESARROLLO
MANEJO DE HERRAMIENTAS ETL (PENTAHO)

Pentaho es uno de los programas que posee un sinnmero de herramientas de


inteligencia de negocios, la cual lo podemos encontrar en dos versiones, la
versin comercial y la versin de cdigo abierto, adems nos permite extraer la
informacin de una base de datos OLTP y transformar la informacin a travs de
un modelo dimensional y cargar los resultados de la transformacin en una base
de datos destino tipo Data warehouse. (Izquierdo, 2010)

Las herramientas que se usan dentro de Pentaho tienden a poseer las siguientes
funcionalidades:

Control de la extraccin de los datos y su automatizacin

Permite al usuario disminuir los procesos de documentacin y ayuda a tener una


mayor resistencia para disminuir los errores.

Acceso a diferentes tecnologas

Como se debe usar el hardware, software, datos y recursos de manera segura.

Proporcionar la gestin integrada del Data Warehouse y los Data


Marts existentes

Ayuda a la construccin respectiva de Data Warehouse y data Marts.

Uso de la arquitectura de metadatos

Define cada objeto y reglas que se deben seguir de manera ordenada.

Acceso a una gran variedad de fuentes de datos diferentes.

Es el volumen de datos que pueden llegar a manejar.

Manejo de excepciones.

Identifica y controla los errores que se pueden ocasionar durante la ejecucin de


algn programa.

Planificacin, logs, interfaces a schedulers de terceros


Interfaz independiente de hardware.

Es el medio en que el usuario se puede comunicar con la mquina.

Soporte en la explotacin del Data Warehouse.

Una de las grandes ventajas que posee Pentaho es su versatilidad y


compatibilidad, que le permite generar informes en diferentes formatos como es
HTML, Excel entre otros, adems posee la habilidad de obtener informacin no
solo de un solo sistema si no de varios a la vez. (AGUILAR, 2009)

MDULOS DE LA PLATAFORMA PENTAHO


Reporting ( Informes)
Analysis (Anlisis)
Dashboard ( Tablero)
Data mining e Integracin de datos.

LAS CARACTERSTICAS GENERALES SON


1. Proporciona funcionalidad crtica para usuarios finales como:
Acceso va web.
Informes parametrizados.
Scheduling.
Suscripciones.
Distribucin (bursting).

2. Proporciona claras ventajas a especialistas en informes:


Acceso a fuentes de datos heterogneos
Capacidad de integracin en aplicaciones o portales
Definicin modular de informes (distincin entre presentacin y consulta).

3. Diseo de informes flexible:


Entorno de diseo grfico.
Capacidad de uso de templates.
Acceso a datos relacionales, OLAP y XML.
4. Desarrollado para:
Ser embebible.
Ser fcil de extender.
No consumir muchos recursos.
100% Java: portabilidad, escalabilidad e integracin.

5. Multiplataforma (tanto a nivel de cliente como servidor):


Mac.
Linux/Unix.
Windows. (Daz, 2010)

PROCESAMIENTO ANALTICO EN LNEA (OLAP)


Es una tecnologa que se usa para organizar grandes bases de datos
empresariales y admitir la inteligencia empresarial. Las bases de datos OLAP
(Online Analytical Processing) se dividen en uno o ms cubos. Cada cubo lo
organiza y disea un administrador de cubos para que se adapte a la forma en
la que recupera y analiza los datos, para que sea ms fcil crear y usar los
informes de las tablas y los grficos dinmicos que necesite, los principales
productos OLAP: Hyperion Solutions Essbase y Oracles Express Server.
(JUANIN, 2012)

Proporciona herramientas y caractersticas para OLAP que puede utilizar para


disear, implementar y mantener cubos y otros objetos compatibles. Aunque se
disean tpicamente para usuarios en entornos mltiples, con el coste del
software basado en el nmero de usuarios. (JUANIN, 2012)

OLAP contiene dos tipos de datos bsicos que son: medidas, que son datos
numricos, las cantidades y los promedios que usa para tomar decisiones
empresariales razonadas, y dimensiones, que son las categoras que usa para
organizar estas medidas. Estn diseadas para agilizar la recuperacin de datos,
crear archivos de cubos para uso sin conexin, acciones de servidor, formato de
servidor, idioma de presentacin de Office. (Moreira, 2003)

Los objetos dentro de OLAP, se pueden definir a partir de un origen de datos


existente, tales como: un almacn de datos, una base de datos de produccin.
Tambin puede definir objetos sin un origen de datos y, despus, generar
esquemas para relacionar objetos subyacentes a partir de objetos OLAP
definidos.

Las dimensiones, atributos y jerarquas dentro de OLAP, se definen y configuran


en el nivel de base de datos. Estos objetos OLAP son independientes de los
cubos OLAP y se pueden usar en uno o varios cubos. En cierta medida, estos
objetos se pueden personalizar en cada cubo. Estos estn compuestos de
medidas y dimensiones, los cuales puede definir y configurar varios cubos en
una nica base de datos; y cada cubo puede usar algunas de las mismas
dimensiones o todas ellas. Tambin puede definir un solo cubo que contenga
varios grupos de medida en la misma base de datos en lugar de definir cubos
independientes. (Price, 2004)

Un cubo con varios grupos de medida, debe definir cmo se relacionan las
dimensiones con cada grupo de medida y personalizar, segn corresponda, los
objetos de dimensin y grupo de medida. Cuando se define un cubo, se les da
propiedades avanzadas del mismo: clculos, acciones, particiones,
agregaciones, perspectivas y traducciones. (Price, 2004)

OLAP ha sido ampliamente utilizada durante aos en diversos sectores


empresariales, tales como el marketing, ventas, gerencia y dems, permitiendo
realizar informes de negocios confiables, que mejoran la competitividad de las
organizaciones, tanto a nivel interno como externo.

INTRODUCCIN A LA MINERA DE DATOS


Con el pasar de los aos las empresas han enfrentado diversos obstculos para
demostrar que son dignas de estar dentro de la competencia comercial, esto
conlleva a tener muy en cuenta la organizacin de produccin, reduccin de
costos y atender al cliente de buena manera, estas condiciones ayudan mucho
a triunfar globalmente en el mercado y ser altamente competitivos. (ORTIZ,
2009)

Gracias al conocimiento que se adquiere diariamente sobre las diversas


necesidades y deseos del cliente, la empresa puede ser capaz de cumplir con
sus objetivos, todo esto se logra utilizando la Minera de Datos, la cual utiliza
herramientas genricas como es CRM, ERP y BI, ya que son tcnicas y mtodos
para dar una buena atencin al cliente y a su vez reducir los costos. (ORTIZ,
2009)

Las tcnicas y mtodos de la minera de datos son descripciones y predicciones


que se llevan a cabo cuando se maneja una gran cantidad de datos, que se
asocian con base de datos especiales, ms conocidas como wharehouse.

La minera de datos posee las siguientes etapas para realizar un proyecto que
son:

Definicin del problema.


Adquisicin y evaluacin de los datos.
Extraccin de caractersticas y realce.
Plan de prototipo y desarrollo del modelo.
Evaluacin del modelo.
Implementacin.
Evaluacin de retorno sobre la inversin (post proyecto).

BASES DE DATOS PARA LA MINERA DE DATOS.


La minera de datos no se relaciona con todo tipo de base de datos, las ms
utilizadas son:

Data Warehouse
Data Mart.
Data WebHouse. (ORTIZ, 2009)
CONCLUSIONES

Pentaho es una herramienta de BI desarrollada para la gestin y toma de


decisiones empresariales, es OPEN SOURCE y su paquete es
extremadamente completo, adems posee un sinnmero de propiedades
que le permiten a la empresa a reducir gastos.
El Procesamiento analtico en lneas nos permite agilizar la consulta de
grandes cantidades de datos. Para ello utiliza estructuras de datos
diversas, normalmente multidimensionales (o Cubos OLAP), que
contienen datos resumidos de grandes Bases de datos o Sistemas
Transaccionales (OLTP). Se usa en informes de negocios de ventas,
marketing, informes de direccin, minera de datos y reas similares.
La minera de datos permite ahorrar grandes cantidades de dinero a una
empresa y abre nuevas oportunidades de negocios, contribuye con la
toma de decisiones y proporciona poder de decisin y resultados de la
mejor forma.
BIBLIOGRAFA

AGUILAR, M. (2009). PENTHAO. BOGOTA: UMBRELLA.

Daz, C. (2010). Introduccin al Business Intelligence. BARCELONA:


OUA.

Izquierdo, M. (2010). Herramienta ETL geo-espacial libre . Barcelona :


JORNADAS DE SIG LIBRE.

JUANIN, C. (2012). Introduccin a los sistemas de bases de datos.


Mexico: Pearson.

Moreira, D. (2003). Procesamiento de bases de datos: fundamentos,


diseo e implementacin. Mexico: Pearson.

ORTIZ, I. (2009). Introduccin a la Minera de Datos. RIO DE JANEIRO :


PAPERS.

Price, J. (2004). Sistemas de informacin gerencial: administracin de la


empresa digital. Mexico: Pearson.

Вам также может понравиться