Вы находитесь на странице: 1из 28

Redes Neuronales, Inteligencia Artificial

Business Inteligence,
Data Warehouse

REDES NEURONALES
Existen numerosas formas de definir a las redes neuronales; desde las definiciones cortas y genricas hasta las que intentan explicar ms detalladamente qu son las redes neuronales. Por ejemplo 1) Una nueva forma de computacin, inspirada en modelos biolgicos. 2) Un modelo matemtico compuesto por un gran nmero de elementos procesales organizados en niveles. 3) Un sistema de computacin compuesto por un gran nmero de elementos simples, elementos de procesos muy interconectados, los cuales procesan informacin por medio de su estado dinmico como respuesta a entradas externas. 4) Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples (usualmente adaptativos) y con organizacin jerrquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biolgico.

Una Neurona biologica

Red Neuronal Biolgica

Red Neuronal Artificial

Las redes neuronales estn basados en el mismo concepto que las neuronas biolgicas, esto quiere decir que cada neurona por si sola es capaz de realizar procesos simples y con muy poca carga de trabajo, al estar entrelazadas con todo el resto de neuronas del cuerpo son capaces de desarrollar y procesar hasta los temas mas difciles y complejos.

Esta misma premisa bsica se ha llevado a la computacin y la tecnologa para que a partir de ello se desarrollen las redes neuronales artificiales (ANN, sigla en ingls que significa Artificial Neuronal Network)

REDES NEURONALES: VENTAJAS


Aprendizaje adaptativo La capacidad de aprendizaje adaptativo es una de las caractersticas ms atractivas de redes neuronales. Esto es, aprenden a llevar a cabo ciertas tareas mediante un entrenamiento con ejemplos ilustrativos. Como las redes neuronales pueden aprender a diferenciar patrones mediante ejemplos y entrenamientos, no es necesario elaborar modelos a priori ni necesidad de especificar funciones de distribucin de probabilidad. Las redes neuronales son sistemas dinmicos autoadaptativos. Son adaptables debido a la capacidad de autoajuste de los elementos procesales (neuronas) que componen el sistema. Son dinmicos, pues son capaces de estar constantemente cambiando para adaptarse a las nuevas condiciones. En el proceso de aprendizaje, los enlaces ponderados de las neuronas se ajustan de manera que se obtengan ciertos resultados especficos. Una red neuronal no necesita un algoritmo para resolver un problema, ya que ella puede generar su propia distribucin de pesos en los enlaces mediante el aprendizaje. Tambin existen redes que continan aprendiendo a lo largo de su vida, despus de completado su perodo de entrenamiento

REDES NEURONALES: VENTAJAS

Auto-organizacin Las redes neuronales emplean su capacidad de aprendizaje adaptativo para autoorganizar la informacin que reciben durante el aprendizaje y/o la operacin. Mientras que el aprendizaje es la modificacin de cada elemento procesal, la autoorganizacin consiste en la modificacin de la red neuronal completa para llevar a cabo un objetivo especfico. Cuando las redes neuronales se usan para reconocer ciertas clases de patrones, ellas autoorganizan la informacin usada. Por ejemplo, la red llamada backpropagation, crear su propia representacin caracterstica, mediante la cual puede reconocer ciertos patrones. Esta autoorganizacin provoca la generalizacin: facultad de las redes neuronales de responder apropiadamente cuando se les presentan datos o situaciones a las que no haba sido expuesta anteriormente. El sistema puede generalizar la entrada para obtener una respuesta. Esta caracterstica es muy importante cuando se tiene que solucionar problemas en los cuales la informacin de entrada no es muy clara; adems permite que el sistema d una solucin, incluso cuando la informacin de entrada est especificada de forma incompleta.

REDES NEURONALES: VENTAJAS


Tolerancia a fallos Las redes neuronales fueron los primeros mtodos computacionales con la capacidad inherente de tolerancia a fallos. Comparados con los sistemas computacionales tradicionales, los cuales pierden su funcionalidad cuando sufren un pequeo error de memoria, en las redes neuronales, si se produce un fallo en un nmero no muy grande de neuronas y aunque el comportamiento del sistema se ve influenciado, no sufre una cada repentina. Hay dos aspectos distintos respecto a la tolerancia a fallos: a) Las redes pueden aprender a reconocer patrones con ruido, distorsionados o incompletos. Esta es una tolerancia a fallos respecto a los datos. b) Las redes pueden seguir realizando su funcin (con cierta degradacin) aunque se destruya parte de la red. La razn por la que las redes neuronales son tolerantes a los fallos es que tienen su informacin distribuida en las conexiones entre neuronas, existiendo cierto grado de redundancia en este tipo de almacenamiento. La mayora de los ordenadores algortmicos y sistemas de recuperacin de datos almacenan cada pieza de informacin en un espacio nico, localizado y direccionable. En cambio, las redes neuronales almacenan informacin no localizada. Por lo tanto, la mayora de las interconexiones entre los nodos de la red tendrn sus valores en funcin de los estmulos recibidos, y se generar un patrn de salida que represente la informacin almacenada

REDES NEURONALES: VENTAJAS


Operacin en tiempo real Una de las mayores prioridades, casi en la totalidad de las reas de aplicacin, es la necesidad de realizar procesos con datos de forma muy rpida. Las redes neuronales se adaptan bien a esto debido a su implementacin paralela. Para que la mayora de las redes puedan operar en un entorno de tiempo real, la necesidad de cambio en los pesos de las conexiones o entrenamiento es mnimo. Fcil insercin dentro de la tecnologa existente Una red individual puede ser entrenada para desarrollar una nica y bien definida tarea (tareas complejas, que hagan mltiples selecciones de patrones, requerirn sistemas de redes interconectadas). Con las herramientas computacionales existentes (no del tipo PC), una red puede ser rpidamente entrenada, comprobada, verificada y trasladada a una implementacin hardware de bajo coste. Por lo tanto, no se presentan dificultades para la insercin de redes neuronales en aplicaciones especficas, por ejemplo de control, dentro de los sistemas existentes. De esta manera, las redes neuronales se pueden utilizar para mejorar sistemas en forma incremental y cada paso puede ser evaluado antes de acometer un desarrollo ms amplio.

REDES NEURONALES: ESTRUCTURA


Niveles o capas de neuronas La distribucin de neuronas dentro de la red se realiza formando niveles o capas de un nmero determinado cada una. Se pueden distinguir tres tipos de capas:

De Entrada: es la capa que recibe directamente la informacin proveniente de las fuentes externas de la red. Ocultas: son internas a la red, no tiene contacto directo con el exterior. El nmero de niveles ocultos puede ser de cero a un nmero elevado. Las neuronas de las capas ocultas pueden estar interconectadas de distintas maneras, lo que determina junto a su nmero, las distintas topologas. De Salida: transfieren informacin de la red hacia el exterior. Se dice que una red es totalmente conectada si todas las salidas desde un nivel llegan a todos y cada uno de los nodos del mismo nivel siguiente. Formas de Conexin entre neuronas La conectividad entre los nodos de una red neuronal est relacionada con la forma en que las salidas de las neuronas estn canalizadas para convertirse en entradas de otras neuronas. La seal de salida de un nodo puede ser una entrada de otro elemento de proceso, o incluso de s mismo (conexin auto-recurrente). Cuando ninguna salida de las neuronas es entrada de neuronas del mismo nivel o de niveles precedentes, la red se describe como propagacin hacia delante. Cuando las salidas pueden estar conectadas como entradas de neuronas de niveles previos o del mismo nivel, incluyndose ellas mismas, la red es de propagacin hacia atrs. Las redes de propagacin hacia atrs que tiene lazos cerrados son sistemas recurrentes.

INTELIGENCIA ARTIFICIAL
Definicion: Las definiciones de Inteligencia Artificial son muchas, pero podra decirse que son programas que realizan tareas que si fueran hechas por humanos se consideraran inteligentes. Estos programas obviamente corren en un computador y se usan, como por ejemplo, en control robtico, comprensin de lenguajes naturales, procesamiento de imgenes basado en conocimientos previos, estrategias de juegos, etc. reproduciendo la experiencia que un humano adquirira y de la forma en que un humano lo hara. Para clasificar las mquinas como "pensantes", es necesario definir qu es inteligencia y qu grado de inteligencia implica resolver problemas matemticos complejos, hacer generalizaciones o relaciones, percibir y comprender. Los estudios en las reas del aprendizaje, del lenguaje y de la percepcin sensorial han ayudado a los cientficos a definir a una mquina inteligente. Importantes desafos han sido tratar de imitar el comportamiento del cerebro humano, con millones de neuronas y extrema complejidad.

INTELIGENCIA ARTIFICIAL: CARACTERISTICAS


Una caracterstica fundamental que distingue a los mtodos de Inteligencia Artificial de los mtodos numricos es el uso de smbolos no matemticos, aunque no es suficiente para distinguirlo completamente. Otros tipos de programas como los compiladores y sistemas de bases de datos, tambin procesan smbolos y no se considera que usen tcnicas de Inteligencia Artificial. Las conclusiones de un programa declarativo no son fijas y son determinadas parcialmente por las conclusiones intermedias alcanzadas durante las consideraciones al problema especfico. Los lenguajes orientados al objeto comparten esta propiedad y se han caracterizado por su afinidad con la Inteligencia Artificial. El comportamiento de los programas no es descrito explcitamente por el algoritmo. La secuencia de pasos seguidos por el programa es influenciado por el problema particular presente. El programa especifica cmo encontrar la secuencia de pasos necesarios para resolver un problema dado (programa declarativo). En contraste con los programas que no son de Inteligencia Artificial, que siguen un algoritmo definido, que especifica, explcitamente, cmo encontrar las variables de salida para cualquier variable dada de entrada (programa de procedimiento).

INTELIGENCIA ARTIFICIAL: CARACTERISTICAS

El razonamiento basado en el conocimiento, implica que estos programas incorporan factores y relaciones del mundo real y del mbito del conocimiento en que ellos operan. Al contrario de los programas para propsito especfico, como los de contabilidad y clculos cientficos; los programas de Inteligencia Artificial pueden distinguir entre el programa de razonamiento o motor de inferencia y base de conocimientos dndole la capacidad de explicar discrepancias entre ellas. Aplicabilidad a datos y problemas mal estructurados, sin las tcnicas de Inteligencia Artificial los programas no pueden trabajar con este tipo de problemas. Un ejemplo es la resolucin de conflictos en tareas orientadas a metas como en planificacin, o el diagnstico de tareas en un sistema del mundo real: con poca informacin, con una solucin cercana y no necesariamente exacta.

BASE DE CONOCIMIENTO, SISTEMAS BASADOS EN EL CONOCIMIENTO

Los mtodos generales desarrollados para la resolucin de problemas y tcnicas de bsqueda al inicio de la era de la Inteligencia Artificial demostraron no ser suficientes para resolver los problemas orientados a las aplicaciones, ni fueron capaces de satisfacer los difciles requerimientos de la investigacin. A este conjunto de mtodos, procedimientos y tcnicas, se lo conoce como Inteligencia Artificial Dbil. La principal conclusin que se deriv de este trabajo inicial fue que los problemas difciles slo podran ser resueltos con la ayuda del conocimiento especfico acerca del dominio del problema. La aplicacin de estas ideas dio lugar al desarrollo de los denominados Sistemas Basados en Conocimiento (Knowledge Based Systems) y al aparecimiento de la Ingeniera Cognoscitiva, como una rama de la Inteligencia Artificial, que estudia los sistemas basados en el conocimiento.

DEFINICION DE SISTEMAS BASADOS EN EL CONOCIMIENTO

Es un sistema computarizado capaz de resolver problemas en el dominio en el cual posee conocimiento especfico. La solucin es esencialmente la misma que hubiera dado un ser humano confrontado con idntico problema, aunque no necesariamente el proceso seguido por ambos puede ser igual. El simple concepto dado, puede causar confusin ya que muchos sistemas basados en programas convencionales podran ser incorrectamente categorizados como sistemas basados en conocimiento. Esta inconsistencia puede ser aclarada, sobre la base de tres conceptos fundamentales que distinguen a los sistemas basados en conocimiento de los programas algortmicos convencionales y de los programas generales basados en bsqueda:

Inteligencia Artificial dbil. Primero, la separacin del conocimiento y el modo en que es usado. Segundo, la naturaleza del conocimiento empleado (heurstica antes que algortmica). Tercero, El uso de conocimiento especfico de un determinado dominio. Las caractersticas principales son: amplia difusin del conocimiento fcil modificacin respuestas coherentes disponibilidad casi completa conservacin del conocimiento capacidad de resolver problemas disponiendo de informacin incompleta capacidad de explicar los resultados y la forma de obtenerlos

Los principales problemas asociados a este mtodo son:


las soluciones no siempre son las mejores o correctas conocimiento limitado frente al dominio de un experto carecen del sentido comn o criterio que puede tener un experto es difcil extraer todo el conocimiento que maneja un experto

Experiencia, Habilidades y Conocimiento. Los tipos de experiencia que son de inters en los sistemas basados en conocimiento, pueden ser clasificados en tres categoras: asociativa, motora y terica. Los sistemas basados en conocimiento son excelentes para representar conocimiento asociativo. Este tipo de experiencia refleja la habilidad heurstica o el conocimiento que es adquirido mayoritariamente, a travs de la observacin. Puede ser que no se comprenda exactamente lo que ocurre al interior de un sistema (caja negra), pero se pueden asociar entradas o estmulos con salidas o respuestas, para resolver problemas que han sido previamente conocidos. La experiencia motora es ms fsica que cognitiva. La habilidad se adquiere fundamentalmente a travs del ejercicio y la prctica fsica constante. Los sistemas basados en conocimiento no pueden emular fcilmente este tipo de experiencia, principalmente por la limitada capacidad de la tecnologa robtica. La experiencia terica y el conocimiento profundo permite que los humanos puedan resolver problemas que no se han visto antes, es decir, no existe una posibilidad asociativa. El conocimiento terico y profundo se adquiere a travs de estudio y entrenamiento formal, as como por medio de la resolucin directa de problemas. Debido a su naturaleza terica, este conocimiento se puede olvidar fcilmente, a no ser que se use en forma continua. Al momento, los sistemas convencionales basados en conocimiento tienen muchas dificultades para duplicar este tipo de experiencia. Sin embargo, los Sistemas de Razonamiento Basado en Modelos representan un notable intento de encapsular este conocimiento profundo y razonar con l.

ESTRUCTURA DE LOS SISTEMAS BASADOS EN CONOCIMIENTO

ESTRUCTURA DE LOS SISTEMAS BASADOS EN CONOCIMIENTO

La arquitectura de un sistema basado en conocimiento de alguna manera refleja la estructura cognitiva y los procesos humanos. La primera parte es la memoria de largo plazo, en la que guarda los hechos (Base de Hechos) y los conocimientos (Base de Conocimientos) acerca del dominio en el que tiene experiencia. La segunda parte es el sistema que realiza la funcin de razonamiento para resolver problemas (Motor de Inferencia). Finalmente, la tercera parte la conforman las unidades de entrada y salida que permiten la comunicacin entre el sistema y su entorno. La representacin del conocimiento determina el desarrollo de un sistema experto e influye en las estrategias de control. Es muy verstil, hay muchas formas de hacerlo y es complicada la eleccin. Generalmente la eleccin est basada en la intuicin o en las especiales circunstancias del problema. La primera fase es la adquisicin del conocimiento desde un experto y depende de la cantidad y de su adecuada representacin. Se deben conocer los lmites, pues slo llegan hasta donde son capaces de resolver un problema. Esto implica, que tiene que circunscribirse a un dominio homogneo

BUSINESS INTELIGENCE

Qu es el Business Intelligence? Para poder conseguir este objetivo, primero es preciso conocer que es el Business Intelligence o Inteligencia de Negocio: Desafortunadamente, este trmino no tiene nada que ver con el ndice de inteligencia medio de las personas que trabajan en un determinado negocio. De hecho, (BI) tiene que ver con los datos y aplicaciones de un negocio para entenderse mejor. Semejante a la inteligencia militar, que procura entender al enemigo, la inteligencia de negocio versa sobre todo alrededor de si mismo. Especficamente, los sistemas de la inteligencia de negocio se basan en crear modelos informticos de negocio de modo que pueda funcionar ms eficientemente. El almacenamiento de los datos est en la base de los procesos de la inteligencia de negocio. En el mundo de ETL, la inteligencia de negocio se refiere generalmente al espacio entero de los sistemas de la base de datos, del software, del anlisis, y de la evaluacin del usuario que pretende entender y evaluar un negocio. Hay generalmente unos o ms usos analticos del software Los sistemas del BI se diferencian de sistemas operacionales en que estn optimizados para preguntar y divulgar sobre datos.

Esto significa tpicamente que, en un Datawarehouse, los datos estn desnormalizados para apoyar preguntas de alto rendimiento, mientras que los sistemas operacionales generalmente se normalizan completamente para apoyar integridad de referencia y para insertar datos continuamente.

Qu es el Business Intelligence? (cont)

Esto significa tpicamente que, en un Datawarehouse, los datos estn desnormalizados. para apoyar preguntas de alto rendimiento, mientras que los sistemas operacionales generalmente se normalizan completamente para apoyar integridad de referencia y para insertar datos continuamente.

Los procesos de ETL que cargan sistemas del BI tienen que traducir del sistema operacional normalizado a desnormalizado.
Y, tpicamente, tienen fallos severos de funcionamiento debido a que no deben degradar el funcionamiento de los sistemas operacionales, y no deben prohibir el acceso al almacn. Por eso surge el Business Intelligence, basado en nuevas estructuras de anlisis, bsicamente multidimensional, en contraste con el relacional.

DATAWAREHOUSE
Que es un Data WareHouse?
Es un repositorio de datos de muy fcil acceso, alimentado de numerosas fuentes, transformadas en grupos de informacin sobre temas especficos de negocios, para permitir nuevas consultas, anlisis, reporteador y decisiones.

Que es lo que le preocupa a los ejecutivos?


Se tienen montaas de datos en la compaa, pero no podemos llegar a ellos adecuadamente. Nada enloquece ms a los ejecutivos que dos personas presentando el mismo resultado de operacin pero con diferentes nmeros y los ejecutivos lo que buscan es ver la informacin pero desde diferentes ngulos, mostrando nicamente lo que es importante para tomar una decisin en la empresa, finalmente los ejecutivos saben que hay datos que nunca sern confiables, por lo que prefieren que se eviten en los reportes ejecutivos. Uno de los valores ms importantes de una organizacin es la informacin. Estos valores normalmente son guardados por la organizacin de dos formas: Los sistemas operacionales de registros Y el Data Warehouse Crudamente hablando, los sistema operacionales de registros es donde los datos son depositados y el Data WareHouse es de donde se extraen eso datos.

OBJETIVOS DE UN DATAWAREHOUSE

Hace que la informacin de la organizacin sea accesible: los contenidos del Data WareHouse son entendibles y navegables, y el acceso a ellos son caracterizado por el rpido desempeo. Estos requerimientos no tienen fronteras y tampoco limites fijos. Cuando hablamos de entendible significa, que los niveles de la informacin sean correctos y obvios. Y Navegables significa el reconocer el destino en la pantalla y llegar a donde queramos con solo un clic. Rpido desempeo significa, cero tiempo de espera. Todo lo dems es un compromiso y por consiguiente algo que queremos mejorar. Hacer que la informacin de la organizacin sea consistente: la informacin de una parte de la organizacin puede hacerse coincidir con la informacin de la otra parte de la organizacin. Si dos medidas de la organizacin tienen el mismo nombre, entonces deben significar la misma cosa. Y a la inversa, si dos medidas no significan la misma cosa, entonces son etiquetados diferentes. Informacin consistente significa, informacin de alta calidad. Significa que toda la informacin es contabilizada y completada. Todo lo dems es un compromiso y por consiguiente algo que queremos mejorar.

OBJETIVOS DE UN DATAWAREHOUSE (CONT)

Es informacin adaptable y elstica: el Data WareHouse esta diseado para cambios continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los datos existentes y las tecnologas no cambian ni se corrompen. Cuando se agregan datos nuevos al Data WareHouse, los datos existentes y las tecnologas tampoco cambian ni se corrompen. El diseo de Data Marts separados que hacen al Data WareHouse, deben ser distribuidos e incrementados. Todo lo dems es un compromiso y por consiguiente algo que queremos mejorar. Es un seguro baluarte que protege los valores de la informacin: el Data WareHouse no solamente controla el acceso efectivo a los datos, si no que da a los dueos de la informacin gran visibilidad en el uso y abusos de los datos, an despus de haber dejado el Data WareHouse. Todo lo dems es un compromiso y por consiguiente algo que queremos mejorar. Es la fundacin de la toma de decisiones: el Data WareHouse tiene los datos correctos para soportar la toma de decisiones. Solo hay una salida verdadera del Data WareHouse: las decisiones que son hechas despus de que el Data WareHouse haya presentado las evidencias. La original etiqueta que preside el Data WareHouse sigue siendo la mejor descripcin de lo que queremos construir: un sistema de soporte a las decisiones

DISEO DE UN DATAWAREHOUSE

ELEMENTOS DE UN DATAWAREHOUSE
Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes tambin se le conoce como Legacy System. rea de trafico de datos: es un rea de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data WareHouse. Servidor de presentacin: la maquina fsica objetivo en donde los datos del Data WareHouse son organizados y almacenados para queries directos por los usuarios finales, reportes y otras aplicaciones. Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa para los modelos de entidad relacin. Procesos de negocios: un coherente grupo de actividades de negocio que hacen sentido a los usuarios del negocio del Data WareHouse. Data Mart: un subgrupo lgico del Data WareHouse completo. Data WareHouse: bsquedas fuentes de datos de la empresa. Y es la unin de todos los data marts que la constituyen. Almacenamiento operacional de datos: es el punto de integracin por los sistemas operacionales. Es el acceso al soporte de decisiones por los ejecutivos. OLAP: actividad general de bsquedas para presentacin de texto y nmeros del Data WareHouse, tambin un estilo dimensional especifico de bsquedas y presentacin de informacin y que es ejemplificada por vendedores de OLAP. ROLAP: un grupo de interfases de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional.

ELEMENTOS DE UN DATAWAREHOUSE

MOLAP: un grupo de interfases de usuarios, aplicaciones y propietarios de tecnologa de bases de datos que tienen un fuerte estilo dimensional. Aplicaciones para usuarios finales: una coleccin de herramientas que hacen los queries, analizan y presentan la informacin objetivo para el soporte de las necesidades del negocio. Herramientas de acceso a datos por usuarios finales: un cliente de Data WareHouse. Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propios queries manipulando directamente las tablas relacionales y sus uniones. Modelado de aplicaciones: un sofisticado tipo de cliente de Data WareHouse con capacidades analticas que transforma o digiere las salidas del Data WareHouse. Meta Data: toda la informacin en el ambiente del Data WareHouse que no son as mismo los datos actuales.

PROCESOS BSICOS DE UN DWH

Extraccin: este es el primer paso de obtener la informacin hacia el ambiente del Data WareHouse.

Transformacin: una vez que la informacin es extrada hacia el rea de trafico de datos, hay posibles paso de transformacin como; limpieza de la informacin, tirar la basura que no nos sirve, seleccionar nicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, hacindolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensin. Carga: al final del proceso de transformacin, los datos estn en forma para ser cargados.

Вам также может понравиться