Вы находитесь на странице: 1из 25

REPBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA DEFENSA UNIVERSIDAD NACIONAL EXPERIMENTAL POLITCNICA DE LA FUERZA ARMADA

UNEFA NCLEO LARA

AGENTES Definicin Un agente es una entidad capaz de percibir su entorno, procesar tales percepciones y responder o actuar en su entorno de manera racional, es decir, de manera correcta y tendiendo a maximizar un resultado esperado. En este contexto la racionalidad es la caracterstica que posee una eleccin de ser correcta, ms especficamente, de tender a maximizar un resultado esperado. Un agente inteligente se considera as, dado que es un programa de

ordenador capaz de hacer lo que haramos nosotros si tuviramos tiempo, es decir; es un tipo de programa informtico que, por encargo de un usuario u otro programa, realiza de forma autnoma tareas que requieren cierto grado de inteligencia y aprendizaje. Arquitecturas de agentes Una arquitectura de agentes es una metodologa particular para construir agentes. La cul especifica cmo el agente puede ser descompuesto en un conjunto de mdulos componentes y cmo estos mdulos pueden interactuar. El conjunto total de mdulos y sus interacciones deben proveer una respuesta a la pregunta de cmo el dato monitoreado y el estado interno del agente determinan las acciones y estados internos futuros. Observa tres categoras principales: Arquitecturas de Agentes Deliberativos: Contiene un mundo

representado explcitamente y un modelo lgico del mismo, en la cual las decisiones (por ejemplo acerca de las acciones a realizar) son hechas por medio de un razonamiento lgico, basado en concordancia de patrones y manipulacin simblica.

Ejemplos: Planning Agents: Desde inicios de los setenta, la comunidad de la Inteligencia Artificial dedicada al Planning ha estado fuertemente

relacionado con el diseo de agentes. Parece razonable entonces, que muchas de las innovaciones en el diseo de agentes provengan de esa comunidad. IRMA: Intellince Resource-bounded Machine Architecture (IRMA).Esta

arquitectura tiene cuatro estructuras claves, de datos simblicos: una librera de planes, una representacin explcita de creencias, deseos e intenciones. HOMER: En el se argumenta que el establecimiento de tecnologas para agentes inteligentes est lo suficientemente desarrollada, como para construir un agente prototipo autnomo con habilidades lingsticas, capacidades de planeacin y accin, etc. GRATE: GRATE es una arquitectura en capas en la que el comportamiento de un agente es guiado por actitudes mentales tales como creencias, deseos, intenciones e intenciones colectivas. Los agentes se dividen en dos partes distintas: un sistema de nivel de dominio y una capa de cooperacin y control. BDI: BDI significa creencias (Beliefs), deseos (Desires) e intenciones (Intention), que son componentes mentales presentes en muchas arquitecturas de agentes. Las creencias representan el conocimiento del agente, los deseos representan los objetivos y las intenciones otorgan deliberacin al agente. Arquitecturas de Agentes Reactivos Una arquitectura para agente reactivo es aquella que no incluye ningn tipo de modelo simblico central del mundo, y no utiliza razonamiento simblico complejo. Ejemplos:

Sumbsumption

Architecture:

Consiste

en

una

jerarqua

de

comportamientos de logro de tareas. Cada comportamiento compite con otros para ejercer control sobre el agente. Capas menores representan comportamientos de tipo ms primitivo, (tal como evitar obstculos, por ejemplo), y tienen precedencia sobre las capas superiores de la jerarqua. PENGI: Chapman y Agre observaron en, que la mayora de las actividades cotidianas son rutinas, en el sentido que se requiere poco (o ningn) nuevo razonamiento. La mayora de las tareas, una vez aprendidas, pueden ser desarrolladas de una manera rutinaria, con poca variacin. Situated Automata: En el paradigma situated automata un agente se especifica en trminos declarativos. Esta especificacin se compila luego a una mquina digital, que satisface la especificacin declarativa. Esta mquina digital puede operar de una manera time-bounded; no realiza ningn tipo de manipulacin simblica, y de hecho ninguna expresin simblica se representa en la mquina. Arquitectura de Red de agentes. Pattie Maes ha desarrollado una arquitectura de agentes en la cual un agente se define como un conjunto de mdulos de competencia. Estos mdulos asemejan ligeramente el comportamiento de la arquitectura subsumption. Arquitecturas para Agentes Hbridos Un enfoque completamente deliberativo uno completamente reactivo no es adecuado para construir agentes, segn investigadores. Por lo cul se dan los sistemas hbridos, que intentan unir los enfoques deliberativos y reactivos. Un enfoque obvio es construir un agente compuesto por dos subsistemas: Deliberativo, que contiene un mdulo simblico del mundo, que desarrolla planes y efecta decisiones de la manera propuesta por la inteligencia artificial simblica.

Reactivo, que es capaz de reaccionar a eventos que ocurren en el ambiente sin necesitar un razonamiento complejo. Ejemplos PRS: De la misma manera que IRMA, el PRS es una arquitectura basada en creencias, deseos e intenciones, que incluye una librera de planes, as como una explcita representacin simblica de las creencias, deseos e intenciones. TouringMachines: La arquitectura consiste de subsistemas de percepcin y accin, que realizan la interfaz directamente con el ambiente del agente, y de tres capas de control, contenidas en un framework de control, que media entre las capas. Cada capa es un proceso independiente, productor de actividad, que se ejecuta continuamente. COSY: La arquitectura COSY es un BDI (creencias, deseos e intenciones) hbrido que incluye elementos tanto de PRS como de IRMA. La arquitectura tiene cinco componentes principales:

sensores, actuadores, comunicaciones, cognicin, intencin. Los primeros tres componentes son directos: los sensores reciben entradas perceptibles no comunicativas, los actuadores permiten al agente realizar acciones no comunicativas, y el componente comunicaciones permite al agente enviar mensajes BDI Composicional: En esta arquitectura, el modelo genrico de un agente con arquitectura composicional es refinado en un modelo BDI genrico racional, en el cual el agente es capaz de razonamiento explcito acerca de sus creencias, deseos e intenciones. El modelo BDI Composicional est basado en un anlisis de las tareas desarrolladas por un agente BDI. Tal anlisis de tareas, resulta, en una composicin (jerrquica) de tareas, que es la base para un modelo composicional.

Tipos de agentes

Agente Estndar: Un agente modelado por una funcin que hace corresponder acciones a secuencias de estados del entorno.

Sean E = {e1, e2,...} estados del entorno. A = {a1, a2,...} repertorio de acciones del agente. E --> A Agentes Puramente Reactivo: Deciden la accin a realizar teniendo en cuenta el estado actual del entorno, sin tener en cuenta su historia. Ante los cambios de estado (E) del entorno se forma un conjunto de percepciones (P) que conducen a las acciones (A) E --> P. P --> A Agentes que mantienen su estado interno: Deciden la accin a realizar teniendo en cuenta su historia de interacciones con el entorno, la secuencia de estados con el entorno o de percepciones. Ante un estado adems de percibirlo va guardando la informacin (I) sobre su historia. O sea antes de ejecutar la accin se combina la percepcin con la informacin (estructura de datos sobre la historia) E --> P, IxP --> A

Las propiedades indispensables de un agente son: Autonoma: es la capacidad de operar sin la intervencin directa de los humanos, y de tener algn tipo de control sobre las propias acciones y el estado interno.

Sociabilidad/Cooperacin: los agentes han de ser capaces de interactuar con otros agentes a travs de algn tipo de lenguaje de comunicacin.

Reactividad: los agentes perciben su entorno y responden en un tiempo razonable a los cambios detectados. Pro-actividad o iniciativa: deben ser capaces de mostrar que pueden tomar la iniciativa en ciertos momentos.

Otras propiedades destacables seran: Movilidad: posibilidad de moverse a otros entornos a travs de una red electrnica. Continuidad temporal: los agentes estn continuamente ejecutando procesos. Veracidad: un agente no comunicar informacin falsa

premeditadamente. Benevolencia: es la propiedad que indica que un agente no tendr objetivos conflictivos, y que cada agente intentar hacer lo que se le pide. Racionalidad: el agente ha de actuar para conseguir su objetivo. Aprendizaje: mejoran su comportamiento con el tiempo. Inteligencia: usan tcnicas de IA para resolver los problemas y conseguir sus objetivos. Categora de agentes Agentes colaborativos: Este tipo de agentes se enfatiza en la autonoma y las habilidades sociales con otros agentes para ejecutar las tareas de sus usuarios. La coordinacin de los agentes se logra mediante la negociacin para alcanzar acuerdos que sean aceptables para los agentes negociantes. Los agentes colaborativos son capaces de actuar racionalmente y autnomamente en ambientes multiagente y con restricciones de recursos

Los agentes colaborativos se pueden utilizar es la solucin de algunos de los siguientes problemas: Para resolver problemas que son muy grandes para un agente centralizado. Para permitir la interconexin e interoperabilidad de sistemas de IA existentes como sistemas expertos, sistemas de soporte de decisin etc. Solucionar problemas que son inherentemente distribuidos. Agentes de Interface: Los agentes de interfaz se enfatizan en la autonoma y la adaptabilidad para realizar tareas a sus usuarios. Este tipo de agentes bsicamente presta soporte y asistencia a un usuario que esta aprendiendo una nueva aplicacin o nuevos conceptos. El agente puede aprender mediante alguna de las siguientes cuatro tcnicas, observando y monitoreando la interfaz: Por observacin e imitacin del usuario. A travs de una retroalimentacin positiva o negativa del usuario. Recibiendo instrucciones explicitas del usuario. Asesorndose de otros agentes. Agentes mviles: Estos agentes se enfatizan en las habilidades sociales y la autonoma, a diferencia de los agentes cooperativos, estos son mviles. Los agentes mviles son procesos de software que son capaces de transitar por una red, generalmente una WAN, interactuando con computadores alejados, reuniendo informacin para el usuario y volviendo a su origen cuando las tareas fijadas por el usuario se hayan completado. Agentes de informacin: Los agentes de informacin nacieron debido a la gran cantidad de herramientas que surgieron para el manejo y recuperacin de informacin. Los agentes de informacin tienen los roles de manejar, manipular, e integrar informacin de muchas fuentes de datos distribuidas. Agentes de informacin o internet: Los agentes de informacin surgen de la necesidad de manejar el crecimiento de informacin que se encuentra en la Internet y poder sacar de ella los mayores beneficios. Los agentes de

informacin se encargan de manejar, manipular y coleccionar informacin de muchas fuentes distribuidas. Los agentes de informacin son similares a los agentes de interfaz o a los agentes mviles. Si son estticos, entonces se les aplica los cambios de los agentes de interfaz. Sin embargo, si son mviles se les aplican los cambios de los agentes mviles. Agentes Reactivos: reaccionan a cambios de su medio ambiente o a

mensajes provenientes de otros agentes. No son capaces de razonar acerca de sus intenciones. Sus acciones se realizan como resultado de reglas que se disparan o de la ejecucin de planes. Agentes hbridos: Los agentes hbridos se refieren a aquellos cuya constitucin es una combinacin de dos o ms filosofas de agentes para formar un agente nico. Agentes inteligentes: Un agente inteligente, es una entidad capaz de percibir su entorno, procesar tales percepciones y responder o actuar en su entorno de manera racional, es decir, de manera correcta y tendiendo a maximizar un resultado esperado. Es capaz de percibir su medioambiente con la ayuda de sensores y actuar en ese medio utilizando actuadores (elementos que reaccionan a un estmulo realizando una accin). Programas de Agente: Es una funcin que, a partir de las percepciones del agente, le permite realizar las acciones. El trabajo de la IA es disear el programa del agente. Tipos Programas de Agente Reactivos Simples: Este tipo de agente no contiene

Agentes

internamente estados y sus procesos o acciones que realiza son respuestas a la entrada de percepciones. Ignoran las percepciones histricas.

Agentes reactivos basados en modelos (con estado interno): Este tipo de agente guarda estados internos sobre la historia percibida lo cual le sirve para ejecutar una accin. Los sensores no nos pueden informar a la vez de todos los estados que maneja nuestro ambiente, es por este caso que el agente necesita actualizar algo de informacin en el estado interno. Agentes basados en metas: Adems de los estados, los agentes necesitan cierto tipo de informacin sobre sus metas Estas metas van a detallar las situaciones a las que se desea llegar de este modo, el programa de agente puede combinar las metas con la informacin de los resultados (acciones) que emprenda y de esta manera poder elegir aquellas acciones que permitan alcanzar la meta. Agentes Basados en Utilidad: Utiliza un modelo del mundo, junto con una funcin de utilidad que calcula sus preferencias entre los estados del mundo. Despus selecciona la accin que le lleve a alcanzar la mayor utilidad esperada, entre todos los resultados posibles.

Agentes y la sociedad de la informacin agentes informativos Se define el concepto agentes informativos, se analiza su intervencin en el desarrollo de la Sociedad de la Informacin, se caracterizan sus rasgos definitorios y se tipifican sus mbitos de participacin en el desarrollo de la sociedad Las sociedades se construyen en base a la interaccin conflictiva entre humanos organizados en y alrededor de una estructura social dada. La estructura social est formada por la conjuncin de relaciones de produccin y consumo, relaciones de experiencia y relaciones de poder Objetivos

Identificar a los principales actores que participan en los procesos de creacin, uso y difusin de la informacin, requeridos en el contexto de la Sociedad de la Informacin. Describir y analizar de las funciones caractersticas que desarrollan los principales agentes informativos identificados. Conocer y comprender los principales procesos y actividades sociales que resultan afectados por la participacin de nuevos agentes informativos en los procesos de creacin, uso y difusin de la informacin necesaria para la generacin del conocimiento. Comprender el concepto industrias de la informacin y conocer el alcance de los diferentes sectores o campos afectados por ellas. Sistema MultiAgente Es un sistema compuesto por mltiples agentes inteligentes que interactan entre ellos. Los sistemas multiagente pueden ser utilizados para resolver problemas que son difciles o imposibles de resolver para un agente individual o un sistema monoltico. Las principales ventajas de la utilizacin de un sistema multiagente son: Modularidad: se reduce la complejidad de la programacin al trabajar con unidades ms pequeas, que permiten una

programacin ms estructurada. Eficiencia: la programacin distribuida permite repartir las tareas entre los agentes, consiguiendo paralelismo (agentes trabajando en diferentes mquinas). Fiabilidad: el hecho de que un elemento del sistema deje de funcionar no tiene que significar que el resto tambin lo hagan; adems, se puede conseguir ms seguridad replicando servicios crticos y as conseguir redundancia. Un sistema multiagente est constituido por un conjunto de entidades inteligentes llamadas agentes que coordinan sus habilidades para la resolucin de

problemas individuales o globales. Estos sistemas considerados como un todo, exhiben caractersticas particulares, que se presentan a continuacin: Organizacin Social Es la manera como el grupo de agentes est constituido en un instante dado. La organizacin social est relacionada con la estructura de los componentes funcionales del sistema, sus

caractersticas, sus responsabilidades, sus necesidades y la manera como realizan sus comunicaciones. Esta organizacin puede ser esttica o dinmica, dependiendo de las unciones o tareas de cada agente. Se puede considerar que una sociedad de agentes est constituida por tres elementos: Un grupo de agentes. Un conjunto de tareas a realizar. Un conjunto de recursos. La organizacin en los SMA depende del tipo de comunicacin y el modo de cooperacin entre agentes, as como del tipo de agentes que conforman el grupo. En general se pueden distinguir tres tipos de configuraciones

organizacionales: Estructura Centralizada: En este tipo de configuracin existe un agente que controla la interaccin de los dems agentes del sistema, porque tiene la informacin o la funcionalidad para hacerlo. Estructura Horizontal: Este tipo de configuracin existe cuando todos los agentes que integran un sistema estn al mismo nivel, es decir, no hay ningn agente que haga las veces de maestro o supervisor, ni tampoco agentes esclavos. Estructura Jerrquica: Esta configuracin existe cuando los agentes trabajan diferentes niveles de abstraccin de un problema, es decir, la configuracin es de niveles.

Estructura "ad hoc: Esta configuracin puede ser una mezcla de las tres anteriores, se caracteriza porque la dinamicidad de la estructura est regida por el ajuste mutuo entre los pequeos grupos de agentes en el sistema. Cooperacin: En un SMA existen dos tipos de tareas que deben ser realizadas: las tareas locales y las tareas globales. Las tareas locales son las tareas relacionadas con los intereses individuales de cada agente y las tareas globales son las tareas relacionadas con los intereses globales del sistema. Para que los agentes puedan cooperar de manera eficiente, cada uno de ellos debe tener ciertas caractersticas: Tener un modelo bien definido del mundo, que le permite localizar a los dems agentes, saber cmo comunicarse con ellos, qu tareas pueden realizar, etc. Poder integrar informacin de otros agentes con la suya, para formar conceptos globales o conocimiento conformado por varios agentes. Coordinacin: La coordinacin entre un grupo de agentes les permite considerar todas las tareas a realizar y coordinarlas para no ejecutar acciones no deseables, por ejemplo: Los agentes no generen y comuniquen subsoluciones que lleven al progreso en la solucin de un problema. Coordinacin Global: Cuando el SMA determina y planifica globalmente las acciones de los diferentes agentes. Coordinacin Individual: Cuando el SMA le da completa autonoma a los agentes, es decir, cada agente decide qu hacer y resuelve localmente los conflictos que detecte con otros agentes. Comunicacin e interaccin de los agentes

Caracterizacin

Las interacciones; ocurren cuando los agentes existen y actan en las proximidades el medio ambiente compartido los recursos compartidos La comunicacin se produce cuando los agentes enviar mensajes el uno al otro con el fin de influir en las creencias e intenciones. Los detalles de implementacin son irrelevantes; A travs de enlaces de comunicacin A travs de la memoria compartida Debido a las convenciones compartidas Sealizacin frente a "hablar" "Lenguaje corporal" Agentes software (softbots): actan en entornos virtuales (p.e. Internet) todo software: no necesitan manipular fsicamente el entorno sensores y efectores: dependientes del entorno

Aplicaciones En estos momentos el desarrollo se est llevando a cabo en distintos tipos de agentes. A continuacin enumeramos algunas de las reas identificadas como las ms prometedoras para la aplicacin de esta tecnologa. Gestin de Redes y Sistemas. La gestin de sistemas y redes es una de las primeras reas que estn recibiendo el impacto de la tecnologa de los agentes inteligentes. El creciente uso de la arquitectura cliente/servidor ha intensificado la complejidad de los sistemas utilizados. Movilidad. De la misma manera que la informtica ha evolucionado de la mquina centralizada hacia las redes, los usuarios lo han hecho hacia una mayor movilidad. Ahora no slo se precisa un acceso a los recursos de la red desde cualquier ubicacin, sino que adems este acceso debe ser satisfactorio a pesar de las limitaciones del ancho de banda que presenta la tecnologa mvil tales como la comunicacin sin cables.

Correo y Mensajera. El software de mensajera (como por ejemplo, las aplicaciones de correo electrnico) ha ido evolucionando para mejorar el servicio de los usuarios y es un rea donde la introduccin de la tecnologa de los agentes inteligentes parece muy propicia ya que el futuro de estas aplicaciones pasa por la delegacin de la toma de decisiones del usuario en el agente de correo.

Gestin y Acceso a la Informacin. El acceso y gestin de la informacin es un rea con gran actividad, dado el gran crecimiento que se esta produciendo en Internet y la consiguiente explosin de datos disponibles para los usuarios. Aqu los agentes inteligentes no solo ayudan en las tareas de bsqueda y filtrado, sino que tambin lo hacen en la clasificacin, establecimiento de prioridad, descarte selectivo, anotacin y comparticin y colaboracin de informacin y documentos.

Workflow

y Gestin

Administrativa.

Estos sistemas ayudan a

automatizar los procesos de negocio, asegurando que diferentes tareas son ejecutadas por las personas idneas en el momento adecuado, adems de asegurar que el flujo de documentos se gestiona correctamente dentro de la organizacin. El sistema ADEPT es un ejemplo de sistema gestor de procesos de negocio basado en agentes. En este sistema cada departamento y cada persona perteneciente a un departamento se convierten en agentes. Para conseguir sus objetivos individuales necesitan interaccionar entre ellos. Comercio Electrnico. El comercio electrnico es un rea de gran crecimiento debido a la creciente popularidad de Internet. Los compradores necesitan encontrar vendedores de productos y servicios, necesitan informacin de los productos que solucionen sus problemas, y tambin precisarn de consejo experto tanto antes de la compra como despus, durante el soporte. Interfaces de Usuario Adaptativos. Al tiempo que avanzan las capacidades y aplicaciones de los ordenadores, el interfaz de usuario

necesita incorporar tal aumento de complejidad. Y adems, los usuarios de ordenadores son un grupo cada vez ms numeroso y disperso, de forma que los interfaces del ordenador deben aprender los hbitos y preferencias del usuario y adaptarse a las individualidades de cada persona. Los agentes inteligentes (llamados agentes de interfaz) pueden ayudar con estos problemas, ya que permite al sistema monitorizar las acciones de los usuarios, desarrollar modelos sobre ellos, y automatizar la ayuda cuando surgen los problemas. Agentes para Gestin de Sistemas Industriales. Probablemente el mayor sistema multiagente, y tambin el mas conocido en Europa, en este campo sea ARCHON. Desarrollado por un consorcio de empresas y centros de investigacin europeos y que se encuentra en funcionamiento para controlar la red de distribucin de energa del Pas Vasco. ARCHON tiene dos partes principales: Un domain component que realiza la funcin especifica del dominio del agente; y un wrapper component que proporciona al agente funcionalidad, permitiendo al sistema que planifique sus acciones y que sea capaz de comunicarse con otros agentes. Simulacin Social

Una de las visiones detrs de los sistemas multiagente es la de utilizarlos como herramientas experimentales en las ciencias sociales. Es decir, se pueden utilizar agentes para simular el comportamiento de las sociedades humanas. El proyecto EOS, llevado a cabo por la Universidad de Essex en el Reino Unido, es un buen ejemplo de simulador de la sociedad. El objetivo del proyecto era investigar las causas de la aparicin de una compleja sociedad en Francia durante el Paleoltico Superior. Conclusiones Hoy en da en la sociedad que vivimos es una sociedad dominada por la informacin, que se ha convertido en la materia prima ms valiosa. Es el Internet

quien est posibilitando cambios destacados en nuestros modos de vida. Sin embargo, no todo es positivo: la bsqueda de informacin en la web todava es muy catica y dista mucho de ser una verdadera infraestructura de informacin para los usuarios. La bsqueda mediante buscadores conlleva mucho tiempo y esfuerzo si se desean agotar todas las posibilidades. La aparicin de agentes inteligentes ha conllevado un avance significativo en este mbito ya que permiten realizar la bsqueda simultneamente en varios motores de bsqueda, comparar los resultados y ofrecer un listado preciso al usuario. El desarrollo de agentes est ligado a lo que se conoce como web semntica en la que todo lo que circule por la web ser entendible no solo por el usuario sino tambin por la mquina. Las posibilidades ofrecidas por los agentes generan una serie de problemas que cabe tener en cuenta. En primer lugar, los agentes existentes en la actualidad necesitan de una gran cantidad de recursos para funcionar, tanto a nivel de mquina del usuario como a nivel de red. En segundo lugar, las habilidades que puedan tener estos agentes pueden resultar una amenaza para la privacidad e intimidad de los usuarios desde el momento que registran sus gustos, preferencias, maneras de actuar, etc.

MINERA DE DATOS Definicin La minera de datos (DM, Data Mining) consiste en la extraccin no trivial de informacin que reside de manera implcita en los datos. En otras palabras, la minera de datos prepara, sondea y explora los datos para sacar la informacin oculta en ellos. Bajo el nombre de minera de datos se engloba todo un conjunto de tcnicas encaminadas a la extraccin de conocimiento procesable, implcito en las bases de datos. Est fuertemente ligado con la supervisin de procesos industriales ya que resulta muy til para aprovechar los datos almacenados en las bases de datos. Las bases de la minera de datos se encuentran en la inteligencia artificial y en el anlisis estadstico. Mediante los modelos extrados utilizando tcnicas de minera de datos se aborda la solucin a problemas de prediccin, clasificacin y segmentacin. Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Historia de data mining (minera de datos)

La idea de data mining no es nueva. Ya desde los aos sesenta los estadsticos manejaban trminos como data fishing, data mining o data archaeology con la idea de encontrar correlaciones sin una hiptesis previa en bases de datos con ruido. A principios de los aos ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los trminos de data mining y KDD.[3] A finales de los aos ochenta slo existan un par de empresas dedicadas a esta tecnologa; en 2002 existen ms de 100 empresas en el mundo que ofrecen alrededor de 300 soluciones. Las listas de discusin sobre este tema las forman investigadores de ms de ochenta pases. Esta tecnologa ha sido un buen punto de encuentro entre personas pertenecientes al mbito acadmico y al de los negocios. El data mining es una tecnologa compuesta por etapas que integra varias reas y que no se debe confundir con un gran software. Durante el desarrollo de un proyecto de este tipo se usan diferentes aplicaciones software en cada etapa que pueden ser estadsticas, de visualizacin de datos o de inteligencia artificial, principalmente. Actualmente existen aplicaciones o herramientas comerciales de data mining muy poderosas que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con otra herramienta. La minera de datos, entendida como la bsqueda de patrones dentro de grandes bases de datos utilizando para ello mtodos estadsticos y de

aprendizaje basado en computadora, est empezando a extenderse en nuestro pas. Empresas en el sector de telecomunicaciones, financiero y de autoservicio estn en el proceso de adquirir alguna solucin tecnolgica en este campo, por lo que surge una demanda por recursos humanos con conocimientos en minera de datos. Los Fundamentos del Data Mining Las tcnicas de Data Mining son el resultado de un largo proceso de investigacin y desarrollo de productos. Esta evolucin comenz cuando los datos

de negocios fueron almacenados por primera vez en computadoras, y continu con mejoras en el acceso a los datos, y ms recientemente con tecnologas generadas para permitir a los usuarios navegar a travs de los datos en tiempo real. Data Mining toma este proceso de evolucin ms all del acceso y navegacin retrospectiva de los datos, hacia la entrega de informacin prospectiva y proactiva. Data Mining est lista para su aplicacin en la comunidad de negocios porque est soportado por tres tecnologas que ya estn suficientemente maduras: Recoleccin masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Data Mining.

Principales caractersticas y objetivos de la minera de datos Explora los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen informacin almacenada durante varios aos. En algunos casos, los datos se consolidan en un almacn de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. El entorno de la minera de datos suele tener una arquitectura cliente servidor. Las herramientas de la minera de datos ayudan a extraer el mineral de la informacin enterrado en archivos corporativos o en registros pblicos, archivados. El minero es, muchas veces un usuario final con poca o ninguna habilidad de programacin, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas adhoc y obtener rpidamente respuestas.

Las herramientas de la minera de datos se combinan fcilmente y pueden analizarse y procesarse rpidamente. Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minera de datos. La minera de datos produce cinco tipos de informacin: Asociaciones. Secuencias. Clasificaciones. Agrupamientos. Pronsticos. Los mineros de datos usan varias herramientas y tcnicas. La minera de datos es un proceso que invierte la dinmica del mtodo

cientfico en el siguiente sentido: En el mtodo cientfico, primero se formula la hiptesis y luego se disea el experimento para coleccionar los datos que confirmen o refuten la hiptesis. En la minera de datos, se coleccionan los datos y se espera que de ellos emerjan hiptesis. Se busca que los datos describan o indiquen por qu son. Luego entonces, se valida esa hiptesis inspirada por los datos en los datos mismos, ser numricamente significativa, pero experimentalmente invlida. Usar la minera de datos para confirmar las hiptesis formuladas puede ser peligroso, pues se est haciendo una inferencia poco vlida. Actualmente existen aplicaciones o herramientas comerciales de minera de datos muy poderosas que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con otra herramienta. El Alcance de Data Mining El nombre de Data Mining deriva de las similitudes entre buscar valiosa informacin de negocios en grandes bases de datos. Por ej: encontrar informacin de la venta de un producto entre grandes montos de Gigabytes almacenados y

minar una montaa para encontrar una veta de metales valiosos. Ambos procesos requieren examinar una inmensa cantidad de material, o investigar

inteligentemente hasta encontrar exactamente donde residen los valores. Dadas bases de datos de suficiente tamao y calidad, la tecnologa de Data Mining puede generar nuevas oportunidades de negocios al proveer estas capacidades: Prediccin automatizada de tendencias y comportamientos. Data Mining automatiza el proceso de encontrar informacin predecible en grandes bases de datos. Preguntas que tradicionalmente requeran un intenso anlisis manual, ahora pueden ser contestadas directa y rpidamente desde los datos. Un tpico ejemplo de problema predecible es el marketing apuntado a objetivos (targeted marketing). Descubrimiento automatizado de modelos previamente desconocidos. Las herramientas de Data Mining barren las bases de datos e identifican modelos previamente escondidos en un slo paso. Otros problemas de descubrimiento de modelos incluye detectar transacciones fraudulentas de tarjetas de crditos e identificar datos anormales que pueden representar errores de tipiado en la carga de datos. Las tcnicas de Data Mining pueden redituar los beneficios de automatizacin en las plataformas de hardware y software existentes y puede ser implementada en sistemas nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean desarrollados. Cuando las herramientas de Data Mining son implementadas en sistemas de procesamiento paralelo de alta performance, pueden analizar bases de datos masivas en minutos. Procesamiento ms rpido significa que los usuarios pueden automticamente experimentar con ms modelos para entender datos complejos. Alta velocidad hace que sea prctico para los usuarios analizar inmensas cantidades de datos. Una arquitectura para Data Mining

Para aplicar mejor estas tcnicas avanzadas, stas deben estar totalmente integradas con el data warehouse as como con herramientas flexibles e interactivas para el anlisis de negocios. Varias herramientas de Data Mining actualmente operan fuera del warehouse, requiriendo pasos extra para extraer, importar y analizar los datos.. El Data warehouse analtico resultante puede ser aplicado para mejorar procesos de negocios en toda la organizacin, en reas tales como manejo de campaas promocionales, deteccin de fraudes, lanzamiento de nuevos productos, etc. El punto de inicio ideal es un data warehouse que contenga una combinacin de datos de seguimiento interno de todos los clientes junto con datos externos de mercado acerca de la actividad de los competidores. Informacin histrica sobre potenciales clientes tambin provee una excelente base para prospecting.

Fases de un Proyecto de Minera de Datos Los pasos a seguir para la realizacin de un proyecto de minera de datos son siempre los mismos, independientemente de la tcnica especfica de extraccin de conocimiento usada tenemos los siguientes:. Filtrado de datos: El formato de los datos contenidos en la fuente de datos (base de datos, Data Warehouse...) nunca es el idneo, y la mayora de las veces no es posible ni siquiera utilizar ningn algoritmo de minera sobre los datos en bruto. Mediante el preprocesador, se filtran los datos (de forma que se eliminan valores incorrectos, no vlidos, desconocidos... segn las necesidades y el algoritmo a usar), se obtienen muestras de los mismos (en busca de una mayor velocidad de respuesta del proceso), o se reducen el nmero de valores posibles (mediante redondeo, clustering,...).

Seleccin de variables: An despus de haber sido preprocesados, en la mayora de los casos se tiene una cantidad ingente de datos. La seleccin de caractersticas reduce el tamao de los datos eligiendo las variables ms influyentes en el problema, sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minera.

Los mtodos para la seleccin de caractersticas son bsicamente dos: Aquellos basados en la eleccin de los mejores atributos del problema, Y aquellos que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heursticos. Algoritmos de Extraccin de Conocimiento: Mediante una tcnica de minera de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores. Interpretacin y evaluacin: Una vez obtenido el modelo, se debe proceder a su validacin, comprobando que las conclusiones que arroja son vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos.

Aplicaciones de Uso En el Gobierno: El FBI analizar las bases de datos comerciales para detectar terroristas. A principios del mes de julio de 2002, el director, anunci que el Departamento de Justicia comenzar a introducirse en la cantidad de datos comerciales referentes a los hbitos y preferencias de compra de los consumidores, con el fin de descubrir potenciales terroristas. Algunos expertos aseguran que, con esta informacin, el FBI unir todas las bases de datos probablemente mediante el nmero de la Seguridad Social y permitir saber si una persona fuma, qu talla y tipo de ropa usa, su registro de arrestos, En la Empresa: Deteccin de fraudes en las tarjetas de crdito. En 2001, las instituciones financieras a escala mundial perdieron ms de 2.000 millones de dlares estadounidenses en fraudes con tarjetas de crdito y dbito. El Falcon Fraud Manager es un sistema inteligente que examina transacciones, propietarios de tarjetas y datos financieros para detectar y mitigar fraudes. Hbitos de compra en supermercados: Un estudio muy citado detect que los viernes haba una cantidad inusualmente elevada de clientes que adquiran a la vez paales y cerveza. Se detect que se deba a que dicho da solan acudir al supermercado padres jvenes cuya perspectiva para el fin de semana consista en quedarse en casa cuidando de su hijo y viendo la televisin con una cerveza en la mano. Prediciendo el tamao de las audiencias televisivas. En la Universidad: Conociendo si los recin titulados de una universidad llevan acabo actividades profesionales relacionadas con sus estudios.

Вам также может понравиться