You are on page 1of 92

UNIVERSIDAD NACIONAL SAN LUIS

GONZAGA DE ICA

FUNDAMENTOS DE LA
INGENIERIA ARTIFICAL
FACULTAD DE INGENIERIA DE SISTEMAS

INTEGRANTES :
Flores Yarasca, Luis Manuel
Hernndez Ramrez Frank, Carlos
Hernndez Ramos, William Antonio
Oncebay Ochoa, Eduardo Jhoel
Pea Siguas, Jesus Enrique
Pario Prada, Anglica Esther

INDICE
INDICE......................................................................................................... 2
BASES DE LA INTELIGENCIA ARTIFICIAL..........................................................4
1.
2.
3.
4.
5.
6.
7.
8.

FILOSOFA (DESDE EL AO 428 A. C. HASTA EL PRESENTE).................................................4


MATEMTICAS (APROXIMADAMENTE DESDE EL AO 800 AL PRESENTE)..................................6
ECONOMA (DESDE EL AO 1776 HASTA EL PRESENTE)......................................................8
NEUROCIENCIA (DESDE EL AO 1861 HASTA EL PRESENTE).................................................9
PSICOLOGA (DESDE EL AO 1879 HASTA EL PRESENTE)...................................................11
INGENIERA COMPUTACIONAL (DESDE EL AO 1940 HASTA EL PRESENTE).............................12
TEORA DE CONTROL Y CIBERNTICA (DESDE EL AO 1948 HASTA EL PRESENTE)...................14
LINGSTICA (DESDE EL AO 1957 HASTA EL PRESENTE)..................................................14

TCNICAS Y CAMPOS DE LA INTELIGENCIA ARTIFICIAL..................................15


1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

APRENDIZAJE AUTOMTICO (MACHINE LEARNING)............................................................15


REAS Y APLICACIONES:.............................................................................................16
INGENIERA DEL CONOCIMIENTO (KNOWLEDGE ENGINEERING)............................................17
LGICA DIFUSA (FUZZY LOGIC)....................................................................................18
REDES NEURONALES ARTIFICIALES (ARTIFICIAL NEURAL NETWORKS)....................................20
SISTEMAS REACTIVOS (REACTIVE SYSTEMS)....................................................................22
SISTEMAS MULTI-AGENTE (MULTI-AGENT SYSTEMS)..........................................................23
RAZONAMIENTO BASADO EN CASOS (CASE-BASED REASONING).........................................25
SISTEMAS EXPERTOS (EXPERT SYSTEMS)........................................................................26
REDES BAYESIANAS (BAYESIAN NETWORKS)................................................................27
VIDA ARTIFICIAL (ARTIFICIAL LIFE). LA VA NO ES UN CAMPO DE LA IA, SINO QUE LA IA ES UN
CAMPO DE LA VA............................................................................................................. 28
12.
COMPUTACIN EVOLUTIVA (EVOLUTIONARY COMPUTATION).............................................28
13.
ESTRATEGIAS EVOLUTIVAS........................................................................................28
14.
ALGORITMOS GENTICOS (GENETIC ALGORITHMS)........................................................29
15.
TCNICAS DE REPRESENTACIN DE CONOCIMIENTO......................................................29
16.
REDES SEMNTICAS (SEMANTIC NETWORKS)...............................................................30
17.
PROCESAMIENTO DEL LENGUAJE NATURAL (NATURAL LANGUAGE PROCESSING)...................30
18.
MINERA DE DATOS (DATA MINING)...........................................................................31
19.
BIBLIOGRAFA....................................................................................................... 32
SISTEMAS EXPERTOS..................................................................................34
1.
2.
3.
4.
5.
6.
7.

HISTORIA................................................................................................................ 34
DEFINICIN.............................................................................................................. 35
VENTAJAS................................................................................................................ 36
LIMITACIONES........................................................................................................... 36
ARQUITECTURA BSICA DE LOS SISTEMAS EXPERTOS........................................................37
TENDENCIA DE LOS SISTEMAS EXPERTOS........................................................................38
APLICACIONES.......................................................................................................... 38

VIDA ARTIFICIAL.........................................................................................39
1.
2.
3.
4.
5.
6.
7.

DEFINICIN.............................................................................................................. 40
PERSPECTIVA METODOLGICA......................................................................................41
VENTAJAS................................................................................................................ 41
DESVENTAJAS........................................................................................................... 41
EJEMPLOS DE VIDA ARTIFICIAL......................................................................................41
AUTMATAS CELULARES.............................................................................................. 42
APLICACIONES.......................................................................................................... 42

SISTEMAS BASADOS EN EL CONOCIMIENTO..................................................44


1.
2.
3.
4.
5.

RESEA.................................................................................................................. 44
DEFINICIN.............................................................................................................. 46
ARQUITECTURA DE LOS SISTEMAS BASADOS EN CONOCIMIENTO.........................................47
SBC VS. SISTEMAS TRADICIONALES..............................................................................47
SISTEMA EXPERTO Y SISTEMA BASADO EN CONOCIMIENTO: EVOLUCIN.................................48

INTELIGENCIA ARTIFICIAL DISTRIBUIDA........................................................49


1.
2.
3.
4.

MOTIVACIONES......................................................................................................... 49
FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL DISTRIBUIDA.............................................50
RESOLUCIN DISTRIBUIDA DE PROBLEMAS......................................................................52
CARACTERIZACIN..................................................................................................... 53

LGICA DIFUSA..........................................................................................58
INTRODUCCIN................................................................................................................ 58
1. TEORA DE CONJUNTOS DIFUSOS..................................................................................58
2. EL CONTROLADOR DIFUSO.........................................................................................60
3. FUSIFICACIN........................................................................................................... 60
4. BASE DE CONOCIMIENTO............................................................................................ 61
5. INFERENCIA.............................................................................................................. 61
6. DEFUSIFICACIN....................................................................................................... 61
REDES NEURONALES ARTIFICIALES..............................................................62
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.

DEFINICIN Y CARACTERSTICAS...................................................................................62
ARQUITECTURA DE LAS RNA.......................................................................................63
APRENDIZAJE DE LAS RNA.......................................................................................... 64
APRENDIZAJE SUPERVISADO.........................................................................................64
APRENDIZAJE POR CORRECCIN DE ERROR.....................................................................65
APRENDIZAJE POR REFUERZO.......................................................................................65
APRENDIZAJE ESTOCSTICO.........................................................................................65
NO SUPERVISADO O AUTO ORGANIZADO........................................................................66
APRENDIZAJE HEBBIANO.............................................................................................66
APRENDIZAJE COMPETITIVO Y COMPARATIVO................................................................66

COMPUTACIN EVOLUTIVA..........................................................................68
1.
2.
3.
4.
5.
6.
7.
8.
9.

BREVE HISTORIA:...................................................................................................... 68
DEFINICIN:............................................................................................................. 68
REPRESENTACIN GENTICA O CODIFICACIN..................................................................71
FUNCIN DE EVALUACIN O DESEMPEO........................................................................72
OPERADORES GENTICOS............................................................................................72
MUTACIN............................................................................................................... 72
RECOMBINACIN....................................................................................................... 73
SELECCIN.............................................................................................................. 74
REEMPLAZO POBLACIONAL..........................................................................................74

MINERIA DE DATOS.....................................................................................75
1.
2.
3.
4.
5.

MARCO TERICO...................................................................................................... 75
TENDENCIAS O SITUACIN PROBLEMATICA......................................................................86
APLICACIN DE LA MINERA DE DATOS..........................................................................86
CONCLUSIONES Y RECOMENDACIONES...........................................................................86
BIBLIOGRAFA....................................................................................................... 86

BASES DE LA INTELIGENCIA ARTIFICIAL


Esta seccin presenta una breve historia de las disciplinas que han
contribuido con ideas, puntos de vista y tcnicas al desarrollo de la IA. Como
toda revisin histrica, en este caso se centra en un pequeo nmero de
personas, eventos e ideas e ignora otras que tambin fueron importantes. La
historia se organiza en torno a una serie de cuestiones, dejando claro que no se
quiere dar la impresin de que estas cuestiones son las nicas por las que las
disciplinas se han preocupado y que el objetivo ltimo de todas estas disciplinas
era hacer avanzar la IA.

1. Filosofa (desde el ao 428 a. c. hasta el presente)


Se pueden utilizar reglas formales para extraer conclusiones vlidas?
Cmo se genera la inteligencia mental a partir de un cerebro fsico?
De dnde viene el conocimiento'?
Cmo se pasa del conocimiento a la accin?
Aristteles (384-322 a. c.) fue el primero en formular un conjunto preciso
de leyes que gobernaban la parte racional de la inteligencia. l desarroll un
sistema informal para razonar adecuadamente con silogismos, que en principio
permita extraer conclusiones mecnicamente, a partir de premisas iniciales.
Mucho despus, Ramn Lull. (13 15), Tuvo la idea de que el razonamiento til se
podra obtener por medios artificiales. Sus ideas aparecen representadas en
la portada de este manuscrito. Thomas Hobbes (1 588- 1679) propuso que el
razonamiento era como la computacin numrica, de forma que nosotros
sumarnos y restamos silenciosamente en nuestros pensamientos. La
automatizacin de la computacin en s misma estaba en marcha; alrededor de
1500, Leonardo da Vinci (1452- 15 19) dise, aunque no construy, una
calculadora mecnica; construcciones recientes han mostrado que su diseo era
funcional. La primera mquina calculadora conocida se construy alrededor de
1623 por el cientfico alemn Wilhelm Schickard (1592-1635), aunque la
Pascalina, construida en 1642 por Blaise Pascal (1623-1 662), sea ms famosa.
Pascal escribi que la mquina aritmtica produce efectos que parecen ms
similares a los pensamientos que a las acciones animales. Gottfried Wilhelm
Leibniz (1646-17 16) construy un dispositivo mecnico con el objetivo de llevar
a cabo operaciones sobre conceptos en lugar de sobre nmeros, pero su campo
de accin era muy limitado.
Ahora que sabemos que un conjunto de reglas pueden describir la parte
racional y formal de la mente, el siguiente paso es considerar la mente como un
sistema fsico. Ren Descartes (1 596- 1650) proporciona la primera discusin
clara sobre la distincin entre la mente y la materia y los problemas que surgen.
Uno de los problemas de una concepcin puramente fsica de la mente es que
parece dejar poco margen de maniobra al libre albedro: si el pensamiento est
totalmente gobernado por leyes fsicas, entonces una piedra podra decidir
caer en direccin al centro de la Tierra gracias a su libre albedro. A pesar de ser
denodado defensor de la capacidad de razonamiento Descartes fue un defensor
del dualismo. Sostena que existe una parte de la mente (o del alma o del
espritu) que est al margen de la naturaleza, exenta de la influencia (le las

leyes fsicas. Los animales, por el contrario, no poseen esta cualidad dual; ii
ellos se le podran concebir como si se tratasen de mquinas. Una alternativa al
dualismo es el materialismo, que considera que las operaciones del cerebro
realizadas de acuerdo a las leyes de la fsica constituyen la mente. El libre
albedro es simplemente la forma en la que la percepcin de las opciones
disponibles aparecen en el proceso dc seleccin.
Dada una mente fsica que gestiona conocimiento, el siguiente problema
es establecer las fuentes de este conocimiento. El movimiento emprico, iniciado
con el Novum Orginun, de Francis Bacon (1 561 - 1626), se caracteriza por el
aforismo de John Locke (1632- 1704): Nada existe en la mente que no haya
pasado antes por los sentidos. David Hume (1711 - 1776) propuso en Treatise
of Human Nature (Hume 1739) lo que actualmente se conoce como principio
de induccin: las reglas generales se obtienen mediante la exposicin a
asociaciones repetidas entre sus elementos. Sobre la base de las propuestas de
Ludwig Wittginstein (1 889- 1951) y Brertrand Russell (1872 - 1970), el famoso
Crculo de Viena, liderado por Rudolf' Carnap, (1891 - 1970), dcsarrol1o la
doctrina del positivismo lgico. Esa doctrina sostiene quc todo el conocimiento
se puede caracterizar mediante teoras lgicas relacionadas, en ltima
instancia, con sentencias de observacin que corresponden a estmulos
sensoriales. La teora de la confirmacin de Carnap y Carl Hempel (1905 - 1997)
intenta explicar cmo el conocimiento se obtiene a partir de la experiencia. El
libro de Carnap. The lgical Structure of de Word (1928), define un
procedimiento computacional explcito para la extraccin de conocimiento a
partir de experiencias primarias. Fue posiblemente la primera teora en mostrar
la mente corno un proceso computacional. El ltimo elemento en esta discusin
filosfica sobre la mente es la relacin que existe entre conocimiento y accin.
Este asunto es vital para la IA, ya que la inteligencia requiere tanto accin como
razonamiento. Ms aun, simplemente con comprender como se justifican
determinadas acciones se puede llegar a saber cmo construir un agente cuyas
acciones sean justificables (o racionales). Aristteles argumenta que las
acciones se pueden justificar por la conexin lgica entre los objetivos y el
conocimiento de los efectos de las acciones.
Como es que el pensamiento viene acompaado en algunos casos de
acciones y en otros no, en algunos casos por movimiento y en otros no'?
Parece como si la misma cosa sucediera tanto si razonramos o hiciramos
inferencias sobre objetos que no cambian; pero en este caso el fin es una
proposicin especulativa... mientras la conclusin resultante de las dos premisas
es una accin... Yo necesito abrigarme, una manta abriga. Yo necesito una
manta. Que necesito, que debo hacer; necesito una manta. Necesito hacer una
manta. Y en conclusin. (Yo tengo que hacer una manta, es una accin.
(Nussbaum 1078, p. 40)
En Nicomachean Ethics (Libro III. 3 , 1 1 12b). Aristteles contina
trabajando en este tema, sugiriendo un algoritmo:
Nosotros no reflexionamos sobre los fines, sino sobre los medios. Un
mdico no reflexiona sobre si debe curar, ni un orador sobre si debe persuadir...
Ellos asumen el fin y consideran cmo y con qu medios lo obtienen, y si resulta
fcil y es por tanto productivo; mientras que si slo se puede alcanzar por un
medio se tiene en consideracin como se alcanzar por este y porque medios
se obtendr este, hasta que se llegue a la causa primera y lo ltimo en el
orden del anlisis para ser lo primero en el orden de los acontecimientos. Y si se

llega a un estado imposible, se abandona la bsqueda, como por ejemplo si se


necesita dinero y no se puede conseguir; peros i hay una posibilidad de intentar.
El algoritmo de Aristteles se implement 2300 aos ms tarde por
Newell y Simon con la ayuda de su programa SRGP. El cual se conoce como
sistema de planificacin regresivo (vase el Captulo 16). El libro Utilitarianism
(Mill, 1863) de John Stuart Mil1 (1806 - 1873) propone la idea de un criterio de
decisin racional en todos los mbitos de la actividad humana.

2. Matemticas (aproximadamente desde el ao 800 al


presente)
Qu reglas formales son las adecuadas para obtener conclusiones
vlidas?
Qu se puede computar?
Cmo razonamos con informacin incierta'?
Los filsofos delimitaron las ideas ms importantes de la IA, pero para
pasar de ah a una ciencia formal es necesario contar COII una formulacin
matemtica en tres reas fundamentales: lgica, computacin y probabilidad.
El concepto de 1gica formal se remonta a los filsofos de la antigua
Grecia, pero su desarrollo matemtico comenz realmente con el trabajo de
George Boole (1815 - 1864) que defini la lgica proposicional o Booleana
(Boole. 1847). En 1879. Gottlob Frege (1848 - 1925) extendi la lgica de Boole
para incluir objetos y relaciones, y cre la lgica de primer orden que se utiliza
hoy como el sistema ms bsico de representacin de conocimiento. Alfrcd
Tarski (1902 - 1983) introdujo una teora de referencia que ensea cmo
relacionar objetos de una lgica con objetos del mundo real. El paso siguiente
consisti en definir los lmites (de lo que se poda hacer con la lgica y la
informtica.
Se piensa que el primer algoritmo no trivial es el algoritmo Eucldeo para
el clculo del mximo comn divisor. E1 considerar los algoritmos como objetos
en s mismos se remonta a la poca de al-Khowarazmi, un matemtico persa del
siglo IX con cuyos escritos tambin se introdujeron los nmeros arbigos y el
lgebra en Europa. Boole, entre otros, present algoritmos para llevar a cabo
deducciones lgicas y hacia el final del siglo XIX se llevaron a cabo numerosos
esfuerzos para formalizar el razonamiento matemtico general con la lgica
deductiva. En 1900, David Hilbert (1862 - 1043) presento una lista de 21
problemas que acertadamente predijo ocupara a los matemticos durante todo
ese siglo. En el ltimo de ellos se preguntaba si existe un algoritmo que permita
determinar la validez, de cualquier proposicin lgica en la que aparezcan
nmeros naturales (el famoso Entscheidungsproblem, o problema de decisin).
Bsicamente, lo que Hilbcrt se preguntaba es si hay lmites fundamentales en la
capacidad de los procedimientos efectivos de demostracin. En 1930, Kurt
Godel (1006 - 1978) demostr que existe un procedimiento eficiente para
demostrar cualquier aseveracin verdadera en la primera lgica de primer
orden de Frege y Russell, sin embargo con la 1gica de primer orden no era
posible capturar el principio de induccin matemtica necesario para la
caracterizacin dc los nmeros naturales. En 1931, demostr que, en efecto,
existen lmites reales. Mediante su teorema de incompletitud demostr que en
cualquier lenguaje que tuviera la capacidad suficiente para expresar las

propiedades de los nmeros naturales, existen aseveraciones verdaderas no


decidible en el sentido de que no es posible decidir su validez mediante algn
algoritmo.
El resultado fundamental anterior se puede interpretar tambin como la
indicacin de que existen algunas funciones de los nmeros enteros que no se
pueden representar mediante un algoritmo, es decir no se pueden calcular. Lo
anterior llev a Alan Turing (1912 - 1954) a tratar de caracterizar exactamente
aquellas funciones que s eran susceptibles de ser caracterizadas. La noci6n
anterior es de hecho problemtica hasta cierto punto, porque no es posible dar
una definicin formal a la nocin de clculo o procedimiento efectivo. No
obstante, la tesis de Church-Turing, que afirma que la mquina de Turing (Turing,
1936) es capaz de calcular cualquier funcin computable, goza de aceptacin
generalizada ya que proporciona una definicin suficiente. Turing tambin
demostr que existen algunas: funciones que no se pueden calcular mediante la
mquina de Turing. Por ejemplo, ninguna mquina puede decidir en general si
un programa dado producir una respuesta a partir de unas entradas, o si
seguir calculando indefinidamente.
Si bien ser no decidible ni computable son importantes para comprender
el proceso del clculo, la nocin de intratabilidad tuvo repercusiones ms
importantes. En trminos generales se dice que un problema es intratable si el
tiempo necesario para la resolucin de casos particulares de dicho problema
crece exponencialmente con el tamao de dichos casos. La diferencia entre
crecimiento polinomial y exponencial de la complejidad se destac por primera
vez a mediados de los aos 60 (Cobham, 1964; Edmonds, 1965). Es importante
porque un crecimiento exponencial implica la imposibilidad de resolver casos
moderadamente grandes en un tiempo razonable. Por tanto, se debe optar por
dividir el problema de la generacin de una conducta inteligente en sub
problemas que sean tratables en vez de manejar problemas intratables.
Cmo se puede reconocer un problema intratable? La teora de la NPcompletitud, propuesta por primera vez por Steven Cook (1971) y Richard Karp
(1972) propone un mtodo. Cook y Karp demostraron la existencia de grandes
clases de problemas de razonamiento y bsqueda conminatoria cannica que
son NP completos. Toda clase de problema a la que la clase de problemas NP
completos se pueda reducir ser seguramente intratable (aunque no se ha
demostrado que los problemas NP completos son necesariamente intratables, la
mayor parte de los tericos as lo creen). Estos resultados contrastan con el
optimismo con e1 que la prensa popular recibi a los primeros computadores,
Supercerebros Electrnicos que eran Ms rpidos que Einstein!. A pesar del
rpido incrementaron en la velocidad de los computadores, los sistemas
inteligentes se caracterizarn por el uso cuidadoso que hacen de los recursos.
De manera sucinta, el mundo es un ejemplo de problema extremadamente
grande! Recientemente la IA ha ayudado a explicar por qu algunos ejemplos de
problemas NP completos son difciles de resolver y otros son fciles (Cheeseman
et al., 1991).
Adems de la lgica y el clculo, la tercera gran contribucin de las
matemticas a la IA es la teora de la probabilidad. El italiano Gerolamo Cardano
(1501 - 1576) fue el primero en proponer la idea de probabilidad, presentndola
en trminos de los resultados de juegos de apuesta. La probabi1idad se
convirti pronto en parte imprescindible de las ciencias cuantitativas, ayudando
en el tratamiento de mediciones con incertidumbre y de teoras incompletas.

Pierre Fermat (1601 - 1665), Blasie Pascal (1623 - 1662), James Bernoulli (1654 1705), Pierre Laplace (1749 - 1827), entre otros, hicieron avanzar esta teora e
introdujeron
nuevos mtodos estadsticos. Thomas Bayes (1702 - 1761)
propuso una regla para la actualizacin de probabilidades subjetivas a la luz de
nuevas evidencias. La regla de Bayes y el rea resultante llamado anlisis
Bayesiano conforman la base de las propuestas ms modernas que abordan el
razonamiento incierto en sistemas de IA.

3. Economa (desde el ao 1776 hasta el presente)


Cmo se debe llevar a cabo el proceso de toma de decisiones para maximizar
el rendimiento'?
Cmo se deben llevar a cabo acciones cuando otros no colaboren?
Cmo se deben llevar a cabo acciones cuando los resultados se obtienen en un
futuro lejano?
La ciencia de la economa comenz en 1776, cuando el filsofo escocs
Adam Smith (1723 - 1790) public An Inquiri into the Nature and Causes of the
Wealth of Nations. Aunque los antiguos griegos, entre otros, haban hecho
contribuciones al pensamiento econmico, Smith fue el primero en tratarlo
como una ciencia, utilizando la idea de que las economas pueden concebirse
como un conjunto de agentes individuales que intentan maximizar su propio
estado de bienestar econmico. La mayor parte de la gente cree que la
economa slo se trata de dinero, pero los economistas dicen que ellos
realmente estudian cmo la gente toma decisiones que les llevan a obtener los
beneficios esperados. Lon Walras (1834 - 19 10) formaliz el tratamiento
matemtico del beneficio deseado o utilidad, y fue posteriormente mejorado
por Frank Ramsey (1931) y despus por John von Neumann y Oskar Morgenstern
en su libro The Theory of Games and Economic Behavior (1944)
.
La teora de la decisin, que combina la teora de la probabilidad con la
teora de la utilidad, proporciona un marco completo y formal para la toma de
decisiones (econmicas o de otra ndole) realizadas bajo incertidumbre, esto es,
en casos en los que las descripciones probabilsticas capturan adecuadamente
la forma en la que se toman las decisiones en el entorno; lo cual es adecuado
para grandes economas en las que cada agente no necesita prestar atencin
a las acciones que lleven a cabo el resto de los agentes individualmente.
Cuando se trata de pequeas economas, la situacin se asemeja ms a la de
un juego: las acciones de un jugador pueden afectar significativamente a la
utilidad de otro (tanto positiva como negativamente). Los desarrollos de von
Neumann y Morgenstern a partir de la teora de juegos (vase tambin Luce y
Raiffa, 1957) mostraban el hecho sorprendente de que, en algunos juegos, un
agente racional deba actuar de forma aleatoria o, al menos, aleatoria en
apariencia con respecto a sus contrincantes.
La gran mayora de los economistas no se preocuparon de la tercera
cuestin mencionada anteriormente, es decir, cmo tomar decisiones racionales
cuando los resultados de las acciones no son inmediatos y por el contrario se
obtienen los resultados de las acciones de forma secuencial. El campo de la
investigacin operativa persigue este objetivo; dicho campo emergi en la
Segunda Guerra Mundial con los esfuerzos llevados a cabo en el Reino Unido en
la optimizacin de instalaciones de radar, y posteriormente en aplicaciones
civiles relacionadas con la toma de decisiones de direccin complejas. El trabajo

de Richard Bellman (1957) formaliza una clase de problemas de decisin


secuencial llamados procesos de decisin de Markov.
El trabajo en la economa y la investigacin operativa ha contribuido en
gran medida a la nocin de agente racional que aqu se presenta, aunque
durante muchos aos la investigacin en el campo de la IA se ha desarrollado
por sendas separadas. Una razn fue la complejidad aparente que trae consigo
el tornar decisiones racionales. Herbert Simon (1916 - 200l), uno de los primeros
en investigar en el campo de la IA, gan el premio Nobel en Economa en 1978
por su temprano trabajo, en el que mostr, que los modelos basados en
satisfaccin (que toman decisiones que son suficientemente buenas, en vez
de realizar clculos laboriosos para alcanzar decisiones ptimas)
proporcionaban una descripcin mejor del comportamiento humano real (Simon,
1947). En los aos 90, hubo un resurgimiento del inters en las tcnicas de
decisin terica para sistemas basados en agentes (Wellman, 1995).

4. Neurociencia (desde el ao 1861 hasta el presente)


Cmo procesa informacin el cerebro?
La Neurociencia es el estudio del sistema neurolgico, y en especial del
cerebro. La forma exacta en la que en un cerebro se genera el pensamiento es
uno de los grandes misterios de la ciencia. Se ha observado durante miles de
aos que el cerebro est de alguna manera involucrado en los procesos de
pensamiento, ya que fuertes golpes en la cabeza pueden ocasionar minusvala
mental. Tambin es ampliamente conocido que los cerebros humanos son de
alguna manera diferentes: aproximadamente en el 335 a.C. Aristteles escribi,
de entre todos los animales el hombre tiene el cerebro ms grande en
proporcin a su tamao'. Aunque no fue hasta mediados del siglo XVIII cundo
se acept mayoritariamente que el cerebro es la base de la conciencia. Hasta
este momento, se pensaba que estaba localizado en el corazn, el bazo y la
glndula pineal.
El estudio de Paul Broca (1824 - 1880) sobre la afasia (dificultad para
hablar) en pacientes con el cerebro daado, en 1861, le dio fuerza a este campo
y convenci a la sociedad mdica de la existencia de reas localizadas en el
cerebro responsables de funciones cognitivas especficas. En particular, mostr,
que la produccin del habla se localizaba en una parte del hemisferio izquierdo:
hoy en da conocida como el rea de Broca. En esta poca ya se saba que el
cerebro estaba formado por clulas nerviosas o neuronas, pero no fue hasta
1873 cuando Camilo Golgi (1843 - 1926) desarroll una tcnica de coloracin
que permiti la observacin de neuronas individuales en el cerebro. Santiago
Ramn y Cajal (1853 - 1934) utiliz esta tcnica es sus estudios pioneros sobre
la estructura neuronal del cerebro.
En la actualidad se dispone de informacin sobre la relacin existente
entre las reas del cerebro y las partes del cuerpo humano que controlan o de
1as que reciben impulsos sensoriales. Tales relaciones pueden cambiar de forma
radical incluso en pocas semanas, y algunos animales parecen disponer de
mltiples posibilidades. Ms an, no se tiene totalmente claro cmo algunas
reas se pueden encargar de ciertas funciones que eran responsabilidad de
reas daadas. No hay prcticamente ninguna teora que explique cmo se
almacenan recuerdos individuales.

Los estudios sobre la actividad de los cerebros intactos comenzaron en


1929 con el descubrimiento del electroencefalograma (EEG) desarrollado por
Hans Berger. El reciente descubrimiento de las imgenes de resonancia
magntica funcional (IRMF) (Ogawa et al., 1990) est proporcionando a los
neurlogos imgenes detalladas de la actividad cerebral sin precedentes,
permitindoles obtener medidas que se corresponden con procesos cognitivos
en desarrollo de manera muy interesante. Este campo est evolucionando
gracias a los avances en los estudios en celdas individuales y su actividad
neuronal. A pesar de estos avances, nos queda un largo camino para llegar a
comprender cmo funcionan estos procesos cognitivos.
La conclusin verdaderamente increble es que una coleccin de simples
clulas puede llegar a generar razonamiento, accin y conciencia o, dicho en
otras palabras, los cerebros generan las inteligencias (Serle, 1992). La nica
teora alternativa es el misticismo: que nos dice que existe alguna esfera mstica
en la que las mentes operan fuera del control de la ciencia fsica.

Partes de una clula nerviosa o neurona. Cada neurona contiene un cuerpo celular, o soma, que
tiene un ncleo celular. Un nmero de fibras llamadas dendritas se ramifican a partir del cuerpo
de la clula junto con una nica fibra larga llamada axn. El axn se alarga considerablemente,
mucho ms que lo que se representa en esta imagen. Normalmente miden un centmetro (100
veces ms que el dimetro del cuerpo de la clula), pero pueden alcanzar hasta un metro de
longitud. Una neurona se conecta con entre 10 y 100.000 neuronas formando una maraa
llamada sinapsis. Las seales se propagan de neurona a neurona mediante una reaccin
electroqumica complicada. Las seales, controlan la actividad del cerebro a corto plazo, y
permiten establecer cambios en la posicin y conectividad de las neuronas a largo plazo. Se
piensa que estos mecanismos forman la base del aprendizaje del cerebro. La mayora del
procesamiento de informacin se lleva a cabo en la corteza del cerebro, la capa ms externa de
ste. La unidad de organizacin bsica es una columna de tejido de aproximadamente 0,5 mm de
dimetro, con lo cual se ampla la profundidad total de la corteza cerebral, que en el caso de los
humanos es de cuatro mm. Una columna contiene aproximadamente 20.000 neuronas.

Cerebros y computadores digitales realizan tareas bastante diferentes y


tienen propiedades distintas. La Figura 3 muestra cmo hay 1 .000 veces ms
neuronas en un cerebro humano medio que puertas lgicas en la UCP de un
computador estandar. La ley de Moore" predice que el nmero de puertas
lgicas de la UCP se igualar con el de neuronas del cerebro alrededor del ao
2020. Por supuesto, poco se puede inferir de esta prediccin; ms an, la
diferencia en la capacidad de almacenamiento es insignificante comparada con
las diferencias en la velocidad de intercambio y en paralelismo. Los circuitos de
los computadores pueden ejecutar una instruccin en un nanosegundo,
mientras que las neuronas son millones de veces ms lentas. Las neuronas y las
sinapsis del cerebro estn activas simultneamente, mientras que los
computadores actuales tienen una o como mucho varias UCP. Por tanto, incluso
sabiendo que un computador es un milln de veces ms rpido en cuanto a su

velocidad de intercambio, el cerebro acaba siendo 100.000 veces ms rpido en


lo que hace.

5. Psicologa (desde el ao 1879 hasta el presente)


Cmo piensan y actan los humanos y los animales?
La psicologa cientfica se inici con los trabajos del fsico alemn
Hermann von Helmholtz (1821 - 1894), segn se referencia habitualmente, y su
discpulo Wilhelm Wundt (1832 - 1920). Helinholtz aplic el mtodo cientfico al
estudio de la vista humana, y su obra Handbook of Physiological Optic's, todava
en nuestros das, se considera como el tratado actual ms importante sobre la
fsica y la fisiologa de la vista humana (Nalva, 1993, p. 15). En 1879, Wundt
abri el primer laboratorio de psicologa experimental en: la Universidad de
Leipzig. Wuridt puso mucho nfasis en la realizacin de experimentos
controlados cuidadosamente en la que sus operarios realizaban tareas de
percepcin o asociacin a1 tiempo que sometan a introspeccin sus procesos
mentales. Los meticulosos controles evolucionaron durante un largo perodo de
tiempo hasta convertir la psicologa en una ciencia, pero la naturaleza subjetiva
de los datos hizo poco probable que un investigador pudiera contradecir sus
propias teoras. Bilogos, estudiando el comportamiento humano, por el
contrario, carecan de datos introspectivos y desarrollaron una metodologa
objetiva, tal y como describe H. S. Jennings (1906) en su influyente trabajo
Behavior of the Lower Organism. El movimiento conductista, liderado por John
Watson (1878 - 1958) aplic este punto de vista a los humanos, rechazando
cualquier teora en la que intervinieran procesos mentales, argumentando que
la introspeccin no aportaba una evidencia fiable. Los conductistas insistieron
en el estudio exclusivo de mediciones objetivas de percepciones (o estmulos)
sobre animales y de las acciones, resultantes (o respuestas). Construcciones
mentales, como conocimientos, creencias, objetivos y pasos en un
razonamiento quedaron descartadas por ser consideradas psicologa popular
no cientfica. El conductismo hizo muchos descubrimientos utilizando ratas y
palomas, pero tuvo menos xito en la comprensin de los seres humanos. Aun
as, su influencia en la psicologa fue notable (especialmente en Estados Unidos)
desde aproximadamente 1920 hasta 1960.
La conceptualizacin del cerebro como un dispositivo de procesamiento
de informacin, caracterstica principal de la psicologa cognitiva, se remonta
por lo menos a las obras de William James (1842 - 1910). Helinholtz tambin
pone nfasis en que la percepcin entraa cierto tipo de inferencia lgica
inconsciente. Este punto de vista cognitivo se vio eclipsado por cl conductismo
en Estados Unidos, pero en la Unidad de Psicologa Aplicada de Cambridge,
dirigida por Frederic Bartlett (1886 l969), los modelos cognitivos emergieron
con fuerza. La obra The Nature of Explanation, de Kenneth Craik (1943),
discpulo y sucesor de Bartlett, reestablece enrgicamente la legitimidad de
trminos mentales como creencias y objetivos, argumentando que son tan
cientficos como lo pueden ser la presin y la temperatura cuando se habla
acerca de los gases, a pesar de que estos estn formados por molculas que no
tienen ni presin ni temperatura. Craik establece tres elementos clave que hay
que tener en cuenta para disear un agente basado en conocimiento: (1) el
estmulo deber ser traducido a una representacin interna, (2) esta
representacin se debe manipular mediante procesos cognitivos para as
generar nuevas representaciones internas, y (3) stas, a su vez, se traducirn

de nuevo en acciones. Dej muy claro por qu consideraba que estos eran los
requisitos idneos para disear un agente:
SI el organismo tiene en su cabeza Un modelo a pequea escala de la
realidad externa y de todas SUS posibles acciones, ser capaz, de probar
diversas opciones, decidir cul es la mejor, planificar su reaccin ante posibles
situaciones futuras antes de que stas surjan, emplear lo aprendido de
experiencias pasadas en situaciones presentes y futuras, y en todo momento,
reaccionar ante los imprevistos que acontezcan de manera satisfactoria, segura
y ms competente (Craik, 1943).
Unidades
computacionales
Unidades de
almacenamiento
Duracin de un ciclo
Ancho de banda
Memoria
actualizacin/sec.

Computador
1 UCP, 108 Puertas
1010 bits RAM
1011 bits disco
10-9 sec.
1010 bits/sec.
109

Cerebro Humano
1011 neuronas
1011 neuronas
1014 sinapsis
10-3 sec
1014 bits/sec
1014

Comparacin bsica entre los recursos de cmputo generales de que disponen los computadores
(circa 2003) y el cerebro. Las cifras correspondientes a los computadores se han incrementado en
al menos un factor 10 desde la primera edicin de este libro, y se espera que suceda la mismo en
esta dcada. Las cifras correspondientes al cerebro no han cambiado en los ltimos 10000 aos.

Despus de la muerte de Craik en un accidente de bicicleta en 1945,


Donald Boadbent continu su trabajo, y su libro Perception and Communication
(1958) incluy algunos de los primeros modelos de procesamiento de
informacin del fenmeno psicolgico. Mientras tanto, en Estados Unidos e1
desarrollo del modelo computacional llevo a la creacin del campo de la ciencia
cognitiva. Se puede decir que este campo comenz en un simposio celebrado
en el MIT, en septiembre de 1956 (como se vera continuacin este evento tuvo
lugar slo dos meses despu6s de la conferencia en la que naci la IA). En este
simposio, George Milles present The Magic, Number Seven, Noam Chomsky
present Three Mode1s of Language,
y Allen Newell y Herbert Simon
presentaron The Logic Theory Machine. Estos tres artculos influyentes
mostraron como se podan utilizar los modelos informticos para modelar la
psicologa de la memoria, el lenguaje y el pensamiento lgico, respectivamente.
Los psiclogos comparten en la actualidad el punto de vista comn de
que la teora cognitiva debe ser como un programa de computador (Anderson,
1980), o dicho de otra forma, debe describir un mecanismo de procesamiento
de informacin detallado, lo cul lleva consigo la implementacin de algunas
funciones cognitivas.

6. Ingeniera computacional (desde el ao 1940 hasta


el presente)
Cmo se puede construir un computador eficiente?
Para que la inteligencia artificial pueda llegar a ser una realidad se
necesitan dos cosas: inteligencia y un artefacto. El computador ha sido cl

artefacto elegido. El computador electrnico digital moderno se invent de


manera independiente y casi simultnea por cientficos en tres pases
involucrados en la Segunda Guerra Mundial. El equipo de Alan Turing construy
en1940, el primer computador operacional de carcter electromecnico,
llamado Heath Robinson", con un nico propsito: descifrar mensajes
alemanes. En 1943 el mismo grupo desarroll el Colossus, una mquina potente
de propsito general basada en vlvulas de vaco. El primer computador
operacional programable fue el Z - 3, inventado por Konrad Zuse en Alemania,
en 1941. Zuse tambin invent los nmeros de coma flotante y e1 primer
lenguaje de programacin de alto nivel, Plankalkul. El primer computador
electrnico, el ABC, fue creado por John Atanasoff junto a su discpulo Clifford
Berry entre 1940 y 1942 en la Universidad Estatal de Iowa. Las investigaciones
de Atanasoff recibieron poco apoyo y reconocimiento; el ENIAC, desarrollado en
el marco de un proyecto militar secreto, en la Universidad dc Pensilvania, por un
equipo en el que trabajaban entre otros John Mauchly y John Eckert, puede
considerarse como el precursor de los computadores modernos.
Desde mediados del siglo pasado, cada generacin de dispositivos
hardware ha conllevado un aumento en la velocidad de proceso y en la
capacidad de almacenamiento as como una reduccin de precios. La potencia
de los computadores se dobla cada 18 meses aproximadamente seguir a este
ritmo durante una o dos dcadas ms. Despus se necesitar ingeniera
molecular y otras tecnologas novedosas.
Por supuesto que antes de la aparicin de los computadores ya haba
dispositivos de clculo. Las primeras mquinas automticas, que datan del siglo
XVII. La primera mquina programable fue un telar desarrollado en 1805 por
Joseph Marie Babbage (1752 - 1834) que utilizaba tarjetas perforadas para
almacenar informacin sobre los patrones de los bordados. A mediados del siglo
xix, Charles Babbage (1792 - 1871) dise dos mquinas que no lleg a
construir. La Mquina de Diferencias, se concibi con la intencin de facilitar
los clculos de tablas matemticas para proyectos cientficos y de ingeniera.
Finalmente se construy y se present en 1991 en el Museo de la Ciencia de
Londres (Swade, 1993). La Mquina Analtica de Babbage era mucho ms
ambiciosa: inclua memoria direccionable, programas almacenados y saltos
condicionales: fue el primer artefacto dotado de los elementos necesarios para
realizar una computacin universal.
Ada Lovelace, colega de Babbage e hija de1 poeta Lord Byron, fue
seguramente la primera programadora (el lenguaje de programacin Ada se
llama as en honor a esta programadora). Ella escribi programas para la
inacabada Mquina Analtica e incluso especul acerca de la posibilidad de que
la mquina jugara al ajedrez y compusiese msica.
La IA tambin tiene una deuda con la parte software de la informtica que
ha proporcionado los sistemas operativos, los lenguajes de programacin, y las
herramientas necesarias para escribir programas modernos (y artculos sobre
ellos). Sin embargo, en esta rea la deuda se ha saldado: la investigacin en IA
ha generado numerosas ideas novedosas de las que se ha beneficiado la
informtica en general, como por ejemplo el tiempo compartido, los intrpretes
imperativos, los computadores personales con interfaces grficas y ratones,
entornos de desarrollo rpido, listas enlazadas, administracin automtica de
memoria, y conceptos claves dc la programacin simblica, funcional, dinmica
y orientada a objetos.

7. Teora de control y ciberntica (desde el ao 1948


hasta el presente)
Cmo pueden los artefactos operar bajo su propio control?
Ktesibios de Alejandra (250 a. C.) construy la primera mquina auto
controlada: un reloj de agua con un regulador que mantena el flujo de agua
circulando por l, con un ritmo constante y predecible. Esta invencin cambi la
definicin de lo que un artefacto poda hacer. Anteriormente solamente seres
vivos podan modificar su comportamiento como respuesta a cambios en su
entorno. Otros ejemplos de sistemas de contro1 autoregulables y
retroalimentados son el motor de vapor, creado por James Watt (1736 1819), y
el termostato, inventado por Cornelis Drebbel (1572 - 1633), que tambin
invent el submarino. La teora matemtica de los sistemascon
retroalimentacin estable se desarroll en el siglo XIX.
La figura central del desarrollo de lo que ahora se llama la teora de
control fue Norbert Wiener (1894 - 1964). Wiener fue un matemtico brillante
que trabaj en sistemas de control biolgicos y mecnicos y en sus vnculos con
la cognicin. De la misma forma que Craik (quien tambin utiliz sistemas de
control como modelos psicolgicos), Wiener y sus colegas Arturo Rosenblueth y
Julian Bigelow desafiaron la ortodoxia conductista (Kosenblileth et al., 1943).
Ellos vean el comportamiento determinista como algo emergente de un
mecanismo regulador que intenta minimizar el error (la diferencia entre el
estado presente y el estado objetivo). A finales de los aos 40, Wiener, junto a
Warren Mc Culloch. Walter Pitts y John von Neumann organizaron una serie de
conferencias en las que se exploraban los nuevos modelos cognitivos
matemticos y computacionales, e influyeron en muchos otros investigadores
en el campo de las ciencias del comportamiento. El libro de Wiener, Cybernetics
(19481, fue un bestscller y desvel al pblico las posibilidades de las mquinas
con inteligencia artificial.
La teora de control moderna, especialmente la rama conocida como
control ptimo estocstico, tiene como objetivo cl diseo de sistemas que
maximizan una funcin objetivo en el tiempo. Lo cual se asemeja ligeramente a
nuestra visin de lo que es la IA: diseo de sistemas que se comportan de forma
ptima. Por qu, entonces. IA y teora de control son dos campos diferentes,
especialmente teniendo en cuenta la cercana relacin entre bus creadores? La
respuesta est en el gran acoplamiento existente entre las tcnicas
matemticas con las que estaban familiarizados los investigadores y entre los
conjuntos de problemas que se abordaban desde cada uno de los puntos de
vista, El clculo y el lgebra matricial, herramientas de la teora de control, se
utilizaron en la definicin de sistemas que se podan describir mediante
conjuntos fijos de variables continuas; ms an, el anlisis exacto es slo
posible en sistemas lineales. La IA se fund en parte para escapar de las
limitaciones matemticas de la teora de control en los aos 50. Las
herramientas de inferencia lgica y computacin permitieron a los
investigadores de IA afrontar problemas relacionados con el lenguaje, visin y
planificacin, que estaban completamente fuera del punto de mira de la teora
de control.

8. Lingstica (desde el ao 1957 hasta el presente)


Cmo est relacionado el lenguaje con el pensamiento?
En 1957, B. F. Skinner public Verbal Behavior. La obra presentaba una
visin extensa y detallada desde el enfoque conductista al aprendizaje del
lenguaje, y estaba escrita por los expertos ms destacados de este campo.
Curiosamente, una revisin de este libro lleg a ser tan famosa como la obra
misma, y provoc el casi total desinters por el conductismo. El autor de la
revisin fue Noam Chomsky, quien acababa de publicar un libro sobre su propia
teora, Syntactic Structures. Chomsky mostr cmo la teora conductista no
abordaba el tema de la creatividad en el lenguaje: no explicaba cmo es posible
que un nio sea capaz de entender y construir oraciones que nunca antes ha
escuchado. La teora de Chomsky (basada en modelos sintcticos que se
remontaban al lingista indio Panini, aproximadamente 350 a.C. s poda
explicar lo anterior y, a diferencia de teoras anteriores, posea el formalismo
suficiente como para permitir su programacin
La lingstica moderna y la IA nacieron, al mismo tiempo y maduraron
juntas, solapndose en un campo hbrido llamado lingstica computacional o
procesamiento del lenguaje natural. El problema del entendimiento del lenguaje
se mostr pronto mucho ms complejo de lo que se haba pensado en 1957. El
entendimiento del lenguaje requiere la comprensin de la materia bajo estudio y
de su contexto, y no solamente el entendimiento de la estructura de las
sentencias. Lo cual puede parecer obvio, pero no lo fue para la mayora de la
comunidad investigadora hasta los aos 60. Gran parte de los primeros trabajos
de investigacin en el rea de la representacin del conocimiento (el estudio de
cmo representar el conocimiento de forma que el computador pueda razonar a
partir de dicha representacin) estaban vinculados al lenguaje y ;i la bsqueda
de informacin en el campo del lenguaje, y su base eran las investigaciones
realizadas durante dcadas en el anlisis filosfico del lenguaje.

TCNICAS Y CAMPOS DE LA INTELIGENCIA


ARTIFICIAL
1. Aprendizaje Automtico (Machine Learning)
En ciencias
de
la
computacin el aprendizaje
automtico o aprendizaje de mquinas es una rama de la inteligencia
artificial cuyo objetivo es desarrollar tcnicas que permitan a las
computadoras aprender. De forma ms concreta, se trata de crear programas
capaces de generalizar comportamientos a partir de una informacin no
estructurada suministrada en forma de ejemplos. Es, por lo tanto, un proceso de
induccin del conocimiento. En muchas ocasiones el campo de actuacin del
aprendizaje automtico se solapa con el de la estadstica, ya que las dos
disciplinas se basan en el anlisis de datos. Sin embargo, el aprendizaje
automtico se centra ms en el estudio de la complejidad computacional de los
problemas. Muchos problemas son de clase NP-hard, por lo que gran parte de la
investigacin realizada en aprendizaje automtico est enfocada al diseo de
soluciones factibles a esos problemas. El aprendizaje automtico puede ser visto

como un intento de automatizar algunas partes del mtodo cientfico mediante


mtodos matemticos.
El aprendizaje automtico tiene una amplia gama de aplicaciones,
incluyendo motores de bsqueda, diagnsticos mdicos, deteccin de fraude en
el uso de tarjetas de crdito, anlisis del mercado de valores, clasificacin de
secuencias de ADN, reconocimiento del habla y del lenguaje escrito, juegos y
robtica.

2. reas y aplicaciones:

Reconocimiento de Imgenes: Reconocimiento de caracteres, de texto


manuscrito, firmas, anlisis de documentos, identificacin de placas de
matrcula y tipos de vehculos, piezas industriales, reconocimiento de
texturas y deteccin de defectos para control de calidad, etc.
Visin Artificial y Robtica: Reconocimiento de rostros y expresiones
faciales, visin para navegacin de robots, vehculos autnomos y
exploracin espacial, etc.
Teledeteccin (imgenes areas o de satlite): Exploracin de recursos
naturales, prediccin de cosechas y explotaciones forestales, localizacin
de posibles yacimientos minerales, etc.
Anlisis de Seales Ssmicas: Seales naturales: prediccin de
terremotos. Seales artificiales: localizacin de yacimientos minerales y
petrleo, etc.
Reconocimiento del Habla y Procesado del Lenguaje: Reconocimiento de
palabras aisladas, habla continua, comprensin, traduccin automtica,
etc.
Aplicaciones en Biomedecina y Genomica: Deteccin de tumores y tejidos
cancerosos, anlisis de electro cardio/encefalogramas, deteccin de
situaciones crticas en UVI, diagnostico a partir de sntomas,
reconocimiento de cromosomas para deteccin de malformaciones
congnitas, anlisis de secuencias genmicas, etc.
Aplicaciones Biomtricas: Reconocimiento de huellas dactilares, de
rostros, iris, anlisis de voz para identificacin del locutor, etc.
Aplicaciones Agrcolas: Visin artificial para recoleccin automtica,
localizacin de malas hierbas para su eliminacin selectiva, deteccin
de puntos de injerto para su automatizacin, deteccin de defectos y
seleccin de frutos para su envasado, etc.
Proteccin Civil: Prediccin del clima, prediccin de terremotos, control
incendios forestales, deteccin de situaciones de alerta en sistemas
hidrolgicos, etc.
Economa: Segmentacin de mercados, prediccin de tendencias,
deteccin de patrones de fraude, minera y analtica de datos, etc.
Ayudas Discapacitados: Ayudas para la visin, control del entorno
mediante reconocimiento del habla, ayudas al aprendizaje del habla, etc.
Anlisis de Datos (Analytics): Datos masivos (big data analytics), web
(web analytics), internet de las cosas (IoT analytics))

3. Ingeniera del conocimiento (Knowledge Engineering)


De acuerdo a (Rodrguez, 2002, p. 20) se presentan las siguientes definiciones
de Ingeniera del conocimiento:

Definicin estricta: La Ingeniera del Conocimiento tiene que ver con la


adquisicin, representacin, validacin, inferenciacin, explicacin y
mantenimiento del conocimiento.

Definicin amplia: La Ingeniera del conocimiento describe el proceso


de desarrollo y mantenimiento de Sistemas de Inteligencia Artificial.

La ingeniera de Conocimiento se asocia como rama de la Inteligencia


Artificial (IA), debido a que esta relacionada con la adquisicin, representacin
y el procesamiento del conocimiento, estrechamente vinculada con el
desarrollo de sistemas de software en donde el conocimiento y razonamiento
tienen un papel fundamental (Sistema Experto -SE).
La ingeniera del conocimiento permite construir aplicaciones informticas
en dominios difciles para la informtica convencional como lo son los SE
(sistemas basados en el conocimiento), donde los algoritmos empleados nos son
de tipo formal, debido a que el conocimiento, en general, no est bien
estructurado, puede ser inconsistente, incompleto e impreciso.
La habilidad de expresar el conocimiento y utilizarlo en un sistema
experto es an ms difcil, pues el lenguaje que utiliza un experto no es un
lenguaje que la computadora entienda. Por eso es necesario que el IC
establezca una comprensin global del rea, se forme un diccionario mental de
los trminos esenciales y desarrolle una comprensin bsica de los conceptos
clave.

De manera general la Ingeniera del Conocimiento est constituida por


tres procesos fundamentales:
1) Adquisicin del conocimiento: fase en la cual mediante expertos
humanos en el dominio del conocimiento.
2) Representacin del conocimiento: en la cual interviene de manera
fundamental el ingeniero del conocimiento encargado de codificar y hacer
explcitas las reglas u otros procedimientos, todo esto para que los expertos
humanos sean capaces de resolver problemas reales, en la construccin de un
SE dicha cooperacin del experto humano con el Ingeniero de conocimiento.
3) Base de Conocimiento: ltima fase y es en la cual la informacin entra tal
como llega, ya que el orden no influye en los resultados obtenidos. Sucede as
porque cada elemento de conocimiento es comprensible por s mismo, tomado
de forma aislada y, por lo tanto, no es necesario referirse al contexto en el cual
est inserto. La informacin puede ser representada mediante reglas de
produccin. Las reglas de produccin constituyen el mtodo ms utilizado para
construir bases de conocimientos. Llamadas tambin implicaciones lgicas. Su
estructura es la siguiente: para unas ciertas causas, unos efectos; o, para
determinadas condiciones, ciertas consecuencias. Esto se define a menudo
como programacin orientada a las reglas.

La Ingeniera del Conocimiento se define como una disciplina que permite


construir sistemas expertos (SE), mediante procesos fundamentales como son:
adquisicin del conocimiento, representacin del conocimiento, validacin del
conocimiento, inferencia del conocimiento, explicacin y justificacin.
El objetivo de la Ingeniera del conocimiento es construir sistemas
basados en el conocimiento de expertos humanos y auxiliado del proceso de
Adquisicin del conocimiento obtener el conocimiento requerido para construir
un determinado sistema. Se debe tener en cuenta que el proceso de adquisicin
del conocimiento se lleva a cabo durante todo el desarrollo del sistema, desde el
momento en que se comienza a estudiar el problema y su solucin, hasta su
evolucin.

4. Lgica difusa (Fuzzy Logic)


La lgica difusa es una metodologa que proporciona una manera simple y
elegante de obtener una conclusin a partir de informacin de entrada vaga,

ambigua, imprecisa, con ruido o incompleta, en general la lgica difusa imita


como una persona toma decisiones basada en informacin con las
caractersticas mencionadas. Una de las ventajas de la lgica difusa es la
posibilidad de implementar sistemas basados en ella tanto en hardware como
en software o en combinacin de ambos.
Se fundamenta en los denominados conjuntos difusos y un sistema de
inferencia difuso basado en reglas de la forma SIENTONCES.. En contraste
con la lgica tradicional, que utiliza conceptos absolutos para referirse a la
realidad, la lgica difusa se define en grados variables de pertenencia a los
mismos, siguiendo patrones de razonamiento similares a los del pensamiento
humano.
As por ejemplo, mientras dentro del marco rgido de la lgica tradicional
o formal un recinto est solamente "oscuro" (0) o claro (1), para la lgica difusa
son posibles tambin todas las condiciones relativas intermedias percibidas por
la experiencia humana como "muy claro", "algo oscuro", "ligeramente claro",
"extremadamente oscuro", etc. Las condiciones extremas o absolutas asumidas
por la lgica tradicional son slo un caso particular dentro del universo de la
lgica difusa. Esta ltima nos permite ser relativamente imprecisos en la
representacin de un problema y an as llegar a la solucin correcta.
Es una lgica multivaluada que permite representar matemticamente la
incertidumbre y la vaguedad, proporcionando herramientas formales para su
tratamiento.
Como indica Zadeh Cuando aumenta la complejidad, los enunciados
precisos pierden su significado y los enunciados tiles pierden precisin. Que
puede resumirse como que los rboles no te dejan ver el bosque
Bsicamente cualquier problema del mundo puede ser resolverse como
dado un conjunto de variables de entrada (espacio de entrada). Obtener un
valor adecuado de variables de salida (espacio de salida). La lgica difusa
permite establecer este mapeo de una forma adecuada, atendiendo a criterios
de significados (y no de precisin)
El trmino lgica difusa fue utilizado por primera vez en 1974.
Actualmente se utiliza en un amplio sentido, agrupando teoras de conjuntos
difusos, reglas si entonces, aritmtica difusa, cuantificadores, etc.
Precisin Vs. Significado:
Lo ms relevante de la informacin es su significado, no la precisin. Por
ejemplo, si nos va a caer una pesa sobre la cabeza, nos interesa que alguien nos
grite rpidamente Cuidado arriba!! y no que nos digan que un objeto de 500
kg de masa, se est aproximadndo a tu cabeza siguiendo ua trayectoria
perpendicular y recta a una velocidad de 47,32 m/seg
Aplicaciones

Informes: lista de clientes, grficos de beneficio.


Integracin en las bases de datos ya existentes (scoring).
Informacin sobre los perfiles de cliente.
Posibles sugerencias para mejorar la recogida de datos.

5. Redes neuronales artificiales (Artificial


Neural Networks)
Las RNA
son sistemas de procesamiento de la informacin cuya
estructura y funcionamiento estn inspirados en las redes neuronales biolgicas
(Hilera y Martnez 1995) consisten en un gran nmero de elementos simples de
procesamiento llamados nodos o neuronas que estn organizados en capas.
Cada nuerona est conectada con otra neurona mediante enlaces de
comunicacin, cada uno de ls cuales tiene asociada un peso. Los pesos
representan la informacin que ser usada por la red neuronal para resolver un
problema determinado.
Si las RNA son sistemas adaptativos que aprenden de la experiencia, esto
es, aprender a llevar acabo ciertas tareas mediante un entrenamiento con
ejemplos ilustrativos.
Mediante este entrenamiento o aprendizaje, las RNA crean su propia
representacin interna del problema, por tal motivo se dice que son
autoorganizadas. Posteriormente, pueden responder adecuadamente cuando se
les presentan situaciones a las que no haban sido expuestas anteriormente, es
decir, las RNA son capaces de generalizar de casos anteriores a casos nuevos.
Esta caracterstica es fundamental ya que permite a la red responder
correctamente no slo ante informaciones novedosas, sino tambin ante
informaciones distorsionadas o incompletas.
En las RNA el tipo de procesamiento es paralela, en el sentido de que
muchas neuronas pueden estar funcionando al mismo tiempo. De hecho,
nuestro cerebro est compuesto por unas 1011 neuronas, las cuales operan en
paralelo. Es ah donde reside una parte fundamental de su poder de
procesamiento. Aunque individualmente las neuronas sean capaces de realizar
procesamientos muy simples, ampliamente interconectadas a travs de sinapsis
(cada neurona puede conectarse a otras 10000 en promedio) y trabajando en
paralelo pueden desarrollar una actividad global de procesamiento
impresionante.
Biolgicamente, se suelen aceptar que el conocimiento est ms
relacionado con las conexiones entre neuronas que con las propias neuronas
(Alkon, 1989; Shepherd, 1990); es decir, el conocimiento se encuentra
distribuido por las sinapsis de la red. Este tipo de representacin distribuida del
conocimiento implica que si una sinapsis resulta daada, no perdemos mas que
una parte muy pequea de la informacin. Adems, los sistemas
neuronalesbiolgicos son redundantes, de mod que muchas neuronas y sinapsis
pueden realiar un papel similar; en definitiv, el sistema resulta tolerante a fallos.
En este sentido, sabemos que cada da mueren miles de enuronas en nuestro
cerebro, y sin embargo tienen que pasar muchos aos para que se recientan
nuestras capacidades. De forma anloga, en el caso de las RNA se puede
considerar que el conocimiento se encuentra representado en los pesos de las
conexiones entre neuronas.
El tipo de representacin de la informacin que manejan las RNA tanto en
los pesos de las conexiones como en las entradas y salidas de informacin es
numrica. Por ejemplo, un dato de entrada puede consistir en un valor numrico

discreto o binario como el sexo de una persona codificado, por ejemplo,


medinte: 0 = hombre, 1 = mujer.
En sisntesi, podemos decir que las RNA se inspiran en la estructura del
sistema nervioso, con la intencin de construir sistemas de procesamiento de la
informacin paralelos, distribuidos y adaptativos que pueden presentar un cierto
comportamiento inteligente (Martn del Brio y Sanz, 1997).
Estas caractersticas contrastan con la estructura y funcionamiento de un
ordenador convencional. Este tipo de computadores son mquinas construidas
en torno a un nico procesador (hardware) que ejecuta de un modo secuencial
(paso a paso) un programa (software) almacenados por su propia memoria.
Sigueindo este esquema, los ordenadores convencionales pueden realizar
importantes operaciones de clculo y razonamiento lgico, de forma mucho ms
rpida y eficiente que el cerebro. Sin embargo, existen problemas de difcil
solucin para un ordenador convencional que el cerebro resuelve eficazmente
(Hertz, Krogh y Plamer, 1991). Precisamente estos problemas son los
relacionados con el mundo real, los cuales estn caracterizados por un alto
grado de complejidad, impresin e incertidumbre como es el caso de la toma de
decisiones, el reconocimiento de patrones como el habla, imgenes o caracteres
escritos, etc.
Aplicaciones:
Las caractersticas de las RNA las hacen bastante apropiadas para aplicaciones
en las que no se dispone a priori de un modelo identificable que pueda ser
programado, pero se dispone de un conjunto bsico de ejemplos de entrada
(previamente clasificados o no). Asimismo, son altamente robustas tanto al
ruido como a la disfuncin de elementos concretos y son fcilmente
paralelizables.

Problemas de clasificacin.

Reconocimiento de patrones de voz, Imgenes, seales, etc.

Encontrar patrones de fraude econmico.

Hacer predicciones en el mercado financiero.

Hacer predicciones de tiempo atmosfrico, etc.

Si no existen modelos matemticos


complejidad razonable (red de Kohonen)

Problema del viajante (no se conoce solucin algortmica de complejidad


polinmica).

Algoritmos genticos (AG) para crear controladores para robots.

precisos

algoritmos

con

6. Sistemas reactivos (Reactive Systems)


Son aplicaciones crticas, en las cuales una falla o mal funcionamiento
pueden acarrear consecuencias graves, tales como poner en juego vidas
humanas y/o grandes inversiones econmicas. El comportamiento de estos
sistemas, llamados sistemas en tiempo real, no esta determinado nicamente
por la sucesin de acciones que se ejecutan, sino tambin por el momento en
que las mismas ocurren y son procesadas. El tiempo de ejecucin es el
parmetro fundamental en el comportamiento de esta clase de sistemas y una
gran parte, quizs la ms importante, delos requerimientos de los mismos son
temporales: tal accin debe ejecutarse en un lapso de tiempo determinado, el
tiempo transcurrido entre dos eventos o seales debe estar acotado por un
valor contante
Caractersticas:

Paralelismo: los sistemas reactivos se ejecutan en paralelo con otros


sistemas. Adems, ellos mismos, posiblemente, estn constituidos por
una serie de mdulos funcioando en paralelo.
Condicionantes temporales: los sistemas reactivos tienen que
responder a los estmulos de entrada instantneamente. La definicin
exacta del trmino instantneo depende mucho del tipo de sistema a
considerar.
Confiabilidad: la mayor parte de los sistemas reactivos se emplean en
situaciones donde un error puede resultar crtico (un error en un sistema
de control de trfico areo no es algo que pueda permitirse.)
Determinismo: Otra de las caractersticas importantes de todo
programa reactivo debe tener es el determinismo. Un programa o un
sistema se considera determinista cuando produce las mismas
secuencias de salida ante las mismas secuencias de entradas. Esto
parece contradictorio con la propia definicin de sistemas reactivos sin
embargo no es as si consideramos en todo caso el tiempo como una
entrada ms.

Aplicaciones:

Dominio Industrial
Controlador de la planta
Robot para tratamiento de material peligroso
Uso militar
Sistema de reconocimiento de blancos automtico
Sistema de guiado de misiles y navegacin
Sistemas altamente crticos
Plantas nucleares
Sistemas de avinica

7. Sistemas multi-agente (Multi-Agent Systems)


En un sistema multiagente el conjunto de agentes est sometido
continuamente a cambios locales. Estos cambios se disean mediante reglas de
comportamiento, cuyos resultados estn influenciados por el comportamiento
del resto de agentes. En los sistemas multiagente reactivos estas reglas de
comportamiento son muy simples y estn inspiradas por ejemplo por las
ciencias biolgicas (Ferber 96).
En el caso de agentes cognitivos las reglas de comportamiento se
corresponden con el principio de racionalidad. Por tanto, los sistemas
multiagente (SMA) no presuponen las propiedades de benevolencia, metas
compartidas y diseo centralizado para la resolucin de problemas.
Su perspectiva est centrada en la interaccin entre los agentes y se
caracterizan por (Durfee, Rosenschein 94):

Heterogeneidad de agentes: Los agentes de un sistema SMA pueden


contar con arquitecturas diferentes, utilizar diferentes representaciones
internas, comunicarse con diferentes lenguajes etc. Generalmente esta
situacin es consecuencia de que el sistema y sus agentes no hayan sido
diseados por una nica persona y para un nico.

Homogeneidad de intereses: Un caso extremo de heterogeneidad se da


cuando los agentes no son "conscientes" de que persiguen un objetivo
comn o este objetivo no existe. Entonces los agentes actan de forma auto
motivada ('egosta'), emprendiendo acciones nicamente si son
individualmente racionales, es decir, beneficiosas para ellos.

En esta rea el objeto de estudio son las situaciones en las que agentes
de este tipo cooperan, formando coaliciones, bajo qu condiciones se retiran de
una coalicin, y cuando compiten (Sandholm 98) y (Conte, Castelfranchi. 95).
Al disear un sistema basado en el conocimiento para un problema
particular se elaboran bases de conocimiento, para seguidamente, configurar
mecanismos de inferencia que razonen sobre ellas. Sin embargo, este
procedimiento es demasiado costoso para construir sistemas inteligentes a gran
escala y se plantea 'reutilizar' bases de conocimiento ya existentes.

Un problema importante que surge a la hora de integrar agentes


preexistentes reside en la heterogeneidad de sus conocimientos. En este
contexto se est promocionando lenguajes intermedios (un ejemplo es KIF,
Knowledge Interchange Format). Una vez resuelto el problema de las
representaciones heterogneas, los agentes se entienden en los trminos en los
que se describe el entorno. Sin embargo, para comunicarse por completo hace
falta especificar un lenguaje de comunicacin de agentes que defina la
pragmtica de mensajes. Una propuesta en esta direccin es KQML (Knowledge
Query and Manipulation Language) [Finnin et al, 93] un lenguaje de
comunicacin estndar entre agentes software. Otra propuesta en esta
direccin, con nfasis especial en la coordinacin entre agentes es Cool
[Barbuceanu, Fox 95].
Los sistemas multiagente pueden constituir el marco adecuado para ello:
cada sistema basado en el conocimiento se concibe como un agente inteligente,
que puede ser utilizado en diferentes dominios. Un nuevo sistema se construye
especificando la forma en la que debe interoperar con agentes ya existentes,
delegando en ellos una parte de las tareas. De esta forma se comparten
conocimiento y tcnicas de razonamiento o actuacin entre diferentes sistemas
[Netches et al 91].
Cuando pueden ser tiles

Tareas Especializadas: Pueden jugar un importante papel importante


en situaciones donde, por sus necesidades o alto riesgo, resultan
imposibles o no aconsejables para humanos.
En aplicaciones donde los datos, control o recursos son
distribuidos: El sistema puede estar conceptualizado como una
coleccin de cooperantes.
Como herramientas para comprender las sociedades humanas:
Proporcionan una nueva herramienta para simular sociedades, que
pueden arrojar luz nueva sobre varios tipos de procesos sociales (donde
los experimentos reales son inviables).
Como herramientas para formalizar y experimentar con ciertas
teoras cognitivas.
Como paradigmas de ingeniera del software: Permiten incrementar
la complejidad del software, destacando la importancia de la
independencia entre componentes y la interaccin entre ellos.

Caractersticas de un agenteinteligente:

capaces
capaces
capaces
capaces

de
de
de
de

tomar la iniciativa
compartir conocimiento
cooperar y negociar,
comprometerse con metas comunes.

Aplicaciones:
Vocales de Yves Demazeau es una de las primeras propuestas en el rea y
considera la concepcin de sistemas multiagentes desde varios puntos de
vista correspondientes a las vocales: Agente, entorno, interacciones y
organizacin.
MADKiT es una herramienta de desarrollo, propuesta por Jacques Ferber,
basada en el paradigma Agente-Role-Organizacin de la metodologa Aladin

ADELFE del grupo IRIT de la Universidad de Toulouse, trata especialmente


los temas de cooperacin entre agentes.

8. Razonamiento basado en casos (Case-Based


Reasoning)
El Razonamiento Basado en Casos (CBR) es una rama de la inteligencia
artificial que se preocupa por el estudio de los mecanismos mentales necesarios
para repetir lo que se ha hecho o vivido con anterioridad, ya sea por uno
mismo, o ya sea por casos concretos recopilados en la bibliografa o en la
sabidura popular. Los diversos casos son del tipo "Si X, entonces Y" con algunas
adaptaciones y crticas segn las experiencias previas en el resultado de cada
una de dichas reglas.
Casi no es posible imaginar un campo de mayor trascendencia para el
humano que el de la toma de decisiones. Tenemos un problema cuando no
sabemos cmo seguir. Una vez que tenemos un problema, hay que tomar una
decisin (incluyendo la de no hacer nada). Elegimos una alternativa que nos
parezca suficientemente racional que nos permita ms o menos maximizar el
valor esperado luego de resuelta nuestra accin. Emitimos en silencio un plan
de control, que nos gua en la toma de decisiones, incluyendo decisiones
relacionadas con modificar ese plan de control. Demostramos nuestra
inteligencia en este proceso en funcionamiento.
Un tpico bastante poco conocido es el papel de la inteligencia en la
resolucin de problemas, de la toma de decisiones, del planeamiento de un
control. Para la realizacin de un CBR debe de cumplirse ciertos lineamientos y
comprender su estructura.
Estructura:
La estructura de este tipo de sistemas se divide en cuatro pasos:
1. Recuperar (retrieve) los casos ms parecidos (un nuevo problema se aparea
con casos similares guardados en la base de casos)
2. Reutiliza (reuse) la solucin propuesta en los casos para tratar de resolver el
problema
3. Revisar (revise) la solucin propuesta (en caso de ser necesario)
4. Almacenar (retain) la nueva solucin como parte de un nuevo caso Un caso
es un pedazo de conocimiento contextualizado representando una
experiencia. Los casos se encuentran formados por:
1. el problema que describe el estado del mundo cuando ocurri el caso
2. una descripcin de la solucin encontrada y/o

3. un resultado describiendo el estado del mundo despus de que ocurri el


caso

Los casos pueden representarse de


representacin frames/objetos es la ms usada.

diversas

formas,

pero

la

Para facilitar la recuperacin asignar ndices. Los ndices deben:

Ser predictivos
Contemplar el propsito para el cual el caso se va a utilizar
Ser suficientemente abstractos para ensanchar el uso de la base de casos
Ser suficientemente concretos para ser reconocidos en el futuro

9. Sistemas expertos (Expert Systems)


Los sistemas expertos resuelven problemas que normalmente son
solucionados por expertos humanos.
Un sistema experto se compone de una base de conocimiento del
dominio en cuestin, mecanismos de razonamiento para aplicar conocimiento a
los problemas que se proponen, mecanismos para explicar a los usuarios el
razonamiento utilizado a la hora de ofrecer una respuesta y mecanismos de
aprendizaje y adquisicin de nuevo conocimiento.
Para crear una base de conocimiento es necesario contar con al menos un
experto humano del dominio en cuestin. Se puede adquirir su conocimiento a
partir de entrevistas mediante interfaces amigables para que lo introduzca.
Pero tambin es muy importante una adecuada modelizacin de su
conocimiento.
Los mecanismos de representacin del conocimiento que se pueden
encontrar son: lgica, redes, marcos y reglas. No obstante, lo ms utilizado es
una adecuada combinacin de marcos y reglas.
Es posible representar el conocimiento mediante hechos o instancias y
reglas algn otro mecanismo para inferir nuevos hechos. Pero deberemos
plantearnos si a partir de los hechos vamos a ir aplicando reglas
(encadenamiento hacia adelante), si por el contrario nos interesa responder a

una cuestin concreta (ej: tengo gripe?) e ir satisfaciendo subobjetivos hasta


llegar a hechos que demuestren la veracidad falsedad de la frase
(encadenamiento hacia atrs). Tambin es conveniente plantear: qu reglas
ejecutar antes, cules estn listas para ser ejecutadas, si ejecutar las reglas
cuyos antecedentes se actualizaron recientemente, si ejecutar primero reglas
especficas. Todos estos mecanismos de control del razonamiento pueden ser
tenidos en cuenta a la hora de construir nuestro sistema experto.

10. Redes Bayesianas (Bayesian Networks)


Las RBs (Pearl 1988, Jensen y Nielsen 2007) son una potente herramienta para
modelar sistemas complejos bajo incertidumbre (Getoor et al. 2004, Uusitalo
2007). Se definen como un modelo estadstico multivariante para una serie de
variables X = {X1, , Xn} formado por dos componentes:
Componente cualitativo: grafo dirigido acclico (Fig. 1) compuesto por una
serie de nodos conectados entre s mediante relaciones direccionadas, donde
los ciclos no estn permitidos. En el caso de las RB, cada nodo representa una
variable en el modelo, y los arcos entre nodos codifican las relaciones de
dependencia / independencia entre las mismas.
Por su componente cualitativo, las RBs facilitan la comunicacin entre los
expertos permitiendo, de una manera sencilla, identificar las relaciones de
dependencia o independencia entre las variables, y aquellas variables
irrelevantes sin necesidad de ningn clculo previo. Adems, presentan la
facilidad de incorporar datos e informacin de fuentes muy diversas. El
conocimiento procedente de fuentes no empricas, como datos bibliogrficos o
la opinin de expertos, pueden ser introducidos en la RB en cualquiera de los
pasos del proceso de aprendizaje y construccin del modelo (Cain et al. 2003,
Castelletti y Soncini-Sessa 2007, Henriksen et al. 2007).

Componente cuantitativo: distribuciones de probabilidad condicionada para


cada variable (Xi) dado sus padres (pa(Xi)) en el grafo, expresadas mediante
tablas de probabilidad condicionada (TPC) en el caso de variables discretas, y
funciones de densidad para las continuas.
El tratamiento de las variables continuas aporta informacin ms detallada. El
valor de probabilidad de las variables discretas viene dado para cada uno de las
categoras de la variable. Por contra, los resultados de las variables continuas
son expresados mediante funciones de densidad a partir de las cuales, es
posible calcular cualquier estadstico (media, mediana, cuartiles,) o
probabilidad de inters.

11. Vida artificial (Artificial Life). La VA no es un campo


de la IA, sino que la IA es un campo de la VA.
La vida artificial es un desarrollo humano que tiene como objeto de
estudio la investigacin de la vida y los sistemas artificiales que exhiben
propiedades similares a los seres vivos, a travs de modelos de simulacin.
El cientfico Christopher Langton fue el primero en utilizar el trmino a fines de
la dcada de 1980 cuando se celebr la "Primera Conferencia Internacional de la
Sntesis y Simulacin de Sistemas Vivientes" (tambin conocido como Vida
Artificial I) en Laboratorio Nacional de Los lamos en 1987.

El rea de vida artificial es un punto de encuentro para gente de otras


reas
ms
tradicionales
como lingstica, fsica, matemticas,
filosofa, psicologa, ciencias de la computacin, biologa, antropologa
y sociologa en las que sera inusual que se discutieran enfoques tericos y
computacionales. Como rea, tiene una historia controvertida; John Maynard
Smith critic ciertos trabajos de vida artificial en 1995 calificndolos de "ciencia
sin hechos", y generalmente no ha recibido mucha atencin de parte de
bilogos. Sin embargo, la reciente publicacin de artculos sobre vida artificial
en revistas de amplia difusin, 1 como Science y Nature son evidencia de que las
tcnicas de vida artificial son cada vez ms aceptadas por los cientficos, al
menos como un mtodo de estudio de la evolucin.

12. Computacin evolutiva (Evolutionary


Computation)
Durante los aos 50 se comenz a aplicar los principios de Charles
Darwin en la resolucin de problemas. Durante los aos 60 y 70, varias
corrientes de investigacin independientes comenzaron a formar lo que ahora
se conoce como computacin evolutiva:

Programacin evolutiva
Estrategias Evolutivas
Algoritmos genticos

La programacin evolutiva naci en la dcada de 1960 y su creador


fue Lawrence J. Fogel. Este desarrollo comenz como un esfuerzo encaminado a
crear inteligencia artificial basado en la evolucin de mquinas de estado
finitas.
Las estrategias evolutivas fueron propuestas por Ingo Rechenberg y HansPaul Schwefel en la dcada de 1970. Su principal objetivo era el de optimizar de
parmetros.

Los algoritmos genticos fueron propuestos por John H. Holland en 1975 y


su motivacin inicial fue la de proponer un modelo general de proceso
adaptable.

13. Estrategias evolutivas


Son mtodos computacionales que trabajan con una poblacin de
individuos que pertenecen al dominio.

Cada individuo de la poblacin es un posible ptimo de la funcin


objetivo; la representacin de cada Individuo de la poblacin consta de 2 tipos
de variables: las variables objeto y las variables estratgicas. Las variables
objeto son los posibles valores que hacen que la funcin objetivo alcance el
ptimo global y las variables estratgicas son los parmetros mediante los que
se gobierna el proceso evolutivo o, en otras palabras, las variables estratgicas
indican de qu manera las variables objeto son afectadas por la mutacin.

Haciendo una analoga ms precisa, el genotipo en las estrategias


evolutivas es el conjunto formado por las variables objeto y las variables
estratgicas. Y el fenotipo son las variables objeto, ya que conforme se da la
variacin de stas, se percibe un mejor o peor desempeo del individuo.

14. Algoritmos genticos (Genetic Algorithms)


Un algoritmo es una serie de pasos organizados que describe el proceso
que se debe seguir, para dar solucin a un problema especfico. En los aos
1970, de la mano de John Henry Holland, surgi una de las lneas ms
prometedoras
de
la inteligencia
artificial,
la
de
los algoritmos
genticos.1 2 Son llamados as porque se inspiran en la evolucin biolgica y su
base gentico-molecular. Estos algoritmos hacen evolucionar una poblacin de
individuos sometindola a acciones aleatorias semejantes a las que actan en la
evolucin biolgica (mutaciones y recombinaciones genticas), as como
tambin a una seleccin de acuerdo con algn criterio, en funcin del cual se
decide cules son los individuos ms adaptados, que sobreviven, y cules los
menos aptos, que son descartados. Los algoritmos genticos se enmarcan
dentro de los algoritmos evolutivos, que incluyen tambin las estrategias
evolutivas, la programacin evolutiva y la programacin gentica.

15. Tcnicas de Representacin de Conocimiento


La representacin del conocimiento y el razonamiento es un rea de
la inteligencia artificial cuyo objetivo fundamental es representar el
conocimiento de una manera que facilite la inferencia (sacar conclusiones) a

partir de dicho conocimiento. Analiza cmo pensar formalmente - cmo usar un


sistema de smbolos para representar un dominio del discurso (aquello de lo que
se puede hablar), junto con funciones que permitan inferir (realizar un
razonamiento formal) sobre los objetos. Generalmente, se usa algn tipo de
lgica para proveer una semntica formal de cmo las funciones de
razonamiento se aplican a los smbolos del dominio del discurso, adems de
proveer operadores como cuantificadores, operadores modales, etc. Esto, junto
a una teora de interpretacin, dan significado a las frases en la lgica.

Cuando diseamos una representacin del conocimiento (y un sistema de


representacin del conocimiento para interpretar frases en la lgica para poder
derivar inferencias de ellas) tenemos que hacer elecciones a lo largo de un
nmero de mbitos de diseo. La decisin ms importante que hay que tomar
es la expresividad de la representacin del conocimiento. Cuanto ms expresiva
es, decir algo es ms fcil y ms compacto. Sin embargo, cuanto ms expresivo
es un lenguaje, ms difcil es derivar inferencias automticamente de l. Un
ejemplo de una representacin del conocimiento poco expresiva es la lgica
proposicional. Un ejemplo de una representacin del conocimiento muy
expresiva es la lgica autoepistmica. Las representaciones del conocimiento
poco expresivas pueden ser tanto completas como consistentes (formalmente
menos expresivas que la teora de conjuntos). Las representaciones del
conocimiento ms expresivas pueden ser ni completas ni consistentes.
El principal problema es encontrar una representacin del conocimiento y un
sistema de razonamiento que la soporte, que pueda hacer las inferencias que
necesita una aplicacin dentro de los lmites de recursos del problema a tratar.
Los desarrollos recientes en la representacin del conocimiento han sido
liderados por la web semntica, y han incorporado el desarrollo de lenguajes y
estndares de representacin del conocimiento basados en XML, que
incluyen Resource Description Framework (RDF), RDF Schema, DARPA Agent
Markup Language (DAML), y Web Ontology Language (OWL).

16. Redes semnticas (Semantic Networks)

Las redes semnticas son estructuras utilizadas para la representacin


de conocimiento en Inteligencia Artificial.
Son especialmente tiles para representar conocimiento de taxonomas.
Una red semntica es un grafo dirigido en el cual los nodos corresponden
a: Constantes de relacin tales como clases (como en los lenguaje
orientado a objetos) y propiedades. Instancias: objetos de alguna clase.
Las aristas en una red semntica estn tambin etiquetadas y
representan relaciones entre clases, propiedades e instancias.

Un ejemplo:

Tenemos dos objetos, Piolin y Pedro. Intuitivamente podemos inferir que


Piolin es un ave dado que canario es una subclase de ave y Piloin es un canario,
podemos inferir tambin que Piolin tiene alas.
No hay un significado preciso para una red semntica cualquiera, este
depender de la aplicacin y debe ser especificado por el diseador de la red.

17. Procesamiento del lenguaje natural (Natural


Language Processing)
Antes de abordar qu es el procesamiento del lenguaje natural (
lenguaje humano), pensemos por un momento qu es la compresin. Segn
Rich y Knigth "comprender algo es transformarlo de una representacin a otra,
en donde la segunda representacin se ha elegido para que se corresponda con
un conjunto de acciones posibles que podran llevarse a cabo, y en donde se ha
diseado la correspondencia de forma que para cada suceso se realice una
accin apropiada". En definitiva, comprender algo es transformarlo en una
representacin que nos sea ms til para lograr nuestro objetivo.
Para qu podemos querer que una mquina comprenda lo que pone en un
texto? Lo primero que se nos puede ocurrir es que sirva para comunicarnos con
ella como si de una persona se tratara, pero para ello no solo requerira
comprender nuestras palabras, sino tambin las emociones con las que las
expresamos, lo cual es algo ms complejo. La traduccin automtica desde un
lenguaje natural a otro es algo para lo que solo necesitamos comprender el
significado neutral de las palabras. Si conseguimos que un ordenador
comprenda, tambin nos va a ayudar en tareas de recuperacin de la
informacin; me refiero a buscadores ms eficaces que sepan relacionar mejor
unas palabras o frases con otras, e incluso independientemente del idioma.

Anlisis morfolgico: Se analizan los componentes de las palabras


individuales y se separan de las palabras los constituyentes que no
forman parte de ellas, como los smbolos de puntuacin

Anlisis sintctico: Se transforman las secuencias lineales de palabras en


ciertas estructuras que muestran la forma en que las palabras se
relacionan entre s. Se pueden rechazar algunas secuencias de palabras si
infringen las reglas del lenguaje sobre la forma en que las palabras
pueden combinarse. Ej: "nia la come mucho" se rechazara.

Anlisis semntico: Se asigna significado a las estructuras creadas por el


analizador sintctico. Es decir, se hace una correspondencia entre las
estructuras sintcticas y los objetos del dominio de la tarea. Las
estructuras en las que no se pueda realizar tal correpondecia se
rechazan. Ej: "Las ideas verdes incoloras duermen furiosamente" se
rechazara

Integracin del discurso: El significado de una frase individual puede


depender de las frases precedentes y puede influenciar el significado de
las frases posteriores. Por ejemplo, la palabra "lo" en "Jaime lo quiso"
depende del contexto del discurso, mientras que la palabra "Jaime" puede
influenciar el significado de frases posteriores como "l vive en Madrid".

Anlisis de la pragmtica: La estructura que representa qu se ha dicho


se reinterpreta para determinar su significado actual. Ej: "Sabe qu hora
es?" se reintepreta como peticin de hora.

Para realizar estas tareas es necesario comprender un texto; esto es lo


que nos proporciona el procesamiento del lenguaje natural. Veamos las
fases de las que se compone [Rich y Knight, 1994]:

Hasta ahora hemos estado hablando del procesamiento del lenguaje


escrito, si quisiramos realizar procesamiento del lenguaje oral,
necesitaramos conocimiento adicional sobre fonologa, as como
suficiente informacin adicional para manejar las posibles ambigedades
que pudieran surgir.

18. Minera de datos (Data Mining)


La minera de datos o exploracin de datos (es la etapa de anlisis de
"Knowledge Discovery in Databases" o KDD) es un campo de las ciencias de la
computacin referido al proceso que intenta descubrir patrones en grandes
volmenes de conjuntos de datos. 1 Utiliza los mtodos de la inteligencia
artificial, aprendizaje automtico, estadstica y sistemas de bases de datos. El
objetivo general del proceso de minera de datos consiste en extraer
informacin de un conjunto de datos y transformarla en una estructura
comprensible para su uso posterior. Adems de la etapa de anlisis en bruto,
que involucra aspectos de bases de datos y de gestin de datos,
de procesamiento de datos, del modelo y de las consideraciones de inferencia,
de mtricas de Intereses, de consideraciones de la Teora de la complejidad
computacional, de post-procesamiento de las estructuras descubiertas, de la
visualizacin y de la actualizacin en lnea.

El trmino es una palabra de moda, y es frecuentemente mal utilizado


para referirse a cualquier forma de datos a gran escala o procesamiento de la
informacin (recoleccin, extraccin, almacenamiento, anlisis y estadsticas),
pero tambin se ha generalizado a cualquier tipo de sistema de apoyo

informtico decisin, incluyendo la inteligencia artificial, aprendizaje automtico


y la inteligencia empresarial. En el uso de la palabra, el trmino clave es el
descubrimiento, comnmente se define como "la deteccin de algo nuevo".
Incluso el popular libro "La minera de datos: sistema de prcticas herramientas
de aprendizaje y tcnicas con Java" (que cubre todo el material de aprendizaje
automtico) originalmente iba a ser llamado simplemente "la mquina de
aprendizaje prctico", y el trmino "minera de datos" se aadi por razones de
marketing. A menudo, los trminos ms generales "(gran escala) el anlisis de
datos", o "anlisis" -. o cuando se refiere a los mtodos actuales, la inteligencia
artificial y aprendizaje automtico, son ms apropiados.
La tarea de minera de datos real es el anlisis automtico o semi-automtico de
grandes cantidades de datos para extraer patrones interesantes hasta ahora
desconocidos, como los grupos de registros de datos (anlisis clster), registros
poco usuales (la deteccin de anomalas) y dependencias (minera por reglas de
asociacin). Esto generalmente implica el uso de tcnicas de bases de datos
como los ndices espaciales. Estos patrones pueden entonces ser vistos como
una especie de resumen de los datos de entrada, y pueden ser utilizados en el
anlisis adicional o, por ejemplo, en la mquina de aprendizaje y anlisis
predictivo. Por ejemplo, el paso de minera de datos podra identificar varios
grupos en los datos, que luego pueden ser utilizados para obtener resultados
ms precisos de prediccin por un sistema de soporte de decisiones. Ni la
recoleccin de datos, preparacin de datos, ni la interpretacin de los resultados
y la informacin son parte de la etapa de minera de datos, pero que pertenecen
a todo el proceso KDD como pasos adicionales.

Los trminos relacionados con la obtencin de datos, la pesca de datos y


espionaje de los datos se refieren a la utilizacin de mtodos de minera de
datos a las partes de la muestra de un conjunto de datos de poblacin ms
grandes establecidas que son (o pueden ser) demasiado pequeas para las
inferencias estadsticas fiables que se hizo acerca de la validez de cualquier
patrn descubierto. Estos mtodos pueden, sin embargo, ser utilizados en la
creacin de nuevas hiptesis que se prueban contra poblaciones de datos ms
grandes.

19. Bibliografa
https://es.wikipedia.org/wiki/Aprendizaje_autom%C3%A1tico
http://www.ptolomeo.unam.mx:8080/xmlui/bitstream/handle/132.248.52.100/21
9/A5.pdf?sequence=5
http://www.itnuevolaredo.edu.mx/takeyas/Apuntes/Inteligencia
%20Artificial/Apuntes/tareas_alumnos/LD/LD(2005-II).pdf
http://www.esi.uclm.es/www/cglez/downloads/docencia/2011_Softcomputing/Log
icaDifusa.pdf
http://disi.unal.edu.co/~lctorress/RedNeu/LiRna001.pdf

SISTEMAS EXPERTOS
1. Historia
Sus inicios datan a mediados de los aos sesenta. Durante esta dcada los
investigadores Alan Newell y Herbert Simon desarrollaron un programa
llamado GPS (General Problem Solver; solucionador general de problemas).
Poda trabajar con criptoaritmtica, con las torres de Hanoi y con otros
problemas similares. Lo que no poda hacer el GPS era resolver problemas
del mundo real, tales como un diagnstico mdico.

Algunos investigadores decidieron entonces cambiar por completo el


enfoque del problema restringiendo su ambicin a un dominio especfico e
intentando simular el razonamiento de un experto humano. En vez de
dedicarse a computarizar la inteligencia general, se centraron en dominios
de conocimiento muy concretos. De esta manera nacieron los SE.

A partir de 1965, un equipo dirigido por Edward Feigenbaum, comenz a


desarrollar
SE utilizando
bases
de
conocimiento
definidas
minuciosamente. Dos aos ms tarde se construye DENDRAL, el cual es
considerado
como
el
primer SE.
La
ficcin
de
dicho SE era
identificar estructuras qumicas moleculares a partir de su anlisis
espectrogrfico.

En la dcada de los setenta se desarroll MYCIN para consulta y diagnstico


de infecciones de la sangre. Este sistema introdujo nuevas caractersticas:
utilizacin de conocimiento impreciso para razonar y posibilidad de explicar
el proceso de razonamiento. Lo ms importante es que funcionaba de
manera correcta, dando conclusiones anlogas a las que un ser humano
dara tras largos aos de experiencia. En MYCIN aparecen claramente
diferenciados motor de inferencia y base de conocimientos. Al separar esas
dos partes, se puede considerar el motor de inferencias aisladamente. Esto
da como resultado un sistema vaco o shell (concha).

As surgi EMYCIN (MYCIN Esencial) con el que se construy SACON, utilizado


para estructuras de ingeniera, PUFF para estudiar la funcin pulmonar y
GUIDON para elegir tratamientos teraputicos.

En esa poca se desarrollaron tambin: HERSAY, que intentaba identificar la


palabra hablada, y PROSPECTOR, utilizado para hallar yacimientos

de minerales. De este ltimo deriv el shell KAS (Knowledge Adquisition


System).

En la dcada de los ochenta se ponen de moda los SE, numerosas empresas


de alta tecnologa investigan en este rea de la inteligencia artificial,
desarrollando SE para su comercializacin. Se llega a la conclusin de que
el xito de un SE depende casi exclusivamente de la calidad de su base de
conocimiento. El inconveniente es que codificar la pericia de un experto
humano puede resultar difcil, largo y laborioso.

Un
ejemplo
de SE moderno
evala proyectos de inversin y
VATIA,
del impuesto sobre el valor aadido o IVA.

es
que

CASHVALUE,
asesora

que
acerca

2. Definicin
Es una aplicacin informtica capaz de solucionar un conjunto de problemas
que exigen un gran conocimiento sobre un determinado tema. Un sistema
experto es un conjunto de programas que, sobre una base de conocimientos,
posee informacin de uno o ms expertos en un rea especfica. Se puede
entender como una rama de la inteligencia artificial, donde el poder de
resolucin de un problema en un programa de computadora viene del
conocimiento de un dominio especfico. Estos sistemas imitan las actividades
de un humano para resolver problemas de distinta ndole (no
necesariamente tiene que ser de inteligencia artificial). Tambin se dice que
un SE se basa en el conocimiento declarativo (hechos sobre objetos,
situaciones) y el conocimiento de control (informacin sobre el seguimiento
de una accin).
Los sistemas expertos son llamados as porque emulan el razonamiento de
un experto en un dominio concreto, y en ocasiones son usados por stos.
Con los sistemas expertos se busca una mejor calidad y rapidez en las
respuestas, dando as lugar a una mejora de la productividad del propio
experto al usar este tipo de sistemas informticos.
Es un software que imita el comportamiento de un experto humano en la
solucin de un problema. Pueden almacenar conocimientos de expertos para
un
campo
determinado
y
solucionar
un
problema
mediante deduccin lgica de conclusiones.

Son SE aquellos programas que


se
realizan
haciendo
explicito el
conocimiento en ellos, que tienen informacin especfica de un dominio
concreto y que realizan una tarea relativa a este dominio.

Programas que manipulan conocimiento codificado para resolver problemas


en un dominio especializado en un dominio que generalmente requiere de
experiencia humana.

Programas que contienen tanto conocimiento declarativo (hechos a cerca de


objetos, eventos y/o situaciones) como conocimiento de control (informacin
acerca de los cursos de una accin), para emular el proceso de razonamiento
de los expertos humanos en un dominio en particular y/o rea de
experiencia.

Software que incorpora conocimiento de experto sobre un dominio de


aplicacin dado, de manera que es capaz de resolver problemas de relativa
dificultad y apoyar la toma de decisiones inteligentes en base a un proceso
de razonamiento simblico
Para que un sistema experto sea herramienta efectiva, los usuarios deben
interactuar de una forma fcil, reuniendo dos capacidades para poder
cumplirlo:
1. Explicar sus razonamientos o base del conocimiento: los sistemas
expertos se deben realizar siguiendo ciertas reglas o pasos
comprensibles de manera que se pueda generar la explicacin para
cada una de estas reglas, que a la vez se basan en hechos.

2. Adquisicin de nuevos conocimientos o integrador del sistema: son


mecanismos de razonamiento que sirven para modificar los
conocimientos anteriores. Sobre la base de lo anterior se puede decir
que los sistemas expertos son el producto de investigaciones en el
campo de la inteligencia artificial ya que sta no intenta sustituir a los
expertos humanos, sino que se desea ayudarlos a realizar con ms
rapidez y eficacia todas las tareas que realiza.
Debido a esto en la actualidad se estn mezclando diferentes tcnicas o
aplicaciones aprovechando las ventajas que cada una de estas ofrece para
poder tener empresas ms seguras. Un ejemplo de estas tcnicas sera los
agentes que tienen la capacidad de negociar y navegar a travs de recursos
en lnea; y es por eso que en la actualidad juega un papel preponderante en
los sistemas expertos.

3. Ventajas
Permanencia: A diferencia de un experto humano un SE (sistema experto)

no envejece, y por tanto no sufre prdida de facultades con el paso del


tiempo.
Replicacin: Una vez programado un SE lo podemos replicar infinidad de

veces.
Rapidez: Un SE puede obtener informacin de una base de datos y

realizar clculos numricos mucho ms rpido que cualquier ser humano.


Bajo costo: A pesar de que el costo inicial pueda ser elevado, gracias a la

capacidad de duplicacin el coste finalmente es bajo.


Entornos peligrosos: Un SE puede trabajar en entornos peligrosos o

dainos para el ser humano.


Fiabilidad: Los SE no se ven afectados por condiciones externas, un

humano s (cansancio, presin, etc.).

Consolidar varios conocimientos.

Apoyo Acadmico.

4. Limitaciones

Sentido comn: Para un Sistema Experto no hay nada obvio. Por ejemplo,
un sistema experto sobre medicina podra admitir que un hombre lleva 40
meses embarazado, a no ser que se especifique que esto no es posible ya
que un hombre no puede gestar hijos.

Lenguaje natural: Con un experto humano podemos mantener una


conversacin informal mientras que con un SE no podemos.

Capacidad de aprendizaje: Cualquier persona aprende con relativa


facilidad de sus errores y de errores ajenos, que un SE haga esto es muy
complicado.

Perspectiva global: Un experto humano es capaz de distinguir cuales son


las cuestiones relevantes de un problema y separarlas de cuestiones
secundarias.

Capacidad sensorial: Un SE carece de sentidos.

Flexibilidad: Un humano es sumamente flexible a la hora de aceptar datos


para la resolucin de un problema.

Conocimiento

no

estructurado:

Un

SE

no

es

capaz

de

manejar

conocimiento poco estructurado

5. Arquitectura bsica de los Sistemas Expertos


Base de conocimientos. Es la parte del sistema experto que contiene el
conocimiento sobre el dominio. Hay que obtener el conocimiento del experto
y codificarlo en la base de conocimientos. Una forma clsica de representar
el conocimiento en un sistema experto son lar reglas. Una regla es
una estructura condicional que relaciona lgicamente la informacin
contenida en la parte del antecedente con otra informacin contenida en la
parte del consecuente.

Base de hechos (Memoria de trabajo): Contiene los hechos sobre un


problema que se han descubierto durante una consulta. Durante una
consulta con el sistema experto, el usuario introduce la informacin del
problema actual en la base de hechos. El sistema empareja esta informacin
con el conocimiento disponible en la base de conocimientos para deducir
nuevos hechos.

Motor de inferencia: El sistema experto modela el proceso de razonamiento


humano con un mdulo conocido como el motor de inferencia. Dicho motor
de inferencia trabaja con la informacin contenida en la base de
conocimientos y la base de hechos para deducir nuevos hechos. Contrasta
los hechos particulares de la base de hechos con el conocimiento contenido
en la base de conocimientos para obtener conclusiones acerca del problema.

Subsistema de explicacin: Una caracterstica de los sistemas expertos es su


habilidad para explicar su razonamiento. Usando el mdulo del subsistema
de explicacin, un sistema experto puede proporcionar una explicacin al
usuario de por qu est haciendo una pregunta y cmo ha llegado a una
conclusin. Este mdulo proporciona beneficios tanto al diseador del
sistema como al usuario. El diseador puede usarlo para detectar errores y el
usuario se beneficia de la transparencia del sistema.

Interfaz de usuario: La interaccin entre un sistema experto y un usuario se


realiza en lenguaje natural. Tambin es altamente interactiva y sigue el
patrn de la conversacin entre seres humanos. Para conducir este proceso
de manera aceptable para el usuario es especialmente importante

el diseo del interfaz de usuario. Un requerimiento bsico del interfaz es la


habilidad de hacer preguntas. Para obtener informacin fiable del usuario
hay que poner especial cuidado en el diseo de las cuestiones. Esto puede
requerir disear el interfaz usando mens o grficos.

6. Tendencia de los sistemas expertos

Los Sistemas Expertos se estn utilizando cada vez ms en las


organizaciones, debido a que la tecnologa tambin es cada vez ms
accesible para una gran mayora de las empresas.
Se piensa que en el futuro las interfaces de los Sistemas Expertos sern
en leguaje natural, lo cual facilitar la comunicacin entre usuarios y el
sistema.
Los Sistemas Expertos darn mayor soporte en el proceso de toma de
decisiones, permitiendo tener el conocimiento del experto capturando en
una base de conocimiento y utilizarlo cuando se requiera sin que est l
presente.
Se manejarn herramientas inteligentes para explotar la informacin que
contengan las bases de datos, permitiendo con ello un mejor uso de la
informacin.
Los Sistemas Expertos se integrarn a otras tecnologas para dar un
mayor soporte en todas las reas de la empresa.

7. Aplicaciones
Sus principales aplicaciones se dan en las gestiones empresariales debido a
que;

a) Casi todas las empresas disponen de un ordenador que realiza las


funciones bsicas de tratamiento de la informacin: contabilidad general,
decisiones financieras, gestin de la tesorera, planificacin, etc.

b) Este trabajo implica manejar grandes volmenes de informacin y realizar


operaciones numricas para despus tomar decisiones. Esto crea un terreno
ideal para la implantacin de los SE.

Adems los SE tambin se aplican en la contabilidad en apartados como:


Auditoria(es el campo en el que ms aplicaciones de SE se est realizando)
Fiscalidad, planificacin, anlisis financiero y la contabilidad financiera.

REAS DE APLICACIN

Los SE se aplican a una gran diversidad de campos y/o reas. A continuacin


se listan algunas de las principales:

Militar

Informtica

Telecomunicacio
nes

Qumica

Derecho

Aeronutica

Geologa

Arqueologa

Agricultura

Electrnica

Transporte

Educacin

Medicina

Industria

Finanzas y
Gestin

Ejemplos

SISTEM
A

FECH
A

AUTOR

APLICACIN

DENDRAL

1965

Stanford

Deduce informacin sobre


estructuras qumicas

Macsyma

1965

MIT

Anlisis matemtico complejo

HearSay

1965

CarnegieMellon

Interpreta en lenguaje natural


un subconjunto del idioma

Mycin

1972

Stanford

Diagnstico de enfermedades
de sangre

Tieresias

1972

Stanford

Herramientas para la
transformacin de
conocimientos

Prospecto
r

1972

Stanford

Exploracin mineral y
herramientas de identificacin

Age

1973

Stanford

Herramienta para generar


sistemas expertos

OPS5

1974

Carnegie

Herramientas para desarrollo de


sistemas expertos

Caduceus

1975

University of
Pittsburg

Herramienta de diagnstico para


medicina interna

Rosie

1978

Rand

Herramienta de desarrollo de
sistemas expertos.

R1

1978

Carnegie Mellon

Configurador de equipos de
computacin para DEC

VIDA ARTIFICIAL
La vida artificial es un desarrollo humano que tiene como objeto de estudio
la investigacin de la vida y los sistemas artificiales que exhiben propiedades
similares a los seres vivos, a travs de modelos de simulacin.
El cientfico Christopher Langton fue el primero en utilizar el trmino a fines de
la dcada de 1980 cuando se celebr la "Primera Conferencia Internacional de la
Sntesis y Simulacin de Sistemas Vivientes" (tambin conocido como Vida
Artificial I) en Laboratorio Nacional de Los lamos en 1987.
El rea de vida artificial es un punto de encuentro para gente de otras reas
ms
tradicionales
como lingstica, fsica, matemticas,filosofa, psicologa, ciencias
de
la
computacin, biologa, antropologa y sociologa en las que sera inusual que se
discutieran enfoques tericos y computacionales. Como rea, tiene una historia
controvertida; John Maynard Smith critic ciertos trabajos de vida artificial
en 1995 calificndolos de "ciencia sin hechos", y generalmente no ha recibido
mucha atencin de parte de bilogos. Sin embargo, la reciente publicacin de
artculos
sobre
vida
artificial
en
revistas
de
amplia
difusin,1 como Science y Nature son evidencia de que las tcnicas de vida
artificial son cada vez ms aceptadas por los cientficos, al menos como un
mtodo de estudio de la evolucin.
El tema de la "vida artificial" se relaciona con el tema de la "inteligencia
artificial". Ambos trminos se refieren a disciplinas sumamente nuevas y de
carcter interdisciplinario. Adems, ambas hacen uso esencial de las tcnicas de

la computacin electrnica. La inteligencia artificial (IA) es la ms antigua de las


dos disciplinas, habindose desarrollado a partir de los aos cincuenta. La vida
artificial (VA) es de ayer: nace en una conferencia sostenida en 1987 que reuni
a especialistas de diversas ciencias, conectados entre s por el comn inters en
la nueva disciplina. La computacin electrnica es un componente esencial de la
IA, pues en ella se trata de construir sistemas computacionales capaces de
realizar tareas inteligentemente. Es tambin un componente esencial de la VA
por cuanto la programacin electrnica ofrece el medio ms econmico y eficaz
de producir los elementos cuyo comportamiento estudia la disciplina. Ambas
ciencias se valen de la computacin como instrumento metodolgico para
experimentar con modelos de lo que no se puede por distintas razones,
experimentar "en vivo". Ambas tambin pretenden usar la computacin para
aplicar sus principios al orden tecnolgico y producir productos tiles. Pero sobre
todo, y adems de estas coincidencias, ambas disciplinas constituyen un
esfuerzo cientfico de alto grado de abstraccin que promueve generalizaciones
sin precedentes sobre dos de las ms importantes ciencias empricas
contemporneas: la psicologa y la biologa.

1. Definicin
Entendemos por inteligencia artificial una disciplina que se dedica a procurar
que los ordenadores sean capaces de realizar tareas intelectuales que, si las
hicieren los seres humanos, diramos que requieren inteligencia. Llamamos
Vida Artificial a la realizacin de comportamientos similares a la vida de
parte de sistemas hechos por el hombre, consistentes en poblaciones de
entes semiautnomos cuyas interacciones locales mutuas estn gobernadas
por un conjunto de reglas simples. Lo interesante de estas situaciones es que
en esos comportamientos se logran observar dinmicas y estructuras de alto
nivel que tienen la calidad de propiedades emergentes, originadas en el
transcurso del tiempo a partir de la totalidad de las interacciones locales
entre los componentes de bajo nivel.

2. Perspectiva metodolgica
Los fenmenos biolgicos de la evolucin han sido estudiados hasta ahora en
su encarnacin concreta en especies que mutan, se recombinan, luchan con
el ambiente, se reproducen, y -como resultado de esas peripecias- se
transforman en otras especies. Pero todo pareciera indicar que estos
fenmenos son objeto de inters con independencia de la encarnacin de las
poblaciones en compuestos carbnicos; igualmente seran interesantes si la
base qumica de la vida fuera diferente. Pero si esto es as, estamos slo a un
paso de entender que los fenmenos de la evolucin son independientes de
la materia que constituye su objeto, que lo realmente importante es el
aspecto formal de estas interacciones. Podemos entonces postular una
disciplina de la vida totalmente formal, anloga a la teora formal de la
inteligencia: en esa disciplina lo importante ser la existencia de poblaciones
de elementos semejantes que transcurren en el tiempo, son capaces de
mutar y recombinan, luchan por la supervivencia en un ambiente comn y se
reproducen a s mismos. En tal disciplina los elementos pueden ser seres

vivientes terrestres en el sentido tradicional, seres vivos de otros planetas,


robots en la luna, mano-mquinas herramientas inoculadas en la sangre o
formas grficas en una pantalla de ordenador.

3. Ventajas

Los dispositivos creados podran ser programados para curar diferentes


enfermedades.

Producir sustancias metablicas para todo tipo de procesos biolgicos.

4. Desventajas

La creacin de armas biolgicas o de transgnicos indeseables traera


como consecuencia muchos problemas para la sociedad

La creacin de una mayor y peligrosa competencia entre los sectores de


la industria

5. Ejemplos de vida artificial


Los genes, rganos de la herencia, tienen dos funciones precisas y
diferenciabas: por un lado participan en la embriologa, influenciando el
desarrollo del fenotipo en una generacin particular; por el otro, participan
en la gentica, al hacerse copiar al travs de la sucesin de generaciones. En
la vida artificial tambin deben considerarse estas dos dimensiones. Las
embriologas estn constreidas, en el sentido de que poseen un conjunto
restringido de fenotipos que les es posible generar, los cuales son
especificados por un nmero menor de genes. En ello, como en muchas
otras cosas, se parecen a los programas de computacin, que son capaces
de producir una amplia variedad de efectos con un nmero muy limitado de
medios.
En su artculo "La Evolucin de la Evolubilidad", Richard Dawkins nos
presenta los resultados de su trabajo en evolucin artificial en que aplic
estos principios. En particular toma en cuenta las clases de constreimientos
embriolgicos; por ejemplo, la mayor parte de los animales son simtricos
bilateralmente; la segmentacin es un fenmeno de distribucin muy amplia;
esta segmentacin tiene gradientes en una gran cantidad de casos . Las
plantas, por su parte, exhiben un alto grado de recursividad en sus
ramificaciones (pinsese sobre todo en los helechos).
Todos estos fenmenos se pueden estipular en los "genes" como condiciones
de desarrollo de una manera general y compacta; en cambio, los "fenotipos"
los mostrarn como matemticas, al "hacer cosas grandes con medios
pequeos", caracterstica comn de la biologa y de la programacin
electrnica, especialmente patente en la investigacin de vida artificial. La
imagen adjunta, tomado de la citada obra de Dawkins, son ejemplos de
"biomorfos" producidos por un programa con 9 "genes", uno de los cuales
muta en cada generacin; un biomorfo fue seleccionado en cada generacin,
con criterios de inters esttico y similitud con seres vivos.

6. Autmatas celulares

Los autmatas celulares aparecen por primera vez a finales de los aos
40, ms concretamente a partir de 1947, de la mano de Von Neumann y
Stanislaw Ulam, dos expertos en fsica computacional con una fuerte
relacin de amistad tras las colaboraciones que realizaron durante el
desarrollo del proyecto Manhattan.

Los autmatas celulares fue basado en un Modelo discreto: estudiado en


la teora de la computabilidad y en matemticas.

Consiste en una matriz o rejilla regular e infinitas de clulas cada una


dentro de un estado determinado dentro de un conjunto finito de ellos.

El vecindario de una celda determinada esta definida por un subconjunto


de las celdas situadas el distintas posiciones relativas alas celdas
analizadas y no cambia.

7. Aplicaciones
Las aplicaciones de la vida artificial se pueden encontrar en alguno de estos
casos:

Los sistemas complejos adaptativos, que han dado paso a una nueva
generacin de sistemas expertos, que son capaces de aprender y
evolucionar.

Los autmatas celulares, que imitan funciones de los organismos


celulares en programas complejos, aplicando el conocimiento biolgico de
los mismos a principios prcticos de organizacin en sistemas de
cmputo.

Los agentes autnomos, que son cada da ms usados en aplicaciones de


bsqueda.

En el conocimiento de comportamientos adaptativos, para el desarrollo


de robots adaptativos.

La computacin cuntica, que a travs del uso de las propiedades


cunticas de los tomos y sus desplazamientos, posibilitar una nueva
forma de clculos binarios.

En algunos campos de aplicacin de la vida artificial se plantean dos tipos de


simulaciones, basadas en el mundo real, las cuales ayudan a la toma de
decisiones. Estas son:

La primera de ellas, se centra en los aspectos de "ms alto nivel" en cada


problema, utilizando frmulas y reglas, o hechos histricos, que ayudan a
la toma de decisiones. Un ejemplo de esto pueden ser las frmulas
del tiro parablico, ya que estas pueden entenderse como modelos de
simulacin.

La segunda pone atencin en los aspectos de "ms bajo nivel", mediante


frmulas o reglas. Una de las ventajas de este tipo de simulaciones es
que sus caractersticas son ms sencillas, ya que suelen ser ms fciles
de detectar los aspectos de bajo nivel que aquellos de alto nivel.

Aplicaciones de la vida artificial en la actualidad


En la actualidad como palpable realidad, la vida artificial est dando lugar a una
autentica revolucin heurstica y a una serie de impresionantes trabajos de
investigacin y entre los que podemos destacar se encuentran:
Las denominadas maquinan bio-inspiradas, que como su nombre lo indica se
fundamentan en su estructura y diseo biolgico, destacndolos trabajos en el
campo de la biomecnica para desarrollos en el campo de la medicina de
sustitucin, la robtica homnida y nuevos tipo de bio-mecanismos.
Proyecciones a futuro

La creacin y el diseo de organismos vivos

La cura de enfermedades cromosmicas

La investigacin de frmacos y contaminantes

La capacidad de alargar nuestra vida evitando el envejecimiento

Avances
Un equipo cientfico internacional ha creado por primera vez en laboratorio
un cromosoma completo de una clula con ncleo el tipo de clula que forma
el cuerpo humano. El avance, presentado ayer en la web de la revista Science,
supone un hito hacia el objetivo an lejano de crear un ser vivo ntegramente en
laboratorio. La investigacin se ha centrado en el ms pequeo de los 16
cromosomas de la levadura de la cerveza (Saccharomyces cerevisiae), un hongo
unicelular que se utiliza en la produccin de pan, cerveza y vino. Se trata de una
clula con ncleo o eucariota, al igual que las de animales y plantas.

SISTEMAS BASADOS EN EL CONOCIMIENTO


1. Resea
Los sistemas basados en conocimiento surgen como una evolucin de los
paradigmas de programacin a lo largo de la historia de la informtica. En los
primeros tiempos de la computacin, los programas, ante una peticin del
usuario, tpicamente producan una salida accediendo a datos almacenados
en ficheros con formatos particulares de cada aplicacin.
Ms adelante surgieron las bases de datos, que abstraan la capa de
almacenamiento/persistencia de datos, eliminando esos ficheros, facilitando
as la gestin de la informacin necesaria para la aplicacin. Adems
aparecen los conceptos de la interfaz grfica del sistema operativo,
facilitando la entrada/salida.
Los sistemas basados en conocimiento son una nueva evolucin: en estos
sistemas, los datos, la base de conocimientos, se convierten en lo ms
importante, y el cdigo que los explota, el motor de inferencias, se
generaliza segn diferentes paradigmas. Esta base de conocimientos la
produce un usuario experto en el dominio, los ingenieros del conocimiento,
que son diferentes a los programadores de la interfaz o del propio motor de
inferencias.
La ingeniera del conocimiento surge como una variante de la ingeniera del
software tradicional en cuanto a que se enfoca al diseo y construccin de
sistemas basados en conocimiento.
El conocimiento es un activo cada vez mas apreciado por la sociedad
contempornea, sus instituciones acadmicas, de investigacin y produccin
se esfuerzan en adquirir mas conceptos, desarrollar modernas tecnologas,
formular nuevas teoras y aportar significativos descubrimientos e
invenciones en los todos los campos de las ciencias con el propsito de
proveer un mayor bienestar a la poblacin.
El conocimiento acumulado a lo largo de la historia, evoluciona y se actualiza
permanentemente en forma cada vez mas acelerada, expandiendo su
alcance y repercusin social en cada mbito de la actividad humana.
Constituye el motor de transformacin y desarrollo de una nacin dentro del
concierto mundial cada vez mas competido, donde los pases que alcanzan
un primer plano de crecimiento industrial, tecnolgico y econmico,
repercutiendo sus beneficios entre los habitantes. Ellos se caracterizan por la

gran inversin que realizan en la adquisicin, desarrollo y explotacin de


conocimiento especializado.
Las organizaciones reconocen que su principal recurso es el humano, entre
las razones que justifican la afirmacin destaca, el atributo de la persona
como un ser dotado de habilidades y capacidades adecuadas en el ejercicio
de funciones especficas gracias al nivel de preparacin que ha adquirido a lo
largo de su vida; donde a travs del estudio, prctica y experiencias acumula
un alto nivel de conocimientos. Por tal motivo, el individuo, la familia, las
empresas y el gobierno reconocen como una prioridad el fomento de la
educacin, la investigacin y el desarrollo tecnolgico. Ya que este medio
constituye la esperanza de un mejor futuro, puesto que es un instrumento
que contribuye a colocar en una posicin ventajosa a la persona, la
organizacin y al pas mismo dentro del mbito donde se desenvuelven.
La informtica como un campo de la actividad, est dedicada a eficientar el
ejercicio de diversas labores, por medio de la representacin y empleo de
conocimiento especfico para la sistematizacin de las tareas, de tal forma
que se realicen con un mayor grado de rapidez, exactitud y simplicidad,
contribuyendo a elevar el bienestar de los usuarios. Para ello aplica un
enfoque interdisciplinario, procura mejorar sus instrumentos y metodologas
de trabajo, aspira a optimizar cada vez mas sus aplicaciones y extender su
marco de accin. Entre sus pretensiones destaca la creacin de sistemas
basados en conocimiento dedicados a una aplicacin especfica. Para ello,
utiliza las aportaciones de la inteligencia artificial en las reas de
aprendizaje, razonamiento, representacin de conocimiento y comunicacin.
Con estos elementos, procura crear una aplicacin mecanizada que
almacene, explote y actualice los conocimientos que los especialistas en un
campo pueden aportar para la solucin de problemas especficos, dando vida
a los sistemas expertos.
El profesional de la informtica debe adquirir los conocimientos y habilidades
que le permitan encarar proyectos con un alto nivel de desarrollo
tecnolgico, entre ellos la creacin de sistemas expertos que procuren
explotar el acervo de los especialistas en forma sistematizada, destinndolos
a campos especficos como el diagnstico mdico, control de procesos,
evaluacin de condiciones meteorolgicas, entre otros.
Dicha formacin se obtiene por medio de cursos, herramientas y acervos
pertenecientes a la ingeniera del conocimiento. Con ese propsito se ha
compilado este material a lo largo de estudios, investigacin y enseanza en
el campo de los sistemas expertos, que al ser redactados en formato de
apuntes respaldan la ctedra del profesor y el estudio de los alumnos. En
ellos se ofrece las argumentaciones necesarias para comprender los temas
conforme al programa de la asignatura.
Su contenido incluye un perfil de los sistemas basados en conocimiento; los
alcances y elementos de los sistemas expertos. Explica la metodologa y
programacin de un shell para construir sistemas. Brinda los conceptos y
tcnicas apropiadas en la creacin del mecanismo de aprendizaje, base de
conocimientos, motor de inferencia e interface hombre mquina. Finaliza
con la descripcin del metaconocimiento.

2.

Definicin
Los sistemas basados en el conocimiento son el resultado de un largo
proceso de investigacin realizado por los cientficos en el rea de la
Inteligencia Artificial, cuando, en los aos setenta, comenzaron a
comprender que la capacidad de un programa de ordenador para resolver
problemas no reside en la expresin formal ni en los esquemas lgicos de
inferencia que emplea sino en el conocimiento que posee.
Un experto es alguien que posee unos determinados conocimientos y
experiencia en un campo de la actividad humana y es capaz de aplicarlos
con rapidez y eficiencia en la resolucin de tareas diferentes aunque no le
hayan sido encomendadas con anterioridad, pero que caen dentro de su
dominio.
As, un sistema basado en el conocimiento es un cuerpo de programas de
ordenador que intenta imitar e incluso superar en algunas situaciones a un
experto humano en un mbito concreto de su actividad. No pretende, en
absoluto, reproducir el pensamiento humano, sino simplemente la pericia de
un profesional competente (tngase en cuenta que para construir un SBC se
suele contar con grandes expertos en la materia que incorporan su
conocimiento al sistema). Esta pretensin es ms sencilla ya que en algunos
campos reducidos los expertos trabajan siguiendo reglas, aunque,
generalmente, no sean conscientes de ello. En aquellos campos en los que
no sea necesario aplicar la intuicin ni el sentido comn, los sistemas
basados en el conocimiento han conseguido notables xitos, consiguiendo en
ocasiones ser ms regulares y rpidos que los propios expertos.
Los sistemas basados en el conocimiento desarrollados hasta hace poco
constituyen la primera generacin cuya caracterstica comn reside en la
superficialidad del conocimiento que se incluye en el mismo. Los ingenieros
de conocimiento (desarrolladores de los sistemas basados en el
conocimiento) se limitan a incorporar en los sistemas la experiencia y
criterios de los especialistas sin buscar las razones ltimas en las que se
basan.
Actualmente existen sistemas ms avanzados, Sistemas de Segunda
Generacin, en la que el conocimiento se estructura en dos niveles. El primer
nivel, de control (se suele aludir a l como Meta conocimiento y las reglas
que lo constituyen reciben el nombre de meta reglas), sirve para determinar
la forma de utilizar el segundo nivel que es el que contiene el conocimiento
de los expertos.

3. Arquitectura de los Sistemas Basados en


Conocimiento
Base de conocimiento
Conocimiento heurstico (decisiones)
Conocimiento de control
Base de hechos
Conocimiento de las estructuras de los datos y procedimientos
asociados
Conocimiento de predicados
Motor de inferencias
Encadenamiento hacia delante
Encadenamiento hacia atrs
Memoria de trabajo
Interfaz con el usuario, el ingeniero de conocimiento y el entorno
informtico
Generador de explicaciones

4. SBC vs. Sistemas tradicionales


4.1.

DEFINICIN DEL CONOCIMIENTO DE LA APLICACIN

En ambos sistemas es necesario definir el conocimiento de la aplicacin.


Mientras que en un SBC, el MI procesa el conocimiento de la aplicacin,
los sistemas tradicionales insisten en que repitamos el procesamiento
para cada aplicacin.

4.2.
MODIFICACION/MANTENIMIENTO DEL CONOCIMIENTO DE LA
APLICACIN

SBC: el usuario define el nuevo conocimiento y SBC lo integra en la


aplicacin existente
Sist. Tradicionales: el usuario define el nuevo conocimiento, y debe definir
adems cmo interacciona con el conocimiento previo y reestablecer la
secuencia de instrucciones de procesamiento.

5. Sistema experto y sistema basado en conocimiento:


Evolucin

1965-1970: Precursores
DENDRAL (Stanford) /MACSYMA (MIT)
1970-1977: Prototipos
INTERNIST (Pittsburg)
MYCIN (Stanford)
CASNET (Rutgers)
PROSPECTOR (S.R.I.)
1977-1981: Primeras herramientas
PROLOG (Marsella-Edimburgo)
OPS5 (CMU)
MYCIN -> EMYCIN
PROSPECTOR -> KAS
CASNET -> EXPERT
1981-1884: Comercializacin grandes ss.ee.
R1/XCON (DEC)
ACE (Bell)
Drilling Advisor (Teknowledge)

5.1.

Base de Conocimiento

CONTROL
o Estrategia de alto nivel de la aplicacin: fases de la aplicacin,
bases de conocimiento que se van a utilizar
o Ejemplo: Primero, pedir los datos al cliente, despus decidir si se le
concede un crdito, y, en caso afirmativo, estimar la cuanta del
crdito.

CONOCIMENTO HEURSTICO
Reglas del tipo
si <condicin> entonces <accin>
- Ejemplo: si el solicitante tiene avalista, entonces se le concede el
crdito

INTELIGENCIA ARTIFICIAL DISTRIBUIDA


1. Motivaciones
Los sistemas estudiados hasta ahora, a los que vamos a denominar
monolticos, han resuelto muchos problemas, pero adolecen de una serie de
limitaciones. Algunas de stas son:
La existencia de un nico formalismo de representacin puede no ser
suficiente para capturar todos los atributos relevantes de un dominio en el
que muy diferentes tareas confluyen.
En problemas complejos diversas tareas han de ser aprendidas, pues la
solucin satisfactoria de estos problemas requiere la concurrencia de muy
diversas habilidades. Los mtodos aplicados en unos casos pueden no ser los
apropiados en otros [Hanovar, 1994].
No es de esperar que un nico sistema sea capaz de aprender funciones
discon tinuas [Wiering, 1995; Boman & Ekenberg, 1995]. Una funcin discon
tinua puede representar diferentes comportamientos en diferentes regiones
del dominio, y el conocimiento aprendido en una regin, puede no ser
aplicable en otras.
Los sistemas monolticos estn limitados a una nica manera de interpretar
sus entradas y producir soluciones, es decir, a una nica forma de resolver
problemas. Este planteamiento puede resultar inadecuado cuando los datos
provienen de fuentes heterogneas, reflejan diferentes comportamientos y
llegan por flujos de entrada en paralelo.
Por otro lado, se pueden mencionar diversas razones que motivan el estudio
de la IAD:
La capacidad de solucionar problemas de los sistemas monolticos est
limitada por los recursos computacionales y el conocimiento disponible, y por
la perspectiva del problema que recibe del mundo exterior. Esta racionalidad
limitada [Simon, 1957] puede superarse con diversos agentes autnomos
que aporten distintas perspectivas. Una solucin distribuida hace que el
conjunto sea menos propenso al fracaso por motivo de la racionalidad
limitada.
Los problemas del mundo real involucran sistemas abiertos y distribuidos
[Hewitt, 1986], lo que sugiere emplear para su solucin sistemas igualmente
distribuidos y adaptativos. Los sistemas abiertos se caracterizan por
[Burkhard, 1994]:

La necesidad de continua disponibilidad, lo que permite la delegacin de


tareas, y posiblemente, la tolerancia al fallo de un componente, cuya carga

puede ser asumida por el resto.


La extensibilidad, los componentes de un sistema pueden abandonarlo y
nuevos componentes entrar a formar parte.
El control descentralizado, muchas veces motivado por la complejidad de la
tarea global.
El funcionamiento asncrono y la posible existencia de informacin
inconsistente. De hecho, en general no hay un medio que asegure la
consistencia global de toda la informacin distribuida, por lo que la
consistencia se reduce al mbito local.
La coexistencia de diversas visiones parciales del problema, lo que permite
simplificar ea nivel local el problema, al precio de la aparicin de
inconsistencias.
Algunos problemas de decisin en los que los datos de entrada provienen de
flujos especialmente dispersos, y en los que hay que tomar decisiones sobre
cmo actuar en localizaciones dispersas (como el control o diagnstico de
sistemas espacialmente dispersos), son especialmente complicados y
costosos de resolver mediante soluciones centralizadas [Froehlich et al.,
1997].
Finalmente, la reutilizacin de las aplicaciones informticas dentro de una
organizacin es sin duda una cuestin importante, pues permite un mayor
aprovechamiento. La utilizacin de las tcnicas de IAD puede hacer posible
el que la reutilizacin de aplica ciones antiguas y su cooperacin con otras
nuevas, transformen lo que eran antes sistemas dbilmente comunicados,
en una comunidad de aplicaciones que resuelve problemas mediante
cooperacin [Jennings et al., 1993].

2. Fundamentos de la Inteligencia Artificial Distribuida


En primer lugar, dentro de la bibliografa existente en castellano, se aconseja
completar el estudio de este apartado con la lectura de la perspectiva del
campo aporta da por [Garca & Ossowski, 1998]. Igualmente es de inters,
dentro de la bibliografa bsica propuesta en esta asignatura, la introduccin,
quiz un poco desactualizada, pero muy clarificadora, propuesta en el
captulo 16 de [Rich & Knight, 1991].
Para entender las diferentes visiones que se puedan encontrar en la
bibliografa existente, quiz convenga aclarar que en la historia de la IAD se
pueden distinguir tres etapas claramente diferenciadas [Nwana, 1996]:
IAD clsica: estudia la conducta colectiva, en oposicin a la IA, que estudia
la conducta individual.
IAD autnoma: estudia los agentes individuales situados en un mundo
social.

IAD comercial: estudia la aplicacin de 1 y 2 en el desarrollo de agentes


(denominados genricamente agentes software) que son explotados de
forma comerical.
El resto del captulo sigue un esquema desarrollo que se corresponde con
dichas etapas.
Comenzando por la propuesta de Rich y Knight (IAD clsica), en ella se
distinguen tres tipos de estudios orientados a la IAD: el modelado
psicolgico, la mejora de la eficiencia y la ayuda para la organizacin de los
sistemas de una forma modular. La primera puede estudiarse en la
perspectiva de SOAR (ver captulo 10). La segunda se refiere
fundamentalmente al uso del paralelismo (hardware o software) para
mejorar la eficiencia. La tercera se estudia en el siguiente apartado con una
visin ms actualizada.
En [Garca & Ossowski, 1998] se presenta la IAD como el rea que estudia
modelos y tcnicas para resolucin de problemas en los que la distribucin,
sea fsica o funcional, es inherente (cubre las tres etapas mencionadas).
A continuacin comentamos los aspectos bsicos que pueden ayudar al
estudio de este captulo.
En los aos 80 los sistemas eran monolticos y centralizados. Un nodo de una
red no era consciente de las respuestas de otros nodos. Un ejemplo
paradigmtico de esta poca es la arquitectura de pizarra del sistema
Hearsay [Erman et al., 1980].
En los 90 aparecen sistemas multiagente SMA con control descentralizado y
mdulos reusables [Damazeau, 1991]. Los agentes de un sistema son
independientes de un problema dado y se les dota de protocolos de
comunicacin suficientemente genricos (p.ej., ARCHON [Cockburn &
Jennings, 1995]).
En general, los sistemas de IAD se caracterizan por una arquitectura de
componentes inteligentes y modulares que interactan de forma coordinada:
Como el resto de los sistemas distribuidos en las aplicaciones de IAD se
aprovecha la distribucin natural del dominio, como pueda ser el
aprovechamiento del paralelismo inherente a su estructura.
Los sistemas de IAD generan un valor aadido que les permite ser
incorporados ms fcilmente en las organizaciones humanas (ver 11.1).
Favorecen el
coordinacin.

desarrollo

de

modelos

cognitivos

de

cooperacin

Los trabajos principales del campo se enumeran en [Garca & Ossowski,


1998]. Algunas de las revisiones de inters son: [Bond et al., 1988] y [Moulin
et al., 1996].

Anticipar que hoy en da predominan las soluciones basadas en agentes cuya


relacin con otros agentes y con el entorno est controlada por mecanismos
sofisticados que dependen de cada arquitectura propuesta.
Algunas de las cuestiones que hay que responder en el desarrollo de este
tipo de sistemas son:
Cmo formular, describir, descomponer, y asignar problemas y sintetizar los
resultados entre un grupo de agentes?
Cmo capacitar a los agentes para que se comuniquen e interacten?
(lenguajes, protocolos, etc.)
Cmo asegurar que los agentes actan coherentemente al tomar decisiones
o realizar las acciones y cmo acordar los efectos globales de decisiones
locales y prevenir interacciones no deseadas?
Cmo capacitar a los agentes para representar y razonar sobre acciones,
planes y conocimiento de otros agentes para coordinarse?
Cmo reconocer y reconciliar puntos de vista e intenciones conflictivas
entre un conjunto de agentes?
Cmo utilizar las tcnicas de ingeniera para desarrollar sistemas con IAD?
(p.ej., ampliaciones CommonKADS)
Estas preguntas sern las que se debern responder a lo largo de este tema.
Finalmente, mencionar que en lo que se refiere a la clasificacin de los
sistemas de IAD, la ms consensuada distingue tres lneas: Solucin
Distribuida de Problemas, Sistemas Multiagente y los Agentes Autnomos.
Las dos primeras se corresponden a la mencionada IAD clsica, mientras
que los agentes autnomos y la IAD comercial son el objeto de inters de
los ltimos avances del campo. Cada una de stas se estudiar en los
siguientes apartados.

3. Resolucin distribuida de problemas


En la resolucin distribuida de problemas (SDP) se pretende dividir el trabajo
necesario para la solucin de un problema entre diversos mdulos (tambin
denominados nodos). Estos mdulos suelen ser agentes inteligentes
distribuidos que en este caso buscan darle una funcionalidad global al
sistema. En este tipo de planteamientos el gran problema es establecer el
mecanismo de control adecuado para que, aunque haya descentralizacin en
la toma de decisiones, se produzca el resultado global buscado.

4. Caracterizacin
En la SDP los agentes cumplen unas caractersticas mnimas [Durfee &
Rosenschein, 1994]: benevolencia (intencin positiva de cooperar), objetivos
compartidos, diseo central (se integran en un sistema capaz de resolver un
problema). Los agentes comparten un lenguaje y desempean funciones

complementarias para alcanzar un objetivo global.


El proceso de un SDP se divide en cuatro etapas [Yang & Zhang, 1996]:
descomposicin de tareas, asignacin de tareas y recursos entre agentes,
solucin de subproblemas e integracin de soluciones, para componer y
conseguir una solucin a la tarea inicial.
Podemos destacar la descomposicin de tareas que se puede realizar
siguiendo alguna de las siguientes tcnicas:
Tareas inherentemente descomponibles: la propia descripcin de la tarea
incluye su descomposicin.

Descomposicin realizada por el programador.


Planificacin jerrquica: es uno de los sistemas ms empleados para
descomponer de forma automtica. Las tareas se definen en forma de
planes que satisfacen unos objetivos y dan lugar a rboles Y-O (tema 2).
Un plan contiene subplanes.
Agregacin de subtareas: enfoque ascendente en lugar de descendente
en la descomposicin.

Metodologas orientadas a agentes


Sistemas multiagente
En el rea de los sistemas multiagente los agentes son heterogneos y
forman un entorno o sociedad en la que actan sin presuponer las
propiedades de benevolencia o comparticin de objetivos. En este marco
las piezas claves son la autonoma y la comunicacin entre agentes.

Fundamentos
Los sistemas de este tipo se caracterizan por [Dufee & Rosenschein,
1994]:
heterogeneidad
de
agentes
(diferentes
arquitecturas,
representaciones, lenguajes, etc.) y homogeneidad de intereses.
En esta rea se estudia cmo se coopera, se forman coaliciones, se
compite, etc. [Sand holm, 1999]. Para ello se definen diferentes tcnicas
de negociacin [Muller, 1996]: negociacin de contratos [Smith, 1980],
negociacin para asignacin de recursos [Conry et al., 1988], negociacin
para resolucin de conlictos [Cammarata et al.], modelado cognitivo de la
negociacin [Sycara, 1989], planificacin multiagente [Durfee, 1996], etc.
Por otro lado, tambin se distinguen diferentes tcnicas de resolucin de
discrepancias entre agentes. En este marco los agentes comparten una
ontologa (conocimiento comn) y en el transcurso de las interacciones se
producen las distintas discre pancias que se reconocen mediante las
creencias de los distintos agentes (las propias y las de los dems
agentes) [Gasser & Briot, 1992].

Otra cuestin significativa es que, dada la posible heterogeneidad de los


conocimientos de los agentes, se trabaja con lenguajes intermedios (p.ej.,
KIF, Knowledge Interchange Format [Genesereth & Fikes, 1992]). Adems
de especificar una representacin comn hay que especificar un lenguaje
de comunicacin de agentes. Una propuesta es KQML, que junto con KIF
son resultados de grupos de estandariza cin de ARPA [Finning et al.,
1993]. En definitiva, KQML y KIF reflejan dos niveles del lenguaje en el
proceso de comunicacin. En la comunicacin se distingue un emisor, un
receptor y un sincronismo. En KQML se especifican los diferentes actos de
la comunicacin (pedir, responder, etc.) y las ontologas (aquello de lo
que se est hablando) y KIF es el lenguaje de representacin del
contenido del mensaje. Comentar igualmente que otra propuesta con
especial nfasis en la coordinacin es Cool [Barbuceanu & Fox, 1996].
Finalmente, se distinguen dos asuntos ms relacionados con los sistemas
multiagente que se comentan en los siguientes apartados: los modelos de
coordinacin y el desarrollo de sistemas multiagente basados en el
conocimiento.

Modelos de coordinacin
Es importante resaltar que, desde el punto de vista de la ingeniera, las
caractersticas de cada dominio influyen en la construccin del modelo de
coordinacin. Por ejemplo, el tipo de interaccin de agentes que
necesitan cooperar es mucho ms complejo que la coordinacin de
agentes que sean autosuficientes. Tambin influye notablemente las
caractersticas de los propios agentes. As por ejemplo, en un sistema de
resolucin de problemas los agente pueden disearse especialmente para
desempear cierto papel dentro del sistema multiagente, con el fin de
que surja la funcionalidad deseada.
Se distinguen tres grandes opciones para modelar la coordinacin en
sociedades de agentes autnomos:
Enfoque pragmtico: tiene su origen en la visin tradicional de la infor
m tica de la resolucin distribuida de problemas. En este caso hay uno o
ms agentes coordinadores que se encargan de armonizar las
actividades de un grupo de agentes. En estos casos hay que considerar:

Gestin de dependencias entre actividades.


Coordinacin de planes locales.
Enfoque econmico: se basa en modelos matemticos de fenmenos
econmicos. Es un modelo ms evolucionado en el que la adaptacin
mutua de los comportamientos de los agentes surge de las interacciones
entre ellos. En concreto, un agente estima la utilidad de una accin que
se le plantea buscando incrementar su beneficio, para ello establece una
medida cuantitativa de utilidad. La cuestin estriba en coordinar la
utilidad de forma que se satisfaga el mximo de los intereses de todos los

individuos. Este enfoque utiliza los modelos matemticos de la slida


teora de juegos (tema 3).
Enfoque sociolgico: se basa en el intercambio social como medida
cualitativa del beneficio y no cuantitativa como el caso anterior. Se trata
de intercambiar favores. El agente establece creencias con respecto a
las posibles dependencias entre sus objetivos y los elementos del dominio
que pueden aportar el resto de los agentes. Este modelo est menos
consolidado que los anteriores en situaciones reales.

Concluir sealando que existen varias aplicaciones multiagente en el


mundo real [Chaib-Draa, 1995] y que muchos agentes basados en
sistemas autnomos se quedan en el estado experimental [Jennings &
Wooldridge, 1998].

Agentes autnomos
La parte de la IAD que estudia los agentes autnomos se centra en los
micro-aspectos, es decir, en los agentes inteligentes, ms que en los
macro-aspectos tratados en la IAD clsica (apartado comprueba 11.2).
El estudio de estos temas se divide en tres reas:
Teora de agentes:
trata de responder a la pregunta de qu es un agente y de la utilizacin
de formalismos matemticos para representar y razonar sobre las
propiedades de agentes.
Arquitecturas de agentes:
trata de las arquitecturas software/hardware que permiten reflejar las
propiedad enunciadas por los tericos.
Lenguajes de agentes:
Son los sistemas software para programar y experimentar con agentes.
Centrndonos en las propiedades que caracterizan a un agente software,
se distinguen los siguientes aspectos esenciales [Wooldridge & Jennings,
1995]:
Capacidad para resolver problemas no triviales: debe poder razonar sobre
el entorno para realizar un conjunto de tareas.
Racionalidad (limitada): poseen objetivos y emprenden acciones para
realizarlos. Eligen sus acciones segn el principio de racionalidad(sec.
10.1COMPRUEBA LINKS).

Auotonoma (limitada): tienen sus propias motivaciones a partir de las


que generan sus propios objetivos.
Reactividad y Pro-actividad: perciben el entorno y responden a los
cambios que se producen en l. Debido a que tienen sus propias metas y
son capaces de tomar la iniciativa.
Sociabilidad: tienen en cuenta la existencia de otros agentes con los que
interacta siguiendo algn tipo de comunicacin y un conjunto de
convenios.
Para distinguir la IAD del resto de las aplica ciones, conviene precisar que
sta estudia los casos en los que se produce una interaccin dinmica
entre componentes (frente a la estructura jerrquica de software
habitual).
La esencia de la IAD est en el estudio de las relaciones que surgen entre
el entorno, el sistema inteligente, y sus componentes, los agentes [Garca
& Ossowski, 1998].

Aplicaciones: Agentes en Internet


Los trabajos en este campo han tenido un gran auge en las aplicaciones
en Internet. Hoy en da se utilizan agentes software para tareas como el
filtrado de los mensajes de correo electrnico, ayuda en la planificacin
de reuniones, bsqueda de referencias de artculos, recopilacin de
informacin temtica, lectura selectiva de grupos de noticias, correo
masivo inteligente, subastas, compras y otros muchos asuntos
relacionados con el comercio electrnico, etc.
Existe abundante documentacin en los que se habla de numerosas
aplicaciones. Muchos de los artculos mencionados a lo largo del presente
tema describen distintas aplicaciones. De entre estos, podemos resaltar
[Nwana, 1996], en el que se propone una tipologa de clasificacin de
agentes en funcin de sus aplicaciones.
Adems de los artculos, tambin se ha dedicado libros a este asunto.
Existe un libro bastante completo en el que se distinguen mltiples
campos de aplicacin de agentes software en Internet [Cheong, 1996]. En
este se mencionan, entre otros, los siguientes campos: asistentes
personales (recordemos el apartado 10.6), agentes de coordinacin de
conferencias, agentes de enseanza y aprendizaje, agentes de gestin de
comunicaciones, agentes de oficina, agentes de planificacin de viajes,
agentes de filtrado de noticias, agentes de gestin de sitios web, agentes
de subastas, agentes de compra y un extenso etctera.
Estas aplicaciones consideran que el agente acta de forma autnoma
pero siguiendo las indicaciones del usuario (o agente) que los ha
activado. Se les denomina sofbots (software robots) [Etzioni & Weld,
1994] precisamente porque se les atribuye la misma autonoma y

propiedades que a los robots, pero en este caso el problema se


circunscribe a la lgica de la delegacin. Se trata de satisfacer unos
objetivos previamente fijados en una gran nube de fuentes de
informacin, recursos y servicios. Este campo tiene grandes posibilidades
para las aplicaciones de IA que se dedican al filtrado y extraccin de
informacin (tema 10), realizan PLN (tema 9), organizan planes (tema 4)
o realizan bsquedas (tema 2) bajo demanda, las que gestionan grandes
cantidades de conocimiento (temas 6, 7 y 8), etc.
Como se comentar enseguida en el apartado de evaluacin, para tener
una visin actual de este tema se van a hacer prcticas que consistan
tanto en utilizar algunos de estos agentes de software existentes en la
red como en analizar y manipular la arquitectura de alguna aplicacin de
IAD basada en agentes.

LGICA DIFUSA
Introduccin
La lgica borrosa es una rama de la inteligencia artificial que se funda en el
concepto "Todo es cuestin de grado, lo cual permite manejar informacin vaga
o de difcil especificacin si quisiramos hacer cambiar con esta informacin el
funcionamiento o el estado de un sistema especfico. Es entonces posible con la
lgica borrosa gobernar un sistema por medio de reglas de 'sentido comn' las
cuales se refieren a cantidades indefinidas.
Las reglas involucradas en un sistema borroso, pueden ser aprendidas con
sistemas adaptativos que aprenden al ' observar ' como operan las personas los
dispositivos reales, o estas reglas pueden tambin ser formuladas por un
experto humano. En general la lgica borrosa se aplica tanto a sistemas de
control como para modelar cualquier sistema continuo de ingeniera, fsica,
biologa o economa.
La lgica borrosa es entonces definida como un sistema matemtico que
modela funciones no lineales, que convierte unas entradas en salidas acordes
con los planteamientos lgicos que usan el razonamiento aproximado.
Se fundamenta en los denominados conjuntos borrosos y un sistema de
inferencia borroso basado en reglas de la forma " SI....... ENTONCES...... ", donde
los valores lingsticos de la premisa y el consecuente estn definidos por
conjuntos borrosos, es as como las reglas siempre convierten un conjunto
borroso en otro.

1. Teora de conjuntos difusos


La lgica de difusa permite tratar con informacin que no es exacta o con un
alto grado de impresin a diferencia de la lgica convencional la cual trabaja
con informacin precisa. El problema principal surge De la poca capacidad de
expresin de la lgica clsica.
Conjuntos Difusos
Los conjuntos clsicos, tienen limitaciones, se define un universo de discurso
que contiene a conjuntos cuyos bordes estn bien definidos, un elemento
puede o no pertenecer a cierto conjunto, algo es verdadero o falso, no se
definen situaciones intermedias. Los conjuntos borrosos son una extensin
de los clsicos, donde se aade una funcin de pertenencia, definida esta
como un nmero real entre 0 y 1. As se introduce el concepto de conjunto o
subconjunto borroso y se lo asocia a un determinado valor lingstico,
definido por una palabra o etiqueta lingstica, donde esta es el nombre del
conjunto o subconjunto. Por cada conjunto se define una funcin de
pertenencia o membresa denominada A(x), indica el grado en que la
variable x est incluida en el concepto representado por la etiqueta A
(0A(x)1), si esta funcin toma el valor 0 significa que tal valor de x no
est incluido en A y si toma el valor 1 el correspondiente valor de x est

absolutamente incluido en A. En la Figura I-1 se puede apreciar un ejemplo


donde el conjunto velocidad (con variable x) est subdividido en 3
subconjuntos {Baja, Meda, Alta}, con sus respectivas funciones de
membresa {Baja(x) Media(x) Alta(x)}

Definicin. Sea X una coleccin de objetos, expresados en forma genrica


por x. Entonces,
un conjunto difuso A en X, se define como un conjunto de pares
ordenados
A = {(x, A(x))/xX}
Donde A(x) es una funcin de pertenencia cuya etiqueta es A y su
dominio es x.
Funciones de Pertenencia
Aun cuando cualquier funcin puede ser vlida para definir un conjunto
difuso, existen ciertas funciones que son ms comnmente utilizadas por
su simplicidad matemtica, entre stas se encuentran las funciones de tipo
triangular, mostrado en la figura 3.2, trapezoidal mostrado en la figura 3.3,
gaussiana,
etc.

2. El Controlador Difuso
La lgica difusa se aplica principalmente en sistemas de control difuso que
utilizan expresiones ambiguas para formular reglas que controlen el sistema.
Un sistema de control difuso trabaja de manera muy diferente a los
sistemas de control convencionales. Estos usan el conocimiento experto
para generar una base de conocimientos que dar al sistema la capacidad
de tomar decisiones sobre ciertas acciones que se presentan en su
funcionamiento [7]. Los sistemas de control difuso permiten describir un
conjunto de reglas que utilizara una persona para controlar un proceso
y a partir de estas reglas generar acciones de control. El control difuso
puede aplicarse tanto en sistemas muy sencillos como en sistemas cuyos
modelos matemticos sean muy complejos. La estructura de un
controlador difuso se muestra en la figura 3.4.

3. Fusificacin
La fusificacin tiene como objetivo convertir valores crisp o valores
reales en valores difusos. En la fusificacin se asignan grados de
pertenencia a cada una de las variables de entrada con relacin a los

conjuntos difusos previamente definidos utilizando


pertenencia asociadas a los conjuntos difusos.

las

funciones

de

Donde las funciones de pertenencia definidas en las variables de entrada se


aplican a sus valores reales, para determinar el grado de verdad para cada
premisa. El grado de verdad de la premisa de una regla se refiere a veces
como su alfa.

4. Base de Conocimiento
La base de conocimiento contiene el conocimiento asociado con el
dominio de la aplicacin y los objetivos del control. En esta etapa se deben
definir las reglas lingsticas de control que realizarn la toma de decisiones
que decidirn la forma en la que debe actuar el sistema.

5. Inferencia
Se llama reglas difusas al conjunto de proposiciones IF-THEN que modelan el
problema que se quiere resolver. Una regla difusa simple tiene la forma: si u
es A entonces v es B dnde A y B son conjuntos difusos definidos en los
rangos de u y v respectivamente. Una regla expresa un tipo de relacin
entre los conjuntos A y B cuya funcin caracterstica sera ) , ( y xB A y
representa lo que conocemos como implicacin lgica. La eleccin apropiada
de esta funcin caracterstica est sujeta a las reglas de la lgica
proposicional. Como es bien sabido se puede establecer un isomorfismo
entre la teora de conjuntos, la lgica proposicional y el lgebra booleana que
garantiza que cada teorema enunciado en una de ellas tiene un homlogo en
las otras dos. La existencia de estos isomorfismos nos permitir traducir las
reglas difusas a relaciones entre conjuntos difusos y stas a trminos de
operadores algebraicos con los que podremos trabajar.
La inferencia relaciona los conjuntos difusos de entrada y salida para
representar las reglas que definirn el sistema. En la inferencia se
utiliza la informacin de la base de conocimiento para generar reglas
mediante el uso de condiciones, por ejemplo: si caso1 y caso2, entonces
accin1.

6. Defusificacin
La defusificacin realiza el proceso de adecuar los valores difusos
generados en la inferencia en valores crisp, que posteriormente se utilizarn
en el proceso de control. En la defusificacin se utilizan mtodos
matemticos simples como el mtodo del Centroide, Mtodo del Promedio
Ponderado y Mtodo de Membresa del Medio del Mximo.

REDES NEURONALES ARTIFICIALES


Las Redes Neuronales son un campo muy importante dentro de la
Inteligencia Artificial. Inspirndose en el comportamiento conocido del
cerebro humano (principalmente el referido a las neuronas y sus
conexiones), trata de crear modelos artificiales que solucionen problemas
difciles de resolver mediante tcnicas algortmicas convencionales.
En esta pgina web trataremos de acercar al visitante a este tema,
mostrando las bases neurolgicas y matemticas, los principales modelos
vigentes y ejemplos interactivos que solucionan algunos problemas de forma
eficaz.
Desde la dcada de los 40, en la que naci y comenz a desarrollarse la
informtica, el modelo neuronal la ha acompaado. De hecho, la aparicin de
los computadores digitales y el desarrollo de las teoras modernas acerca del
aprendizaje y del procesamiento neuronal se produjeron aproximadamente al
mismo tiempo, a finales de los aos cuarenta.
Desde entonces hasta nuestros das, la investigacin neurofisiolgica y el
estudio de sistemas neuronales artificiales (ANS, Artificial Neural Systems)
han ido de la mano. Sin embargo, los modelos de ANS no se centran en la
investigacin neurolgica, si no que toma conceptos e ideas del campo de
las ciencias naturales para aplicarlos a la resolucin de problemas
pertenecientes a otras ramas de las ciencias y la ingeniera.
Podemos decir que la tecnologa ANS incluye modelos inspirados por nuestra
comprensin del cerebro, pero que no tienen por qu ajustarse exactamente
a los modelos derivados de dicho entendimiento.
Los primeros ejemplos de estos sistemas aparecen al final de la dcada de
los cincuenta. La referencia histrica ms corriente es la que alude al trabajo
realizado por Frank Rosenblatt en un dispositivo denominado perceptrn. Hay
otros ejemplos, tales como el desarrollo del Adaline por el profesor Bernard
Widrow.
Durante todos estos aos, la tecnologa ANS no siempre ha tenido la misma
consideracin en las ramas de la ingeniera y las ciencias de la computacin,
ms ansiosas de resultados que las ciencias neuronales. A partir de 1969, el
pesimismo debido a las limitadas capacidades del perceptrn hizo
languidecer este tipo de investigacin.

1. Definicin y caractersticas
Una RNA puede definirse como un sistema de procesamiento de informacin
compuesto por un gran nmero de elementos de procesamiento (neuronas),
profusamente
conectados
entre
s
a
travs
de
canales
de
comunicacin(Reguero, 1995). Estas conexiones establecen una estructura
jerrquica y permiten la interaccin con los objetos del mundo real tratando
de emular al sistema nervioso biolgico. A diferencia de la computacin
tradicional, basada en algoritmos predecibles, la computacin neuronal
permite desarrollar sistemas que resuelvan problemas complejos cuya
formalizacin matemtica es sumamente difcil. Esto se logra gracias a los

principios de funcionamiento de las RNA, de los cuales citamos a


continuacin los cinco ms importantes(Hilera, 1995):

Aprendizaje adaptativo: esta es quizs la caracterstica ms


importante de las RNA, ya que pueden comportarse en funcin de un
entrenamiento con una serie de ejemplos ilustrativos. De esta forma, no
es necesario elaborar un modelo a priori, ni establecer funciones
probabilsticas. Una RNA es adaptativa porque puede modificarse
constantemente con el fin de adaptarse a nuevas condiciones de trabajo.
Autoorganizacin: mientras que el aprendizaje es un proceso donde se
modifica la informacin interna de la RNA, la autoorganizacin consiste en
la modificacin de toda la red completa con el fin de llevar a cabo un
objetivo especfico. Autoorganziacin significa generalizacin, de esta
forma una red puede responder a datos o situaciones que no ha
experimentado antes, pero que puede inferir en base a su entrenamiento.
Esta caracterstica es muy til sobre todo cuando la informacin de
entrada es poco clara o se encuentra incompleta.
Tolerancia a fallos: en la computacin tradicional la perdida de un
fragmento pequeo de informacin puede acarrear comnmente la
inutilizacin del sistema. Las RNA poseen una alta capacidad de
tolerancia a fallos. La tolerancia a fallos se entiende aqu en dos sentidos:
primero, las redes pueden reconocer patrones de informacin con ruido,
distorsin o incompletos (tolerancia de fallos respecto de los datos); y
segundo, pueden seguir trabajando (con cierta degradacin) aunque se
destruya parte de la red (tolerancia a fallos respecto de la estructura). La
explicacin de este fenmeno se encuentra en que, mientras la
computacin tradicional almacena la informacin en espacios nicos,
localizados y direccionables, las redes neuronales lo hacen de forma
distribuida y con un alto grado de redundancia.
Operacin en tiempo real: de todos los mtodos existentes, la RNA son
las ms indicadas para el reconocimeinto de patrones en tiempo real,
debido a que trabajan en paralelo actualizando todas sus instancias
simultneamente. Es importante destacar que esta caracterstica solo se
aprecia cuando se implementan redes con hardware especialmente
diseado para el procesamiento en paralelo.
Fcil insercin en la tecnologa existente: es relativamente sencillo
obtener chips especializados para redes neuronales que mejoran su
capacidad en ciertas tareas. Ello facilita la integracin modular en los
sistemas existentes.

2. Arquitectura de las RNA


La arquitectura de una RNA es la estructura o patrn de conexiones de la
red. Es conveniente recordar que las conexiones sinpticas son direccionales,
es decir, la informacin slo se transmite en un sentido.
En general, las neuronas suelen agruparse en unidades estructurales
llamadas capas. Dentro de una capa, las neuronas suelen ser del mismo tipo.
Se pueden distinguir tres tipos de capas:
De entrada: reciben datos o seales procedentes del entorno.
De salida: proporcionan la respuesta de la red a los estmulos de la
entrada.
Ocultas: no reciben ni suministran informacin al entorno (procesamiento
interno de la red).
Generalmente las conexiones se realizan entre neuronas de distintas capas,
pero puede haber conexiones intracapa o laterales y conexiones de
realimentacin que siguen un sentido contrario al de entrada-salida

3. Aprendizaje de las RNA


Es el proceso por el que una RNA actualiza los pesos (y, en algunos casos, la
arquitectura) con el propsito de que la red pueda llevar a cabo de forma
efectiva una tarea determinada.
Hay tres conceptos fundamentales en el aprendizaje:
Paradigma de aprendizaje: informacin de la que dispone la red.
Regla de aprendizaje: principios que gobiernan el aprendizaje.
Algoritmo de aprendizaje: procedimiento numrico de ajuste de los pesos.
Existen dos paradigmas fundamentales de aprendizaje:

4. Aprendizaje supervisado
El aprendizaje supervisado se caracteriza porque el proceso de aprendizaje
se realiza mediante un entrenamiento controlado por un agente externo
(supervisor, maestro) que determina la respuesta que debera generar la red
a partir de una entrada determinada. El supervisor controla la salida de la
red y en caso de que sta no coincida con la deseada, se proceder a
modificar los pesos de las conexiones, con el fin de conseguir que la salida
obtenida se aproxime a la deseada. Donde la red trata de minimizar un error
entre la salida que calcula y la salida deseada (conocida), de modo que la
salida calculada termine siendo la deseada.
En este tipo de aprendizaje se suelen considerar, a su vez, tres formas de
llevarlo a cabo, que dan lugar a los siguientes aprendizajes supervisados:
1) Aprendizaje por correccin de error.
2) Aprendizaje por refuerzo.
3) Aprendizaje estocstico.

5. Aprendizaje por correccin de error.


Consiste en ajustar los pesos de las conexiones de la red en funcin de la
diferencia entre los valores deseados y los obtenidos a la salida de la red, es
decir, en funcin del error cometido en la salida.

6. Aprendizaje por refuerzo


Se trata de un aprendizaje supervisado, ms lento que el anterior, que se
basa en la idea de no disponer de un ejemplo completo del comportamiento
deseado, es decir, de no indicar durante el entrenamiento exactamente la
salida que se desea que proporcione la red ante una determinada entrada.
En el aprendizaje por refuerzo la funcin del supervisor se reduce a indicar
mediante una seal de refuerzo si la salida obtenida en la red se ajusta a la
deseada (xito = +1 o fracaso = -1), y en funcin de ello se ajustan los
pesos basndose en un mecanismo de probabilidades. Se podra decir que
en este tipo de aprendizaje la funcin del supervisor se asemeja ms a la de
un crtico (que opina sobre la respuesta de la red) que a la de un maestro
(que indica a la red la respuesta concreta que debe generar), como ocurra
en el caso de supervisin por correccin del error.

7. Aprendizaje estocstico
Consiste bsicamente en realizar cambios aleatorios en los valores de los
pesos de las conexiones de la red y evaluar su efecto a partir del objetivo
deseado y de distribuciones de probabilidad.
En el aprendizaje estocstico se suele hacer una analoga en trminos
termodinmicos, asociando a la red neuronal con un slido fsico que tiene
cierto estado energtico. En el caso de la red, la energa de la misma
representara el grado de estabilidad de la red, de tal forma que el estado de
mnima energa correspondera a una situacin en la que los pesos de las
conexiones consiguen que su funcionamiento sea el que ms se ajusta al
objetivo deseado.

Segn lo anterior, el aprendizaje consistira en realizar un cambio aleatorio


de los valores de los pesos y determinar la energa de la red (habitualmente
la funcin energa es una funcin de Liapunov). Si la energa es menor
despus del cambio, es decir, si el comportamiento de la red se acerca al
deseado, se acepta el cambio; si, por el contrario, la energa no es menor, se
aceptara el cambio en funcin de una determinada y preestablecida
distribucin de probabilidades.

8. No supervisado o auto organizado


Las redes con aprendizaje no supervisado (tambin conocido como
autosupervisado) no requieren influencia externa para ajustar los pesos de
las conexiones entre sus neuronas. La red no recibe ninguna informacin por
parte del entorno que le indique si la salida generada en respuesta a una
determinada entrada es o no correcta.
Estas redes deben encontrar las caractersticas, regularidades, correlaciones
o categoras que se puedan establecer entre los datos que se presenten en
su entrada.
Existen varias posibilidades en cuanto a la interpretacin de la salida de
estas redes, que dependen de su estructura y del algoritmo de aprendizaje
empleado.
Donde la red conoce un conjunto de patrones sin conocer la respuesta
deseada. Debe extraer rasgos o agrupar patrones similares.
En algunos casos, la salida representa el grado de familiaridad o similitud
entre la informacin que se le est presentando en la entrada y las
informaciones que se le han mostrado hasta entonces (en el pasado). En otro
caso, podra realizar una clusterizacin (clustering) o establecimiento de
categoras, indicando la red a la salida a qu categora pertenece la
informacin presentada a la entrada, siendo la propia red quien debe
encontrar las categoras apropiadas a partir de las correlaciones entre las
informaciones presentadas.
En cuanto a los algoritmos de aprendizaje no supervisado, en general se
suelen considerar dos tipos, que dan lugar a los siguientes aprendizajes:
1) Aprendizaje hebbiano.
2) Aprendizaje competitivo y comparativo.

9. Aprendizaje hebbiano
Esta regla de aprendizaje es la base de muchas otras, la cual pretende medir
la familiaridad o extraer caractersticas de los datos de entrada. El
fundamento es una suposicin bastante simple: si dos neuronas Ni y Nj
toman el mismo estado simultneamente (ambas activas o ambas inactivas),
el peso de la conexin entre ambas se incrementa.
Las entradas y salidas permitidas a la neurona son: {-1, 1} o {0, 1}
(neuronas binarias). Esto puede explicarse porque la regla de aprendizaje de
Hebb se origin a partir de la neurona biolgica clsica, que solamente
puede tener dos estados: activa o inactiva.

10.Aprendizaje competitivo y comparativo


Se orienta a la clusterizacin o clasificacin de los datos de entrada. Como
caracterstica principal del aprendizaje competitivo se puede decir que, si un
patrn nuevo se determina que pertenece a una clase reconocida
previamente, entonces la inclusin de este nuevo patrn a esta clase
matizar la representacin de la misma. Si el patrn de entrada se determin
que no pertenece a ninguna de las clases reconocidas anteriormente,
entonces la estructura y los pesos de la red neuronal sern ajustados para
reconocer la nueva clase.
En cuanto a los algoritmos de aprendizaje, tenemos cuatro tipos:

Minimizacin del error: reduccin del gradiente, retro propagacin, etc. La


modificacin de pesos est orientada a que el error cometido sea mnimo.
Boltzmann: para redes estocsticas, donde se contemplan parmetros
aleatorios.
Hebb: cuando el disparo de una clula activa otra, el peso de la conexin
entre ambas tiende a reforzarse (Ley de Hebb).
Competitivo: slo aprenden las neuronas que se acercan ms a la salida
deseada.

COMPUTACIN EVOLUTIVA
1. Breve historia:
Durante los aos 50 se comenz a aplicar los principios de Charles Darwin en
la resolucin de problemas. Durante los aos 60 y 70, varias corrientes de
investigacin independientes comenzaron a formar lo que ahora se conoce
como computacin evolutiva:

Programacin evolutiva

Estrategias Evolutivas

Algoritmos genticos

La programacin evolutiva naci en la dcada de 1960 y su creador


fue Lawrence

J.

Fogel.

Este

desarrollo

comenz

como

un

esfuerzo

encaminado a crear inteligencia artificial basado en la evolucin de mquinas


de estado finitas.
Las estrategias evolutivas fueron propuestas por Ingo Rechenberg y HansPaul Schwefel en la dcada de 1970. Su principal objetivo era el de optimizar
de parmetros.
Los algoritmos genticos fueron propuestos por John H. Holland en 1975 y su
motivacin inicial fue la de proponer un modelo general de proceso
adaptable.

2. Definicin:
La computacin evolutiva es una rama de la computacin y la inteligencia
artificial que comprende mtodos de bsqueda y aprendizaje automatizado
inspirados en los mecanismos de la evolucin natural. Diversos enfoques a
la computacin evolutiva han sido propuestos: las estrategias evolutivas,
los algoritmos genticos, la programacin gentica y los clasificadores
genticos entre otros. A estos mtodos se les denomina de manera
colectiva como algoritmos evolutivos, entre los cuales los ms conocidos
son probablemente los algoritmos genticos. Estos algoritmos han sido
aplicados exitosamente en la resolucin de problemas en distintas ramas de
la ingeniera, el diseo, la industria, la economa y las ciencias naturales.
La computacin evolutiva emula a la evolucin natural en el diseo e
implementacin de herramientas computacionales para la resolucin de
problemas. A partir de 1960, varios modelos de computacin evolutiva han
sido propuestos y estudiados, a los cuales se les denomina colectivamente
como algoritmos evolutivos (Eiben y Smith, 2003). Estos algoritmos han sido
aplicados a una amplia variedad de problemas encontrados tanto en la
industria y el comercio, como en la investigacin cientfica de punta. Dado

que otros captulos en este volumen describen los principios de la evolucin


natural, estos no son mencionados aqu. Es suficiente decir que los
algoritmos evolutivos emulan a la evolucin natural y comprenden:

Una representacin o codificacin de las soluciones potenciales al


problema bajo estudio.
Una poblacin (conjunto de individuos) de estas soluciones
potenciales.
Mecanismos para generar nuevos individuos o soluciones potenciales
al problema estudiado, a partir de los miembros de la poblacin actual
(los denominados operadores de mutacin y recombinacin).
Una funcin de desempeo o evaluacin (del ingls fitness function)
que determina la calidad de los individuos en la poblacin en su
capacidad de resolver el problema bajo estudio.
Un mtodo de seleccin que otorgue mayores chances de sobrevivir a
las buenas soluciones.

Naturaleza
Individuo
Poblacin
Adecuacin (fitness)

Algoritmos Evolutivos
Solucin al problema
Conjunto de soluciones
Calidad de la solucin
Representacin o codificacin de una
solucin
Parte
o
componente
de
la
representacin de
una solucin

Cromosoma
Gen
Mutacin
recombinacin

Operadores de bsqueda
Preservacin o re-utilizacin de
Seleccin natural
buenas
soluciones (o sus componentes)
Tabla1: Analogas entre aspectos de la evolucin natural y los algoritmos
evolutivos

La Tabla 1 muestra las analogas entre la evolucin natural y los algoritmos


evolutivos, mientras que a Figura 1 ilustra el esquema general de un algoritmo
evolutivo. Una poblacin de M individuos es inicializada y sujeta a evolucin
simulada de una generacin a la siguiente a travs de la aplicacin sucesiva de
los operadores de seleccin de progenitores, recombinacin, mutacin,
evaluacin de la funcin de desempeo y seleccin de sobrevivientes. Este ciclo
es interrumpido luego de un nmero fijo de iteraciones (generaciones), o
cuando la solucin encontrada es de calidad aceptable para el problema bajo
estudio.

Figura 1: Esquema general de un algoritmo evolutivo


Histricamente, existen tres enfoques bien definidos, con origen
independiente, a la computacin evolutiva: la programacin evolutiva
(Fogel, Owens, y Walsh, 1966), las estrategias evolutivas (Rechenberg,
1973) y los algoritmos genticos (Holland, 1975). Aunque similares a nivel
conceptual, estos enfoques difieren en la manera de implementar el
algoritmo evolutivo. Estas diferencias tocan distintos aspectos del
algoritmo incluyendo la manera de representar los individuos, los
mecanismos de seleccin, y el nfasis y tipo de operadores de variacin
gentica utilizados. Aunque no es posible hacer en este captulo una
revisin rigurosa de todos los enfoques recientes a la computacin
evolutiva, cabe mencionar los algoritmos genticos con representacin
ordinal (Goldberg, 1989), los clasificadores genticos (Holland, 1986) y la
programacin gentica (Koza, 1992), como ramificaciones de los
algoritmos genticos que se han desarrollado y aplicado ampliamente.
Los algoritmos genticos con representacin ordinal se utilizan en la
resolucin de problemas de optimizacin combinatoria, donde el espacio
de bsqueda se compone de permutaciones (ordenamientos de los
nmeros enteros), como por ejemplo el famoso problema del agente
viajero (que debe recorrer una ruta de varias ciudades, volviendo a la
ciudad de origen, mientras minimiza la distancia o el costo de la ruta). En
este caso los individuos se codifican como permutaciones de los nmeros
enteros y los operadores genticos (Ej. Inversin y reordenamiento)
deben disearse de manera de producir permutaciones. Los sistemas
clasificadores genticos utilizan un algoritmo evolutivo para explorar el
espacio de reglas de produccin de un sistema de aprendizaje capaz de
inducir nuevo conocimiento y generalizar. Finalmente, la programacin
gentica aplica bsqueda evolutiva en el espacio compuesto por
programas de computadora en un lenguaje de programacin que puede
modificarse utilizando operadores de mutacin y recombinacin. Cabe
mencionar que en la actualidad hay gran interaccin y comunicacin

entre los investigadores de los distintos enfoques a la computacin


evolutiva; las fronteras entre estos mtodos han desaparecido hasta
cierto punto.
A continuacin se presenta una descripcin ms detallada de los
algoritmos
evolutivos
ms
comnmente
utilizados,
los
denominados algoritmos genticos:

3. Representacin gentica o codificacin


Para poder aplicar algoritmos genticos a un problema dado, es necesario
poder representar a las soluciones potenciales al mismo como un conjunto
de parmetros o componentes (llamados genes). Estos parmetros o
componentes se juntan para formar una secuencia o cadena que representa
una solucin o individuo; a la que se denomina tambin cromosoma o
genotipo. Ntese que la terminologa de las ciencias biolgicas es utilizada
para denominar los componentes anlogos (ampliamente simplificados) en
los algoritmos genticos. Tradicionalmente, la representacin en los
algoritmos genticos consiste en cadenas de caracteres binarios. Esta
cadena de dgitos binarios o bita es posteriormente decodificada pare
constituir los parmetros o componentes del problema en cuestin (Figura
2). Sin embargo, muchas otras representaciones, como las mencionadas
permutaciones, conjunto de reglas, estructuras ramificadas, vectores de
nmeros reales, programas por computadora, etc. han sido utilizadas
exitosamente.

Figura 2: La representacin gentica puede basarse en valores discretos;


binarios, enteros u otro sistema o alfabeto con un conjunto discreto de
valores. El cromosoma o genotipo es posteriormente decodificado en los
parmetros o componentes asociados al problema bajo estudio (fenotipo).

4. Funcin de evaluacin o desempeo


Una funcin de desempeo (tambin llamada funcin de evaluacin, funcin
objetivo o funcin de fitness) debe disearse para cada problema a ser
resuelto. El propsito de esta funcin es el de medir la calidad de los
cromosomas en su capacidad de resolver el problema bajo estudio. Para
algunos problemas (Ej. La optimizacin de funciones reales o la optimizacin
combinatoria) la definicin de la funcin objetivo resulta evidente y sencilla,
pero esto no es as en aplicaciones del mundo real, donde la definicin de la
funcin de desempeo puede requerir la implementacin de un complejo
modelo de simulacin.

5. Operadores genticos
Los operadores genticos introducen diversidad gentica en la poblacin; su
propsito es generar nuevos individuos a partir de los individuos existentes
en la poblacin actual. Los algoritmos genticos contienen dos tipos
principales de operadores: la recombinacin y la mutacin los cuales estn
inspirados en los mecanismos anlogos de la reproduccin en la naturaleza.
Cada operador tiene un parmetro asociado que controla la probabilidad de
su aplicacin en cada iteracin (generacin) del algoritmo. El cmo asignar
estos parmetros es todava tema de investigacin, ya que es conocido que
el funcionamiento del algoritmo es muy sensible a los valores de los
mismos.

6. Mutacin
Cuando la representacin gentica consiste en una cadena de bits, el
operador de mutacin simplemente altera un bit, es decir, lo cambia de 0 a 1
o viceversa. La probabilidad de que un bit sea alterado depende de un
parmetro: la probabilidad o tasa de mutacin. Los bits de la cadena son
mutados de manera independiente, es decir, la mutacin de un bit no altera
la probabilidad de mutacin de los otros bits (Figura 3). Para
representaciones distintas a las cadenas de bits, otros operadores de
mutacin deben ser diseados. La idea detrs de un operador de mutacin
es la de realizar una alteracin o perturbacin pequea al genotipo, para
generar un individuo ligeramente distinto pero relacionado con el progenitor.
Tradicionalmente, la mutacin se considera como un operador secundario en
los algoritmos genticos, cuyo rol es el de restaurar el material gentico
perdido, siendo la recombinacin el principal operador de bsqueda. Sin
embargo, algunos investigadores sostienen que un mtodo basado en
mutacin y seleccin resulta un algoritmo de bsqueda poderoso; y que el
rol de la mutacin en los algoritmos genticos ha sido sub-estimado mientras
que el de la recombinacin sobre-estimado.

Figura3: El operador de mutacin sobre cadenas de bits, se aplica con


probabilidad pm para cada bit.

7. Recombinacin
La recombinacin o crossover se considera el operador de bsqueda
principal en los algoritmos genticos. Este operador produce individuos
descendientes a partir de combinar o mezclar el material gentico de dos (o
ms) individuos progenitores. La motivacin detrs de este operador es que
la mezcla de sub-partes de los progenitores puede crear nuevos individuos
con combinaciones favorables de genes. La aplicacin de la recombinacin
es controlada por un parmetro (la probabilidad o tasa de cruce). Varios
operadores de recombinacin han sido propuestos en la literatura. Los ms
conocidos son los de un punto, dos puntos, mltiples puntos y uniforme. En
la recombinacin de un punto, un nico punto de corte es seleccionado
aleatoriamente en los progenitores; luego los segmentos antes y despus del
punto de corte son intercambiados. La recombinacin de mltiples puntos es
una generalizacin de esta idea que introduce varios puntos de corte e
intercambia los segmentos entre dichos puntos. En la recombinacin
uniforme, los segmentos intercambiados se reducen a bits nicos. En lugar
de puntos de corte, se sortea aleatoriamente de cual progenitor proviene
cada bit. La figura 4 ilustra la operacin de la recombinacin de dos-puntos
(izquierda) y uniforme (derecha) sobre cadenas de bits. Varios trabajos han
comparado el desempeo de los distintos operadores de recombinacin, sin
embargo, no hay evidencia concluyente sobre cual es mejor. Es probable que
la eleccin del operador ms adecuado sea dependiente del problema.
Parece haber, sin embargo, un consenso general respecto a las ventajas de
los operadores de dos puntos y uniforme sobre el operador de un punto. Tal
como ocurre con la mutacin, para representaciones genticas distintas de
las cadenas de bits, operadores de recombinacin especializados y capaces
de preservar la estructura gentica, deben ser diseados.

Figura 4: Ilustracin de los operadores de recombinacin ms


comnmente utilizados para la representacin binaria. Izquierda:

recombinacin de dos puntos, se seleccionan 2 puntos de corte, y se


intercambian los segmentos entre ellos. Derecha: recombinacin
uniforme, se intercambian bits, para cada bit del hijo se selecciona
aleatoriamente de qu padre procede.

8. Seleccin
La seleccin se encarga de asignar oportunidades de reproduccin a cada
uno de los miembros de la poblacin. Mientras ms alto sea el valor de la
funcin de desempeo de un individuo, ms oportunidades tendr de
reproducirse. En los algoritmos evolutivos, la seleccin debe ser balanceada
con los operadores de variacin (mutacin y recombinacin). Todo algoritmo
de bsqueda debe balancear estas dos fuerzas opuestas: la exploracin de
nuevas zonas en el espacio de bsqueda, y la explotacin de zonas
promisorias del mismo que ya han sido descubiertas. La seleccin es el
componente que determina principalmente las caractersticas del proceso de
bsqueda. Si la seleccin es muy fuerte, individuos de calidad sub-ptima
pueden dominar la poblacin y por lo tanto reducir la diversidad gentica
requerida para el cambio y el avance; por otro lado, una seleccin muy dbil
puede resultar en un proceso evolutivo muy lento. Varios esquemas de
seleccin han sido propuestos en la literatura: seleccin proporcional, por
escalamiento, por torneo, basada en rango, etc. No existe consenso respecto
a cul esquema es preferible, aunque algunos son ms sencillos
conceptualmente que otros, y por tanto ms fciles de implementar.

9. Reemplazo poblacional
Pueden distinguirse dos modelos bsicos para realizar el reemplazo de una
poblacin simulada de una generacin o iteracin del algoritmo a la
siguiente: en el modelo generacional, toda la poblacin es reemplazada en
cada generacin; mientras que en el modelo de estado-estacionario, solo
pocos individuos son reemplazados en cada generacin (tpicamente uno o
dos). Entre estos dos extremos, se encuentra el llamado gap (brecha)
generacional, el cual define un porcentaje (gap) de los individuos que sern
reemplazados cada generacin.

Bibliografa:

http://www.cs.stir.ac.uk/~goc/papers/GOchoaIntroCompEv.pdf
https://es.wikipedia.org/wiki/Computaci%C3%B3n_evolutiva

MINERIA DE DATOS
1. Marco Terico
1.1.

Definicin

La minera de datos es el proceso de detectar la informacin de grandes


conjuntos de datos. Utiliza el anlisis matemtico para deducir los
patrones y tendencias que existen en los datos. Normalmente, estos
patrones no se pueden detectar mediante la exploracin tradicional de
los datos porque las relaciones son demasiado complejas o porque hay
demasiado datos.
Estos patrones y tendencias se pueden recopilar y definir como
un modelo de minera de datos.

1.2.

Datos informacin y conocimiento

1.2.1. DATOS
Los datos son en esencia nmeros o texto que puede ser procesado
en una computadora, en la actualidad las organizaciones acumulan
grandes cantidades de datos en distintos formatos y en distintas
bases de datos, entre las que se incluyen datos operacionales o
transaccionales en las que se almacenan costos, ventas, inventarios,
contabilidad, etc.
1.2.2. INFORMACIN
Los patrones, asociaciones o relaciones entre los datos proporcionan
informacin, por ejemplo el anlisis de transacciones de un punto de
venta nos pueden dar informacin sobre que cantidad de productos
se han vendido y durante cuanto tiempo.
1.2.3. CONOCIMIENTO
La informacin puede ser convertida en conocimiento partiendo de
patrones histricos

1.3.

Origen de la minera de datos

Las tcnicas de minera de datos son el resultado de un largo proceso de


investigaciones. Esta evolucin se inicia cuando se empieza a almacenar
la informacin de organizaciones en las computadoras, contina con
mejoras en el acceso de datos y ms recientemente se han generado
tecnologas que los usuarios naveguen por la informacin en tiempo real.
La minera de datos toma este proceso evolutivo y va ms all del
acceso retrospectivo de los datos y navegacin analizando la informacin
para luego mostrar resultados.

La minera de datos est lista para la aplicacin en la comunidad de los


negocios ya que ahora cuenta con un soporte de tres tecnologas que la
hacen suficientemente madura:

Recopilacin de datos de forma masiva


Computadoras poderosas con multiprocesadores

Los algoritmos de minera de datos

Las bases de datos comerciales estn creciendo a proporciones sin


precedentes y conjuntamente la necesidad de motores de bsqueda
mejorados. Los algoritmos de minera de datos personalizan tcnicas
que han existido por lo menos desde hace 10 aos, pero que hasta ahora
han podido ser implementadas de tal forma que se consideran
herramientas confiables y que consistentemente ejecutan los mtodos
estadsticos ms antiguos.
En la evolucin de la forma en que se manejan los datos de los negocios,
cada nuevo paso que se construye sobre la base la uno previo, por
ejemplo, el acceso dinmico de datos es crtico para las aplicaciones de
navegacin de datos y la habilidad de almacenamiento de grandes bases
de datos es crtica para la minera de datos.
Desde el punto de vista de los usuarios, el manejo de la informacin ha
evolucionado y ha permitido responder nuevas preguntas sobre los
negocios de manera rpida y exacta, a continuacin se muestran los
pasos evolutivos que se han dado:
Tabla1. Pasos evolutivos de la minera de datos
Paso evolutivo
Recopilacin
datos
(1960s)
Acceso de datos

Pregunta
de Cul ha sido mi ingreso en los ltimos
5 aos?
Cuales han sido las unidades de venta
en Nueva Inglaterra el mes pasado?

(1980s)
Data Warehousing y Cuales han sido las unidades de
soporte de decisin venta en Nueva Inglaterra el mes
(1990s)
pasado? Durante el entrenamiento en
Boston ?
Minera de datos
Que puede suceder el mes que viene
en las ventas de Boston? Y por que?
Los componentes que conforman el ncleo de la minera de datos han
estado en desarrollo durante dcadas, reas tales como estadstica,
inteligencia artificial y mquinas de aprendizaje. Hoy la madurez de estas
tcnicas acopladas al alto desempeo de los motores de bsqueda de
bases de datos relacionales y los esfuerzos de integracin de datos,
hacen estas tecnologas prcticas para los entornos del Data
warehousing.

1.4.

Proceso de Generacin de Modelo de Minera de Datos

La generacin de un modelo de minera de datos forma parte de


proceso mayor que incluye desde la formulacin de preguntas acerca
los datos y la creacin de un modelo para responderlas, hasta
implementacin del modelo en un entorno de trabajo. Este proceso
puede definir mediante los seis pasos bsicos siguientes:
1)

Definir Problema:

un
de
la
se

El primer paso del proceso de minera de datos, tal como se


resalta en el siguiente diagrama, consiste en definir claramente el
problema y considerar formas de usar los datos para proporcionar
una respuesta para el mismo.

Paso 1 de : Diagrama de proceso de


minera de datos

generacin de modelo de

Este paso incluye analizar los requisitos empresariales, definir el


mbito del problema, definir las mtricas por las que se evaluar
el modelo y definir los objetivos concretos del proyecto de minera
de datos. Estas tareas se traducen en preguntas como las
siguientes:

Qu est buscando? Qu tipos de relaciones intenta


buscar?
Refleja el problema que est intentando resolver las
directivas o procesos de la empresa?
Desea realizar predicciones a partir del modelo de minera
de datos o solamente buscar asociaciones y patrones
interesantes?
Qu resultado o atributo desea predecir?
Qu tipo de datos tiene y qu tipo de informacin hay en
cada columna? En caso de que haya varias tablas, cmo se
relacionan? Necesita limpiar, agregar o procesar los datos
antes de poder usarlos?
Cmo se distribuyen los datos? Los datos son
estacionales? Los datos representan con precisin los
procesos de la empresa?

Para responder a estas preguntas, puede que deba dirigir un


estudio de disponibilidad de datos para investigar las necesidades
de los usuarios de la empresa con respecto a los datos disponibles.
Si los datos no abarcan las necesidades de los usuarios, podra
tener que volver a definir el proyecto.

Tambin debe considerar las maneras en las que los resultados del
modelo se pueden incorporar en los indicadores de rendimiento
clave (KPI) que se utilizan para medir el progreso comercial.
2)

Preparas los Datos


El segundo paso del proceso de minera de datos, como se indica
en el siguiente diagrama, consiste en consolidar y limpiar los
datos identificados en el paso Definir el problema.

Paso 2 de: Diagrama de proceso de


minera de datos.

generacin de modelo de

Los datos pueden estar dispersos en la empresa y almacenados


en formatos distintos; tambin pueden contener incoherencias
como entradas que faltan o incorrectas. Por ejemplo, los datos
pueden mostrar que un cliente adquiri un producto incluso antes
que se ofreciera en el mercado o que el cliente compra
regularmente en una tienda situada a 2.000 kilmetros de su
casa.
La limpieza de datos no solamente implica quitar los datos no
vlidos o interpolar valores que faltan, sino tambin buscar las
correlaciones ocultas en los datos, identificar los orgenes de
datos que son ms precisos y determinar qu columnas son las
ms adecuadas para el anlisis. Por ejemplo, debera utilizar la
fecha de envo o la fecha de pedido? Qu influye ms en las
ventas: la cantidad, el precio total o un precio con descuento? Los
datos incompletos, los datos incorrectos y las entradas que
parecen independientes, pero que de hecho estn estrechamente
correlacionadas, pueden influir en los resultados del modelo de
maneras que no espera.
Por consiguiente, antes de empezar a generar los modelos de
minera de datos, debera identificar estos problemas y
determinar cmo los corregir. En la minera de datos, por lo
general se trabaja con un conjunto de datos de gran tamao y no
se puede examinar la calidad de los datos de cada transaccin;
por tanto, es posible que necesite usar herramientas de

3)

generacin de perfiles de datos, y de limpieza y filtrado


automtico de datos, como las que se proporcionan en Integration
Services, Microsoft SQL Server 2012 Master Data Services o SQL
Server Data Quality Services para explorar los datos y buscar
incoherencias. Para obtener ms informacin, vea estos recursos:
Es importante tener en cuenta que los datos que se usan para la
minera de datos no necesitan almacenarse en un cubo de
procesamiento analtico en lnea (OLAP), ni siquiera en una base
de datos relacional, aunque puede usar ambos como orgenes de
datos.Puede realizar minera de datos mediante cualquier origen
de datos definido como origen de datos de Analysis Services.Por
ejemplo, archivos de texto, libros de Excel o datos de otros
proveedores externos.
Explorar los Datos

Paso 3 de: Diagrama de proceso de


minera de datos.

generacin de modelo de

Debe conocer los datos para tomar las decisiones adecuadas al


crear los modelos de minera de datos. Entre las tcnicas de
exploracin se incluyen calcular los valores mnimos y mximos,
calcular la media y las desviaciones estndar, y examinar la
distribucin de los datos. Por ejemplo, al revisar el mximo, el
mnimo y los valores de la media se podra determinar que los
datos no son representativos de los clientes o procesos de
negocio, y que por consiguiente debe obtener ms datos
equilibrados o revisar las suposiciones que son la base de sus
expectativas. Las desviaciones estndar y otros valores de
distribucin pueden proporcionar informacin til sobre la
estabilidad y exactitud de los resultados. Una desviacin estndar
grande puede indicar que agregar ms datos podra ayudarle a
mejorar el modelo. Los datos que se desvan mucho de una
distribucin estndar se podran sesgar o podran representar una
imagen precisa de un problema de la vida real, pero dificultan el
ajustar un modelo a los datos.

Al explorar los datos para conocer el problema empresarial, puede


decidir si el conjunto de datos contiene datos defectuosos y, a
continuacin, puede inventar una estrategia para corregir los
problemas u obtener una descripcin ms profunda de los
comportamientos que son tpicos de su negocio.
Puede usar herramientas como Master Data Services para
sondear los orgenes de datos disponibles y determinar su
disponibilidad para la minera de datos. Puede usar herramientas
como SQL Server Data Quality Services, o el generador de perfiles
de datos de Integration Services, para analizar la distribucin de
los datos y solucionar problemas, como la existencia de datos
incorrectos o la falta de datos.
Cuando tenga definido los orgenes, combnelos en una vista del
origen de datos con el Diseador de vistas del origen de datos de
SQL Server Data Tools.
Este diseador tambin contiene algunas herramientas que podr
usar para explorar los datos y comprobar que funcionarn a la
hora de crear un modelo. Para obtener ms informacin,
consulte Explorar datos en una vista del origen de datos (Analysis
Services).
Tenga en cuenta que cuando se crea un modelo, Analysis Services
crea automticamente resmenes estadsticos de los datos
contenidos en l, que puede consultar para su uso en informes o
anlisis.Para obtener ms informacin, consulte Consultas de
minera de datos.
4)

Generar Modelos
El cuarto paso del proceso de minera de datos, como se resalta
en el siguiente diagrama, consiste en generar el modelo o
modelos de minera de datos. Usar los conocimientos adquiridos
en el paso Explorar los datos para definir y crear los modelos.

Paso 4 de: Diagrama de proceso de


minera de datos.

generacin de modelo de

Deber definir qu columnas de datos desea que se usen; para


ello, crear una estructura de minera de datos. La estructura de
minera de datos se vincula al origen de datos, pero en realidad
no contiene ningn dato hasta que se procesa. Al procesar la
estructura de minera de datos, Analysis Services genera
agregados y otra informacin estadstica que se puede usar para
el anlisis.Cualquier modelo de minera de datos que est basado
en la estructura puede utilizar esta informacin.
Antes de procesar la estructura y el modelo, un modelo de
minera de datos simplemente es un contenedor que especifica
las columnas que se usan para la entrada, el atributo que est
prediciendo y parmetros que indican al algoritmo cmo procesar
los datos. El procesamiento de un modelo a menudo se
denomina entrenamiento. El entrenamiento hace referencia al
proceso de aplicar un algoritmo matemtico concreto a los datos
de la estructura para extraer patrones. Los patrones que
encuentre en el proceso de entrenamiento dependern de la
seleccin de los datos de entrenamiento, el algoritmo que elija y
cmo se haya configurado el algoritmo. SQL Server 2014 contiene
muchos algoritmos diferentes. Cada uno est preparado para un
tipo diferente de tarea y crea un tipo distinto de modelo.
Tambin puede utilizar los parmetros para ajustar cada algoritmo
y puede aplicar filtros a los datos de entrenamiento para utilizar
un subconjunto de los datos, creando resultados diferentes.
Despus de pasar los datos a travs del modelo, el objeto de
modelo de minera de datos contiene los resmenes y modelos
que se pueden consultar o utilizar para la prediccin.
Puede definir un modelo nuevo mediante el Asistente para minera
de datos de SQL Server Data Tools o con el lenguaje DMX
(Extensiones de minera de datos).
Es importante recordar que siempre que los datos cambian, debe
actualizar la estructura y el modelo de minera de datos.Al
actualizar una estructura de minera de datos volvindola a
procesar, Analysis Services recupera los datos del origen, incluido
cualquier dato nuevo si el origen se actualiza dinmicamente, y
vuelve a rellenar la estructura de minera de datos.Si tiene
modelos que estn basados en la estructura, puede elegir
actualizar estos, lo que significa que se vuelven a entrenar con los
nuevos datos, o puede dejar los modelos tal cual.
5)

Explorar y validar los datos


El quinto paso del proceso de minera de datos, como se resalta
en el siguiente diagrama, consiste en explorar los modelos de
minera de datos que ha generado y comprobar su eficacia.

Paso 5 de: Diagrama de proceso de


minera de datos.

generacin de modelo de

Antes de implementar un modelo en un entorno de produccin, es


aconsejable probar si funciona correctamente. Adems, al generar
un modelo, normalmente se crean varios con configuraciones
diferentes y se prueban todos para ver cul ofrece los resultados
mejores para su problema y sus datos.
Analysis Services proporciona herramientas que ayudan a separar
los datos en conjuntos de datos de entrenamiento y pruebas, para
que pueda evaluar con precisin el rendimiento de todos los
modelos en los mismos datos. El conjunto de datos de
entrenamiento se utiliza para generar el modelo y el conjunto de
datos de prueba para comprobar la precisin del modelo
mediante la creacin de consultas de prediccin. En SQL Server
2014 Analysis Services (SSAS), estas particiones se pueden hacer
automticamente mientras se genera el modelo de minera de
datos.
Puede explorar las tendencias y patrones que los algoritmos
detectan mediante los visores del diseador de minera de datos
de SQL Server Data Tools.
Tambin puede comprobar si los modelos crean predicciones
correctamente mediante herramientas del diseador como el
grfico de mejora respecto al modelo predictivo y la matriz de
clasificacin.Para comprobar si el modelo es especfico de sus
datos o se puede utilizar para realizar inferencias en la poblacin
general,
puede
utilizar
la
tcnica
estadstica
denominada validacin cruzada para crear automticamente
subconjuntos de los datos y probar el modelo con cada uno
6)

Implementar y Actualizar los Datos

El ltimo paso del proceso de minera de datos, como se resalta


en el siguiente diagrama, consiste en implementar los modelos
que funcionan mejor en un entorno de produccin.

Paso 6 de: Diagrama de proceso de generacin de modelo de


minera de datos.
Use los modelos para crear predicciones que luego podr
usar para tomar decisiones comerciales. SQL Server pone a
su disposicin el lenguaje DMX, que podr usar para crear
consultas de prediccin, y el Generador de consultas de
prediccin, que le ayudar a generar las consultas.
Crear consultas de contenido para recuperar estadsticas,
reglas o frmulas del modelo.
Incrustar la funcionalidad de minera de datos directamente
en una aplicacin. Puede incluir Objetos de administracin
de anlisis (AMO), que contiene un conjunto de objetos que
la aplicacin pueda utilizar para crear, cambiar, procesar y
eliminar estructuras y modelos de minera de datos.
Tambin puede enviar mensajes XML for Analysis (XMLA)
directamente a una instancia de Analysis Services.
Utilizar Integration Services para crear un paquete en el
que se utilice un modelo de minera de datos para dividir
de forma inteligente los datos entrantes en varias tablas.
Por ejemplo, si una base de datos se actualiza
continuamente con clientes potenciales, puede utilizar un
modelo de minera de datos junto con Integration Services
para dividir los datos entrantes en clientes que
probablemente compren un producto y clientes que
probablemente no compren un producto.
Crear un informe que permita a los usuarios realizar
consultas directamente en un modelo de minera de datos
existente.
Actualizar los modelos despus de la revisin y anlisis.
Cualquier actualizacin requiere que vuelve a procesar los
modelos.

1.5.

Actualizar dinmicamente los modelos, cuando entren ms


datos en la organizacin, y realizar modificaciones
constantes para mejorar la efectividad de la solucin
debera ser parte de la estrategia de implementacin

reas relacionadas con la Minera de Datos

1.5.1. MINERA DE DATOS Y ALMACENES DE DATOS (DATAWAREHOUSE)


Frecuentemente los datos que sern minados se extraen del data
warehouse de una empresa. Existe un beneficio real si los datos son
parte ya de un data warehouse esto es porque el proceso de
depuracin de datos para un data warehouse y para la minera de
datos son similares.
Si la mayor parte de los datos ya han sido limpiados para un data
warehouse, es muy probable que no se necesite una limpieza
adicional para minar los datos.
La base de datos que se va a minar puede ser un subconjunto lgico
en lugar de uno fsico del data warehouse, esto slo si el DBMS del
data warehouse soporta los recursos de demanda de minera de
datos.
Si, la data warehouse no posee soporte de minera de datos,
entonces se tendr que separar las bases de datos a minar en:

Geogrfica
Data Mart
Anlisis
Data mining
Data source
Data warehouse

El data warehouse no es un requerimiento indispensable para la


minera de datos, la configuracin de un data warehouse de mltiples
datos, resuelve problemas de integridad de datos y una consulta de
los datos por medio de un query, puede ser una tarea enorme que
puede tomar mucho tiempo y a un costo elevado. Sin embargo para
minar los datos de una base de datos operacional o transaccional se
puede cargar la informacin a una base de datos de slo consulta,
este proceso es muy parecido al de un data mart.
1.5.2. MINERA DE DATOS Y OLAP
Una de las preguntas ms frecuentes entre los profesionales en
informtica es cul es la diferencia entre la minera de datos y
OLAP? Pues son dos herramientas muy diferentes, pero que se
pueden complementar mutuamente.
OLAP es un espectro de las herramientas de soporte de decisiones.
Las consultas tradicionales en sql y las herramientas para reportes
solo muestran lo que est en una base de datos, OLAP va un poco
ms all y responde porqu ciertas cosas son verdaderas, el usuario
forma una hiptesis sobre alguna relacin y la verifica por medio de
una serie de queries en los datos,

Por ejemplo: un analista deseara determinar los factores que llevan


a las omisiones de un prstamo. El analista puede crear una hiptesis
que dice que la gente con pocos ingresos corren el riesgo de un mal
crdito. Luego analiza la base de datos con OLAP para verificar esta
suposicin. Si la hiptesis no puede ser comprobada por los datos, el
analista puede asumir que su hiptesis es correcta.
En otros trminos el analizador de OLAP genera una serie de modelos
hipotticos que por medio de queries trata de verificar, el anlisis de
OLAP es esencialmente un proceso deductivo, pero qu sucede
cuando la cantidad de variables a analizar crece, se vuelve un poco
ms difcil y se necesita de mucho tiempo para encontrar una
hiptesis que pueda ser comprobada por el sistema.
La minera de datos es diferente de OLAP porque en lugar de hacer
verificaciones por medio de modelos hipotticos utiliza los datos para
encontrar dichos modelos, este es esencialmente un proceso
inductivo.
Por ejemplo, supongamos que el analista desea determinar los
factores de riesgo por medio de una herramienta de minera de
datos, la minera de datos podra determinar que las personas con
deudas e ingresos bajos son de mal crdito, pero adicionalmente
tambin puede encontrar un patrn que el analista no tom en
cuenta y es que la edad es un factor determinante de riesgo.

Aqu es donde la minera de datos y OLAP se pueden complementar


mutuamente, el analista necesita saber las implicaciones financieras
que representa dar un crdito, la herramienta OLAP puede permitir al
analista responder ese tipo de preguntas, adems OLAP tambin es
complementario en las fases iniciales del descubrimiento del
conocimiento porque puede ayudar a explorar los datos enfocando
atencin en variables importantes, identificar excepciones o
hallazgos.
1.5.3. MINERIA DE DATOS Y ESTADSTICA
Las tcnicas usadas en la minera de datos, cuando son exitosas, son
igualmente exitosas de la misma forma en que tcnicas estadsticas
son exitosas. Y en su mayor parte las tcnicas son usadas en los
mismos lugares para los mismos tipos de problemas (prediccin,
descubrimiento de clasificacin). En realidad algunas de las tcnicas
que son definidas como clsicas de la "minera de datos" son como
CART y CHAID, estas tienen su origen en tcnicas estadsticas.
Las tcnicas mineras clsicas de datos tal como CART, redes
neuronales y tcnicas de vecino ms cercano tienden a ser ms
robustas para ser usadas por usuarios menos expertos. Pero esa no
es la nica razn. La otra razn es que el espacio y el tiempo son
limitados. Debido al uso de computadoras para almacenamiento y

generacin de datos, ahora existen grandes cantidades de


informacin que estn a disposicin de los usuarios. Los dispositivos
de almacenamiento han aumentado su capacidad de forma
dramtica por lo que la capacidad de almacenar y procesar la
informacin hace que las tcnicas mineras sean ms poderosas.
La lnea fundamental sin embargo, de un punto de vista acadmico al
menos, es que existe una diferencia muy pequea entre las tcnicas
estadsticas y algunas tcnicas clsicas de la minera de datos.

2. Tendencias o situacin problematica


Los numerosos desafos que conlleva el proceso de minera de datos han
servido de fuente de inspiracin a quienes han visto los obstculos
convertirse en oportunidades de mejora. La construccin de entornos
integrados e interactivos y el diseo de lenguajes de minera de datosson
slo un par de muestras del progreso en este campo, que queda patente con
las novedades en:
o

Exploracin de aplicaciones: que explota las posibilidades de


la prospeccin en los datos para aportar soluciones punteras a cada
sector, contribuyendo a la innovacin y garantizando un mejor servicio
al cliente. Los campos de las finanzas, el retail, las telecomunicaciones
o la investigacin mdica son algunos de los ms favorecidos, aunque
no los nicos.
Mtodos de minera de datos escalables: desde la explosin big data,
la escalabilidad es una cualidad imprescindible de cualquier
herramienta orientada al analytics. Las soluciones deben tener la
flexibilidad suficiente para poder crecer al ritmo que lo hace el negocio,
dando soporte al aumento constante del volumen de datos.
Integracin de la minera de datos con los sistemas de bases de datos,
sistemas de almacenamiento de datos y los sistemas de bases de
datos web: para lograr la mxima eficiencia.
Normalizacin de lenguaje de consulta de minera de datos: para que
los comandos que provee puedan trabajar con cualquier base de datos
o data warehouse y sean aplicables a la definicin de tareas de data
mining.
Visual Data Mining: esta tendencia de minera de datos aumenta la
eficiencia del proceso, al disminuir el tiempo de trabajo gracias a una
forma de llevar a cabo la prospeccin en los datos mucho ms intuitiva
y sencilla.
Nuevos mtodos para la minera de datos complejos: los conjuntos de
datos pierden simplicidad al tiempo que aumenta la dificultad de los
procedimientos de negocio. Las soluciones de minera han de ser
capaces de soportar las condiciones de trabajo en un entorno de este
tipo, sin que ello incida negativamente en sus resultados.
Distributed Data Mining: es la respuesta tecnolgica a las necesidades
que plantean las bases de datos distribuidas. Los algoritmos se centran
en estas particulares tareas, prestando especial atencin a todo lo
relacionado con su anlisis y modelado.

La minera de datos en tiempo real: la extraccin de conocimiento a


partir de informacin para la toma de decisiones empresarial ha de ser
capaz de aportar el dinamismo que los mercados requieren hoy da.
Los datos se procesan en tiempo real y tambin deben poder ser
analizados a este ritmo.
Proteccin de la privacidad y seguridad de la informacin en la minera
de datos: con el aumento de la velocidad, la variedad y el volumen de
los datos la seguridad plantea incertidumbres a las empresas, que la
sealan como una de sus preocupaciones ms importantes. Los
procedimientos de minera de datos que se lleven a cabo no pueden,
en ningn caso, comprometer a los datos crticos e informacin
relevante del negocio. En este lnea, las tendencias apuntan a la
consecucin de una mayor integridad, tanto en lo referente a bases de
datos fsicas, como a las lgicas y por supuesto tambin en relacin a
cada elemento en particular.

3. Aplicacin de la Minera de Datos


Los modelos de minera de datos se pueden aplicar en escenarios como los
siguientes:

Previsin: calcular las ventas y predecir las cargas de servidor o el


tiempo de inactividad del servidor.
Riesgo y probabilidad: elegir los mejores clientes para la
distribucin de correo directo, determinar el punto de equilibrio
probable para los escenarios de riesgo, y asignar probabilidades a
diagnsticos u otros resultados.
Recomendaciones: determinar los productos que se pueden vender
juntos y generar recomendaciones.
Buscar secuencias: analizar los artculos que los clientes han
introducido en el carrito de compra y predecir los posibles eventos.
Agrupacin: separar los clientes o los eventos en clsteres de
elementos relacionados, y analizar y predecir afinidades.
La minera de datos es cada vez ms popular debido a la contribucin
substancial que puede hacer. Puede ser usada para controlar costos
as como tambin para contribuir a incrementar las entradas.
Muchas organizaciones estn usando minera de datos para ayudar a
manejar todas las fases del ciclo vital del cliente, incluyendo la
adquisicin de nuevos clientes, aumentando los ingresos con clientes
existentes y manteniendo bien a la clientela.
Determinando caractersticas de clientes buenos (trazado de perfil),
una compaa puede determinar conjuntos con caractersticas
similares. Perfilando clientes que hayan comprado un producto en
particular, ello puede enfocar la atencin en clientes similares que no
hayan comprado ese producto (de venta cruzada).
Cerca de perfilar clientes que se han ido, lo que la compaa hace para
retener los clientes que estn en riesgo de alejarse, porque es
normalmente un poco menos caro retener un cliente que conseguir
uno nuevo.

Las ofertas de minera de datos se valoran a travs de una amplia


efectividad de industrias. Las compaas de telecomunicaciones y
tarjeta de crdito son dos de los conductores para aplicar minera de
datos, para detectar el uso fraudulento de sus servicios.
Compaas aseguradoras y bolsas de valores se interesan tambin al
aplicar esta tecnologa para reducir el fraude. Las aplicaciones
mdicas son otra rea fructfera; la minera de datos se puede utilizar
para predecir la eficiencia de procedimientos quirrgicos, las pruebas
mdicas o medicaciones.
Las compaas activas en el mercado financiero, usan minera de
datos para determinar el mercado y caractersticas de industria as
como para predecir el comportamiento de las compaas individuales
y mejorar el sistema de inventarios.

Los minoristas estn haciendo mayor uso de la minera de datos, para


decidir que productos en particular deben mantener en inventario
para no abastecerse de productos innecesarios, as como para evaluar
la eficacia de promociones y ofertas.
Las firmas farmacuticas poseen grandes bases de datos de los
compuestos qumicos y de material gentico en las cuales hay
substancias que pueden muy buenas ser candidatas para minar, esto
con el objetivo de determinar como se pueden desarrollar nuevos
agentes para los tratamientos de determinadas enfermedades.

4. Conclusiones y Recomendaciones
Se determin que la minera de datos es el conjunto de herramientas y
tcnicas de anlisis de datos que permiten crear escenarios, de los cuales se
puede obtener informacin til para la toma de decisiones a nivel gerencial.

Las tcnicas que utiliza la minera de datos para la exploracin consisten el


la identificacin de patrones.

El proceso de la minera de datos genera conocimiento por medio de la


depuracin, enriquecimiento y transformacin de datos que sirve para la
creacin de un modelo en el que se evala un conjunto de casos.

5. BIBLIOGRAFA

http://www.monografias.com/trabajos16/sistemas-expertos/sistemasexpertos.shtml
https://es.wikipedia.org/wiki/Sistema_experto
http://sbc-unesr-2014-b.blogspot.pe/p/ventajas-y-desventajas-de-se.html
https://es.wikipedia.org/wiki/Vida_artificial
http://platea.pntic.mec.es/jdelucas/vidaartificial.htm
https://msdn.microsoft.com/es-es/library/ms174949(v=sql.120).aspx

http://biblioteca.usac.edu.gt/tesis/08/08_0307_CS.pdf
http://www.lantares.com/blog/tendencias-en-mineria-de-datos