711 524 131 - 3 PDF

ESTADISTICA ESPAOLA
Vol. 34, Nm. 131, 1992, pgs. 407 a 430
Inteligencia artificial y estadstica

por
R. ALONSO
ETSI Agrnornos, Madrid
Unidad de Estadstica
M. TALBOT
SASS, University of Edinburgh
RESUMEN
Este trabajo revisa las potenciales aplicaciones de la Inteligencia
Artificial en Estadstica y, recprocamente, de la Estadstica en Inteligencia Artificial.
Palabras clave: Inteligencia Artificial, Estadstica.
Clasificacin AMS: 62A99, 68G99.
1.
INTRODUCCION
EI anlisis estadstico, en particular su componente de clculo, se hizo

progresivamente ms fcil y cmodo a medida que los programas informticos
evolucionaban desde los elaborados en las primeras etapas, de objetivo especfico, hasta los paquetes de programas de arnplio espectro, con posibilidades de
interaccin con el usuario y crecientes capacidades grficas. Con la Ilegada de
los microordenadores, el potencial inforrntico de clculo estadstico ha dejado
de estar definitivamente limitado a una lite especializada y, muy por el contrario, es de fcil acceso para un muy amplio grupo de usuarios. Incluso de
^:sr^[)IST[(Â ^^tiPAti(al_A
^(^K
aquellos que disponen de una limitada formacin en Estadstica. Pero los profesionafes expertos en Estadstica, que pueden ayudar a este tipo de usuarios, no
son muy numerosos, en particular en ciertas reas de especializacin. Por lo
tanto, ^por qu no incorparar el conocimiento de los expertos en Estadstca a
los ordenadores, de forma que el usuario de los paquetes de anlisis estadstico
pueda beneficiarse del conocimiento de tales expertos?
Este articulo tiene como objetivo priortaro analizar la investigacin desarroliada a fin de extraer, organzar e incarporar a los ordenadores electrnicos el
conocimiento de las profesionales expertos en Estadstica, utilizando las tcnicas de Inteligencia Artificial (IA).
â segunda seccin describe las caractersticas definitorias de la IA y su
relacin con !os programas de anlisis estadistico. En la tercera se analiza la
naturaieza especfica del conocimiento exper#o en Estadstica, y en la cuarta,
los sistemas expertos en Estadstica (el rea de la IA que ha conocido un mayor
desarrOllo y repercusin). En la seccin quinta se plantea el futuro previsibie de
la IA en Estadstica, y la sexta estudia ia incidencia de la Estadstica en IA.
2.
INTE^.iGENCiA ARTIFICIAL EN ESTAQISTICA: UNA VISION GENERAL
EI trmino Inteligencia Artificial aparece en su forma actual a mediados de

las aos cincuenta. La Inteligencia Artificia! es una disciplina cientfica que
estudia la inteligencia humana utilizando el ordenador como principal herramienta de trabajo. La IA na dispone de una definicin expresa que delimite su
contenido, pero una de las ms aceptadas es: IA es la ciencia que persigue
lograr que las mquinas hagan cosas que, si fueran hechas por 1os seres
humanos, dirarnos que requieren inteligencia. Como se advierte, es una definicin un tant0 sutil.
EI arquetipo de sisterna en IA comprende, de manera muy general, dos
componentes fundamentafes y, consiguientemente, definitorios. Estos son: a) la
Base de Cnocimientas, anloga a la base de datos en la programacin convencional, y b) el Mator de lnferencia, equivalen#e a los programas de naturaleza
algoritmica. De esta forma, ias caracteristicas centrales de la IA pueden resumirse
en: i) la bsqueda de la representacin explicita del conocimiento humano
mediante hechos, reglas y otras estructuras smblcas, frente al tratamiento
convencional basado en su cuantificacin numrica, y ii) la aplicacin de sistemas de inferencia que perrnitan elaborar conclusiones a partir de un conocimiento inicial que no tiene por qu implicar de forma automtica y directa las
conclusiones obtenidas.
INTÊ^-L1(ÊNCÎ,A :ZkT^1F[('IAl_^ Y E^^TA[)Iti^T'I(Â
Ô^)
En trminos generales, la situacin puede resumirse afirmando que frente a

un paradigma anterior, condensado en la expresin: Programa=Datos+Algoritmo,
ha aparecido uno nuevo: Sistema=Conocimiento+lnferencia.
EI conocirniento incorporado a los sistemas informticos construidos en IA,
as como la forma en la que se incorpora, son aspectos tan determinantes en la
elaboracin de dichos sistemas que se suelen denorninar, genricamente, Sistemas Basados en el Conocimiento (SBC). Parafraseando otra afirmacin ms
conocida: el conocimiento {no ya la informacin) es poder.
Por esta razn, las tcnicas de adquisicin y representacin del conocimiento son brevemente revisadas en el apartado siguiente (2.1). Algunas caractersticas de las herramientas de programacin en IA se describen en el apartado 2.2.
2.1.
Adquisicin y representacin de! conocimiento
La adquisicin de conocimiento, frecuentemente adjetivada como el cuello

de botella de la ingeniera del conocimiento, es uno de los principales problemas en el desarrollo de todo SBC.
En la literatura especializada se encuentran algunos ejemplos (Gale, 1986c)
de SBC en el campo de la Estadstica, construidos en colaboracin con ingenieros del conocimiento, profesionales formados en la obtencin del conocimiento
de los expertos en la materia objeto de estudio. Sin embargo, los ingenieros del
conocirniento, una figura caracterstica de la IA, no han jugado un papel relevante en la construccin de SBC en Estadstica. La tendencia general ha sido la de
prescindir de intermediarios, como comentan Lubinsky y Pregibon (1988).
Thisted (1986) explica esta tendencia a la marginacin de los ingenieros del
conocimiento en la construccin de SBC en Estadstica, a partir de las caractersticas propias de los profesionales de la Estadstica. Estos acostumbran a
analizar e incorporar el conocimiento de quienes les consultan para aplicar las
tcnicas estadsticas en un muy amplio espectro de materias. Materias sobre
las que el profesional de la Estadstica tiene con cierta frecuencia un conocimiento escaso, en ocasiones nulo. De esta farma, el profesional de la Estadstica sera un ingeniero del conocimiento avant /a /ettre, capacitada para analizar
su propio rea de especializacin sin ayuda suplementaria.
As sucede con STUDENT (Gale, 1986b, 1987a), un ambicioso proyecto
diseado como herramienta para la construccin de SBC en el campo del
anlisis de datos, que no ha precisado de ingenieros del conocimiento en su
propio desarrollo, ni se presuponen en su uso. EI profesional de la Estadstica
k`_ :^l)Iti T Ic A E^P ^^^+^ ^ t .^
-^ I 1)
que utilice STUDENT no precisa tampoco conocer las tcnicas desarrolladas en

IA para la construccin de SBC, sino el sistema estadstico en el que se apoya
(QPE, un sucesor de S), un conocimiento que presumiblemente un estadstico
poseer ms fcilmente. Es de destacar que STUDENT, un sisterna concebido
como auxiliar, no como un producto acabado, es el nico SBC adaptativo
desarrollado en Estadstica; a diferencia del resto, su base de conocimientos no
es fija, sino que se construye mediante la seleccin de elaborados ejemplos y la
respuesta a preguntas.
A los expertos, en ocasiones, les resulta difcil justificar razonadamente sus
propias conclusiones. Por esta causa, se han desarrollado programas de adquisicin automtica de conocimiento (Gale, 1987c}. Algunos, apoyndose en
bases probabilsticas, infieren reglas desde datos (Ivanek y Stejskal, 1988;
Jirousek y Kriz, 1988} y otros desde series de ejemplos convenientemente
elaborados.
La calidad y utilidad de todo SBC depende en buena medida de su tcnica
de representacin del conocimiento. La tarea de representacin del conocimiento en Estadstica es, por su amplitud, particularmente ardua y sobre ella se ha
investigado poco. Para abordar los problemas planteados los SBC en Estad stica se han utilizado las tcnicas ya desarrolladas en otras reas. De esta forma,
para la representacin del conocimiento en Estadstica se han utilizado los
sistemas de produccin, marcos y rboles de decisin.
Un nrnero limitado de SBC en Estadstica ha utilizado los sistemas de
produccin para la representacin del conocimiento. Como ejemplo citaremos el
sistema descrito por Hietala (1988). EI programa REX (Gale, 1986c) hizo uso de
los sistemas de produccin y de los marcos en la representacin del conocimiento. Como resultado de la experiencia acumulada en el desarrollo de REX,
en su sistema sucesor, STUDENT, se utilizaron exclusivamente los marcos,
tcnica que se ha impuesto en el contexto de los SBC desarrollados en Estadstica. La tcnica de representacin del conocimiento basada en los rboles de
decisin ha sido, par el contrario, poco utilizada. Sus limitaciones e inconvenientes se describen en Hand (1985).
EI uso de tcnicas de representacin del conocimiento de tipo Hypertext
puede analizarse en los sistemas de potenciacin del conocimiento: LMG (Hitchock
y Edwards, 1989), KENS (Hand, 1987) y en su sucesor, NOMPAREIL (Hand,
1990b). La metadologa hypertext propone una representacin ms estructurada,
modelizada mediante grafos, que la convencional, en especial que la conseguida mediante sistemas de produccin (Hand, 1990a).
Oldford (198$) analiza las particularidades de la representacin del conocimiento
en el contexto de la metodologa de programacin orientada a objetos (OOP).
^ti^l^ ^c^1 Vc l^1 ^klltlt ^^l
ti I ^^^Î^^^^^^ ^
Tcnicas especficas de representacin del conocimiento se utilizan en los

trabajos de Hakong y Hickman ( 1985) y Gale y Lubinsky ( 1986).
2.2.
Herramientas informticas en Inteligencia Artificial
Las herramientas de desarrollo en IA pueden clasificarse, segn un nivel de

complejidad creciente, en: i) lenguajes de programacin lgica (LPL), como
PROLOG; ii) entornos de programacin del conocimiento (EPC), como KEE, y
iii) periferias (shells), SBC de los que se elimin su base de conocimienta
especfica, manteniendo nicamente su motor de inferencia y ciertos elernentos
complementarios. Westerhoff y Naeve (1988) estudian las periferias en el contexto estadstico.
Los LPL fueron originalmente diseados para actuar en macroordenadores,
las periferias en microordenadores y los EPC en microordenadores o estaciones de trabajo (analizadas stas en el mbito estadstico por Rasch y Sawitzki,
1990).
Algunas aplicaciones de la IA en Estadstica han hecho uso de las herramientas de programacin de alto nivel, como las periferias. Ejemplos son: i) el
programa desarrollado por Havranek y Sovdsky (1988) {al objeto de disear un
sistema que aconseje al usuario del paquete BMDP en la construccin del
archivo de parmetros para la ejecucin del programa de clasificacin automtica), utilizando la periferia EQUANT, de tipo MYCIN, y ii) el pragrama de ayuda
para la utilizacin de MLP (Berzuini, 1988) construido con la periferia EXPERT.
Oldford (1988) analiza las caractersticas, en su opinin muy positivas, del
paradigma OOP y de su lenguaje ms elaborado: SMALLTALK.
Pero, en el estado de investigacin actual, las herramientas de programacin de bajo nivel, como LISP -utilizado para elaborar DINDE (Oldford y
o PROLOG utilizado en GLIMPSE (Nelder, 1987) , son de
Peters, 1988)
utilizacin preferente.
3.
EL CONOCIMIENTO DE LOS EXPERTOS EN ESTADISTICA
Las tcnicas de IA se han utilizado en la investigacin desarrollada para

incorporar el conocimiento de los expertos en Estadstica {3.1) a los ordenadores. La clave de esta investigacin se encuentra no ya en los aspectos de
clculo, sino en la elaboracin de la adecuada estrategia estadstica (3.2).
t ^r.^rîs-ric^;^ t^^r^,^ ^^c ^ i ,^
3.1.
La naturaleza del conocimiento de los expertos en Estadistica
Aigunos autores, como Thisted {1986) o Bell y Watts (1988}, han estudiado
las caractersticas especficas del conocimiento experto en Estadstica.
Se ha prestado muy particular atencin a la comparacin de dicho conocimiento con el anlogo en medicina, debido a que un buen nmero de tcnicas
de IA se han aplicado en el contexto mdico (Spiegelhalter, 1987a, b), ya desde
los aos setenta, De hecho, la primera investigacin de la IA en el dominio de la
Estadistica estaba fuertemente influida por el modo de pensar en el anlisis de
datos como en un problema de diagnstico: se deberan enumerar las posibles
hiptesis del modelo (proceso anlogo a la especificacin de las posibles enfermedades), estudiar en el conjunto de datos la no verificacin de las hiptesis
(sntomas) que, caso de producirse, obliga a su transformacin (tratamiento). EI
conocimiento experto en Estadistica mantiene analogas con el propio en medicina {analogas esencialmente basadas en la naturaleza poco estructurada de
los problemas que plantean), pero tambin importantes diferencias, que Chambers
(1981 } y Hand (1986a) han analizado.
3.2.
Estrategia en Estadstica
La estrategia estadstica ha sido definida como la descripcin formalizada

de las elecciones, acciones y decisiones a adoptar en la utilizacin de los
mtodos estadsticos en el curso de un estudio de cualquier naturaleza. Hand
(1986b) estructura la estrategia del anlisis estadstico en cuatro etapas:
I. Formulacin de los objetivos generales; II. Formalizacin en trminos estadsticos de los objetivos prefijados; III. Tratamiento nurnrico, y IV. Interpretacin
de resultados.
La etapa I constituye la actividad propia de las sesiones de consulta, en las
que se precisan las cuestiones que el investigador quiere estudiar. Esta accin
depende en gran medida del dominio abjeto de estudio, por lo que resulta difcil
plantear la elaboracin de un programa que abarque el conjunto de aspectos no
estadsticos que se presentan en las sesiones de consulta. Es por esta razn
que e! problema ha recibido poca atencin (Hand, 1984b), pero no cabe duda de
su importancia. Permitira evitar el que se ha denominado error de tercera
especie: dar ia respuesta correcta al problema incorrecto (incorrectamente
planteado). Ante esta posibilidad sera preferible obtener una respuesta siquiera
aproximada, pero relativa al problema real.
EI programa RX (Blum, 1982) es, de entre los no muy numerosos sistemas
que han abordado la etapa II, el ms significativo. RX acepta un problema
ItiTt^l,lt^t^^l( 1^1 ^^^tt11t Ic l^^l ti' t^T ^^[ÎtiTlt .>
expresado en trminos mdicos y elabara una descripcin del estudio estadstico a efectuar. Pero en RX el anlisis estadstico considerado slo se refiere a
las tcnicas de regresin multivariante. Esta limitacin a un nico mtodo
estadistico es una caracterstica del trabajo desarrollado, hasta el momento
presente en la aplicacin de las tcnicas de IA en Estadstica. Una correcta
concepcin de la Estadstica debera contemplar todas y cada una de las
tcnicas que la componen. Pero no se ha efectuado ningn intento de elaboracin de un programa capaz de incorporar el conocimiento experto en Estadstica
con carcter general. Sera, al menos por el momento, impracticable. Aderns,
en paralelo con la evolucin general de la IA, superada una etapa inicial de
grandes expectativas, se abordan en la actualidad problemas especficos, de
complejidad limitada. Es an relativamente reciente la falta de curnplimiento de
las expectativas generadas en el mbito propio de ia lA, por programas como el
sistema GPS (General Problem Solver); nadie se aventura a construir, ni siquiera a plantear la construccin de un SGPS (Statistics GPS).
Es por ello que la investigacin se ha centrado en la etapa III, pero entendida en sentido amplio, supliendo en alguna medida la falta de tratamiento de la
etapa II. En la etapa III se ha abordado el problema de la seleccin de la tcnica
estadstica pertinente, siempre en el marco de un subdominio de la Estadstica.
As, a modo de ejemplo, el anlisis multivariante en MUSE (Dambroise, 1987) o
las series temporales en ESTES (Hietala, 1988).
La etapa III se ocupa tambin de la aplicacin de las tcnicas estadsticas
consideradas pertinentes. Aplicacin que no slo implica clculo, sino que
requiere tambin el anlisis de las particularidades que los datos puedan presentar y que no se correspondan con las hiptesis exigidas para el correcto uso
de la tcnica seleccionada. Las microestrategias, modelos formalizados de un
pequeo nmero de decisiones estadsticas, tal y como fueron definidas por
Gale (1988), pueden contribuir a abordar los problemas a este nivel.
La interpretacin (etapa IV) de los resultados del anlisis estadstico es,
quiz, el objetivo de mayor alcance de entre los abordados hasta el momento.
Tambin es uno de los ms difciles de resolver. En opinin de Gale (1986d), la
interpretacin de resultados es una tarea que est exigiendo ms esfuerzos de
investigacin. Algunos trabajos en esta lnea son los de Gyarfars y Klosgen
(1986) y Ho et al. (1986).
Como indica Hand (1986a), es importante sealar que la linealidad de la
secuencia de tareas 1-2-3-4 constituye una simplificacin. En primer lugar, la
Estadstica, en tanto que disciplina cientfica, est dotada de una estructura
propia, no es un conjunto de recetas. Adems, la prctica del anlisis estadstico puede desarrollarse en forma cclica: las cuestiones a estudiar son frecuen-
f^ r^^ ai^, r i^ ^ t,i^-^ti^ ^ i :^
temente redefinidas a la luz de la tcnica a adoptar; los primeros resultados

pueden aconsejar la consideracin de mtodos alternativos, y la presentacin
de los resultados ante 1os investigadores no estadsticos puede hacer reconsiderar
al estadstico la idoneidad de la(s) tcnica(s) adoptadas primariamente.
EI estudio de las estrategias estadsticas es importante en s mismo y en

relacin con su presencia en los programas informticos que incorporan el
del trabajo en Estadstica.
saber hacer
4.
SISTEMAS EXPERTOS EN ESTADISTICA {SEE)

Los Sistemas Expertos (SE) constituyen un importante tipo de sistemas
basados en el conocimiento. Feingenbaum los ha definido como: programas

de ordenador inteligentes que utilizan conocimiento y mtodos de inferencia
para resolver problemas, cuya complejidad es tal, que requeriran una aportacin significativa de expertos para su resolucn. En los SE se integran hechos
y heurstica. Los hechos constituyen la parte de la informacin que es compartida, disponible en publicaciones y en la que estn de acuerdo la generalidad de
los especialistas en la materia. La componente heurstica, por el contrario, tiene
un carcter ms personalizado y ha sido menos discutida, la conforman el
conjunto de juicios que caracterizan el nivel de decisin de ios especialistas de
vala rns reconocida, expertos en la materia.
Nelder (1977), en un artculo que es pionero en la reflexin acerca del papel
de la IA en Estadstica, fue uno de los primeros autores en considerar la
posibilidad de elaborar programas de ordenador ms inteligentes que ofrecer al
usuario de los paquetes informticos. Hasta el artcufo de Chambers (1981 } y su
subsiguiente prototipo inicial, descrito en Chambers et al. (1981 }, no se inici la
discusin acerca de la operatividad de la incorporacin de inteligencia a los
programas informticos de aplicacin en Estadstica.
Hand {1984a, 1994a) estudi los atributos de los SE en Estadstica (SEE),
resumidos en: i) los SEE han de ser de fcii modificacin; ii} capaces de
explicar tanto su proceso de razonamiento como los trminos tcnicos; iii) un
SEE ha de tratar todas las cuestiones planteadas y, lo que es ms importante y
difcil de automatizar, ha de ser capaz de determinar cundo se han abordado
todos los aspectos del problema estudiado, y, por ltirno, iv) debe permitir el
fcil retorno a etapas previas, previendo tanto la deficiente comprensin de los
trminos tcnicos por parte del usuario como las contradicciones en la informacin proporcionada por ste.
Iti1t l It^f tit I1 .^^kII} It I^^l ti I^t^11 ^ I^1It ^
L Quin usar el sistema ?

Los SEE pueden ser utilizados por usuarios no especialstas en Estadstica
o, por el contrario, por profesionales de la Estadstica, en cuyo caso el SE
puede aportar una opinin alternativa. En la prctica, la distincin entre estos
tipos de usuarios no se produce de una forma abrupta, se presentan formaciones intermedias, por lo que los sistemas flexibles sern de utilidad.
La mayor parte del trabajo acerca de los SEE ha sido orientado hacia los
usuarios no especialistas en Estadstica. De stos, quz el ms conocido sea
REX (Gale, 1986c). REX, en palabras de sus diseadores, aconseja al usuario
en el anlisis de regresin, conduce el estudio analizando e! cumplimiento de
fas hiptesis del modelo, sugiriendo transformaciones cuando dichas hiptesis
no se verifican y justificando sus sugerencias cuando se le requiere. Interpreta
los resultados intermedios y finales e instruye al usuario en los conceptos
estad sticos .
Como REX, la mayor parte de los SEE intentan emular a los expertos
humanos. La propuesta alternativa, tambin caracterstica de la IA, podra ser la
de la caja negra: no importa cmo la mquina hace las cosas, sino qu es lo
que hace. Manteniendo el rnismo resultado final que el que producira un analista
humano, los medios utilizados son diferentes. Ms que emular a los expertos
humanos en su capacidad de sntesis global, la idea sera aprovechar aquellos
aspectos en los que los ordenadores son realmente ms eficientes, en particular
en su capacidad de bsqueda basada en su potencia de clculo (Lubinsky y
Pregibon, 1988). Las tcncas de bsqueda heurstica, una de las metodologas
emblemticas de la IA, han sido aplicadas en TESS (Lubinsky, 1987) y TETRAD
(Glymour et al., 1987). EI captulo 9 del texto de Glyrnour et al. revisa la historia
de la bsqueda heurstica en Estadstica aplicada.
A diferencia de los programas dirigidos a no especialistas, otro tipo de
programas, de los que seran ejemplos KENS (Hand, 1987) y DINDE (Oldford y
Peters, 1988), se disearon para su uso por profesionales de la Estadstica.
Estos sistemas aspiran a ayudar a los expertos humanos, no a reemplazarlos.
Entre estos tipos extremos se encuentra GLIMPSE (Nelder, 1987), un proyecto a gran escala que se plantea la posibilidad de su utilizacin tanto por no
especialistas, que iran aprendiendo con su uso, como por estadstcos profesionaies. igualmente flexib/e es el programa de entrada desarrollado por Ross
(1988); en l, el usuario puede desconocer MLP o, por el contrario, ser un
usuario experimentado en MLP pero que desea optimizar su uso. EI usuario de
STATXPS (Prat et al., 1985) puede, anlogamente, ser un experto, iniciado 0
principiante, tipos de usuarios a los que se les ofrece las posibilidades de
interaccin mediante comandos, mens o ayudas ms elaboradas.
-l I f^
E tiTAE)ItiTlt'1 E tiE';^yt ^ l :1
Los SEE y e! clculo
Un limitado de SEE no efecta cICUIOS. No se plantea esta actividad en

su concepcin, sino que buscan orientar al usuario acerca de la correcta metodologa estadstica a aplicar. Ejemplos de este tipo de sisternas son KENS y STATISTICAL NAVIGATOR {Brent, 1988). Pero, en general, los SEE abordan tambin
la ejecucin de los clculos. Dentro de este tipo mayoritario, un grupo limitado de sistemas se han desarroilado sin hacer uso de programacin previa
(como DINDE}. Sin embargo, la mayor parte de los SEE se construyen como
programas de enlace (interface) que actan sobre un paquete de programas
preexistente, obviando as los problemas derivados del tratamiento numrico,
que el paquete efecta. Los problemas de conexin entre las componentes conversacional y numrica disminuyen utilizando UNIX (como ya REX demostr).
Un primer tipo de programas de enlace son los pragramas de preprocesado que, interrogando al usuario, se limiten a la construccin del archivo de
instrucciones exigido por el paquete estadstico {Havranek y Sovdsky, 1988).
Pero la mayor parte de los programas de enlace desarrollados mantienen una
relacin ms estrecha con el paquete para el que se disean; actan como
un frente exterior (front-end) del paquete. Como ejemplo, GLII't/IPSE, basado
en GLIM.
La mayor parte de ios programas de eniace hacen uso de las tcnicas
propias de IA. La aproxirnacin seguida en TAXSY ( Darius, 1990) y en la
versin actual de STUDENT ( Gale, 1987a) es diferente, ya que el programa de
enlace se desarrolla en el mismo lenguaje del paquete estadstico sobre el que
acta (SAS y QPE, respectivamente, en TAXSY y STUDENT).
^ Quin decide?
Los problemas relativos al dilogo hombre-mquina deben ser considerados
en la elaboracin de SEE. En contra de lo que ocurre con los programas de
enlace convencionales, en los que domina el uso de rdenes (command), el
programa de enlace inteligente deberia permitir la interaccin mediante conversacin. EI tratamiento del lenguaje natural resulta de evidente inters para
cumplir este objetivo. EI prototipo de programa descrito por Hakong y Hickman
(1985) presenta ciertas caractersticas prximas al lenguaje natural. Pero, sin
duda, las aplicaciones ms importantes en el tema que estudiamos se han
orientado hacia la elaboracin de programas de enlace que permitan la bsque-
INIf f Ic^t Nc'IA,^Kf1!-I< I^^t ti t^Tnl>I^;llc -ti
da en bases de datos mediante lenguaje natural (Lella et al., 1986; Barcaroli y

Fortunato, 1989a) (1).
Pero aun en el supuesto de lograr la comunicacin con el sistema en
lenguaje natural, la capacidad de decisin ha de recaer en el usuario y no en el
sistema informtico. Los SE deben ser libertarios, dice Nelder (1988): deben
dar consejos, nunca rdenes. La razn es clara: el anlisis estadistico est
fuertemente condicionado por la rnateria objeto de estudio, sta puede requerir
informacin especfica y/o complementaria (metadatos: datos acerca de los
datos), que el usuario posee y que el sistema informtico ignora. Como contrapartida, el peligro es que estos sstemas libertarios no pueden evitar su mal uso
por parte del usuario. Citando nuevamente a Nelder (1988), el acceso a GLM
mediante GLIMPSE, por ejemplo, no necesariamente supone que el usuario ha
hecho buen uso del conocimiento experto incorporado al programa de enlace,
lo que los editores y revisores de revistas deben tener presente, precisa
Nelder.
No realizamos en este trabajo un anlisis particularizado de todos los SEE
desarrollados hasta el momento presente. Pero interesa destacar que la utilidad
de las tcnicas de IA en Estadstica ha sido considerada no slo en relacin con
las tareas de modelizacin, anlisis e interpretacin, sino tambin con otras
tareas estadsticas, como son la obtencin y preparacin de datos (2). En esta
lnea destaca, en particufar en relacin con las tcnicas de muestreo, el proyecto ESCA (1991), desarrollado en el Centro Comn de Investigacin de la CE
(JRC, Ispra).
5.
EL FUTURO DE LA INTELIGENCIA ARTIFICIAL EN ESTADISTrCA
La IA conoci un perodo de relanzamiento en los aos ochenta. La investigacin en su aplicacin en Estadstica en particular fue rnayor en la segunda
mitad de la dcada. Se gener entonces un gran entusiasmo inicial, pero los
resultados no se correspondieron, al menos en opinin de los observadores
ms crticos, con las grandes expectativas iniciales. Por esta razn, se pas de
unos planteamientos en cierta medida arrogantes, que Ilevados al extremo
planteaban la posibilidad de sustitucin de los expertos humanos por los sistemas informticos inteligentes, a plantear la construccin de sisternas que ofre(1) La bibliografa incorpora referencias de algunos artculos que estudian la interrelacin
IA-Estadstica-Bases de Datos: Elliman y Wittowski (1987); Haux y Jockel (1989); Lubinsky
(1990); Drewett (1989); Fessey (1989); Lawton (1989); Lubbe (1990); Neumann (1990).
(2) La recopilacin DOSES (1989) presenta dos captulos en esta lnea; de ellos hemos
incluido en la bibliografa los trabajos de Appel y Scop; Barcaroli y Fortunato; Bethelem et a1.;
Gonzlez y Hatabian; Greenberg; Lamb; Saris; Jeffers; y Talbot.
-;^
F^,f ^1l)Itillt ,^ f tiP-1tiâ1 1
cieran ayuda, siernpre en reas muy delimitadas, no que sustituyeran a los

especialistas humanos. Es por ello que 1a aplicacin de las tcnicas de IA en
Estadstica, lejos de representar una amenaza de para la actividad de los
estadsticas profesionales, les ofrece la posibilidad de relevarlos de ciertas
componentes rutinarias de su trabajo, permitindoles centrarse en las ms
creativas. En particular, el desarrolla y uso de SEE supondr ms (y mejor)
trabajo (Gale, 1987b), no menos, de forma ms significativa para los estadsticos relacionados con la investigacin. As lo demuestra el proyecto DOSES
(Development Of Statistical Expert Systems), elaborado por la Comunidad Eurapea en 1987.
Pero resta por comprabar empiricamente que los nuevos sistemas propuestos resulten verdaderarnente efectivos. Se pueden encontrar en la literatura
especializada opiniones pesimistas (Jida y Lemaire, 1986} o escpticas (Molenaar,
1988) al respecto. La ms agresiva es quiz la de Streitberg (1989), quien,
apoyndase en argumentos tcnicos, concluye que ios SEE no existen y, ms
an, no existirn jams. Streitberg propone en su artculo un test prctico para
determinar si un sistema infarmtico puede ser calificado de SEE con propiedad. EI test descansa en tres pruebas: i) su compieta operatividad; ii) su
disponibilidad comercial, y iii) la superacin de un test de Turing. En opinin de
Streitberg, ningn sistema, de entre los elaborados hasta el momento, cumplira
estas condicones.
Tanto el test como la idea genrica de Streitberg fueron refutados en la
discusin de su artculo (Chambers et al., 1989; Molenaar et al., 1989). Pero en
una cuestin todos los autores se muestran de acuerdo: el trmino
Sistema
no es muy preciso, siendo preferible hablar de
Experto
Sistema de Consulta , como ya hizo Gale (1987a}, o de
Sistema de Potenciacin del Conocimiento , como propone Hand (1990b). Se tratara con ello de ayudar a centrar
las expectativas acerca de la posible aportacin de la IA en Estadstica; sta no
cristaliz en los aos ochenta, pero tampoco habra necesariamente que esperar ochenta aos, como algn autor ironiza en Malenaar et al. (1989).
La exigencia de la formalizacin del conocimiento que la aplicacin de las
tcnicas de IA exige condujo a una comprensin ms profunda de reas ajenas
a la Estadistica; presumiblemente tambin este resultado se dar con ella. As,
para mejorar los SEE ser necesario reestudiar la metodologa del anlisis
estadstico en su conjunto; sus componentes menos estructuradas pueden destacar sobre el resto y su mejora puede hacer aparecer nuevos campos de
estudio. Esto ha sucedido anteriormente; por ejemplo, el anlisis exploratorio de
datos plante una forma diferente de tratar los datos y condujo al desarrollo de
nuevas tcnicas y mtodos estadsticos. No obstante, el papel de la IA en
Estadstica no se plantea como revolucionario, como pudieron serlo los mto-
I^+I k^l I(î^N( I,^ ,^kf l#Î^ I^^l. ti^ 1^1 ^^fÎti^l l^ ^^
dos bayesianos, aunque no se descarta que la revolucin pueda producirse

como efecto secundario. Mientras, la IA puede ser un importante apoyo en la
formacin en Estadstica, una expectativa que la informtica en general, no slo
la IA, no acaba de cumplir.
Es de destacar la extraordinaria dispersin de la literatura relativa a la
interrelacin Estadstica-IA, de la que puede ser un ejemplo la bibliografa de
este artculo. Una fuente bsica la constituyen las actas de congresos, entre los
que destacan COMPSTAT e INTERFACE. Los textos existentes hasta el momento son recopilaciones de congresos (3), en ocasiones de difcil localizacin.
EI espectro de revistas en las que interesarse es muy arnplio, ya que incluye
tanto las revistas de Estadstica como un buen nmero de las de IA. De entre
las del primer tipo destacaremos que: i) la revista Statistics and Computing,
cuyo primer nmero apareci en 1991, trata, segn se lee en su editarial, el
tema objeto de este artculo como preferente, y ii) desde 1991 (vol. 11, 1), la
revista Statisties and Data Analysis incorpora Statistieal Software Newsletter,
que hasta 1991 era una publicacin interna para rniembros de la seccin de
clculo estadstico (IASC) del iSl, uno de los entes organizadores de COMPSTAT.
Sealaremos, por ltimo, que si bien los sistemas expertos son el rea de la
IA que ha conocido un mayor desarrollo y divulgacin, no constituyen en moda
alguno su nica lnea de investigacin. De entre el resto destaca la relativa a las
redes neuronales, estructuras que buscan reproducir la actividad del cerebra
humano. Esta aproximacin exige ordenadores de gran potencia de clculo,
ordenadores como los vectoriales, que posibilitan el clculo en paralelo, capacidad caracterstica del cerebro humano y que estaba ausente de los ordenadores
convencionales que actan secuencialmente. Citaremos el proyecto NNCR (1991),
desarrollado tambin en el JRC, como uno de los de mayor alcance en esta
lnea de investigacin y desarrollo.
6.
ESTADISTICA EN INTELIGENCIA ARTIFICIAL
Si bien la IA ha contribuido al desarrollo de un buen nmero de disciplinas

cientficas y tcnicas, la Estadstica es una de las no muy numerosas reas de
la ciencia que han realizado aportaciones significativas al desarrollo de la IA.
Las ms importantes se agrupan en torno: i) al tratamiento de la incertidumbre,
y ii) al estudio de los procesos de aprendizaje y desarrollo conceptual.
(3)
DOSES (1989); Gale (1986a); Haux (198fi); Phelps (1987).
C `^T ^^f)Iti1 I^ ,1 F^ti1'-^^1^)C ,^
6.1.
Tratamiento de la incertidumbre
Hasta hace relativamente no muchos aos, la comunidad de investigadores

en !A no se mostraba atrada por el razonamiento probabilstico. Las razones de
esta desafeccin inicial parecan claras: las probabilidades son nmeras y la
contribucin de la IA se ha de producir, de acuerdo con su fundamento ms
exigente, aportando herramientas y tcnicas para el razonamiento no numrico.
Destacaremos entre stas la lgica no monotnica y la teora de los endosos
(endorsernents) de Cohen.
Los factores que originaron este prejuicio inicial evolucionaron sustancialmente
y, de forma paralela, las exgencias prcticas condujeron al inters en el uso de
los nmeros como elementos de codificacin del grado de confianza. Los primeros trabajos en esta lnea se centraron en la incorporacin de una medda de!
nivel de conviccn en el cumplirniento de ias reglas utilizadas en los sistemas
de produccin. La estructura genrica de dichas reglas pasara a ser: SI A
ENTONCES B CON CERTEZA P. Los primeros y ya clsicos SBC (como
MYCIN} adoptaron ciertos sistemas de medida del grado de certeza y reglas de
operacin que, en alguna medida, se pueden calificar de cuasiprobabilisticos,
pero que esencialmente constituan mecanismos ad hoc, elaborados para tratar
problernas particulares. Estos mtodos se han perpetuado en las periferias
(shells) de los SE, hecho que ha redundado en una cierta limitacin en el
desarrollo prctico, en la incorporacin a los sistemas expertos ms conocidos
de metodologias alternativas de tratamiento de la incertidumbre.
Dos teoras de tratamiento de la incertidumbre, al margen de la probabilstica
y de !a no numrica, se han desarrollado de forma significativa en el campo de
la Inteligencia Artificial: i) el rnodelo lingi^stico que hace uso del razonamiento difuso en un intento de cuantificar, en la medida de lo posible, las ideas
imprecisas presentes en la cornunicacin humana verbal y ajustarlas a proposiciones formalmente definidas (Zadeh, 1986), y ii) la metodologa de las funciofrecuenternente denominada de Dempster-Shafer , que
nes de creencia
generaliza la aproximacin bayesiana al problema de tratamiento de la incertidumbre (Shafer, 1986). EI proyecto piloto ESMA (199Q) utiliz la teora de
Dempster-Shafer en el tratamiento de la incertidumbre.
En su defensa de la probabilidad, Cheeseman (1985, 1986) afirma que los
modelos numricos no probabilsticos, como los mencionados, son innecesarios, confusos y pueden conducir a conclusiones errneas, habiendo sido concebidos para superar dificultades de !a teoria probabilstica que slo existen en
la mente de sus inventores. A su vez, Lindley (1982, 1987) afirma que la
nica descripcin satisfactoria de la incertidumbre se tiene mediante la probabilidad, el resto son innecesarias; la probabilidad es inevitable. De hecho, un
1N T I LIc;F:NC IA .^Ft TIF IC I,^l_ l" t^, t^1F>I^T Ic "^
gran nmero de investigadores en IA o que hacen uso de ella defienden hoy, en

clara oposicin a su rechazo inicial, el modelo probabilstico como la mejor
herrarnienta numrica para el tratarniento de la incertidurnbre. No obstante lo
cual, se mantienen opiniones claramente contrarias no slo a la probabilidad
(Zadeh, 1986}, sino, en forma ms genrica, a todo tratamiento nurnrico de la
incertidurnbre en IA (Fox, 1986a, b). Entre los autores que aceptan el tratamiento numrico, cabe destacar la corriente eclctica que aspira a integrar las
aportaciones de las aproxirnaciones probabilstica y difusa (Kaufmann, 1986;
Kacprzyck y Fedrizzi, 1988).
De inters para el estudio del problema del tratamiento de la incertidumbre
en IA en refacin con la Estadstica resultan las siguientes recopilaciones: i) los
textos de ttulo genrico Incertidumbre en Inteligencia Artificial (4); ii) el conjunto de artculos del tercer nrnero, monogrfico, de la revista Statistical Science,
al que pertenecen los trabajos de Shafer (1987), Lindley (1987) y Spiegelhalter
(1987a), y iii) el nmero monagrfico de la revista citada bajo las siglas JSPI en
la bibliografa.
6.2.
Aprendizaje
La principal aportacin de la Estadstica al tratamiento del problema del

aprendizaje en IA, estudiado por Yakowitz (1989), la han realizado las tcnicas
de clasificacin. De hecho, en sus prirneros das al menos, la Inteligencia
Artificial se identificaba (5) en gran medida con el reconocirniento automtico de
patrones, que, a su vez, centraba sus objetivos en la visin artificial. Las
tcnicas de reconocimiento de patrones tratan hoy el problerna de forma general, no circunscrita a imgenes. De manera muy especial, trata el problema del
reconocimiento de la voz (Russell et al., 1986; Morin, 1988), actividad bsica en
el procesamiento del lenguaje oral, una de las ms importantes reas de investigacin y desarrollo en IA.
Hay problemas en el rea del reconocimiento de patrones que son, en gran
medida, propios de esta tcnica y han conducido al desarrollo de rntodos
especficos de clasificacin y seleccin de caractersticas. Sin ernbargo, los
temas objeto de estudio del denominado reconocimiento estadstico de patrones (Devijner y Kittler, 1982; Ripley, 1987) y amplias reas del anlisis
multivariante son muy similares. A modo de ejemplo, el aprendizaje no dirigido
(4) Kanal y Lemmer (1986); Lemmer y Kanal (1988); Kanal et al. (1989); Shachter, Levitt et
al. (1990); Henrion et al. (1990).
(5) Identificacin inicial que de alguna forma ha permanecido, como reflejara la pertenencia
de los textos de la nota de pie de pgina anterior a la coleccin -Machine Intelligence and
Pattern Recognition-.
f^^^1 ^1.fÎtiTÎ( 11^ti!'^1Î^ ^ I ^1
tendra su analoga, en el marco de la Estadstica, con las tcnicas de clasificacin automtica (cluster analysis).
Son numerosos los problemas planteados en IA que no pueden ser fcilmente tratados como problemas de clasificacin. Otros, como el mencionado en
el prrafo anterior, s. Pero, en todo caso, los mtodos de taxonoma numrica,
cuando son utilizados en IA, han de ser adaptados para tratar no slo con
nmeros, sino tambin con smbolOS. Este es el origen del agrupamiento conceptual (conceptual clustering) (Michalsk, 1980; Gowda y Diday, 1990), una
tcnica utiiizada en el anlisis del proceso de elaboracin de conceptos, componente bsico del aprendizaje (Fisher y Langley, 1986).
EI anlsis exploratorio de datos (AED) ha demostrado constituir un rea de
inters como objeto de aplicacin de las tcnicas de IA (Phelps y Musgrove,
1986; Jirku, 198$). Reciprocamente, el anlisis de regularidad que caracteriza
al AED, es una tarea central en ios procesos de aprendizaje y formacin de
conceptos. Es por ello que las tcnicas de AED pueden resultar de utilidad en el
estudio del aprendizaje automtico en IA (Hajeck e Ivaneck, 1982; Gebhardt,
1989) .
La utilidad de otras tcnicas estadsticas, en especial regresin, en la generacin de reglas ha sido explorada por Berzuini (1988) y Rowly ( 1988). Los
mtodos estadsticos tambin han sido aplicados en el estudio de la validez de
los grados de certeza asignados a las reglas que conforman los SE (O'Learly y
Kandelin, 1988).
De anloga importancia a!a aportacin de las tcnicas de clasificacin en IA
es la contribucin de ia teora de la decisin (Horvitz et al., 1988). Como es
sabido, la teora de la decisin se estudia frecuentemente como una tcnica que
forma parte de la Investigacin Operativa y no de la Estadstica. No es objeto de
este articulo discutir la delimitacin entre ambas disciplinas, pero, de acuerdo
con su ttulo, no hemos analizado aqu la interrelacin genrica Investigacin
Operativa-^nteligencia Artificial, ni la de ninguno de sus campos ms caractersticos, como seran !a teora de la decisin y las tcnicas de simulacin, con la IA (6).
7.
CONCLUSIONES
Giertos prototipos de sistemas han demostrado la aplicabilidad potencial de

las tcnicas de Inteligencia Artificial en Estadstica. Sin embargo, quedan por
(6) En el estudio de esta interrelacin son de inters los textos de Brawn y White (1990);
Futo y Gergely (1990); Klein (1990), y Widman et al. (1989), y los articulos de Grant (1986);
Grundwald et al. (1989); O'Keefe (1985}, y Phelps (1986).
ItiTI LI(^# !v( I^^ ZKTIf l( !Î ti 1-^f ^11 ^ 1ÎIt 1
responder un buen nmero de preguntas acerca de la operatividad de dicha

aplicacin, interrogantes que han estimulado la investigacin en los ltimos
aos. Es difcil predecir en qu medida la aplicacin de las tcnicas de Inteligencia Artificial en Estadstica supondr avances significativos en su desarrollo,
pero, en el momento presente, no se espera que su efecto sea el desarrollo de
perspectivas genuinamente nuevas, que supongan un cambio cualitativo en el
desarrollo de la Estadstica.
La Estadstica aporta a la Inteligencia Artificial no slo herramientas para la
resolucin de problernas especficos, sino tambin el tratamiento probabils#ico
de los problemas de incertidumbre. A diferencia de lo que ocurri desde el
nacimiento de la Inteligencia Artificial, hasta hace reiativamente pocos aos, el
modelo probabilstico es hoy considerado por un nmero creciente de investigadores en Inteligencia Artificial, presurniblemente ya rnayoritario, como el mejor
modelo numrico para el tratamiento de la incertidumbre.
* Agradecimiento: Este trabajo ha sido parcialmente subvencionado por el Programa Sectorial
de Promocin General del Conocimiento de la DGICYT.
BIBLIOGRAFIA
APPEL, M. V.; ScoPP, T. (1989): Autornated Industry and Occupation Coding.
In DOSES (1989), 143-59.
BARCAROLI, G.; FORTUNATO, E. (1989a): Intelligent Interfaces between Users and
Statistical Databases. In DOSES ( 1989), 221-5.
BARCAROLf, G.; FORTUNATO, E. (1989b): Expert Systems for Defining Statistical
Samples. In DOSES ( 1989), 72-83.
BELL, E.; WATTS, P. (1988): Building a Statistical Knowledge Base: A Discussion
of the Approach used in THESEUS, an Statistical Expert System. In
COMPSTAT (1988), 143-148.
BERZUINI, C. (1988): Generating Rules by Means of Regression Analysis . I n
COMPSTAT ( 1988), 273-278.
BETHLEHEM, .I.; DENTENEER, D., et al. (1989): BLAISE, A New System for Computer
Assisted Survey Processing. In DOSES (1989), 101-16.
BLUM, R. L. (1982): Discovery and Representation of Causal Relationships from
a Large Time-Oriented Clinical Database: The RX project. Springer-Verlag,
NY.
I ti T AUItiTI('A ltit'AN^ ^L ^^
gRENT, E. E. (1988): STATISTICAL NAVIGATOR: An ES to ASSIST in Selecting

Appropriate Statistical Analysis. Columbia, MO: The Idea Works, Inc.
BROwN, D. E.; WNITE, C. C. (eds.) (1990): Operations Research and AI: The
Integration of Problem-Solving Strategies. Dordrecht, Netherlands.
CHAMBERS, J. M. {1981 }: Some thoughts in Expert Systems. Proc. Comp.
Science and Statistics. 13th Sympsium on the Interface, 36-4^.
CHAMBERS, J. M.; GALE, ^/. A.; PRECIBON, D. (1989): On the Existence of Expert
Systems. Comrnent on Streitberg (88). Stat. Soft. Newsl., 14, 2, 63-6.
CHAMBERS, J. M.; PREGIBON, D.; ZAYAS, E. Z. (1981): Expert Software for data
analysis. An Initial Experment. Bull. Int. Stat. Inst., 49, 294-308.
CHEESEMAN, P. (1985): In defense of probability. Proc. on the 9th Int. Joint

Conference on AI. A. Joshi (ed.}. IJCAI-85, 1002-9.
CHEESEMAN, P. (1986): Probabilistic versus Fuzzy Reasoning. In Kanal and
Lemmer (1986}, 85-102.
COMPSTAT 86/88/90: Proceedings in Compu#ational Statistics. Physica-Verlag.
F. de Antoni / D. Edwards / K. Momirovic (eds.).
DAMBRO^sE, E. (1987): MUSE: Multivariate Expertise. Thesis INRIA, Montpellier,
Cedex, France.
DARIUS, P. (1990): <cA Toolbox for adding Knowledge-based modules to existing
statistical software . Annals of Mathematics and Al, 2, 101-8.
DEVIJVER, P. A.; KITTLER, J. (1982): Pattern Recognition: a statistical approach.
Prentice-Hall.
DOSES (1989); Deveiopment Of Statistical Expert Systems. EUROSTAT

News, Special edition.
DREWETT, R. (1989): Creating a Standarised and Integrated Knowledge-Based
ES for the Documentation of Statist. Series. In DOSES (1989), 178-88.
ELLIMAN, A. D.; WITTKOWSKI, K. M. (1987): The impact of Expert Systems on
Statistcal Database. Statistica/ Software Newsletter, 13, 1, 14-18.
ESCA ( 1991): An Expert System approach for rapid estimates of Crop Acreages
using integrated image and GIS data. JRC, Ispra.
ESMA (1990): Expert System for Land Cover Discrimination and Mapping.
JRC, Ispra.
FESSEY, M. C. (1989): Feedstocks for statistical ES. In DOSES (1989), 169-77.
IN Tf^:l.l( ^F.N(T,A AFt7 lF l< I^^L ti' T.ST At)I^ T It :^
FISHER, D.; LANGLEY, P. (1986): Conceptual Clustering and Its Relation to Numerical
Taxonomy. In Gale (1986a}, 77-116.
Fox, J. (1986a): Knowledge, Decision Making, Uncertainty. In Gale ( 1986a),

57-76.
Fox, J. ( 198fib): Three arguments for extending the framework of Uncertainty.
In Kanal and Lemmer ( 1986), 1-26.
FUTO, I.; GERGELY, T. (1990): AI in Simulation. Ellis Hoorwood.
GALE, W. A. (198fia): A1 and Statistics. Addison-Wesley.
GALE, W. A. (1986b}: Student phase 1- a report on work in progress. In Gale
(1986a), 239-265.
GALE, W. A. (1986c): REX review. In Gale (1986a), 173-227.
GALE, W. A. (1986d): AI and Statistics: verview . In Gale (1986a), 1-16.
GALE, W. A. (1987a): Student: a tool for constructing consultation systems in
data analysis. Bull. lnt. Stat. /nst., 52, 3, 305-321.
GALE, W. A. (1987b): Statistical Applications of AI and Knowledge Engineering.
Know/edge Engineering Review, 3, 4, 227-247.
GALE, W. A. (1987c): Knowledge-based knowledge acquisition for a statist.
consulting system. Int. J. of Man-Machine Studies, 26, 55-64.
GALE, W. A. (1988): Applications of Artificial Intelligence in Statistics. Technical
Memorandum. Tutorial Notes. In COMPSTAT-88.
GALE, W. A.; LUBINSKY, D. (1986): A cornparison of representations for statistical
strateg ies . Proc. ASA., Stat. Comp. Section, 88-96.
GEBHARDT, F. (1989): Some considerations on Expert Systems in Exploratory
Data Analysis. In DOSES (1989), 303-15,
GLYMOUR, C.; SCHEINES, R.; SPIRTES, P.; KELLY, K. (1987): Discovering Causal
Structure. AI, Philosophy of Science and Statistical Modelling. Academic
Press.
GONZLEZ, P.; HATABIAN, G. (1989): ADELLE or an aid in the analysis of surveys
by expert software on a microcomputer. In DOSES (1989), 278-92.
GowDA, K. C.; DIDAY, E. (1990): Glustering Syrnbolic Obêcts and Generalization.

In COMPSTAT-80, Short Comm., 27-28.
GRANT, T. J. (1986): Lessons for O.R. frorn A.I. A Scheduling Case Study.
J. Opl. Res. Soc., 37, 1, 41-57.
I ti 1 11^1ti l I( 1 IÎ' 1^^ ^ l ;^
GREENBERG, B. V. (1989): Developing an Expert Systems for Edit and Imputation.

In DOSES (1989), 132-42.
I^RUNWALD, H. J.; FORTUIN, L, (1989): c<DSS and ES in the " information organization" - Back to the roots of OR. Eur. J. of OR, 41, 2, 142-50.
GYARFARS, G.; KLUSGEN, W. (1986): A Statistical ES for the Generation of an
Analysis-Report. In COMPSTAT-86, Short Comm., 105-6.
HAJEK, P.; IVANEK, J. (1982): Artificial Intelligence and Data Analysis. In

COMPSTAT-82, Physica-Verlag, 54-60.
HAKONG, L.; HICKMAN, F. R. (1985): Expert Systems Techniques: An Application
in Statistics. M. A. Bramer (ed.). Cambridge Univ. Press.
HAND, D. J. (1984a): Statistical Expert Systems: necessary attributes. Journal

of Applied Statistics, 12, 1, 19-27.
HAND, D. J. (1984b}: Statistical ES: Design. The Statistician, 33, 351-69.
HAND, D. J. (1985): Choice of statistical technique. Bull. lnt. Stat. Inst., 51, 3,
21.1-16.
HÂND, D. J. (1986a): Expert systems in statistics. Knowledge Engineering
Review, 1, 2-10.
HAND, D. J. (1986b): Patterns in statistical strategy. In Gale {1986a), 355-87.
HAND, D. J. (1987): A Statistical Knowledge Enhancement System. J. R.
Statist. Soc., A, 150, 334-345.
HAND, D. J. (1990a): Emergent themes in statistical expert systems. /n
Knowledge, data and computer assisted decissions. Shader, M., Gaul, W.
(eds.}.
HAND, D. J. (1990b): Practical experience in developing knowledge enhancement
systems. Annals of Mathematics and Al, 2.
Haux, R. (ed.) {1986): Expert systems in statistics. Gustav Fischer, Stut.
HAUx, R.; JOCKEL, K.-H. (19$9): Database Management and Statistical Data
Analysis: The Need for Integration and for Becoming More Intelligent. In
COMPSTAT-86 & DOSES ( 1989), 245-54.
HAVRANEK, I.; SovosKY, O. (1988): Using an Expert System Shell for settling
Statistical Package Parameters. Comp. Stat. Quarterly, 4, 3, 159-69.
HENRION, H., et al. {eds.) ( 1990): Uncertainty in AI, 5. North-Holland.
ItiIF l I(^F N( I,ti ^K1lFl^ l^^l_ti_# Î ^(Îti_Ilt ^^
HIETALA, P. (1988): Inside a Expert System: Statistical Methods Employed in

the ESTES System. In COMPSTAT-88, 163-168.
HITCHOCK, S. E.; EDWARDS, J. W. (1989): LMG: Data Analysis Knowledge
Enhancement in an MS-DOS statistical computing environment. Bull. Int.
Stat. Inst., 53, 5, 55.
HO, T. B.; QUINQUETON, J.; RALAMBONDRAINY, H. (19$6): Using Expert System
Techniques for interpretation of data analysis results. In COMPSTAT-86,
Short Comm., 308-309.
FiORVITZ, E. J.; BREESE, J. S.; HENRION, M. {198$}: Decision Theory in Expert
Systems and AI. Int. Journ.al of Approximate Reasoning, 2, 3, 247-302.
INTERFACE-87/88: Computer Science and Statistics. Proc. of the 19/20th

Symposium on the Interface. R. M. Heiberger / E. J. Wegman (eds.). ASA.
IVANEK, J.; STEJSKAL, B. (1988): Automatic Acquisiti0n of Knowledge Base without
Expert: ESOD (Expert System from Observational Data). In COMPSTAT88, 175-180.
JEFFERS, J. N. R. (1989}: Expert Systems for advice on the design of experiments

and surveys. In DOSES (1989), 84-91.
JIDA, J.; LEMAIRE, J. (1986): Expert Systems and Data Analysis Package
Management. In COMPSTAT-86, 251-258.
JIRKU, P. (1988): An Implementation of an Exploratory Data Analysis Expert

System in Prolog Environment. In COMPSTAT-88, 169-174.
JIROUSEK, R.; KRIZ, O. (1988): An Expert System Accepting Knowledge in a form
of Statistical Data. In COMPSTAT-88, 123-128.
JSPI (1988): Special Issue on Assessing Uncertainty. Journal of Statistical
Planning and Inference, 20, 3.
KACPRZYCK, J.; FEDRIZZI, M. (1988): Combining Fuzzy imprecision with Probabilistic
Uncertainty in Decision Making. Springer-Verlag, Lecture Notes in Economics
and Mathe. Systems, 30.
KANAL, L. N.; LEMMER, J. F. (eds.) (1986): Uncertainty in AI, 1. North-Holland.

KANAL, L. N., et al. (eds.) (1989): Uncertainty in AI, 3. North-HOlland.
KAUFMANN, A. (1986): On the relevance of fuzzy sets for Operations Research.
European Journal of O. R., 25, 330-335.
KLEIN, M.; METHLIE, L. B. (1990): Expert Systems: A Decision Support Approach.
Addison-Wesley, UK.
t^ti^TAUt^TI( A f^^tiPA!^(^1 A
-^?X
LAnê, J. (1989): Putting Sernantics in Data Capture. In DOSES (1989), 11730.

LAWTON, K. (1989): Combining Expert Systems and Database Management
technoiogies with the SAS System. Proc. 1989 SASUG Int. Conf., 735-8.
LELLA, A.; AVAM, S.; Bucci, P. (1986): Easy-Link: An Expert System Natural
Language Interface to a Statistical Data Bank. in COMPSTAT-86, 443-7.
LEMMER, J. F.; KANAL, L. N. (eds.) (19$$): Uncertainty in AI, 2. North-Holland.

LINDLEY, D. V. (1982): Scoring Rules and the Inevitability of Probability. Int.
Stat. Review, 50, 1-26.
LINDLEY, D. V. {1987}: The probability approach to the treatment of Uncertainty
in AI and ES. Statistical Science, 3, 17-24.
LuBBE, H. (1990): Statistical metadata and terminological databases. In
COMPSTAT-90, Short Cornm., 107-8.
LUBINSKY, D. (1987): TESS: A tree-based environment for statistical strategies.
In INTERFACE-87.
LUBINSKY, D, (1990): Integrating statistical theory with statistical databases.
Annals of M'athematics and Artificial Intelligence, 2.
LUBINSKY, D.; PREGIBON, D. (1988): Data Analysis as search. Journa/ of
Econometrics, 38, 247-268.
MICHALSKI, R. (1980): Knowledge acquisition through conceptual clustering:

theoretic framework & Algorithm for partitioning data in conjunctive concepts.
Int. Jour. Polcy Ana/ysis and Infor. Systems, 4, 3, 219-43.
MOLENAAR, I. W. (1988): Statistical Consultants and Statistical Expert Systerns.
In COMPSTAT-88, 187-192.
MOLENAAR, I. W./ADERD, H. J.; KuiK, D. J. (1989): To exist or not to exist.
A comment on Statistical Expert Systems / E.S. can only be Constructed if
Expertise can be Formalized. Stat. Soft. Newsl., 14, 3, 127-130.
MoR^N, A. M. (1988): Decision Tree Classifier for Speech Recognition. In

COMPSTAT-88, 245-251.
NELDER, J. A. (1977): Intelligent programs, the next stage in statistical computing.
In Recent Developrnents in Statistics, 79-86. North-Holland.
NELDER, J. A. (1987): AI and generalized linear modelling: an Expert System for
GLIM. In Phelps (1987), 36-44.
i^vrr^r_ic;r^rvc^rA .^krir r^ i,^^ ti^ r^^r,^rî^rrc .^
-^'^>
NELDER, J. A. (1988): How should the Statistical System and its user see Each
Other?. In COMPSTAT-88, 107-116.
NEUMANN, K. (1990): Co-Operative Processing - A Challenge for Statistics and
Database Management. In COMPSTAT-9o, 225-36.
NNCR (1991): Neural Network development for crop recognition integrated
image and GIS da#a. IRSA, Joint Research Centre, Ispra.
O'KEEFE, R. M. (1985): Expert Systems and O. R. - Mutual Benefits . J. Opl.
Res. Soc., 36, 2, 125-129.
O'LEARLY, E.; KANDELIN, N. A. (1988): Validating the Weights in Ruled-Based
ES: A Statistical Approach. lnt. J. of Expert Systems, 1, 3, 253-9.
OLDFORD, R. W. (1988): Object oriented software representations for statistical

data. J. Econometrics, 38, 227-246.
OLDFORD, R. W.; PETERS, S. C. (1988): DINDE: Towards More Sophisticate Soft.
Environments for Stat. SIAM. J. Sci. Stat. Comp., 9, 1, 191-211.
PHELPS, R. I. (1986): AI - an overview of similarities with Operational Research.
J. Opl. Res. Soc., 37, 1, 13-30.
PHELPS, R. I. (ed.) (1987): Interactions in Artificial Intelligence and Statistical
Methods. Unicom Seminars Ltd. Technical Press.
PHELPS, R. I.; MusGROVE, P. B. (1986): Artificial Intelligence Approaches in
Statistics. In Gale (1986a), 159-171.
PRAT, A.; MART, M.; CATOT, J. M. (1985): Incorporating Expertise in Time Series
Modelling: The STATXPS system. Stat. Soft. News., 11, 2, 55-62.
RASCH, D.; SAWITZKI, G. (1990): Joint Preface: What is a Biometrical Workstation?.

Proc. XVth Int. Biom. Conf., 130-56.
RIPLEY, B. D. (1987): An Introduction to Statistical Pattern Recognition. In
Phelps (1987), 176-87.
Ross, G. J. S. (1988): Expert Systems for Non-Linear Modelling: Progress and
Prospects. In COMPSTAT-88, 155-161.
RowLY, D. (1988): Statistical Approaches for the Generation of Rules for ES.
Learned Information Ltd., Oxford. Second Int. ES Conference.
RussELL, M. J.; MooRE, R. K.; TOMLINSON, M. J. (1986): Dynamic Programming
and Statistical Modelling in Automatic Speech Recognition. J. O. R. Soc.,
37, 1, 21-30.
I^til 11)I^f I^ ^ ^ FÎ'^1tit^1 ;^
-^ ^1)
SARIS, W. E. (1989): Intelligent computer programs for assisted data collection.

In DOSES (1989), 92-100.
SHACHTER, R. D.; LEVITT, T. S.; KANAL, L.; LEMMER, J
. (eds.) (1990): Uncertainty in
AI, 4. North-Holland.
SHAFER, G. (1986): Probability Judgment in Artificial Intelligence. In Kanal and
Lemrner (198+6), 127-136.
SHAFER, G. (1987): Probability judgrnents in artificial intelligence and expert
systems . Statistical Science, 3, 3-16.
SPIEGELHALTER, D. J. { 1987a): Probabilistic ES in Medicine: Practical Issues in
Handling Uncertainty. Statistical Science, 3, 1, 3-44.
SPIEGELHALTER, D. J. (1987b): Synthesis of AI and Bayesian Methods in Medical
Expert Systems. In Phelps (1987), 169-175.
STREiTBERG, B. (1989): On the nonexistence of ES. Critical remarks on AI in

statistics. Stat. Software Newsletter, 14, 2, 55-74.
TALBOT, M. (1989): Developrnent of Expert System Tools for Routine Data
Monitoring. In DOSES {1989}, 160-7.
THISTED, R. A. (1986): Representing Statistical Knowledge for Expert Data
Analysis Systems. In Gale (1986a), 267-284.
WESTERHOFF, T.; NAEVE, P. (1988): On Inference Process. In COMPSTAT-88,
193-8.
WIDMAN, L. E.; LOPARO, R.; NIELSEN, N. (1989): Artificial Intelligence, Simulation

and Modelling. Wiley.
YaKOwiTZ, S. (1989): Statistical Foundation for Machine Learning. Computer
and Mathematics with Appl., 17, 7, 1095-1102.
ZADEH, L. A. (1986): Is Probability Theory Sufficient for Dealing with Uncertainty
in Ai: A Negative View. In Kanal and Lemmer (1986}, 103-16.
ARTIFICIAL INTELLIGENCE AND STATISTICS

SUMMARY
This paper reviews the possible applications of Artificial Intelligence
in Statistics, and, conversely, Statistics in Artificial Intelligence.
Keywords: Artificial Intelligence, Statistics.
AMS Classification: 62A99, 68G99.

711 524 131 - 3 PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

711 524 131 - 3 PDF

Загружено:

Авторское право:

Доступные форматы

ESTADISTICA ESPAOLA

Vol. 34, Nm. 131, 1992, pgs. 407 a 430

Inteligencia artificial y estadstica

EI anlisis estadstico, en particular su componente de clculo, se hizo

INTE^.iGENCiA ARTIFICIAL EN ESTAQISTICA: UNA VISION GENERAL

EI trmino Inteligencia Artificial aparece en su forma actual a mediados de

INTÊ^-L1(ÊNCÎ,A :ZkT^1F[('IAl_^ Y E^^TA[)Iti^T'I(Â

En trminos generales, la situacin puede resumirse afirmando que frente a

Adquisicin y representacin de! conocimiento

La adquisicin de conocimiento, frecuentemente adjetivada como el cuello

k`_ :^l)Iti T Ic A E^P ^^^+^ ^ t .^

que utilice STUDENT no precisa tampoco conocer las tcnicas desarrolladas en

^ti^l^ ^c^1 Vc l^1 ^klltlt ^^l

Tcnicas especficas de representacin del conocimiento se utilizan en los

Herramientas informticas en Inteligencia Artificial

Las herramientas de desarrollo en IA pueden clasificarse, segn un nivel de

EL CONOCIMIENTO DE LOS EXPERTOS EN ESTADISTICA

Las tcnicas de IA se han utilizado en la investigacin desarrollada para

t ^r.^r^is-ric^;^ t^^r^,^ ^^c ^ i ,^

La naturaleza del conocimiento de los expertos en Estadistica

La estrategia estadstica ha sido definida como la descripcin formalizada

ItiTt^l,lt^t^^l( 1^1 ^^^tt11t Ic l^^l ti' t^T ^^[^ItiTlt .>

f^ r^^ ai^, r i^ ^ t,i^-^ti^ ^ i :^

temente redefinidas a la luz de la tcnica a adoptar; los primeros resultados

EI estudio de las estrategias estadsticas es importante en s mismo y en

SISTEMAS EXPERTOS EN ESTADISTICA {SEE)

basados en el conocimiento. Feingenbaum los ha definido como: programas

Iti1t l It^f tit I1 .^^kII} It I^^l ti I^t^11 ^ I^1It ^

L Quin usar el sistema ?

Los SEE y e! clculo

Un limitado de SEE no efecta cICUIOS. No se plantea esta actividad en

INIf f Ic^t Nc'IA,^Kf1!-I< I^^t ti t^Tnl>I^;llc -ti

da en bases de datos mediante lenguaje natural (Lella et al., 1986; Barcaroli y

EL FUTURO DE LA INTELIGENCIA ARTIFICIAL EN ESTADISTrCA

F^,f ^1l)Itillt ,^ f tiP-1ti^a1 1

cieran ayuda, siernpre en reas muy delimitadas, no que sustituyeran a los

dos bayesianos, aunque no se descarta que la revolucin pueda producirse

ESTADISTICA EN INTELIGENCIA ARTIFICIAL

Si bien la IA ha contribuido al desarrollo de un buen nmero de disciplinas

DOSES (1989); Gale (1986a); Haux (198fi); Phelps (1987).

C `^T ^^f)Iti1 I^ ,1 F^ti1'-^^1^)C ,^

Hasta hace relativamente no muchos aos, la comunidad de investigadores

1N T I LIc;F:NC IA .^Ft TIF IC I,^l_ l" t^, t^1F>I^T Ic "^

gran nmero de investigadores en IA o que hacen uso de ella defienden hoy, en

La principal aportacin de la Estadstica al tratamiento del problema del

f^^^1 ^1.fÎtiTÎ( 11^ti!'^1Î^ ^ I ^1

Giertos prototipos de sistemas han demostrado la aplicabilidad potencial de

ItiTI LI(^# !v( I^^ ZKTIf l( !^I ti 1-^f ^11 ^ 1^IIt 1

responder un buen nmero de preguntas acerca de la operatividad de dicha

gRENT, E. E. (1988): STATISTICAL NAVIGATOR: An ES to ASSIST in Selecting

CHEESEMAN, P. (1985): In defense of probability. Proc. on the 9th Int. Joint

DOSES (1989); Deveiopment Of Statistical Expert Systems. EUROSTAT

IN Tf^:l.l( ^F.N(T,A AFt7 lF l< I^^L ti' T.ST At)I^ T It :^

Fox, J. (1986a): Knowledge, Decision Making, Uncertainty. In Gale ( 1986a),

GowDA, K. C.; DIDAY, E. (1990): Glustering Syrnbolic Ob^ects and Generalization.

I ti 1 11^1ti l I( 1 I^I' 1^^ ^ l ;^

GREENBERG, B. V. (1989): Developing an Expert Systems for Edit and Imputation.

HAJEK, P.; IVANEK, J. (1982): Artificial Intelligence and Data Analysis. In

HAND, D. J. (1984a): Statistical Expert Systems: necessary attributes. Journal

ItiIF l I(^F N( I,ti ^K1lFl^ l^^l_ti_# ^I ^(^Iti_Ilt ^^

HIETALA, P. (1988): Inside a Expert System: Statistical Methods Employed in

INTERFACE-87/88: Computer Science and Statistics. Proc. of the 19/20th

JEFFERS, J. N. R. (1989}: Expert Systems for advice on the design of experiments