Академический Документы
Профессиональный Документы
Культура Документы
M. TALBOT
SASS, University of Edinburgh
RESUMEN
Este trabajo revisa las potenciales aplicaciones de la Inteligencia
Artificial en Estadstica y, recprocamente, de la Estadstica en Inteligencia Artificial.
Palabras clave: Inteligencia Artificial, Estadstica.
Clasificacin AMS: 62A99, 68G99.
1.
INTRODUCCION
^:sr^[)IST[(^A ^^tiPAti(al_A
^(^K
aquellos que disponen de una limitada formacin en Estadstica. Pero los profesionafes expertos en Estadstica, que pueden ayudar a este tipo de usuarios, no
son muy numerosos, en particular en ciertas reas de especializacin. Por lo
tanto, ^por qu no incorparar el conocimiento de los expertos en Estadstca a
los ordenadores, de forma que el usuario de los paquetes de anlisis estadstico
pueda beneficiarse del conocimiento de tales expertos?
Este articulo tiene como objetivo priortaro analizar la investigacin desarroliada a fin de extraer, organzar e incarporar a los ordenadores electrnicos el
conocimiento de las profesionales expertos en Estadstica, utilizando las tcnicas de Inteligencia Artificial (IA).
^a segunda seccin describe las caractersticas definitorias de la IA y su
relacin con !os programas de anlisis estadistico. En la tercera se analiza la
naturaieza especfica del conocimiento exper#o en Estadstica, y en la cuarta,
los sistemas expertos en Estadstica (el rea de la IA que ha conocido un mayor
desarrOllo y repercusin). En la seccin quinta se plantea el futuro previsibie de
la IA en Estadstica, y la sexta estudia ia incidencia de la Estadstica en IA.
2.
^O^)
2.1.
-^ I 1)
ti I ^^^^I^^^^^^ ^
2.2.
3.
3.1.
Aigunos autores, como Thisted {1986) o Bell y Watts (1988}, han estudiado
las caractersticas especficas del conocimiento experto en Estadstica.
Se ha prestado muy particular atencin a la comparacin de dicho conocimiento con el anlogo en medicina, debido a que un buen nmero de tcnicas
de IA se han aplicado en el contexto mdico (Spiegelhalter, 1987a, b), ya desde
los aos setenta, De hecho, la primera investigacin de la IA en el dominio de la
Estadistica estaba fuertemente influida por el modo de pensar en el anlisis de
datos como en un problema de diagnstico: se deberan enumerar las posibles
hiptesis del modelo (proceso anlogo a la especificacin de las posibles enfermedades), estudiar en el conjunto de datos la no verificacin de las hiptesis
(sntomas) que, caso de producirse, obliga a su transformacin (tratamiento). EI
conocimiento experto en Estadistica mantiene analogas con el propio en medicina {analogas esencialmente basadas en la naturaleza poco estructurada de
los problemas que plantean), pero tambin importantes diferencias, que Chambers
(1981 } y Hand (1986a) han analizado.
3.2.
Estrategia en Estadstica
expresado en trminos mdicos y elabara una descripcin del estudio estadstico a efectuar. Pero en RX el anlisis estadstico considerado slo se refiere a
las tcnicas de regresin multivariante. Esta limitacin a un nico mtodo
estadistico es una caracterstica del trabajo desarrollado, hasta el momento
presente en la aplicacin de las tcnicas de IA en Estadstica. Una correcta
concepcin de la Estadstica debera contemplar todas y cada una de las
tcnicas que la componen. Pero no se ha efectuado ningn intento de elaboracin de un programa capaz de incorporar el conocimiento experto en Estadstica
con carcter general. Sera, al menos por el momento, impracticable. Aderns,
en paralelo con la evolucin general de la IA, superada una etapa inicial de
grandes expectativas, se abordan en la actualidad problemas especficos, de
complejidad limitada. Es an relativamente reciente la falta de curnplimiento de
las expectativas generadas en el mbito propio de ia lA, por programas como el
sistema GPS (General Problem Solver); nadie se aventura a construir, ni siquiera a plantear la construccin de un SGPS (Statistics GPS).
Es por ello que la investigacin se ha centrado en la etapa III, pero entendida en sentido amplio, supliendo en alguna medida la falta de tratamiento de la
etapa II. En la etapa III se ha abordado el problema de la seleccin de la tcnica
estadstica pertinente, siempre en el marco de un subdominio de la Estadstica.
As, a modo de ejemplo, el anlisis multivariante en MUSE (Dambroise, 1987) o
las series temporales en ESTES (Hietala, 1988).
La etapa III se ocupa tambin de la aplicacin de las tcnicas estadsticas
consideradas pertinentes. Aplicacin que no slo implica clculo, sino que
requiere tambin el anlisis de las particularidades que los datos puedan presentar y que no se correspondan con las hiptesis exigidas para el correcto uso
de la tcnica seleccionada. Las microestrategias, modelos formalizados de un
pequeo nmero de decisiones estadsticas, tal y como fueron definidas por
Gale (1988), pueden contribuir a abordar los problemas a este nivel.
La interpretacin (etapa IV) de los resultados del anlisis estadstico es,
quiz, el objetivo de mayor alcance de entre los abordados hasta el momento.
Tambin es uno de los ms difciles de resolver. En opinin de Gale (1986d), la
interpretacin de resultados es una tarea que est exigiendo ms esfuerzos de
investigacin. Algunos trabajos en esta lnea son los de Gyarfars y Klosgen
(1986) y Ho et al. (1986).
Como indica Hand (1986a), es importante sealar que la linealidad de la
secuencia de tareas 1-2-3-4 constituye una simplificacin. En primer lugar, la
Estadstica, en tanto que disciplina cientfica, est dotada de una estructura
propia, no es un conjunto de recetas. Adems, la prctica del anlisis estadstico puede desarrollarse en forma cclica: las cuestiones a estudiar son frecuen-
4.
-l I f^
E tiTAE)ItiTlt'1 E tiE';^yt ^ l :1
^ Quin decide?
Los problemas relativos al dilogo hombre-mquina deben ser considerados
en la elaboracin de SEE. En contra de lo que ocurre con los programas de
enlace convencionales, en los que domina el uso de rdenes (command), el
programa de enlace inteligente deberia permitir la interaccin mediante conversacin. EI tratamiento del lenguaje natural resulta de evidente inters para
cumplir este objetivo. EI prototipo de programa descrito por Hakong y Hickman
(1985) presenta ciertas caractersticas prximas al lenguaje natural. Pero, sin
duda, las aplicaciones ms importantes en el tema que estudiamos se han
orientado hacia la elaboracin de programas de enlace que permitan la bsque-
5.
La IA conoci un perodo de relanzamiento en los aos ochenta. La investigacin en su aplicacin en Estadstica en particular fue rnayor en la segunda
mitad de la dcada. Se gener entonces un gran entusiasmo inicial, pero los
resultados no se correspondieron, al menos en opinin de los observadores
ms crticos, con las grandes expectativas iniciales. Por esta razn, se pas de
unos planteamientos en cierta medida arrogantes, que Ilevados al extremo
planteaban la posibilidad de sustitucin de los expertos humanos por los sistemas informticos inteligentes, a plantear la construccin de sisternas que ofre(1) La bibliografa incorpora referencias de algunos artculos que estudian la interrelacin
IA-Estadstica-Bases de Datos: Elliman y Wittowski (1987); Haux y Jockel (1989); Lubinsky
(1990); Drewett (1989); Fessey (1989); Lawton (1989); Lubbe (1990); Neumann (1990).
(2) La recopilacin DOSES (1989) presenta dos captulos en esta lnea; de ellos hemos
incluido en la bibliografa los trabajos de Appel y Scop; Barcaroli y Fortunato; Bethelem et a1.;
Gonzlez y Hatabian; Greenberg; Lamb; Saris; Jeffers; y Talbot.
-;^
I^+I k^l I(^i^N( I,^ ,^kf l#^I^ I^^l. ti^ 1^1 ^^f^Iti^l l^ ^^
6.
(3)
6.1.
Tratamiento de la incertidumbre
6.2.
Aprendizaje
tendra su analoga, en el marco de la Estadstica, con las tcnicas de clasificacin automtica (cluster analysis).
Son numerosos los problemas planteados en IA que no pueden ser fcilmente tratados como problemas de clasificacin. Otros, como el mencionado en
el prrafo anterior, s. Pero, en todo caso, los mtodos de taxonoma numrica,
cuando son utilizados en IA, han de ser adaptados para tratar no slo con
nmeros, sino tambin con smbolOS. Este es el origen del agrupamiento conceptual (conceptual clustering) (Michalsk, 1980; Gowda y Diday, 1990), una
tcnica utiiizada en el anlisis del proceso de elaboracin de conceptos, componente bsico del aprendizaje (Fisher y Langley, 1986).
EI anlsis exploratorio de datos (AED) ha demostrado constituir un rea de
inters como objeto de aplicacin de las tcnicas de IA (Phelps y Musgrove,
1986; Jirku, 198$). Reciprocamente, el anlisis de regularidad que caracteriza
al AED, es una tarea central en ios procesos de aprendizaje y formacin de
conceptos. Es por ello que las tcnicas de AED pueden resultar de utilidad en el
estudio del aprendizaje automtico en IA (Hajeck e Ivaneck, 1982; Gebhardt,
1989) .
La utilidad de otras tcnicas estadsticas, en especial regresin, en la generacin de reglas ha sido explorada por Berzuini (1988) y Rowly ( 1988). Los
mtodos estadsticos tambin han sido aplicados en el estudio de la validez de
los grados de certeza asignados a las reglas que conforman los SE (O'Learly y
Kandelin, 1988).
De anloga importancia a!a aportacin de las tcnicas de clasificacin en IA
es la contribucin de ia teora de la decisin (Horvitz et al., 1988). Como es
sabido, la teora de la decisin se estudia frecuentemente como una tcnica que
forma parte de la Investigacin Operativa y no de la Estadstica. No es objeto de
este articulo discutir la delimitacin entre ambas disciplinas, pero, de acuerdo
con su ttulo, no hemos analizado aqu la interrelacin genrica Investigacin
Operativa-^nteligencia Artificial, ni la de ninguno de sus campos ms caractersticos, como seran !a teora de la decisin y las tcnicas de simulacin, con la IA (6).
7.
CONCLUSIONES
BIBLIOGRAFIA
APPEL, M. V.; ScoPP, T. (1989): Autornated Industry and Occupation Coding.
In DOSES (1989), 143-59.
BARCAROLI, G.; FORTUNATO, E. (1989a): Intelligent Interfaces between Users and
Statistical Databases. In DOSES ( 1989), 221-5.
BARCAROLf, G.; FORTUNATO, E. (1989b): Expert Systems for Defining Statistical
Samples. In DOSES ( 1989), 72-83.
BELL, E.; WATTS, P. (1988): Building a Statistical Knowledge Base: A Discussion
of the Approach used in THESEUS, an Statistical Expert System. In
COMPSTAT (1988), 143-148.
BERZUINI, C. (1988): Generating Rules by Means of Regression Analysis . I n
COMPSTAT ( 1988), 273-278.
BETHLEHEM, .I.; DENTENEER, D., et al. (1989): BLAISE, A New System for Computer
Assisted Survey Processing. In DOSES (1989), 101-16.
BLUM, R. L. (1982): Discovery and Representation of Causal Relationships from
a Large Time-Oriented Clinical Database: The RX project. Springer-Verlag,
NY.
I ti T AUItiTI('A ltit'AN^ ^L ^^
ESCA ( 1991): An Expert System approach for rapid estimates of Crop Acreages
using integrated image and GIS data. JRC, Ispra.
ESMA (1990): Expert System for Land Cover Discrimination and Mapping.
JRC, Ispra.
FESSEY, M. C. (1989): Feedstocks for statistical ES. In DOSES (1989), 169-77.
FISHER, D.; LANGLEY, P. (1986): Conceptual Clustering and Its Relation to Numerical
Taxonomy. In Gale (1986a}, 77-116.
HAVRANEK, I.; SovosKY, O. (1988): Using an Expert System Shell for settling
Statistical Package Parameters. Comp. Stat. Quarterly, 4, 3, 159-69.
HENRION, H., et al. {eds.) ( 1990): Uncertainty in AI, 5. North-Holland.
t^ti^TAUt^TI( A f^^tiPA!^(^1 A
-^?X
-^'^>
NELDER, J. A. (1988): How should the Statistical System and its user see Each
Other?. In COMPSTAT-88, 107-116.
NEUMANN, K. (1990): Co-Operative Processing - A Challenge for Statistics and
Database Management. In COMPSTAT-9o, 225-36.
NNCR (1991): Neural Network development for crop recognition integrated
image and GIS da#a. IRSA, Joint Research Centre, Ispra.
O'KEEFE, R. M. (1985): Expert Systems and O. R. - Mutual Benefits . J. Opl.
Res. Soc., 36, 2, 125-129.
O'LEARLY, E.; KANDELIN, N. A. (1988): Validating the Weights in Ruled-Based
ES: A Statistical Approach. lnt. J. of Expert Systems, 1, 3, 253-9.
-^ ^1)
AI, 4. North-Holland.
SHAFER, G. (1986): Probability Judgment in Artificial Intelligence. In Kanal and
Lemrner (198+6), 127-136.
SHAFER, G. (1987): Probability judgrnents in artificial intelligence and expert
systems . Statistical Science, 3, 3-16.
SPIEGELHALTER, D. J. { 1987a): Probabilistic ES in Medicine: Practical Issues in
Handling Uncertainty. Statistical Science, 3, 1, 3-44.
SPIEGELHALTER, D. J. (1987b): Synthesis of AI and Bayesian Methods in Medical
Expert Systems. In Phelps (1987), 169-175.