Академический Документы
Профессиональный Документы
Культура Документы
0.1. Resumen
The documentary form of content is presented as a new theoretical development inside the extended Documentary Content Processing theory, for which a
model is established based on the textual studies of genre. Methodologically, the
concept of textual structure, or formal scheme of content, is stressed and analyzed
through the identification of rhetorical-functional categories and the detection of
rhetorical markers with an important function in the theory of informative releScire. 10 : 1 (en.-jun. 2004) 31-50.
32
Desde esta perspectiva retrico-funcional, concebimos el texto como un tejido que presenta una estructura orgnica a travs de la cual se articula y distribuye
la informacin. Esta disposicin formal (o esquema textual caracterstico) difiere
segn de qu tipo de documento se trate, del propsito de ste y de la situacin
comunicativa. Cabe suponer, que esta heterogenidad estructural del contenido
informativo presenta caractersticas propias, entendidas bajo la nocin de gnero,
que han de tener su reflejo en metodologas especficas y tcnicas diferenciadas
de tratamiento documental de contenido (TDC). Ahora bien, desde la perspectiva
tpica del anlisis documental de contenido (ADC) no se ve representada dicha
estructura, y este estudio pretende ser una intervencin a favor de la consideracin del aspecto formal del contenido del mensaje informativo, defendiendo un
nuevo estatuto terico y metodolgico.
Teniendo en cuenta todo lo dicho, una vez centrada la atencin en esta nueva
dimensin retrica, y tras su conceptualizacin, nos aproximaremos a un nuevo
Scire. 10 : 1 (en.-jun. 2004) 31-50.
33
Una de las razones que han impulsado nuestra inquietud por la investigacin
documental de los aspectos retricos del contenido es el necesario conocimiento
que hemos de tener, como analistas de contenido, de la materia prima con la que
operamos: el texto; pues preferentemente procesamos textos, informacin textual,
aunque el ADC se abre a otros sistemas semiticos como el icnico, el auditivo,
multimedia, etc. En este sentido, los textos son unidades lingstico-comunicativas con determinadas caractersticas textuales, que han de conocerse para dominar el espacio textual y dirigir los estudios de bsqueda textual estructurada.
Consecuentemente, es necesario un dominio de las representaciones textuales y, mxime, si nuestro propsito para el tratamiento discursivo es, hacindonos
eco de la alegora otletiana (1), aplicar procedimientos metalrgicos de procesamiento documental. Con estas tcnicas, ya no extraemos minerales y refinamos
metales sino segmentos textuales relevantes, desde criterios depurados de estructuracin textual. Ello nos lleva a la necesidad de adentrarnos en el entramando
textual, y desmenuzarlo, cuidadosamente, a fin de reconocer los distintos aspectos que lo conforman. Bucearemos, as, en el conocimiento de las caractersticas
textuales, los procedimientos lingstico-discursivos y las relaciones retricas.
De aqu la necesidad de expandir cualitativamente el marco conceptual dentro del
TDC, a partir de la aplicacin de modelos lingsticos, readaptados convenientemente a los intereses documentales, provenientes de campos como la lingstica
textual o el anlisis del discurso. Desde este marco general, intentaremos analizar
y dar respuesta a dos problemas tericos de considerable importancia y proyeccin en el campo del procesamiento textual automtico: cmo est organizada
la representacin del conocimiento en los documentos?; y cmo se distribuyen
en ellos las partes del conocimiento?
Otra de las motivaciones que nos dirigi la atencin hacia el tema que nos
ocupa fue cuestionarnos si los modelos existentes y las tcnicas actuales de ADC
daban respuesta a las necesidades de procesamiento informativo, creadas como
Scire. 10 : 1 (en.-jun. 2004) 31-50.
34
35
Esta investigacin supone una llamada de atencin sobre los aspectos estructurales del contenido, en las Ciencias de la Documentacin, desde el reconocimiento de una nueva variante: la Morfologa Documental del Contenido (MDC).
Hemos optado por esta expresin sintagmtica, como denominacin que refleja
el espacio de significacin que pretendemos dar a los aspectos formales de contenido. Definimos, pues, la MDC como la disciplina encargada del estudio de la
Forma Documental del Contenido (FDC). A ella incumbir el establecimiento de
los principios generales que rigen la estructura interna de los mensajes informativos y la delimitacin de la naturaleza, relaciones y funciones de los diferentes
tipos de constituyentes que pueden ser parte de dicha estructura. Dicha disciplina estara incluida dentro de una rama ms amplia: la textologa documental
(Izquierdo Alonso, 1999a).
3. Los ahormantes del contenido textual: gnero, tipo y estructura
textual
36
37
38
Fundamentado el contexto terico en torno a los aspectos formales o retricos del contenido, desarrollaremos un marco analtico que toma como referencia
la perspectiva sistmico-funcional de anlisis textual. Dicho modelo se aplicar
al anlisis de estructuras (formas) retricas de un tipo documental especfico: el
artculo cientfico. As, a partir de un anlisis de corpus, se diseara una gramtica
textual basada en de la deteccin de una serie de constituyentes (categoras morfofuncionales) y en la proyeccin de reglas formales. Finalmente, este modelo
formal encontrar su representacin en una ontologa, en la que se representar
jerarquizada la estructura retrica del documento-tipo analizado.
5.1. Precedentes de nuestro modelo: enfoques textuales y recuperacin de
informacin
Sin nimo de ser exhaustivos, vamos a mostrar una breve relacin de distintas propuestas sobre representacin del conocimiento y recuperacin de informacin, desde los avances conseguidos en las teoras lingsticas y en el dominio
de la Ingeniera informtica. As pues, podemos aproximarnos al estudio del
procesamiento informativo a partir de distintos objetivos:
El funcionamiento de la coherencia textual en el marco de investigaciones
sobre traduccin automtica, planificacin textual y elaboracin de resmenes (Marcu, 1998, 2000; Hovy, 1993, 1995, etc.).
La bsqueda de parmetros que sustenten juicios evaluativos sobre los
procesos de calidad en el resumen y en la indizacin: revisin de las condiciones de textualidad (Pinto, 1994; Moreiro, 2002)).
39
40
41
42
Contenido
Expresin
Sustancia
Forma
Forma
Sustancia
Identificaremos, pues, una sustancia y una forma de la expresin, y una sustancia y una forma del contenido. En el estrato semntico-cognitivo, la sustancia
del contenido textual (SC) est constituida por todo el conjunto de ideas, hechos,
pensamientos, etc. pertenecientes al continuum del espectro semntico-cognitivo
(el universo ideolgico). Mediante la Forma del contenido (FC), y segn la
intencin del autor, esa sustancia se materializa en una estructura lgico-retrica
definida, en unos modelos de organizacin textual, y el texto adquiere un orden y
disposicin caractersticos. A su vez, en el estrato grfico lingstico, en el plano
de la expresin, el conjunto heterogneo de grafas de un texto (letras, esquemas,
ilustraciones, notaciones, grficos) que constituyen la sustancia significante
cristalizan en una estructura formal precisa, que adquiere una determinada configuracin o disposicin grfica en torno a una pgina o cualquier otra superficie
suscriptora. Hecha esta distincin, nos situamos en el estudio del plano del contenido, ncleo y objeto propio del TDC, distinguiendo en l dos unidades interdependientes de anlisis: a) la sustancia del contenido, y b) la forma del contenido.
5.3.2. El anlisis sistmico de gnero
El otro pilar sobre el que se asienta nuestro modelo de arqueologa textual es
el concepto de gnero (8). Autores como Bathia (1993), Swales (1981,1990), o
Paltridge (1997), consideran los gneros como tipos de textos (orales y escritos)
Scire. 10 : 1 (en.-jun. 2004) 31-50.
43
definidos por sus propiedades o caractersticas formales, as como por sus propsitos o intenciones comunicativas, dentro de un contexto social. Esta perspectiva de
gnero incluye una dimensin pragmtica y sociocultural en las investigaciones
sobre caracterizacin estructural de los textos y ha asumido el modelo de anlisis
contextual de la escuela de Sydney. Lo ms destacable de la teora del anlisis de
gnero es que ha asentado las bases para el anlisis estructural desde el punto de
vista pragmtico, delimitando una estructuracin retrica de los textos en fases
(moves) y pasos (steps) atendiendo a las funciones y subfunciones comunicativas
concretas de gnero. Del mimo modo, supone un modelo sociopragmtico de
anlisis textual basado en la interaccin textual (Izquierdo Alonso, 2003a).
Nuestra investigacin es eminentemente pragmtico-discursiva. Como mostraremos en el siguiente epgrafe, partimos de un corpus textual especializado
y analizamos sus caractersticas propias y su configuracin intratextual, con el
objetivo de obtener su estructura. Para ello, atendemos preferentemente a la
relacin que existe entre los propsitos comunicativos e interactivos de cada
secuencia textual y a los medios que se ponen en juego para realizarlos.
5.4. Propuesta de anlisis sistmico de un gnero especfico: el artculo
cientfico (AC)
Una vez definida nuestra orientacin metodolgico-funcional, y delimitados los objetivos del modelo pragmtico de anlisis textual (Izquierdo Alonso,
2003b, p. 749-750), intentamos aplicarlo a un gnero concreto, el cientfico-acadmico. Nos centramos en un tipo especfico, el artculo cientfico, y analizamos
su organizacin retrico-discursiva a partir de un corpus de veinte textos (6), pertenecientes al mbito de la Psicologa experimental. En nuestro anlisis, partimos
del modelo esquemtico de Swales (1990) para la divisin retrica del artculo
cientfico. El autor concibe una estructura argumentativa, fija y obligatoria, fundamentada en cuatro grandes secciones (MIRAD) que contribuyen al desarrollo
lgico del artculo. Asimismo, existen otra serie de elementos opcionales, como
constituyentes inmediatos de cada seccin: los moves y submoves. Dichas variables desempean una serie de funciones discursivas especficas que completan
el valor informativo de cada seccin textual y contribuyen a la realizacin global
del objetivo comunicativo de este tipo textual: la comunicacin-informe de una
actividad investigadora.
As pues, en nuestro esquema de organizacin discursiva, distinguimos dos
tipos de unidades (actos textuales) y una serie de dispositivos retrico-lingsticos
que permiten la realizacin y el reconocimiento posterior de aquellos (Izquierdo
Alonso, 2002): una serie de macroactos textuales o macrocategoras: (secciones
textuales o zonas primarias; los movimientos y submovimientos retricos (categoras retricas o morfofuncionales) como microactos o secuencias textuales; y
Scire. 10 : 1 (en.-jun. 2004) 31-50.
44
45
Respecto a la metodologa de seleccin, asignacin y validacin de marcadores, hubo una primera fase de extraccin manual de frases significativas que
sirvieron para identificar las categoras retrico-funcionales detectadas a priori:
mtodo de seleccin por asignacin a una categora retrico-funcional. A partir
de esta seleccin contamos con una muestra representativa de marcadores para
ser asignados a las categoras. En una segunda fase, se produjo la asignacin y
validacin de marcadores (candidatos y/o efectivos) a categoras terminales de
un modo controlado por un procedimiento automtico (componente Remarcat del
mdulo de Gestin Ontologas formales (ONTOFORM).
Tras el anlisis de estos marcadores o frmulas, como expresiones compuestas tomadas literalmente del corpus textual, establecimos una distincin entre
los macadores continuos aquellos cuyos componentes (palabras) no tienen
ningn vaco o variable: en la lnea de, y que podemos clasificar en continuos
literales (puros o lematizados) o con variables en cuanto a la forma ordinal y
marcadores discontinuos aquellos en los que localizamos vacos o variables:
por ... entendemos, etc. Actualmente, nos hallamos en la fase de desarrollo
expansivo del tratamiento de los marcadores; que sin duda requerira un estudio
ms profundo dentro del mbito de la Lingstica computacional. Dependiendo
del nivel de detalle de anlisis en los marcadores, podremos lograr una red de
sustitucin funcional y sintctica que pueda incorporarse a un sistema experto
de conocimiento.
6. Un escenario de aplicacin: GECONTEXT como entorno de
gestin de la forma documental del contenido.
Finalmente, no queremos cerrar este espacio sin aludir, aunque sea objeto
ya de otro discurso, al modelo de aplicacin que justifica y corrobora la validez
general del modelo terico-metodolgico aqu presentado. As pues, hemos
desarrollado una serie de instrumentos de anlisis automtico creados ad hoc,
Scire. 10 : 1 (en.-jun. 2004) 31-50.
46
Para concluir este trabajo, queremos hacer una serie de reflexiones generales
que intentan aunar los principios tericos, base epistemolgica de nuestro modelo, con la propuesta metodolgica de anlisis funcional, como marco operativo
de aqulla. As pues, defendemos que este nuevo enfoque formal, desde la ptica de la glosemtica danesa y las actuales tendencias de anlisis del discurso,
enriquece y abre una nueva va dentro de la Lingstica Documental capaz de
explicar muchos fenmenos referidos al contenido. Supone ampliar el campo del
tratamiento documental de contenido a la consideracin de la forma documental
del contenido y adecuar a ello los instrumentos y las tcnicas de anlisis a ello.
Se plantea, as, la necesidad de establecer una tipologa documental atendiendo
al contenido, potenciando el estudio de los distintos gneros, en razn de
su estructura discursiva. Este espacio descriptivo y terico tiene una aplicacin
prctica concreta al trasladarse a un anlisis de corpus de textos de especialidad,
aplicando los principios de la teora estndar de las gramticas generativas,
gracias a la definicin de una base de categoras morfofuncionales y una serie
de reglas de proyeccin. Dicha gramtica de relaciones retricas encuentra su
espacio de representacin en la implementacin de una ontologa formal para un
gnero cientfico especfico: el artculo de investigacin.
Considerado desde esta perspectiva funcional, el anlisis de gnero supone un avance ms dentro de la investigacin sobre la Forma Documental del
Scire. 10 : 1 (en.-jun. 2004) 31-50.
47
Contenido (FDC), una orientacin entre las posibles perspectivas de anlisis que
se abren, creemos, dentro de este prometedor campo de la morfologa documental
del contenido (MDC).
8. Notas
(1) Otlet (1934a, 373-373 bis, n 411.2), citado por el profesor Izquierdo Arroyo (1995:
35) refirindose al concepto y propsitos de la Documentacin, hace la siguiente
reflexin sobre el proceso de la metalurgia documental: Es preciso poner orden
en la montaas de papeles y documentos: es preciso crear una metalurgia del papel,
hacer galeras de aproximacin hacia esas montaas, cuyos flancos encierran tesoros;
extraer de ah el buen mineral y separar despus el metal puro de su ganga ().
(2) Para la concepcin pragmtica del discurso documental: vid. el modelo semitico
documental del prof. Izquierdo Arroyo (1993). Esta dimensin pragmtica del TDC,
desde el condicionante retrico-comunicativo, se completa con la visin de Izquierdo
Alonso (1999b, 2000).
(3) As, dentro de un dominio cientfico las funciones pueden ser varias: difundir ampliamente un nuevo hallazgo ante la comunidad cientfica, transmitir el conjunto de saberes propios de una disciplina, divulgar unos conocimientos bsicos ante un pblico de
carcter general, etc. Por su parte, en una situacin o contexto tcnico, por ejemplo,
dentro del dominio industrial, las funciones a las que ha de responder un texto pueden
ir desde asegurar los derechos jurdicos frente a posibles plagios, caso de las patentes,
hasta incitar a la compra de un producto si se trata de textos publicitarios.
(4) El trmino forma, y el concepto que ste entraa, es un tema de estudio para diferentes disciplinas que consideran el espacio semitico-textual como marco de actuacin. Cada una de stas lo ha adaptado a sus necesidades y, lo que es ms importante,
lo ha dotado de connotaciones especficas, sin quizs molestarse en un anlisis interdisciplinar detallado del trmino y de su significacin. As, reas como la Psicologa
cognitiva, la Inteligencia artificial, aprovechando los desarrollos de aqulla, la
Lingstica textual o la Informtica, entre otras, han definido el concepto de forma
bajo los trminos de superestructura, superestructura esquemtica, esquemas de
dominio, estructura retrica, marco (frame), etiqueta, organizacin lgicodiscursiva, etc. El resultado lgico es un gran variedad de trminos, que bien pueden
no significar lo mismo, y que, sin embargo, dan buena cuenta de la confusin terminolgica al respecto. Ante la sealada falta de comparabilidad de conceptos tericos
y operacionales, proponemos una acepcin del concepto de forma, desde la aplicacin
documental de los presupuestos hjelmslevianos, que puede constituir un primer paso
para un trabajo interdisciplinar ms integrado y acumulativo en este dominio de los
espacios formales de representacin estructural.
(5) Sobre el macroprocreso del TDC como acto comunicativo de reconduccin del discurso Vid. Izquierdo Arroyo (1993, p. 206).
(6) Tomamos el concepto de anlisis de corpus en el sentido metodolgico del valor
que tiene el conjunto de los textos codificados como materia prima y banco de pruebas
para la confirmacin de nuestra hiptesis de estructuracin textual. Del mismo modo,
Scire. 10 : 1 (en.-jun. 2004) 31-50.
48
9. Referencias
49
50