Академический Документы
Профессиональный Документы
Культура Документы
)
1/2011, pp. 1-29, ISSN: 2014-1408
Universitat de Barcelona
juan.aparicio@thera-clic
IRENE CASTELLN
Universitat de Barcelona
icastellon@ub.edu
MARTA COLL-FLORIT
La investigacin que actualmente se est llevando a cabo en el rea del Procesamiento del
Lenguaje Natural est todava lejos de conseguir niveles profundos de compresin del lenguaje.
Para poder construir sistemas inteligentes que traten con la representacin del significado, es
necesario en el mbito de las tecnologas del lenguaje, la creacin de recursos semnticos de
amplia cobertura. El objetivo principal de nuestra investigacin es el establecimiento de clases
para la representacin eventiva en un sistema computacional. La unidad bsica de
representacin es el rasgo, concretamente hemos considerado cuatro rasgos: dinamicidad,
telicidad, duracin y gradualidad. A partir de la combinacin de estos rasgos semnticos hemos
establecido un conjunto de clases eventivas que nos permite caracterizar el comportamiento
verbal. Para establecer estas clases hemos tenido en cuenta los posibles cambios eventivos que
puede sufrir una unidad verbal segn el contexto, representando as la composicionalidad del
significado eventivo. Por ello hemos considerado la prototipicidad de los sentidos verbales, y la
sensibilidad de las diferentes clases al contexto. El total de clases definidas se clasifica en dos
grupos, las clases simples: estados, procesos y puntos, cuya combinacin da lugar a las clases
complejas: culminaciones, realizaciones y graduales.
PALABRAS CLAVES: lingstica computacional, representacin semntica, estructura eventiva,
rasgos, clases, composicionalidad.
FEATURES AND CLASSES OF THE EVENT STRUCTURE: TOWARDS A COMPUTATIONAL
REPRESENTATION
ABSTRACT
Research currently being conducted in the area of Natural Language Processing is still far
from achieving deep levels of understanding of language. To build intelligent systems that deal
with the representation of meaning, it is necessary in the field of language technologies, to
create wide coverage semantic resources. The main goal of our research is the establishment of
classes for representing events in a computational system. The basic unit of representation is the
feature; we have considered four specific features: dynamism, telicity, duration and gradual
change. From the combination of these semantic features we have established a set of event
classes that allows us to characterize verbal behavior. To establish these classes we took into
account possible event changes that a verbal unit may suffer because of the context, thus
representing the compositionality of event meaning. Therefore we have considered the
prototypicity of verbal senses, and the sensitivity of the different classes to the context. The total
number of defined classes is classified into two groups, simple classes: states, processes and
points, the combination of which gives rise to the complex classes: culminations,
accomplishments and graduals.
KEYWORDS: computational linguistic, semantic representation, event structure, features,
classes, compositionality.
1. INTRODUCCIN
La situacin actual de la investigacin en el rea del Procesamiento del
Lenguaje Natural (PLN) est lejos de la comprensin completa del lenguaje.
Para llegar a construir sistemas inteligentes que puedan tratar con el significado
en el mbito de las tecnologas del lenguaje es necesaria la creacin de recursos
semnticos ricos. As, el uso de recursos semnticos de amplia cobertura se ha
convertido en una prctica habitual en los sistemas avanzados del PLN.
En los ltimos aos el tratamiento estadstico ha proporcionado modelos
superficiales que parecen no llegar a caracterizar profundamente las unidades y
producciones. Desde una perspectiva lingstica, si queremos llegar a niveles
profundos de comprensin, parece necesario el tratamiento de las unidades
lxicas y de las relaciones que se establecen entre ellas para obtener una
representacin del significado y, posteriormente, aplicar procesos de
razonamiento. Sin embargo, la construccin de bases lxicas ricas y de amplia
cobertura para el procesamiento semntico requiere de un gran esfuerzo, en
tiempo y en investigadores.
Una de las dificultades que presenta el tratamiento semntico del lenguaje
es el problema del establecimiento de clases, bsicamente por la naturaleza
gradual del significado y la alta incidencia del contexto en la interpretacin de
las unidades. Esto es una de las causas de, por ejemplo, el escaso acuerdo entre
jueces en la desambiguacin semntica, frente a otro tipo de tareas como puede
ser la anotacin morfosintctica. Ante esta realidad, podramos considerar que
la representacin del significado debera formalizarse mediante mecanismos
dinmicos, ms relacionados con el proceso que con la representacin, muchas
veces explicado por mecanismos de coercin (Pustejovsky 1995; De Swart 1998;
Michaelis 2004). As, se han establecido algunos mecanismos dinmicos de
creacin de lxico, como las reglas lxicas (Briscoe y Copestake 1992; Flickinger
1987) que permiten el cambio de clase de una unidad, o representaciones lxicas
en las que se incluye toda la informacin necesaria para la composicin con
otras unidades (Pustejovsky 1995; Jackendoff 1990). No obstante, en el momento
de enfrentar la tarea de establecer la representacin semntica en un sistema
computacional, es necesario establecer clases bsicas de significado que sean lo
ms unvocas posible, pero que den cuenta tambin de los diferentes usos
semnticos de las unidades y sobre las cuales sea posible aplicar mecanismos de
generacin de nuevos sentidos.
2. RASGOS
Una propiedad fundamental de la semntica verbal es el modo de accin o
estructura eventiva, esto es, la informacin relacionada con la estructura
temporal interna del evento descrito por un predicado verbal: si es esttico o
dinmico; si se extiende a lo largo de un periodo temporal o es puntual; si
implica una culminacin inherente o est exento de delimitacin; entre otras
distinciones. A partir de la combinacin de estos rasgos semnticos se pueden
establecer clases eventivas que permiten identificar patrones morfosintcticos
de los predicados verbales.
En concreto, siguiendo la propuesta de De Miguel (1999), los parmetros
semnticos que sustentan las diferentes clasificaciones eventivas se pueden
dividir en dos grandes grupos. Por un lado, los parmetros cualitativos se refieren
a la manera en que se desarrolla un evento en el tiempo. Los rasgos cualitativos
ms importantes son la dinamicidad y la telicidad. En este grupo tambin se
incluye la informacin sobre la fase temporal que focaliza el evento: si es
ingresivo, progresivo o resultativo. Por otro lado, los parmetros cuantitativos se
caracterizan por expresar la manera en que se distribuye un evento en el
sentido, todos los verbos habrn de ser (ms o menos) durativos; eso es lo que he
intentado recoger al proponer el trmino 'escasamente durativo'. 1
3. CLASES
Uno de los autores de referencia ineludible en el estudio de la estructura
eventiva es Vendler (1957), autor que establece una tipologa eventiva
cuatripartita de los verbos que tuvo un gran impacto en los trabajos posteriores
sobre aspecto. Vendler propone cuatro clases aspectuales de los predicados
verbales: estados, actividades, realizaciones y logros. En concreto, el autor
establece una distincin genrica entre clases que implican progresin
temporal, esto es, sucesin de diferentes fases temporales (actividades y
realizaciones), y clases que estn formadas por una sola fase temporal (estados
y logros). A su vez, establece subclasificaciones, en funcin de la telicidad y la
duracin del evento, tal como se muestra en la Tabla 1.
Ausencia de lmite temporal: Actividades
Con
temporal
progresin
Presencia
Realizaciones
de
lmite
temporal:
Eventos
Designan periodos: Estados
Sin progresin temporal
Designan instantes: Logros
Tabla 1. Clases aspectuales de Vendler (1957)
Estado:
predicado (x)
Logro:
BECOME predicado (x)
Actividad:
DO (x, *predicado (X)+)
Realizacin:
(en que es normalmente una
actividad y un logro)
Tabla 2: Estructuras lgicas de Dowty (1979)
b. Proceso
P
e1en
c.Transicin
T
P
proceso
punto estado
Culminacin
Realizacin
Gradual
C = Pu + E
R = Pr + C [Pu + E]
G = C[Pu + E]1 ...C[Pu + E]n
A su vez, entendemos que estos grupos eventivos son clases genricas que
se estructuran internamente en diferentes subclases. A continuacin
presentamos detalladamente la caracterizacin y el modelo de representacin
de cada una de estas clases. El sistema de representacin que utilizaremos est
basado en Croft (2008). Segn este autor, se hace necesario un sistema de
representacin bidimensional que sea capaz de definir las propiedades
Esta clase eventiva equivale a los llamados verbos semelfactivos (Smith, 1991). No obstante,
en nuestro trabajo hemos optado por usar la terminologa de Moens y Steedman (1988).
4 Esta clase corresponde en gran medida a los logros tradicionales. Sin embargo, hemos
optado por utilizar la terminologa de Moens y Steedman (1988).
3
10
11
Procesos
12
T
Figura 4: Representacin de un proceso
13
Puntos
Punto
Juan tosi
Punto
Juan tosi
(tosi)
(no tosi)
C
T
T
Figura 5. Representacin de un punto
14
C
Iteracin de puntos
La nia est golpeando la puerta
T
Figura 7. Iteracin de puntos
T
Figura 8. Proceso por iteracin
15
Con verbos como golpear se pueden contar los eventos simples que
conforman el proceso, mientras que con verbos como correr, slo se puede
contar la extensin completa del evento. Cules son, entonces, las diferencias
entre un proceso expresado por verbos del tipo correr y un proceso expresado
por golpear?
Dowty (1979), refirindose a los procesos prototpicos, considera que
todos los procesos est{n relacionados con un evento de proceso mnimo.
Tambin nos dice Dowty, que normalmente no es posible definir cules son los
eventos mnimos que conforman un proceso, ahora bien, estos eventos mnimos
se extienden en el tiempo y no son puntuales. De esta manera, un proceso
prototpico como correr progresa en el tiempo (es durativo) y en el cambio
(implica cambios cualitativos que se dirigen hacia un cambio de estado).
En el caso de los procesos como golpear, la iteracin de puntos (a partir de
la forma progresiva o de adverbios durativos como 'durante X tiempo') implica
una interpretacin cercana a la de un proceso, es decir, a pesar de que no
progresan en el cambio (cosa que hacen los procesos prototpicos), s que
progresan en el tiempo (concatenacin de diferentes eventos instantneos que
avanzan en el tiempo). En este caso, a diferencia de los procesos prototpicos,
los eventos mnimos que conforman el proceso iterativo estn lexicalizados: el
propio evento simple. Croft (2009) llama a este tipo de procesos undirected
activities ya que no se dirigen hacia un cambio de estado sino que cada vez que
avanzan en el tiempo vuelven a su estado inicial.
16
Proceso prototpico
Mara estaba corriendo
Culminaciones
17
that distinguishes certain verbs from others *<+. Given these considerations I would
conclude that there is no ground for distinguishing Achievement terms from
Accomplishment terms. (Verkuyl 1989: 58)
Otros autores como Bertinetto (1986), Smith (1991), Croft (1998, 2009) o
Rothstein (2004, 2008b), no aceptan la va reduccionista de unificar logros y
realizaciones, sino que toman el camino contrario e identifican ms de una clase
de logros: logros progresivos o runup achievements's y logros puntuales. Los logros
progresivos admiten un estadio preparatorio que se puede medir a travs de un
adverbial temporal como 'en X tiempo' (morir, alcanzar la meta, desmayarse, caer
dormido, etc.), mientras que los logros puntuales (caer, explotar, etc.) son
consistentemente menos durativos. Otra autora que no acepta la aproximacin
reduccionista es De Miguel (2004) que considera dos grandes grupos de logros:
logros simples y logros complejos (seguidos de un estado o un proceso).
Queremos hacer notar que la aproximacin reduccionista, al no tener en
cuenta la diferencia entre realizaciones y logros, pierde la evidencia emprica
que aporta la compatibilidad adverbial, en particular, la interpretacin que
aporta el adverbial temporal 'durante X tiempo'. La interpretacin de este
adverbial es muy diferente si se combina con un logro o con una realizacin.
Con una realizacin (5), 'durante X tiempo' delimita una parte de la situacin
transformndola en un proceso. Por otro lado, los logros o bien no admiten esta
construccin (6) o, si la admiten, focalizan la consecuencia de un logro, esto es,
un estado (7) o un proceso (8).
5.
6.
7.
8.
18
C
Culminacin
La puerta se abri
Culminacin
El agua hirvi
3.5.
Realizaciones
19
Accomplishments have successive stages in which the process advances to its natural
final endpoint. They result in a new state. When a process with a natural final endpoint
reaches its outcome, the event is completed and cannot continue.
C
Realizacin
Me com una manzana
T
Figura 12. Representacin de una realizacin
20
Graduales
21
22
Con este anlisis slo asignamos un valor a enfriarse, el de estar cada vez m{s
fro.
Veamos ahora como a partir de esta estructura se pueden derivar el resto
de interpretaciones que tradicionalmente se asigna a los graduales. Enfriarse
tambin puede denotar un conjunto de cambios, donde el cambio es de una
situacin en la que a x se le asigna un valor d en la escala del fro a una situacin
en la que a x se le asigna un valor ms bajo que d. Este conjunto de cambios es
conceptualizado como instantneo (inherentemente no tiene extensin), as el
ejemplo (17) es perfectamente compatible con esta interpretacin.
17. Cuando ech el hielo, el lquido se enfri al instante (aunque no mucho). 8
C0
T
Figura 14: Representacin de enfriarse como culminacin
Tal como podemos ver en la Figura 14, lo que se focaliza en este caso no es
la extensin del cambio, sino lo que es caracterstico de estos eventos: el cambio
de valores en una escala. Si tomamos un evento e el valor asignado a x en la
escala es el punto de partida para otro evento de cambio e', donde e y e' no son
temporalmente adyacentes, sino que se solapan, es decir el momento final de (e)
= momento inicial de (e').
En otras ocasiones, enfriarse puede aparecer con el progresivo o con
modificadores atlicos. En estos casos, como vemos en los ejemplos (18-19), se
implica la paradoja del imperfectivo. (18) implica que la sopa se ha enfriado
(algo) y (19) implica que la sopa se enfri durante un intervalo de tres horas y
durante todos los subintervalos que componen esas tres horas.
18. La sopa se estaba enfriando
19. La sopa se enfri durante tres horas
23
C1
Proceso gradual
La sopa se enfri durante 3 horas
T
C0
24
C0
T
Figura 16. Representacin de enfriarse como realizacin
25
una sntesis de las clases generales propuestas, segn los rasgos que cumplen y
algunos ejemplos.
Dinamicidad Telicidad Duracin Gradual Ejemplos
Estado
[E]
Proceso
+
[Pr]
Punto
+
[Pu]
Culminacin +
Pu + E / Pr
Realizacin
+
Pr + C [Pu + E]
Gradual
+
C[Pu + E]1<
C[Pu + E]n
Actualmente estamos definiendo estas clases junto con sus rasgos en una
gramtica Head-Driven Phrase Structure Grammar para el espaol, la Spanish
Resource Grammar (Marimon 2010). Este sistema proporciona diversas
caractersticas que son tiles para implementar nuestra propuesta: (a) se trata
de un sistema de tipos jerarquizado lo cual permite la infraespecificacin de
propiedades, caracterstica muy til para la definicin de las clases flexibles; (b)
adems la Spanish Resource Grammar proporciona mecanismos de herencia lo
cual posibilita el establecimiento de la jerarqua de clases aqu presentada; (c)
por ltimo, esta gramtica dispone de mecanismos compositivos para probar
cmo el contexto perfila las clases verbales, obteniendo de esta forma una
interpretacin oracional a partir de las especificaciones lxicas. El objeto de
representacin es la regla sintagmtica que en la Head-Driven Phrase Structure
Grammar es una estructura de rasgos que combina la informacin de los
constituyentes. En nuestro caso, la actuacin se realizar sobre la subestructura
semntica y en concreto, se modificarn los valores eventivos dependiendo de
las condiciones contextuales. Este sistema nos permitir probar que la
clasificacin presentada es explicativa y predictiva mediante su implementacin
computacional.
El trabajo futuro plantea diversos frentes, en primer lugar, queremos
profundizar en la composicionalidad del significado eventivo, para ello estamos
estudiando los mecanismos de coercin y las perfrasis verbales que inciden
sobre la estructura eventiva (<empezar a + Vinf>, <continuar + V-ndo>, <acabar de
+ Vinf>, etc.). En segundo lugar, pretendemos aplicar esta clasificacin a dos
recursos, por un lado, vamos a continuar la implementacin en la Spanish
Resource Grammar, como hemos dicho esto nos permitir demostrar que
26
AGRADECIMIENTOS
Esta investigacin se ha desarrollado en el marco del proyecto KNOW2
financiado por el Ministerio de Ciencia e Innovacin. TIN2009-14715-C0403.
BIBLIOGRAFA
ABUSCH, D. (1985), On Verbs and Times, Tesis doctoral, Amherst, University of
Massachussets.
_________ (1986), "Verbs of change, causation and time", Technical Report CSLI-86-50,
Center for the Study of Language and Information, Standford University.
ALTURO, N. (2001), "Les activitats no sn accions (situacions i tipus de text en angls i
en catal)", Caplletra, 30, 111-134.
ATSERIAS, J., VILLAREJO, L., RIGAU, G., AGIRRE, E., CARROLL, J., MAGNINI, B. yVOSSEN, P.
(2004), "The Meaning Multilingual Central Repository", en Proceedings of the
Second International Global WordNet Conference (GWC04), Brno, Czech Republic,
pp. 23-30.
BACH, E. (1981), "The Algebra of Events", Linguistics and Philosophy 9, 5-16.
BENNET, W.S., HERLICK, T., HOYT, K., LIRO, J. y SANTISTEBAN, A. (1990), "Toward a
Computational Model of Aspect and Verb Semantics", Machine Translation, 4, 217250.
BERTINETTO, P.M. (1986), Tempo, Aspetto e Azione nel verbo italiano, Il sistema
dell'indicativo, Firenze, Accademia della CRusca.
BERTINETTO, P.M. y SQUARTINI, M. (1995), "An Attempt at Defining the Class of
'Gradual Conmpletion' Verbs", en Temporal Reference Aspect and Actionality, 1:
Semantic and Syntactic Perspectives, Bertinetto P.M, Biachi V., Higginbotham J. y
Squartini M. (eds.), Torino, Rosenberg and Sellier, pp. 11-26.
BINNICK, R.I. (1991), Time and the Verb. A guide to Tense and Aspect, Oxford, Oxford
University Press.
BRISCOE, R. y COPETAKE, A. (1991), "Sense extensions as Lexical Rules", en Proceedings of
the IJCAI Workshop on Computational Approaches to Non-Literal Language, Fass D.,
Hinkelman E. y Martin J. (eds.), Sydney, pp.12-20.
CARLSON, G.N. (1977), Reference to Kinds in English, Tesis doctoral, Amherst, University
of Massachussets.
27
CARLSON, L. (1981), "Aspect and quantification", en Syntax and Semantics. Tense and
Aspect, Tedeschi, P.J y Zaenen, A. (eds.), pp. 31-64.
COLL-FLORIT, M. (2009), La modalitat de lacci. Anlisi emprica, reformulaci terica i
representaci computacional, Tesis doctoral, Barcelona, IN3/Universitat Oberta de
Catalunya.
_________ (2011), "Aproximacin emprica a los modos de accin del verbo: un estudio
basado en corpus", Revista Signos: Estudios de Lingstica, 77. [en prensa]
COLL- FLORIT, M., APARICIO, J. y CASTELLON, I. (2010), "Aproximacin emprica a la
gradacin del Aktionsart", en Actas del IX Congreso Internacional de Lingstica
General, Valladolid, Universidad de Valladolid. [en prensa]
COLL-FLORIT, M. y GENNARI, S. (2011), "Time in language: Event duration in language
comprehension", Cognitive Psychology, 62, 41-79.
COMRIE, B. (1976), Aspect, Cambridge, Cambridge University Press.
COPESTAKE, A. (2002), Implementing Typed Feature Structure Grammars, Standford, CSLI
Publications.
CROFT, W. (1998), "Event structure in argument linking", en The projection of arguments:
lexical and compositional factors, Butt, M. y Geuder, W. (eds.), Standford, Centre for
the Study of Language and Information, pp. 1-43.
_________ (2008), "Aspectual and causal structure in event representations", en Routes
to language development. Studies in honor of Melissa Bowerman, Gathercole, V. (ed.),
Mahwah, Lawrence Erlbaum Associates, pp.139-166.
DE MIGUEL, E. (1999), "El aspecto lxico", en I. Bosque y V. Demonte (ed.), Gramtica
descriptiva de la lengua espaola, Bosque, I. y Demonte, V. (eds.), Madrid, Espasa
Calpe, pp. 2977-3060.
_________ (2004), "Qu significan aspectualmente algunos verbos y qu pueden llegar a
significar", en El verbo, nmero monogrfico de ELUA, Cifuentes, J.L. y Marimn,
C. (eds.), Alacant, Universitat dAlacant, pp. 167-206.
DEPRAETERE, I. (1995). On the necessity of distinguishing between (un)boundedness
and (a)telicity, Linguistics and Philosophy, 18, 1-19.
DE SWART, H. (1998), "Aspect shift and coercion", Natural Language and Lingusitic
Theory, 16, 347-385.
DOWTY, D. (1979), Word Meaning and Montague Grammar: The Semantics of Verbs and
Times in Generative Semantics and in Montagues PTQ, Dordrecht, Reidel.
_________ (1991), "Thematic proto-roles and argument selection", Language 67, 547-619.
ENGELBERG, S. (1999), "The magic of the moment: What It Means to Be a Punctual
Verb", en Proceedings of the Twenty-Fifth Annual Meeting of the Berkeley Linguistic
Society, Chang, S., Liav, L. y Ruppenhofer, J. (eds), Berkeley, Berkeley Linguistic
Society, pp. 109-121.
FLICKINGER, D. (1987), Lexical Rules in the Hierarchical Lexicon, Tesis Doctoral, Standford,
Standford University.
GRIMSHAW, J. (1990), Argument structure, Cambridge, The MIT Press.
HAVU, J. (1997), La constitucin nominal del sintagma verbal en el espaol moderno, Helsinki,
Academia Scientarium Fennica.
HAY, L. (1998), "The Non-Uniformity of Degree Achievements", ponencia presentada
en el 72 Annual Meeting of the LSA, New York.
HAY, J., KENNEDY, C. y LEVIN, B. (1999), "Scalar Structure Underlies Telicity in 'Degree
Achievements'", SALT9, 127-144.
28
29
Standford, Center for the Study of Language and Information Publications, pp.
96-134.
_________ (2000), "Classifying Single Argument Verbs", en Lexical Specification and
Insertion, Coopmans, P., Everaert, M. y Grimshaw, J. (eds.), Amsterdam, John
Benjamins, pp. 269-304.
ROBINSON, M. (1994), "States, Aspect and Complex Argument Structures", en
Proceedings of the Edinburgh Linguistic Departament Conference 94, Edinburgh, pp.
183-193.
ROTHSTEIN, S. (2004), Structuring Events: A Study in the Semantics of Lexical Aspect,
Oxford, Blackwell.
_________ (2008a), "Two puzzles for a theory of lexical aspect: the case of semelfactives
and degree adverbials", en Event Structures in Linguistic Form and Interpretation,
Dlling, J., Heyde-Zybatow, T. y Shaefer, M. (eds.), Berlin, Mouton De Gruyter,
pp. 175-198.
_________ (2008b), "Telicity and atomicity", Theoretical and Crosslinguistic Approaches to
the Semantics of Aspect, Rothstein, S. (ed.), Amsterdam, John Benjamins, pp. 43-78.
SMITH, C. (1991), The Parameter of Aspect, Dordrecht, Kluwer.
TALMY, L. (1985), "Lexicalization Patterns: Semantic Structure in Lexical Forms", en
Language Typology and Syntactic Description: Grammatical Categories and the Lexicon,
Shopen, T. (ed.), Cambridge, Cambridge University Press, pp. 57-149.
_________ (2000), Towards a Cognitive Semantics I: Concept Structuring Systems,
Cambridge, MIT Press.
TENNY, C. (1994), Aspectual Roles and The Syntax-Semantics Interface, Dordrecht, Kluwer.
VENDLER, Z. (1957), "Verbs and Times", The Philosophical Review LXVI, 143-160.
VERKUYL, H.J. (1989), "Aspectual Classes and Aspectual Composition", Linguistics and
Philosophy, 12, 39-64.
_________ (1993), A Theory of Aspectuality: The Interaction between Temporal and Atemporal
Structure, Cambridge, Cambridge University Press.
_________ (2005), "Aspectual composition: surveying the ingredients", en Perspectives
on Aspect, Verkuyl, V., de Swart, H. y van Hout, A. (eds.), Dordrecht, Springer,
pp. 517-552.