Вы находитесь на странице: 1из 3

CLASIFICACIN DE SUSTANTIVS PORLAS ESTRUCTURAS ARGUMENTALES

DEL PREDICADO.

INTRODUCCIN
El artculo trata sobre la descripcin de un mtodo para determinar la similitud de sustantivos
(en ingls), a partir de una mtrica de derivacin de la distribucin de sujeto, verbo y objeto
en un corpus de texto. (Es un mtodo distribucional).
En esta investigacin se hizo una clasificacin distribucional automtica de palabras en
ingls, se propuso una medida particular de similitud que es una funcin de la informacin
mutua estimada a partir del texto. El corpus son seis millones de palabras de noticias de
Associated Press. La clasificacin de sustantivos se desarroll de acuerdo a los predicados
con los que aparecen. Esta medida de similitud se basa en sintaxis pero muestra relaciones
semnticas justificables.
Se hacen restricciones de qu palabras pueden aparecer en la misma construccin. Por
ejemplo la restriccin sobre qu verbos pueden aparecer con determinados sustantivos; por
ejemplo, el vino puede aparecer con los verbos beber, producir y vender, pero no puede
aparecer con el verbo podar. Por lo tanto, cada sustantivo puede caracterizarse de acuerdo a
los verbos con los que se acompaa. Los sustantivos pueden agruparse de acuerdo a los
contextos en que aparecen, si estos son similares.
Uno de los autores en los que se basa la investigacin es Hams, el cul dice: "el significado
de las entidades y el significado de las relaciones gramaticales entre ellas est relacionado
con la restriccin de combinaciones de estas entidades con respecto a otras entidades"
ANLISIS
Se hicieron los anlisis de las oraciones a travs de rboles sintcticos. (1 rbol por oracin)
Con los rboles se busc obtener clausulas grandes y a partir de la informacin argumental
del predicado obtener categoras como las que se muestran en la siguiente tabla1:

1
(Pongo la tabl, porque no entiendo a qu se refieren las etiquetas)
El anlisis de los rboles sintcticos no resulta completamente eficaz, pues se menciona que
de la construccin: The clothes we wear, the food we eat, the air we breathe, the water we
drink, the land that sustains us, and many of the products we use are the result of agricultural
research. no se detectan d eforma correcta los objetos de ciertos verbos.
ARGUMENTOS TPICOS
Para cualquier verbo de las muestra se puede preguntar qu sustantivos tiene como sujetos u
objetos. Ejemplo de objetos del verbo beber.
2

Los datos deben estar normalizados, no solo quedarnos en la frecuencia de aparicin.


La informacin mutua de dos eventos se calcula del siguiente modo: (I es la hiptesis)
( )
( ) = 2 =
()()
Cuando la probabilidad conjunta P (x y) es alta en relacin con el producto de las
probabilidades independientes, I es positiva; cuando la probabilidad conjunta es
relativamente baja, I es negativa. Utilizamos las frecuencias observadas para obtener un
puntaje de cooccurrencia.
La hiptesis distribucional es que los sustantivos son similares en la medida en que
comparten contextos. Ejemplo: tabla en la que se presentan los verbos de los cuales el vino
y la cerveza pueden ser objetos

SIMILITUD SUSTANTIVA
Cada sustantivo tiene un conjunto de verbos y objetos que regularmente se acompaan, estas
relaciones nos dan cierta informacin de similitud. Definimos la similitud de objeto de dos
sustantivos con respecto a un verbo en trminos de los pesos mnimos de coonccurrencia
compartidos, la semejanza del sujeto de dos sustantivos, se define de manera anloga.
Ahora defina la similitud general de dos sustantivos como la suma entre todos los verbos de
la similitud del objeto y la similitud del sujeto.
OPERACIONES QUE NO ENTEND
3

La Tabla 4 muestra los diez sustantivos ms parecidos a barco.

2
Weight como valor? Relacin con concurrencias? Weight es el valor de las concurrencias
3
Este anlisis se hizo [creo] de forma vectorial, mencin de la distancia coseno.
La tabla 5 muestra los diez sustantivos ms parecidos a legislador
La tabla 6 muestra los diez sustantivos ms parecidos a mesa/tabla (Gpo heterogneo)
La primera columna enumera el sustantivo que es similar al barco. La segunda columna
muestra el nmero de instancias en que el sustantivo aparece en un predicado argumental. La
tercera columna es el nmero de contextos verbales distintos (sujeto u objeto) que tiene el
sustantivo. La cuarta columna es la medida de similitud. La quinta columna muestra los
verbos comunes, ordenados por puntaje de coocurrencia. 4
RECIPROCIDAD DE LOS SUSTANTIVOS MS SIMILARES
Podemos definir como vecinos recprocos ms cercanos a dos sustantivos que son el
sustantivo ms similar de cada uno. Podramos decir que son como sinnimos. En la tabla 7
observamos este tipo de muestras. La lista de la Tabla 7 muestra un buen conjunto de palabras
sustituibles, muchas de las cuales son sinnimos. Algunos no lo son pero tienen cierta
relacin.
DISCUSIN
A travs del uso de la mtrica de similitud se analiz la distribucin sintctica de sujetos,
verbos y objetos del corpus para hacer una agrupacin semntica.
Limitaciones lxicas:
Polisemia: No hay distincin del sentido de las palabras
Palabras vacas: Desde el punto de vista semntico, por ejemplo seccin. Su concurrencia
depende del complemento que las acompae.
Tamao de la muestra: La muestra actual es demasiado pequea, por lo que muchas palabras
ocurren con poca frecuencia para ser adecuadamente analizadas y justificadas.
Anlisis ms extenso: La mtrica de similitud en este artculo, nicamente se enfoc en el
agrupamiento de sustantivos, sin embargo, debido al modo de anlisis sujeto-verbo-objeto,
se puede hacer ms con este mtodo y obtener mayor informacin.

4
Por lo que entiendo, se hizo la clasificacin de sustantivos por el tipo de verbos y objetos
que comparten. (AGRUPACIN SEMNTICA).

Вам также может понравиться