Академический Документы
Профессиональный Документы
Культура Документы
COMPUTACIONAL
INDICE
QU ES LA LINGSTICA COMPUTACIONAL?.......................................................2
ANTECEDENTES HISTRICOS..................3
LINGSTICA TERICA Y LINGSTICA COMPUTACIONAL..................4
TRATAMIENTO DEL LENGUAJE GENERACIONAL E INTERPRETACIONAL..5
APLICACIONES..................8
BIBLIOGRAFIA.....................10
1.
QU ES LA LINGSTICA COMPUTACIONAL?
Siendo la lingstica computacional una disciplina tan reciente, y abarcando objetivos tan
variados, resulta bastante comprensible la gran vacilacin terminolgica que impera en su dominio.
Una tentativa de delimitacin del campo de estudio de la misma, exige el reconocimiento de un
mnimo de tres vertientes. Estas tres grandes lneas de trabajo ordenadas de la ms vinculada a la
lingstica a la ms vinculada a la informtica son:
a.
b.
c.
2.
La lingstica computacional surgi en los Estados Unidos en la dcada de 1950 con el fin
de obtener computadoras que fueran capaces de traducir automticamente textos de lenguas
extranjeras al ingls, particularmente de revistas cientficas rusas. Como los ordenadores pueden
hacer clculos aritmticos con mayor rapidez y precisin que los seres humanos, se crey que solo
era cuestin de tiempo que tuvieran la misma capacidad para procesar el lenguaje. Surgi como
resultado de las aseveraciones de Warren Weaver, quien vea en la traduccin una forma de
descifrado. No obstante, no tardaron en percatarse de que el tratamiento automtico de las lenguas
era mucho ms complejo de lo que inicialmente pensaban, puesto que la traduccin automtica no
logr producir traducciones precisas.
Para traducir de un lenguaje a otro, se observ que era necesario comprender la sintaxis de
ambos lenguajes, al menos en el nivel morfolgico y en las frases enteras, y a su vez, para entender
la sintaxis, hay que entender la semntica del vocabulario y la pragmtica del lenguaje. De esta
forma, lo que empez como un esfuerzo para traducir textos, pronto, se convirti en una disciplina
encargada de entender cmo representar y procesar el lenguaje natural individual usando
ordenadores.
Cuando la inteligencia artificial apareci en la dcada de 1960, la lingstica computacional
se convirti en una rama de sta (la inteligencia artificial) en una subdivisin, tratando con el nivel
de comprensin humano y la produccin de los lenguajes naturales.
En la actualidad la investigacin en el mbito de la lingstica computacional se lleva a cabo
en los departamentos de lingstica computacional, laboratorios, departamentos de informtica y
departamentos de lingstica.
3.
De todos modos, y como conclusin, cabe decir que una solucin en un rea de la
lingstica
terica no soluciona
computacional.
Los desarrollos de teoras simples no siempre proporcionan procedimientos de anlisis
eficaces. Se requiere esfuerzo para pasar de una teora formal a una teora computable.
4.
En lo respectivo al parsing, se parte del conocimiento de que una gramtica formal ofrece
un conjunto de reglas, pero lo que no explicita la gramtica es qu reglas se han de aplicar ni
tampoco en qu orden. Y este es el objetivo de las tcnicas de parsing. Las tcnicas de parsing han
de dar cuenta de las reglas aplicadas, el orden, e incluso, de otras posibles reglas que pudieran haber
sido aplicadas. La variabilidad en el orden de aplicacin de las reglas seleccionadas no es una
propiedad exclusiva de las gramticas sintagmticas, sino que las gramticas no sintagmticas
tambin muestran esta propiedad y, por tanto, distintas formas de analizar una oracin, es decir,
el orden en el que se aplican las distintas reglas categoriales no es una cuestin que est
determinada propiamente por la gramtica categorial puesto que una gramtica formal lo que no
determina tampoco es qu reglas se han de aplicar para el correcto anlisis, lo que supone un
problema para las ambigedades sintcticas. (Tordera Yllescas, 2011: 88).
Ej. El nio vio al polica con los prismticos. Donde sin un contexto pragmtico no se
puede determinar sin el nio vio al polica a travs de unos prismticos o bien si el nio vio a un
polica que portaba unos prismticos.
As pues, aunque una gramtica formal pueda explicitar las reglas, no puede determinar qu
reglas se han de aplicar ni en qu orden. El parsing es un algoritmo computacional cuyo objetivo
es dar cuenta, precisamente, de las reglas que se aplican y el orden en que estas se aplican. -esto es,
qu se sabe-, los parsers (los analizadores sintcticos) forman parte de la informacin procedimental
- esto es, cmo se aplica dicho conocimiento (Moreno Sandoval, 1998: 42-43; citado por Tordera
Yllescas, 2011: 89)
Tipos de parsing
Segn Allen (1995, 41-222): Parsers de gramticas sintagmticas, de gramticas de estados
finitos, de rasgos y estadsticos.
Sintagmticos a su vez en: ascendentes/descendentes; secuencial/de procesamiento paralelo;
determinista/no determinista; con chart/sin chart.
Parsers con retrotrazado: permite una marcha atras en el proceso de anlisis cuando detecta
un resultado errneo. A partir de la gramtica y el lexicn.
Entre las gramticas ms utilizadas en lingstica computacional para este cometido, ocupan
un lugar destacado las gramticas de rasgos. Este tipo de gramticas se caracterizan por incluir a las
reglas sintagmticas informacin sobre la concordancia y la subcategorizacin mediante rasgos
(Allen) pues las gramticas de rasgos son inadecuadas por s para dar cuenta de fenmenos del
lenguaje natural como la concordancia, la subcategorizacin, etc... Dando por vlidas oraciones del
tipo:
Las nios vinieron contentas de la fiesta
El nio de este curso suelen interrumpir bastante al profesor
Los parsers estadsticos no se caracterizan por la aplicacin de una determinada gramtica,
sino por utilizar conceptos y principios propios de la estadstica y, especialmente el clculo
probabilstico (Allen 1995). Es decir, este tipo de parsers no pertenece al modelo simblico (o
gramatical) sino al modelo estadstico.
Finalmente podemos sealar que los parsers ms representativos de entre todos los
generados son Cocke, Parsifal, Early y CYK.
5.
mucho xito, ya que ha sido un impacto. Sin embargo, en los ltimos aos se han conseguido
muchos avances.
La segunda utilidad de la lingstica computacional es la extraccin de informacin. Se
obtiene informacin a partir de un conjunto de documentos. Dicha informacin es previamente
predefinida.
A finales de los aos ochenta y principios de los noventa los investigadores queran
desarrollar sistemas de informacin ms flexibles, por lo que aprovechan los avances tcnicos
llevados a cabo en anlisis, generacin e interpretacin del lenguaje natural. Por ello han intentado
implementar tcnicas sencillas de parsing y fragmentos de teoras lingsticas para dar cuenta de
fenmenos lingsticos, de las pasivas, de las conjunciones etc..
Otra aplicacin de la lingstica computacional est relacionada con la consulta de corpus.
Los corpus en la lingstica computacional son instrumentos de desarrollo y de consulta para el
usuario.
La siguiente y ltima aplicacin es la basada en el resumen de textos. Los resmenes
abarcan dos tipos: reduccin y copia literal del texto original denominado en ingls extract. Este
tipo de resumen no implica la verdadera comprensin del texto original. Por otro lado, el otro tipo
es la comprensin, sntesis y reelaboracin del texto. Lo que se denomina en ingls abstract.
La interaccin hombre-mquina hasta el momento est teniendo muchos inconvenientes por
lo que queda en el aire el deseo de conseguir robots parlantes. Se pretende que el robot, aparte de
entender responda al usuario.
Si la comunicacin se estableciera por medio del canal oral tambin hara falta el
reconocimiento del habla y la sntesis de voz.
En las aplicaciones de los sistemas de traduccin automtica diferenciamos los sistemas de
traduccin automtica financiados por empresas o instituciones y los sistemas comerciales de uso
general para todo el pblico. En ambos sistemas el objetivo perseguido es la transportabilidad del
sistema, la flexibilidad y la calidad del texto traducido.
Los sistemas de traduccin automtica no son sistemas perfectos, sino que la traduccin
automtica se enfrenta a diversos problemas de ndole lingstica al ser una tarea bastante compleja,
por ello se produce siempre algn margen de error en los textos obtenidos. Con el fin de reducir los
errores producidos, una estrategia utilizada desde hace ya mucho tiempo es restringir los dominios,
es decir, la temtica de los textos traducidos. De este modo se reduca la ambigedad.
La traduccin automtica se enfrenta a diversos problemas de ndole lingstica al ser una
tarea bastante compleja,
El objetivo actual es que el usuario no experto sea capaz de definir la lengua y el dominio
para facilitarle el proceso de traduccin al sistema informtico. Actualmente, existen bastantes
sistemas de traduccin que permiten modificar de forma sencilla los datos lingsticos con el fin de
introducir modificaciones que mejoren el funcionamiento del sistema.
Un sistema de traduccin automtica de alta calidad es aquel que consigue respetar el estilo,
el nfasis, la distribucin telemtica y las caractersticas retricas. Todas ellas son propiedades que
inciden sobre el significado global del texto y, por tanto, propiedades que es conveniente mantener
en la traduccin.
Se distinguen tres etapas en los sistemas desarrollados para uso restringido, esto es no
comercial:
- Primera etapa: La traduccin automtica nace en los aos cincuenta y sesenta. Estos primeros
sistemas realizaban una traduccin directa y muy simple palabra por palabra.
- Segunda etapa: A mediados de los sesenta, estos sistemas empiezan a tener muchos
conocimientos. Estos sistemas aplican los mtodos de transferencia y los mtodos de interlengua.
- Tercera etapa: sta es la generacin en la cual los mtodos escogidos estn basados en el
conocimiento del mundo.
En el mbito comercial, son muchos los sistemas que desarrollados en el mbito
experimental y privado, han tenido una versin accesible al pblico. Es por ello que muchas
compaas han desarrollado sus propios traductores automticos de venta al pblico.
Por ltimo, es preciso hacer referencia a los sistemas de traduccin automticos simultneos
que traducen textos orales, para el desarrollo de este sistema es necesario incluir las investigaciones
llevadas a cabo en el tratamiento del habla. Dado la complejidad que supone este proceso
actualmente no se ha realizado.
6.
BIBLIOGRAFA
10