Академический Документы
Профессиональный Документы
Культура Документы
Trabajo 1
Realizado por:
Andrea Trujillo
09-Abril-2018
Título propuesto:
Evaluación de técnicas de procesamiento de lenguaje natural para textos
cortos en lenguaje español.
Problemática
Pregunta de investigación:
¿Cuáles son las técnicas y librerías relevantes para el procesamiento de lenguaje natural
en textos cortos del lenguaje español?
Objetivo general:
Evaluar técnicas relevantes de procesamiento del lenguaje natural para textos cortos en
lenguaje español y las librerías asociadas.
1. Complete la siguiente tabla
Artículo. Referencia Palabras clave ¿De qué trata el artículo? ¿En que coincide con ¿En qué se diferencia de su trabajo
su trabajo de de titulación?
titulación?
Kursat Uysal, A., & Gunal, S. Pre-procesamiento, El artículo se enfoca en el impacto Aplica técnicas como El artículo se enfoca solo en texto en
(2014). The impact of categorización, del pre-procesamiento de texto, de tokenizer, lowercase, turco e inglés, no aplica a lenguaje
preprocessing on text patrones, acuerdo a ciertos patrones como stop-word removal, para español, además de no evaluar librerías
classification. Information clasificación. dominio o clasificación, procesamiento de texto. que contienen las técnicas que aplican.
Processing & Management, comparando la combinación de
104 - 112. diferentes técnicas de
procesamiento de texto en
lenguaje turco e inglés.
Kanakaraj, M., & Mohana , R. Análisis de El documento se centra en aplicar Aplican técnicas para el El documento se centra en evaluar
(2015). Performance Analysis sentimiento, técnicas PLN enfocadas en la procesamiento de texto, técnicas PLN para precisar la
of Ensemble Methods on clasificador, social semántica para procesar con además de tener los clasificación del texto, no determina las
Twitter Sentiment Analysis media, técnicas PLN. mayor precisión el texto. mismos parámetros de técnicas y librerías a valorar.
using NLP Techniques. evaluación(precisión,
International Conference on recall y rendimiento).
Semantic Computing.
Omran, F. N. A. Al, & Treude, Procesamiento de El artículo se centra en la Trabaja con librerías No determina técnicas concretas de
C. (2017). Choosing an NLP lenguaje natural, experimentación de 4 librerías PLN y evalúa su evaluación y experimenta de manera
Library for Analyzing Software librerías PLN, PLN, aplicando técnicas para este precisión y rendimiento. general con las librerías, enfocándose
Documentation: A Systematic documentación de proceso. en texto de documentación de software
Literature Review and a Series software. en inglés.
of Experiments. In
Proceedings of the 14th
International Conference on
Mining Software Repositories
(pp. 187–197). Piscataway, NJ,
USA: IEEE Press.
Fernández, A., Morere, P., Análisis de El artículo presenta un estudio Implementa técnicas de Implementan su experimento con una
Nuñez, L., & Santos, A. (2013). sentimientos, sobre la clasificación y PLN, aunque en este herramienta y no con una o varias
Sentiment Analysis and Topic detección de asunto. procesamiento de texto en inglés caso son configuraciones librerías propias de PLN.
Detection of Spanish Tweets: aplicado a texto español, de la herramienta Weka,
A. Procesamiento del Lenguaje enfocándose en la además de analizar con
Natural,, 45-52. experimentación con la texto en español y
herramienta Weka y sus posibles evaluar de acuerdo a
configuraciones para PLN. parámetros similares.
ITU PLN, web,
Eryiğit, G. (2014). ITU Turkish lenguaje turco. El documento presenta la Enseña técnicas para El artículo se enfoca en mostrar la
NLP web service. In plataforma web de una biblioteca PLN, su eficiencia y funcionalidad de una biblioteca para
Proceedings of the para PLN, es especialmente para funcionalidad aplicado a PLN en un nuevo ámbito como es la
Demonstrations at the 14th lenguaje turco, enseña las técnicas textos cortos. web; sin embargo no se concentra en
Conference of the European que soporta la plataforma y su evaluar sus técnicas, comparándolas
Chapter of the Association for diferentes aplicaciones y con otras bibliotecas.
Computational Linguistics (pp. funcionalidades.
1-4).
2. Escriba en máximo 2 páginas la sección de trabajos relacionados.
Fernández, A., Morere, P., Nuñez, L., & Santos, A. (2013). Sentiment Analysis and Topic
Detection of Spanish Tweets: A. Procesamiento del Lenguaje Natural,, 45-52.
Rodrigues, M., & Teixeira, A. (2015). Advanced Applications of Natural Language Processing
for Performing Information Extraction. Springer.
Althobaiti, M., Kruschwitz, U., & Poesio, M. (2014). AraNLP: A Java-based Library for the
Processing of Arabic Text.
Eryiğit, G. (2014). ITU Turkish NLP web service. In Proceedings of the Demonstrations at the
14th Conference of the European Chapter of the Association for Computational
Linguistics (pp. 1-4).
Hernández, J. M. (2016). Análisis automático de textos en español. San Critóbal de la Laguna.
Kanakaraj, M., & Mohana , R. (2015). Performance Analysis of Ensemble Methods on Twitter
Sentiment Analysis using NLP Techniques. International Conference on Semantic
Computing.
Kursat Uysal, A., & Gunal, S. (2014). The impact of preprocessing on text classification.
Information Processing & Management, 104 - 112.
Al Omran, F. N. A., & Treude, C. (2017, May). Choosing an NLP library for analyzing software
documentation: a systematic literature review and a series of experiments.
In Proceedings of the 14th International Conference on Mining Software
Repositories (pp. 187-197). IEEE Press. Paramkusham, S. (2014). NLTK: THE
NATURAL LANGUAGE TOOLKIT. International Journal For Technological
Research In Engineering.
Reese, R. M. (2015). Natural Language Processing with Java. Packt Publishing Ltd,.
Valverde Olmedo, B., & Martínez García, R. (2016). Herramientas de código abierto para el
procesamiento del español: Análisis y comparativa. Revista Iberoamericana de
Linguistica, 11.