Вы находитесь на странице: 1из 3

Компьютерная лингвистика

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА, направление в прикладной лингвистике, ориентированное на


использование компьютерных инструментов – программ, компьютерных технологий организации
и обработки данных – для моделирования функционирования языка в тех или иных условиях,
ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей
языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь
о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка
может рассматриваться и как сфера приложения информатики и теории программирования к
решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят
практически все, что связано с использованием компьютеров в языкознании.

МАШИННЫЙ ПЕРЕВОД

Как особое научное направление компьютерная лингвистика оформилась в 1960-е годы. Русский
термин «компьютерная лингвистика» является калькой с английского computational linguistics.
Поскольку прилагательное computational по-русски может переводиться и как «вычислительный»,
в литературе встречается также термин «вычислительная лингвистика», однако в отечественной
науке он приобретает более узкое значение, приближающееся к понятию «квантитативной
лингвистики». Поток публикаций в этой области очень велик. Кроме тематических сборников, в
США ежеквартально выходит журнал «Компьютерная лингвистика». Большую организационную и
научную работу проводит Ассоциация по компьютерной лингвистике, которая имеет
региональные структуры (в частности, европейское отделение). Каждые два года проходят
международные конференции по компьютерной лингвистике – COLING. Соответствующая
проблематика обычно бывает широко представлена также на различных конференциях по
искусственному интеллекту.

Инструментарий компьютерной лингвистики.

Компьютерная лингвистика как особая прикладная дисциплина выделяется прежде всего по


инструменту – т.е. по использованию компьютерных средств обработки языковых данных.
Поскольку компьютерные программы, моделирующие те или иные аспекты функционирования
языка, могут использовать самые различные средства программирования, то об общем
понятийном аппарате компьютерной лингвистики говорить вроде бы не приходится. Однако это
не так. Существуют общие принципы компьютерного моделирования мышления, которые так или
иначе реализуются в любой компьютерной модели. В их основе лежит теория знаний,
первоначально разрабатывавшаяся в области искусственного интеллекта, а в дальнейшем ставшая
одним из разделов когнитивной науки. Важнейшими понятийными категориями компьютерная
лингвистика являются такие структуры знаний, как «фреймы» (понятийные, или, как принято
говорить, концептуальные структуры для декларативного представления знаний о
типизированной тематически единой ситуации), «сценарии» (концептуальные структуры для
процедурного представления знаний о стереотипной ситуации или стереотипном поведении),
«планы» (структуры знаний, фиксирующие представления о возможных действиях, ведущих к
достижению определенной цели). Тесно связано с категорией фрейма понятие «сцена».
Категория сцены преимущественно используется в литературе по компьютерной лингвистике как
обозначение концептуальной структуры для декларативного представления актуализованных в
речевом акте и выделенных языковыми средствами (лексемами, синтаксическими
конструкциями, грамматическими категориями и пр.) ситуаций и их частей.
Направления компьютерной лингвистики.

Сфера КЛ весьма разнообразна и включает такие области, как компьютерное моделирование


общения, моделирование структуры сюжета, гипертекстовые технологии представления текста,
машинный перевод, компьютерная лексикография. В узком смысле проблематика КЛ часто
связывается с междисциплинарным прикладным направлением с несколько неудачным
названием «обработка естественного языка» (перевод английского термина Natural Language
Processing). Оно возникло в конце 1960-х годов и развивалось в рамках научно-технологической
дисциплины «искусственный интеллект». По своей внутренней форме словосочетание «обработка
естественного языка» охватывает все области, в которых компьютеры используются для
обработки языковых данных. Между тем в практике закрепилось более узкое понимание этого
термина – разработка методов, технологий и конкретных систем, обеспечивающих общение
человека с ЭВМ на естественном или ограниченном естественном языке.

Компьютерно-лингвистические модели

Основная задача компьютерной лингвистики - автоматическая обработка информации,


представленной на естественном языке. Благодаря разработкам в области компьютерной
лингвистики были созданы системы: компьютерного перевода текстов с одних естественных
языков на другие, автоматического поиска информации в текстах, автоматического анализа и
синтеза устной речи, классификации, сортировки и индексирования текстовых документов, поиска
документов в полнотекстовых базах данных, модификации и пополнения баз знаний, а также
экспертные системы, обучающие и обучающиеся системы, гипертекстовые технологии
представления текста, компьютерная лексикография, построение тезаурусов, автоматическое
реферирование и аннотирование текстов.

Центральным научными проблемами компьютерной лингвистики являются проблема


моделирования понимания смысла текстов (т.е. перехода от текста к формализованному
представлению его смысла) и проблема синтеза речи (т.е. перехода от формализованного
представления смысла к текстам на естественном языке) [2].

Для решения данных проблем необходимо выполнить две основные задачи -создать формальный
семантический язык, адекватный естественному языку, и осуществлять прямой и обратный
перевод с естественного языка на семантический. Таким образом, выполняются процедуры
распознавания текстов и речи - построение полной синтаксической структуры предложений,
соответствующей его семантической структуре, и перевод с естественного языка на формальный
семантический язык, с которым способен оперировать компьютер, и синтеза текстов -
формирование фраз и предложений на естественном языке по записям на формальном
семантическом языке.

Знания человека хранятся на естественном языке, являющимся инструментом мышления и


средством общения между людьми. Язык служит для восприятия, накопления, хранения,
обработки и передачи информации. Психологи считают, что естественный язык представляет
собой вторую сигнальную систему человека, функционирующую на основе первой сигнальной
системы врожденных безусловных рефлексов. Мыслительные процессы, происходящие в "душе"
человека, значительно богаче их внешнего языкового выражения.
Теоретические и практические проблемы лингвистики
Самой большой проблемой, которая стояла перед языкознанием являлась оптимизация функций
языка. Это была глобальная задача, которая включала в себя все сферы деятельности начиная с
правил чтения и понимания сакральных текстов и вплоть до обеспечение контактов между
различными народами.

Термин «прикладная лингвистика» многозначен . В зарубежных источниках этот термин появился


в 30-40 годах, а в России этот термин получил широкое распространение в 1950 г.г, когда в нашей
стране стали появляться первые компьютерные системы автоматической обработки текстовой
информации.Именно поэтому в нашей стране до сих пор используется термины «компьютерная
лингвистика», «инженерная лингвистика» наряду с общим термином "прикладная лингвистика"
.Как в России так и за рубежом можно найти разные интерпретации этого термина. Например, на
Западе данный термин используют, прежде всего, для обозначение теории и практики
преподавания языков .Если рассматривать определение прикладной лингвистики, то эта
дисциплина является предметом языкознания, основная задача которого заключается в
оптимизации функций языка в обществе.

Прикладная лингвистика специализируется на практических задачах, которые связаны с


изучением языка, а также практическим использованием лингвистической теории в других
сферах.

Прикладная лингвистика также занимается разработкой и практическим применением


результатов теоретических и лингвистических исследований , поэтому иногда прикладную
лингвистику называют инструментальной. Прикладная лингвистика помогает внедрять в
практическую деятельность результаты научных исследований ,которые проводились в
теоретическом аспекте.

Прикладная лингвистика ставит много проблем и задач,при этом решение каждой новой задачи в
данном разделе лингвистики формулируется не тривиально и не шаблонно. Число и виды
прикладных лингвистических задач совершенно непредсказуемо, так как мы не в силах
предвидеть все коммуникативные ситуации и иногда эти зачади настолько нестандартны ,что для
их решения может понадобиться участие специалистов; сами задачи не остаются неизменными:
одни уходят, приходят новые, поэтому исследование, решение проблем и задач прикладной
лингвистики никогда не прекратится, потому что при коммуникации людей, ознакомление их с
каким-либо источником всегда возникают проблемы ,решением которых занимается прикладная
лингвистика и исследования в данной сфере будут существовать до тех пор, пока люди
существуют на Земле.

Теоретическое языкознание

Представляет собой раздел общего языкознания, занимающийся в основном проблемами


лингвистических моделей, поиском языковых универсалий (характеристик или особенностей, в
той или иной мере распространяющихся на большие группы языков или на все языки) •
Фонология – исследует функции звуков • Морфология – занимается морфемами • Синтаксис –
исследует правила образования фраз и предложений • Семантика – занимается смыслом и
значением речевых выражений. Существует несколько концепций строения языка. Наиболее
известной является многоуровневая (иерархическая) концепция языка.