Вы находитесь на странице: 1из 12

КОНСПЕКТЫ ЛЕКЦИЙ ПО КУРСУ

«ОСНОВЫ ПРИКЛАДНОЙ ЛИНГВИСТИКИ»


Лекция 3
План
I. Искусственные языки как знаковые системы.

II. Формальные методы описания языков. Формальная


грамматика.

I. В предыдущей лекции мы говорили о лингвистических основах


информатики и о том, что в связи с невозможностью полной формализации
ЕЯ для коммуникации в компьютерных средах необходима разработка
специальных искусственных языков (ИЯ), что входит в сферу интересов
лингвистики.

Искусственные языки – это знаковые системы, создаваемые


для использования в тех областях науки и техники, где применение
естественного языка ограничено, менее эффективно или
невозможно.

Любой искусственный язык по сравнению с естественным всегда


ограничен (по словарю, синтаксису, семантике слов) и служит для решения
определенных задач.
Лингвист должен иметь представление о том, какие бывают языки,
какова структурная организация языков и как создаются языки.

© Соснина, Е.П.
Классификация искусственных языков:

1. Неспециализированные языки общего назначения

ПРИМЕРЫ

Волапюк
Придуман в Германии католическим священником Иоганном Шлейером
в 1879 году, который считал, что этот язык подсказал ему Бог, сошедший к нему
во время сна. Название произошло от английских слов world (vol на волапюке)
и speak (pük), а сам язык был основан на латыни. Волапюк был популярен
достаточно долгое время: на нем издавалось более 25 журналов и было написано
около 300 учебников по его изучению. Существует даже Википедия на волапюке.

© Соснина, Е.П.
В волапюке три алфавита: основной — приближенный к латинскому и состоящий
из 27 знаков, фонетический алфавит, состоящий из 64 букв, и латинский
расширенный алфавит со включенными в него дополнительными буквами
(умляутами), который используется для передачи имен собственных.
Фонетика волапюка элементарна: нет сложных сочетаний гласных и звука r, что
облегчает произношение детям и народам, не использующим звук r в речи.
Ударение всегда падает на последний слог. Многие корни слов в волапюке
заимствованы из французского и английского языков, но лексикон языка
самостоятелен и лишен тесной смысловой связи с живыми языками.

Эсперанто
Самый популярный из искусственных языков был создан в 1887 году варшавским
лингвистом и врачом Лазарем Заменгофом. Идея создать международный язык
пришла Заменгофу в связи с тем, что в его родном городе проживали люди разных
национальностей и они чувствовали себя разобщенными, не имея общего,
понятного каждому языка. Алфавит был создан на основе латинского и состоит
из 28 букв. Есть буквы с диакритическими знаками. Произношение большинства
звуков легко дается без специальной подготовки, отдельные звуки произносятся
на русский и польский манер. Ударение во всех словах падает на предпоследний
слог. Корни слов в основном заимствованы из романских и германских языков
(французского, немецкого, английского), иногда встречаются славянские
заимствования.
Эсперанто был с энтузиазмом принят общественностью и долгое время активно
развивался: появилась Академия эсперанто, и в 1905 году состоялся первый
Всемирный конгресс, посвященный новому языку.
На эсперанто по прежнему общается около 100 000 человек всей планеты. На этом
языке вещают несколько радиостанций (в том числе радио Ватикана), поют
некоторые музыкальные группы и снимают фильмы. Существует и поиск Google
на эсперанто. На языке эсперанто снято четыре полнометражных фильма.

Первый полнометражный эсперанто-фильм был снят


в 1964 году во Франции и назывался «Тревоги» (эспер. «Angoroj»).

© Соснина, Е.П.
Вторым полнометражным эсперанто-фильмом стал «Инкуб»
(эспер. «Incubus»), малобюджетный чёрно-белый фильм ужасов. Он был снят
в 1965 году в США.

Два других полнометражных фильмов сняты уже в XXI веке:


«Герда исчезла!» (эспер. «Gerda malaperis!») — детективный фильм 2006 года,
основанный на одноименной книге Клода Пирона.

«Отец» (эспер. «La patro») — драматический фильм 2007 года, основанный на


произведении японской литературы 1907 года.

Логлан
Логлан — logical language, язык, разработанный доктором Джеймсом Куком
Брауном как экспериментальный язык для проверки гипотезы лингвистической
относительности Сепифира — Уорфа (язык определяет мышление и способ
познания реальности). Язык совершенно логичен, прост для изучения и лишен
неточностей естественных языков. За первыми изучающими логлан было
установлено наблюдение: ученые-лингвисты пытались понять, как язык влияет
на мышление. Также планировалось сделать логлан языком для общения
с искусственным интеллектом, но в 1987 году Институт логлана раскололся и
распространение языка прекратилось.

АРТЛАНГИ
Квенья и другие эльфийские языки
Эльфийские языки — наречия, придуманные писателем и лингвистом
Дж.Р.Р. Толкиеном (автор книги «Властелин колец») в 1910–1920 годах.
Напоминаю вам кинотрилогию The Lord of the Rings; 2001—2003, снятую
режиссёром Питером Джексоном серию из трёх связанных единым сюжетом
кинофильмов, представляющая собой экранизацию романа Дж. Р. Р. Толкина
«Властелин колец».

© Соснина, Е.П.
На этих языках общаются эльфы в его произведениях. Эльфийских языков
множество: квендерин, квенья, эльдарин, аварин, синдарин, илькорин,
лемберин, нандорин, тэлерин и т.д. Их множественность обусловлена
многочисленными «разделениями» эльфийского народа из-за частых войн
и переселений. У каждого эльфийского языка есть как внешняя история (то есть
история его создания Толкиеном), так и внутренняя (история его происхождения
в эльфийском мире). Эльфийские языки популярны среди поклонников творчества
Толкиена: на квенье и синдарине (двух самых популярных языках) выпускается
несколько журналов.
В алфавите квеньи 22 согласных и 5 гласных. Для записи слов на эльфийских языках
существует две системы письменности: тенгвар и кирт (похожий на руническое
письмо). Используется также и латинская транслитерация.
Произношение и система ударений в квенье похожи на латинские.
Основой квеньи стали финский, латинский и греческий языки. Прототипом для
синдарина послужил валлийский язык. Большая часть слов так или иначе относится
к быту эльфийских поселений, к военным действиям, к магии и к повседневной
жизни эльфов.

Клингонский язык

Язык, разработанный в 1980-х специально для инопланетной расы сериала


«Звездный путь» лингвистом Марком Окрандом. Он продуман от и до: имеет
свою грамматику, устойчивый синтаксис, письменность, а также активно
поддерживается Институтом клингонского языка, издающим на клингтонском
книги и журналы. Существует не только клингонская Википедия и клингонский
поисковик Google, но и рок-группы, поющие только на клингонском языке. В Гааге
в 2010 году вышла опера «’u’» на этом выдуманном наречии («’u’» в переводе
означает «Вселенная»).
Фонетически непростой язык, использующий гортанную смычку для создания
эффекта инопланетного звучания. Разработано несколько систем письменности,
имеющих черты тибетского письма с обилием острых углов в начертании
символов. Латиница также используется.
Лексика сформирована на основе санскрита и языков североамериканских
© Соснина, Е.П.
индейцев. В основном синтаксис посвящен космосу и завоеваниям, войне,
вооружению и многочисленным вариациям проклятий (в культуре клингонов
проклятие является своеобразным искусством).

На'ви
На'ви — язык, разработанный в 2005–2009 годах лингвистом Полом Фроммером
для фильма Джеймса Кэмерона «Аватар». На нави разговаривают синекожие
жители планеты Пандора. С их языка слово на'ви переводится как «народ».
В качестве прототипов для на'ви использовались папуасские, австралийские
и полинезийские языки. Всего в языке около 1000 слов. Лексика в основном
бытовая.

На каком искусственном(ых) языке(ах) говорят в сериале «Игра престолов»

© Соснина, Е.П.
2. Специализированные языки различного назначения
(например, символические языки наук (математика, логика, химия,
физика)).
ПРИМЕРЫ
Язык математики

Язык логики высказываний

Пример
Вася любит Машу.
L(v, m)

Во 2-й класс также входят языки человеко-машинного


(компьютерного) общения и реализации компьютерных и информационных
© Соснина, Е.П.
технологий (языки программирования, языки операционных систем, языки
информационных систем и т.п.).

Языки программирования

Пример части программы на Python - разбить текст на предложения:


Python is a cool language. I like using it.

>>> text = TextBlob("Python is a cool language. I like using it.")


>>> text.sentences

[Sentence("Python is a cool language."), Sentence("I like using it.")]

ЯП – это класс искусственных языков, предназначенных для обработки


информации с помощью компьютера. Любой язык программирования - это
строгая (формальная) знаковая система, при помощи которой записываются
компьютерные программы. По разным оценкам, в настоящее время
существует от тысячи до десяти тысяч различных языков программирования.
Исторически языки программирования возникли в 40-х годах XX в. и
качественно совершенствовались в сторону упрощения своего описания, т.е.
высокоуровневой организации, методов программирования и приложения
для обработки информации человеком.
Можно выделить следующие качественные уровни развития ЯП (т.е.
то, как их классифицируют в программировании):
 Низкий уровень (работа с машинными кодами, например, есть языки -
ассемблеры – это версии машинных кодов, адаптированных под
аппаратные платформы компьютеров).
 Средний уровень.

© Соснина, Е.П.
 Высокий уровень (язык программирования высокого ровня – это язык,
команды и структура которого удобны для восприятия человеком,
например, Паскаль, Delphi, SQL, Java Script, PHP и др.

Если взглянуть на язык программирования как на некий объект с


лингвистической точки зрения, можно увидеть, что ЯП так же, как и любой
язык, имеет свои ярусы или структуру.
Первый низший уровень – символьный, его элементы алфавита –
буквы, спецсимволы (по аналогии с ЕЯ – графематический уровень).
Второй уровень – это уровень имен, например, зарезервированных
слов, выражений (в ЕЯ – это лексический уровень).
Третий уровень – операторный (командный), где синтаксические
конструкции имеют повелительный характер (в ЕЯ – аналог синтаксического
уровня), и последний – уровень программы, всегда являющейся
синтаксически и семантически законченной последовательностью
предписаний-команд. Программа – это структурно строгий текст,
записанный по формально заданным правилам искусственного языка
программирования.

II. Формальные методы описания языков


Общим признаком описания специализированных искусственных
языков является формальный метод.

ФОРМАЛЬНЫЙ МЕТОД описания и определения языка идет


через задание алфавита, словаря и системы правил образования и
преобразования выражений (грамматика). Формальный метод
служит для порождения «правильных выражений» («правильных»
– значит «записанных по определенным правилам»).

© Соснина, Е.П.
Вообще, при написании «правильных выражений», т.е. для
формального описания синтаксиса элементов любого языка, широко
используются метаязыки и разные нотации (способы записи), например,
формальные грамматики.

Формальная грамматика – это система строгих (часто


математических) правил, позволяющая с помощью единообразных процедур
получать (выводить) правильные выражения данного языка либо
анализировать имеющиеся выражения на предмет их соответствия
правилам языка.

Вопросами формальных грамматик и теорией формальных языков


занимается такой раздел языкознания как математическая лингвистика.
Она является смежным направлением прикладной лингвистики, тесно
соприкасающимся с математикой и информатикой.
В 1957 году в своей книге «Syntactic structures» американский ученый-
лингвист Ноам Хомский предложил классификацию формальных языков по
типу правил формальной грамматики.
Существует множество видов формальных грамматик, как например:
1. Регулярная грамматика.
2. Контекстно-свободная грамматика.
3. Грамматика непосредственно-составляющих.
4. Лексико-функциональная грамматика.
5. Грамматика Монтегю.

Кратко опишем порождающую грамматику.


Порождающая формальная грамматика – это система
G = Vт, Vнт, S, R,
где G – грамматика;
Vт – множество терминальных (конечных) символов языка;
Vнт – множество нетерминальных символов (из которых можно
выводить далее), заключаются нами в примере ниже в угловые скобки <…>;

© Соснина, Е.П.
S – начальный символ нетерминального множества;
R – система правил вывода типа XY (где X,Y – цепочки символов
из Vт, Vнт).

Множество цепочек, выводимых через G из ее начального символа S,


есть выражения языка, порождаемые этой грамматикой G (т.е. вывод цепочек
всегда начинается с нетерминала S).

Пример:
Формальная система: Система правил R: Выражения,
Г =<{I, We, They, .}, порождаемые согласно
{S, Pr, V, N}, S, R>, <S><Pr><V><N>. синтаксическим правилам R:
<Pr>  I WeThey I like music.
где {I, We, They, .} – Vт, <V>  like We like music.
{S, Pr, V, N} - Vнт <N>  music They like music.

Формальная грамматика, изложенная по подобным правилам, в свою


очередь, работает на базе метаязыка, т. е. специальной вспомогательной
системы знаков (нотации) для работы с конечным языком.

Другие нотации (разбираем на семинаре)


На практике применяется еще один метаязык, который даже считают
синонимичной записью или функциональным аналогом нотации формальных
грамматик. Это Бэкус-Науровы формы (БНФ–формы или БНФ–нотации),
которые, как и формальная грамматика, служат для задания правил
получения правильных выражений и текстов.
Аналогичный метаязык, имеющий графическое наглядное
представление – это синтаксические диаграммы, которые используются
часто при преподавании программирования на языках высокого уровня.
Синтаксическая диаграмма – это схема, объясняющая правило построения
либо некоторого элемента, выражения, либо текста.

© Соснина, Е.П.
Обе эти формы нотаций нашли широкое применение при описании
языков программирования в информатике. Для прикладной лингвистики
построение формальных грамматик, БНФ и синтаксических диаграмм
интересно как способ понять структуру любого языка, увидеть возможности
по моделированию искусственных языков и лингвистических структур.

Домашнее задание (дедлайн 1 пункт - лекция и 2 пункт к


следующей лекции по расписанию).
1. Подготовьте отчет про эксперимент Серля.
Китайская комната Джона Сёрла. Смогут ли программы и роботы
мыслить….
Дать свое объяснение (на 1-2 страницы как поняли этот эксперимент).
Прислать отчет в вк PDF.

2. Для каждого из перечисленных в лекции групп артлангов найти


примеры любых 5 слов и 5 предложений. В том числе для дотракийского и
валирийского языков (из Игры престолов). Дать ссылки откуда взяли
примеры.

Семинар 3-4
План семинара
I. Нотации БНФ и СД.
II. Примеры формальных грамматик и вывода на них.

Список литературы - Мой учебник!


и
Chomsky, Noam. Syntactic structures. Walter de Gruyter, 2002 – 117c.
- books.google.com

© Соснина, Е.П.

Вам также может понравиться