Вы находитесь на странице: 1из 10

Кыргызский государственный университет

строительства, транспорта и архитектуры им.


Н. Исанова

ИНСТИТУТ НОВЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Кафедра: «Компьютерная лингвистика и межкультурная коммуникация»

ОТЧЕТ
О прохождении учебной практики
(02.09.2021 – 10.09.2021)

Выполнила студентка
1го курса
Группы КЛ-1-20
Аскарова Айганыш

Руководитель практики:
Насипова Асылкул Алдаяровна

Бишкек 2021
Содержание

Введение………………………………………………………………………………………..3
Задачи и цели учебной практики………………………………………………….3
Автоматическая обработка текста………………………………………………..4
Перевод текста и вывод………………………………………………………………..7
Заключение……………………………………………………………………………………10
Список источников литературы…………………………………………………….10

2
Введение

Вид практики: Учебная.

Название практики: Автоматическая обработка текста

Сроки прохождения практики: 4 недель

Цель учебной практики: Практика проводится с целью закрепления


теоретических знаний, полученных в процессе обучения.

Для выполнения поставленной цели были решены следующие задачи:


1. Выработать умение работать самостоятельно, связанной с переводом
текстов официально-делового, публицистического и художественного
стиля.
2. Освоение практических приемов и методов решения отдельных задач
по информатике и языковых задач.
3. Активизация речевых умений в чтении, говорении, аудировании и
письме.
4. Необходимо улучшать ораторские навыки, полученные в процессе
обучения.
База практики: КГУСТА
Длительность пребывания на базе прохождения практики: 5 дней в неделю
по 5 часов

Руководитель практики от ВУЗа: Насипова Асылкул Алдаяровна


старший преподаватель английского языка.

3
АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА

АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА - преобразование текста на


искусственном или естественном языке с помощью ЭВМ. 

Автоматическая обработка текста и ее место среди


различных дисциплин
Задача разработки систем, понимающих ЕЯ, может решаться только
совместными усилиями целого ряда наук. Направление «Автоматическая
обработка текста» лежит на стыке лингвистики (в частности, компьютерной
лингвистики), ИИ, психологии.

Компьютерная лингвистика берет на себя собственно лингвистические


проблемы компьютерного моделирования языковой деятельности. Ее задачи–
построение более точных и более полных лингвистических моделей и более
совершенных алгоритмов анализа и синтеза.

На западе:

дисциплина, занимающаяся разработкой компьютерных систем анализа ЕЯ


текста, называется NLP – Natural Language Processing (language technology,
language engineering). Ее принято выделять в отдельную и скорее инженерную
дисциплину.

Технологически моделирование языковой деятельности выражается в


построении систем автоматической обработки текста (АСОТ), или
лингвистических процессоров.

Из истории лингвистических процессоров

Формальные модели языка, которые первоначально разрабатывались в чисто


теоретическом плане, затем стали использоваться в качестве компонентов
различных прикладных систем. Началось это в 50-е годы XX века с разработки
систем МП (машинного перевода).

Вообще МП – первый опыт использования вычислительных машин для решения


невычислительных задач. Джорджтаунский эксперимент (январь 1954 г.)
Совместный проект Georgetown University и IBM. Основная цель – публично
продемонстрировать принципиальную возможность (feasibility) автоматического
перевода текста. Перевод 49 тщательно отобранных русских предложений на
английский с использованием словаря в 250 слов и всего лишь 6 правил.
Эксперимент, хоть и не имел большого научного значения, тем не менее

(1) стимулировал финансирование работ по МП

4
(2) вызвал бурное развитие МП в мире, в частности, в СССР.

Общественная эйфория сменилась разочарованием.

Bar-Hillel, один из участников Джорджтаунского эксперимента выступил против


постановки нереальной цели (при том уровне лингвистических знаний и тех
возможностях вычислительной техники) – цели создания fully automatic high quality
translation systems. (Одна из наиболее наглядных проблем – лексическая
неоднозначность: The box is in the pen. => Проблема использования знаний о
мире.)

1966 год – опубликован знаменитый отчет ALPAC (Automatic Language Processing


Advisory Committee): MT was slower, less accurate and twice as expensive as human
translation. [W.John Hutchins. Machine translation. A brief history. 1995]

До середины 70-х годов – в МП затишье. Затем активизация.

Помимо МП, предпринимались попытки использовать методы обработки ЕЯ для


задач информационного поиска. Появились макеты фактографических ИПС
(вопросно-ответные системы), которые умели переводить запросы с ЕЯ в
некоторое формальное представление (и обратно).

Современные сферы применения систем автоматической обработки текстов


(лингвистических процессоров)

Приложения компьютерной лингвистики можно разделить на несколько категорий:

Текстовые:

Предназначены для обработки письменного текста (либо устного, но


приведенного к письменному виду методами распознавания речи):

 Поисковые системы:

o Information retrieval (информационный поиск, поиск


документов); Пример: поиск документов по ключевым словам (в
полнотекстовой БД, в сетях Интернет или Интранет)
o Information extraction (извлечение из текстов информации на
заданную тему: сведений о событиях и их атрибутах, о причинах,
последствиях); Пример: Извлечение из текстов Wall Street Journal
информации о смене руководства компаний; заполнение БД по
биржевым операциям, описанным в новостях; поиск конкретных
фактов в текстах (фактографический поиск).

 Прочие:

o классификация (категоризация, рубрицирование);


o машинный перевод;
o проверка правописания;
o аннотирование (реферирование);

5
Понимание текста тут не всегда необходимо, могут использоваться
статистические методы.

Примеры задач не требующих понимания ЕЯ:

 Поиск документов по ключевым словам;


 Построение квазирефератов;
 МП в некоторых системах.

Диалоговые:

Системы человеко-машинного общения., можно выделить следующие

Приложения:

 интеллектуальные вопросно-ответные (ориентированные на узкие


предметные области);
 общение пользователей с базами данных (сейчас - на ограниченном языке);
 системы, предоставления различных услуг (выполнение банковских
операций по телефону, заказ товаров по каталогам)
 голосовое управление техникой (бытовыми приборами, компьютером);
 интерфейсы экспертных систем (кооперативное решение проблем =
человек + интеллектуальная система).

Не следует путать: распознавание речи и понимание устной речи.

[О специфике диалоговых приложений тоже потом].

Несмотря на специфику приложений АОТ, можно выделить основные принципы


построения лингвистических процессоров- общие для обоих видов задач.

Направления компьютерной лингвистики

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА— наука, родившаяся на стыке


вычислительной техники и лингвистики к началу 70-х годов ХХ столетия. Другие
названия: математическая лингвистика, структурная лингвистика,
вычислительная лингвистика.

ПЯТЬ ОСНОВНЫХ НАПРАВЛЕНИЙ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ:

1. Анализ текстов на естественном языке.


2. Синтез текстов на естественном языке.
3. Понимание текстов.
4. Оживление текста.
5. Модели коммуникации.

6
ПЕРЕВОД ТЕКСТА И ВЫВОД

ОСНОВНОЙ ТЕКСТ:
Integrating Language Skills through a Dictogloss Procedure

Not long ago it was common to find instructors teaching languages, particularly English
in non-English-speaking countries, without a degree and with little to no experience or
expertise. But today, governmental agencies like Mexico's Secretaria de Educación
Pública (Ministry of Public Education) have begun to require that teachers have a
degree that demonstrates sufficient skill and language proficiency. Nevertheless, being
able to speak English and having a degree do not necessarily lead to purposeful
language teaching, particularly with a traditional instructional approach that isolates
language skills without appropriate contextual clues in a classroom environment where
the teacher is didactic expert and students complacently follow along.

Traditional methods of teaching English often include translating structures from the
target language to the mother tongue; although this method may seem antiquated, it is
still commonly practiced. Indeed, those teachers who were taught by traditional
methods tend to continue teaching with similar methods. Teachers tend to teach the
way they were taught (Prabhu 1987), and if an English language teacher learned
English via the translation method, this same method is likely to reappear when the
teacher plans, implements, and evaluates instruction. Many English teachers around
the world in Mexico, for example-may still prefer direct instruction even though they are
often free to choose from a variety of methods or strategies (Bollin 2003).

The purpose of this article is to demonstrate interactive and student-centered examples


of dictogloss activities that offer an alternative to traditional dictation (usually reserved
for listening comprehension) and that can be applied both within and outside the English
language-learning classroom (Wajnryb 1990). Dictogloss procedures are practical, yet
flexible enough to account for the needs, interests, and learning preferences of each
learner. But more than that, the dictogloss activities allow English learners to be active
and reflective during the learning process.

ПЕРЕВОД:

7
Интеграция языковых навыков с помощью процедуры Диктофонной
записи

Не так давно было обычным делом встретить преподавателей, преподающих


языки, особенно английский, в неанглоязычных странах, без ученой степени и
практически без опыта или знаний. Но сегодня правительственные учреждения,
такие как Министерство народного образования Мексики, начали требовать,
чтобы учителя имели степень, которая демонстрирует достаточные навыки и
знание языка. Тем не менее, умение говорить по-английски и наличие ученой
степени не обязательно приводят к целенаправленному обучению языку,
особенно при традиционном подходе к обучению, который изолирует языковые
навыки без соответствующих контекстуальных подсказок в классной комнате, где
учитель является экспертом по дидактике, а студенты самодовольно следуют за
ним.

Традиционные методы преподавания английского языка часто включают перевод


структур с языка перевода на родной язык; хотя этот метод может показаться
устаревшим, он все еще широко практикуется. Действительно, те учителя,
которые обучались традиционными методами, как правило, продолжают
преподавать аналогичными методами. Учителя, как правило, преподают так, как
их учили (Прабху 1987), и если учитель английского языка изучал английский язык
с помощью метода перевода, этот же метод, скорее всего, появится снова, когда
учитель планирует, реализует и оценивает обучение. Многие преподаватели
английского языка по всему миру в Мексике, например, все еще могут
предпочесть прямое обучение, хотя они часто свободны в выборе из множества
методов или стратегий (Боллин 2003).

Цель этой статьи-продемонстрировать интерактивные и ориентированные на


учащихся примеры диктофонных упражнений, которые предлагают альтернативу
традиционной диктовке (обычно предназначенной для понимания на слух) и
которые могут применяться как в классе изучения английского языка, так и за его
пределами (Wajnryb 1990). Процедуры диктофона практичны, но достаточно
гибки, чтобы учитывать потребности, интересы и предпочтения в обучении
каждого учащегося. Но более того, занятия с диктофоном позволяют изучающим
английский язык быть активными и рефлексивными в процессе обучения.

ВЫВОД:
Данная работа связана с выявлением ошибок в машинном переводе. Мною были
выявлены следующие ошибки:
1. Грамматические ошибки:
Неверные падежные/родовые окончания

8
Нарушение синтаксических связей, например, неверный выбор или
отсутствие предлогов или союзов.
Помимо неверных падежных окончаний, множества пунктуационных
ошибок (даже запятые, например, поставлены через пробел от слова,
в данном предложении предлог выбран в машинном переводе
неверно.
Переводчик обязан исправить неверный выбор союза или добавить
его при необходимости.

2. Пунктуационные ошибки:
Помимо неверных падежных окончаний, в машинном переводе
пропущено тире, а кавычки и запятые поставлены через пробел от
слова.
Переводчик обязан скорректировать пунктуацию.

3. Лексические ошибки:
Переводчик должен
выбрать правильное лексическое соответствие.
Отсутствие перевода отдельных слов.
Переводчик обязан перевести слова, которые остались без перевода.

4. Лексико-грамматические ошибки:
Отдельно отметим лексико-грамматические ошибки в переводе.
Такие ошибки возникают в машинном переводе тогда, когда перевод
требует комплексного переосмысления:
Бессмысленный дословный перевод.

5. Стилистические ошибки:
Часто машинный переводчик грамматически верно соединяет слова в
одно предложения, но при этом нарушаются нормы сочетаемости
слов, нарушается стиль. Очень часто это происходит при переводе
предложений с безличным подлежащим «It».
Переводчик обязан сформулировать правильную синтаксическую
конструкцию.

9
Анализ ошибок машинного перевода текстов позволил мне прийти к выводу, что
наиболее корректно с переводам справилась система машинного перевода
«YANDEX».

ЗАКЛЮЧЕНИЕ
Учебно-ознакомительная практика помогла мне совершенствовать навыки,
необходимые в дальнейшей профессиональной деятельности.
Я приобрела и совершенствовала навыков сбора и первичной обработки
лингвистического материала; совершенствовала навыков работы с новыми
информационными технологиями; закрепила полученные в ходе теоретической
подготовки знания, умения и навыки; усвоила основные теоретические знания и
практические умения.
Анализ ошибок машинного перевода текстов позволил мне прийти к выводу, что
наиболее корректно с переводам справилась система машинного перевода
«YANDEX».

СПИСОК ИСТОЧНИКОВ ЛИТЕРАТУРЫ


1. Бархударов Л.С. Язык и перевод (Вопросы общей и частной теории перевода).
М., «Междунар. отношения», 1975. 240 с.
1. Гуськова, А.П., Популярный словарь русского языка. Толково-
энциклопедический / Гуськова, А.П., Сотин, Б.В., М., 2013, - 880 с.
2. Ефремова, Т.Ф. Большой современный толковый словарь русского языка, т. 1,
М., 2011, - 1168 с.
2. Комиссаров В.Н. Теория перевода (лингвистические аспекты) // Учебник для
институтов и факультетов иностранных языков — М.: Высшая школа, 1990. - 253 с.
3. Рецкер Я.Н. Пособие по переводу с английского языка на русский язык. М.:
Просвещение, 1982. - 159 с.

10

Вам также может понравиться