ВКР Компьютерные технологии в переводе

Федеральное государственное автономное
образовательное учреждение
высшего профессионального образования
«СИБИРСКИЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ КОСМИЧЕСКИХ И ИНФОРМАЦИОННЫХ
ТЕХНОЛОГИЙ
Кафедра «Разговорный иностранный язык»
«Допущено к защите»
Зав. каф. РИЯ, доцент
________ Т. Н. Ямских
«______» ___________2023 г.
Выпускная квалификационная работа

слушателя дополнительной квалификации
«Переводчик в сфере профессиональной коммуникации»
Тема: Компьютерные технологии в переводе (на материале статьи

«Coding as another language: a pedagogical approach for teaching computer science
in early childhood»)
Руководитель ___________ ________________ _____________

подпись, дата должность, ученая степень инициалы, фамилия
Выпускник ___________ _____________

подпись, дата инициалы, фамилия
Красноярск 2023
СОДЕРЖАНИЕ
Введение.........................................................................................................3
1. Машинный перевод..............................................................................6
1.1. Традиционный машинный перевод..................................................7
1.2. Статистический машинный перевод..............................................11
1.2.1. Пример перевода текста с помощью средств статистического

машинного перевода.............................................................................................13
1.3. Нейронный машинный перевод......................................................15
1.3.1. Пример перевода текста с помощью средств нейронного

машинного перевода.............................................................................................17
Выводы по первой главе.............................................................................20
2. Автоматизированный перевод..........................................................22
2.1. Обзор и сравнение систем автоматизированного перевода.........23
2.1.1. Smartcat.............................................................................................23
2.1.2. MemoQ.............................................................................................24
2.1.3. SDL Language Tool (T-сервис).......................................................26
Выводы по второй главе.............................................................................28
3. Совмещенное использование систем машинного и

автоматизированного перевода............................................................................30
3.1. Пример совмещенного использования SmartCAT и сервиса

DeepL……..............................................................................................................32
Выводы по третьей главе............................................................................36
Заключение..................................................................................................38
Список использованных источников........................................................40
Приложение.................................................................................................41
ч
2
Введение
Современные компьютерные технологии имеют значительное влияние на

различные сферы нашей жизни, включая область перевода. Развитие
информационных технологий привело к возникновению и совершенствованию
компьютерных инструментов, предназначенных для облегчения и
автоматизации переводческих процессов. В настоящей выпускной
квалификационной работе будет рассмотрена тема "Компьютерные технологии
в переводе", с фокусом на двух основных аспектах: машинном переводе и
автоматизированном переводе.
Первая глава работы посвящена машинному переводу. Машинный

перевод представляет собой процесс автоматического перевода текста с одного
языка на другой с использованием компьютерных систем. В рамках этой главы
будут рассмотрены два основных подхода к машинному переводу: нейронный и
статистический. Нейронный машинный перевод основан на использовании
нейронных сетей, которые обучаются переводить тексты, анализируя большие
объемы параллельных корпусов. Статистический машинный перевод, напротив,
основан на статистическом анализе больших массивов параллельных текстов,
чтобы найти соответствия между языками и перевести тексты.
Вторая глава работы посвящена автоматизированному переводу.

Автоматизированный перевод является более широким понятием, включающим
использование различных компьютерных инструментов и программ для
поддержки переводческого процесса. В этой главе будут рассмотрены
различные аспекты и инструменты автоматизированного перевода,
предназначенные для обеспечения качества и эффективности переводческой
работы.
В заключительной, третей части работы будет представлено

рассмотрение возможностей совмещения машинного и автоматизированного
перевода. Будут обсуждены преимущества и недостатки каждого из подходов, а
3
также предложены рекомендации по оптимальному использованию
компьютерных технологий в переводческой деятельности.
Во всех главах будут приведены примеры работы указанных технологий

через перевод фрагментов текста из статьи «Coding as another language:
a pedagogical approach for teaching computer science in early childhood».
Актуальность темы "Компьютерные технологии в переводе" постоянно

растет в современном информационном обществе, где множество текстовых,
аудиальных и аудиовизуальных материалов требует перевода на различные
языки. Быстрое развитие информационных технологий и возрастающие
потребности в переводе привели к росту интереса к применению
компьютерных технологий в данной сфере, вследствие того, что объем
информации, который требуется перевести, огромен. Ресурсы,
распространяемые через интернет, социальные сети и электронную почту, а
также книги фильмы и другие развлекательные продукты, производящиеся в
ранее невиданных масштабах, требуют быстрого и качественного перевода на
различные языки. Машинный перевод и автоматизированные инструменты
значительно ускоряют процесс перевода. Они позволяют переводчикам
справляться с большим объемом работы и сокращать время, затрачиваемое на
перевод. Быстрая и доступная переводческая поддержка становится все более
важной в международных коммуникациях и бизнес-среде. Кроме того,
современные компьютерные технологии, такие как нейронные сети и
статистические модели, постоянно совершенствуются, попутно улучшая
качество перевода. Они способны обрабатывать сложные структуры языка,
учитывать контекст и создавать более точные переводы.
Данная тема важна как с практической, так и с теоретической точки

зрения. Её практическая значимость проявляется в повышении эффективности
и производительности процесса перевода, а также точности и качества
переведенного медиума. Использование компьютерных технологий также
4
способствует снижению затрат на переводческие услуги, путем повторного
использования переведенных текстов.
Теоретическая же значимость данной темы заключается в возможности

исследования и анализа новых методов и технологий в области перевода.
Изучение нейронного и статистического машинного перевода, их принципов
работы и применения позволяет расширить теоретические знания о
современных подходах к переводу. Кроме того, применение компьютерных
технологий в переводе представляет собой новое направление, которое влияет
на традиционные представления о процессе перевода. Исследование этой темы
позволяет развивать и адаптировать переводческую теорию, учитывая
современные технологические возможности и требования переводческой
практики.
Целью данной выпускной квалификационной работы является

исследование и анализ компьютерных технологий в области перевода для
определения их роли и значимости в современном переводческом процессе.
Для достижения этой цели будут изучены основные аспекты машинного
перевода, автоматизированного перевода, а также способы их взаимодействия
для обеспечения наилучших результатов.
5
1. Машинный перевод
Машинный перевод (МП) представляет собой область компьютерной

лингвистики, которая занимается разработкой и применением компьютерных
технологий для автоматического перевода текстов с одного языка на другой.
Этот процесс основан на использовании компьютерных алгоритмов и моделей,
которые анализируют структуру и семантику исходного текста и генерируют
соответствующий перевод на целевом языке.
Идея машинного перевода возникла ещё в середине XX века, когда

компьютерные технологии только начинали свое развитие. В 1950-х годах
появились первые новаторские работы, которые исследовали возможности
автоматического перевода. Одним из самых известных примеров стал проект,
представленный в Нью-Йорке в 1954 г. – первая система МП — IBM Mark II,
ставшая отправной точкой для дальнейшего развития в этой области.
В начале развития машинного перевода основным подходом был

лингвистический метод, вначале основанный на словаре и словарном переводе
(Dictionary Based Machine Translation), затем, основанный на правилах и
грамматике (Rules Based Machine Translation). Однако, эти подходы оказались
сложными и требовали большого объема ручной работы для создания словарей,
правил и лексикона.
С развитием вычислительной мощности и общих статистических методов

в математике к 1990-м годам, статистический машинный перевод (SMT) стал
доминирующим подходом в этой области.
В статистическом машинном переводе (SMT), модель перевода основана

на статистическом анализе больших параллельных корпусов, где каждое
предложение на исходном языке связано с соответствующим предложением на
целевом языке. Статистические модели определяют вероятности перевода слов
и фраз на основе статистических данных и обучения на параллельных текстах.
В то же время, нейронный машинный перевод (NMT), появившийся благодаря
6
развитию нейросетей в предыдущем десятилетии, использует нейронные сети,
которые обучаются на параллельных корпусах. Нейронная сеть состоит из
энкодера (encoder - кодировщика), который кодирует исходное предложение в
векторные представления, и декодера, который генерирует перевод на целевом
языке. Обучение нейронной сети происходит путем минимизации функции
потерь, чтобы достичь наилучшего перевода. Подробнее про эти два вида
машинного перевода будет рассказано далее.
Машинный перевод обладает рядом преимуществ, включая высокую

скорость перевода, возможность обработки больших объемов текста и
повторное использование переводов. Он также может быть полезным
инструментом для предварительного перевода или ориентировочного перевода.
Однако, у машинного перевода также есть свои ограничения. Качество

перевода может варьироваться в зависимости от языковой пары и сложности
текста. Машинный перевод может сталкиваться с трудностями в переводе
идиом, метафор и культурно-специфических выражений. Он также может быть
неэффективным при обработке текстов с высокой степенью неоднозначности
или сложными грамматическими конструкциями.
1.1. Традиционный машинный перевод
Под традиционным машинным переводом здесь понимается именно

машинный перевод на основе правил (Rule based machine translation), так как
получивший развитие с поздних 1940-х и до середины 1960-х машинный
перевод на основе словарей (Dictionary based machine translation) безнадежно
устарел.
Машинный перевод на основе правил (RBMT) во многом опирается на

морфологическую, синтаксическую и семантическую информацию об
исходном и целевом языке. На основе этой информации строятся
лингвистические правила. Также используется миллионы двуязычных словарей
7
для языковой пары. RBMT способен удовлетворить потребности широкого
спектра лингвистических явлений, является расширяемым и
поддерживаемым[1].
Процесс машинного перевода включает несколько основных этапов. На

первом этапе происходит ввод текста и поиск входных словоформ вместе с
соответствующим морфологическим анализом. В процессе анализа
определяется принадлежность каждой словоформы к определенной лексеме в
словаре, а также могут получаться сведения о других уровнях языковой
системы, например, о возможной роли данного слова в предложении.
Для машины совмещение этих двух операций - грамматического разбора

и смыслового анализа слов - является сложной задачей. Вместо этого
рекомендуется проводить синтаксический анализ, который не зависит от
смысла слов, и использовать словарь на других этапах перевода. Машина
проводит синтаксический анализ предложения, опираясь исключительно на
грамматические свойства его составляющих слов, без учета их значений. В
результате анализа формируется синтаксическая структура, которая
представляется в виде дерева зависимостей, где "корень" соответствует
сказуемому, а "ветви" отображают синтаксические связи с зависимыми
словами. Каждое слово предложения записывается в словарной форме, а рядом
указываются грамматические характеристики, которые присущи этому слову в
анализируемом предложении.
Следующий этап включает несколько шагов. Во-первых, производится

перевод идиоматических выражений, фразеологических единиц или
устойчивых оборотов, характерных для данной предметной области. Например,
при переводе с английского на русский язык выражения типа "in case of" или
"in accordance with" могут иметь общий цифровой эквивалент и исключаются из
дальнейшего грамматического анализа.
8
Затем происходит определение основных грамматических характеристик
элементов входного текста, таких как морфологические, синтаксические,
семантические и лексические свойства. Например, определяется число
существительных, время глаголов и их роль в данном предложении в рамках
входного языка.
Далее происходит разрешение неоднозначности, например, английское

слово "round" может быть существительным, прилагательным, наречием,
глаголом или предлогом. Важно определить его конкретное значение в данном
контексте.
Затем производится анализ и перевод слов. Обычно на этом этапе

однозначные слова отделяются от многозначных. Однозначные слова
переводятся по спискам эквивалентов, а для перевода многозначных слов
используются контекстологические словари. Эти словари представляют собой
алгоритмы запроса к контексту для определения значения слова на основе
наличия или отсутствия контекстных определителей.
Таким образом, этот этап включает не только перевод слов, но и учет

контекста и разрешение лексической неоднозначности для достижения
точности и адекватности перевода.
Затем происходит окончательный грамматический анализ, в процессе

которого уточняется необходимая грамматическая информация, учитывая
особенности выходного языка. Последний этап состоит в синтезе выходных
словоформ и создании полного предложения на целевом языке. Здесь
недостаточно просто перевести "узлы" дерева на другой язык. Синтаксис
каждого языка имеет свою специфику: то, что является подлежащим в русском
предложении, в другом языке может быть выражено как дополнение, а то, что
является дополнением, может быть преобразовано в подлежащее. Кроме того,
группа слов, обозначающая одну концепцию в одном языке, может быть
переведена на другой язык всего одним словом, и так далее. Этот переход от
9
структуры к реальному предложению называется синтаксическим синтезом.
Необходимо учесть эти языковые особенности для достижения корректного и
естественного перевода предложения.
Системы машинного перевода обычно ориентированы на конкретные

языковые пары (например, французский и русский, или японский и
английский) и используют переводные соответствия на поверхностном уровне
или на некотором промежуточном уровне между входным и выходным
языками. Качество машинного перевода зависит от объема словаря,
информации, связанной с лексическими единицами, а также от тщательности
разработки алгоритмов анализа и синтеза и эффективности программного
обеспечения. Современные аппаратные и программные средства позволяют
использовать большие словари, содержащие подробную грамматическую
информацию. Эта информация может быть представлена в декларативной
(описательной) форме или в процедурной (с учетом потребностей алгоритма)
форме.
В практике переводческой деятельности выделяются два основных

подхода к машинному переводу. Во-первых, результаты машинного перевода
могут использоваться для поверхностного ознакомления с содержанием
документа на незнакомом языке. В таком случае машинный перевод может
служить в качестве сигнальной информации и не требует тщательного
редактирования. Во-вторых, машинный перевод может использоваться вместо
обычного "человеческого" перевода. Этот подход предполагает тщательное
редактирование и настройку системы перевода для конкретной предметной
области. Здесь важным является полнота словаря, его соответствие содержанию
и языковым средствам переводимых текстов, а также эффективность методов
разрешения лексической многозначности, извлечения грамматической
информации, поиска переводных соответствий и синтеза. Экономически
эффективность такого типа перевода достигается при большом объеме
переводимых текстов (не менее нескольких десятков тысяч страниц в год),
10
достаточной однородности текстов, полноте словарей системы и возможности
их расширения, а также удобстве программного обеспечения для
последующего редактирования.
1.2. Статистический машинный перевод
Статистический машинный перевод (Statistical Machine Translation, SMT)

представляет собой подход к автоматическому переводу, основанный на
статистическом анализе параллельных корпусов текстов на исходном и целевом
языках. В данной главе будет подробно рассмотрена работа статистического
машинного перевода и ее ключевые этапы.
Перед началом обучения модели SMT необходимо провести

предварительную обработку параллельного корпуса. Этот этап включает в себя
несколько важных процедур, направленных на очистку и структурирование
данных.
Первый шаг в предварительной обработке данных - очистка текстовых

документов от нежелательных символов, метаданных или форматирования. Это
включает удаление специальных символов, знаков препинания, HTML-тегов,
чисел и других элементов, которые могут негативно повлиять на качество
перевода или анализ статистики.
Далее происходит токенизация - процесс разделения текста на отдельные

лексические единицы, такие как слова, фразы или предложения. В SMT каждый
токен рассматривается как отдельная единица и служит основой для
вычисления статистических характеристик [2]. Токенизация может быть
осуществлена с использованием различных методов, включая разделение на
основе пробелов, использование регулярных выражений или применение
специальных инструментов, таких как NLTK (Natural Language Toolkit) или
SpaCy.
11
Следующий этап – выравнивание. Это процесс установления
соответствия между фразами или предложениями на исходном и целевом
языках. Параллельный корпус может содержать фразы различной длины или
синтаксической структуры, и выравнивание позволяет установить соответствие
между элементами в параллельных текстах [3]. Выравнивание может быть
выполнено вручную или автоматически с использованием алгоритмов, таких
как IBM Models или HMM Aligner.
Сегментация является дополнительным этапом предварительной

обработки данных и применяется в случаях, когда предложения в параллельных
текстах не соответствуют друг другу по структуре или длине (например, в
случае перевода на китайский язык [4]). Сегментация может включать
разделение предложений на более мелкие фрагменты или объединение
нескольких предложений в одно. Это помогает согласовать структуру
параллельных текстов и облегчить анализ статистики и моделирование
переводных вероятностей.
Обучение модели SMT происходит на основе параллельного корпуса.

Одной из основных моделей в статистическом машинном переводе является
модель переводных вероятностей [5]. В процессе обучения модели
применяются статистические методы, такие как модели на основе скрытой
марковской модели (Hidden Markov Models, HMM) и модели на основе
условных случайных полей (Conditional Random Fields, CRF). Обученная
модель переводных вероятностей позволяет определить вероятность
конкретного перевода фразы или предложения с исходного языка на целевой
язык.
Далее система машинного перевода осуществляет декодирование и

генерацию перевода. Декодирование заключается в выборе наиболее
вероятного перевода из множества возможных вариантов на основе модели
переводных вероятностей и других статистических параметров [6]. Генерация
12
перевода включает синтез выходных словоформ и предложений на целевом
языке.
Оценка качества статистического машинного перевода играет важную

роль. Для этого используются различные метрики, такие как BLEU (Bilingual
Evaluation Understudy), NIST (National Institute of Standards and Technology). Эти
метрики оценивают сходство между машинным переводом и эталонным
переводом, позволяя оценить точность и качество перевода [7]. Оптимизация
модели SMT включает в себя настройку параметров, выбор наилучших
алгоритмов и методов, а также оптимизацию процесса декодирования.
В заключение, статистический машинный перевод в теории является

эффективным подходом к автоматическому переводу, основанном на
статистическом анализе параллельных корпусов текстов. Результаты SMT
зависят от качества и объема обучающих данных, а также от использованных
алгоритмов и методов. Постоянные исследования и разработки в области
статистического машинного перевода способствуют улучшению его качества и
эффективности.
1.2.1. Пример перевода текста с помощью средств статистического

машинного перевода
Процесс поиска рабочего, и при этом удобного, инструмента для

статистического перевода занял достаточно много времени, ввиду того, что
сервисы машинного перевода начиная с 2015 года стали переходить либо на
системы нейронного машинного перевода, либо совмещать статистический и
нейронный машинный перевод (в так называемый гибридный машинный
перевод, как, например, в сервисе «Yandex Translate» [8]). После длительных
поисков удалось найти сайт imtranslator.net [9], предоставляющий именно
статистический машинный перевод.
13
Попробуем перевести несколько фрагментов текста с помощью данного
сервиса. Начнем с простого:
«Computer programming is an essential skill in the 21st century and new

policies and frameworks aim at preparing students for computer science-related
professions.»
Этот фрагмент сервисом был переведен как:
«Программирование - существенный навык в 21-ом столетии и новая

политика, и структуры стремятся готовить студентов к компьютерным
связанным с наукой профессиям.»
Слово «framework» было переведено как «структуры», что не является

точным переводом, но это не самое худшее, что может выдать онлайн-
переводчик. А вот все, что было переведено после – не выдерживает никакой
критики. Вместо «связанных с информатикой» или хотя бы «связанных с
компьютерными науками» машины выдала «компьютерным связанным с
наукой».
Далее попробуем перевести довольно часто встречающуюся

аббревиатуру «STEM», обозначающую комплекс точных наук:
«Thus, the teaching of computer science drew from methodologies already

used in STEM disciplines such as solving pre-set challenges and engaging in
competitions.»
Сервис imtranslator.net перевел это предложение следующим образом:
«Таким образом, обучение информатики тянуло из методологий, уже

используемых в дисциплинах СТЕБЛЯ, типа решения заданных проблем и
привлечения на соревнования.»
«STEM» действительно можно перевести как «стебель» или «основа», но

в данном контексте совершенно очевидно, что имеется в виду точные науки.
14
Хотя можно отметить, что данная система все же может перевести «computer
science» как «информатика».
Попробуем перевести имена собственные:
« Pioneers, such as Seymour Papert, the developer of LOGO, and others within
the Constructionist movement, could foresee this limitation and claimed that the true
power of computer science education was to provide new ways of thinking (Papert
1980; Kafai and Resnick 1996; Resnick 2017; Bers 2018a, b; Resnick et al. 2009).»
Сервис выдает:
«Зачинатели, типа Сеймура Пейпрта, разработчик ЭМБЛЕМЫ, и других в

пределах движения Constructionist, могли предвидеть это ограничение и
утверждали, что истинная энергия образования информатики состояла в том,
чтобы обеспечить новые мышления (Papert 1980; Kafai и Перенадрез 1996;
Перенадрез 2017; Bers 2018a, b; Перенадрез и др. 2009).»
Имена собственные переводятся через раз, где-то с ошибками, где-то

перевод вообще не ясен, как например с фамилией Резник (Resnick). Движение
«конструктивистов» переведено не было, «new ways of thinking» было
переведено как «новые мышления» вместо «новые способы мышления»
В итоге можно сказать, что статистический машинный перевод на

сегодняшний день является далеко не самым надежным методом перевода (и в
сравнении с нейронным машинным переводом это станет очевидно). Развитие
нейросетей обеспечило возможность сделать сервисы машинного перевода
самообучаемыми, что позволило значительно повысить качество перевода.
Именно это – одна из причин, по которой сервис именно статистического
машинного перевода средний пользователь, выйдя в интернет, скорее всего
даже не найдет.
15
1.3. Нейронный машинный перевод
Нейронный машинный перевод (NMT) представляет собой современный

подход к автоматическому машинному переводу, который основан на
использовании нейронных сетей. В этой главе мы рассмотрим архитектуру и
принципы работы NMT, а также роль нейронного машинного перевода в
современных системах перевода.
Нейронные сети - это модели, вдохновленные работой мозга

млекопитающих, которые могут обучаться на больших объемах данных и
выполнять сложные задачи. В нейронном машинном переводе нейронные сети
используются для автоматического перевода текста. Они могут эффективно
моделировать сложные языковые зависимости и лучше справляться с
проблемами, с которыми сталкиваются иные методы машинного перевода.
Архитектура нейронного машинного перевода представлена несколькими

ключевыми компонентами – кодировщик (энкодер - encoder), декодер и
механизм внимания [10]. Кодировщик отвечает за представление исходного
текста в виде вектора фиксированной длины, который содержит семантическую
информацию о тексте. Обычно в качестве кодировщика используются
рекуррентные нейронные сети (RNN) (или сверточные нейронные сети (CNN)).
Рекуррентный кодировщик принимает на вход последовательность слов и

обрабатывает их одно за другим, передавая состояние слов с предыдущего шага
на следующий. Это позволяет модели учитывать контекст и зависимости между
словами. Рекуррентные ячейки, такие как LSTM (Long Short-Term Memory) или
GRU (Gated Recurrent Unit), обычно используются для улучшения
моделирования долгосрочных зависимостей [11].
Сверточный кодировщик использует сверточные слои для извлечения

признаков из исходного текста. Он работает путем сканирования окна
фиксированного размера по последовательности слов и применения операции
свертки для создания фильтров признаков. Сверточные кодировщики
16
позволяют параллельную обработку и обнаружение локальных зависимостей в
тексте [12].
Декодер принимает на вход векторное представление исходного текста,

сгенерированное кодировщиком, и генерирует текст на целевом языке. Обычно
декодер основан на рекуррентной нейронной сети, которая обрабатывает
последовательность слов и на каждом шаге генерирует следующее слово на
основе предыдущего контекста и предсказания [13].
Механизмы внимания (attention mechanism) - это механизмы, который

позволяют модели фокусироваться на различных частях исходного текста при
генерации целевого текста [14]. Они позволяет модели обрабатывать длинные
последовательности и учитывать важность различных слов или фраз в процессе
перевода.
Концепция механизма внимания совершила огромный скачок в 2015 году

благодаря трем вышедшим в этом году статьям, в одной из которых было
предложено использовать двунаправленные рекуррентные нейронные сети
(BiRNN) вместо обычных [14]. Двунаправленные рекуррентные нейронные
сети основаны на том, что выходные данные в момент времени t могут зависеть
не только от предыдущих элементов в последовательности, но и от будущих.
Таким образом нейросеть принимает решение о переводе той или иной лексемы
не только в зависимости от контекста предыдущих переводов, но и от того, как
будут переведены последующие лексемы (это применимо для любого набора
данных, не только для текста) [15].
Пример архитектуры системы нейронного машинного перевода GNMT от

компании «Google» можно увидеть в статье В. А. Нуриева, «Архитектура
системы нейронного машинного перевода» [16].
17
1.3.1. Пример перевода текста с помощью средств нейронного машинного
перевода
Системы нейронного машинного перевода, не смотря на всю свою

функциональность и удобность в использовании имеют некоторые проблемы.
Например, они зачастую с трудом переводят имена собственные [17]. Но это
может показаться незначительным минусом, если сравнивать современные
системы NMT с системами, в которых используется только SMT. Давайте
продемонстрируем способности нейросетей на примере онлайн-переводчика
DeepL [18].
Переведем те же самые фрагменты текста, что мы предоставляли сервису

imtranslator.net:
«Computer programming is an essential skill in the 21st century and new

policies and frameworks aim at preparing students for computer science-related
professions.»
Получим:
«Компьютерное программирование является важным навыком в 21 веке,

и новые политики и рамки направлены на подготовку студентов к профессиям,
связанным с компьютерными науками.»
Союз «и», соединяющий слово «политики» со словом «рамки», лишился

запятой, что является приятным бонусом к неплохому переводу. Системы
NMT, по опыту автора, довольно часто правильно расставляют знаки
препинания, даже там, где в оригинале они вовсе отсутствуют. Слово
«framework» было переведено как «рамки», что гораздо ближе по смыслу, чем
«структуры». В русском языке можно найти, например, «законодательные
рамки» (legislative framework) или «рамки финансирования»
(funding framework).
Далее:
18
«Thus, the teaching of computer science drew from methodologies already
used in STEM disciplines such as solving pre-set challenges and engaging in
competitions.»
Переведено как:
«Таким образом, при преподавании информатики использовались

методики, уже применяемые в STEM дисциплинах, такие как решение заранее
поставленных задач и участие в соревнованиях.»
DeepL не стал раскрывать понятие STEM, что может быть расценено и

положительно, и отрицательно. Все остальное переведено правильно.
Последнее предложение:
«Pioneers, such as Seymour Papert, the developer of LOGO, and others within
the Constructionist movement, could foresee this limitation and claimed that the true
power of computer science education was to provide new ways of thinking (Papert
И в итоге имеем:
«Первопроходцы, такие как Сеймур Пейперт, разработчик LOGO, и

другие представители движения конструктивистов, могли предвидеть это
ограничение и утверждали, что истинная сила образования в области
информатики заключается в предоставлении новых способов мышления (Papert
Имя в тексте переведено, а имена в ссылках – нет. Название LOGO

осталось как есть, а «the Constructionist movement» было переведено как
«движение конструктивистов». Перевод конкретно этого предложения
выполнен замечательно.
Нейронный машинный перевод определенно является скачком вперед по

сравнению с предыдущими видами машинного перевода. Точность перевода,
пунктуация и учет контекста, позволяют переводчикам во многом полагаться
19
на сервисы на подобии DeepL. Кроме того, в DeepL есть возможность
редактирования перевода на лету, как показано на рисунках 1 и 2.
Рисунок 1 - Вывод текста до редактирования
Рисунок 2 - Вывод текста после редактирования
Выводы по первой главе
Традиционные методы машинного перевода основаны на грамматических

правилах языка. Эти методы требуют большого количества ручной работы по
адаптации этих правил в виде запрограммированных алгоритмов. Они не всегда
способны учесть все особенности и нюансы языка, а их результаты могут быть
неполными или неточными.
Статистические методы машинного перевода используют большие

корпусы параллельных текстов для обучения модели перевода. Они основаны
20
на статистическом анализе и вычислении вероятностей удачных переводов. Эти
методы позволяют улучшить качество перевода по сравнению с
традиционными методами. Однако они все же ограничены точностью перевода
и могут иметь трудности с неоднозначностью и идиоматическими
выражениями.
Нейронные сети, используемые в нейронном машинном переводе,

способны автоматически извлекать сложные языковые шаблоны и учиться им, а
также обучаться нахождению зависимостей в данных. Нейронный машинный
перевод смог преодолеть некоторые недостатки статистического метода,
показывая более высокое качество перевода и способность учиться на больших
объемах данных. Однако для эффективного обучения ему, собственно,
требуется этот большой объем данных, а нейронные модели могут быть
вычислительно сложными и требовательными к вычислительным ресурсам.
Стоит отметить, что с развитием технологий и появлением больших

наборов данных, нейронный машинный перевод стал предпочтительным
методом машинного перевода. Он продемонстрировал значительные
улучшения в качестве перевода, особенно в сложных и контекстно-зависимых
задачах. Однако статистический (и даже традиционный машинный перевод) все
еще используются в некоторых сценариях и может быть полезен в
определенных контекстах.
В целом, глава подчеркивает эволюцию методов машинного перевода от

традиционного к статистическому и нейронному подходам. Нейронный
машинный перевод представляет собой наиболее современный и эффективный
метод, который продолжает развиваться и улучшаться с использованием
глубокого обучения (deep learning).
21
2. Автоматизированный перевод
Computer-assisted translation (CAT) или автоматизированный перевод - это

методология, включающая использование компьютерных технологий для
помощи переводчикам в процессе перевода текстов. В отличие от полностью
автоматических систем машинного перевода, CAT-системы предназначены для
поддержки переводчиков во время их деятельности, предоставляя им
инструменты и функционал для более эффективной работы.
Основной целью автоматизированного перевода является повышение

производительности и качества перевода путем автоматизации рутинных задач
и обеспечения доступа к различным переводческим ресурсам и инструментам.
CAT-системы предоставляют переводчикам удобные средства для организации
и управления переводческими проектами, позволяют сохранять и повторно
использовать переводы, обеспечивают контроль качества перевода и поддержку
глоссариев и терминологических баз данных.
Основные компоненты систем автоматизированного перевода включают

в себя множество полезных составляющих. Например, специальные текстовые
редакторы, предназначенные для работы с переводами, обеспечивающие
функции, такие как выделение сегментов для перевода, отображение оригинала
и перевода рядом и предоставление переводчику инструментов для
редактирования и коррекции перевода.
CAT-системы позволяют переводчикам создавать и использовать базы

данных терминов и глоссариев, что обеспечивает согласованность
терминологии и упрощает перевод специализированных текстов.
Также в таких системах присутствует память перевода – база данных,

которая сохраняет ранее выполненные переводы и предоставляет переводчику
возможность повторно использовать уже переведенные сегменты. Это
позволяет сэкономить время и обеспечить согласованность перевода в рамках
одного проекта или между проектами.
22
CAT-системы также могут предоставлять функционал для проверки
орфографии, грамматики, стиля и других аспектов качества перевода, что
помогает переводчикам улучшить точность своих переводов.
Автоматизированный перевод является ценным инструментом для

профессиональных переводчиков, позволяя им повысить эффективность
работы, сохранить согласованность перевода и улучшить качество своих
переводов.
2.1. Обзор и сравнение систем автоматизированного перевода
2.1.1. Smartcat
Давайте взглянем поближе на Smartcat [19]. Smartcat (интерфейс

представлен на рисунке 3)- это инструмент для автоматизированного перевода,
который изначально был разработан компанией ABBYY для внутреннего
использования с 2012 по 2015 годы. Хотя изначально Smartcat ассоциировался с
ABBYY, он вскоре стал независимым и начал быстрый рост. Одним из
ключевых преимуществ Smartcat является его интуитивно понятный
пользовательский интерфейс, который делает его использование простым как
для опытных переводчиков, так и для начинающих. Еще одним преимуществом
является его обширный набор функций, который включает память переводов,
инструменты управления проектами и функции совместной работы. Smartcat
также предлагает широкий спектр интеграций с другими программными
инструментами, такими как системы машинного перевода. В целом, Smartcat –
это универсальная и мощная платформа для перевода, которая может помочь
оптимизировать ваш рабочий процесс и улучшить качество ваших переводов.
23
Рисунок 3 - интерфейс SmartCAT
Smartcat - это платформа для перевода, предлагающая множество

функций, которые могут помочь оптимизировать ваш рабочий процесс и
улучшить качество ваших переводов. Набор функций, предлагаемых Smartcat,
включает в себя неограниченное число пользователей, память перевода и базы
терминов, доступ к более чем 10 сервисам машинного перевода, интеграцию с
внешними сервисами, такими как Google Drive, среду, обеспечивающую
взаимодействие всех участников переводческого процесса, управление
исполнителями, использование API, решения для оплаты и получения средств,
автоматизированный рабочий процесс, переводческая среда, доступ к
маркетплейсу и отчетности включая налоговую.
Таким образом, Smartcat может быть полезным инструментом для любого

человека или организации, занимающихся переводом, которые хотят повысить
эффективность своей работы и значительно улучшить качество переводов.
24
2.1.2. MemoQ
MemoQ translator pro [20]- это программный продукт, который был создан
для облегчения процесса перевода для профессиональных переводчиков. Он
предоставляет широкий набор функций, которые помогают пользователю
повысить эффективность и точность своей работы. Без приставки "pro" в
названии программы, версии memoQ не имеют полного набора функций. На
рисунке 4 показан интерфейс программы.
Рисунок 4 - интерфейс MemoQ
Одна из главных функций memoQ - это iOS-приложение, которое

позволяет переводить текст на более чем 30 мировых языках. Это может быть
удобно для переводчиков, которые работают с иностранными клиентами или
коллегами, и которые должны быстро переводить тексты на разные языки.
Кроме того, это приложение можно использовать для надиктовывания
перевода, что еще больше упрощает процесс перевода.
25
Кроме того, memoQ предоставляет утилиту для управления проектами,
которая помогает пользователям организовывать свою работу и совместно
работать с коллегами. Это может быть полезно для профессиональных
переводчиков, которые работают с большим количеством материалов и
клиентов.
Наконец, memoQ также предлагает облачное и серверное решения,

которые помогают пользователям сохранять и совместно использовать свои
переводы и проекты. Это удобно для переводчиков, которые работают
удаленно или с разных мест, так как они могут легко получить доступ к своим
материалам и проектам из любого места с помощью Интернета.
В целом, memoQ translator pro - это полезный инструмент для

профессиональных переводчиков, который предоставляет широкий набор
функций, которые помогают улучшить качество и эффективность перевода.
2.1.3. SDL Language Tool (T-сервис)
SDL Language Cloud [21], также известный как RWS Language Cloud,
представляет собой облачное решение, разработанное для централизации
процесса перевода. Это онлайн-сервис, который позволяет объединить всех
участников процесса перевода, включая создателей контента, клиентов,
менеджеров проектов, переводчиков и редакторов.
SDL Language Cloud не является полностью независимым решением для

переводчиков. Вы не можете использовать Language Cloud для прямого
перевода из браузера, но у вас есть выбор: вы можете интегрировать его с SDL
Trados Studio или использовать плагин для Microsoft Word. За $10 в месяц (цена
для частных лиц) вы можете:
 интегрировать Language Cloud с SDL Trados Studio;
 просматривать базы терминологии;
26
 проводить поиск похожих слов и фраз (независимо от формы и
лингвистических морфем);
 проводить лингвистические поиски (поиск на основе сходства корневых

морфем);
 управлять терминами в базе терминологии;
 импортировать/экспортировать терминологии в форматах Microsoft Excel,

CSV и других форматах;
 предоставить доступ к системе терминологии другим пользователям в

вашей учетной записи Language Cloud.
Эта подписка не включает машинный перевод и представляет собой

только базовый план для частных пользователей. Стоимость Language Cloud
для бизнеса не рекламируется, и информация предоставляется только по
запросу.
Различия между корпоративными и индивидуальными подписками

включают возможность создания собственных определений для терминов в
базе данных и возможность предоставлять доступ к системе терминологии
другим пользователям через ссылку без необходимости подключения их к
вашей учетной записи.
Как упоминалось ранее, Language Cloud не является автономным

решением и требует установки дополнительного программного обеспечения,
SDL Trados Studio Freelance, на компьютер переводчика. SDL Trados Studio
Freelance следует отличать от Trados Studio Professional, который предназначен
для компаний.
Для корпоративных клиентов Trados Studio Professional начинается от

€2700 за чистую лицензию. Однако, если вы не хотите покупать лицензии
оптом, передавать их пользователям в виде отдельного файла и сопровождать
27
их подробным руководством по установке Trados Studio и активации лицензии,
вам будет интереснее Professional Network версия.
В этой версии лицензии находятся на сервере SDL. Однако вам все равно
нужно установить Trados Studio на свой локальный компьютер. Стоимость этой
версии будет зависеть от количества требуемых лицензий, которые вы всегда
можете приобрести и делегировать исполнителям. Стоимость лицензии Trados
Studio Professional Network предпочтительно запрашивать через форму на
сайте.
Trados Studio, вероятно, самая известная программа для переводчиков.

Однако, по моему субъективному мнению, она перегружена функциями. Даже
на первой странице, где кажется, что ничего не должно усложнять, есть много
вкладок, которые могут ввести в заблуждение и отбить желание использовать
Trados. Возьмите, к примеру, гигантское выпадающее меню "Файл".
Множество разворачивающихся элементов: "Настройки" и "Опции". Важно не
путать их.
К сожалению, сайт SDL Trados также кажется мне неясным. Было трудно
понять, что SDL Language Cloud и SDL Managed Translation на самом деле
являются отдельными продуктами, причем второй включает в себя первый.
Выводы по второй главе
На основании сказанного уже можно сделать некоторые заключения.

CAT-системы представляют собой специализированные инструменты,
разработанные для помощи переводчикам в их работе. Они предоставляют
широкий набор функций и возможностей для эффективного перевода текстов.
Они облегчают работу переводчиков путем предоставления средств для
перевода по сегментам, повторного использования переводов, автоматического
выравнивания и контроля качества перевода.
28
Основной целью CAT-систем является повышение производительности
переводчика, сокращение времени на перевод и обеспечение согласованности
перевода.
CAT-системы имеют различные функциональные возможности, такие как

глоссарии, базы данных переводов, инструменты форматирования, фильтры
для различных типов файлов и другие, которые способствуют более
эффективной работе переводчика. При этом каждая CAT-система имеет свои
особенности и преимущества, и выбор конкретной системы зависит от
потребностей и предпочтений переводчика, а также требований конкретного
проекта или клиента.
Но даже несмотря на все удобства, которые получает переводчик при

работе со средствами автоматизированного перевода, использование CAT-
систем требует определенного обучения и адаптации, чтобы эффективно
применять все их функциональные возможности и достичь наилучших
результатов.
В целом, CAT-системы являются ценными инструментами для

переводчиков, которые значительно упрощают и ускоряют процесс перевода,
повышая его качество и согласованность. Выбор конкретной CAT-системы
зависит от потребностей и предпочтений переводчика, а также от требований
проекта или клиента.
29
3. Совмещенное использование систем машинного и автоматизированного
перевода
Современные технологии в области машинного перевода (МП) и систем

автоматизированного перевода (Computer-Assisted Translation, CAT)
предлагают широкий спектр инструментов и возможностей для повышения
эффективности и качества переводческого процесса. Для повышения качества
переводов и эффективности переводческого процесса следует рассмотреть
вопрос о совмещении этих двух подходов. Будут рассмотрены преимущества и
вызовы такого совмещения, а также описаны основные методы и стратегии
интеграции МП и CAT-систем.
Совмещение МП и CAT-систем позволяет переводчику использовать

преимущества обоих подходов для повышения своей производительности.
Машинный перевод может быть использован для автоматического
предварительного перевода текста, что позволяет переводчику сосредоточиться
на редактировании и правке, вместо того чтобы выполнять полный перевод "с
нуля". Это значительно сокращает время, затрачиваемое на перевод, и
позволяет переводчику выполнять больше работы за более короткий
промежуток времени.
Использование CAT-систем позволяет переводчику внести необходимые

корректировки и улучшения в машинный перевод, чтобы достичь высокого
качества перевода. Переводчик имеет возможность работать над переводом на
уровне предложений или сегментов, использовать глоссарии и
терминологические базы данных для обеспечения согласованности и точности
перевода. CAT-системы также предлагают функции проверки качества
перевода, такие как проверка орфографии, грамматики и стиля, что помогает
переводчику исправить ошибки и улучшить качество перевода.
Одним из вызовов является адаптация МП к особенностям CAT-систем.

CAT-системы используют свои собственные форматы файлов и структуры
данных, что требует разработки специальных интеграционных модулей или
30
плагинов для интеграции МП. Также важно учитывать специфические
потребности и требования переводчиков, связанные с использованием CAT-
систем, и обеспечивать удобство и эффективность работы в такой совмещенной
среде. В SmartCAT существует встроенная платная функция машинного
перевода текстов.
Еще одним вызовом является работа с различными типами текстов,

такими как техническая документация, маркетинговые материалы, локализация
веб-сайтов и другие. Каждый тип текста имеет свои особенности, требующие
определенного подхода к переводу. Совмещение МП и CAT-систем должно
учитывать эти различия и предоставлять переводчику соответствующие
инструменты и ресурсы для эффективной обработки каждого типа текста.
Один из методов совмещения МП и CAT-систем заключается в

использовании МП в качестве предварительного перевода текста. Переводчик
получает автоматически сгенерированный перевод, который затем
редактируется и корректируется в CAT-системе. Это позволяет сократить
время, затрачиваемое на перевод, и улучшить производительность переводчика.
Другой метод состоит в интеграции функций МП непосредственно в

CAT-систему. Некоторые CAT-системы предлагают встроенные инструменты
машинного перевода, которые позволяют переводчику получить предложения
или сегменты перевода с использованием МП прямо в рабочей среде CAT-
системы (например, SmartCAT). Это обеспечивает единое рабочее пространство
для переводчика и упрощает процесс использования МП.
Совмещение машинного перевода и систем автоматизированного

перевода представляет собой оптимальный подход для повышения
эффективности и качества переводческой работы. Оно позволяет переводчикам
использовать преимущества обоих подходов, сокращая время перевода и
обеспечивая его высокое качество. Однако, чтобы успешно совместить эти
системы, необходимо учитывать вызовы, связанные с адаптацией МП к CAT-
31
системам и работой с различными типами текстов.
3.1. Пример совмещенного использования SmartCAT и сервиса DeepL
В переводческом ремесле чаще всего необходимо сохранять

форматирование файла, содержащего исходный текст (как в случае перевода
статей). Для этого проще всего воспользоваться CAT-системой, которая сама
будет следить за форматированием документа, пока переводчик занимается
своей непосредственной работой.
Во время выполнения практикума был выполнен перевод части статьи

«Coding as another language: a pedagogical approach for teaching computer science
in early childhood». Покажем на примере первой страницы данной стать, как
можно параллельно использовать возможности CAT-системы SmartCAT и
сервиса нейронного машинного перевода DeepL для того, чтобы добиться
высокого качества перевода, оптимизации самого процесса перевода и
сохранения изначального вида статьи.
Для начала создадим проект на сайте SmartCAT и загрузим в него

исходный текст в формате «.docx», затем откроем в отдельном окне сервис
DeepL и разместим их параллельно, как показано на рисунке 5.
32
Рисунок 5 - отдельные окна SmartCAT и DeepL
Копируем строку, которую необходимо перевести из текста в переводчик,

затем по необходимости редактируем (благо DeepL, как говорилось ранее,
позволяет делать это на ходу). Переводим таким образом, пока не закончим
проект. В конце мы получим страницу, идентичную оригиналу по своему
оформлению (как на рисунках 6 и 7).
33
Рисунок 6 - оригинальный текст
34
Рисунок 7 - итоговый перевод
Использование системы автоматизированного перевода избавляет

переводчика от рутинной работы по восстановлению исходного
форматирования текста и позволяет ему сосредоточиться на действительно
35
важных аспектах его работы. Также, наличие глоссариев и памяти переводов
помогают сохранять точность перевода. В то же время, использование системы
нейронного машинного перевода позволяет переводчику быстро получить
примерный, «сырой» перевод предложения, редактирование которого занимает
гораздо меньше времени и сил, чем перевод предложения с нуля.
Стоит при этом внимательно отнестись к соблюдению постоянства в

переводе терминов, т.к. при последовательном переводе одного предложения за
другим, NMT-сервисы могут (и зачастую будут) выдавать различный перевод
одних и тех же слов и словосочетаний.
Выводы по третьей главе
Совместное использование CAT-систем и машинного перевода

представляет значительный потенциал для улучшения эффективности и
качества переводческой работы. Объединение этих двух технологий позволяет
переводчикам комбинировать преимущества машинного перевода, такие как
автоматический перевод больших объемов текста, с возможностями CAT-
систем, направленными на повышение точности и согласованности перевода.
Одним из главных преимуществ совмещения CAT-систем и машинного

перевода является возможность использования предварительно переведенных
сегментов и баз данных переводов, которые сохранены в CAT-системе. Это
позволяет повторно использовать уже проверенные и одобренные переводы,
что значительно сокращает время на перевод и улучшает согласованность
перевода в рамках проекта.
Кроме того, совместное использование CAT-систем и машинного

перевода позволяет переводчику использовать автоматические переводы в
качестве исходной основы, которую затем можно отредактировать и улучшить.
Машинный перевод может служить полезным инструментом для
36
предварительного перевода текстов, особенно если они имеют большой объем
или содержат специфическую терминологию.
Однако, необходимо отметить, что совмещение CAT-систем и машинного

перевода требует осторожного подхода и правильной оценки результатов
машинного перевода. Важно иметь возможность критически оценивать и
редактировать автоматические переводы, чтобы обеспечить высокое качество
окончательного перевода.
Таким образом, совместное использование CAT-систем и машинного

перевода позволяет переводчикам значительно улучшить эффективность и
точность своей работы, используя автоматические переводы в качестве
отправной точки и опираясь на функциональность CAT-систем для улучшения
и согласованности перевода. Это позволяет сократить время на перевод и
повысить качество перевода, особенно при работе с большими объемами текста
или проектами с повторяющимися элементами.
37
Заключение
В работе были представлены теоретические сведения о машинном

переводе и его видах, а также о системах автоматизированного перевода (CAT-
системах). Обе технологии перевода были рассмотрены на практике с
использованием текста статьи «Coding as another language: a pedagogical
approach for teaching computer science in early childhood».
На основании сказанного в работе, можно сделать вывод, что машинный

перевод является мощным инструментом, который значительно упрощает
процесс перевода, повышает его эффективность и сокращает временные
затраты. От традиционных методов перевода до современных статистических и
нейронных подходов, машинный перевод продемонстрировал значительный
прогресс в точности и качестве перевода.
Однако, несмотря на преимущества машинного перевода, он все еще

имеет свои ограничения, особенно при работе с текстами высокой сложности,
специфической терминологией или контекстуальными нюансами. Поэтому
важно уметь критически оценивать результаты машинного перевода и при
необходимости вносить корректировки и улучшения.
CAT-системы представляют собой ценный инструмент для переводчиков,

обеспечивая функциональность, направленную на повышение согласованности,
эффективности и качества перевода. Они позволяют переводчикам сохранять и
повторно использовать переводы, использовать глоссарии и терминологические
базы данных, а также обеспечивают удобное взаимодействие с клиентами и
редакторами.
Совмещение машинного перевода и CAT-систем представляет

значительный потенциал для оптимизации переводческого процесса.
Использование автоматических переводов в качестве отправной точки и
совместная работа переводчика и машинного перевода позволяют сократить
время на перевод, повысить согласованность и качество перевода. Однако
38
важно иметь возможность критически оценивать результаты машинного
перевода и вносить редактирования для достижения наилучшего качества
окончательного перевода.
Таким образом, с учетом преимуществ и ограничений машинного

перевода, а также роли и функциональности CAT-систем, совмещение этих
двух подходов представляет собой эффективный и перспективный подход к
автоматизации переводческой работы. Это позволяет достичь более высокой
эффективности, точности и согласованности перевода, улучшая
взаимодействие между переводчиками, клиентами и редакторами, а также
сокращая временные затраты на перевод.
39
Список сокращений
RBMT — Rule-Based Machine Translation, машинный перевод на основе

правил;
МП — машинный перевод;
HTML – hypertext markup language, гипертекстовый язык разметки;
SMT – statistical machine translation, статистический машинный перевод;
NLTK – Natural Language Toolkit, Пакет библиотек и программ для

символьной и статистической обработки естественного языка, написанных на
языке программирования Python;
HMM – Hidden Markov Models, скрытые марковские модели;
CRF – Conditional Random Fields, условное случайное поле;
BLEU – bilingual evaluation understudy, алгоритм оценки качества текста,

переведенного машиной с одного естественного языка на другой;
NIST – National Institute of Standards and Technology, Национальный

институт стандартов и технологий, а также одноименный алгоритм оценки
качества машинного перевода текста;
NMT – neural machine translation, нейронный машинный перевод;
RNN – recurrent neural network, рекуррентная нейронная сеть;
CNN – convolutional neural network, сверточная нейронная сеть;
LSTM – Long Short-Term Memory, долгая краткосрочная память;
GRU – Gated Recurrent Unit, управляемые рекуррентные нейроны;
BiRNN – bidirectional recurrent neural network, двунаправленная

рекуррентная нейронная сеть;
40
GNMT – Google Neural Machine Translation, нейронный машинный
перевод Google;
CAT – computer-aided (computer-assisted) translation, автоматизированный

перевод.
41
Список использованных источников
1. S. Tripathi and J. K. Sarkhel. “Approaches to machine translation” // Annals

of Library and Information Studies. - 2010. - №57. - С. 383-393.
2. Koehn Philipp. “Statistical Machine Translation”. - 1-е изд. - New York:

CAMBRIDGE UNIVERSITY PRESS, 2009. – С. 34-35

CAMBRIDGE UNIVERSITY PRESS, 2009. – С.113-118
4. Aye Thida, Nway Nway Han, Sheinn Thawtar Oo. “Statistical Machine
Translation Using 5-grams Word Segmentation in Decoding” // 32nd Pacific Asia
Conference on Language, Information and Computation. - 2018

CAMBRIDGE UNIVERSITY PRESS, 2009. – С. 249 – 283

CAMBRIDGE UNIVERSITY PRESS, 2009. – С. 155-176

CAMBRIDGE UNIVERSITY PRESS, 2009. – С. 222 -232
8. О машинном переводе // Технологии Яндекса URL:

https://yandex.ru/dev/translate/doc/dg/concepts/how-works-machine-translation.html
(дата обращения: 14.06.2023).
9. Translation // ImTranslator URL: https://about.imtranslator.net/language-

tools/translation/ (дата обращения: 15.06.2023).
10. Basab Nat, Chandrashekhar Kumbhar, Bui Thanh Khoa. “A Study on

Approaches to Neural Machine Translation” // Journal of Logistics, Informatics and
Service Science. - 2022. - № 9. - С. .271-283.
42
11. Jinsong Su, Zhixing Tan, Deyi Xiong, Rongrong Ji, Xiaodong Shi, Yang
Liu. Lattice-Based Recurrent Neural Network Encoders for Neural Machine
Translation // AAAI. – 2016
12. Jonas Gehring, Michael Auli, David Grangier, Yann N. Dauphin. A

Convolutional Encoder Model for Neural Machine Translation // Facebook AI
Research. – 2017
13. Introduction to Neural Machine Translation(NMT) // the AI dream URL:

https://www.theaidream.com/post/how-ai-is-changing-personal-data-tracking (дата
обращения: 15.06.2023).
14. Derya Soydaner. “Attention Mechanism in Neural Networks: Where it

Comes and Where it Goes”. Department of Brain and Cognition, University of
Leuven (KU Leuven), Leuven, Belgium
15. Mike Schuster and Kuldip K. Paliwal. “Bidirectional Recurrent Neural

Networks”. IEEE TRANSACTIONS ON SIGNAL PROCESSING, VOL. 45, NO.
11, 1997.
16. В. А. Нуриев. “Архитектура системы нейронного машинного

перевода” // Информатика и её применение. - 2019. - №том 13, выпуск 3. - С.
90–96.
17. Zixin Zeng, Rui Wang, Yichong Leng, Junliang Guo, Xu Tan,Tao Qin2,
Tie-yan Liu. “Extract and Attend: Improving Entity Translation in Neural Machine
Translation” // Peking University, Microsoft Research Asia, University of Science
and Technology of China. – 2023.
18. Переводчик // DeepL URL: https://www.deepl.com/translator (дата

обращения: 15.06.2023).
19. Smartcat URL: https://smartcat.com/ (дата обращения: 15.06.2023).
43
20. Created by Translators for Translators // memoQ URL:
https://www.memoq.com/products/memoq-translator-pro (дата обращения:
15.06.2023).
21. RWS Language Cloud // RWS URL:

https://www.rws.com/localization/language-cloud/ (дата обращения: 15.06.2023).
44
Приложение A
Ниже представлен перевод фрагмента статьи за авторством Марины

Умаски Берс «Coding as another language: a pedagogical approach for teaching
computer science in early childhood».
№ Оригинал (En) Перевод (Ru)

Coding as another Кодирование как другой
language: a pedagogical язык: педагогический подход к
approach for teaching computer преподаванию информатики в
science in early childhood раннем детстве
Marina Umaschi Bers Марина Умаски Берс
Received: 28 February 2019 Получено: 28 февраля 2019
/ Revised: 18 June 2019 / г. / Отредактировано: 18 июня 2019
Accepted: 9 September 2019 / г. / Принято: 9 сентября 2019 г. /
Published online: 25 September Опубликовано онлайн: 25 сентября
2019 © Beijing Normal University 2019 г. © Пекинский
2019 педагогический университет 2019
1 Abstract Аннотация
1
Computer programming is Программирование является
an essential skill in the 21st необходимым навыком в 21 веке,
century and new policies and новые стратегии и концепции
frameworks aim at preparing стремятся подготовить студентов к
students for computer science- профессиям, связанным с
related professions. Today, the компьютерными науками. Сегодня
development of new interfaces and разработка новых интерфейсов и
block-programming languages языков блочного
facilitates the teaching of coding программирования упрощает
and computational thinking обучение программированию и
starting in kindergarten. вычислительному мышлению,
начиная с детского сада.
2 However, as new Однако по мере появления

2 programming languages that are новых языков программирования,
developmentally appropriate соответствующих уровню развития
emerge, there is a need to детей, возникает необходимость в
explicitly conceptualize четкой концептуализации
pedagogical approaches for педагогических подходов к
teaching computer science in the обучению информатике в раннем
45
возрасте, которые охватывают
этапы взросления детей, предлагая
early years that embrace the им играть и совершать открытия,
maturational stages of children by социализироваться и заниматься
inviting play and discovery, творчеством. Таким образом,
socialization, and creativity. Thus, недостаточно копировать модели,
it is not enough to copy models разработанные для детей старшего
developed for older children, возраста, которые в основном
which mostly grew out of выросли из традиционных
traditional Science, Technology, дисциплин и методов обучения в
Engineering and Math (STEM) области естественных наук,
disciplines and instructional технологии, инженерии и
practices. This paper describes a математики (STEM). В данной
pedagogical approach for early статье описывается педагогический
childhood computer science called подход к информатике для детей
“Coding as Another Language” младшего возраста под названием
(CAL), as well as six coding "Кодирование как другой язык"
stages, or learning trajectories, that (CAL), а также шесть этапов
young children go through when изучения кодирования, или
exposed to CAL curriculum. траекторий обучения, через
которые проходят дети младшего
возраста при изучении программы
CAL.
3 CAL is grounded on the В основе CAL лежит
3 principle that learning to program принцип, согласно которому
involves learning how to use a обучение программированию
new language (a symbolic system предполагает обучение
of representation) for использованию нового языка
communicative and expressive (символической системы
functions. This paper proposes представления) для выполнения
that, due to the critical коммуникативных и
foundational role of language and выразительных функций. В данной
literacy in the early years, the работе выдвигается
teaching of computer science can предположение, что в связи с
be augmented by models of важнейшей основополагающей
literacy instruction. CAL supports ролью языка и грамотности в
young children in transitioning раннем возрасте, преподавание
through different six coding информатики может быть
stages. Case studies of young дополнено моделями обучения
children using either the KIBO грамотности. CAL помогает
robot or the ScratchJr app will be маленьким детям пройти через
used to characterize each coding шесть различных этапов изучения
stage and to illustrate the кодирования. Чтобы
46
instructional practices of CAL охарактеризовать каждый этап
curriculum. изучения кодирования и
проиллюстрировать методы
Keywords
обучения в рамках учебной
Coding · Young children · программы CAL будут
Early childhood · Literacy использованы примеры из
практики детей младшего возраста,
использующих либо робота KIBO,
либо приложение ScratchJr.
Ключевые слова
Кодирование · Маленькие
дети · Раннее детство ·
Грамотность
4 Introduction: new ways Введение: новые способы
4 of thinking through computer мышления с помощью
science информатики
Computer programming is Программирование
becoming an essential skill in the становится необходимым навыком
21st century. Each month, there в 21 веке. Ежемесячно по всей
are an estimated 500,000 openings стране появляется примерно 500
for computing jobs nationwide, 000 вакансий, связанных с
and a lack of adequately trained вычислительной техникой, и не
people to fll them (Code.org 2018; хватает адекватно подготовленных
Fayer et al. 2017). In order to meet людей для их занятия (Code.org
the growing needs, new 2018; Fayer et al. 2017). Чтобы
educational policies and удовлетворить растущие
frameworks aim at preparing потребности, новые
students in kindergarten to high образовательные стратегии и
school for computer science- концепции направлены на
related professions (National подготовку учащихся от детского
Research Council 2012; сада до старшей школы к
Hubwieser et al. 2014). This paper профессиям, связанным с
addresses this need but claims that информатикой (National Research
the rationale for supporting the Council 2012; Hubwieser et al. 2014).
introduction of computer science В данной работе рассматривается
starting in kindergarten shouldn’t эта потребность, но при этом
be the creation of the future утверждается, что основанием для
workforce, but the future citizenry. поддержки введения информатики
If we do not understand what an с детского сада должно быть не
algorithm is, we might not создание будущей рабочей силы, а
understand why and how certain воспитание будущих граждан. Если
information is or is not presented мы не понимаем, что такое
47
to us. We become illiterate in the алгоритм, мы можем не понимать,
information age. Coding is a new почему и как нам представляется
literacy, and as such, those who или не представляется
learn how to code from a young определенная информация. В
age will not only be able to информационной эпохе это
participate in the automated означает неграмотность.
economy, but will also have a Кодирование - это новая
civic voice. Reading and writing, грамотность, и поэтому те, кто
as well as computer programming, научится писать код с раннего
are tools of power because they возраста, не только смогут
support new ways of thinking and участвовать в автоматизированной
the making of new processes and экономике, но и будут иметь
artifacts. гражданский голос. Чтение и
письмо, а также программирование
- это инструменты власти,
поскольку они поддерживают
новые способы мышления и
создание новых процессов и
материальных ценностей.
5 From smart watches to cell Большинство наших вещей -
5 phones to automated cars, most of от умных часов до мобильных
our objects have been телефонов и самоуправляемых
programmed. Furthermore, автомобилей - запрограммированы.
algorithms dictate the news Более того, алгоритмы диктуют то,
displayed in our social media, the какие новости появляются в наших
people we might enjoy meeting, социальных сетях, с какими
and the merchandise we might людьми мы можем встретиться и
want to purchase. Researchers какие товары мы можем захотеть
have coined the term приобрести. Исследователи
“computational thinking” to refer придумали термин
to the analytical process rooted in "вычислительное мышление" для
the discipline of computer science обозначения аналитического
and the activity of programming. процесса, который уходит корнями
It involves thinking recursively, в информатику и
applying abstraction, breaking up программирование. Оно
a complex problem in smaller предполагает рекурсивное
tasks, and using heuristic мышление, применение
reasoning to discover a solution абстракций, разбиение сложной
(Wing 2006a, b; 2011). There is проблемы на более мелкие задачи и
debate among researchers and использование эвристических
educators regarding whether рассуждений для поиска решения
computational thinking can be (Wing 2006a, b; 2011). Среди
classified as a unique category of исследователей и педагогов
48
thought (Gadanidis 2017; Pei et al. ведутся споры о том, можно ли
2018). However, the term has классифицировать вычислительное
grown popular at a time when мышление как уникальную
schools are starting to incorporate категорию мышления (Gadanidis
computer science in more massive 2017; Pei et al. 2018). Однако этот
ways (K–12 Computer Science термин стал популярным, ведь в
Framework Steering Committee это же время школы начинают
2016). While back in the 1960s it более массово внедрять
was argued that all college информатику (K-12 Computer
students needed to learn Science Framework Steering
programming and the “theory of Committee 2016). Хотя еще в 1960-х
computation” (Guzdial 2008; годах утверждалось, что всем
Grover and Pea 2013; Perlis студентам колледжей необходимо
1962), most of its early application изучать программирование и
was primarily found in "теорию вычислений" (Guzdial
mathematics, science and 2008; Grover and Pea 2013; Perlis
engineering. 1962), большинство ранних
применений этого термина было
найдено в основном в математике,
естественных и технических
науках.
6 As new programming По мере разработки новых
6 languages were developed, such as языков программирования, таких
Basic and Pascal, computer как Basic и Pascal,
programming started to slowly программирование стало
make its way into high schools постепенно проникать в средние и
and middle schools (Wilson et al. старшие школы (Wilson et al. 2010).
2010). In the 1980s with the В 1980-х годах с широким
widespread use of LOGO and the распространением LOGO и
turtle that could draw geometrical черепашки, которая могла рисовать
shapes with simple commands, геометрические фигуры с помощью
programming also received a простых команд,
major push in elementary schools программирование получило
(Papert 1980; Abelson and большой толчок в начальных
DiSessa 1981). Today, with the школах (Papert 1980; Abelson and
development of new computer DiSessa 1981). На сегодняшний
interfaces and block-programming день, с развитием новых
languages, coding is also arriving компьютерных интерфейсов и
to early childhood education. For языков блочного
example, the ScratchJr программирования, кодирование
programming app and the KIBO также приходит в дошкольное
robotics kit (for a depth discussion образование. Например,
of the theoretically rooted design приложение для программирования
49
of these tools, see Bers 2018a). ScratchJr и набор для
Each of these tools engages робототехники KIBO (углубленное
children to create their own обсуждение теоретически
projects and express their ideas обоснованного проектирования
through programming. However, этих инструментов см. в Bers
research shows that the best uses 2018a). Каждый из этих
happen when the tools are инструментов привлекает детей к
integrated into an intentional созданию собственных проектов и
learning experience and к самовыражению посредством
curriculum (Bers 2012; Pea and программирования. Однако, как
Kurland 1984) that must be age- показывают исследования,
appropriate. наилучшее использование
инструментов происходит тогда,
когда они интегрированы в
целенаправленный опыт обучения
и учебную программу (Bers 2012;
Pea and Kurland 1984), которая
должна соответствовать возрасту
обучаемых.
7 The traditional Традиционная точка
7 perspective: coding as STEM зрения: кодирование как часть
STEM
The STEM acronym came
into the American consciousness Аббревиатура STEM вошла в
in the 1950s as a response to the сознание американцев в 1950-х
need for a technically oriented годах как ответ на потребность в
workforce, and to maintain инженерно-ориентированной
national security. In 1958, during рабочей силе и для поддержания
the height of the space race, the национальной безопасности. В
United States passed the National 1958 году, в разгар космической
Defense Education Act (NDEA), гонки, в США был принят "Закон
which provided funding and об образовании в области
incentives for schools to improve национальной обороны (NDEA)",
their math, science, and который предусматривал
engineering curricula to prepare финансирование и поощрение школ
the future workforce. The act also за улучшение учебных программ
had provisions for research and по математике, естественным
experimentation in the use of наукам и инженерному делу для
television, radio, and motion подготовки будущей рабочей силы.
pictures for educational purposes Закон также предусматривал
and included the teaching of проведение исследований и
modern foreign languages due to экспериментов по использованию
their importance for national телевидения, радио и кино в
security. As the cold war ended, образовательных целях и включал
50
the emphasis on national security преподавание современных
diminished and the perceived иностранных языков в связи с их
urgency to teach a foreign важностью для национальной
language dropped, but the need for безопасности. С окончанием
economic competitiveness холодной войны акцент на
remained. With a rapidly growing национальной безопасности
technological society, learning уменьшился, и необходимость
computer programming provided преподавания иностранных языков
increased career opportunities. снизилась, но потребность в
However, computer programming экономической
was seen as a skillset for конкурентоспособности осталась. В
mathematicians, scientists, and условиях быстро развивающегося
engineers. технологического общества
изучение программирования
открывало большие возможности
для карьерного роста. Однако
программирование
рассматривалось как набор
навыков для математиков, ученых
и инженеров.
8 Thus, the teaching of Таким образом, при
8 computer science drew from преподавании информатики
methodologies already used in использовались методики, уже
STEM disciplines such as solving применявшиеся в STEM-
pre-set challenges and engaging in дисциплинах, такие как решение
competitions. At the time, the заранее поставленных задач и
broader benefits for everyone to участие в соревнованиях. В то
learn how to code could not yet be время еще не было понимания
perceived, as computers did not более широкой пользы от того, что
play a major role in everyday life. каждый человек научится
As technological advances rapidly программировать, поскольку
grew and a gender and racial gap компьютеры не играли большой
started to emerge among STEM- роли в повседневной жизни. По
related fields, it became clear that мере быстрого развития
computer programming needed to технического прогресса и
be taught before college, to появления гендерного и расового
prevent and address negative разрыва среди специальностей,
STEM stereotypes (Markert 1996; связанных с STEM, стало ясно, что
Madill et al. 2007). By 2011, the программирование необходимо
inclusion of computer science изучать до колледжа, чтобы
education in the K-12 curriculum предотвратить и устранить
was seen as key for “succeeding in негативные стереотипы в области
a technological society, increasing STEM (Markert 1996; Madill et al.
51
interest in the information 2007). К 2011 году включение
technology professions, информатики в учебный план К-12
maintaining and enhancing U.S. считалось ключевым для "успеха в
economic competitiveness, технологическом обществе,
supporting inquiry in other повышения интереса к профессиям
disciplines, and enabling personal в области информационных
empowerment” (National технологий, поддержания и
Research Council 2011). повышения экономической
конкурентоспособности США,
поддержки изучения других
дисциплин и расширения
возможностей личности" (National
Research Council 2011).
9 As computer science По мере того как образование
9 education entered federal agencies в области информатики выходило
and the school system, well- на уровень федеральных
funded non-profits such as учреждений и школьной системы,
Code.org championed awareness хорошо финансируемые
and access by launching curricular некоммерческие организации,
initiatives, educational такие как Code.org, способствовали
frameworks, professional повышению осведомленности о
development, and policy changes. программировании и его
In 2009, the first Computer доступности, выдвигая инициативы
Science Education Week was в области учебных программ,
held, which became the Hour of образовательных стандартов,
Code in 2013. Today, more than повышения квалификации и
100 million people have изменения образовательных
participated in this endeavor политик. В 2009 году была
(Code.org 2019). In 2015, the проведена первая "Неделя
STEM Education Act was passed образования в области
(H.R.1020 2015) representing the информатики", которая в 2013 году
first time that federal funding for превратилась в "Час кода". Сегодня
STEM was explicitly extended to в этом начинании приняли участие
cover computer science programs. более 100 миллионов человек
The National Science Foundation (Code.org 2019). В 2015 году был
launched the STEM+C (Computer принят Закон о STEM-образовании
Partnerships) program with the (H.R.1020 2015), впервые в истории
goal of “helping all students—but федеральное финансирование
particularly students in science, STEM было прямо распространено
technology, engineering and на программы по информатике.
mathematics disciplines—need to Национальный научный фонд
understand the role of computation запустил программу STEM+C
and computational thinking within (Computer Partnerships) с целью
52
disciplinary problem solving” and "помочь всем студентам - но
“to build the evidence base for особенно студентам, изучающим
effective pedagogy and естественно-научные,
pedagogical environments that технологические, инженерные и
will make the integration of математические дисциплины -
computing within STEM понять роль вычислений и
disciplines more age-appropriate вычислительного мышления в
and contemporaneously relevant решении дисциплинарных задач" и
to pre-K-12 STEM education” (de "создать доказательную базу для
Strulle and Shen n.d.). эффективной педагогики и
педагогической среды, которая
сделает интеграцию вычислений в
STEM-дисциплины более
подходящей по возрасту и
актуальной в настоящее время в
преподавании STEM до изучения
программы К-12" (de Strulle and
Shen n.d.).
1 The history of the История консолидации STEM
10 consolidation of STEM as a как дисциплинарного кластера,
disciplinary cluster strongly linked тесно связанного с информатикой,
to computer science originated in возникла в связи с необходимостью
the need to maintain US поддержания международного
international primacy by having a первенства США за счет сильной
strong economy and national экономики и национальной
security. However, it also безопасности. Однако это также
restricted the power of computer свело образование в области
science education to a limited информатики к ограниченной
group of disciplines, to a limited группе дисциплин, ограниченной
group of students and teachers, группе студентов и
and to the particular demands of преподавателей, а также к
the workforce. Pioneers, such as определенным требованиям со
Seymour Papert, the developer of стороны работников.
LOGO, and others within the Первопроходцы, такие как Сеймур
Constructionist movement, could Пейперт, разработчик LOGO, и
foresee this limitation and claimed другие участники движения
that the true power of computer конструктивистов, могли
science education was to provide предвидеть это ограничение и
new ways of thinking (Papert утверждали, что истинная сила
1980; Kafai and Resnick 1996; образования в области
Resnick 2017; Bers 2018a, b; информатики заключается в том,
Resnick et al. 2009). The feld of чтобы обеспечить новые способы
computer science education мышления (Papert 1980; Kafai and
53
Resnick 1996; Resnick 2017; Bers
2018a, b; Resnick et al. 2009). Сфера
образования в области
borrowed pedagogical approaches информатики заимствовала
from STEM disciplines and its педагогические подходы из
instructional methodologies were дисциплин STEM, а ее методики
based on solving challenges обучения были основаны на
designed to learn concepts and решении задач, направленных на
skills in a sequenced order of последовательное изучение
increased complexity. In early концепций и навыков в порядке
childhood, this approach translated возрастающей сложности. Для
into activities such as the ones раннего детства этот подход
promoted by the popular Code.org воплотился в мероприятиях,
website. These are carefully подобных тем, которые
designed to engage children in продвигаются на популярном сайте
solving structured puzzle-like Code.org. Они тщательно
challenges, such as navigating разработаны, чтобы вовлечь детей
mazes using instructional в решение структурированных
commands. Lessons in the K-12 задач, похожих на головоломки,
sequence feature a series of таких как прохождение лабиринтов
increasingly more complex mazes с помощью обучающих команд.
that vary in theme, but essentially Уроки в программе К-12 включают
rely on direction cues to move an в себя серию все более сложных
object around the screen. лабиринтов, которые различаются
по тематике, но в основном
основаны на подсказках о
направлении движения объекта по
экрану.
1 Children need to solve the Детям необходимо пройти
11 maze and then can move up to the лабиринт, после чего они могут
next level. Although popular, перейти на следующий уровень.
based on the ease of classroom Несмотря на свою популярность,
implementation, approaches such основанную на простоте
as this one reduce the potential of реализации в школьных кабинетах,
learning how to code to a подходы, подобные этому, сводят
problem-solving activity, ignoring потенциал обучения написанию
the expressiveness and кода к решению задач, игнорируя
communicative functions of самовыражение и
programming. Coding is about коммуникативные функции
making meaning by creating a кодирования. Кодирование - это
personally meaningful project that обретение смысла путем создания
can be shared with others. Puzzle- личностно значимого проекта,
type approaches miss the которым можно поделиться с
54
opportunity to explore the richness другими. Подходы по принципу
of a programming language as a головоломок упускают
symbol system with a grammar возможность изучить богатство
and syntax that can be used to языка программирования как
express thoughts and ideas. системы символов с грамматикой и
Furthermore, a few decades ago, синтаксисом, которые можно
Papert suggested that the process использовать для выражения
of learning to program may be мыслей и идей. Более того,
akin to learning a new language несколько десятилетий назад
(Papert 1987). However, empirical Пейперт предположил, что процесс
research did not explore this path, обучения программированию
neither instructional programs nor может быть сродни изучению
curriculum were developed based нового языка (Papert 1987). Однако
on this observation. The CAL эмпирические исследования не
approach, described next, изучали этот путь: ни обучающие
addresses this. программы, ни учебные планы не
были разработаны на основе этого
An alternative
наблюдения. Подход CAL,
perspective: coding as another
описанный далее, решает эту
language
проблему.
The CAL approach,
Альтернативная
presented in this paper, is in sharp
перспектива: кодирование как
contrast with the STEM tradition
другой язык
described earlier. CAL’s influence
can be traced back to two lines of Подход CAL,
work: First, Constructionism, представленный в данной статье,
developed by Seymour Papert резко контрастирует с традицией
(Papert 1980; Bers 2008; Resnick STEM, описанной ранее. Влияние
2017; Kafai and Resnick 1996), CAL можно проследить по двум
which shows that, when children направлениям: Во-первых,
have opportunities to learn a конструкционизм, разработанный
programming language to create Сеймуром Пейпертом (Papert 1980;
computational projects to express Bers 2008; Resnick 2017; Kafai and
themselves, they are likely to Resnick 1996), который показывает,
encounter powerful ideas from что, когда дети имеют возможность
different disciplines, and to think изучать язык программирования
about their own thinking. Second, для создания вычислительных
the long-standing work on literacy проектов, как средство
instruction, based on research on самовыражения, они, скорее всего,
how young children learn to read столкнутся с глубокими идеями из
and write and the cognitive разных дисциплин и задумаются о
changes associated with that своем собственном мышлении. Во-
progression, which provides tools вторых, многолетняя работа по
for adapting the processes of обучению грамотности, основанная
55
learning how to read and write a на исследованиях того, как
natural language to an artificial маленькие дети учатся читать и
language. писать, и когнитивных изменений,
связанных с этим процессом, что
дает инструменты для адаптации
процессов обучения чтению и
письму на естественном языке к
искусственному языку.
1 CAL’s premise is that Предпосылкой для
12 coding is a literacy for the 21st программы CAL является тот факт,
century and, as such, it can borrow что кодирование - это грамотность
strategies for teaching other XXI века, и поэтому она может
literacies (Bers 2019). заимствовать стратегии обучения
Alphabetical literacy enables другим видам грамотности (Bers
people to represent and interpret 2019). Алфавитная грамотность
ideas through texts that can travel позволяет людям представлять и
away from immediate contexts интерпретировать идеи через
and still be understood by people тексты, которые могут выходить за
(Vee 2013). Similarly, algorithms пределы непосредственного
allow people to represent ideas контекста и при этом быть
through computer programs that понятыми людьми (Vee 2013).
are interpreted by a computer or a Аналогичным образом, алгоритмы
robot. Both activities, coding and позволяют людям представлять
reading and writing, involve a идеи через компьютерные
problem-solving dimension as программы, которые
well as the use and manipulation интерпретируются компьютером
of a language, a symbolic или роботом. Оба вида
representational system, to create деятельности - кодирование и
a sharable, interpretable product. чтение с письмом - предполагают
For alphabetical literacy, a natural решение проблем, а также
language. For coding literacy, an употребление языка и
artificial language. Research has манипулирование им, как
explored the similarities and символической репрезентативной
differences between natural and системой, для создания доступного
artificial languages and для обмена и интерпретации
interdisciplinary endeavors such результата. Для алфавитной
as natural language processing and грамотности - естественный язык.
computational linguistics have Для грамотности в кодировании -
emerged (Allamanis et al. 2018). искусственный язык. В ходе
While that work is beyond the исследований изучались сходства и
scope of this paper, it is important различия между естественными и
to establish that both natural and искусственными языками, и
artificial languages meet three произошло столкновение с такими
56
междисциплинарными
направлениями, как обработка
естественного языка и
вычислительная лингвистика
(Allamanis et al. 2018). Хотя эта
common criteria: they are деятельность выходит за рамки
meaningful, productive, and allow данной статьи, важно установить,
displacement (Norman 2017). что как естественные, так и
искусственные языки отвечают
трем общим критериям: они
содержательные, порождающие и
допускают смещение (Norman
2017).
1 That is to say, languages are Иными словами, языки - это
13 symbolic representational systems, символические репрезентативные
with a grammar and syntax, that системы с грамматикой и
can be used to convey meaning, to синтаксисом, которые можно
produce something that has never использовать для передачи смысла,
happened before, and to создания чего-то, чего раньше не
communicate about things that are было, и общения о вещах,
displaced in time or space. Thus, смещенных во времени или
the end goal of the activity of пространстве. Таким образом,
coding and decoding is to конечной целью деятельности по
ultimately comprehend, generate, кодированию и декодированию
communicate, and express ideas or является осмысление,
thoughts by making a sharable формирование, передача и
product that others can interpret выражение идей или мыслей путем
(Bers 2018a). Within this создания доступного продукта,
perspective, CAL puts problem который могут интерпретировать
solving at the service of personal другие (Bers 2018a). В рамках этой
expression. CAL’s approach and перспективы CAL ставит решение
curriculum explores the parallels задач на службу самовыражению
between programming and natural личности. Подход и учебная
languages and their программа CAL исследуют
communicative and expressive параллели между
functions. Research shows that программированием и
children learn to think with and естественными языками и их
through language (Vygotsky коммуникативными и
1978). Thus, by learning to use a выразительными функциями.
programming language that Исследования показывают, что
involves logical sequencing, дети учатся думать с помощью
abstraction, and problem solving, языка и через язык (Выготский
children can learn how to think in 1978). Таким образом, изучая язык
57
analytical ways. Wittgenstein программирования, который
(1997) argued that the language предполагает логическое
we speak determines the thoughts следование, абстрагирование и
we are able to have. In other решение задач, дети могут
words, learning a new language научиться мыслить аналитически.
can make new patterns of thought, Витгенштейн (1997) утверждал, что
new conceptual frameworks, and язык, на котором мы говорим,
new ways of using language определяет мысли, которые у нас
(Wittgenstein 1997). могут возникнуть. Другими
Wittgenstein’s philosophy echoes словами, изучение нового языка
Vygotsky’s developmental может создать новые модели
perspective in terms of the мышления, новые концептуальные
relationship between language and основы и новые способы
thinking at the individual level. использования языка
Furthermore, researchers such as (Витгенштейн, 1997). Философия
Walter Ong, while studying Витгенштейна перекликается с
societies that are transitioning перспективой развития Выготского
from orality to literacy, also found в том, что касается взаимосвязи
a fundamental shift in their form между языком и мышлением на
of thought (Ong 1982). Just like индивидуальном уровне. Более
literacy, coding can change not того, такие исследователи, как
only the way we think, but also the Уолтер Онг, изучая общества,
way we see ourselves in society. переходящие от устной речи к
Mitchel Resnick and David Siegel, письменности, также обнаружили
when discussing the creation of фундаментальный сдвиг в их
the Scratch Foundation to promote форме мышления (Ong 1982). Как и
an expressive approach to coding, письменность, умение писать код
wrote (Resnick and Siegel 2015): может изменить не только способ
“For us, coding is not a set of мышления, но и то, как мы видим
technical skills but a new type of себя в обществе. Митчел Резник и
literacy and personal expression, Дэвид Сигел, обсуждая создание
valuable for everyone, much like фонда Scratch Foundation для
learning to write. We see coding продвижения выразительного
as a new way for people to подхода к кодированию, написали
organize, express, and share their (Resnick and Siegel 2015): "Для нас
ideas … In many introductory написание кода - это не набор
coding activities, students are технических навыков, а новый вид
asked to program the movements письменности и самовыражения,
of a virtual character navigating ценный для каждого, подобно
through a set of obstacles toward a обучению письму. Мы
goal. This approach can help рассматриваем кодирование как
students learn some basic coding новый способ систематизации и
concepts, but it doesn’t allow them выражения идей, а также обмена
to express themselves creatively— ими... Во многих вводных занятиях
58
or develop a long-term по написанию кода студентов
engagement with coding. It’s like просят написать программу
offering a writing class that движения виртуального персонажа,
teaches only grammar and проходящего через ряд
punctuation without providing препятствий к цели. Такой подход
students a chance to write their может помочь студентам освоить
own stories” (Resnick and Siegel некоторые базовые концепции
2015, pp. 1–3). кодирования, но он не позволяет
им выразить себя творчески или
развить долгосрочное увлечение
написанием кода. Это все равно,
что давать уроки письма, в которых
преподают только грамматику и
пунктуацию, не предоставляя
ученикам возможности писать свои
собственные истории" (Resnick and
Siegel 2015, pp. 1-3).
1 Papert reminded us that, Пейперт напомнил нам, что,
14 using this approach, children are используя этот подход, дети,
not only likely to learn how to скорее всего, не только научатся
program but also to encounter программировать, но и столкнутся
knowledge from other disciplines. со знаниями из других дисциплин.
For example, in his own work Например, в своей работе с LOGO
with LOGO, Papert described the Пейперт описал встречу с
encounter with mathematics математикой (Papert 1980).
(Papert 1980). The CAL Учебный план CAL ставит
curriculum puts computer science информатику в прямой контакт с
in direct conversation with важными идеями в области
powerful ideas from literacy грамотности, определенными
identified by Chall (1983) and Чаллом (1983) и другими
other literacy scholars (e.g., исследователями грамотности
Shanahan et al. 2010; Duke and (например, Shanahan и др. 2010;
Pearson 2002; Carnine et al. Duke и Pearson 2002; Carnine и др.
2006). The process of learning 2006). Процесс обучения
how to program expressively takes выразительному
time and requires instruction. программированию занимает время
While children can discover things и требует обучения. Хотя дети
on their own, a curriculum shows могут самостоятельно открывать
a pathway to expose them to a для себя что-то новое, учебная
comprehensive scope and программа показывает путь, по
sequence. However, curriculum которому их можно ознакомить с
must be grounded on maturational полным объемом знаний и
stages or learning trajectories, последовательностью их
59
получения. Однако учебный план
должен быть основан на стадиях
developmental models of how созревания или траекториях
children think and operate within a обучения, моделях развития
domain (Clements 2007; Clements мышления и деятельности детей в
and Sarama 2004). I coined the той или иной сфере (Clements 2007;
term “coding stages” to describe Clements and Sarama 2004). Я
the learning trajectories in the придумала термин "этапы изучения
domain of computer science that кодирования" для описания
young children go through, with траекторий обучения в области
increasingly nuanced levels of информатики, с возрастающим
sophistication, when engaged with уровнем сложности, по которому
an intentional curriculum, such as целенаправленно обучаются
CAL curriculum. The next section маленькие дети, например,
introduces six coding stages and учебного плана CAL. В следующем
draws parallels to stages of разделе представлены шесть этапов
literacy development: emergent, изучения кодирования и проведены
coding and decoding, fluency, new параллели с этапами развития
knowledge, multiple perspectives, грамотности: зарождение,
and purposefulness. кодирование и декодирование,
свободное владение, новые знания,
множественные перспективы и
целенаправленность.
1 Coding stages Этапы изучения
15 кодирования
Describing the activity of
coding as a learning progression Описание деятельности по
assumes a developmental написанию кода, как процесса
approach supported by instruction обучения, предполагает подход к
that takes into account both образованию, основанный на
cognitive as well as преподавании, которое учитывает
socioemotional factors. Efforts to как когнитивные, так и социально-
describe learning as a progression эмоциональные факторы. Попытки
of stages are influenced by описать обучение как прохождение
Piaget’s work (1952); however, последовательности этапов
the coding stages presented in this навеяны работами Пиаже (1952),
paper depart in an important way. однако этапы изучения
This is not a universal attempt at кодирования, представленные в
explaining a naturally occurring данной работе, существенным
phenomenon, as was Piaget’s образом от них отличаются. Это не
cognitive development stages. It is всеобъемлющая попытка объяснить
an effort to create a blueprint to естественно возникающее явление,
describe a learning path for young как это было со стадиями
children that can be supported когнитивного развития Пиаже. Это
60
through instruction that includes попытка создать план для описания
both a curriculum (e.g., CAL), a пути обучения детей младшего
programming language (e.g., возраста, который может быть
KIBO robotics and/or ScratchJr), поддержан посредством
and a pedagogical approach [e.g., преподавания, включающего
The Positive Technological учебную программу (например,
Development framework (Bers CAL), язык программирования
2012)]. The instructional elements (например, программирование
in the curriculum are designed роботов KIBO и/или ScratchJr) и
with a scope and sequence that педагогический подход [например,
corresponds to a developmental концепцию позитивного
progression that starts by технологического развития (Bers
exploring what is the concept of 2012)]. Учебные элементы в
programming and technology, and учебной программе разработаны в
culminates with the ability to том объеме и с той
purposefully create a program to последовательностью, которые
express themselves in a соответствуют последовательному
meaningful way. Stages are not изучению, которое начинается со
fixed and linear, and children can знакомства с концепциями
move up and down stages and программирования и технологии и
encounter one or more stages at завершается формированием
the same time. The CAL способности целенаправленно
curriculum is explicitly designed создавать программы, для
to help children move through six осмысленного самовыражения.
coding stages: emergent, coding Этапы не являются
and decoding, fluency, new фиксированными и линейными, и
knowledge, multiple perspective, дети могут двигаться вверх и вниз
and purposefulness. Each and по этапам и сталкиваться с одним
every one of these stages involves или несколькими этапами
the creation of a personally одновременно. Учебная программа
meaningful computational project. CAL разработана таким образом,
чтобы помочь детям пройти через
шесть этапов изучения
кодирования: зарождение,
кодирование и декодирование,
свободное владение, новые знания,
множественные перспективы и
целенаправленность. Каждый из
этих этапов включает в себя
создание лично значимого
программного проекта.
1 While in early childhood В то время как в области
16 mathematics (Clements and математики (Clements and Sarama
61
Sarama 2004) and early childhood 2004) и грамотности (Lonigan et al.
literacy (Lonigan et al. 2008) there 2008) для детей младшего возраста
has been extensive research on были проведены обширные
defining learning progressions and исследования по определению
stages, very little work has been последовательности и этапов
done with early childhood обучения, в области информатики
computer science. Pilot research для детей младшего возраста было
explored a developmental model проделано очень мало работы. В
of programming based on экспериментальном исследовании
observations of children 4–7 изучалась модель развития
years old using KIBO robotics, программирования, основанная на
and categorized children into four наблюдениях за детьми 4-7 лет,
stages: proto-programmer, early использующими робототехнику
programmer, programmer, and KIBO, в которой дети были
fluent programmer (Vizner 2017). разделены на четыре ступени:
These exploratory trajectories start "протопрограммист", начинающий
with learning that order matters программист, программист и
and ends with learning more опытный программист (Vizner
complex patterns of sequencing 2017). Эти ознакомительные курсы
such as conditionals and loops. начинаются с изучения того, что
Data from this work show that порядок имеет значение, и
children’s stages did not заканчиваются изучением более
correspond to age. This finding is сложных моделей
consistent with previous work. последовательности, таких как
While some studies found that условные знаки и циклы. Данные
children ages 5–6 may have a из этой работы показывают, что
limited ability to grasp the этапы обучения детей не
programming of conditionals (e.g., соответствовали их возрасту. Этот
if–then) (Barrouillet and Lecas вывод согласуется с предыдущими
1999; Janveau-Brennan and работами. В то время как
Markovits 1999), other studies некоторые исследования показали,
found that age did not correlate что дети в возрасте 5-6 лет могут
with performance on conditional обладать ограниченной
and repeat programs (Elkin et al. способностью к усвоению
2016; Strawhacker and Bers программирования условных
2015). While useful, these efforts алгоритмов (например, if-then)
at creating learning trajectories did (Barrouillet and Lecas 1999; Janveau-
not take into consideration the Brennan and Markovits 1999),
expressive dimension of другие исследования показали, что
programming. They mostly возраст не коррелирует с
focused on the sequencing and результатами выполнения
problem-solving aspects of программ, в которых были условия
programming. The work presented и повторения (Elkin et al. 2016;
in this paper extends this research Strawhacker and Bers 2015).
62
Несмотря на свою полезность, эти
попытки создать траектории
обучения не учитывали
выразительность
программирования. Они в
основном фокусировались на
последовательности действий и
by focusing on coding as a аспектах решения задач
literacy; thus, the expressive and программирования. Работа,
communicative dimensions are представленная в данной статье,
central in defining coding stages расширяет эти исследования,
or learning trajectories. фокусируясь на написании кода как
Furthermore, research on на языковой грамотности; таким
emergent literacy stages informed образом, выразительные и
the description of the coding коммуникативные аспекты
stages. занимают центральное место в
определении этапов изучения
кодирования или учебных планов.
Кроме того, при описании этапов
изучения кодирования
использовались результаты
исследования развития
грамотности.
1 Scholars on emergent Специалисты по вопросам
17 literacy have found that children формирующейся грамотности
enter school with a great deal of пришли к выводу, что дети
skill and knowledge about reading приходят в школу с большим
and writing, although perhaps not количеством навыков и знаний о
in a formal or conventional way чтении и письме, хотя, возможно, и
(e.g., Ferreiro and Teberosky не в формальной или
1982; Sulzby 1989; Sulzby and общепринятой форме (например,
Teale 1991; Whitehurst and Ferreiro and Teberosky 1982; Sulzby
Lonigan 2001). This early 1989; Sulzby and Teale 1991;
knowledge lays the foundation for Whitehurst and Lonigan 2001). Эти
later literacy success. This insight ранние знания закладывают основу
is applicable when thinking about для последующего успеха в
coding, even though there is no освоении грамотности. Эта мысль
“orality” period, children are применима и при размышлении о
immersed in an interactive написании кода. Несмотря на
technologically rich world, before отсутствие периода "устности",
they are even aware of what дети погружаются в интерактивный
programming is and frequently технологически насыщенный мир
encounter powerful ideas, such as еще до того, как узнают, что такое
63
sequencing, cause and effect, программирование, и часто
correspondence, that are сталкиваются с глубокими идеями,
foundational for coding. Just as такими как последовательность,
children do not begin to talk by причина и следствие, соответствие,
speaking in complex utterances, or которые являются фундаментом
decode by reading a novel (Chall для написания кода. Подобно тому,
1983), children do not begin как дети не начинают говорить,
writing in complete sentences but произнося сложные фразы, или
start by scribbling (Puranik and расшифровывать смысл текста,
Lonigan 2011; Ferreiro and читая роман (Chall 1983), дети не
Teberosky 1982). Reading and начинают писать законченными
writing are intimately related. предложениями, они начинают с
Although research on writing has каракулей (Puranik and Lonigan
been scarce compared to that on 2011; Ferreiro and Teberosky 1982).
reading, literacy researchers have Чтение и письмо тесно связаны
identified a learning progression между собой. Несмотря на то, что
or stages that can happen through исследования в области письма
instruction. The same applies to были скуднее, чем в области
coding. Children do not start by чтения, исследователи грамотности
programming complex algorithms определили последовательность
and using nested control (или этапы) обучения, которая
structures. They begin with simple может быть пройдена в процессе
sequencing (Lockwood and обучения. То же самое относится и
Mooney 2018; Jenkins 2002; к написанию кода. Дети не
Guzdial and Morrison 2016) and a начинают с программирования
well-developed curriculum can сложных алгоритмов и
help them move through more использования вложенных
sophisticated stages. While there структур управления. Они
is a rich tradition of cognitive начинают с простой
scientists, experimental последовательности действий
psychologists, and psycholinguists (Lockwood and Mooney 2018;
doing basic research on how the Jenkins 2002; Guzdial and Morrison
brain learns to read (Wolf and 2016), а хорошо разработанная
Stoodley 2007; Dehaene 2010) учебная программа может помочь
and write (Puranik and Lonigan им пройти через более сложные
2011; Bialystok 1991) and there этапы обучения. Хотя существует
are well-known controversies and богатая традиция когнитивистов,
theoretical battles based on that экспериментальных психологов и
research, such as the Reading психолингвистов, проводящих
Wars (Pearson, 2004) and the фундаментальные исследования
Linearity and Unified Hypothesis того, как мозг учится читать (Wolf
in writing (Tolchinsky 2003; Fox and Stoodley 2007; Dehaene 2010) и
and Saracho 1990), there is a lack писать (Puranik and Lonigan 2011;
of research on the cognitive Bialystok 1991), и на основе этих
64
исследований существуют
известные споры и теоретические
баталии, такие как "Война за
чтение" (Pearson, 2004) и гипотеза
линейности и унифицированности
mechanisms involved when young
в письме (Tolchinsky 2003; Fox and
children learn to code (Fedorenko
Saracho 1990), в это же время
et al. 2019).
исследований когнитивных
механизмов, задействованных при
обучении маленьких детей
написанию кода, не хватает
(Fedorenko et al. 2019).
1 Some research explores the Некоторые исследования
18 differences between expert and изучают различия между
novice programmers (Dalbey and опытными и начинающими
Linn 1985) and other employs программистами (Dalbey and Linn
tools such as fMRI (Siegmund 1985), а другие используют такие
et al. 2014; Floyd et al. 2017) to инструменты, как фМРТ (Siegmund
characterize mechanisms and et al. 2014; Floyd et al. 2017), чтобы
propose a theoretical foundation to охарактеризовать эти механизмы и
ground this novel work. However, предложить теоретический
there is not enough empirical work фундамент для обоснования данной
to be able to categorically identify новой работы. Однако
different stages in the coding эмпирических трудов
learning progression. The six недостаточно, чтобы можно было
coding stages presented here are однозначно определить различные
based on behavioral observations этапы обучения написанию кода.
and data collection from over two Представленные здесь шесть
decades of work conducted with этапов изучения кодирования
young children (4 to 7) learning to основаны на наблюдениях за
code in different settings using a поведением детей и сборе данных,
variety of integrated CAL based полученных в ходе более чем
curriculum. CAL positions the двадцатилетней работы с детьми
process of coding as a semiotic младшего возраста (от 4 до 7 лет),
act, a meaning making activity, обучающимися написанию кода в
and not only a problem-solving различных условиях с
challenge, even during its earliest, использованием различных
most basic levels of instruction. интегрированных учебных
Thus, throughout all six coding программ на основе CAL. CAL
stages, the instruction involves позиционирует процесс написания
children using the programming кода как семиотический акт,
language to create and share a деятельность по созданию смысла,
personally meaningful project. а не только как решение задач,
65
даже на самых ранних, базовых
уровнях обучения. Таким образом,
на всех шести этапах изучение
кодирования предполагает, что
дети будут использовать язык
This approach is informed by программирования для того, чтобы
Constructionism (Papert 1980). создать личностно значимый
This research was done with проект и поделиться им с другими.
block-based programming Этот подход основан на
languages, ScratchJr and KIBO, конструктивизме (Papert 1980). Это
which engage children in исследование было проведено с
sequential thinking and present использованием блочных языков
interfaces that are программирования ScratchJr и
developmentally appropriate and KIBO, которые вовлекают детей в
explicitly designed to promote логическое мышление и
literacy and expressiveness (Bers представляют интерфейсы,
2018b). The following table (see соответствующие развитию детей и
Table 1) describes the six coding явно предназначенные для
stages and draws parallels with повышения грамотности и
stages of literacy development. экспрессивности (Bers 2018b). В
However, it is important to note следующей таблице (см. таблицу 1)
that Chall’s stages (Chall 1983) описаны шесть этапов изучения
begin with babies and extend кодирования и проведены
beyond college, tapping into the параллели с этапами формирования
life span. In contrast, the грамотности. Однако важно
characterization of coding stages отметить, что этапы Чалла (Chall
proposed here focuses only on 1983) начинаются с младенчества и
early childhood, spanning the 4 to продолжаются после колледжа,
7 years old range. охватывая весь жизненный цикл. В
отличие от этого, предложенная
здесь характеристика стадий
кодирования сосредоточена только
на раннем детстве, охватывая
возраст от 4 до 7 лет.
1 Although the progression Хотя переход от одного этапа
19 from one coding stage to the next изучения кодирования к другому не
is independent of age, the зависит от возраста, уровень
developmental level of the child развития ребенка определяет,
informs how quickly the child can насколько быстро он сможет
progress through the stages. The пройти эти этапы. Подход CAL
CAL approach assumes that предполагает, что обучение
teaching to code involves the use написанию кода включает в себя
of a developmentally appropriate использование соответствующего
66
уровню развития ребенка языка
программирования, такого как
KIBO или ScratchJr, разработанного
programming language such as для введения таких понятий, как
KIBO or ScratchJr, designed to циклы и условия, а также для
both introduce concepts such as содействия самовыражению и
loops and conditionals, and also творчеству. Учитывая, что это
support personal expression and вводные языки программирования,
creativity. Given that these are можно достичь более сложных
introductory programming этапов (множественные
languages, it is possible to reach перспективы и
the more complex stages (multiple целенаправленность) при
perspectives and purposefulness) надлежащем преподавании и
with sufficient instruction and времени обучения, а также начать
learning time, as well as to begin изучать такие важные идеи из
exploring powerful ideas from the дисциплины информатики, как
discipline of computer science алгоритмы, модуляризация,
such as algorithms, представление, управляющие
modularization, representation, структуры, процесс
control structures, the design проектирования, отладка,
process, debugging, software, and программное и аппаратное
hardware (Bers 2008). Through обеспечение (Bers 2008). С точки
the lens of CAL, coding is not зрения CAL, написание кода - это
only an instrumental tool for не только средство для решения
problem solving, but a задач, но и коммуникативный
communicative tool for инструмент для самовыражения.
expression. Thus, the pedagogy Таким образом, педагогика и
and the curriculum must scaffold учебный план должны открывать
opportunities for the creation of возможности для создания
meaningful projects. The осмысленных проектов. В
following stories present children следующих историях
learning with either KIBO or рассказывается о детях,
ScratchJr and exhibiting behaviors обучающихся с помощью KIBO
that characterize each of the six или ScratchJr и демонстрирующих
different stages of coding. These поведение, характерное для
vignettes occurred in the context каждого из шести различных
of a variety of learning settings этапов изучения кодирования. Эти
that utilized different versions of истории произошли в контексте
integrated CAL curricula with различных условий обучения, в
diverse disciplinary content. которых использовались разные
версии интегрированных учебных
программ CAL с разнообразным
дисциплинарным содержанием.
67
2 Table 1 The six different Таблица 1 Шесть
20 coding stages that young различных этапов изучения
children move through when кодирования, через которые
learning to code with CAL, and проходят маленькие дети, когда
their corresponding literacy учатся писать код с помощью
stages CAL, и соответствующие им
этапы грамотности
Stages Coding
Literacy Этапы Кодирование
Грамотность
1. Emergent
1. Возникновение
Learn the variety of
purposes of technology Изучение разнообразия целей
(hardware/software). Recognize использования технологий
that technologies are human (аппаратное/программное
engineered Explore what a обеспечение). Понимание того, что
programming language is and технологии создаются человеком.
when it is used Learn concepts of Изучение того, что такое язык
interface (e.g., turning on and of, программирования и когда он
different elements of interfaces, используется. Изучение понятий
screens, inputs and outputs) интерфейса (например, включение
Understand the concept of и выключение, различные
symbolization and representation элементы интерфейсов, экраны,
(i.e., a command is not the входы и выходы). Понимание
behavior, but represents the концепции символизации и
behavior) Explore basic control представления (т.е. команда не
structures, such as cause and effect является поведением, а
Identify when technologies do not представляет поведение). Изучить
work and the need to problem основные структуры управления,
solve такие как причина и следствие.
Определение того, когда
Learn the variety of
технологии не работают, и когда
purposes of language Explore the
необходимо решать задачи.
structure of the language and
recognize some signs Learn Изучение разнообразия целей
concepts of print (e.g., recognize языка. Исследование структуры
in a story book where the words языка и распознавание некоторых
are on the page, know how to hold символов. Изучение понятий
a book and a pen) Understand the печати (например, распознавание,
concept of symbolization and где находятся слова на странице
representation (i.e., a noun is not книги, знание того, как держать
the object itself, but represents an книгу и ручку). Понимание
object) Recognize the diference концепции символизации и
between writing drawing and репрезентации (например,
scribbling существительное не является
68
2. Coding and decoding самим предметом, а представляет
предмет). Понимание разницы
Learn a limited set of
между письмом, рисунком и
symbols (syntax) and grammar
каракулями.
rules within a programming
language Understand that 2. Кодирование и
sequencing matters and that the декодирование
order in which commands
Изучение ограниченного
(symbols) are put together
набора символов (синтаксиса) и
generates diferent behaviors
грамматических правил языка
Create simple programs with
программирования. Понимание
simple cause and efect commands
того, что последовательность
Learn to engage in simple
действий имеет значение и что
debugging by trial and error
порядок, в котором команды
Identify and fx grammatical errors
(символы) собраны вместе, создает
in the code (i.e., make it work)
различные модели поведения.
Instruction is specifc to the
Создание простых программ с
developmentally appropriate
помощью простых команд
programming language of choice
причинно-следственных связей.
(e.g., KIBO or ScratchJr)
Обучение простым методам
отладки методом проб и ошибок.
Выявление и исправление
грамматических ошибок в коде (т.е.
заставить код работать). Обучение
проводится на подходящем для
уровня развития ребенка языке
программирования (например,
KIBO или ScratchJr).
2 Learn the arbitrary set of Знакомство с произвольным
21 letters and begin associating them набором букв и начало
with corresponding sounds and ассоциирования их с
parts of spoken words and соответствующими звуками и
between printed and spoken words частями произносимых слов, а
Learn the ‘alphabetic principle’ также между печатными и
and the spelling (orthographic) произносимыми словами. Изучение
system Acquire general "алфавитного принципа" и
understanding of the spelling- орфографической системы.
sound system Read and write Получение общего представления о
simple text with high-frequency системе "буква-звук". Чтение и
words and phonically regular написание простого текста с
words Learn to edit the writing высокочастотными словами и
and fx errors Instruction is specifc фонетически правильными
to the particular natural language словами. Обучение
69
used редактированию письменных работ
и исправлению ошибок. Обучение
3. Fluency
проводится с учетом особенностей
Consolidation of all that используемого естественного
was previously learned Master the языка.
full syntax of the programming
3. Свободное владение
language and be able to create
complex programs using control Закрепление всего, что было
structures Apply knowledge изучено ранее. Овладение полным
gained to create complex синтаксисом языка
programs that are personally программирования и умение
meaningful Ability to apply all создавать сложные программы с
steps of the design process использованием управляющих
Distinguish and fx logical errors in структур. Применение полученных
the code (i.e., a program runs, but знаний для создания сложных
it doesn’t do what is expected) программ, имеющих личный
Transition from ‘learning to code’ смысл. Умение применять все
to ‘coding to learn’ этапы процесса проектирования.
Выявление и исправление
Accomplish automatic
логических ошибок в коде (т.е.
word-recognition and increasingly
программа запускается, но не
fuent reading and writing.
делает того, что ожидается).
Consolidation of all that was
Переход от принципа "учиться
previously learned. Apply
писать код" к принципу "писать
knowledge gained to read and
код, чтобы учиться".
write increasingly complex words
and stories. Transition from Автоматическое
‘learning to read’ to ‘reading to распознавание слов и все более
learn’’ Distinguish between уверенное чтение и письмо.
grammatical and semantical errors Закрепление всего ранее
in a sentence Being able to write изученного. Применение
complex stories and begin to полученных знаний для чтения и
explore diferent genres написания все более сложных слов
и текстов. Переход от "учиться
4. New knowledge
читать" к "читать, чтобы учиться".
Ability to combine multiple Умение различать грамматические
control structures and create и семантические ошибки в
nested programs for making a предложении. Умение писать
complex project Consolidation of сложные рассказы и начинать
debugging tools, allowing for изучать различные жанры.
more strategic debugging
4. Новые знания
Learning how to learn new
commands Умение комбинировать
несколько структур управления и
создавать вложенные программы
70
для создания сложного проекта.
Объединение инструментов
отладки, позволяющее проводить
более стратегическую отладку.
Обучение новым командам.
2 A qualitative shift in the Качественный сдвиг в
22 nature and demands of reading характере и требованиях к чтению
and writing Exposure to new и письму. Знакомство с новым
readings and interpretations, and чтением и интерпретациями, а
ability to do more complex writing также способность к более
Emphasis is on vocabulary and сложным письменным работам.
background knowledge growth Упор делается на расширение
словарного запаса и базовых
5. Multiple perspectives
знаний.
Understand a situation from
5. Множественные
the point of view of others and be
перспективы
able to create programs that refect
this understanding Creating Понимание ситуации с точки
programs that involve user’s input зрения других людей и умение
and that can span diferent создавать программы, отражающие
expressive genres (i.e. games, это понимание. Создание
stories) программ, в которых задействован
пользовательский ввод и которые
Reading widely from a
могут охватывать различные
broad range of complex materials,
выразительные жанры (например,
both exposi- tory and narrative,
игры, рассказы).
with a variety of viewpoints.
Ability to write from multiple Чтение широкого круга
perspectives, utilize diferent сложных материалов, как
voices, and switch genres easily описательных, так и
повествовательных, с различными
6. Purposefulness
точками зрения. Способность
Coding is skillfully used for писать с разных точек зрения,
one’s own needs and purpose использовать разные голоса и легко
Coding at high levels of переходить от одного жанра к
abstraction requiring high skill and другому.
fexibility Coders analyze,
6. Целенаправленность
synthesize, and make judgments
based on what they read Coding is Написание кода умело
rapid and efcient используется для собственных
нужд и целей. Написание кода на
Reading and writing are
высоких уровнях абстракции,
skillfully used for one’s own
требующее высокого мастерства и
needs and purpose Reading and
гибкости ума. Кодеры
71
writing at high levels of анализируют, синтезируют и
abstraction requiring high skill and выносят суждения на основе
fexibility. Readers and writers прочитанного. Процесс написания
analyze, synthesize, and make кода быстрый и эффективный.
judgments based on what they
Чтение и письмо умело
read and what they want to write
используются для собственных
Reading and writing is rapid and
нужд и целей. Чтение и письмо на
efcient
высоких уровнях абстракции,
требующих высокого мастерства и
гибкости ума. Читатели и писатели
анализируют, синтезируют и
выносят суждения на основе
прочитанного и того, что они хотят
написать. Чтение и письмо быстрое
и экономное.
1 Emergent stage Начальная стадия
23
Jenny is 4 years old, and at Дженни 4 года, и в детском
preschool she receives an iPad саду она получает iPad с
with ScratchJr. Jenny is very программой ScratchJr. Дженни
comfortable with her mom’s cell уверенно пользуется мобильным
phone, and although she has seen телефоном своей мамы, и хотя она
tablets before, she was never уже видела планшеты, ей никогда
allowed to use them on her own. не разрешали пользоваться ими
Jenny’s teacher told her class that самостоятельно. Учительница
for the next 3 weeks they were Дженни сказала классу, что в
going to be using tablets with течение следующих трех недель
ScratchJr, a programming они будут использовать планшеты
language to make animations. с ScratchJr, языком
Jenny is not exactly sure what a программирования для создания
programming language is, but she мультфильмов. Дженни не совсем
loves animations. She watches понимает, что такое язык
them on TV, as well as on her программирования, но она любит
mom’s phone. The invitation of мультфильмы. Она смотрит их по
making her own animation is телевизору, а также на телефоне
intriguing. During the frst lesson, своей мамы. Предложение создать
Jenny is told how to turn on and of свой собственный мультфильм ее
the tablet, how to position it заинтриговало. Во время первого
correctly and how to launch урока Дженни объясняют, как
ScratchJr by clicking on the icon включить планшет, как правильно
that shows a picture of a kitten. его расположить и как запустить
She is also told to ask for help if ScratchJr, нажав на значок с
text that she can’t read appears on изображением котенка. Ей также
72
говорят, что нужно попросить
помощи, если на экране появляется
текст, который она не может
the screen. Jenny’s teacher shows прочитать. Учительница Дженни
the class how to take care of the показывает классу, как ухаживать
tablet, which is expensive, and за дорогим планшетом и как
how to put it away in its charging убирать его в зарядную станцию,
station, so the next class can also чтобы следующий класс тоже мог
use it. Once fnished with the им пользоваться. Закончив с
basics, Jenny’s teacher connects основами, учительница Дженни
her own tablet to the projector and подключает свой планшет к
shows children an animation she проектору и показывает детям
made with ScratchJr. There is an анимацию, которую она сделала с
elephant walking in the jungle. помощью ScratchJr. По джунглям
The elephant stops when it gets to идет слон. Слон останавливается,
a puddle and then makes a silly когда доходит до лужи, а затем
noise (see Fig. 1). Jenny loves it. издает дурашливый звук (см. рис.
She fnds it very funny. The 1). Дженни это нравится. Она
teacher shows children the diferent находит это очень забавным.
elements she used for making the Учительница показывает детям
animation: the backgrounds, the различные элементы, которые она
characters, the programming использовала для создания
blocks, the paint editor, etc. She анимации: фоны, персонажи,
then shows them how to add программные блоки, редактор
another elephant to her animation красок и т.д. Затем она показывает,
and how to program it. She drags как добавить в анимацию еще
two programming blocks with одного слона и как его
diferent colors: the green flag, so запрограммировать. Она
the program starts, and a blue перетаскивает два программных
“move forward” block. блока разного цвета: зеленый
флажок, чтобы запустить
программу, и синий блок
"двигаться вперед".
1 Finally, she presses the Наконец, она нажимает
24 green flag on the interface, and the зеленый флажок на интерфейсе, и
animation starts. She invites a few начинается анимация. Она
children to come to the front and приглашает нескольких детей
add their own blue motion blocks подойти и добавить свои
to her sequence to see what собственные синие блоки движения
happens. Children fnd this very к ее последовательности, чтобы
intriguing and program the посмотреть, что произойдет. Дети
elephants to jump, turn right and находят это очень интригующим и
left. Finally, the time has come for программируют слонов на прыжки,
73
children to create their own повороты направо и налево.
projects with ScratchJr. She Наконец, пришло время для
explains that frst, they will create создания детьми собственных
a simple animation with only two проектов с помощью ScratchJr. Она
blocks. The class becomes chaotic, объясняет, что сначала они
but the teacher has anticipated that создадут простую анимацию,
this would happen. Some children состоящую всего из двух блоков. В
are not able to fnd the ScratchJr классе начинается хаос, но
app on their tablet, and others учительница предвидела, что так
need help to drag the blocks. The будет. Некоторые дети не могут
few who can follow the teacher’s найти приложение ScratchJr на
instructions are asked to walk своем планшете, другим нужна
around the room to help those in помощь, чтобы перетащить блоки.
need. After 10 min, the teacher Тех немногих, кто может следовать
invites children to save their инструкциям учителя, просят
projects, regardless of their state, пройтись по комнате и оказать
and return their iPads. She помощь тем, кто в ней нуждается.
promises them that during the next Через 10 минут учитель предлагает
few classes they will continue детям сохранить свои проекты,
their explorations with ScratchJr. независимо от их состояния, и
This vignette shows how Jenny вернуть планшеты iPad. Она
was ofered the opportunity to обещает им, что на следующих
encounter powerful ideas of занятиях они продолжат свои
computer science at the simplest исследования с помощью ScratchJr.
level. She explored the tablet, as Эта сцена показывает, как Дженни
hardware, and the ScratchJr app, была предоставлена возможность
the software. As the curriculum познакомиться с глубокими идеями
progressed, Jenny participated in информатики на самом простом
diferent activities to develop an уровне. Она изучала планшет, как
understanding of the complex оборудование, и приложение
interactions between a ScratchJr, как программное
hardware/software system. This обеспечение. По мере продвижения
exploration would prove helpful учебной программы Дженни
for Jenny to understand her участвовала в различных видах
interactions with most of the деятельности, чтобы развить
technologies that surround her in понимание сложных
the world. Jenny was also exposed взаимодействий между аппаратной
to the concept of representation и программной системами. Это
when the teacher showed her the исследование поможет Дженни
diferent elements of the Scratchjr понять, как она взаимодействует с
interface and played a game for большинством технологий,
children to identify the diferent которые окружают ее в мире.
icons and programming blocks Дженни также познакомилась с
and their meanings. концепцией представления, когда
74
учитель показал ей различные
элементы интерфейса Scratchjr и
провел для детей игру на
определение различных значков и
блоков программирования и их
значений.
1 As children created the Создавая короткую
25 short program for the elephant, программу для слона, дети
they encountered the foundational столкнулись с основополагающей
concept of algorithms: order концепцией алгоритмов: порядок
matters. The sequence in which имеет значение.
we put the blocks dictates the Последовательность, в которой мы
behaviors of the character on the размещаем блоки, диктует
screen. Although this vignette поведение персонажа на экране.
describes a frst introductory class Хотя в этой сцене описывается
to ScratchJr, it is possible to see первый вводный урок в ScratchJr,
how Jenny’s teacher gave children можно увидеть, как учительница
the opportunity to also engage in Дженни дала детям возможность
the design process. Although this участвовать в процессе
was a beginners’ class, children проектирования. Хотя это был
were invited to create a very вводный урок, детям было
simple project. They did not know предложено создать очень простой
the syntax or the grammar of проект. Они не знали синтаксиса и
ScratchJr, but by setting an грамматики ScratchJr, но, создав
environment in which those среду, в которой более
children who were more advanced продвинутые дети могли играть
could play a helper role, Jenny’s роль помощников, учительница
teacher was able to establish in the Дженни смогла создать в классе
classroom an early culture of раннюю традицию отладки и
debugging and problem solving. решения проблем. В период
In the emergent literacy period, зарождения грамотности дети
children are exposed to language знакомятся с языком, рассматривая
by seeing written words and написанные слова и участвуя в
participating in word games. They играх со словами. Им читают,
are being read to and asked to look просят посмотреть книги и
at books and “pretend-read” to "притвориться читающим", чтобы
become familiar with the “book познакомиться с "книжным
interface,” even though they интерфейсом", хотя они еще не
cannot read on their own yet. умеют читать самостоятельно.
Similarly, in the emergent coding Аналогичным образом, на этапе
stage, children are exposed to the зарождения навыков написания
programming language. They are кода дети знакомятся с языком
shown programming commands as программирования. Им показывают
75
well as programs written by команды программирования, а
someone else, and they are given также программы, написанные кем-
the possibility to learn how to use то другим, и дают возможность
the interface of the tool to create научиться использовать интерфейс
very simple things. They are инструмента для создания очень
immersed in a culture that can простых вещей. Они погружаются
program, a culture that can в культуру, в которой люди умеют
problem solve and debug, in the программировать, в культуру, в
same way that in the emergent которой они могут решать задачи и
literacy stage children are exposed отлаживать программы, точно так
to a classroom culture that “can” же, как на этапе формирования
read. грамотности дети приобщаются к
культуре класса, в котором
"умеют" читать.
76

ВКР Компьютерные технологии в переводе

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

ВКР Компьютерные технологии в переводе

Загружено:

Авторское право:

Доступные форматы

Федеральное государственное автономное

Кафедра «Разговорный иностранный язык»

Выпускная квалификационная работа

Тема: Компьютерные технологии в переводе (на материале статьи

Руководитель ___________ ________________ _____________

Выпускник ___________ _____________

1.1. Традиционный машинный перевод..................................................7

1.2. Статистический машинный перевод..............................................11

1.2.1. Пример перевода текста с помощью средств статистического

1.3. Нейронный машинный перевод......................................................15

1.3.1. Пример перевода текста с помощью средств нейронного

Выводы по первой главе.............................................................................20

2.1. Обзор и сравнение систем автоматизированного перевода.........23

2.1.3. SDL Language Tool (T-сервис).......................................................26

Выводы по второй главе.............................................................................28

3. Совмещенное использование систем машинного и

3.1. Пример совмещенного использования SmartCAT и сервиса

Выводы по третьей главе............................................................................36

Список использованных источников........................................................40

Современные компьютерные технологии имеют значительное влияние на

Первая глава работы посвящена машинному переводу. Машинный

Вторая глава работы посвящена автоматизированному переводу.

В заключительной, третей части работы будет представлено

Во всех главах будут приведены примеры работы указанных технологий

Актуальность темы "Компьютерные технологии в переводе" постоянно

Данная тема важна как с практической, так и с теоретической точки

Теоретическая же значимость данной темы заключается в возможности

Целью данной выпускной квалификационной работы является

Машинный перевод (МП) представляет собой область компьютерной

Идея машинного перевода возникла ещё в середине XX века, когда

В начале развития машинного перевода основным подходом был

С развитием вычислительной мощности и общих статистических методов

В статистическом машинном переводе (SMT), модель перевода основана

Машинный перевод обладает рядом преимуществ, включая высокую

Однако, у машинного перевода также есть свои ограничения. Качество

1.1. Традиционный машинный перевод

Под традиционным машинным переводом здесь понимается именно

Машинный перевод на основе правил (RBMT) во многом опирается на

Процесс машинного перевода включает несколько основных этапов. На

Для машины совмещение этих двух операций - грамматического разбора

Следующий этап включает несколько шагов. Во-первых, производится

Далее происходит разрешение неоднозначности, например, английское

Затем производится анализ и перевод слов. Обычно на этом этапе

Таким образом, этот этап включает не только перевод слов, но и учет

Затем происходит окончательный грамматический анализ, в процессе

Системы машинного перевода обычно ориентированы на конкретные

В практике переводческой деятельности выделяются два основных

1.2. Статистический машинный перевод

Статистический машинный перевод (Statistical Machine Translation, SMT)

Перед началом обучения модели SMT необходимо провести

Первый шаг в предварительной обработке данных - очистка текстовых

Далее происходит токенизация - процесс разделения текста на отдельные

Сегментация является дополнительным этапом предварительной

Обучение модели SMT происходит на основе параллельного корпуса.

Далее система машинного перевода осуществляет декодирование и

Оценка качества статистического машинного перевода играет важную

В заключение, статистический машинный перевод в теории является

1.2.1. Пример перевода текста с помощью средств статистического

Процесс поиска рабочего, и при этом удобного, инструмента для

«Computer programming is an essential skill in the 21st century and new

Этот фрагмент сервисом был переведен как:

«Программирование - существенный навык в 21-ом столетии и новая

Слово «framework» было переведено как «структуры», что не является

Далее попробуем перевести довольно часто встречающуюся

Руководитель _ ___

Выпускник _ ___