Вы находитесь на странице: 1из 7

Учреждение образования

«БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ


ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ»

Кафедра интеллектуальных информационных технологий

Отчет по лабораторной работе №6


по курсу «ЕЯзИИС»
на тему: «Разработка системы машинного перевода текстовых
документов»

Выполнили Бирючёв И.Г.


студенты гр. 621701: Васильева А.Г.

Проверил: Крапивин Ю.Б.

МИНСК
2019

Вариант: 11

Цель работы: освоить на практике основные принципы машинного


перевода текстов.

Описание структуры разработанной системы:


Описание используемых методов для решения задачи:
Для решения задачи было использовано Google Translate API основе лежит
следующий алгоритм:
Пример работы:
Описание и особенности применения готовых к использованию
компонент (библиотек, классов, фреймворков и т.п.) в случае их
использования в работе:
Описание использованных компонент.
Использование готовых компонент ускоряет разработку систем.
Библиотеки и фреймворки, использованные для выполнения данной
лабораторной работы:
1. Spring Boot – универсальный фреймворк с открытыми исходными
кодом для Java платформы. Предоставляет модули
конфигурирования компонентов приложения, модули доступа к
данным, модули MVC и тд.
2. Google Translate API — сервис компании Google, предназначенная
для автоматического перевода части текста или веб-страницы на
другой язык. Для некоторых языков пользователям предлагаются
варианты переводов, например, для технических терминов, которые
должны быть в будущем включены в обновления системы перевода.
○ Google Translate API может динамически переводить текст
между тысячами языковых пар. Google Translate API позволяет
программным сайтам и программам интегрироваться со
службой перевода. Google Translate API является частью более
широкого семейства API облачного машинного обучения.
○ Google Translate API предлагается в различных выпусках
(Basic и Advanced) со своими тарифными планами.
○ Помимо перевода текста, определения исходного языка и
получения списка поддерживаемых языков, расширенная
версия также поддерживает пользовательские глоссарии,
пакетный перевод, модели AutoML, метки. Для выполнения
лабораторной работы нами была использована базовая версия.
○ Cloud Translate доступен всем, кто хочет выполнить
интеграцию между Google Translate и собственным сайтом или
приложением.
○ Вводимый текст может быть простым текстом или HTML.
Google Translate API - Basic не переводит теги HTML во
входных данных, только текст, который появляется между
тегами. В выходных данных сохраняются (непереведенные)
теги HTML с максимально возможным количеством
переведенного текста между тегами из-за различий между
исходным и целевым языками. Порядок HTML-тегов в
выходных данных может отличаться от порядка во входном
тексте из-за изменения порядка слов в переводе.
○ По умолчанию, когда вы отправляете запрос на перевод в
Google Translate API, ваш текст переводится с использованием
модели нейронного машинного перевода (NMT). Если модель
NMT не поддерживается для запрошенной пары языковых
переводов, то используется модель машинного перевода на
основе фраз (PBMT).
○ NMT — это подход к машинному переводу, в котором
используется большая искусственная нейронная сеть. Он
отличается от методов машинного перевода, основанных на
статистике фраз, которые используют отдельно разработанные
подкомпоненты. Модели NMT используют глубинное
обучение и обучение признакам. Для их работы требуется
лишь малая часть памяти по сравнению с традиционными
системами статистического машинного перевода (SMT).
Кроме того, в отличие от традиционных систем перевода, все
части модели нейронного перевода обучаются совместно (от
начала до конца), чтобы максимизировать эффективность
перевода.
3. Yandex Translate API - интернет-сервис, предоставляющий
онлайновые инструментальные средства для автоматического
перевода слов, фраз и предложений с одного языка на другой.
○ С помощью API можно получить доступ к онлайн-сервису
машинного перевода Яндекса. Он поддерживает более 90
языков и умеет переводить отдельные слова и целые тексты.
Этот API позволяет встроить Яндекс.Переводчик в мобильное
приложение или веб-сервис для конечных пользователей. Или
же переводить большие объёмы текста — например,
техническую документацию.
Для доступа к API Переводчика по HTTPS вы можете использовать:

● XML-интерфейс (ответ возвращается в виде XML-документа).


● JSON-интерфейс (ответ возвращается в виде JavaScript-
объектов с теми же именами и семантикой, что и у XML-
элементов).
● JSONP-интерфейс (ответ возвращается в виде JavaScript-
объектов, обернутых в callback-функцию с заданным именем).

Все интерфейсы имеют одинаковую функциональность и


используют одни и те же входные параметры.

Выводы:
В рамках лабораторной работы была разработана система
машинного перевода текстов документов.
Маши́нный перево́д — процесс перевода текстов (письменных, а в
идеале и устных) с одного естественного языка на другой с помощью
специальной компьютерной программы. Так же называется направление
научных исследований, связанных с построением подобных систем.
Качество перевода зависит от тематики и стиля исходного текста, а
также грамматической, синтаксической и лексической родственности
языков, между которыми производится перевод. Машинный перевод
художественных текстов практически всегда оказывается
неудовлетворительного качества. Тем не менее для технических
документов при наличии специализированных машинных словарей и
некоторой настройке системы на особенности того или иного типа текстов
возможно получение перевода приемлемого качества, который нуждается
лишь в небольшой редакторской корректировке. Чем более формализован
стиль исходного документа, тем большего качества перевода можно
ожидать. Самых лучших результатов при использовании машинного
перевода можно достичь для текстов, написанных в техническом
(различные описания и руководства) и официально-деловом стиле.

Оценить