Вы находитесь на странице: 1из 13

Машинный перевод

Понятие машинного перевода


Машинный перевод (МП) – процесс
автоматического перевода текстов одного
естественного языка на другой с помощью
компьютерных алгоритмов.
Виды машинного перевода:
• Аналитический / основанный на правилах
(Rule-Based Machine Translation, RBMT)

• Статистический (Statistical Machine Translation, SMT)

• Гибридный (Hybrid Machine Translation, HMT)

• Нейронный (Neural Machine Translation, NMT)


Машинный перевод,
основанный на правилах (RBMT)
Системы RBMT осуществляют перевод на базе встроенных словарей и
наборов правил

Достоинства: Недостатки:

• Синтаксическая и • Трудоемкость и
морфологическая точность длительность разработки
• Стабильность и • Необходимость
предсказуемость результата актуализировать
• Возможность настройки на лингвистические базы
предметную область данных
Статистический машинный
перевод (SMT)
Основан на поиске соответствий между переводимым текстом и
корпусом, состоящим из слов, вносимых пользователем раннее во
время переводов
Недостатки:
Достоинства:
• Необходимость больших
•Легко создается при объемов параллельных
достаточном объеме корпусов
параллельных текстов • Ориентированность на
•Возможность применить конкретную предметную
область
к любой языковой паре
• Грамматические ошибки
Гибридный машинный перевод
(HMT)
совмещает в себе несколько технологий машинного перевода, чаще
всего – системы RBMT и SMT
Нейронный машинный перевод
(NMT)
Процесс перевода разбит на две фазы:
1. каждое слово исходного
предложения проходит через
«кодер», который генерирует то,
что мы называем «исходным
контекстом», опираясь при этом
на текущее слово и предыдущий
контекст
2. формируется полная
последовательность с упором на
«исходный контекст», после чего
один за другим целевые слова
генерируются с использованием:
целевого контекста и значимости
контекстного источника

Перевод завершается, когда декодер


доходит до этапа генерации
фактически последнего слова в
предложении
В 2017 движок перевода полностью
переведен на нейросети

Недостатки:
• На результат выдачи можно
повлиять, массово предлагая некий,
в том числе заведомо неверный
вариант перевода
• Некоторые языки кодируются
через близкородственные языки.
Например, белорусский-русский-
английский-другой язык
• Использует статистический машинный
перевод (область перевода – 95 языков)
• В 2017 начался переход на нейронный
машинный перевод
• Google: 66% верных переводов

• Yandex: 61% верных переводов

Вам также может понравиться