Академический Документы
Профессиональный Документы
Культура Документы
Машинный перевод
Машинный перевод
Достоинства: Недостатки:
• Синтаксическая и • Трудоемкость и
морфологическая точность длительность разработки
• Стабильность и • Необходимость
предсказуемость результата актуализировать
• Возможность настройки на лингвистические базы
предметную область данных
Статистический машинный
перевод (SMT)
Основан на поиске соответствий между переводимым текстом и
корпусом, состоящим из слов, вносимых пользователем раннее во
время переводов
Недостатки:
Достоинства:
• Необходимость больших
•Легко создается при объемов параллельных
достаточном объеме корпусов
параллельных текстов • Ориентированность на
•Возможность применить конкретную предметную
область
к любой языковой паре
• Грамматические ошибки
Гибридный машинный перевод
(HMT)
совмещает в себе несколько технологий машинного перевода, чаще
всего – системы RBMT и SMT
Нейронный машинный перевод
(NMT)
Процесс перевода разбит на две фазы:
1. каждое слово исходного
предложения проходит через
«кодер», который генерирует то,
что мы называем «исходным
контекстом», опираясь при этом
на текущее слово и предыдущий
контекст
2. формируется полная
последовательность с упором на
«исходный контекст», после чего
один за другим целевые слова
генерируются с использованием:
целевого контекста и значимости
контекстного источника
Недостатки:
• На результат выдачи можно
повлиять, массово предлагая некий,
в том числе заведомо неверный
вариант перевода
• Некоторые языки кодируются
через близкородственные языки.
Например, белорусский-русский-
английский-другой язык
• Использует статистический машинный
перевод (область перевода – 95 языков)
• В 2017 начался переход на нейронный
машинный перевод
• Google: 66% верных переводов