Вы находитесь на странице: 1из 15

TTS

Автоматизация труда письменного


переводчика
Дмитрий Троицкий, к.т.н., доцент,
директор агентства переводов TTS,
член правления Ассоциации преподавателей перевода

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021 1


2
Дмитрий Троицкий
dmitry.troitsky@tt-sw.ru
 Кандидат технических наук, доцент, генеральный директор агентства переводов и разработки
софта TTS
 Практикующий письменный переводчик в парах Ru-En, En-Ru
 Член Правления Ассоциации преподавателей перевода
 Преподаватель ТулГУ, школы профессионального перевода Альянс Про
 Научный сотрудник Института системных исследований РАН
 Разработчик промышленного и образовательного софта
 Более 200 научных публикаций
 Четырежды лауреат премии Фонда Потанина для молодых преподавателей
 Гранты РФФИ, правительства США и пр.
 Опыт работы начальником отдела международных связей университета
 Эксперт научных проектов INTAS, рецензент научных публикаций
 Опыт учебы и работы в университетах США

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021


План выступления
3
 CAT – это не машинный перевод!
 Зачем САТ письменному переводчику?
 Термины по САТ
 Принципы работы САТ
 Основные САТ
 Рабочие процессы в САТ
 Подсчет фактического объема перевода
 Пример
 Автоматизированный контроль качества
 QA

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021


Чем нам помогают кошки
4

 Кошка запоминает все, что вы переводите, и, когда попадается что-то


похожее, тут же подсказывает, как вы это ранее переводили
 Никаких проблем с форматированием: кошка сама вытаскивает текст из
файлов самых разных форматов (Word, Excel, PowerPoint…) и затем
запихивает перевод обратно
 Ведение глоссария
 Масса функций повышения производительности труда (AutoSuggest,
RegEx, пакетные операции…)
 Надежность: перевод сохраняется дважды
 Только при работе в кошке можно использовать QA tools для контроля
качества перевода

ОН НЕ УМЕЕТ
ПОЛЬЗОВАТЬСЯ
КОШКАМИ!
I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021
Зачем переводчику
5
кошки?
 Владение кошками - это ЕДИНСТВЕННЫЙ
способ получать заказы от бюро переводов

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021


Термины и определения
6
 CAT tool (computer-aided translation), «кошка»: система переводческой
памяти. Не имеет ничего общего с машинным переводом!
 Двуязычный файл: содержит исходный текст и его перевод. Имеет
расширение sdlxliff.
 ТМ (translation memory): база данных, в которой накапливаются переводы.
 Глоссарий (termbase): справочник терминов. Имеет расширение sdltb.
 Тег (tag): значок, заменяющий форматирование текста. Например, набранный
курсивом текст может выглядеть как [i]курсив[/i]. Теги позволяют сохранять
форматирование исходника в переводе
 Сегмент: «кусочек» перевода. Чаще всего – одно предложение

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021


Как работает САТ
7
Исходник (docx, Двуязычный файл
pptx, xml, xlsx…) CAT (sdlxliff) Переводчик

TM Перевод в формате
исходника (docx,
pptx, xml, xlsx...)

Глоссарий
(не
обязательно)

1. Из исходного файла извлекается текст и заносится в двуязычный файл


2. Переводчик выполняет перевод двуязычного файла. Каждый переведенный сегмент
заносится не только в этот файл, но и в ТМ
3. Каждый сегмент исходника ищется в ТМ. Если найдено что-то похожее, то текст сразу
подставляется в перевод, и переводчику не придется его писать заново, а достаточно
только немного подправить
4. Готовый перевод после проверки преобразуется из двуязычного файла обратно в формат
исходника. При этом все переведенное запоминается в ТМ на будущее
I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021
8

Какие бывают кошки


offline online

Лучше для: стабильной
группы переводчиков,
которая работает с Лучше для: облачные
регулярной нагрузкой в инструменты подходят
течение нескольких лет, для быстрого перевода
может обрабатывать «толпой» того, что никто
конфиденциальную никогда не будет читать
информацию, редко отдает
материалы на сторону.

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021


Породы кошек
9

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021

Источник: Константин Дранч, https://translationrating.ru/top-10-tms-2018/


Основные кошки
CAT Вид  
10
SDL Trados offline Самая популярная в мире; Требует времени на полное
самая функциональная и освоение
быстрая
Memsource Offline/ Достаточно популярная Online – работать
online невозможно; offline – слабый
функционал. Lifehack:
файлы совместимы с Trados
Across offline - Масса ошибок, очень сильно
тормозит
Deja Vu offline Есть интересные средства Мало распространена; есть
повышения ошибки
производительности
MemQ Offline Есть интересные средства Мало распространена; есть
повышения ошибки
производительности

SmartCAT online Простая, объединена с Тормоза, очень слабый


биржей функционал, для серьезной
работы непригодна

I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021


Основные
11 рабочие процессы
 Расчет объема и стоимости заказа с учетом
повторов
 Подготовка проекта
 Управление глоссариями
 Собственно перевод
 Редактирование
 Проверка качества (QA)
 Управление ТМ
I ЗИМНЯЯ ШКОЛА ПЕРЕВОДА 4 – 5.02.2021
Оплата труда переводчика
12 В договоре указывается ставка за полностью новые сегменты (New) и
ставки за сегменты, частично совпадающие с тем, что есть в ТМ.
Пример:

Повторения не оплачиваются
Общее кол-во: 42958 слов
Цена за 1 слово: 1.2000 РУБ Частичные совпадения с ТМ
оплачиваются со скидкой
Repetitions: 4550 слов по ставке 0% : 0.00 РУБ
95-99%: 2754 слов по ставке 40% : 1321.92 РУБ Совпадения менее 75%
85-94%: 1807 слов по ставке 70% : 1517.88 РУБ оплачиваются полностью
75-84%: 1411 слов по ставке 70% : 1185.24 РУБ
50-74%: 529 слов по ставке 100% : 634.80 РУБ
No Match: 15998 слов по ставке 100% : 19197.60 РУБ

Итоговая стоимость работы: 23857.44 РУБ


13
Quality Assurance
 Непереведенные сегменты SOURCE TARGET
 Соответствие глоссарию I love you I love you
 Consistency в обе стороны
The motor is hot Мотор горячий
 Числа
6.4.2.2 Overview 6.4.2.1 Обзор
 Теги
 Орфография <cf>Green</cf> <cf>Зеленый
 Повторы слов
Sorry Извените
 Двойные пробелы
It is a fault Это это отказ

The rpm is high Высокие__


обороты
Место инструментов Automated QA
14 в рабочем процессе

Подход №1

Подход №2
15

Спасибо за внимание!

dmitry.troitsky@tt-sw.ru