Академический Документы
Профессиональный Документы
Культура Документы
Допуск к защите
Заведующий кафедрой
____________ Ткачева И.А.
«____» ____________ 2018 г.
Санкт-Петербург
2018 г.
Оглавление
Введение................................................................................................................4
Заключение.........................................................................................................53
Библиографический список...............................................................................55
Приложение 1.....................................................................................................60
2
Введение
3
В соответствии с целью работы были сформулированы следующие
задачи, решение которых направленно на всестороннее раскрытие темы и
достижение поставленной цели:
- Проанализировать стилистические и лексико-грамматические
особенности текстов научно-технической направленности;
- изучить требования, необходимые для достижения адекватности
перевода текстов научно-технической направленности;
- определить основные трудности при переводе текстов научно-
технической направленности.
Объектом данного исследования является особенности перевода
технических текстов.
Предметом исследования данной работы являются тексты научно-
технических статей и аннотаций.
Актуальность и необходимость изучения особенностей перевода текстов
научно-технической направленности объясняют теоретическую значимость
исследования, проведенного в данной работе.
Практическая значимость данной работы объясняется возможностью
практического использования результатов исследования в работе
переводчиков, занимающихся переводами текстов и документации научно-
технической направленности.
В процессе исследования применялись следующие методы: метод
структурного анализа, метод сравнительно-сопоставительного анализа, метод
анализа текста по уровням (морфологический, лексический и
синтаксический), метод стилистического анализа,
Материалом исследования послужили тексты научно-технический
статей и аннотаций из журналов научно-технического направления
«Measurement Science and Technology», «Physiological Measurement».
4
ГЛАВА 1. Теоретические предпосылки исследования и определение
исходных понятий
7
Синонимия и многозначность противоречат природе функционирования
и предназначению термина. Однако при описании конкретной предметной
ситуации, конкретной научно–технической сферы, термины не допускают
неверного их толкования [33, 76].
Лексическая многозначность придает речи живость и гибкость и
позволяет выражать тончайшие оттенки мысли [34, 164]. Иначе обстоит дело
в техническом языке; в нем главным требованием оказывается абсолютная
точность выражения мысли, не допускающая возможности альтернативных
толкований. Поэтому основным требованием, предъявляемым к термину,
становится однозначность, т. е. наличие только одного установленного
значения.
Основными способами образования английских научно-технических
терминов являются морфологический, семантический и синтаксический, а
также заимствование из других отраслевых терминологий и языков.
Заимствованием считается слово или термин, который переходит в
другой язык со своим понятием (computer – компьютер) или который
используется для терминирования того же понятия.
Морфологический способ: сочетание морфем на базе имеющихся в
языке словообразовательных аффиксов и основ путем:
– суффиксации: присоединением суффикса к производящей основе.
– преффиксации: прибавлением префикса к производящей основе.
Лексико-семантический способ: приобретение одним и тем же словом
разных значений (омонимизация). Для англоязычных текстов научно-
технической направленности очень важно словопроизводство способом
конверсии: переход слова из одной части речи в другую без каких–либо
морфологических изменений в составе слова [34, 164].
Одной из лексических особенностей научно-технических текстов
является наличие аббревиатур, т.е. буквенных сокращений словосочетаний,
8
например: e.m.f. (electromotive force - электродвижущая сила); AA (antenna
array) (антенная решетка).
Акронимы представляют собой сокращения, которые, в отличие от
аббревиатур (читаемых, произносимых и воспринимаемых по названиям
букв), читаются и воспринимаются как обычные лексические единицы.
Акронимы образуются из разных сочетаний букв (из первых букв, от первых
нескольких с последней и др.) [41, 169]. К ним относятся термины–
сокращения radar (радар), laser (лазер), maser (мазер). Стоит отметить, что
переводческими соответствиями этих единиц в русском языке являются
именно эти акронимы, а не многословные термины: radar (Radio Detection and
Ranging – радиообнаружение и определение расстояния), laser (Light
Amplification by Stimulated Emission of Radiation – оптический квантовый
генератор), maser (Microvave Amplification by Stimulated Emission of Radiation
– микроволновое усиление с помощью индуцированного излучения) [1, c.
204]
Эти сокращения (акронимы) переносятся в русский язык как новые
термины методом транслитерации. Такие единицы легко входят в
терминологию и быстро ассимилируются в языке.
В научно–технических текстах используются сокращения двух видов.
Текстовые (авторские), которые функционируют в пределах только
данного текста; текстовые (авторские) сокращения поясняются в тексте или
представляются в виде отдельного списка сокращений к данному тексту;
общепринятые, которые фиксируются в официальных справочниках и
являются частью лексической системы языка. Сокращенное употребление
длинных однословных и многословных терминов есть результат действия
тенденции, приводящей к созданию удобных для произношения, чтения и
восприятия терминов-сокращений.
9
Поскольку характерной чертой термина является четкость
семантических границ, он обладает значительно большей
самостоятельностью по отношению к контексту, чем обычные слова.
По тем же причинам термин должен быть однозначным и независимым
от контекста. Другими словами, он должен иметь свое точное значение,
указанное его определением, во всех случаях его использования в любом
тексте, чтобы читающему не нужно было каждый раз решать, в каком из
возможных значений он здесь употреблен. Непосредственно связано с
точностью термина и требование, чтобы каждому понятию соответствовал
один термин, т.е. чтобы не существовало терминов–синонимов с
совпадающими значениями. Очевидно, что точная идентификация объектов
и понятий затруднена, когда одно и то же именуется по-разному.
Термин должен быть частью строгой логической системы. Определения
терминов и их значения должны подчиняться правилам логической
классификации, четко различая объекты и понятия, не допуская
противоречивости или неясности. И, наконец, термин должен быть
абсолютно объективным наименованием, лишенным каких-либо побочных
смыслов, привносящих элемент субъективности и отвлекающих внимание
специалиста,. В связи с этим в термине запрещена эмоциональность,
метафоричность, наличие каких-либо ассоциаций и т.п. [13, c.103]
Широкое употребление специалистами общетехнической лексики,
которая также составляет одну из специфических черт научно–технического
стиля, в значительной степени способствует их взаимопониманию. Это –
слова и словосочетания, не обладающие свойством термина
идентифицировать понятия и объекты в определенной области, но
употребляемые исключительно или почти исключительно в данной сфере
общения, отобранные узким кругом специалистов, привычные для них,
позволяющие им не обращать внимание на способ выражения мысли, а
сосредоточиваться на сути дела. Специальная лексика включает в себя
10
всевозможные производные от терминов, слова, используемые при описании
отношений и связей между обозначенными понятиями и объектами, их
свойств и особенностей, а также целый ряд общенародных слов,
употребляемых, однако, в строго определенных сочетаниях и тем самым
специализированных. Такая лексика обычно не фиксируется в
терминологических словарях, ее значения не задаются научными
определениями, однако она в той же степени характерна для научно-
технического стиля, как и термины.
К общеупотребительной лексике относятся слова общего языка, которые
наиболее часто встречаются в текстах научно-технической направленности.
Очевидно, в научно-технических материалах используется отнюдь не только
терминологическая и специальная лексика. В них встречается большое число
общенародных слов, употребляемых в любых функциональных стилях. В
любом научном тексте такие слова преобладают, составляют основу
изложения. Благодаря общеупотребительной лексике язык науки сохраняет
связь с общелитературным языком и не превращается в «язык избранных»
или, как иногда говорят, в язык жрецов, понятный только посвященным,
ученым. В зависимости от состава читателей доля общеупотребительной
лексики меняется: она уменьшается в работах, предназначенных для
специалистов (может составлять не больше половины всех слов), и
возрастает в сочинениях, обращенных к широкой аудитории [41, 148].
Помимо нейтральных слов и терминологии употребляются так
называемые книжные слова: perform (выполнять), calculation (расчет), circular
(круговой), phenomenon (явление), maximum (максимум), etc (и т.д.).
Книжные слова – это обычно длинные, многосложные заимствованные
слова, иногда не полностью ассимилированные, часто имеющие в
нейтральном стиле более простые и короткие синонимы, напр.: phenomenon –
phenomena.
11
Неполная грамматическая ассимиляция выражается, например, в
сохранении формы множественного числа, принятой в языке, из которого
данное существительное заимствовано, напр.: automaton – automata [41, 119].
В отношении синтаксической структуры английские тексты научно-
технической направленности отличаются своей конструктивной сложностью.
В них присутствует множество инфинитивных, причастных и герундиальных
оборотов, а также некоторые другие сугубо книжные конструкции, которые
часто затрудняют понимание текста и ставят перед переводчиком
дополнительные задачи.
В глаголах преобладает настоящее время, сложноподчиненные
предложения встречаться значительно чаще сложносочиненных, широко
использоваться различные средства логической связи. В то же время целый
ряд особенностей русских материалов этого типа связан со специфическими
структурами русского языка и выделяется благодаря своеобразному
использованию таких структур, по сравнению с иными стилями русской
речи. [16, 65]
В англоязычных научно-технических текстах крайне часто встречаются
пассивные обороты, тогда как в русском языке страдательный залог
употребляется значительно реже. Из этого следует, что при переводе,
необходимо прибегать к замене пассивных конструкций иными средствами
выражения, более свойственными русскому языку.
Для англоязычных текстов научно-технической направленности
характерно преобладание простых предложений, которые, составляют в
среднем больше половины от общего числа предложений в тексте. В то же
время число сложных предложений сравнительно невелико. Это явление
несвойственно данному стилю в русском языке, где сложные предложения
используются очень широко. В связи с этим в англо-русских технических
переводах часто используется прием объединения предложений, в результате
12
чего два или более простых предложения английского оригинала
трансформируются в одно сложное предложение в русском переводе.
Стремительно развивающаяся лингвистика текста показала, что наряду с
грамматикой, семантикой текста и иными областями и аспектами его
изучения необходима и стилистика текста. Как представляется, в названии
этой науки очень важны оба его компонента – стилистика и текст. Первый
предполагает стилистический подход ко всем явлениям текста, второй
обозначает предмет изучения и в соответствии с этим специфику
стилистического изучения (изучаются не традиционные языковые единицы, а
тексты) [4, 62].
Стилистический подход предполагает изучение функционирования
(способов использования) текста и его единиц – прозаических строф
(сложных синтаксических целых), частей, фрагментов, глав; стилевой
специфики типов текста (речи); условий и средств выразительности текстов.
Стиль языка – это сочетание двух факторов – «что говорится» и «как
говорится», т. е. это совокупность языковых средств. «В основе понятия
стиля языка лежит оценка отношения средств выражения к выражаемому
содержанию».
В основе стиля современной англоязычной литературы научно-
технической направленности лежат нормы английского письменного языка с
определенными специфическими характеристиками изложения материала.
Основная задача научной-технической литературы – абсолютно ясно и точно
довести представленную информацию до читателя. Это достигается
логически обоснованным изложением фактического материала, без
применения эмоционально окрашенных слов, выражений и грамматических
конструкций. Такой способ изложения можно назвать формально-
логическим [3, 92].
Все три приведенные выше характеристики присущи естественным и
точным наукам (а также их прикладным областям) – математике, химии,
13
физике, астрономии, электронике, электротехнике, медицине, сантехнике,
земледелию, лесоводству, авиации, горному делу, строительной и оборонной
промышленности, технологии механизмов, химической и транспортной
промышленности.
Принято считать, что литературе научно-технической направленности
свойственен нейтральный способ изложения материала, или нейтральный
стиль. Однако, по мнению А. В. Федорова, понятие какого-то
«нейтрального» стиля, т. е. стиля сухого, лишенного образности,
эмоциональности, понятие очень относительное, ибо само отсутствие этих
свойств составляет отчетливый, хотя и негативный стилистический признак
оказывается налицо и положительный характеризующий признак [43, 98].
Поскольку технической литературе присуще логическое, формальное,
почти математически строгое изложение материала, правомерно назвать
подобное изложение формально-логическим.
Как упоминалось выше, под стилем языка понимается комплексное
переплетение двух факторов – что говорится и как говорится. Потому,
используя в данном разделе термин «стиль» для описания способа изложения
материала англоязычной литературы научно-технической, будут
одновременно рассматриваться лексические и грамматические особенности
такой литературы. «Стиль ученого – формальный, – пишет Л. И. Борисова, –
он избегает неточных определений, неспелых обобщений, сенсаций, в его
работах всегда присутствует ясность и глубокое проникновение в суть
предмета, которые неотделимы от четкости мышления и формулировок.
Осторожность неотделима от точности: ученый не утверждает того, чего не
может доказать. Обычно он не выступает от первого лица; ему важны факты,
а не то, что «Я» думаю или делаю. Он избегает сокращений и оборотов
разговорного языка» [7, 166]. «Общий знаменатель между искусством писать
и научным методом, – отмечает В. Н. Комиссаров,– это логика. Пишущий на
технические темы уже научился мыслить во время подготовки к
14
специальности. Писать означает для него лишь расширение сферы действия
этого качества» [24, 204].
Итак, основное требование к языку научно-технической литературы –
это четкое и точное изложение, объяснение и описание фактов. Основной
акцент делается на логическую, а не эмоциональную сторону информации.
Автору необходимо исключить возможность вольного толкования существа
предмета. Потому в технической литературе почти не используются такие
выразительные средства, как аллегория, гипербола и т. п., и изложение носит
формальный, несколько «сухой» характер.
При обсуждении способа формирования научно-технической
литературы необходимо учитывать, что такая литература имеет весьма
ограниченный круг читателей, для которых именно формально–логический
стиль обеспечивает наиболее эффективную и полную информацию. Г.М.
Стрелковский полагает, что подобный стиль был навязан ученым
Королевским Обществом (Британской Академией наук) [41, 78–79].
Как упоминалось раннее, автору статьи научно-технической
направленности необходимо исключить возможность альтернативного
толкования предмета исследования, вследствие чего в научно-технической
литературе почти не встречаются такие выразительные средства, как
метафоры, метонимии и другие стилистические фигуры, которые широко
используются в художественных произведениях для придания речи живого,
образного характера.
Таким образом, исследуя стилистические особенности научно-
технических текстов, необходимо отметить, что основная их характеристика
заключается в стремлении к строгости и четкости изложения, отказу от
описательных, косвенных обозначений объектов, широкому использованию
стереотипов и клише специальной лексики. При всей своей стилистической
отдаленности от живого разговорного языка, богатого выразительными
средствами, научно-технический текст, все же включает в себя известное
15
количество более или менее нейтральных по окраске фразеологических
сочетаний технического характера.
16
заменам. Например, to upgrade – обновить, улучшить, усовершенствовать, но
не сделать апгрейд [12, c. 57]
2. Калькирование
Калькирование является заимствованием особого рода: из иностранного
языка заимствуется та или иная синтагма и буквально переводятся элементы,
из которых она состоит. Таким образом получается либо калькирование
выражения, причем используются синтаксические структуры языка перевода,
привнося в него новые элементы, либо калькирование структуры, привнося в
язык новые конструкции, например, Science-fiction (букв. научная
фантастика) [12, c.44 ]
Если структура переводимой лексической единицы в обоих языках
совпадает, это называется семантической калькой. Таким образом на основе
английского термина tree (дерево) создан термин tree structure, который
переводится на русский язык термином древовидная структура. При
использовании семантического калькирования структура термина,
создаваемого в языке оригинала, соответствует нормам языка оригинала, а
структура термина, создаваемого в языке перевода, соответствует нормам
языка перевода.
3. Дословный перевод
Дословный перевод, или перевод "слово в слово", обозначает переход от
исходного языка к языку перевода, который приводит к созданию
правильного и идиоматического текста, а переводчик при этом следит только
за соблюдением обязательных норм языка [18, c.27]
В принципе дословный перевод – это единственное обратимое и полное
решение вопроса. Тому очень много примеров в текстах, переведенных с
языков, входящих в ту же семью (французский–итальянский), и в
особенности между языками, входящими в одну и ту же культурную орбиту.
Если и можно констатировать наличие некоторых случаев дословного
перевода, так это потому, что существуют металингвистические понятия,
17
которые могут также отражать факты совместного существования, периоды
билингвизма и сознательного или бессознательного подражания, которое
связано с политическим или интеллектуальным престижем [38, 174].
В случае, когда дословный перевод признается переводчиком
неприемлемым, необходимо прибегнуть к косвенному (непрямому) переводу.
Перевод является неприемлемым, если сообщение, которое переведено
дословно:
а) не имеет смысла;
б) дает другой смысл;
в) не соответствует стилистическому уровню;
г) не соответствует металингвистике языка перевода;
д) невозможно по структурным соображениям.
Эквивалентность сообщений основывается, в конечном счете, на
идентичности ситуаций, которая позволяет утверждать, что язык перевода
содержит некоторые характеристики действительности, которых в исходном
языке нет.
4. Эквиваленция
В случае, когда два текста описывают одну ситуацию, используя
совершенно разные структурные и стилистические средства, мы говорим об
эквиваленции. Большинство эквиваленций, которые используются в речи,
являются устойчивыми и входят в состав идиоматической фразеологии,
включая поговорки, клише, адъективные или субстантивные устойчивые
сочетания и т. д. Пословицы и поговорки представляют собой, как правило,
иллюстрацию этого явления. Однако переводчик не должен брать на себя
ответственность за введение калек в уже организованный язык. В переводе
следует придерживаться более классических форм, так как новшества в
калькировании вызывают обвинения во внесении в язык англицизмов,
германизмов или испанизмов [15, c.105]
18
1.3. Использование переводческих трансформаций в процессе перевода
19
Этот способ может применяться как в пределах одного языка, так и при
переводе.
Основной и транспонированный обороты не обязательно эквивалентны
со стилистической точки зрения. Переводчик должен воспользоваться
транспозицией, если получаемый оборот лучше вписывается во всю фразу
или позволяет восстановить стилистические нюансы [41, 189]. Необходимо
обратить внимание, что транспонированный оборот обычно имеет более
литературный характер.
2. Модуляция
Модуляция представляет собой лексико-семантическую замену слова
или словосочетания исходного языка единицей языка перевода, значение
которой является логическим следствием значения исходной единицы. К
этому способу можно прибегнуть том случае, когда дословный или даже
транспонированный перевод приводит в результате к высказыванию
грамматически правильному, но противоречащему духу языка перевода [45,
210].
При свободной модуляции устойчивая фиксация отсутствует, и процесс
каждый раз происходит заново. Однако необходимо отметить, что из этого не
следует, что такая модуляция является факультативной; она должна привести
при правильном применении к идеальному решению для языка перевода в
соответствии с ситуацией, предложенной исходным языком. Итак, можно
заметить, что между устойчивой и свободной модуляцией имеется только
разница в степени и что свободная модуляция может в любой момент стать
устойчивой, как только она получит высокую степень частотности или будет
представлена в качестве единственного решения (это делается обычно на
основе анализа двуязычных текстов в результате дискуссии на двуязычной
конференции, или, исходя из известных переводов, которые имеют высокий
литературный престиж) [46, 261].
3. Адаптация
20
Данный способ является крайним пределом в процессе перевода. Он
применим к случаям, когда ситуация, о которой идет речь в исходном языке,
не имеет аналогов в языке перевода и должна быть передана посредством
другой ситуации, которую можно считать эквивалентной. Это представляет
собой особый случай эквивалентности - эквивалентность ситуаций.
Процесс адаптации можно условно разбить на несколько этапов:
1) подготовительный: составляется список информационных
источников, которые могут помочь переводчику в процессе работы;
проводится анализ наиболее трудных мест; составляется план реализации
всех стадий проекта.
2) перевод: совместная работа специализированного переводчика,
редактора и технического специалиста.
3) завершающий: создание четкой логической структуры документа,
поиск во внешних источниках недостающей информации и интеграция ее в
документ, разработка дополнительных глоссариев, словарей и справочных
систем.
Отказ от адаптирования, которое затрагивает не только структуры, но
также и само развитие идеи и способ ее фактического изложения в тексте
приводит к наличию в тексте неопределенности, что неизменно проявляется
в переводе. Такую неопределенность очень часто производят тексты,
публикуемые современными международными организациями, члены
которых по неведению или из стремления к «точности» требуют
буквальности переводов, максимального калькирования. Текст не должен
быть калькой ни в структурном, ни в металингвистическом плане.
Обратимся к основным сложностям перевода научно-технических
текстов. В процессе перевода переводчик может столкнуться с такой
сложностью как перевод терминов в следующих случаях:
21
а) часть терминов, имеющих международный характер, передается
путем транслитерации и не нуждается в переводе: antenna (антенна), feeder
(фидер).
б) некоторые термины имеют прямые соответствия в русском языке и
передаются соответствующими эквивалентами: hydrogen (водород), voltage
(напряжение).
в) известная часть терминов при переводе калькируется, т. е. передается
с помощью русских слов и выражений, дословно воспроизводящих слова и
выражения английского языка: single–needle instrument (однострелочный
аппарат); superpower system (сверхмощная система) [19, 38]
г) нередко случается, что словарь не дает прямого соответствия
английскому термину. В этом случае переводчик должен прибегнуть к
описательному переводу, точно передающему смысл иноязычного слова в
данном контексте: video-gain (регулировка яркости отметок от отраженных
сигналов); combustion furnace (печь для органического анализа) [19, 63]
Для того, чтобы правильно понять технический текст, необходимо, как
уже указывалось ранее, достаточно глубоко понимать данный предмет и
связанную с ним англоязычную терминологию.
Иначе обстоит дело, когда одному английскому термину соответствует
несколько русских, например, switch – выключатель, переключатель,
коммутатор. В этом случае сознательный выбор аналога может диктоваться
лишь хорошим знанием данного предмет.
Исходный текст: Most of the modern radio–transmitters can communicate
both telegraph and telephone signals.
Переводчик, основательно не знакомый с радиоделом и
соответствующей русской терминологией, перевел бы это предложение так:
Перевод 1: Большинство современных радиопередатчиков может
посылать как телеграфные, так и телефонные сигналы.
Однако технически грамотный перевод должен быть следующим:
22
Перевод 2: Большинство современных радиопередатчиков может
работать как в телеграфном, так и в телефонном режиме. [27, 22]
Основными чертами русского технического стиля являются строгая
ясность изложения, четкость определений, лаконичность формы.
Для иллюстрации следует остановиться на некоторых стилистических и
грамматических особенностях английского текста, чуждых стилю русской
технической литературы.
В английском тексте преобладают личные формы глагола, тогда как
русскому научному стилю более свойственны безличные или неопределенно-
личные обороты, например:
Исходный текст: We know the primary coil in the ordinary transformer to
have more turns than the secondary one.
Перевод: Известно, что первичная обмотка обычного
трансформатора имеет больше витков, чем вторичная.
В английских текстах описательного характера нередко употребляется
будущее время для выражения обычного действия [15, 118].
Руководствуясь контекстом, следует переводить такие предложения не
будущим, а настоящим временем, иногда с модальным оттенком:
Исходный текст: Fig. 10 gives a drawing of a bulb; the filament will be seen
in the centre.
Перевод: На рис. 10 приводится чертеж электрической лампы; нить
накала видна в центре.
В английских технических текстах особенно часто встречаются
пассивные обороты, тогда как в русском языке страдательный залог
употребляется значительно реже [15, 160].
Авторы английской технической литературы широко используют
различные сокращения, которые совершенно неупотребительны в русском
языке, например: d.c. (direct current) – постоянный ток; а.с. (alternating current)
– переменный ток.
23
По словам Л. С. Бархударова, все виды преобразований или
трансформаций осуществляемых в процессе перевода можно свести к
четырем элементарным типам, а именно:
1. Перестановки – изменение расположения языковых элементов в
тексте перевода по сравнению с текстом подлинника. Элементами,
подвергаемыми перестановке, являются обычно слова, словосочетания, части
сложного предложения и самостоятельные предложения в строе текста.
2. Замены – наиболее распространенный и многообразный вид
переводческой трансформации. В процессе перевода замене могут
подвергаться как грамматические единицы, так и лексические, в связи с чем
можно говорить о грамматических и лексических заменах. К грамматическим
же относятся следующие типы: замена частей речи, замена форм слова,
синтаксические замены в сложных предложениях, замена членов
предложения (перестройка синтаксической структуры предложения);
3. Добавления. Этот тип переводческой трансформации основан на
восстановлении опущенных при переводе слов имеющих смысловую
важность.
4. Опущение – явление, прямо противоположное добавлению. Под
опущением имеется в виду опущение тех или иных "избыточных" слов при
переводе [6, c. 135].
Таким образом, следует отметить, что главными особенностями
перевода является применение всей совокупности средств перевода для
обеспечения максимальной эквивалентности и адекватности, что является
главным требованием к переводу научно-технических текстов.
24
Выводы по Главе 1
Диаграмма 1
27
слов. Подобные свернутые и развёрнутые определения дают возможность
указать на самые различные признаки объекта или явления.
Большое значение имеет распространённость атрибутивных сочетаний
со словами type, scale, position, scope, axis, plane, phase: needle-type
environmental microsensor, impulse-type cyclic signal, pilot-type manufacturing
plants; wafer-scale integrated versions, chip-scale chemical analysis systems;
microscale and nanoscale deformation; gyroscope, microscope; multi-position
calibration method, six-position and rate test; axis misalignments and cross-axis
sensitivities of both the tree-axial accelerometer; in-plane gap closing and out-of-
plane gap closing; phase-matching turning point, phase-resolved partial discharge
patterns. Подобные сочетания встречаются почти в каждом тексте.
В научно-технических текстах наблюдается широкое употребление
прилагательных и наречий, характеризующих эти предметы, процессы и
действия: perfectly, respectively, easily, currently, successfully, favorably,
typically, exclusively, mechanically, electrically, initially, directly, geotechnical,
critical, experimental, numerical, practical, environmental, chemical, biological,
inertial, characteristic, electromagnetic, electrostatic, magnetic, discrete, etc.
Количество прилагательных и наречий составляет 24% объема текста в 192
28
слова (Диаграмма 2).
Диграмма 2
29
52 % от общего объёма текста (Диаграмма 3).
Диаграмма 3
30
perfectly, positively, reasonably, finally, traditionally, consequently, specifically,
additionally, more generally, etc.
The amount of energy that has to be dissipated is clearly enormous. The
energy loss is markedly reduced. [Measurement Science and Technology, Vol. 20,
2009]
Значительную роль в технической литературе играют служебные
(функциональные) слова, создающие логические связи между отдельными
элементами высказываний. Это предлоги и союзы (в основном составные)
например: on (по), upon (относительно), in (на), after (после), before (до),
besides (кроме того), instead of (вместо), in preference to (по отношению к),
apart (aside) from (кроме), except (for) (за исключением), in addition (to) (в
дополнение к), together with (вместе с), owing to (вследствие), due to (из-за),
thanks to (благодаря), according to (в соответствии с), because of (по причине),
by means of (посредством), in accordance with (в соответствии с), in regard to
(в отношении), in this connection (в связи с этим), for the purpose of (с целью),
in order to (для того, чтобы), as a result (в результате), rather than (скорее
чем), provided (при условии), providing (обеспечение), either... or (или ... или).
В ходе анализа технических текстов аннотаций были выявлены
следующие морфологические особенности: образование терминов путём
прибавления заимствованных, префиксов и суффиксов, отрицание
выражается преимущественно морфологическим способом, то есть с
помощью отрицательных аффиксов (аффиксальный способ отрицания
способствует большей лаконичности изложения, характеризующей научный
стиль), наличие многочисленных атрибутивных групп, которые могут
состоять из 3 - 6 слов (подобные свернутые и развёрнутые определения дают
возможность указать на самые различные признаки явления или объекта),
распространённость атрибутивных сочетаний со словами type, scale, position,
scope, axis, plane, phase, замене наречий предложно-именными сочетаниями,
широкое использование отглагольных прилагательных с предлогами вместо
31
глаголов, наречия могут выступать в качестве основного модально-
экспрессивного средства, широкое использование причинно-следственных
союзов и логических связок, увеличивается процентное содержание именных
частей речи, уменьшается содержание глаголов в личной форме, умеренное
количество служебных частей речи. Например, на текст объемом 234 слова
проходится 56 существительных, что составляет 24 % от всего объёма
лексики, 64 прилагательных и причастий, выступающих в роли описательных
определений, что составляет 27%, 72 служебные части речи (артикли,
предлоги, союзы) – 30 % только 10 глаголов, что составляет 4%. (Диаграмма
4)
Диаграмма 4
Диаграмма 5
Диаграмма 6
35
2.2 Анализ грамматических особенностей текстов аннотаций
36
4) …real bearing faulty signals collected from a laboratorial rotary machine
[Measurement Science and Technology, Vol. 23, 2012]
Многочисленные случаи опущения в научных материалах артикля,
особенно определенного, там, где в текстах другого типа его употребление
считается абсолютно обязательным:
1) General view is that..., __First uranium mine in the region was... .
2) Measurement of in situ __magnetic field on __space science missions is most
commonly achieved using instruments based on fluxgate sensors [Measurement
Science and Technology, Vol. 23, 2012].
3) When faults occur, __rotating machinery always manifests nonlinear dynamic
behavior [Measurement Science and Technology, Vol. 23, 2012].
Артикль часто отсутствует перед названиями конкретных деталей в ТУ,
технических описаниях и т.п.: Armstrong Traps have long-live parts, valve and
seat are heat treated crome steel, lever assembly and bucket arc stainless steel.
Это так же наблюдается в названих научных областей: __mechanical
engineering, __civil engineering, __standardization etc.
Также важно подчеркнуть большое количество случаев употребления
множественного числа вещественных существительных, например: methods,
results, generators, devices, materials, parameters, techniques, species, systems,
measurements, mechanisms, applications, examples, patterns, stages, conditions,
values, fats, oils, greases, steels, rare earths, sands, wools, etc.;
- множественного числа в названиях инструментов: clippers, jointers, shears,
dividers, compasses, trammels, etс;
- использование предлога of для передачи видо-родовых отношений: the
oxidizer of liquid oxygen, the fuel of kerosene;
Наличие пассивных и неопределённо-личных конструкций
обусловлено тем, что личность автора в подобных работах отодвигается на
второй план, а на первое место выходят описываемые им процессы и
явления. Например: We propose a numerical method which can numerically
37
correct the distorted en face images obtained with a full field optical coherence
tomography (FF-OCT) system. It is shown that the FF-OCT image of the deep
region of a biological sample is easily blurred or degraded because the sample
has a refractive index (RI) much higher than its surrounding medium in general. It
is analyzed that the focal plane of the imaging system is segregated from the
imaging plane of the coherence-gated system due to the RI mismatch. This image-
blurring phenomenon is experimentally confirmed by imaging the chrome pattern
of a resolution test target through its glass substrate in water. Moreover, we
demonstrate that the blurred image can be appreciably corrected by using the
numerical correction process based on the Fresnel–Kirchhoff diffraction theory.
The proposed correction method is applied to enhance the image of a human hair
[Measurement Science and Technology, Vol. 23, 2012].
Общие свойства научного изложения также отражаются на
синтаксической структуре высказывания. Одна из главных особенностей текста
аннотации к научной статье использование простых двусоставных предложений
с составным сказуемым, состоящим из глагола-связки и именной части
(предикатива): The barn is a unit of measure of nuclear cross sections, A
breakdown is an electric discharge through an insulator, etc. В качестве
предикатива часто выступает прилагательное или предложный оборот: The
pipe is steel… The surface is copper… These materials are low-cost… Control is
by a foot switch… Wing de-icing is by ducting exhaust heated air through leading
edge duct.
Важная характеристика английского научно-технического стиля,
которая отражается в отборе и использовании языковых средств заключается
также в его стремлении к краткости и компактности изложения, что
выражается, в частности, в довольно широком использовании эллиптических
конструкций. Неправильное понимание этих конструкций нередко приводит
к нелепым ошибкам в переводе. Встретив в тексте сочетание а remote crane
или a liquid rocket, переводчик должен распознать в них эллиптические
38
формы сочетаний a remote-operated crane и a liquid-fuelled rocket. Прочитав
предложение “A non-destructive testing college is to open in London this
October”, он должен помнить, что открывающийся колледж вовсе не будет
неразрушающимся (non-destructive) или испытательным (testing), а будет
готовить специалистов в области неразрушающих методов испытания
материалов. Аналогичным образом low-pressure producers могут оказаться
производителями полиэтилена методом низкого давления.
Указанная тенденция находит отражение и в ряде других
синтаксических особенностей. Для научно-технического стиля характерна,
например, замена определительных придаточных предложений
прилагательными в постпозиции (особенно с суффиксами -ible, -able, -ive и
др.): the materials available, excellent properties never before attainable, all
factors important in the evaluation of, problems difficult with ordinary equipment,
etc. Эта цель может достигаться использованием форм инфинитива в
функции определения: the properties to be expected, the temperature to be
obtained, the product to be cooled, etc.
Частотное распределение частей речи в научно-технических текстах
отличается от того, которое наблюдается в нейтральном или разговорном
стиле: увеличивается процентное содержание именных частей речи,
уменьшается содержание глаголов в личной форме, умеренное количество
служебных частей речи. Например, на текст объемом 234 слова проходится
56 существительных, что составляет 24 % от всего объёма лексики, 64
прилагательных и причастий, выступающих в роли описательных
определений, что составляет 27%, 72 служебные части речи (артикли,
предлоги, союзы) – 30 % только 10 глаголов, что составляет 4% (Диаграмма
4).
39
Диаграмма 4
40
The aim of this study was to identify the critical parameters that influence
the accuracy of the strain measurement [Measurement Science and Technology,
Vol. 23, 2012].
Рассматривая порядок слов в предложениях, необходимо отметить, что
не всегда на первом месте стоит подлежащее. В начале предложения могут
стоять причастные, герундиальные и инфинитивные обороты, например:
after removing the basic frequency component… , based on the theory of
morphology…, combined with the adaptive threshold…, to demonstrate the
effectiveness of the sensor…, to monitor these materials at a structural leve…, in
many civil and geotechnical applications…, over the past two decades…,
according to phase-resolved partial discharge patterns…, different from existing
approaches, the proposed method…, in a demonstration case…, for land vehicle
navigation…, when a bearing suffers…, when faults occur…, etc. Инверсия
служит цели логической связи в тексте.
В синтаксической структуре научных текстов преобладают простые
предложения, распространённые однородными членами и развёрнутыми
атрибутивными цепочками, а также простые двусоставные предложения с
составным сказуемым, состоящим из глагола-связки и именной части
(предикатива), в качестве предикатива часто выступает прилагательное или
предложный оборот.
Таким образом, на весь объём текста статьи насчитывается около 75%
простых предложений и 25% сложных, в основном сложноподчиненных
предложения, среди которых предложений с одним придаточным - 70% с
двумя - 20% с тремя и более – 10% (Диаграмма 7).
41
Диаграмма 7
Простые предложения
Сложноподчиненные предложения с одним придаточным
Сложноподчиненные предложения с двумя придаточными
Сложноподчиненные предложения с тремя и более придаточными
42
2.3 Анализ стилистических средств, использованных в текстах научно-
технической направленности
45
2.4 Особенности перевода научно-технических текстов
46
В самом простом типе кластера каждое облако представляет собой
краткое содержание отдельного документа. Отсюда следует, что глядя на эти
облака, пользователь может быстро получить представление о содержании
текста и проанализировать связь между разными текстовыми документами.
Синтаксическое уподобление (дословный перевод):
The variance is adjusted depending on the width and the height of the word cloud
frame. – Дисперсия корректируется в зависимости от ширины и высоты
фрейма облака слов.
Грамматические замены:
Перевод дирем:
подлежащее – фактический объект:
1) Different types of storms can be constructed for different data analysis tasks
- Анализ разных видов данных требует построения разных типов кластеров
2) By scanning the largest terms across all the clouds, the user can form a
quick impression of the topics of whole corpus. – При просмотре крупных
фрагментов теста по средствам облаков, у пользователя быстро
формируется представление о тематике всего текста.
3) The automatic evaluation allows us to rapidly compare different layout
algorithms. - По средствам автоматической оценки можно быстро
сравнить различные алгоритмы компоновки.
Перевод абсолютных конструкций:
а) абсолютные причастные конструкции:
all the documents written in a particular month - все документы, созданные в
определённый период времени (конкретный месяц)
б) абсолютная номинативная конструкция с предлогом with (переводится
самостоятельным предложением):
1) generating the storm with one cloud merged per document. – генерировать
такой кластер, где одно облако отвечает за присоединённый текст
47
2) with the word frequency indicated by its font size - согласно частоте
употребления слова определяется размер шрифта.
Перевод пассивных конструкций:
1) Сlouds should be designed so that they are effective as small multiples, that
is, they should be easy to compare and contrast. – Чтобы легко сравнить или
сопоставить облака, необходимо воспользоваться методом параллельного
изложения.
2) The way the clouds are arranged and organized on the canvas can also play
an important role - Облака ранжируются таким образом, что в полном
кластере каждому из них отводится определённое место.
3) The storm should be arranged to facilitate the most important comparisons. -
Облака в кластере следует размещать так, чтобы максимально облегчить
сравнение, то есть согласно более важным отличительным признакам
4) Each of the programmes is obtained by concatenating all its grants
abstracts. – Каждая из научных программ составляется путем объединения
по направлениям всех докладов, претендующих на получение гранта.
5) Each word w є W is assigned a position pw = (xw; yw) - Каждому слову w є
W присваивается позиция pw = (xw; yw)
6) The variance is adjusted depending on the width and the height of the word
cloud frame. – Дисперсия корректируется в зависимости от ширины и
высоты фрейма облака слов.
Сложное дополнение:
A single word storm allows the user to analyze the corpus at a variety of different
levels. – Один кластер позволяет пользователю проанализировать корпус
текста на разных уровнях.
allowing the viewer to assess the degree of similarity of two documents – что
позволяет зрительно оценить степень сходства двух документов
Инфинитивные конструкции:
48
1) To choose the size of the frame , we estimate the necessary width and the
height to fit M words. - Чтобы выбрать размер фрейма, мы оцениваем
необходимую ширину и высоту в соответствии с частотой слов M.
2) To add a word w to the cloud, the algorithm places it at an initial desired
position pw .- Чтобы добавить слово w в облако, алгоритм помещает его в
начальную нужную позицию pw.
3) To select the words in a cloud, we choose the top M words from the
document by term frequency. - При выборке слов для создания облака, мы
отбираем количество наиболее часто встречающихся в документе слов с
частотой M.
4) In order to decide if two words intersect, we check them at the glyph level. -
Для того чтобы решить, пересекаются ли два слова, мы проверяем их на
уровне символов.
Таким образом, в ходе анализа перевода научно-технических текстов
было установлено, что среди лексических трансформаций преобладает
использование транскрипции, транслитерации и калькирования. Довольно
часто при переводе научно-технических текстов производятся лексико-
семантические замены, а именно модуляция и смысловое развитие.
Грамматические трансформации также играют важную роль при переводе
текстов. В наших текстах применялись такие приёмы как членение
высказывания, синтаксическое уподобление (дословный перевод). К
грамматическим заменам относится перевод дирем, перевод абсолютных
конструкций (абсолютные причастные конструкции, абсолютные
номинативные конструкции с предлогом with, которые переводятся
самостоятельным предложением), перевод пассивных конструкций (пассив
применяется для того, чтобы выделить рему), перевод сложного дополнения
и инфинитивных конструкций, которые также являются особенностями
научного стиля.
49
Выводы по Главе 2
50
замены, а именно модуляция и смысловое развитие. Грамматические
трансформации, такие как членение высказывания, перевод пассивных
конструкций, перевод сложного дополнения и инфинитивных конструкций,
также играют важную роль при переводе текстов.
С помощью диаграмм были проиллюстрированы соотношения
количеств частей речи, простых и сложных терминов, простых и сложных
предложений.
51
Заключение
53
Библиографический список
54
16. Денина О.О. Использование переводческих трансформаций для
достижения адекватности перевода// Вестник Оренбургского
Государственного Университета. – 2015. – № 11.- C. 186-191
17. Денисенко Ю.А., Коммисаров В.Н., Черняковская Л.А. «Пособие по
научно–техническому переводу». - М.: 1981
18. Зайцев А.Б. Некоторые особенности прагматической адаптации
перевода англоязычного научного текста на русский язык // Вестник ОГУ.
2001.
19. Кауфман С.И. Некоторые особенности стиля американской
технической литературы: Автореф. Дис. канд. филол. Наук. –М.: 1960.–16 с.
20. Кирсанов Ю.А. Лингвистические проблемы перевода
(методологический аспект критериев качества перевода) // Текст в языке и
речевой деятельности (состав, перевод, автоматическая обработка). М., 1987.
– 230 с.
21. Климзо Б.Н. Ремесло технического переводчика. Об английском языке,
переводе и переводчиках научно-технической литературы.- М.: 2006
22. Колшанский. Г.В. Логика и структура языка. М., «Высшая школа»,
196512. Рецкер Я.И. Пособие по переводу с английского языка на русский
язык. – М.: Просвещение, 2012. — 240 с.
23. Комиссаров В.Н. Современное переводоведение. – М., 2004
24. Латышев Л.К. Межъязыковые трансформации как средство
достижения переводческой эквивалентности.//Семантико-синтаксические
проблемы теории языка и перевода. М., 1986. – 107 с.
25. Левицкая Т.Р., Фитерман А.М. Теория и практика перевода с
английского на русский.- М.: 1963
26. Люткин И.Д. Научно-технический перевод с русского на английский
язык. - М.: 1991
27. Макеева М.Н., Начерная С.В., Чуксина О.В. Технический перевод в
повседневной жизни.- Тамбов, 2004
55
28. Миньяр-Белоручев Р.К. Как стать переводчиком? – М.: Готика, 1999. –
176 с.
29. Наер В.Л. К описанию функционально–стилевой системы
современного английского языка // Лингвостилистические особенности
научного текста. - М.: 1981. С. 3 – 13.
30. Наурызбаева А.М., Сарымсакова А.Ж. Понятие «научно-технический
перевод» // Вестник КГУСТА. 2017 №2. С. 104-108
31. Нелюбин Л.Л. Введение в технику перевода: учебное пособие. – М.:
Флинта, 2009. – 319 с
32. Пумпянский А.Л. Лексические закономерности научной и технической
литературы. Англо-русские эквиваленты. – Калининград: 1980
33. Пумпянский А.А. Язык и стиль научной литературы, Калининский
госуниверситет, 1987
34. Реформатский А.А. Введение в языкознание. - М.: 1955
35. Рецкер Я. И. Методика технического перевода. - М.: 1934
36. Рецкер Я.И. Пособие по переводу с английского языка на русский язык.
– М.: Просвещение, 1982, - 84 с.
37. Рябцева Н. К. Научная речь на английском языке. Руководство по
научному изложению. Словарь оборотов и сочетаемости общенаучной
лексики. Новый словарь–справочник активного типа (на английском языке). -
М.: 2002
38. Скороходько Э.Ф. Вопросы перевода английской технической
литературы. – Киев: 1969
39. Смекаев В.П. Учебник технического перевода. – М.: 2006
40. Стрелковский Г. М., Латышев Л. К – Научно–технический перевод.-
М.: 1980
41. Стрельцов А.А. – Основы научно-технического перевода. English –
Russian.-М.: Флинта, 2017
56
42. Федоров А. В., Основы общей теории перевода. - М.: 1968
43. Хроменкова О.А., Чудова И.В. // Текст и дискурс: проблемы анализа и
интерпретации. - Тюмень, 2010. - С. 237-242.
44. Чернухина А.Е. Генезис научной терминологии - М.: Русский язык,
1979
45. Швейцер А. Д. Перевод и лингвистика. – М.: Воениздат, 1973
46. Швейцер А. Д. Текст и перевод . – М.: Наука, 1988
47. Эткинд Е. Г (Ленинград) Мастерство перевода: 1966. М., Советский
писатель, 1968.- 165 с.
48. Bell, Roger T. Translation and Translating. Longman, 1991. – 341 с.
Список использованных словарей и справочников
49. Википедия. Свободная энциклопедия [Электронный ресурс]. – Режим
доступа: http://ru.wikipedia.org/wiki/Википедия. – Загл. с экрана.
50. Киберленинка. [Электронный ресурс]. – Режим доступа:
https://cyberleninka.ru/ . – Загл. с экрана
51. Ушаков Д.Н. Толковый словарь русского языка /Под ред. Д.Н.
Ушакова. — М.: «Аделант», 2013. – 800с.
52. Электро-технический словарь [Электронный ресурс]. – Режим доступа:
http://www.consultant-e.ru/ . – Загл. с экрана
53. Электронный словарь – режим доступа http://www.multitran.ru
54. Языкознание. Большой энциклопедический словарь / гл. ред. В. Н.
Ярцева. – 2-е изд. – М. : Большая Рос. энцикл., 1988. – 685 с.
55. Cambridge International Dictionary of English. – Cambridge, Cambridge
University Press, 1995. – 1771 p. (CIDE).
56. Collins Copybuild Learner’s Dictionary. – Second Edition,
HarperCollinsPublishers, 2003. – 1322 p. (CCLD).
57. Longman Dictionary of Contemporary English: Pearson Education Limited,
1995. – 1668 p. (LDCE).
57
58. Macmillan English Dictionary for Advanced Learners: Macmillan
Publishers limited, 2002. – 1692 p. (MEDAL).
59. Online Wordnet Dictionary [Электронный ресурс]. – Режим доступа:
http://onlinedictionary.datasegment.com/word/thanksgi... – Загл. с экрана.
60. Oxford Advanced Learner’s Dictionary of Current English. Ed. by J.
Crowther. Fifth edition. Oxford University Press, 1995. – 1428 p.(OALD).
Источники практического материала
61. Measurement Science and Technology, Issue 12, Volume 17, 2006
62. Measurement Science and Technology, Issue 9, Volume 20, 2009
63. Measurement Science and Technology, Issue 4, Volume 22, 2011
64. Measurement Science and Technology, Issue 5, Volume 22, 2011
65. Measurement Science and Technology, Issue 6, Volume 23, 2012
66. Physiological Measurement, Issue 7, Volume 18, 2007
67. Physiological Measurement, Issue 3, Volume 23, 2012
68. Physiological Measurement, Issue 4, Volume 23, 2012
69. Physiological Measurement, Issue 6, Volume 23, 2012
58
Приложение 1
In many civil and geotechnical applications it is of interest to monitor the strain deep inside the
structure; consequently, it is necessary to embed the sensors into the structure's material. Construction
and geotechnical materials, such as concrete and soil, can be affected by local defects, e.g. cracks, air
pockets and inclusions. To monitor these materials at a structural level it is necessary to use long-gauge
sensors. As the sensor has to be embedded in the host material, its presence causes perturbation of the
strain field and influences the accuracy of the strain measurement. The aim of this research was to
identify the critical parameters that influence the accuracy of the strain measurement, to study how
these parameters affect the accuracy, and to give recommendations for sensor users. The study was
based on finite element analysis and all involved materials were assumed to have the Möhr–Coulomb
elastic, perfectly plastic behavior. A suitability of the numerical model for the analysis was verified using
the experimental results of two cases reported in the literature and one on-site application. The study
revealed that the most important parameters that influence the accuracy of the strain measurement are
the goodness of interaction (strain transfer) between the host material and the anchor pieces of the
sensor, the ratio between equivalent Young's modulus of the sensor and the Young's modulus of the
host material, the radius of the anchor piece and the gauge length. The numerical model and parametric
study are presented in detail along with practical recommendations.
59
with molecular biotechnology (such as microscopic observation with fluorescent probes) show
the tremendous promise of micro-environmental sensor technology.
(Measurement Science and Technology, Issue 4, Volume 22, 2011)
Over the past two decades, several advances have been made in micromachined sensors
and actuators. As the field of microelectromechanical systems (MEMS) has advanced, a clear
need for the integration of materials other than silicon and its compounds into micromachined
transducers has emerged. Piezoelectric materials are high energy density materials that scale very
favorably upon miniaturization and that has led to an ever-growing interest in piezoelectric films
for MEMS applications. At this time, piezoelectric aluminum-nitride-based film bulk acoustic
resonators (FBAR) have already been successfully commercialized. Future innovations and
improvements in inertial sensors for navigation, high-frequency crystal oscillators and filters for
wireless applications, microactuators for RF applications, chip-scale chemical analysis systems
and countless other applications hinge upon the successful miniaturization of components and
integration of piezoelectrics and metals into these systems. In this article, a comprehensive
review of micromachined piezoelectric transducer technology will be presented. Piezoelectric
materials in bulk and thin film forms will be reviewed and fabrication techniques for the
integration of these materials for microsensor applications will be presented. Recent advances in
various piezoelectric microsensors will be presented through specific examples. This review will
conclude with a critical assessment of the future trends and promise of this technology.
(Measurement Science and Technology, Issue 9, Volume 20, 2009)
This paper reviews the state-of-the art in vibration energy harvesting for wireless, self-
powered microsystems. Vibration-powered generators are typically, although not exclusively,
inertial spring and mass systems. The characteristic equations for inertial-based generators are
presented, along with the specific damping equations that relate to the three main transduction
mechanisms employed to extract energy from the system. These transduction mechanisms are:
piezoelectric, electromagnetic and electrostatic. Piezoelectric generators employ active materials
that generate a charge when mechanically stressed. A comprehensive review of existing
piezoelectric generators is presented, including impact coupled, resonant and human-based
devices. Electromagnetic generators employ electromagnetic induction arising from the relative
motion between a magnetic flux gradient and a conductor. Electromagnetic generators presented
in the literature are reviewed including large scale discrete devices and wafer-scale integrated
versions. Electrostatic generators utilize the relative movement between electrically isolated
charged capacitor plates to generate energy. The work done against the electrostatic force
between the plates provides the harvested energy. Electrostatic-based generators are reviewed
under the classifications of in-plane overlap varying, in-plane gap closing and out-of-plane gap
closing; the Coulomb force parametric generator and electret-based generators are also covered.
The coupling factor of each transduction mechanism is discussed and all the devices presented in
the literature are summarized in tables classified by transduction type; conclusions are drawn as
to the suitability of the various techniques.
(Measurement Science and Technology, Issue 12, Volume 17, 2006)
Measurements and analysis of surface damage on oil-impregnated insulation paper caused by partial
discharge
60
Surface topography, surface roughness, and surface conductivity of oil-impregnated
insulation paper were studied during the damage process caused by partial discharge within the
cavity of the paper. Products generated on the surface during this process were studied, as well.
According to phase-resolved partial discharge patterns, the damage process can be divided into
five stages. At each of the stages, surface conditions of insulation were analyzed by optical
microscopy, scanning electron microscopy, atomic force microscopy and high-resistance meter.
'Ablating', 'peeling', 'cracking in silk', 'pitting' and 'electrical treeing' appear on insulation
surfaces one after another during the five stages of the damage process, along with sequential
generation of droplets and crystalline solids. Surface roughness initially decreases, then
increases. Finally, surface conductivity exhibits a general increasing trend, before it eventually
stabilizes. However, its growth rate varies in different stages of damage.
(Measurement Science and Technology, Issue 5, Volume 22, 2011)
This paper presents a control algorithm that can compensate for imperfect dynamics of vibrating
gyroscopes. The compensated gyroscope dynamics can directly measure the rotation angle without
integrating the angular rate. The direct angle measurement approach is promising because it is exempt
from the error accumulation problem. However, using control methods to compensate for imperfect
dynamics for the direct angle measurement is very challenging work, and very few control algorithms
were reported to achieve that. Different from existing approaches, the proposed method has the
following advantages: it requires the measurements of either the proof mass velocity or position, it does
not require a calibration phase prior to normal use, and it compensates different types of imperfection
even when the proof mass of a gyroscope is unknown. In a demonstration case, imperfections cause
system parameters 20% deviated from their designated values; the measured signals are the proof mass
velocities and contaminated by zero-mean white noise with a noise level of 0.1% full scale output (FSO);
the angular rate to be measured is 200sin (2π × 10t) deg s−1. The proposed algorithm can compensate
for those imperfections and achieve an angle measurement accuracy of 0.23°.
The Global Positioning System (GPS) is a worldwide navigation system that requires a
clear line of sight to the orbiting satellites. For land vehicle navigation, a clear line of sight
cannot be maintained all the time as the vehicle can travel through tunnels, under bridges, forest
canopies or within urban canyons. In such situations, the augmentation of GPS with other
systems is necessary for continuous navigation. Inertial sensors can determine the motion of a
body with respect to an inertial frame of reference. Traditionally, inertial systems are bulky,
expensive and controlled by government regulations. Micro-electro mechanical systems
(MEMS) inertial sensors are compact, small, inexpensive and most importantly, not controlled
by governmental agencies due to their large error characteristics. Consequently, these sensors are
the perfect candidate for integrated civilian navigation applications with GPS. However, these
sensors need to be calibrated to remove the major part of the deterministic sensor errors before
they can be used to accurately and reliably bridge GPS signal gaps. A new multi-position
calibration method was designed for MEMS of high to medium quality. The method does not
require special aligned mounting and has been adapted to compensate for the primary sensor
errors, including the important scale factor and non-orthogonality errors of the gyroscopes. A
turntable was used to provide a strong rotation rate signal as reference for the estimation of these
61
errors. Two different quality MEMS IMUs were tested in the study. The calibration results were
first compared directly to those from traditional calibration methods, e.g. six-position and rate
test. Then the calibrated parameters were applied in three datasets of GPS/INS field tests to
evaluate their accuracy indirectly by comparing the position drifts during short-term GPS signal
outages.
(Measurement Science and Technology, Issue 7, Volume 18, 2007)
Methods for in-field user calibration of an inertial measurement unit without external equipment
This paper presents methods to calibrate and compensate for non-zero biases, non-unit
scale factors, axis misalignments and cross-axis sensitivities of both the tri-axial accelerometer
and gyroscopic setups in a micro-electro-mechanical systems (MEMS) based inertial
measurement unit (IMU). These methods depend on the Earth's gravity as a stable physical
calibration standard. Specifically, the calibration of gyroscopes is significantly improved by
comparing the outputs of the accelerometer and the IMU orientation integration algorithm, after
arbitrary motions. The derived property and proposed cost function allow the gyroscopes to be
calibrated without external equipment, such as a turntable, or requiring precise maneuvers. Both
factors allow the IMU to be easily calibrated by the user in the field so that it can function as an
accurate orientation sensor. A custom-made prototype IMU is used to demonstrate the
effectiveness of the proposed methods, with data that are carefully obtained using prescribed
motions, as well as those less rigorously collected from the IMU when it is mounted on the head
of a user or held in hands with brief random movements. With calibration, the observed average
static angular error is less than a quarter of a degree and the dynamic angular error is reduced by
a factor of 2 to 5.
(Measurement Science and Technology, Issue 8, Volume 19, 2008)
Two-dimensional digital image correlation for in-plane displacement and strain measurement: a review
A morphogram with the optimal selection of parameters used in morphological analysis for enhancing
the ability in bearing fault diagnosis
62
Morphological analysis is a signal processing method that extracts the local
morphological features of a signal by intersecting it with a structuring element (SE). When a
bearing suffers from a localized fault, an impulse-type cyclic signal is generated. The amplitude
and the cyclic time interval of impacts could reflect the health status of the inspected bearing and
the cause of defects, respectively. In this paper, an enhanced morphological analysis called
'morphogram' is presented for extracting the cyclic impacts caused by a certain bearing fault.
Based on the theory of morphology, the morphogram is realized by simple mathematical
operators, including Minkowski addition and subtraction. The morphogram is able to detect all
possible fault intervals. The most likely fault-interval-based construction index (CI) is
maximized to establish the optimal range of the flat SE for the extraction of bearing fault cyclic
features so that the type and cause of bearing faults can be easily determined in a time domain.
The morphogram has been validated by simulated bearing fault signals, real bearing faulty
signals collected from a laboratorial rotary machine and an industrial bearing fault signal. The
results show that the morphogram is able to detect all possible bearing fault intervals. Based on
the most likely bearing fault interval shown on the morphogram, the CI is effective in
determining the optimal parameters of the flat SE for the extraction of bearing fault cyclic
features for bearing fault diagnosis.
(Measurement Science and Technology, Issue 6, Volume 23, 2012)
Internal displacement and strain measurement using digital volume correlation: a least-squares
framework
This paper presents a single reflective grating-based fiber optic accelerometer that can
monitor the low-frequency acceleration of civil engineering structures. A simpler sensor
structure was realized by employing a single reflective grating panel and two optical fibers as
transceivers rather than the moiré fringe fiber optic accelerometer, which is composed of two
gratings and four optical fibers. The simplified layout contributes to resolving the issues of space
restraints during installation and complex cabling problems in transmission of fiber optic
accelerometers. The measured oscillated displacement and sinusoidal acceleration from the
proposed fiber optic sensor demonstrated good agreement with those of a commercial laser
displacement sensor and an accelerometer without electromagnetic interference. The developed
fiber optic accelerometer can be used in frequency ranges below 4 Hz within a 5% error margin
and high sensitivity of 33.33 rad G−1. Furthermore, in comparison with the conventional
transmission fiber optic accelerometer design, the proposed scheme's cable design is simplified
by 50%.
(Measurement Science and Technology, Issue 4, Volume 23, 2012)
Analysis of a capacitive sensor for the evaluation of circular cylinders with a conductive core
A capacitive sensor has been developed for the purpose of measuring the permittivity of a
cylindrical dielectric that coats a conductive core cylinder. The capacitive sensor consists of two
identical curved patch electrodes that are exterior to and coaxial with the cylindrical test piece.
The permittivity of the cylinder is determined from measurements of capacitance by means of a
physics-based model. In the model, an electroquasistatic Green function due to a point source
exterior to a dielectric-coated conductor is derived, in which the permittivity of the dielectric
material may take complex values. The Green function is then used to set up integral equations
that relate the unknown sensor surface charge density to the imposed potentials on the electrode
surfaces. The method of moments is utilized to discretize the integral equation into a matrix
equation that is solved for the sensor surface charge density and eventually the sensor output
capacitance. This model enables the complex permittivity of the dielectric coating material, or
the geometry of the cylindrical test-piece, to be inferred from the measured sensor capacitance
and dissipation factor. Experimental validation of the numerical model has been performed on
three different cylindrical test-pieces for two different electrode configurations. Each of the test-
pieces has the structure of a dielectric coated brass rod. A good agreement between measured
and calculated sensor capacitance (to an average of 7.4%) and dissipation factor (to within
0.002) was observed. Main sources of uncertainty in the measurement include variations in the
test-piece geometry, misalignment of sensor electrodes, strain-induced variation in the test-piece
permittivity and the existence of unintended air gaps between electrodes and the test-piece. To
demonstrate the effectiveness of the sensor, measurements of capacitance have been made on
64
aircraft wires and the permittivity of the insulation inferred. A significant change in permittivity
was observed for thermally degraded wires.
(Measurement Science and Technology, Issue 4, Volume 23, 2012)
Approximate entropy as a nonlinear feature parameter for fault diagnosis in rotating machinery
Feature extraction is always a crucial step for fault diagnosis in rotating machinery. When
faults occur, rotating machinery always manifests nonlinear dynamic behavior. It is necessary to
extract the nonlinear features hidden in the vibration signal for more accurate diagnosis.
Approximate entropy (ApEn) is the nonlinear parameter identification method for measuring the
irregularity of the stochastic signal or the stochastic process. In this paper, ApEn is used as a
nonlinear feature parameter to measure the irregularity of the vibration signals for fault diagnosis
in rotating machinery. Four typical faults are considered, which are imbalance, misalignment,
shaft rubbing and oil whirl. To improve the distinguishability of the ApEn values of the different
faults, the empirical mode decomposition (EMD) method is used to remove the basic frequency
component from the signals of the various faults. The experimental study results demonstrate
that EMD can separate the basic frequency component from the original signals satisfactorily.
After removing the basic frequency component, the distinguish ability of the ApEn values of the
residual signals is improved greatly. The proposed strategy for the ApEn calculation of the
various faults is proved effective. In addition, the simulation study is presented to investigate
some characteristics of ApEn, which will benefit better application of ApEn in the field of fault
diagnosis.
(Measurement Science and Technology, Issue 4, Volume 23, 2012)
Generating an indicator for pump impeller damage using half and full spectra, fuzzy preference-based
rough sets and PCA
Parameters that vary monotonically with damage propagation are useful in condition
monitoring. However, it is not easy to find such parameters especially for complex systems like
pumps. A method using half and full spectra, fuzzy preference-based rough sets and principal
component analysis (PCA) is proposed to generate such an indicator for tracking impeller
damage in a centrifugal slurry pump. Half and full spectra are used for extracting features related
to pump health status. A fuzzy preference-based rough set model is employed in the process of
selecting features reflecting the damage propagation monotonically. PCA is used to condense the
features and generate an indicator which represents the damage propagation. The effectiveness of
the proposed method is tested using laboratory experimental data. Results show that the indicator
generated by the proposed method can clearly and monotonically distinguish the health status of
the pump impeller.
(Measurement Science and Technology, Issue 4, Volume 23, 2012)
Improved spectral kurtosis with adaptive redundant multiwavelet packet and its applications for rotating
machinery fault detection
Rotating machinery fault detection is significant to avoid serious accidents and huge
economic losses effectively. However, due to the vibration signal with the character of non-
stationarity and nonlinearity, the detection and extraction of the fault feature turn into a
challenging task. Therefore, a novel method called improved spectral kurtosis (ISK) with
adaptive redundant multiwavelet packet (ARMP) is proposed for this task. Spectral kurtosis (SK)
has been proved to be a powerful tool to detect and characterize the non-stationary signal. To
65
improve the SK in filter limitation and enhance the resolution of spectral analysis as well as
match fault feature optimally, the ARMP is introduced into the SK. Moreover, since kurtosis
does not reflect the actual trend of periodic impulses, the SK is improved by incorporating an
evaluation index called envelope spectrum entropy as supplement. The proposed method is
applied to the rolling element bearing and gear fault detection to validate its reliability and
effectiveness. Compared with the conventional frequency spectrum, envelope spectrum, original
SK and some single wavelet methods, the results indicate that it could improve the accuracy of
frequency-band selection and enhance the ability of rotating machinery fault detection.
(Measurement Science and Technology, Issue 4, Volume 23, 2012)
A laboratory scale piezoelectric array for underwater measurements of the fluctuating wall pressure
beneath turbulent boundary layers
To capture the full spectrum of the fluctuating wall pressure beneath a turbulent boundary layer
(TBL) provides a unique challenge in transducer design. This paper discusses the design,
construction and testing of an array of surface-mounted piezoelectric ceramic elements with the
goal of having both the spatial resolution and the frequency bandwidth to accurately sense the
low-frequency, low-wavenumber events beneath a TBL at moderately low Reynolds numbers.
The array is constructed from twenty 1.27 cm tall prismatic rods with 0.18 cm × 0.16 cm cross-
section made of Navy type II piezoelectric ceramic material. Calibration was performed by
comparing the response of a Navy H56 precision-calibrated hydrophone to the outputs of each
element on the array for a given input from a Navy J9 projector. The elements show an average
sensitivity of −184 dB (re: 1 V μPa−1) and are assembled with a centre-to-centre spacing of 0.2
cm. Measurements of the fluctuating wall pressure below a 2d TBL with Reynolds numbers
(based on momentum thickness) ranging from 2100 to 4300 show that the dimensions of the
elements are between 64 and 107 viscous length units, respectively. A spatial and temporal
footprint of the fluctuating wall pressure reveals convective speeds averaging 75% of the free
stream velocity.
(Measurement Science and Technology, Issue 4, Volume 23, 2012)
We propose a numerical method which can numerically correct the distorted en face
images obtained with a full field optical coherence tomography (FF-OCT) system. It is shown
that the FF-OCT image of the deep region of a biological sample is easily blurred or degraded
because the sample has a refractive index (RI) much higher than its surrounding medium in
general. It is analyzed that the focal plane of the imaging system is segregated from the imaging
plane of the coherence-gated system due to the RI mismatch. This image-blurring phenomenon
is experimentally confirmed by imaging the chrome pattern of a resolution test target through its
glass substrate in water. Moreover, we demonstrate that the blurred image can be appreciably
corrected by using the numerical correction process based on the Fresnel–Kirchhoff diffraction
theory. The proposed correction method is applied to enhance the image of a human hair, which
permits the distinct identification of the melanin granules inside the cortex layer of the hair shaft.
(Measurement Science and Technology, Issue 3, Volume 23, 2012)
We compare the performance of four different damage measures based on the full
spectral response of fiber Bragg grating (FBG) sensors: spectral bandwidth, number of peaks,
cross-correlation coefficient and fractal dimension. These damage measures provide a rapid
indication of the extent of damage near the FBG sensor. Each damage measure is applied to data
simulating the response of a FBG to a pure strain gradient and experimental data from FBG
sensors embedded in a laminate subjected to multiple impacts. The cross-correlation coefficient
and number of peaks did not perform well for the experimental data. The spectral bandwidth
presented a low sensitivity to noise and a high sensitivity to rapidly increasing strain fields,
whereas the fractal dimension was more sensitive to more gradually changing strain fields.
Ultimately, the best strategy would be to fuse the results of the spectral bandwidth and fractal
dimension damage measures to incorporate the strengths of each approach. At the same time,
this study highlighted the challenges in using such spectral data from FBG sensors embedded in
structural materials, primarily due to the variability in response between sensors exposed to the
same damage states.
(Measurement Science and Technology, Issue 2, Volume 23, 2012)
68
Measurement of the in situ magnetic field on space science missions is most commonly
achieved using instruments based on fluxgate sensors. Fluxgates are robust, reliable and have
considerable space heritage; however, their mass and volume are not optimized for deployment
on nano or picosats. We describe a new magnetometer design demonstrating science
measurement capability featuring significantly lower mass, volume and to a lesser extent power
than a typical fluxgate. The instrument employs a sensor based on anisotropic magnetoresistance
(AMR) achieving a noise floor of less than 50 pT Hz −1/2 above 1 Hz on a 5 V bridge bias. The
instrument range is scalable up to ±50 000 nT and the three-axis sensor mass and volume are less
than 10 g and 10 cm3, respectively. The ability to switch the polarization of the sensor's easy axis
and apply magnetic feedback is used to build a driven first harmonic closed loop system
featuring improved linearity, gain stability and compensation of the sensor offset. A number of
potential geospace applications based on the initial instrument results are discussed including
attitude control systems and scientific measurement of waves and structures in the terrestrial
magnetosphere. A flight version of the AMR magnetometer will fly on the TRIO-CINEMA
mission due to be launched in 2012.
(Measurement Science and Technology, Issue 2, Volume 23, 2012)
Charles Sutton
School of Informatics
University of Edinburgh
69
ABSTRACT
Word clouds are a popular tool for visualizing documents, but they are not a good tool
for comparing documents, because identical words are not presented consistently across different
clouds. We introduce the concept of word storms, a visualization tool for analysing corpora of
documents. A word storm is a group of word clouds, in which each cloud represents a single
document, juxtaposed to allow the viewer to compare and contrast the documents. We present a
novel algorithm that creates a coordinated word storm, in which words that appear in multiple
documents are placed in the same location, using the same color and orientation, in all of the
corresponding clouds. In this way, similar documents are represented by similar-looking word
clouds, making them easier to compare and contrast visually. We evaluate the algorithm in two
ways: first, an automatic evaluation based on document classification; and second, a user study.
The results confirm that unlike standard word clouds, a coordinated word storm better allows for
visual comparison of documents.
Key words: word storm, word cloud, visualization, optimization algorithms, document.
1. INTRODUCTION
Because of the vast number of text documents on the Web, there is a demand for ways
to allow people to scan large numbers of documents quickly. A natural approach is visualization,
under the hope that visually scanning a picture may be easier for people than reading text. One of
the most popular visualization methods for text documents are word clouds. A word cloud is a
graphical presentation of a document, usually generated by plotting the document's most
common words in two dimensional space, with the word's frequency indicated by its font size.
Word clouds have the advantages that they are easy for naive users to interpret and that they can
be aesthetically surprising and pleasing. One of the most popular cloud generators, Wordle, has
generated over 1.4 million clouds that have been publicly posted. [6]
Despite their popularity for visualizing single documents, word clouds are not useful for
navigating groups of documents, such as blogs or Web sites. The key problem is that word
clouds are difficult to compare visually. For example, say that we want to compare two
documents, so we build a word cloud separately for each document. Even if the two documents
are topically similar, the resulting clouds can be very different visually, because the shared
words between the documents are usually scrambled, appearing in different locations in each of
the two clouds. The effect is that it is difficult to determine which words are shared between the
documents.
In this paper, we introduce the concept of word storms to afford visual comparison of
groups of documents. Just as a storm is a group of clouds, a word storm is a group of word
clouds. Each cloud in the storm represents a subset of the corpus. For example, a storm might
contain one cloud per document, or alternatively one cloud to represent all the documents written
in each year, or one cloud to represent each track of an academic conference, etc. Effective
storms make it easy to compare and contrast documents visually. We propose several principles
behind effective storms, the most important of which is that similar documents should be
represented by visually similar clouds. To achieve this, algorithms for generating storms must
perform layout of the clouds in a coordinated manner.
We present a novel algorithm for generating coordinated word storms. Its goal is to
generate a set of visually appealing clouds, under the constraint that if the same word appears in
more than one cloud in the storm, it appears in a similar location. Interestingly, this also allows a
user to see when a word is not in a cloud: simply find the desired word in one cloud and check
the corresponding locations in all the other clouds. At a technical level, our algorithm combines
the greedy randomized layout strategy of Wordle, which generates aesthetically pleasing layouts,
with an optimization-based approach to maintain coordination between the clouds. The objective
70
function in the optimization measures the amount of coordination in the storm and is inspired by
the theory of multidimensional scaling.
We apply this algorithm on a variety of text corpora, including academic papers and
research grant proposals. We evaluate the algorithm in two ways. First, we present a novel
automatic evaluation method for word storms based on how well the clouds, represented as
vectors of pixels, serve as features for document classification. The automatic evaluation allows
us to rapidly compare different layout algorithms. However, this evaluation is not specific to
word clouds and may be of independent interest. Second, we present a user study in which users
are asked to examine and compare the clouds in storm. Both experiments demonstrate that a
coordinated word storm is dramatically better than independent word clouds at allowing users to
visually compare and contrast documents.
2. DESIGN PRINCIPLES
In this section we introduce the concept of a word storm, describe different types of
storms, and present design principles for effective storms.
A word storm is a group of word clouds constructed for the purpose of visualizing a
corpus of documents. In the simplest type of storm, each cloud represents a single document by
creating a summary of its content; hence, by looking at the clouds a user can form a quick
impression of the corpus's content and analyse the relations among the different documents.
We build on word clouds in our work because they are a popular way of visualising
single documents. They are very easy to understand and they have been widely used to create
appealing figures. By building a storm based on word clouds, we create an accessible tool that
can be understood easily and used without requiring a background in statistics. The aim of a
word storm is to extend the capabilities of a word cloud: instead of visualizing just one
document, it is used to visualize an entire corpus.
There are two high level design motivations behind the concept of word storms. The
first design motivation is to visualize high-dimensional data in a high-dimensional space. Many
classical visualization techniques are based on dimensionality reduction, i.e., mapping high-
dimensional data into a low dimensional space. Word storms take an alternative strategy, of
mapping high dimensional data into a different high dimensional space, but one which is tailored
for human visual processing. This is a similar strategy to approaches like Chernoff faces [2]. The
second design motivation is the principle of small multiples [12, 11], in which similar
visualizations are presented together in a table so that the eye is drawn to the similarities and
differences between them. A word storm is a small multiple of word clouds. This motivation
strongly influences the design of effective clouds, as described in Section 2.3.
2.1 Types of Storms
Different types of storms can be constructed for different data analysis tasks. In general,
the individual clouds in a storm can represent a group of documents rather than a single
document. For example, a cloud could represent all the documents written in a particular month,
or that appear on a particular section of a web site. It would be typical to do this by simply
merging all of the documents in each group, and then generating the storm with one cloud per
merged document. This makes the storm a flexible tool that can be used for different types of
analysis, and it is possible to create different storms from the same corpus and obtain different
insights on it. Here are some example scenarios:
1. Comparing Individual Documents. If the goal is to compare and contrast individual
documents in a corpus, then we can build in a storm in which each word cloud represents a
single document.
2. Temporal Evolution of Documents. If we have a set of documents that have been
written over a long period, such as news articles, blog posts, or scientific documents, we may
want to analyze how trends in the documents have changed over time. This is achieved using a
word storm in which each cloud represents a time period, e.g., one cloud per week or per month.
71
By looking at the clouds sequentially, the user can see the appearance and disappearance of
words and how their importance changes over time.
3. Hierarchies of Documents. If the corpus is arranged in a hierarchy of categories, we
can create a storm which contains one cloud for each of the categories and subcategories. This
allows for hierarchical interaction, in which for every category of the topic hierarchy, we have a
storm that contains one cloud for each subcategory. For instance, this structure can be useful in a
corpus of scientific papers. At the top level, we would first have a storm that contains one cloud
for each scientific field (e.g., chemistry, physics, engineering), then for each field, we also have a
separate storm that includes one cloud for each subfield (such as organic chemistry, inorganic
chemistry) and so on until arriving at the articles. An example of this type of storm is shown in
Figures 2 and 3.
To keep the explanations simple, when describing the algorithms later on, we will
assume that each cloud in the storm represents a single document, with the understanding that
the document in this context may have been created by concatenating a group of documents, as
in the storms of type 2 and 3 above.
2.2 Levels of Analysis of Storms
A single word storm allows the user to analyse the corpus at a variety of different levels,
depending on what type of information is of most interest, such as:
1. Overall Impression. By scanning the largest terms across all the clouds, the user can
form a quick impression of the topics of whole corpus.
2. Comparison of Documents. As the storm displays the clouds together, the user can
easily compare them and look for similarities and differences among the clouds. For example,
the user can look for words that are much more common in one document than another. Also the
user can compare whether two clouds have similar shape, to gauge the overall similarity of the
corresponding documents.
3. Analysis of Single Documents. Finally, the clouds in the storm have meaning in
themselves. Just as with a single word cloud, the user can analyze an individual cloud to get an
impression of a single document.
2.3 Principles of Effective Word Storms
Because they support additional types of analysis, principles for effective word storms
are different than those for individual clouds. This section describes some desirable properties of
effective word storms.
First of all, each cloud should be a good representation of its document. That is, each
cloud ought to emphasize the most important words so that the information that it transmits is
faithful to its content. Each cloud in a storm should be an effective visualization in its own right.
a b c d
72
e f g h
Figure 1: We represented the papers of the ICML 2012 conference. These 8 clouds represent the
papers in the Optimization Algorithms track.
Further principles follow from the fact that the clouds should also be built taking into
account the roles they will play in the complete storm. In particular, clouds should be designed
so that they are effective as small multiples [11, 12], that is, they should be easy to compare and
contrast. This has several implications. First, clouds should be similar so that they look like
multiples of the same thing, making the storm a whole unit. Because the same structure is
maintained across the different clouds, they are easier to compare, so that the viewer's attention
is focused on the differences among them. A related implication is that the clouds ought to be
small enough that viewers can analyze multiple clouds at the same time without undue effort.
The way the clouds are arranged and organised on the canvas can also play an important
role, because clouds are probably more easily compared to their neighbours than to the more
distant clouds. This suggests a principle that clouds in a storm should be arranged to facilitate
the most important comparisons. In the current paper, we take a simple approach to this issue,
simply arranging the clouds in a grid, but in future work it might be a good option to place
similar clouds closer together so that they can be more easily compared.
A final, and perhaps the most important, principle is one that we will call the
coordination of similarity principle. In an effective storm, visual comparisons between clouds
should reflect the underlying relationships between documents, so that similar documents should
have similar clouds, and dissimilar documents should have visually distinct clouds. This
principle has particularly strong implications. For instance, to follow this principle, words should
appear in a similar font and similar colours when they appear in multiple clouds. More
ambitiously, words should also have approximately the same position when the same position
across all clouds.
Following the coordination of similarity principle can significantly enhance the
usefulness of the storm. For example, a common operation when comparing word clouds is to
finding and comparing words between the clouds, e.g., once a word is spotted in a cloud,
checking if it also appears in other clouds. By displaying shared words in the same color and
position across clouds, it is much easier for a viewer to determine which words are shared across
clouds, and which words appear in one cloud but not in another. Furthermore, making common
words look the same tends to cause the overall shape of the clouds of similar documents to
appear visually similar, allowing the viewer to assess the degree of similarity of two documents
without needing to fully scan the clouds.
Following these principles presents a challenge for algorithms that build word storms.
Existing algorithms for building single word clouds do not take into account relationships
between multiple clouds in a storm. In the next sections we propose new algorithms for building
effective storms.
a b c
d e f
Figure 3: A word storm containing six randomly sampled grants from the Complexity
Programme (which was Cloud (e) in Figure 2). The word “complex” that only appeared in one
cloud in Figure 2, appears in all clouds in this Figure.
3. CREATING A SINGLE CLOUD
In this section, we describe the layout algorithm for single clouds that we will extend
when we present our new algorithm for word storms. The method is based closely on that of
Wordle [6], because it tends to produce aesthetically pleasing clouds. Formally, we define a
word cloud as a set of words W = {w1; : : : ;wM}, where each word w є W is assigned a position
pw = (xw; yw) and visual attributes that include its font size sw, colour cw and orientation ow
(horizontal or vertical).
74
To select the words in a cloud, we choose the top M words from the document by term
frequency, after removing stop words. A more general measure of the weight of each term, such
as tf *idf, could be used instead; for this reason we use term weight to refer to whatever measure
we have selected for the importance of each term. The font size is set proportional to the term
frequency, and the colour and orientation are selected randomly.
Choosing the word positions is more complex, because the words must not overlap on
the canvas. We use the layout algorithm from Wordle [6], which we will refer to as the Spiral
Algorithm.
This algorithm is greedy and incremental; it sets the location of one word at a time in
order of weight. In other words, at the beginning of the i-th step, the algorithm has generated a
partial word cloud containing the i - 1 words of largest weight. To add a word w to the cloud, the
algorithm places it at an initial desired position pw (e.g., chosen randomly). If at that position, w
does not intersect any previous words and is entirely within the frame, we go on to the next
word. Otherwise, w is moved one step outwards along a spiral path. The algorithm keeps moving
the word over the spiral until it finds a valid position, that is, it does not overlap and it is inside
the frame. Then, it moves on to the next word. This algorithm is shown in Algorithm 1.
We set the word desired positions randomly by sampling a 2D Gaussian distribution
whose mean is at the center of the word cloud frame. The variance is adjusted depending on the
width and the height of the word cloud frame. If the desired position is sampled outside the
frame or it intersects with it, it is resampled until it is inside.
Note that the algorithm assumes that the size of the frame is given. To choose the size of
the frame, we estimate the necessary width and the height to fit M words. This choice will affect
the compactness of the resulting word cloud. If the frame is too big, the words will find valid
locations quickly but the resulting cloud will contain a lot of white space. If it is frame is too
small, it will be more difficult or impossible to fit all the words. A maximum number of
iterations is set to prevent words from looping forever. If one word reaches the maximum
number of iterations, we assume that the word cannot fit in the current configuration. In that
case, the algorithm is restarted with a larger frame.
Algorithm 1 Spiral Algorithm
Require: Words W, optionally positions p = {pw}wєW
Ensure: Final positions p = {pw}wєW
1: for all words w є {w1; : : : ;wM}do
2: if initial position pw unsupplied, sample from Gaussian
3: count ← 0
4: while pw not valid ˄ count < Max Iteration do
5: Move pw one step along a Spiral path
6: count ← count + 1
7: end while
8: if pw not valid then
9: Restart with a larger Frame
10: end if
11: end for
In order to decide if two words intersect, we check them at the glyph level, instead of
only considering a bounding box around the word. This ensures a more compact result.
However, checking the intersection of two glyphs can be expensive, so instead we use a tree of
rectangular bounding boxes that closely follows the shape of the glyph [6]. We use the
implementation of the approach in the open source library Word Cram.
4. CREATING A STORM
75
In this section, we present novel algorithms to build a storm. The simplest method
would of course be to simply run the single-cloud algorithm of Section 3 independently for each
document, but the resulting storms would typically violate the principle of coordination of
similarity (Section 2.3) because words will tend to have different colours, orientations, and
layouts even when they are shared between documents. Instead, our algorithms will coordinate
the layout of different clouds, so that when words appear in more than one cloud, they have the
same color, orientation, and position. In this way, if the viewer finds a word in one of the clouds,
it is easy to check if it appears in any other clouds.
We represent each document as a vector ui, where uiw is the count of word w in
document i. A word cloud vi is a tuple vi = (Wi; {piw}; {ciw}; {siw}), where Wi is the set of words
that are to be displayed in cloud i, and for any word w є Wi, we define piw = (xiw; yiw) as the
position of w in the cloud vi, ciw the color, and siw the font size. We write pi = {piw | w є Wi} for
the set of all word locations in vi.
Our algorithms will focus on coordinating word locations and attributes of words that
are shared in multiple clouds in a storm. However, it is also possible to select the words that are
displayed in each cloud in a coordinated way that considers the entire corpus. For example,
instead of selecting words by their frequency in the current document, we could use global
measures, such as tf * idf, that could emphasize the differences among clouds. We tried a few
preliminary experiments with this but subjectively preferred storms produced using tf .
5. CONCLUSIONS
We have introduced the concept of word storms, which is a group of word clouds
designed for the visualization of a corpus of documents. We presented a series of principles for
effective storms, arguing that the clouds in a storm should be built in a coordinated fashion to
facilitate comparison. We presented a novel algorithm that builds storms in a coordinated
fashion, placing shared words in a similar location across clouds, so that similar documents will
have similar storms. Using both an automatic evaluation and a user study, we showed that
coordinated storms were markedly superior to independent word clouds for the purposes of
comparing and contrasting documents.
References
[1] I. Borg and P. Groenen. Modern Multidimensional Scaling: Theory and Applications.
Springer, 2005.
[2] H. Cherno. The use of faces to represent points in k-dimensional space graphically. Journal
of the American Statistical Association, 68(342):361{368, 1973.
[3] J. Clark. Clustered word clouds - neoformix, april 2008. URL http://www.neoformix.com/.
[4] C. Collins, F. B. Viegas, and M. Wattenberg. Parallel tag clouds to explore and analyze
faceted text corpora. pages 91{98, Oct. 2009. doi: 10.1109/VAST.2009.5333443. URL
http://dx.doi.org/10.1109/VAST.2009.5333443.
[5] W. Cui, Y. Wu, S. Liu, F. Wei, M. Zhou, and H. Qu. Context-preserving, dynamic word
cloud visualization. IEEE Computer Graphics and Applications, 30:42{53, 2010. ISSN 0272-
1716. doi: http: //doi.ieeecomputersociety.org/10.1109/MCG.2010.102.
[6] J. Feinberg. Wordle. In J. Steele and N. Iliinsky, editors, Beautiful Visualization Looking at
Data through the Eyes of Experts, chapter 3. O'Reilly Media, 2010.
[7] Y. Hassan-Montero and V. Herrero-Solana. Improving tag-clouds as visual information
retrieval interfaces. In InScit2006: International Conference on Multidisciplinary Information
Sciences and Technologies, 2006. URL http://nosolousabilidad.com/hassan/improving
tagclouds.pdf.
[8] O. Khalifa, D. Corne, M. Chantler, and F. Halley. Multi-objective topic modelling. In F. F.
Purshouse and S. Greco, editors, Evolutionary Multi-Criterion Optimization (EMO 2013), 2013.
[9] K. Papineni, S. Roukos, T. Ward, and W.-J. Zhu. Bleu: a method for automatic evaluation of
machine translation. In Proceedings of the 40th Annual Meeting on Association for
76
Computational Linguistics, ACL '02, pages 311{318, Stroudsburg, PA, USA, 2002. Association
for Computational Linguistics. doi: 10.3115/1073083.1073135. URL http://dx.doi.org/10.3115/
1073083.1073135.
[10] J. Steele and N. Iliinsky. Beautiful Visualization: Looking at Data through the Eyes of
Experts. Oreilly & Associates Inc, 2010. ISBN 1449379869.
[11] E. R. Tufte. Visual Explanations: Images and Quantities, Evidence and Narrative. Graphics
Press LLC, 1997.
[12] E. R. Tufte. The Visual Display of Quantitative Information. Graphics Press LLC, 2nd
edition, 2001.
77