Академический Документы
Профессиональный Документы
Культура Документы
грамотная
работа с данными
предисловие
Эта книга — небольшой путеводитель по грамотной работе с данными, Текущее издание рассказывает об элементах последних шести тематических
источник подходов и советов по созданию визуальных форм ваших данных. марафонов по работе с программными продуктами для визуализации дан-
Мы хотим, чтобы вы научились создавать красоту из сложных хитросплете- ных. Путеводитель также показывает наработки из корпоративных тренингов
ний абстрактных данных, умели задавать аналитические вопросы, овладели DataYoga, проводимых для крупнейших компаний в разных отраслях экономики.
навыками целеориентированной разработки интерактивных дашбордов
и визуализации. Мы хотим поделиться своими наработками, чтобы начать системную работу
по исследованию лучших практик, применяемых нашими клиентами и
Многие начинающие специалисты, работающие с данными, ощущают партнерами. Мы приглашаем к сотрудничеству участников профессиональ-
нехватку лаконичных материалов, которые бы охватывали весь спектр
ных коммьюнити, работающих с дизайном, программным обеспечением для
темы грамотной работы с данными. Поэтому мы сделали путеводитель.
бизнес-анализа, специалистов из бизнеса.
Мы постарались объяснить наиболее важные и ключевые темы в деталях
и сразу же дать необходимые ссылки на более развернутые материалы для Как практикующие преподаватели с многолетним опытом, курирующие кур-
дальнейшего самостоятельного изучения. Это поможет вам ориентироваться сы в ВУЗах и корпоративных университетах, мы видим как быстро меняются
в пространстве данных.
подходы, технологии и требования в сфере анализа и визуализации данных.
Основой для материалов путеводителя стала системная работа целого Классические руководства по дизайну данных так и остаются не переве-
сообщества специалистов в рамках образовательных проектов DataYoga. денными на русский язык, и мы стараемся заполнить потребность в этих
Наше сообщество было сформировано за последние несколько лет благода- материалах, собирая по крупицам полезные практики. Мы делимся ими
ря экспериментам с новыми форматами обучения в онлайне и опыту почти в рамках обмена опытом в наших онлайн-сообществах, которые мы ведём
2 10 000 участников марафонов по работе с визуализацией данных. последние несколько лет.
Современные коммьюнити для новичка в этой сфере — это основа для Эта книга предназначается для тех, кто только приходит в эту область
быстрого обучения, практики, обмена опытом. Мы благодарны всем нашим знаний и ищет хороший путеводитель для долгосрочной системной работы
коллегам, которые внесли свой вклад в систематизацию материалов, по- и накопления опыта. Мы пытались выстроить системный взгляд на область
делились своими знаниями и продолжают просветительскую деятельность разработки информационных продуктов: интерактивные отчеты, презента-
в этом направлении. ции и дашборды. Мы объединили материалы наших отдельных марафонов,
построили между ними связи и показали области для дальнейшего изуче-
В отсутствие необходимых русскоязычных материалов, многие специали-
ния и развития навыков в этой сфере.
сты ведут самостоятельное обучение работе с программными продуктами
для визуализации данных. Многим это дается тяжело: не просто соединять Многие примеры путеводителя представлены в скетчах, для того чтобы
технические навыки с визуальным анализом и критическим мышлением. быстро передать некую идею и проиллюстрировать подход, но более
Форма может теряться по мере того, как на первый план выходят срочные подробные материалы разбора, множественные практические примеры,
бизнес-задачи. Но именно визуальная форма и понимание того как совре- вы конечно же найдёте на страницах наших марафонов, которые находятся
менный человек воспринимает информацию, во многих проектах становит- в бесплатном открытом доступе на сайте datayoga.ru
ся краеугольным камнем и влияет на успешность реализуемых задач.
Визуализация данных сильно недооценена в современном бизнесе. Но, как
мы видим в последнее время, начинают набирать силу долгосрочные кор-
поративные образовательные проекты, нацеленные на грамотную работу
с данными и визуальной аналитикой. Такие программы ставят перед собой
цель научить сотрудников понимать и видеть данные, чтобы принимать
Учитесь с удовольствием. Виз виз урааа! 3
обоснованные бизнес-решения.
зачем вам DataYoga
и чему вы научитесь
Для легкого старта: отметьте для себя те темы книги, которые кажутся вам Уметь различать 50 оттенков серого, знать их названия и понимать приро-
наиболее интересными. ду цвета, уверенно подбирать свои целевые палитры для данных
Разобраться в управленческих технологиях и видеть ключевые показатели Различать зрительные иллюзии и понимать людей с особенностями
эффективности визуально восприятия
Уметь правильно выбирать и настраивать виды визуализации под вашу Уметь выстраивать аргументы за использование таблиц для работы
задачу с цифрами, и настаивать на применение визуализации для аналитических
целей
Понимать пользователя и его поведение
Противодействовать когнитивным искажениям, знать их природу и не до-
Узнать как различные шрифты управляют вниманием, что такое изящ-
пускать ошибок визуализациях и презентациях
ность и какой шрифт подобрать для цифр
Освоить составление информативных заголовков, аналитических выводов
Как переносить стили художников и их цветовые палитры в дизайн своих
и аннотаций, правильно размещать метаданные
информационных продуктов
4
Найти эффективный алгоритм для разбора чужих дашбордов в деталях, Научиться скетчить, графически передавать свои идеи быстрыми набро-
уметь их переделывать и видеть нюансы визуализации сками и собрать свой визуальный словарь
Научиться выявлять и собирать требования к интерактивному продукту Научиться проектировать дата истории с эмоциональным вовлечением
Соприкоснуться с историей первых визуализаций и появления дашбор- зрителя
дов в разных областях человеческой деятельности Проектировать слайды презентаций и не тратить на это много времени
Поразмышлять над особенностью дизайна для мобильных устройств Освоить приемы интерактивности для удобной аналитики
Обосновать перечень компетенций и того что нужно знать и уметь Разбираться в различных типах данных и понимать их связь со шкалами
чтобы быть грамотным в работе с данными и визуальным представлением
Сравнить требования и детали современных стандартов по визуализа- Практиковать принципы DataYoga – осознанность и концентрацию
ции данных и разработать свой гид по стилю дашбордов на текущем моменте
Хорошо ориентироваться и уметь подбирать графические стили для Уметь научить даже ребёнка понимать, любить и проектировать
визуализаций визуализации
5
раздел
6
7
о DataYoga
8
9
DataYoga – это
Идея достижения того, что прежде с помощью имеющихся у нас дан- осознавать все, что вы делаете. действовать, следя за направлени-
было недостижимо, лежащее пока ных. Мы можем быть погружены Ваша внимательность снижает ве- ем своего движения. Это поможет
еще за пределами наших возмож- в процесс, но на самом деле уделять роятность ошибок, а осознанность всегда знать, где находится цель
ностей. Это идея изменений, которые ему очень мало внимания; действо- во всех ваших действиях избавит от и что нужно, чтобы до нее добрать-
происходят когда мы предприни- вать, но не присутствовать в своем старых ненужных привычек. Вам не ся. Такое внимательное наблюдение
маем действия, позволяющие нам действии. нужно будет уже делать что-то се- позволит вам постоянно обнаружи-
выйти за свои границы, и в ходе дис- годня, только потому, что вы делали вать что-то новое.
DataYoga стремится к достижению
куссии лучше понять себя или других. такого состояния, когда вы присут- это вчера. Так вы сможете избежать
ствуете в каждом действии, кото- бессмысленных повторений в своих
Образ действия, при котором наше поступках.
внимание целиком и полностью рое вы осуществляете со своими
сконцентрировано на том, чем мы данными. Концентрация внимания В истинной практике DataYoga каж-
занимаемся в настоящий момент. позволит вам выполнять работу дый человек идет своей дорогой.
На тех задачах, которые мы решаем лучше, чем прежде, и при этом И для движения вперед нужно
10
принципы DataYoga
11
Наше внимание целиком Когда же мы обладаем Методологические практики Асаны присоединения к дан-
8 шагов и полностью сконцентриро- ясным пониманием, мы чув-
ствуем глубоко внутри себя
для понимания чувств ауди-
тории
ным, помогают объединять
источники
вано на том, чем мы занима-
Data Yoga емся в настоящий момент тишину и покой Учимся концентрироваться на конеч- Налаживаем навыки подключения
Обретаем здоровый разум и баланс Налаживаем гармоничное взаи- ной цели и держать в фокусе задачи к данным и их объединения. Пони-
при работе с данными внешнего модействие со своим внутренним нашей аудитории: максимально маем происходящее за пределами
мира путем соблюдения определен- миром и своими данными. Учимся погружаемся во внутренний мир зоны видимости для достижения
ных правил: использования визуа- держать данные в чистоте и преоб- пользователей наших визуализаций максимального внимания и эффек-
лизации во благо, отказ от обмана, разовывать их для визуализации. и вовлекаем их в циклы прототипи- тивности. Учимся практически.
манипуляций и профанаций, отказ Понимаем свои компетенции и рования дата-продуктов.
от накопления бесполезных данных выстраиваем путь самообразова- Понимание аудитории Вопросы к данным
и желания обладать ими бесцельно. ния. Самодисциплина приведет нас
Проведение интервью Как мы измеряем и пониманием
Жизнь в ладу с внешним миром. к осознанной удовлетворенности
Важность KPI данные
и возможности делать полезные
Применение визуализации Виды агрегации
визуализации на благо всех окружа- Подходы к ведению дата-
в разных доменах
ющих. проектов Способы объединения
Саморазвитие в области работы Корпоративное управление
с данными данными
12 Форматы обучения
Визуальное дыхание дает Управление текущим момен- Медитация и интерактив- Сверхсознание это уже ваша
почувствовать данные том концентрация на даш- ность проявляет связи история
Визуальная пранаяма – «аяма» – борде в данных Убираем временные и простран-
означает расширение, описывает Собираем все свои визуальные на- Отбрасываем всё и ощущаем только ственные рамки: практикуемся
воздействие пранаямы. «Пра- выки и направляем их, концентрируя предмет нашей медитации, настра- подавать наши инсайты в различных
на» – это то, что есть повсюду, то внимание на разработке идеального ивая интерактивные элементы на подходах выстраивания дата-исто-
есть данные. Учимся удерживать дашборда и его адаптации под мо- дашборде. Это позволит визуально рий. Медитируем регулярно.
внимание на датавизе и расширяем бильные устройства для получения отвечать на наши целевые вопросы. На восьмом шаге датайоги деятель-
видение находящейся за данными идеального дата-продукта. Учимся проектировать пользова- ность ума характеризуется устойчи-
реальности. Правило «быть здесь и нигде тельский опыт с помощью интерак- вой фиксацией внимания.
История визуализации больше» является ключом к полной тивных элементов.
Истории против анализа данных
Принципы визуального дыхания концентрации. Есть только текущий Когда человек постоянно концентри-
Приемы сторителлинга
Как работают диаграммы момент. Нет ничего больше руется на одном объекте, он обретает
все более и более глубокое понима- Идеальная история на языке
Как читать визуализации Что такое дашборд данных
Основные виды дашбордов ние этого объекта
Каталог визуализаций
Точки внимания и сетки Виды интерактивности
Прототипирование и скетчинг
Мобильные макеты Процесс аналитики
Стандартизация ТВ-дашборды Пять видов анализа данных 13
Важность цвета и шрифта Ошибки на дашбордах
раздел
14
15
o Data Literacy или
что такое грамотность
в работе с данными
DataYoga вместе с глобальной инициативой DataLiteracyProject стремится Грамотность работы с данными – это умение понимать данные, работать
сформировать сообщество увлеченных людей, которые осознают важность с ними и анализировать их, а также правильно интерпретировать и использо-
навыков грамотной работы с данными. вать. Необходимо также уметь обосновывать свое мнение и выводы, основы-
На практике термин Data Literacy означает набор навыков, который помогает ваясь на данных.
работать с данными без ошибок, решая свои задачи. При этом, это не только Последние несколько лет, компании по всему миру включают программу
технические навыки работы в программном обеспечении — компетенции развития навыков Data Literacy в свои внутренние стандарты обучения со-
включают в себя понимание концепций управления данными, знание базовой трудников. Менеджмент верит, что эти навыки нужны не только аналитикам,
статистики, а также умение выдвигать гипотезы и принимать обоснованные но и вообще всем. При этом, грамотная работа с данными востребована не
решения на основе данных. только в бизнесе.
.02
.01
.03
Данные становятся
более ценными
Данных становится больше Данные становятся доступнее
Компания делает свои данные
Человечество производит все доступными для сотрудников, чтобы Поскольку объем данных в послед-
больше и больше данных год от года. они сами могли строить отчеты или ние годы растет экспоненциально,
Новые инструменты и технологии, работать с данными – к счастью, аналитика коренным образом
развитие способов хранения и уже многие компании знакомы изменила методы работы компаний.
обработки данных, увеличивающе- с SelfService аналитикой и не боятся Компании пытаются перевести все
еся число транзакций и изменение отдать данные рядовым сотрудни- процессы в цифровой вид: оцифро-
пользовательских привычек. NFT- кам для самостоятельного анализа. вать и тегировать. Для организаций
аукционы, глобальные базы данных В обществе формируются порталы очень важно использовать эти
по заболеваемости, хранилища и организации по работе с открыты- данные для принятия правильных
рекламных предпочтений в интер- ми данными, создаются площадки решений – и они готовы давать лю-
нете, поставленные лайки и реакции, для краудсорсинга данных: каждый дям доступ к данным без обученно-
отслеживание здоровья и заполнен- может добавить свой кусочек к ми- го персонала продвинуться дальше
ности холодильника… ровому пазлу данных. этого шага практически невозможно. 17
культура грамотной
работы с данными
Навык читать и понимать дан- скими методами и алгоритмами Компаниям с высоким уровнем грамотности работы с данными при принятии
ные – снимает «языковой» барьер для проведения самостоятельного решений не нужно опираться только на нескольких дата-саентистов, которые
в понимании всего процесса работы анализа и поиска инсайтов (озаре- и без этого обычно сильно загружены. У большего числа сотрудников тоже
с данными. Что такое гистограмма? ний) в данных. Или же читать уже будут навыки анализа данных и в организациях смогут приходить к эффектив-
Из чего состоят базы данных? Когда подготовленные кем-то аналити- ным решениям быстрее.
нужно использовать медиану? Мы ческие отчеты и делать выводы Сотрудники будут обучены задавать правильные вопросы и выдвигать гипо-
учимся разбираться в терминологии на основе полученной информации. тезы, а также чувствовать себя более комфортно в общении с руководством
и без проблем считывать данные. Статистические навыки не равны при помощи данных. Компании будут конкурентоспособны, потому что смогут
Навык работать с данными – аналитическим, а скорее являются быстро разобраться в своих данных, чтобы адаптироваться к происходящему
это ваша способность взаимодей- их частью. и опережать своих конкурентов. В конце концов, весь персонал будет чув-
ствовать с полученными и (уже Навык вести аргументацию ствовать свою причастность к общему процессу анализа данных и процессу На специальной доске Miro вы
успешно) прочитанными данными. принятия решений. сможете узнать больше про навыки
и коммуникацию с помощью
Понимание инструментов для их данных – это умение отстаивать В компании с развитой культурой данных, данные рассматриваются как вто- и компетенции по работе с дан-
обработки, использование методов свою точку зрения (гипотезу, пред- рой язык, на котором говорят все. Все кто когда-либо учил иностранный язык ными, их описание и модель оценки
визуализации, подготовка данных положение, действие) с помощью понимают, что изучение любого языка — комплексное освоение навыков уровня зрелости организаций в
для презентации. данных. Это новая альтернатива чтения, понимания, разговора и восприятия. рамках подходов Data Literacy
Навыки анализа данных – дают традиционной интуиции, которой miro.com/app/board/o9J_kpnxzOk=
возможность приходить к выводам. часто руководствовались при
Вы можете владеть статистиче- принятии решений. 19
Свободное владение данными включает в себя 4 ключевые Истории успеха.
компетенции. Изучите примеры развития куль-
Эти компетенции — не конечны и не являются строго обязательными. туры данных в разных компаниях на
Уровень развития каждой группы навыков зависит от вида, частоты, уровня, сайте проекта DataLiteracy
профиля деятельности каждого отдельного человека. Но такой список
20 может служить хорошим ориентиром возможных стремлений. dataliteracy.ru/cases
Язык данных включает те же самые подходы, которые мы используем в нашем «разговорном» мире. Мы учимся читать
и изучаем основные блоки языка. Мы учимся слушать других и обрабатывать, то что воспроизводится другими. Мы
начинаем формулировать собственные сообщения. Мы делимся ими с другими людьми и наблюдаем за реакцией
окружающих на наши мысли и предложения. И, конечно же, мы стремимся пообщаться с теми, кто свободно общается
на новом для нас языке.
Знание языка данных помогает Знание языка расширяет ваши Людям свойственно бояться того,
произвести хорошее впечатление горизонты. Язык — самый на- чего они не знают. Чем лучше вы уз-
и получить достойную оплату за дежный ключ к другой культуре. наете ценности и особенности жизни
свои умения. Сегодня в компани- Современный глобальный мир, других, тем более очевидным для вас
ях нужно не только знать пред- который стремительно становит- станет тот факт, что различия между
ся все меньше, требует умения людьми не так велики, как может
метную область, но и понимать
понимать людей, принадле- показаться на первый взгляд.
принципы обработки и анализа
данных для принятия решений. жащих к другой культуре или
занимающихся в организации
Знание языка развивает такие смежными направлениями. Это
качества как уверенность в себе становится жизненной необходи- Развитие компетенций Data Literacy
и самоконтроль, повышает мостью. неразрывно связано с развити-
эффективность работы и комму- ем культуры работы с данными
никацию с коллегами. Изучение в компании, креативности среди ее
языка – непростое, но благо- сотрудников и открытой коммуни-
дарное занятия, повышающее кации, где могут появляться смелые
самооценку и уверенность в себе. идеи и новые подходы
21
cколько людей обладает
навыками грамотной
работы с данными
Исследование Censuswide от имени Qlik* показало, что только 24% лиц, принимаю- Из 1500 участников только 11% набрали проходной балл и получили сертификат.
щих решения в сфере бизнеса, от младших менеджеров до руководителей высшего Почти 50% участников не смогли сопоставить приведенный график распределения с
звена, полностью уверены в своей способности читать, работать с данными, анали- указанной величиной моды
зировать и спорить на основе данных — то есть имеют фундаментальные навыки,
которые определяют грамотность человека в области данных. Возможно те же 15% ответили, что бимодальное распределение, вероятнее всего,
имеет распределение веса новорожденных малышей
В России компания Qlik тоже проводила сертификацию: 50 вопросов по темам пони-
мания данных, базовой статистики, методов анализа данных и интерпретации биз- Для 11% участников, утверждение «значения показателя увеличилось на 200%»
нес-требований и была частью подготовки образовательного марафона от DataYoga можно описать в цифрах как «было 100, стало 200»
и Qlik «Заговори на языке данных». Тем не менее, конечно, сертификация не позиционируется как абсолютно полная и
объективная проверка знаний. Это, скорее, возможность для каждого участника
узнать больше о многообразии факторов, которые стоит учитывать при работе с
данными. Одновременно с этим, это возможность узнать свои слабые стороны и
наметить для себя новые горизонты.
*В исследовании приняли участие 7 377 лиц, принимающих решения в бизнесе. Марафон «Заговори на языке данных» – это бесплатная онлайн-программа
Исследование проводилось в период с августа 2017 года по февраль 2018 года. получения навыков понимания и анализа данных.
22 Респонденты были отобраны из Европы, Азии и США. dataliteracy.ru/speakdata
ПРОТЕСТИРУЙТЕ СВОИ НАВЫКИ РАБОТЫ
С ДАННЫМИ
Вы тоже можете пройти тестирование на проверку своего уровня знаний: от простого
и развлекательного теста до более серьезной сертификации по работе с данными,
включая вопросы на знание BI-инструментов.
Для начинающих подходит тест по определению вашей роли работы с данными.
От скептика до эксперта — насколько вы доверяете данным и верите в их силу для
принятия решений?
Посмотрим на то, как собираемые Данные собираются в том виде, На этом этапе данные фильтруют-
в огромном количестве данные в котором они генерируются устрой- ся – компания оставляет только те
из нашей повседневной жизни ствами передачи связи, в техниче- поля, которые ей нужны. Некоторые
обретают ценность. ском формате совсем неудобном поля могут пройти через правила
трансформации. «Сырые» данные
для восприятия человеком. Это
Вот наглядный пример, знако- преобразовывают в более агрегиро-
огромные таблицы данных с боль- ванный источник, которым удобно
мый каждому: данные вашего
шим количеством метрик. управлять с точки зрения хранения
мобильного телефона. Каждый
день мы пользуемся смартфонами данных. Агрегированные источники
Если компания (в нашем случае
и планшетами, совершая звонки, уже используются разработчиками
сотовый оператор связи) решает ПО и аналитиками – к ним удобно
отправляя и получая смс (все еще!) использовать эти данные для обращаться.
и используя мобильный интернет. проведения аналитики и принятия
На подготовленном источнике дан-
Каждое наше действие фиксируется решений любого уровня – от опе-
ных заинтересованные сотрудники
в специальных системах хранения рационных до стратегических, то ей уже могут задавать вопросы к дан-
данных: кто, кому, когда, из какой нужно продолжить цепочку данных ным. Ведь данные сами по себе не
точки и в какую точку на карте дальше. Начать обрабатывать «сы- имеют никакого смысла. Они должны
звонил, сколько времени прогово- рые» таблицы с помощью специаль- помогать нам в оценке обстановки,
рил и сколько мегабайтов интернета ных процедур и правил, формируя принятии решений, разрешении
25
потратил. курируемые источники данных. проблем или постановке целей.
Как развивать компетенции Модель аналитических компетенций состоит из общих
и профессиональных компетенций
внутри компании? Data Literacy – все сотрудники
Татьяна Хорошева
— Жизненный цикл аналитики данных
Руководитель Направления развития компетенций по анализу данных,
Газпромнефть – Региональные продажи — Качество данных
Мы в компании используем единую систему, включающую в себя перечень — Основы анализа данных
общих и профессиональных компетенций, их индикаторов, позволяющих — Основы машинного обучения
оценить уровень развития каждой компетенции.
— Визуализация и интерпретация данных
Использование модели компетенций позволяет спрогнозировать програм-
му обучения, также применяется при оценке эффективности проведенного Data Science – профессиональные компетенции продвинутого
обучения, корректировке планов развития сотрудников, оценке соответ- анализа данных.
Узнайте ваш уровень владения
ствия кандидата планируемому повышению, что в свою очередь позволяет — Подготовка и организация данных
инструментом Qlik Sense, чтобы
сформировать прозрачную систему мотивации персонала.
найти свои слабые места и сильные — Основы разработки программного обеспечения
стороны — Математические основы анализа данных
dataliteracy.ru/qlik-check
— Методы оптимизации и имитационного моделирования
26 — Машинное обучение и анализ данных
какую выгоду
приносят данные
27
от данных
к мудрости
От сырых данных к мудрости, которая помогает нам делать выводы и при- Знание.
нимать решения. Навыки грамотной работы с данными нужны и для того, Информация, которая была собрана и обработана. С одной стороны, это
чтобы понимать, какие данные могут быть полезны вообще и уметь преоб- синтез всей имеющейся информации с целью получения результата. С дру-
разовывать их от простого набора цифр в ценность гой — знание индивидуально. Знание можно передать кому-то только в
виде информации.
Нам зачастую не нужны все данные, которые собираются и доступны нам
Мудрость. Знание, которое трансформируется в принятие обоснованного
в различных системах хранения. Не все из них можно трактовать с поль-
решения. Здесь задаются вопросы «что происходит» и «почему это проис-
зой. Некоторые просто создают шум, из которого нельзя получить ничего
ходит».
полезного.
Давайте на примере. Представьте, что вы — пилот самолета. Вдруг на при-
Исходные данные.
борной панели загорается надпись: «10 000». О чем вы подумаете? Сейчас
Это пока еще только потенциально полезная информация. Не все данные
для вас эта цифра — просто данные. Вы пока не знаете как их применить
имеют ценность. Но если вы сможете предварительно «просканировать»
к своему опыту управления самолетом. Затем, появляется надпись: «над
исходные данные и понять их потенциальную пользу, то данные можно
Концепция пирамиды DIKW. Чтобы уровнем моря». Окей, теперь у этих данных есть значение и цель – они
собрать и проверить на качество – узнать пригодны ли они.
прийти к мудрости, нужно пройти показывают высоту полета. Это стало для нас информацией. Из своего про-
путь извлечения выгоды из данных Информация. шлого опыта мы знаем, что впереди на нашем пути есть большая-большая
через получение информации и фор- Данные, которые имеют цель и значение. Изучаем взаимосвязи между вершина – гора Олимп, высотой в 12 000 метров. И как успешный мудрый
мирования знания. элементами исходных данных, например с помощью визуализации. пилот мы понимаем, что самолету нужно подняться еще выше, чтобы доле-
теть до конечного пункта маршрута в целости.
28
процесс принятия
решений
30
корпоративные
марафоны
34
35
Другая крайность Несколько точек Сложная Дублирование усилий
self-service правды поддержка Вместо того, чтобы посчитать
нужные показатели один раз и со-
Подход self-service кажется грамот- Если пользователи сами занимаются При таком подходе, администриро-
хранить их в курируемом источнике
ным с точки зрения работы с дан- публикацией источников данных, вание сервисов аналитики может
данных, пользователи будут каждый
ными и актуальным для множества это приводит к нескольким версиям усложняться за счет нестандартизи-
раз создавать новые источники и
организаций. Вы перекладываете одних и тех же исходных данных рованных правил выдачи доступов,
заново рассчитывать необходимые
ответственность по работе с данными в разных источниках. Становится отсутствия системы наименований,
метрики.
на конечных пользователей, понима- сложно уследить за корректностью логически слабой организации
ющих бизнес. данных и их качеством. Ситуа- контента.
Однако, не попадите в другую край- ция повторяется и с конечными
ность такой свободы. Если полностью дашбордами, часть которых может
уйти от управления данными при терять свою актуальность, но не
self-service подходе, то есть веро- архивироваться.
ятность получить хаос из данных
и информационных систем.
36
Поэтому, компаниям нужно Единый Менеджмент Легкое
приходить к модели управляемого
self-service, при котором, сервис безопасный групп доступа администрирование
аналитики будет иметь возможно- источник данных Каждый пользователей может При управляемом self-service, ад-
сти мониторинга, прописывания быть наделен особыми правами министраторам понятна структура
ролей пользователей, контроля Модерирование источников
группы доступа, в зависимости сервера, логика выстроенных при-
прав доступа, модерации источни- данных централизованно поможет
от того, какие у него потребности ложений, матрица ролей и уровней
ков данных и каталогизирования обеспечить качество и актуаль-
работы с данными и какие навыки доступов. Это облегчает процесс
метрик, дашбордов и приложений. ность данных для пользователей,
он уже имеет. Таким образом легче изменения администрирования
которые, в свою очередь, будут
проводить поддержку доступов и поддержки
всегда уверены в ответах, которые
и их изменение
они получают.
Искусство внедрения Qlik Sense. Можно читать без привязки к продукту Qlik
datayoga.ru/qlik13dragon
Подробнее про управление проектами в одном из дней Марафона
datayoga.ru/qq03 37
где шум,
а где – сигнал
Для качественной работы с данными мы должны понимать, что для нас Сигнал — это что-то, чего мы не знали до текущего момента, но что имеет
важно, что мы ищем, что нам будет полезно? Когда мы хотим принимать для нас ценность, благодаря которой мы в состоянии совершить полезное
решения на основе данных, нам нужно понять что является для нас сигна- действие.
лом, а что — просто шум, который необходимо игнорировать. Сигнал — это та информация, которая вам необходима. Шум — это вся
Данные сами по себе не могут считаться сигналом. Напротив, данные — остальная информация, которая мешает найти нужный сигнал.
это наблюдения и факты, которыми мы обладаем, большинство из которых Представьте себя игроком баскетбольной команды, вам надо принять реше-
является шумом. Чтобы данные были полезны, они должны быть инфор- ние — передавать кому-то пас или попытаться забить мяч самостоятель-
мативны, иметь ценность и заслуживать ответного действия, реакции. Нам но? За пару секунд вы должны оценить положение игроков своей команды,
нужно уметь искать в данных сигналы. игроков команды противника, вспомнить их сильные и слабые стороны,
прислушаться к тренеру и своей интуиции, услышать подсказки болель-
щиков и вспомнить математические прогнозы, которые вы читали неделю
назад. Довольно много информации вокруг? Но не вся из нее полезна.
38
как искать
сигналы
При исследовании данных руководствуйтесь несколькими ключевыми прин-
ципами, которые помогут вам получить наиболее качественный результат.
.02
.03
.01
Оставьте
.04
предрассудки Перепроверяйте.
Мы подвержены десяткам когнитив- Всегда.
Четко определите ных искажений (то, чему в англий- Этот совет вытекает из предыдущего Задавайте вопрос «Почему?
свой вопрос ском соответствует термин cognitive совета. Оставайтесь скептиками Почему? Почему?»...
Что вы ищете? Поставьте цель. bias). Постарайтесь исключить из и задавайте новые вопросы. Почему Это самый мощный вопрос в вашем
Не важно, большая у вас цель или процесса работы с данными уже полученные цифры отличаются друг арсенале для проведения исследо-
маленькая, личная или масштабная. сформированные мнения и убежде- от друга именно так? Может, про- вания. Старайтесь посмотреть сквозь
Четко сформулируйте вопрос, иначе ния. Помните о том, что любой пущена часть данных? Это вообще полученные цифры, ищите смысл,
вы рискуете потеряться и уйти от вывод лучше подвергнуть сомнению соотносится с моим изначальным перепроверяйте на соответствие
исходной задачи. и перепроверить. поставленным вопросом? исходной цели исследования.
40
41
I подготовительная
шаг медитация
Наше внимание целиком и полностью скон- что мы говорим, как мы говорим на – через проникновение в суть
и как это повлияет на окружающих. проблем и запутанных явлений мы
центрировано на том, чем мы занимаемся Регулярное занятие датайогой
движемся к ясности понимания.
в настоящий момент предполагает, что мы сможем
Если некоторые из нас ищут реше-
ния проблем, то по ходу достигают
научиться присутствовать в ка-
определенной степени ясности.
ждом конкретном моменте работы
Обретаем здоровый разум и баланс при работе с данными внешнего мира с данными, в каждом аспекте Практикуя датайогу мы можем
путем соблюдения определенных правил: использования визуализации рассчитывать только на один ре-
управления информационными
во благо, отказ от обмана, манипуляций и профанаций, отказ от накопле- зультат – успокоение ума. Тяжесть
потоками и в результате дости-
ния бесполезных данных и желания обладать ими бесцельно. Жизнь в ладу и нервозность каким-то образом
гать того, чего не могли достичь
с внешним миром. исчезают.
прежде. Мы постепенно повышаем
свою способность к концентрации
и к независимости. Мы улучшаем
В датайоге нам необходимо тре- Нужно понимать, что правдивость,
отношение с окружающими и все
нировать способность оценивать тем не менее, не означает, что
ситуацию. Это просто означает, что что мы делаем.
правду следует говорить всегда, не
надо быть внимательным к другим Те кто ищет ясности, могут понять
и добрым по отношению к самому взирая ни на какие обстоятельства, различие между правильным и не-
себе. В любой ситуации нужно дей- ведь это может кому-то напрасно правильным восприятием. В этом
42 ствовать разумно и правдиво. отношении датайога оптимистич-
повредить. Мы должны учитывать,
Полководец медлит,
потому что не видит
победы
43
<< Сун Цзы
44
три области данных
Когда мы слышим о данных, нам приходят образы компаний, которые решают бизнес задачи при помощи таблиц, что-то новое, мы можем сделать Такое количество возможностей
специальных программ, а также аналитиков и дата-инженеров. Но не стоит ограничивать сферу применения прин- сбор данных, распространение сформировало отдельное мас-
ципов грамотной работы с данными только коммерческой деятельностью и бизнесом. информации, знаний и мудрости штабное течение – «Quantified self
Данные помогают обществу создавать более умный и функциональный окружающий мир. Навыки грамотной работы началом больших преобразований movement». Проводятся конфе-
с данными также хорошо помогают и в личной жизни каждого человека. в обществе. ренции, выпускаются журналы,
собираются онлайн-форумы – все
Персональные для обмена подходами к сбору
Профессиональная ных с данными — ввод данных, бóльшим приоритетом, чем здоро-
проекты данных энтузиастами о самих себе
инженерия данных, работа с базами вье общества и окружающей среды. и их анализу с целью улучшения
деятельность данных, дата-аналитика... После Но данные могут снабдить нас Данные могут быть полезны не качества жизни.
Скорость инноваций за последние 2015 года начала развиваться волна знаниями и осветить основные только на уровне корпораций, госу- Будете ли вы отслеживать свои
несколько десятилетий увеличилась self-service аналитики и работа проблемы, с которыми мы сталки- дарственных органов или общества, персональные данные через
драматически. Мы вынуждены изу- сданными перестала быть уделом ваемся в обществе. Некоммерче- но также могут помочь в нашей трекеры или различные сенсорные
чать новые навыки для того, чтобы небольшого количества технических ские организации и отдельные люди личной жизни. устройства или просто будете вести
успевать за временем. В 1980-х специалистов. Каждый должен быть могут собирать, находить, анали- Мы живем в мире с большим заметки о своей жизни — это мо-
годах переход от больших мэйн- грамотным по работе с данными. зировать доступные им данные количеством сенсорных устройств жет стать хорошим первым шагом
фреймов к персональным ком- по разным темам, таким как: на вашем пути к грамотной работе
пьютерам привел к необходимости
Общественная вокруг нас: на наших запястьях
с данными.
Изменение климата и окружаю- и в карманах, иногда даже встро-
изучения базовых компьютерных деятельность щей среды енных в наше тело. Эти устройства
навыков. В 1990-х развитие ин- помогают нам узнать сколько шагов
Если мы применим наши знания Права человека
тернета и всемирной сети накрыло мы прошли, как долго и куда мы
только в области корпоративных
информационными технологиями интересов, работа с данными Кризисы, связанные с инфекци- путешествовали, уровень нашего
большую часть планеты. не сможет раскрыть весь свой онными заболеваниями сердцебиения, как хорошо мы спим
Переход в новое тысячелетие и бы- потенциал. Это происходит потому, Применяя здоровую долю скеп- ночью, уровень сахара в крови
строе развитие социальных медиа что корпоративная нацеленность тицизма к данным, а также имея и ещё множество других полезных
породило сотни профессий связан- на получение прибыли становится возможность и желание изучать метрик о нас самих. 45
открытые
данные
46
47
II ясное
шаг понимание
Часто мы считаем, что видим дан- нам самим или окружающим. Или
ные «правильно», и исходя из этого сомневаясь, мы можем ничего
принимаем решения и совершаем не делать, в то время как на самом
те или иные поступки. Впоследствии деле наши действия принесли
оказывается, что на самом деле бы пользу. Нам недостает правиль-
мы обманываем самих себя и что ного видения и понимания наших
48
наши действия причиняют вред возможностей.
Все должно быть
сделано так просто,
как это возможно.
Но не проще
49
<< Альберт Эйнштейн
50
путь человека: как развиваться
в визуализации данных
В каких областях вам стоит развиваться, если вы хотите развиваться
в работе с данными?
Знание основных статистиче- вашей аудитории нужно видеть Что касается технической части принятия решений, поэтому Умение четко излагать свои
ских концепций именно эти данные; а также, для понимания данные, вы будете интерес к работам Дэниела мысли
Вы должны понимать разницу чего аудитория будет использо- более продуктивны, если сможете Канемана, Дэна Ариели, Шейна Важно организовывать мате-
между средним значением, вать именно эти диаграммы. выполнять очистку данных самосто- Пэрриша, братьев Хит и других, риал, опираясь на критическое
медианой и модой, как правиль- ятельно, а не полагаться на других, пишущих о принятии решений, мышление, выстраивание
но рассчитывать процентное Понимание природы данных а знание SQL может быть действи- логической иерархии, форми-
является хорошим знаком.
изменение между периодами Знание как выбрать правильный тельно ценным. Но развитие этого рование связного рассказа на
и уметь выполнять другие базо- тип диаграмм для вашей ауди- навыка зависит от ваших целей. Опыт работы с программным основе данных. Быть хорошим
вые статистические вычисления. тории и какие данные исполь- обеспечением слушателем, отказаться от
Да, эти функции сегодня выпол- Базовые навыки графического собственных представлений
зовать. Чтобы развивать этот Речь идет как о ПО для визуали-
няют программные продукты, дизайна и ожиданий и уметь «залезать
навык, необходимо регулярно зации данных, так и прикладны-
но ваше понимание нужно для Базовое понимание особенно- в головы» лиц, принимающих
читать книги, статьи и блоги от ми программами и сервисами решения, чтобы выяснить, что
самопроверки. стей работы с цветом и шрифта-
разных авторов, таких как Стивен ми достаточно для разработки для обработки данных, создания им действительно нужно.
Базовые знания отраслевых Фью, Альберто Каиро и Эдвард большинства диаграмм. Плюсом специализированных видов диа-
задач Тафти – и других исследователей будем интерес к когнитивным грамм и онлайн-презентаций. Вы Стратегические просчеты не могут
Это необходимо для проектиро- в этой области знаний. Участвуй- искажениям и психологии можете проходить сертификацию быть компенсированы тактически-
те в дискуссионных форумах по по выбранным вами инструмен- ми средствами.
вания востребованных визуали- визуального восприятия. Боль-
заций и требует удивительно глу- визуализации данных, конферен- шинство диаграмм создано для там, а также формировать свое
бокого понимания того, почему циях, конкурсах и мероприятиях. поддержки более эффективного портфолио решенных кейсов. 51
форматы
обучения
Визуализация данных одна из наибо- к решению задач... Но то, что объеди- Для того, чтобы увереннее разви-
лее быстро развивающихся областей няет всех, это желание максимально ваться при работе с конкретными
Аналитики и Науки о данных. Она эффективно инвестировать свое BI инструментами, присоединяйтесь
дает возможность представить время в получение новых знаний. к Telegram-сообществам! В чате
данные в таком виде, чтобы даже Какие виды обучения нам известны? всегда можно задать любой вопрос
неподготовленный человек смог их Менторство по продукту и по работе с данными,
понять. Объединение эстетических Самообучение: книги, блоги, чтобы получить поддержку.
элементов визуализации создают образовательные ресурсы
произведения искусства, которые в Онлайн-обучение Ищите в Telegram чаты от DataYoga
то же время передают аналитические Академическая программа для по Qlik, Tableau и Yandex DataLens:
выводы, которые в свой черед помо- ВУЗов @qlikbi_chat,
гают принимать бизнес решения. Сборная группа в тренинговом
Все люди разные, разнятся их @tableau_chat,
центре / онлайн
навыки, жизненный опыт, подходы Корпоративное обучение/онлайн @yandexdatalens
55
<< Владимир Тарасов
56
дао процесса
создания дашборда
В DataYoga мы используем
проверенный на практике подход
к разработке интерактивных даш-
бордов – или любого дата-про-
дукта в целом. Это последователь-
ность этапов, которые помогают
системно подойти к процессу
и получить планируемый результат
с минимальными рисками – лотос
датайоги.
В книге мы помедитируем на
каждым из этих этапов.
57
начало работы
и сбор требований
Сбор требований – это сбор необ- Перед запуском проекта: для BI-проекта, вы должны попы-
ходимой информации о проекте, таться получить информацию для
обозначьте цель проекта
включая информацию об инфра- трех категорий:
структуре, техническую информа- поставьте сроки
функциональной
цию, такую как источники данных спланируйте ресурсы, роли и от-
технической
и возможности подключения, ветственность команд
требования к дашборду, а также инфраструктурной
определите этапы и задачи
сопроводительную информацию, Заказчик дашборда определяет
например, о будущих пользователях зафиксируйте критерий успеха функциональные требования
и необходимых лицензиях. Составление паспорта проекта важно будущего продукта. На основе этого,
для проектов BI. Он предоставляет команда формирует технические
Процесс, которому вы должны сле-
краткое его описание, на котором требования и инфраструктурные.
довать — это продолжать задавать
различные вопросы, чтобы полу- основывается дальнейший сбор
Прямой контакт с заказчиком не всегда возможен. Но требования к даш- требований. Без четкой цели, можно
чить ясность о текущей ситуации
борду все равно нужно получить. Если доступного контакта нет и провести легко сойти с маршрута.
и о будущих планах. Задавайте как
полноценное интервью не получается, попытайтесь прочитать требования
можно больше вопросов. Этот про- Как начать сбор требований? Какую
к продукту из письменных переписок и встреч.
цесс углубления в детали и попытки информацию вы должны собрать?
понять формулировку проблемы Какие вопросы задавать? Когда
58 называется сбором требований. дело доходит до сбора требований
узнайте
свою аудиторию Интерактивный дашборд. Сами
работают с данными и привыкли
просматривать все детали на больших
экранах. Целевой дашборд: высоко ин-
терактивный, с большим количеством
фильтров.
Презентация. Любят, чтобы им
Ваш дашборд начинается и заканчивается вашими пользователями. Вам подготовили слайды с выводами
необходимо разработать продукт с учетом целевой аудитории и требований и аннотациями. Чтобы аналитические
к ее взаимодействию. выводы уже были готовы и понятны,
чтобы не тратить свое время на
Ваша целевая аудитория может относиться к одной из четырех категорий: поиск инсайтов. Целевой дашборд: без
руководители, бизнес-пользователи, аналитики данных, ИТ-пользователи. интерактивности, вывод всех подписей
Руководителям и аналитикам данных потребуется аналитический или данных, все диаграммы помещаются
на одном экране.
стратегический дашборд, чтобы исследовать тенденции и улучшать биз-
нес-стратегию. Бизнес-пользователям и ИТ-специалистам потребуется Мобильный дашборд. Находятся
дашборд операционного типа, чтобы внимательно отслеживать ежедневную в постоянных поездках, смотрят
производительность и составлять отчеты о бизнес-деятельности. данные на маленьких экранах. Целевой
дашборд: верстка подстроена под
Частота использования дашборда тоже будет влиять на его адаптацию мобильный формат, нет сложных
к аудитории. Например, отчеты, которые используются аналитиками по детализированных диаграмм.
несколько раз в день, должны быстро открываться и, скорее всего, требо- Email рассылка. Получают много
вать минимальных стартовых настроек по фильтрам и параметрам. А если писем, привыкли работать в компании
целевая аудитория (например, те, кто находится постоянно на встречах через рассылки, получая оперативные
у клиентов) будет просматривать дашборды на бегу, то нужно адаптировать данные в почте. Целевой дашборд:
дашборд под мобильные устройства. При этом, мобильные версии даш- краткие выжимки по основным опера-
бордов должны учитывать небольшой размер экрана и нестабильную связь тивным показателям.
мобильного интернета. 59
Точно понимая цель и потребности конечных пользователей, вы как разработ-
чик сократите общее время работы и эффективно выстроите процесс работы
над продуктом, не совершая лишних усилий.
После определения потребностей целевой аудитории, можно перейти к определению Дашборды могут отвечать на большое предоставлять общую сводную
ключевых показателей для выбранной аудитории. количество разных вопросов одновре- «картину бизнеса» для руководи-
Какую бизнес-проблему вы пытаетесь решить? Тип создаваемого дашборда зависит менно. Но лучше оставить только самое телей
от ключевых показателей эффективности, которые необходимо отслеживать. Опреде- необходимое. Определитесь и выберите помогать менеджерам планировать
лив эти показатели в начале, вы поймете, чего пытаетесь достичь. Выбирайте только топ-3 конечных цели, которые должен процессы и акцентировать внимание
нужные метрики, которые ценны и полезны для выбранных задач. Отделите руду от решать будущий дашборд, например:
выступать в роли интерфейса к БД
полезных KPI. сообщать о последних достиже-
ниях
ставить цели для конкретных сотруд- Определение конечной цели облегчит
ников или отделов подготовку источника данных и прото-
типа дашборда. Поскольку одни и те же
содействовать определенным данные можно показать как минимум
действиям время от времени 10 разными способами, определение
сообщать о экстренных ситуациях, цели сфокусирует вас на выборе наибо-
сбоях, отклонению от плана лее подходящих способов визуализаций
под задачу.
На странице ресурсов и полезных
материалов по книге вы можете найти
шаблон для реестра KPI в формате
таблицы Excel. Реестр KPI помогает
собрать в одном месте все характери-
62 стики KPI для отслеживания.
если вы собираете
требования на слух
Лучше провести несколько этапов Перестаньте думать, просто Даже если чувствуете что что-то
тестирования и интервью-сессий, слушайте упустили, двигайтесь дальше
чем пропустить что-то действительно Расставляйте приоритеты Развивайте свой визуальный
важное. словарь, придумывайте свои
Используйте телеграфный стиль.
Помимо получения требований Например, если вы слышите «Се- собственные символы и знаки
к продукту из личного интервью или годня мы обсудим пять важных О более продвинутых и расширенных
имейлов от заказчика, вы можете инициатив, которые приведут способах применения визуальных за-
выслушать пожелания в свободной нашу компанию к успеху», запи- меток можно ознакомиться в работах
форме. Можно даже включить дикто- шите просто: Инициативы Санни Браун и Дэна Роэма.
фон и записать все ответы заказчика
Если начинаете всерьез отставать,
на него (В этом случае обязательно
максимально используйте линии,
спросите разрешение на запись).
соединители, рамки и цвет
И главное, объясните, что без четкого
ТЗ можно потратить десятки часов Используйте аббревиатуры и со- Узнайте больше про использова-
на ненужную работу. кращенные фразы – посмотрите ние скетчинга на Скетч-марафоне
на опыт семантографии DataYoga: новые подходы к проекти-
Если вы скетчите на слух... рованию визуализаций с помощью
скетчей с классными заданиями
dataliteracy.ru/sketchdata
63
что такое
KPI
KPI – Key Performance Indicator – или например, KPI для продаж или проек-
ключевой показатель эффективности. та показывают производительность
KPI отражают наиболее важные ме- отдельных бизнес-подразделений.
трики на разных уровнях компании:
Часто отслеживаемые KPI могут быть
либо для всей организации в целом,
такими:
либо для ее департаментов, отделов
или конкретных сотрудников (личные Темпы роста выручки
KPI). KPI отслеживаются на постоян- Чистая прибыль
ной основе, должны быть измеря- Коэффициент оттока (сколько
емы и иметь решающее значение человек перестают пользоваться
для достижения целей компании и продуктом или услугой)
поддержания роста. Правильно подо- Средний доход для каждого
бранный KPI помогает менеджерам клиента Существуют целые онлайн-реестры
День 15 Марафона Qlik подробно
ориентироваться между важными Срок жизни клиента (CLV / LTV) рассказывает о видах KPI и о способах со списком KPI по разным областям биз-
бизнес-процессами и показывает, их визуализации на дашбордах неса, с указанием методологии расчета
может ли организация достичь своих и особенностей применения. Приводим
ключевых целей. один из таких ресурсов здесь.
datayoga.ru/q14
KPI высокого уровня демонстрируют
общую эффективность компании, klipfolio.com/resources/kpi-examples
в то время как KPI низкого уровня #поисковые слова: KPI catalog,
64 KPI examples
фокусируются на более узких целях,
проблемы
формулирования KPI
Как говорила Мико Юк, евангелист североамериканской школы дашбордизма — сегодня большинство менедже-
.04
ров отслеживают KPI, которые не помогают в принятии решений, но большинство менеджеров также измеряют
неправильные KPI.
Ниже приведены пять ключевых областей, на которых по мнению Мико следует сосредоточиться и определить
У KPI нет ясного
пришло ли время выбросить бесполезные KPI.
названия
Один из самых быстрых способов
.05
повысить ценность вашего KPI –
изменить имя.
Можно спросить у пользователей: KPI визуализируют
Если этот KPI позитивен, какое «просто так»
Когда дело доходит до выбора
.01
.03
невозможно измерить успех команда предприняла? знаний. А вот реальность – если у
Первым шагом в подтверждении Менеджеры полагают, что исполь- вас возникли проблемы с визуализа-
ценности любого KPI является во- У KPI множественные зуя общие имена KPI, такие как цией ваших ключевых показателей
прос «почему». Почему мы решили определения Источники данных для расчета KPI «Продажи» или «Сервисные вызовы эффективности, это либо потому, что
отслеживать этот KPI? Как только Следующий шаг — определить неизвестны клиентов», их команда автоматиче- у него нет четкой цели или опреде-
будет получен ответ, вы захотите «что»? Что означает этот KPI? Хотя это Подобно «почему», мы рекоменду- ски поймет, что делать с KPI. Это не ления или же нет никаких действий,
установить количественную цель может показаться простым, неве- ем 100% прозрачность источников так. Вместо названия KPI «Сервис- связанных с ним. Начинайте разбор
и установить сроки. Это даст четкое роятно, насколько сложно заставить данных во всех ваших приложениях ные вызовы клиентов», если целью KPI с верхней части списка. А если
представление о том, как выглядит конечных пользователей согласиться бизнес-аналитики. Прилагайте является сокращение количества ничего не поможет, просто выбрось-
успех. Примером хорошей цели для с единственным определением постоянные усилия по сохранению вызовов, можно переименовать KPI те этот показатель!
KPI будет: Мы планируем увеличить данного KPI. Делайте определения гигиены данных. Самое худшее, что в «Уменьшение вызовов обслужи-
продажи на 30% / $ 300 млн до простыми и понятными для пользо- может произойти – это неверные вания клиентов». Это новое имя KPI
вателей. данные для расчета KPI. 65
конца года. делает цель кристально чистой.
если вы не в бизнесе…
противопоставление миров
Медиа и бизнес – широкая публика и корпорации. Их противоположные
подходы к восприятию данных и работе с данными позволяют сформировать
две модели, на примере которых мы поговорим о многообразии целевой ау-
дитории.
МЕДИА-ПОДХОД
В медиа визуализация данных проекты СМИ). Визуализация данных
выступает как способ донесения и создание визуальных историй
информации до широкой аудитории в медиа сформировалось в отдельное
на понятном языке, чаще всего – направление дата-журналистики.
с использованием мультимедиа. Медийные проекты отличаются
При этом, исходные данные могут своей открытостью, актуальностью
описывать сложную предметную и большим охватом аудитории. В чем
область, освещать социальные особенность их работы?
темы (интерактивные визуальные
66
про журналистику
данных
Анастасия Валеева
дата-журналистка, соосновательница ОФ «Школа данных»
Кажется, что понятие «журналистика практически во все науки и ремес-
данных» – это оксюморон. Ты либо ла: и в медицину, и в социологию,
журналист, либо аналитик. Но на и в политологию. Поэтому работа
самом деле данные – это огромный с данными – это просто современ-
кладезь информации и историй для ный метод в журналистике. И если
журналиста, а значит мы не можем к этому относиться так, то получится,
себе позволить пройти мимо. что с помощью данных вы просто
Сначала возникают психологические можете лучше делать свою работу –
барьеры – есть страх перед мате- быстрее анализировать документы,
матикой или питоном, кажется, что находить эксклюзивные истории,
это необъятная сфера, куда входят создавать увлекательный сторител-
и визуализация, и статистика, и все линг. Это путь, на котором можно
языки программирования. Но на развиваться бесконечно. Поэтому
самом деле дата-подход проникает начать не страшно.
67
бизнес-подход
.01
Данные
Все данные хранятся в корпоратив-
.02
ных источниках с формализованной
системой доступов. Департаменты
информационной безопасности,
ИТ-отделы, согласование с биз- Дизайн
нес-владельцами данных и прочие Здесь в роли дата-продуктов высту-
необходимые атрибуты корпоратив- пают дашборды с показом данных по
ной жизни сильно ограничивают сво- бизнес-областям. Для определения
боду работы с данными. Но без этого целевого среза применимо использова-
.03
слишком велики риски их потери и ние подхода shareholder value и жестких
неправомерного использования. методологий разработки.
Сотрудники практически всегда По структуре дашборды чаще горизон-
используют программы работы с та- тальные, занимают весь доступный Действие
блицами типа Excel, в котором может экран. Еще чаще – оптимизированы Бизнес-дашборды призваны помо-
проводиться до 90% всей работы с вывод на слайдах (4:3, 16:9). Почти ни- гать в принятии управленческих,
данными. При этом, у пользователей кто не пытается сделать заголовки эмо- стратегических и операционных
часто есть потребность в создании циональными, скорее наоборот – они решений, поэтому они насыщены
сложных видов визуализации, отражают факты без лишних пояснений. показателями, анализом, инте-
выходящих за рамки стандартных Важно четко и без эмоций донести то, рактивными возможностями для
68 диаграмм. что показано на диаграммах. сравнения и фильтрами.
медиа-подход
.02
Дизайн
Для создания первичных макетов
.03
и прототипов, в медиа используют
скетчинг и применяют итеративную
модель разработки финальных
продуктов. То есть, конечный результат Действие
достигается поэтапно. Пиар является одной из главных
.01 Дизайн диаграмм может быть вы- составляющих визуализации данных
чурным, отличаться обилием нагляд- в медиа. Сайтам нужны просмотры
ных образов, завлекать аудиторию и они работают на удержание и
Данные экстра-интерактивностью. При этом, приращение аудитории. Визуальные
Здесь преобладают открытые источ- слишком сложные диаграммы не ис- истории помогают создавать эффект
ники данных. Так как темы социаль- пользуются – они слишком специфич- цепной реакции, рассказывая о
ные, то и данные – общественные. ны и требуют определенного уровня темах, интересных обществу, кра-
Сбор таких данных часто включает грамотности. сиво, интерактивно и эмоциональ-
в себя парсинг, т.е. выборочное Редакторское мышление определяет но. Поэтому, практически всегда,
извлечение информации с веб-стра- всю дальнейшую работу с визуализа- визуализация в медиа вовлекает
ниц при помощи кода. Такие данные цией: структура дашборда чаще всего людей в социализацию, предлагая
требуют дальнейшей обработки и оформляется в виде лонгридов по одной кнопкой поделиться материа-
проверки на качество, ведь ко- примеру «стандартных» новостных лом в социальных сетях, рассказать
нечный результат будет показан статей. А заголовки могут быть прово- друзьям, отправить ссылку в пись-
широкой аудитории, которой важна кационны и эмоциональны – эмоции ме. Важно создавать обсуждение
достоверность. привлекают больше читателей. вобщественном пространстве. 69
IV выбор
шаг источника данных
72
пять вопросов
к данным
Начиная любую работу с данными, вне зависимости от того, что именно вы хотите с ними сделать, будет полезно сформу-
лировать для себя ответы на ключевые вопросы об их природе.
Эти вопросы применимы ко всем трем областям использования данных, о которых мы уже упоминали: профессиональ-
ная среда, общественная и личная. Вопросы не зависят от формы имеющихся данных — таблица, база данных, корпора-
.04
тивный дашборд или презентация. Иногда ответы на эти вопросы бывают очень простыми, а иногда требуют длительных
размышлений.
.05
Какие переменные являются
наиболее значимыми Как эти данные были изменены,
и как они определяются? собраны и сохранены?
Наборы данных часто могут быть Каждое значение данных создается
очень большими, и каждая запись процессом или системой, которая
.03
может характеризоваться десят- может включать в себя как челове-
ками, сотнями или даже тысячами
.01
74
75
исследование
данных
Процесс подготовки данных для анализа занимает до 80% времени, Следующие шаги включают в себя начальный анализ источника данных.
потраченного на решение аналитической задачи в целом. После нахожде- Необходимо «подружиться» с данными, изучить их особенности, найти
ния ответов о необходимых KPI, мы находим информационные системы, выбросы, неточности, ограничения. Будет полезно документировать все най-
в которых хранятся нужные KPI или их составные части. Необходимо прове- денные аспекты для облегчения дальнейшей работы с источником данных
сти анализ подключения к такому источнику данных – узнать, например, для вас или коллег.
настроена ли интеграция или ее нужно продумывать с нуля, какие таблицы
нам необходимы для создания конечного источника данных, кто владелец
этих данных и есть ли у нас необходимые разрешения от него?
На этапе подготовки источника данных будет полезно определиться:
что является единицей (юнитом) таблицы (транзакция, номер клиента,
номер продукта)
являются ли данные уникальными для каждого юнита или для пары
значений юнит+время
какой уровень агрегации данных необходим для задачи, нужны ли
детальные данные или можно проагрегировать строчки до уровня выше
(во времени, по категориям)
как часто будет обновляться источник данных на сервере, сможет ли
система «выдержать» такой объем данных, устроит ли такая частота
76 данных заказчика
понимание
данных
Данные — это набор фактов и наблюдений, которые можно использовать для Структурированные данные – все, которые имеют формализованную структу-
анализа, расчетов, планирования и прогнозирования. Все данные можно раз- ру. Они уже обработаны и пригодны для работы. То есть, их можно разложить
делить на две категории: структурированные данные и неструктурированные. на столбцы и строки и загрузить в инструмент для анализа данных.
Большинство данных в мире неструктурированно. Такие данные, как правило, Это данные о посещении сайтов в системах веб-аналитики, о покупках в ин-
представлены в виде текста, который может содержать любую информацию: тернет-магазине (или просто в магазине, например, nalog.ru), о проведенных
цифры, даты, прочие факты. Примером неструктурированных данных явля- финансовых операциях, транзакциях, мобильной связи, в общем... любые
ются любые тексты, книги, видео, аудио, изображения – вообще практически области, в которых сбор и хранение данных курируется человеком.
все, что вы видите вокруг себя. Структурированные данные упорядочены и типизированы. Хранятся в форме
Даже эта страница является примером неструктурированных данных, таблиц, имеют столбцы (поля) и строки (записи). Еще говорят, что каждый
несмотря на то, что она содержит в себе определенную структуру, способству- столбец представляет собой атрибут данных, а каждая строка — единицу
ющей отображению текста. Мы все равно не можем провести какой-либо наблюдения.
количественный анализ содержимого на этой странице без этапа обработки
и подготовки данных: скопировать или оцифровать весь текст, разбить его
на слова и выделить части речи...
Для подготовки неструктурированных данных к анализу используют мето-
ды интеллектуального анализа данных (Data Mining) и методы обработки
естественного языка (для распознавания речи, Natural Language Processing).
Также существуют более простые системы, например, сервисы веб-скрейпинга
77
(Web Scraping) для сбора и категоризации текстовых данных из веб-страниц.
Важность качества данных
Мансур Кадимов
Гуру по качеству данных. Управляющий партнер в Reshape Analytics
79
aгрегация
данных
Агрегация — это способ обобщения наших числовых значений. Мы хотим Основные способы агрегации Для текстовых категорий мы не
сделать какие-то выводы из имеющегося набора данных и нам не нужно числовых данных: можем посчитать сумму по полю
смотреть на каждую строчку в таблице по отдельности. И мы можем посмо- Сумма – суммирование всех со значениями городов «Москва»,
треть на агрегированное значение показателя. Иными словами, нам не нужно наблюдений «Томск», «Самара» — зато мы
смотреть все 10 000 строк по заказам, но мы хотим увидеть просто сумму можем посчитать их количество.
Среднее – подсчет арифметиче-
выручки по этим 10 000 строк. Это тоже будет агрегация.
ского среднего
Можно сказать, что агрегация выдает одно единственное число на агреги- Минимум / максимум – поиск Возможности нашего восприятия
рованную таблицу, на основе которого мы формируем вывод. Агрегация — наименьшего или наибольшего не позволяют проводить анализ
это способ объединения данных для упрощения их восприятия и анализа. значения данных в уме, просматривая сотни
записей в таблице одна за одной.
Количество – сколько раз встре-
Но возможности программ и прило-
чается то или иное значение
жений для анализа данных основаны
на функциях агрегирования данных!
Это основной способ получения пред-
ставления об имеющихся данных.
80
меры центральной
тенденции
82
Таблицы объединяются при помощи
специальных операций соедине-
ния – joins. Разные виды «джойнов»
по-разному определяют итоговую
таблицу, которая получится после
проведения операции. От выбран-
ного типа «джойна» зависит полнота
данных, которую мы получим – ка-
кие строки останутся, а какие – будут
исключены из итоговой таблицы.
83
INNER JOIN / LEFT JOIN / RIGHT JOIN / FULL JOIN /
Внутреннее соединение Левое соединение Правое соединение Полное внешнее соединение
Внутреннее соединение — самый Левое внешнее соединение — Правое внешнее соединение Полное внешнее соединение вернет
распространенный тип связи. соединение, при котором таблица зеркально противоположно левому. вообще все данные из обеих таблиц.
Внутреннее соединение находит слева полностью останется в Здесь базовой таблицей выбирается Однако, полнота строк будет разной.
пары строк, которые удовлетворяют результирующей таблице. Правая правая. Это значит, что в таблице Там, где условие сравнения выпол-
условию сравнения в двух таблицах таблица «отдаст» в результиру- справа останутся все строки, а левая няется, данные по новой строке
одновременно. ющую только те строки, которые таблица «отдаст» только те строки, будут полными. Но там, где условие
соответствуют условию сравнения. которые соответствуют условию не выполнится, будут проставлены
Строки, которые не нашли себе пары сравнения. NULL значения (пустые ячейки).
не будут добавлены в результирую-
щую таблицу.
84
корпоративное
управление данными
Концептуально, работа с данными не сводится только к его анализу. Можно DMBOK – Свод знаний по управлению данными – ставит своей целью
выделить 11 областей знаний, которые поддерживают процессы управления продвижение общего языка, общего понимания используемых терминов
данными в компаниях. Эти направления были выделены Ассоциацией DAMA. по теме управления данными. Второе издание DMBOK основано на 11 обла-
Миссия Ассоциации DAMA заключается в продвижении важности и общего стях знаний, которое составляют «колесо DAMA». В центре находится тема
понимания процессов управления данными по всему миру. руководства данными (Data Governance), которую окружают все остальные
Архитектура данных области знаний, приведенных в списке.
Управление качеством данных Если перед вами стоит задача управления данными в рамках большого
Управление метаданными количества потоков данных, скорее всего, вы сможете получить базовые
Ведение хранилищ данных и бизнес-аналитика знания по этим дисциплинам в книге DAMA DMBOK — Свода знаний
Управление справочными и основными данными по управлению данными. DMBOK не нужно использовать как готовую «книгу
Data Literacy Project в России ведет
Управление документами и контентом рецептов». Ее стоит использовать, чтобы убедиться, что у всех есть общее
проект по популяризации «DAMA-
Интеграция и интероперабельность данных (ETL) понимание различных дисциплин управления данными. Чтобы помочь себе
DMBOK2:
Управление безопасностью данных понять, в каких областях вы преуспеваете, а в каких областях вам не хватает
Cвода знаний по управлению
знаний. И чтобы с ее помощью углубиться в ту или иную область знаний,
данными». Хранение и операции с данными
на которой вы хотите сосредоточиться.
Команда собирает наиболее важные Моделирование и проектирование данных
идеи одной главы книги DMBOK2 Руководство данными
в месяц в формате привычного
текстового конспекта.
dataliteracy.ru/dmbok 85
V визуальное
шаг дыхание
88
сила
визуализации
Как часто вы сталкивались с проблемами в коммуникации? Случалось ли, простые учетные таблицы для структурирования информации. Через столетие
что ваша мысль, которую вы стараетесь рассказать собеседнику во всех благодаря Уильяму Плейфэру (William Playfair) появились первые научные
деталях, остается непонятой? способы визуализации статистической информации и экономических данных.
Плейфэр аргументировал, что диаграммы передают, «коммуницируют» дан-
Одни и те же слова разные люди понимают по-разному. У каждого свой ные эффективнее, чем таблицы. Он – создатель линейного графика, столбико-
личный, особый опыт. Рисунки в блокноте, зарисовки на салфетке, схемы вой и круговой диаграммы.
в интернете, объясняющие видео и прочие средства визуальной коммуни-
кации позволяют фиксировать наши идеи в графической форме и доносить В наше время, визуализация помогает наводить порядок, преобразовывая
информацию наглядно. сырые данные в наглядные диаграммы и графики. Без визуализации мы бы
не смогли быстро и легко разбираться в таком огромном количестве данных,
Визуальные образы воспринимаются нами более однозначно, чем их которые накапливаются сегодня. Данные без обработки, в сыром виде, нам
словесное описание. ни о чем не сказали бы – как можно уловить суть таблицы на 50 тысяч строк
Более того, в одну единицу времени мы можем увидеть гораздо больше, без какого-либо визуального анализа?
чем, например, услышать. Визуальные образы в 60 000 раз воспринимают-
ся нами быстрее, чем слова на слух. Исследования Массачусетского инсти- Исследования Массачусетского
тута MIT от 2014 года показали, что человек может понять, что изображено института MIT: результаты
на фотографии, посмотрев на нее всего 13 миллисекунд.
news.mit.edu/2014/in-the-blink-of-an-
С течением времени стало понятно, что визуализация информации может eye-0116
помочь существенно сократить время поиска решения разных задач.
В XVII веке, ученые начали визуализировать метео-данные на картах и вести 89
история
визуализации
Потребность в качественном
представлении информации стала
возникать в эпоху Возрождения,
с появлением большого количества
данных и визуальной информа-
ции из географии, астрономии, Первые визуализации Ранние карты Кристофер Шейнер Джозеф Пристли
геометрии, статистики и других
наук. В первой половине XIX века Древние вавилоняне, егип- Карта Турина Папируса Немецкий астроном, физик, В 1765 году были созданы
наблюдался рост работ, в которых тяне, греки и китайцы раз- (Египет, 1150 г. до н.э.) механик и математик. первые таймлайны, в ко-
использовалось графическое пред- работали сложные способы найденная в Фивах в XIX веке, Наблюдал за солнцем, торых отдельные линии
ставление данных. К середине XIX визуализации информации отображающая увлекатель- в 1630 году создал первое использовались для визуа-
века были изобретены все основ- визуально, чтобы запе- ный спектр информации, известное использование лизации продолжительно-
ные типы представления данных: чатлеть движения звезд, включая географические идеи кратных повторений, сти жизни 2000 известных
столбчатые и круговые диаграммы, подготовить карты для и минеральные данные. чтобы показать серию изме- людей. Его автор – Джозеф
гистограммы, линейные графики. навигации и разработать Пейтингерова скрижаль нений в одном изображении. Пристли – священник, фи-
планы по посеву сельско- (366-335 гг до н.э.) отобра- Нарисовал визуальные пред- лософ, общественный дея-
Тенденция начала снижаться в на- хозяйственных культур жающая дорожную систему ставления, используемые тель, и химик, открывший
чале XX века, уступив место точной и развитию города. Многие Римской империи, начиная для составления графика кислород! В 1769 он сделал
математике. Тем не менее, именно из этих ранних визуали- с Великобритании на за- изменения солнечных пятен еще один таймлайн –
в этот период стали появляться заций были бы сделаны паде и заканчивая Индией с течением времени. «A New Chart of History», на
учебники и курсы по графическим на глине, такой как карта на востоке. Карты древне- котором наглядно отразил
методам представления данных, раннего вавилонского мира греческого учёного Птолемея историю мира, начиная от
а сами графики стали использовать- (600 г. до н.э.) (150 год н.э.), которые 1100 года до н.э.
ся не только для представления включают карту мира
результатов исследований, но и для и 26 специальных карт зем-
изучения информации и выдвиже- ной поверхности, которые
ния гипотез в астрономии, физике, прилагались к трактату
90 биологии и других науках. «Руководство по географии».
Уильям Плейфер Шарль Минард Флоренс Найтингейл Эдвард Тафти Микровизуализация ...История продолжается
Два века назад Уильям Плей- Французский инженер, Английская сестра мило- Новые форматы визуализа- Развитие форматов ми- Что нас ждет впереди –
фер предложил все основные пионер в области графи- сердия и общественная ции (спарклайны!), семинары кровизуализации – то есть узнаем в будущем...
типы используемых сегодня ческих методов анализа деятельница. В 1858 году для экономических журнали- компактный графиков пря-
видов визуализаций: линей- и представления информа- создала диаграмму причин стов, академические книги по мо в тексте и в интерфейсе
ные графики, диаграммы ции в области инженерных смертности солдат во визуальному представлению современных устройств,
с областями, гистограммы, наук и статистики. Минард время Крымской войны информации, движение за например, в умных часах.
круговые диаграммы, ради- наиболее известен своей (1853−1856). Диаграмма визуальную грамотность.
альные диаграммы и карто- статистической картой смертности попала в отчет
диаграммы (карты с коди- «Огромные потери Напо- комиссии по проблемам здо-
ровкой данных с помощью леона» во время русской ровья в армии и способство-
кружков). В 1786 года издал кампании 1812 года. Она вала проведению реформ
«Коммерческий и полити- отображает шесть типов и улучшению санитарных
ческий Атлас», в котором данных в двух измерениях: условий не только в воен-
и были представлены все количество войск Наполеона; ных госпиталях, но и в граж-
виды визуализации данных. пройденное расстояние; данских.
температура; широта Краткая неоконченная история
и долгота; направление датавиза
движения; и местоположение tableau.pro/datavizhistory
относительно определенных
дат кампании.
91
как
мы видим
Зрение – единственный канал восприятия человека, который обрабатывает человеческого восприятия, по которым люди группируют схожие объекты
максимально возможное количество информации подсознательно. Как в единое целое. Гештальтпсихология основывается на исследованиях вос-
часто вы осознанно распознаете то, что у вас перед глазами? приятия, в ее центре – тенденция психики к организации опыта в доступное
пониманию целое.
Сначала информация из внешнего мира поступает в первичную зрительную
кору, где происходит анализ ориентации отдельных линий объекта. Потом Почему это важно при визуализации данных? Потому что диаграммы и гра-
идет разделение на два потока: на «где» и на «что». В «где» строится карта фики – это тоже визуальное восприятие. Для того, чтобы разговаривать на
местности, а в «что» — сборка образов, добавление цвета и контрастности, языке – нужно знать лексику и грамматику. Для того, чтобы показывать
и в самом конце — распознавание сложных образов и их категоризация. данные – нужно знать как выстроен процесс восприятия визуальной
Мозг выступает в роли очень быстрого процессора и обрабатывает получен- информации.
ный образ моментально и подсознательно.
Более того, наша зрительная система устроена так, что она везде ищет зако-
номерности, так как это упрощает процесс восприятия окружающего мира.
При этом, наши глаза – не фотоаппарат. Органы зрения действуют совмест-
но с мозгом, который определенным образом «истолковывает» видимый
мир. То, как именно мозг обрабатывает входящую информацию и обрабаты-
вает ее исследует Гештальтпсихология.
В начале прошлого века ряд ученых изучали, как люди считывают значимые
92 смыслы из хаоса вокруг них. Они выявили набор естественных законов
93
законы восприятия
в гештальтпсихологии
Мы воспринимаем элементы, Мы воспринимаем похожие по Мы воспринимаем элементы по- Мы воспринимаем элементы как
которые расположены ближе друг одному признаку элементы как следовательно, если они соединены схожие, если они находятся в одной
к другу, как связанные, и отличаем единое целое, даже если по другим между собой. и той же закрытой области.
их от элементов, которые находятся признакам эти элементы отличаются.
на расстоянии. Основные объединяющие призна-
ки — форма, цвет, размер.
94
преимущества
визуализации
Наша долговременная память создана для визуальных образов. Крат-
ковременная и долговременная память хранят информацию порциями,
но кратковременная память ограничена. Один из самых простых способов
гарантировать, что мы сможем сохранить информацию в нашей долговре-
менной – объединить идеи, данные и концепции со значимыми изображе-
ниями. Мы можем вспомнить информацию намного лучше когда она была
доставлена в визуальном, а не в аудио или текстовом виде.
Визуальная передача сообщений осуществляется быстрее. Факты: «Мозг
обрабатывает визуальную информацию в 60 000 быстрее, чем текст».
(3M Corporation, 2001), «90 процентов информации, поступающей в мозг,
является визуальной». (Hyerle, 2000), «40 процентов всех нервных волокон,
связанных с мозгом, связаны с сетчаткой» (Jensen, 1996), Мы можем видеть
изображения, которые длятся всего 1/10 секунды. Все это указывает на то,
что мы можем обрабатывать визуальную информацию гораздо эффектив-
нее, чем текст.
Визуальные образы улучшают понимание. Было обнаружено, что образы
улучшают наше понимание в четыре раза по сравнению с простым чтением.
Хорошая инфографика, а соответственно и хорошие диаграммы позво- Именно благодаря тому, что визуальное восприятие строится в основном подсознательно, то многие вещи мозг
ляют нашему мозгу автоматически интерпретировать отношения между «не проверяет», доверяя вместо этого знаниям, полученным из предыдущего опыта. Например, на иллюзии, где
объектами, обеспечивая почти мгновенное понимание с минимальными две линии уходят «вдаль», одна черточка кажется длиннее, чем другая, потому что мозг достраивает привычную
усилиями ему перспективу.
95
визуальные
атрибуты
Визуализация данных не случайно эффективна – все диаграммы в какой-то степени используют специальные визуальные атрибуты для кодирования данных
(preattentive attributes). Визуальные атрибуты – специальные сигналы-подсказки, которые мы считываем глазами и понимаем подсознательно. Их всего 8 и они
основаны на визуальных отличиях: положении, формы, длины и ширины линии, цвета и насыщенности, размера и положения в пространстве. Когда наши глаза
замечают какое-то отличие по одному из этих признаков, то внимание сразу приковывается в эту точку. Чем более однородны будут фоновые элементы, тем
заметнее будет отличающийся элемент.
При помощи визуальных атрибутов, мы можем доносить до аудитории то, на что хотим обратить их внимание, еще до того, как они это осознают. Их внимание
будет приковано к тому, что выделяется на общем фоне.
Замечая визуальные атрибуты в текстах, на визуализациях, в рекламе, фотографиях, кино, постерах и любых визуальных материалах – наши глаза фокусируются
96 на подобных контрастах. Мозг задает вопрос «почему этот элемент выделяется? что он пытается мне сказать?» и уделяет этому больше внимания.
Во второй половине ХХ века и в начале XXI было проведено несколько исследований по восприятию визуальной инфор-
мации, в результате которых сегодня выделено несколько видов визуальных кодировок.
Разные визуальные кодировки решают разные задачи. Некоторые кодировки лучше передают значения переменных,
а другие – эффективнее помогают передавать непохожесть данных.
99
Шкалы
Благодаря подписям данных
на шкалах, мы понимаем на что
мы смотрим, какая размерность
у графика, что представляет каждая
категория. Шкалы также определя-
ют как будет выглядеть конечный
график.
100
визуальная
кодировка
Данные должны быть правильно закодированы для того, чтобы они были
понятны. Визуальная кодировка, которую вы будете использовать, зависит
от природы ваших данных и вашей цели.
Визуальная кодировка может выражаться через:
Столбцы
Линии
Точки
Символы (квадраты, звездочки, треугольники…)
Площадь
Радиус угла
Направление 101
как читать
визуализации
Начиная работать с графиком или Что за данные показаны на После внешнего осмотра диаграм- Если на диаграмме показано из- Наконец, можно посмотреть и на до-
диаграммой как пользователь, диаграмме? Достаточно ли их? мы, можно погрузиться в ее суть. менение показателя во времени, полнительные детали на диаграмме,
который хочет найти ответы на Ответят ли они на мой вопрос? Здесь важно удостовериться, что вы как идет ось времени? если они есть.
свои вопросы, не торопитесь делать и автор диаграммы одинаково пони- Если на диаграмме показано Проверить, есть ли выбросы
выводы. К тому же, требуется опре- Какие визуальные кодировки маете язык визуализации — ведь
используются для передачи изменение показателя, то что и почему они случились? Про-
деленная насмотренность, чтобы это не всегда так. указывает на его увеличение? блема в качестве данных или
уметь быстро считывать визуализа- имеющихся показателей?
Если на диаграмме показывают- Какая агрегация используется это действительно аномальные
ции и уметь находить в них необхо- Какие шкалы используются на ся отношение частей к целому, значения, стоящие внимания?
димые вам зацепки. с показателями? Подходит ли мне
диаграмме? Какая размерность действительно ли все части такая агрегация? Проверить, при наличии, на-
Начните с формулирования своего и диапазон осей, начинаются ли суммируются в целое? Нет ли тут пример, регрессионной модели,
вопроса к данным и проверьте ди- они от нуля? исключений? Какие новые вопросы возника-
ют после первичного анализа характеристики модели и как она
аграмму с помощью первых общих описывает данные?
вопросов. диаграммы? Хватает ли мне всей
необходимой информации? Проверить используемые леген-
ды, не раскрывают ли они новые
характеристики данных?
102
103
от таблиц
к визуализации
Таблица – основа для хранения соб представления данных там, где Но у таблиц есть свои недостатки.
данных. Таблица содержит кон- нужна конкретика. Главное – не При большом количестве данных,
кретные данные и – как способ испортить данные оформлением. таблицы уже достаточно плохо
визуализации – передает их справляются с передачей инфор-
Наше знакомство с таблицами мации. Аналитикам сложно делать
с высокой точностью. В таблицах
мы можем проводить наиболее начинается еще в школе – мы какие-то общие суммирующие вы-
детальные сравнения по разным вычисляем координаты для воды на основе детальных данных.
срезам категорий. При этом, струк- графиков на математике, ведем Кроме того, таблицы довольно
тура таблиц не ограничивает нас учет температур на уроках геогра- плохо удерживают и внимание
в формате данных, одинаково точ- фии, заполняем разлинованные конечной аудитории.
но показывая целые числа, числа тетрадки с переводом английских
с десятичной частью и проценты. слов, записываем свои карманные
104 На самом деле, это хороший спо- расходы.
Задействуют отделы мозга отве- Нечто среднее между таблицами Задействуют отделы мозга
чающие за «чтение» и «речь» и графиками отвечающие за «образы»
Узнать конкретное значение Сохраняет точность таблиц и «расстояния»
105
главное —
задать вопрос
Один и тот же набор данных 1 Если хотим показать данные 2 Если хотим показать тенденцию 3 Если хотим показать тенден-
можно показать разными спосо- с сохранением точности цифр, изменения двух категорий цию изменения, но при этом
бами, в зависимости от вопроса мы выберем таблицу во времени, выберем линейный важен накопительный эффект,
и конечной цели. Поэтому, не имея график покажем динамику в графике
вопроса, подбирать вид диаграм- с накоплением
мы под имеющиеся данные можно
довольно долго.
106
4 Если хотим просто показать 5 Если важно показать суммар- 6 Если хотим показать сравнение 7 Если важно показать разницу 8 Если хотим показать характер
само изменение в двух точках, ный эффект по двум категориям двух категорий в разрезе каж- между двумя категориями, сде- разницы между двумя ка-
выберем график было-стало с акцентом на баланс в каждом дого месяца, выберем столби- лаем выбор в пользу диаграм- тегориями, то добавим цвет
месяце, сделаем выбор в ковую диаграмму, где столбцы мы наклона по каждому месяцу и сделаем акцент
пользу столбиковой диаграммы будут находиться рядом друг
с накоплением сдругом
Мы уже поняли, что каждый вид Сравнение категорий Соотношение Части целого
диаграммы выполняет опреде- Позволяют продемонстрировать Используют объем или пространство Показывают, как нечто цельное
ленную задачу — нужно уметь сходства или различия по категори- визуализации для отображения воз- делится на составные части.
подбирать наиболее подходящий. ям. В этом виде сравнения основ- можных взаимосвязей между двумя Используются такие диаграммы как
Вот основные виды сопоставления ное – это заметить разницу и понять, показателями. круговая, древовидная и накопи-
данных: насколько она велика или мала. Классический пример — точечная тельные линейчатые диаграммы.
Сравнение категорий Для сравнения категорий используют (или пузырьковая) диаграмма, Обычно сегменты показателя (его
Соотношение категорий столбиковые диаграммы в разных которая показывает наличие или части) также сортируют от большего
Части целого вариациях. А еще столбцы обычно отсутствие зависимости двух пере- к меньшему, чтобы визуально упро-
Распределение величины сортируют по убыванию или возрас- менных. стить считывание данных.
Изменение во времени танию величины — это упрощает
Изменение на местности сравнение.
108
Распределение величины Изменение во времени Изменение на местности
Отображают частотность и распреде- Показывают изменение показателя Показывают изменение показателя
ление данных в пределах определен- во времени — основную роль тут на местности. Используют карты, на
ного интервала или по выделенным играет наличие поля с датой по оси Х. которых откладываются точки коор-
группам. динат или географические слои. Сам
Классический пример – гистограм- показатель может выражаться при
ма, в котором каждая полоса на помощи фоновой заливки элементов
гистограмме представляет частот- карты (областей) или с помощью
ность значения за определенный точек разного размера.
интервал – то есть, сколько раз то
или иное наблюдение встречается
в данных.
109
каталог
визуализаций
110
линейная
диаграмма
график, линейный график, line chart
113
столбчатая
диаграмма
столбиковая диаграмма,
линейчатая диаграмма,
барчарт, bar chart
115
картограмма
Фоновая картограмма,
карта с заливкой областей,
choropleth map
116
пузырьковая
карта
Карта с точками,
bubble chart
117
анатомия
карт
Андрей Дорожный,
дата-журналист, специалист по визуализации данных
Первый вопрос, который нужно и принимать верное, неискаженное Если кодируем количественные
задать себе при создании карты — масштабами страны или площади данные на карте, всегда следуем
нужна ли она вам? Часто бывает решение. правилу – чем темнее цвет, тем
так, что простой рейтинг регионов и Интерактивная карта должна иметь больше показатель. В целом, это
городов может быть понятнее и вы- фильтры поиска или уметь опреде- правило работает не только для
игрышнее. Не используйте карту лять геопозицию пользователя – это карт, но не забывайте о нем.
ради карты. позволяет персонифицировать
Так как я работаю с журналистикой инсайты из данных. Такой подход
данных, то мой опыт работы связан полезен, если у вас очень большое
с определенными социальными и распределенное количество точек,
показателями. Почти всегда данные а аудитория пользуется отчетом
на карте нужно нормировать: на из разных городов. Ваша забота
население, на площадь. Это позво- о пользователях не останется
120 ляет адекватно смотреть на данные незамеченной.
121
точечная
диаграмма
диаграмма рассеяния, диаграмма
разброса, scatterplot
123
древовидная
диаграмма
Диаграмма дерева, тримап,
treemap
128
зачем нужно
прототипирование
Любой хороший продукт потребует Прототипирование – важный этап который будет использоваться при Прототип представляет собой черно-
нескольких итераций и многоразовой при разработке отчетности, благодаря разработке. Мы получаем некий вую реализацию базовой функцио-
доработки с учетом комментариев которому можно облегчить весь про- «объект», который будет описывать нальной модели дашборда. От списка
пользователей. Важно слышать обрат- цесс проектирования, от установки представление о дашборде. Благодаря показателей для визуализации до
ную связь для сокращения количества требований до тестирования удобства. прототипу можно: цветов и расположения диаграмм.
итераций и более точного попадания в Во время разработки прототипа продать идею Главное – прототип даст вам матери-
потребности аудитории. учитываются пожелания и требования объяснить логику ал для работы и обсуждения с заказ-
Основной способ коммуникации заказчика, наложенные на возмож- чиками и пользователями.
объяснить поведение
при разработке любых визуальных ности разработчика и, непосредствен-
продуктов – создание прототипа. но, возможности того инструмента, проверить удобство интерфейса
испытать продукт на себе
испытать продукт на других
129
пожить с продуктом
зачем нужно
прототипирование
130
скетчинг
Скетчинг – один из популярных На этапе подготовки, в начале любо- не уходить в детали: «ого, как много
методов прототипирования. Набро- го исследования данных, обращайте сделок мы заключили в апреле»).
ски, сделанные от руки на простой внимание на общую структуру Так вы увидите картину в целом,
бумаге – это то, что упрощает данных: из чего состоят макро- и не упустите важное.
визуализацию данных и может категории данных, которые мы После проведения первичного
стать эффективным «мостиком» для анализируем, какого рода данные исследования данных, при помощи
людей, не погруженных в предмет- собираются. На этом этапе редко набросков проводите прототипи-
ную область данных. обращаются к реальным данным, рование конечной визуализации –
Для многих дизайнеров, карандаш изучая лишь их общую концепцию, либо на бумаге, либо в цифровом
и бумага – основной инструмент например: виде. Здесь рисунок облегчает
проектирования. Они переносят коммуникацию между разработ-
ключевые категории
данные на бумагу, «рисуют» данные, чиками и заказчиками, являясь
ключевые показатели упрощенным макетом внешнего
чтобы понять их природу и в даль-
нейшем извлечь из них смысл. как они соотносятся друг вида и функционала. В скетчи легко
Попробуйте узнать подходы к скет- с другом вносить изменения, учитывая об-
чингу лучше. Вы можете пройти Наброски играют важную роль ратную связь заказчика: это дешево
бесплатный марафон от DataYoga в производстве и передаче знаний. Скетчинг на этом этапе позволяет и наглядно.
по скетчингу На практике скетчинг используют сфокусироваться на логической
на протяжении всего процесса структуре данных, а не на конкрет-
dataliteracy.ru/sketchdata 131
разработки. ных значениях показателей (чтобы
важность скетчинга
и визуальная грамотность
Современная культура не помога- Визуальная грамотность — это спо- С помощью скетчинга мы ищем Способность реалистично рисовать
ет нам обнаружить связь между собность делать все то, что ассоции- способы понимать и обрабатывать похвальна, но к решению бизнес-за-
визуальным языком и критическим руется с традиционной грамотностью, большие объемы информации, дач и коммуникации имеет мало
мышлением, навыком решения используя при этом визуальный язык упрощать концепции этого сложного отношения. Нам не нужны художе-
проблем, способностью к пониманию, и наглядные пособия. мира, и быстро передавать свои идеи ственные таланты, дорогие краски
новаторством. Но в визуальном Вы конечно же можете задать коллегам и обществу. и рисовальные принадлежности,
языке скрывается могучая интеллек- себе вопрос — ну и что? Великая У нас много предрассудков о а также долгое формальное образо-
туальная и творческая энергия. важность научиться делать визу- скетчинге. Мы думаем, что умение вание в этой области. Мы восполь-
С детства мы все хорошо рисуем, альный наброски? Как это может «рисовать» требует одаренности — зуемся нашим инстинктивными
используя этот навык для обучения быть связано с моей работой и моей скетчинг равносилен искусству и мо- навыками, которые есть у каждого.
и для развлечений. Взрослея, мы личной жизнью взрослого и серьез- жет не подходить нам по характеру. Давайте применять практические
попадаем в культуру, которая не при- ного человека? Мы с трудом можем преодолеть эти навыки набросков как доступных
дает никакой ценности визуальным Визуальная грамотность влияет на стереотипы и взять в руку карандаш. и эффективных методов, помогающих
средствам мышления. Мы остаемся способность людей достигать постав- Полноценное рисование обычно вос- в решении проблем.
один на один с цифрами словами, ленных целей, наращивать потенциал принимается как способность реали-
и все больше убеждаемся в том, что и полноценно участвовать в решении стично отображать действительность.
не способны визуально выразить значимых для общества проблем. Возникают образы картин известных
свои мысли или запечатлеть образы. В каждом из нас уже есть навыки художников. Это ведёт к быстрой
Это приводит к «визуальной негра- думать визуально, хотя иногда очень панике, возникновению стрессовой
132 мотности» среди взрослых. реакции, и это легко объяснимо.
глубоко спрятаны.
применение скетчинга
в визуализации данных
.01
.02
Понимание проблем аудитории
и постановки задачи Поиск альтернативных решений
При проведении интервью с и генерации идей
заказчиком помогает следить Включение простых средств ви-
.03
за нитью разговора, а не витать зуального языка в коллективный
в облаках. процесс мышления дает интен-
Графические образы помогают сивный обмен мнениями и повы- Формирование конечного
команде достигать общего шает уровень взаимопонимания композиционного решения
мнения благодаря визуальному между людьми. Изобретать нечто и добавление интерактивности
пониманию проблемы. необыкновенное в обыденных Проработка механизмов
Скетчи играют роль якоря и не обстоятельствах. Лучше раскры- управления вниманием поль-
позволяют отвлекаться в процес- вать природу и смысл продукта, зователя благодаря нагляд-
.04
се размышления над решае- чтобы он эффективнее исполь- ности
мой задачей, позволяя лучше зовался конечными пользовате- Выстраивание пути пользова-
концентрироваться. лями. теля при сценариях решения
Перенос фокуса внимания Повышение креативности и твор- информационных задач. Презентация конечной идеи
с интерпретации представляе- ческое мышление во время Лучше один раз увидеть – для ее реализации
мой информации на создание игровых сессий проектирования и зарисовать композиционные Кадрирование истории и слайдов
собственных визуальных обра- дизайна. решения в разных форматах презентации для лучшего
зов, это значительно улучшает Быстрый подбор правильных дашбордов и интерактивных представления конечной идеи
освоение материала. графиков и диаграмм. отчетов. дашборда. 133
скетчинг
в Novartis
136
программы
для прототипирования
MIRO FIGMA
это онлайн-платформа для команд- более профессиональный онлайн-ре-
ной работы, которая похожа на дактор для работы с изображениями.
бесконечную маркерную доску пря- В нём можно создать прототип,
мо у вас в браузере. На ней можно интерфейс приложения и обсудить
печатать, рисовать, добавлять файлы,
правки с коллегами в реальном
заметки, соединители и все это будет
видно «с любой парты в классе» – из времени.
любой точки мира. Figma сложнее и содержит больше
Основное преимущество Miro в его настроек, чем Miro. Но ее результаты
доступности и наглядности. Рабо- воспринимаются более профессио-
тать в интерфейсе очень просто, не нально. Рекомендуем использовать
смотря на то, что язык сервиса – ан- сервис на последующих этапах прора-
глийский. Miro подходит для всего: от ботки прототипа, когда основная идея
рисования скетча до выстраивания понятна, но нужно утвердить конкрет-
процесса тестирования. ные детали будущего дизайна.
Вы можете пользоваться сервисом
бесплатно. Функциональность
бесплатного тарифа позволяет ком-
фортно работать со всем доступным
138 инструментарием.
стикеры для
прототипирования
139
стандартизация
Стандарты при работе с визуа- нения улучшенных стилевых проверенных практик по визуа- менты и смежные стандарты ком-
лизацией данных формируются элементов визуализаций лизации и анализу данных пании, относящиеся к процессам
в специальный гид по стилю или Фокусировки на наиболее важ- Ускорить процесс разработки подготовки отчетности, презента-
stylebook. Гид по стилю содержит ных элементах данных за счет отчетности и донесения резуль- ций и дашбордов, такие как:
примеры использования подходов композиционных принципов татов работы до руководителей Презентация общего стиля бренда
к дизайну в дашбордах компании, дизайна и приемах управления и ответственных лиц компании, обычно разработан-
а также разработанный шаблон вниманием пользователей ная департаментом маркетинга
Предоставить эффективное сред-
стиля отчетов для ускорения про- интерактивной отчетности Стандарт по работе с источника-
цессов проектирования и настройки ство принятия управленческих
решений, путем обеспечения ми данных
интерактивных отчетов. Практическое использование гида
позволяет поддерживать цели процесса более качественными Стандарт подготовки управ-
Стандарт компании используется ленческой отчетности ком-
по повышению эффективности визуальными аналитиками,
для: пании, описывающий детали
работы внутренних подразделений, сфокусированными на самых
Ускорения разработки интерак- важных аспектах данных, требу- бизнес-процесса и правил
а также:
тивных отчетов и дашбордов взаимодействия специалистов
Создать единую базу по стилям ющих минимальных усилий для
за счет использования лучших различных департаментов, при-
дашбордов, вариантам пред- восприятия
практик и шаблонов, настроен- нимающих участие в подготовке
ных на обновленный визуаль- ставления, обработки и анализа Уменьшить трудоемкость и со-
ный стиль компании необходимой информации кратить затраты на подготовку
компании интерактивной отчетности.
Повышения эстетики и уровня
восприятия данных на дашбор- Обеспечить специалистов ком- Более того, визуальный стандарт
142 пании надежным источником
дах компании за счет приме- поддерживает внутренние доку-
cмысловые блоки
гида по стилю
144
ЦВЕТ ТЕКСТА ВЫРАВНИВАНИЕ Текст не выравнивается по левому
За базовый цвет текста берется отте- Выравнивание текста по левому краю краю в следующих случаях:
нок темно-серого, на несколько тонов применяется к: В подписях данных в таблице
светлее чистого черного. Заголовкам дашборда и визуали- (по умолчанию – выравнивание
#1b1b1b заций по правому краю)
Такой оттенок цвета одинаково хоро- Подзаголовкам В заголовках столбцов данных в та-
шо читается как на экранах компью- блице (выравнивание заголовков
Прочим подписям на дашборде должно совпадать с выравнива-
теров и ноутбуков, так и в напечатан- (описания графиков, технические
ном виде на белой бумаге. нием числовых данных в ячейках,
комментарии по времени обнов- т.е. по правому краю)
В качество цвета для подписей ления данных, подписям легенд
данных в таблицах и диаграммах и фильтров) В подписях данных непосредствен-
используем более светлый оттенок но на визуализациях (например,
Названиям категорий в таблицах/ подписи точек на Диаграмме
серого. Он хорошо читается, при этом диаграммах с подписями
не мешая восприятию визуальных рассеяния).
форм диаграммы (столбцов, круж- Всплывающим подсказкам При визуализации KPI
ков, линий)
#555555
Допускается использование чистого
черного цвета (#000000)
145
ЦВЕТ Используйте следующие Однонаправленная палитра ЦВЕТОВЫЕ АКЦЕНТЫ
цветовые палитры. для цветового кодирования Цветовые акценты – это то, что
Цветовые палитры подобраны
Базовые цвета для использования однонаправленного изменения помогает сделать визуальный акцент
с учетом того, что цвет на визуализа-
на визуализациях без цветового показателя (например, измене- на определенном срезе в данных и
циях не должен мешать восприятию
кодирования на основе какого- ние выручки, которая не может выделить его из всей совокупности
данных. Кроме того, цветовые
либо поля, т.е. как базовые цвета быть отрицательной) информации.
палитры учитывают особенности
диаграммы Например, если вся визуализация
цветового восприятия у людей Двунаправленная палитра для
с разными особенностями зрения, Категориальная палитра для цветового кодирования измене- использует серый цвет для столбцов
а также детали передачи цвета при цветового кодирования категорий на диаграмме, используйте основ-
ния показателя с переходом через
на визуализациях ной синий для создания цветового
печати визуализаций. какую-либо границу (например,
акцента на необходимой категории
изменение прибыли, которая (или нескольких сразу).
может быть как положительной,
так и отрицательной)
146
ФОРМАТЫ ЧИСЕЛ Сокращайте количество знаков ФОРМАТЫ ОСЕЙ И ШКАЛ ДОПОЛНИТЕЛЬНО
Используйте одинаковый формат в подписях шкал. Если на шкале Главное требование к формату сопро- Все сопутствующее оформление
числа для одинаковых показателей размерность 40 000, переведите вождающих элементов на диаграм- визуализаций не должно выходить
во всех создаваемых отчетах, если число в формат в тысячах – 40К ме – их незаметность. Оси и шкалы на первый план и спорить с визуаль-
нет конкретного требования от Не показывайте знаки после запя- не должны выходить на первый план ным представлением самих данных.
заказчика. Это упростит восприятие той там, где это не имеет смысла – при работе с дашбордом и спорить Итоги и промежуточные итоги
данных на дашбордах у аудитории. оставьте только целые числа с данными. должны быть более заметными, чем
Если это целое число в миллионах Ограничьтесь одним знаком после Основное правило форматирования основная часть данных, но при этом
или миллиардах, сократите коли- запятой, если вам нужна дополни- осей и шкал – не создавать помехи не сильно от них отличаться.
чество знаков, добавив вместо тельная точность считыванию данных на визуализации. Всплывающие подсказки должны,
последних разрядов – М для Убирайте контрастные границы в первую очередь, предоставлять
миллионов и B для миллиардов диаграммы дополнительную информацию по
Придерживайтесь светло-серого выбранным данным и при этом быть
цвета для осей и шкал легко-читаемы.
При малых изменениях показателя Для выделения акцентных областей
допустимо начать ось Y не от нуля, на диаграммах, рекомендуется
но в этом случае, обязательно использовать блеклые цвета, которые
оставляйте шкалы диаграммы не будут отвлекать внимание от са-
видимыми – не скрывайте мих данных.
147
рекомендации
для дашбордов
Задача дашборда – предоставить с дашбордом, направляя ауди- При большом количестве легенд
возможность изучать и читать торию от общего к частному, от рекомендуется использовать
данные максимально эффективно крупного заголовка к детальным скрываемый контейнер.
У дашборда: подписям. В нижней части дашборда – се-
Есть зонирование благодаря Стандарты расположения элементов рая плашка, в которой рекомен-
областям с белым фоном. Зо- дашборда: дуется располагать метаданные
нирование позволяет целостно В верхней части располагается по времени обновления даш-
воспринимать каждую из диа- плашка с Заголовком, описа- борда, а также любую дополни-
грамм, быстро понимая что все нием дашборда, глобальными тельную информацию, включая
элементы, находящиеся в одной фильтрами, логотипом контакты.
зоне, связаны между собой по Логотип располагается в верхнем
смыслу и назначению. правом углу.
Чистые цвета. Каждая визуали- Рядом с заголовком располага-
зация размещается на рабочем ется иконка с информацией.
листе белого фона, с минималь- Легенды располагаются либо
ным количеством отвлекающих в верхней части дашборда
деталей оформления. (если они глобальные), либо
Иерархия шрифтов. Необходима рядом с заголовком визуали-
148 для поддержки понятной работы зации (если они локальные).
общие правила работы
с дашбордами
Подготовленные шаблоны пред- Дашборд должен помещаться Используйте текстовый блок При использовании мобильных
лагают структуру размещения на одном экране. внизу дашборда для того, чтобы версий дашбордов, зафиксируй-
визуализаций по трем схемам: расшифровать аббревиатуры, те разрешения для планшетов
Дашборд должен иметь фикси-
Шаблон 2х3 – сетка из 6 оди- дать информацию по источни- и мобильных телефонов.
рованный размер.
наковых по размеру диаграмм кам данных и дате обновления/
Старайтесь избегать полосы создания отчета.
в две строки
прокруток на добавленных
Шаблон 2|1|3 – трехколоночная листах дашборда. Логотип находится строго
сетка, согласно которой слева в верхнем правом углу даш-
направо показываются две, Никогда не делайте дашборд борда.
одна, а затем и три диаграммы с горизонтальной прокруткой.
Разместите описание текущей
в трех колонках Дашборд должен выглядеть цели по SMART в описании
Шаблон 1-2-3 – трехколоноч- аккуратно независимо от при- дашборда
ная сетка, согласно которой мененных в момент времени
фильтров. Иными словами, все Одна диаграмма – один заго-
слева направо показываются
визуализации должны читаться ловок.
две, а затем и три диаграммы
в трех строках; при этом в каче- и выглядеть гармонично и це- Добавляйте легенды наверху
стве первой строки выступает лостно не смотря на то, сколько или внизу диаграммы. Фильтры
отдельная строка с четырьмя данных сейчас показывает также находятся рядом с визуа-
KPI визуализация. лизацией. 149
примеры стандартов
в жизни
151
использование
цвета
152
рисунок по категориям цвета
Восприятие информации человеком Элементарные связи цветов людей В аналитике добавляется еще один
во многом зависит от цвета. Человек на графиках и KPI схожи с цветами цвет – нейтральный черный или
благодаря своему опыту отождест- светофора: серый. Он ассоциируется с тем, что
вляет цвета с определенными пара- с показателем все хорошо, на него
метрами, например цвета светофора Красный – плохо, падение показа-
можно пока не обращать внимание.
(зеленый – можно идти, все хорошо; теля, невыполнение плана;
Внимание надо уделить тем пока-
красный – стой на месте). Необ- Зеленый – все отлично, рост, пе- зателям, которые соответствуют
ходимо учесть это и использовать ревыполнение плана, или просто описанным выше ярким цветам.
цветовые акценты для привлечения значение выше ожидаемого;
внимания человека, либо передачи
ему главной информации.
154
советы по работе
с цветом
Цвета на вашем мониторе могут Корпоративные цвета вашей Одни и те же данные должны быть
отличаться от цветов на мониторе компании могут плохо смотреться постоянны в своем цвете на протя-
других людей на визуализациях жении всей визуализации
Цвета на экране монитора Если вы хотите сделать на чем-то Ваши данные могут сами под-
и напечатанные на бумаге могут цветовой акцент – это правда сказать вам какой цвет выбрать
различаться должно иметь особое значение (яблоки – зеленые, ягоды –
Черно-белая печать может Цвет не должен использоваться красные)
изменить внешнее восприятие для «украшения» данных – тогда
визуализации он не вызовет у людей отклика
155
шрифт
в визуализациях
Шрифт, как и цвет, формирует Важность выбора цифр, что особенно важно при работе
визуальное восприятие. Неудач- с большими и насыщенными данны-
ное использование или плохой шрифта ми таблицами. А иерархия шрифтов
выбор шрифта могут испортить помогает управлять вниманием —
Мы будем использовать шрифты для
впечатление от визуальных работ. наши глаза движутся от больших
того, чтобы четко донести инфор-
Почему шрифту надо уделять много заголовков в дополнительным
мацию до аудитории и управлять
внимания? Обратите внимание подписям, постепенно «сканируя»
вниманием конечного пользователя.
на городские рекламные вывески пространство визуализации.
или названия магазинов – как много Под шрифтами мы понимаем
Изучение гарнитур шрифтов, полного
плохих шрифтовых решений можно художественное оформление текста
набора букв и символов, выполнен-
встретить просто гуляя по городу? средствами графического дизай- ных в одном графическом стиле,
на. Оно складывается из выбора требует времени и внимания к де-
гарнитуры, размера букв, длины талям. Существуют тысячи шрифтов
строки, расстояние между строками, и каждый день появляются новые,
пробелы между буквами и между поэтому исследование особенностей
группами букв. применения шрифтов приводит нас
Все эти компоненты можно изме- к погружению в область дизайна.
нять, воздействуя на восприятие Рекомендуем исследовать возмож-
и понимание текста аудитории. ности гарнитур шрифтов, изучив
156 Выбор шрифта влияет на читаемость наши дополнительные материалы.
Посмотрите на влияние высоты цифр. Там, где цифры одной высоты, Еще одно сравнение – ширина цифр. И снова, там, где цифры имеют одну
«бежать глазами» легче. Такой шрифт лучше подходит для визуализации ширину, считывание происходит легче. Нам проще увидеть большие и малые
данных. Нам же важна скорость и простота считывания. значения в строках таблицы
Формируем правила ных на диаграммах должны быть Шрифты с засечками лучше под- При моноширинном шрифте, числа Используйте темно-серый, не до
еще меньшего размера. Совсем не- ходят для большого объема текста, с одинаковым количеством сим- конца черный, цвет для основного
хорошего вкуса большим шрифтом пишется допол- потому что засечки-хвостики по- волов будут иметь равную ширину, текста. Это придаст дашборду стиль.
При разработке дизайна диаграмм, нительная информация, которая не могают взгляду быстрее считывать образуя ровные «столбцы» и облег- Такой текст лучше воспринимается
используйте только один шрифт является безусловно-обязательной буквы. Такие шрифты используются чая считывание. аудиторией, т.к. он не настолько
(одно семейство шрифтов) и не к прочтению. Например, источник в большинстве печатных книг. сильно контрастирует с белым
Как еще можно влиять на
данных, или примененные фильтры фоном как чисто-черный.
более 3-4 размеров шрифта. Очень Шрифты без засечек лучше под- восприятие текста? Использо-
важно создавать иерархию шриф- на дашборд. Тот, кто часто работает ходят для коротких блоков текста, вать форматирование. Выделение
тов – она будет поддерживать с этим отчетом и так будет это знать например, заголовков. Читатели на главного. Цветовые контрасты для
общую логику работы с данными. и не будет отвлекаться. А тот, кто них обращают внимание. Дорож- привлечения внимания. Усиление
видит дашборд впервые изучит все ные знаки в некоторых странах какой-либо части текста. Главное –
Заголовок дашборда – самая важ-
сноски и пояснения для того, чтобы набираются Helvetica, шрифтом без не перестараться.
ная часть экрана, точка входа, мо-
получить полное и верное пред- засечек.
мент погружения в тематику цифр. На дашбордах вы можете исполь-
Сделайте его самым большим и за- ставление.
Для показа текстовых данных, зовать элементы форматирования
метным, это притягивает внимание. Какой шрифт нужно использо- выбирайте моноширинные ширины текста для того, чтобы выделить
Заголовки диаграмм – вторые по вать? Большинство современных с одинаковой шириной каждого название показателя в заголовке
важности. Уменьшите шрифт, но не шрифтов можно отнести к одному символа. Это наиболее заметно (жирное начертание) или сделать
сильно. Это тоже заголовок, пусть из двух классов: с засечками (serif) влияет, прежде всего, на отображе- небольшую сноску по одной из
ние текстовых данных в таблицах. 157
и следующего уровня. Подписи дан- или без засечек (sans-serif). диаграмм (наклонное начертание).
контраст в дизайне
данных
ОСНОВЫ ТИПОГРАФИКИ
Павел Шайкин ОТ ПАВЛА ШАЙКИНА
Гуру шрифтового дизайна. Каллиграф. Мастер художественного печатного
Не используйте слишком много
слова. Лауреат и участник международных плакатных конкурсов дизайна
шрифтов
Шрифт является связующим звеном Курсивные шрифты часто в книгах Не злоупотребляйте декоратив-
между информацией и пользова- используются для отступлений ными шрифтами
телем. и примечаний. Поэтому надписи Оставьте немного воздуха
Шрифт — это та мелочь, которая таким шрифтом пользователь Не меняйте пропорции шрифта
может разрушить ваш проект. Не- может оставить без внимания. Будьте осторожны с цветом
верно подобранный шрифт может
Зато строгие прямые гротески Не используйте эффекты
изменить значение слов, их смысл
задают деловое настроение, сразу на шрифтах
и дизайн всего проекта. Именно
шрифт является связующим звеном определяют серьезность подавае-
Идеально подобранный шрифт
между информацией, которую вы мого материала. Правда, гротеск, пользователь не замечает. Он про-
хотите донести, и вашим пользо- в силу своей универсальности сто прочтет текст и запомнит ин-
вателем. Выбор шрифта может и распространенности, не сможет формацию. Шрифтом вы говорите
напрямую управлять настроением подчеркнуть уникальность проекта, со своим пользователем — говори-
пользователя и вниманием. выделить его среди конкурентов. те так, чтобы ему было приятно.
159
самые важные советы
по дизайну данных
Алексей Новичков
Графический дизайнер, эксперт в области инфографики и независимый кон-
сультант, руководитель студии инфографики ТАСС
162
163
VI cбор дашборда
шаг и интерактивность
166
дашборд
или дэшборд?
Дашборд – основной элемент комму- космических кораблях и другой
никации между разработчиком отчета технике показывает все необходимые
и аудиторией. Дашбордом можно элементы управления на одной пане-
назвать общий экран, на котором ли. Дашборд в аналитике делает тоже
добавлены все необходимые для при- самое, но на одном экране.
нятия решений диаграммы, фильтры, В других материалах на русском
комментарии, заголовки, легенды языке, вы можете встретить такие
и прочие элементы взаимодействия. варианты как дэшборд, приборная
Дашборд создает целостную кар- панель, аналитическая панель
тинку для пользователей, объясняя и прочие близкие по смыслу слова
и показывая данные в доступной и выражения.
форме. Компактное размещение Дашборд — это прежде всего сред-
диаграмм позволяют оценить данные ство коммуникации. И представляет
одним взглядом. И вместо того, чтобы ценность, если показывает данные
просматривать несколько листов доступными и наглядными средства-
в письменном многостраничном ми, формируя понимание ситуации,
отчете, можно посмотреть на все помогая формированию выводов,
данные разом. побуждая к изучению имеющихся
Термин дашборд произошел от данных, если в них что-то не так.
английского dashboard – в переводе В идеальном мире дашборд должен
с английского «приборная панель». способствовать диалогу между вами
Дашборд в самолетах, автомобилях, и данными. 167
применение
дашбордов
Дашборды создаются и используются нию дашборда. Большие объемы ционных – была выделена группа
почти в каждой отрасли, включая данных и доступные технологии коммуникационных и обучающих
некоммерческие и сервисные визуализации вызвали распростра- дашбордов. Исследователи стол-
компании, для поддержки принятия нение дашбордов в новых областях кнулись с несколькими примерами,
решений, основанных на данных. и в новых формах, хотя первоначаль- которые не оказывали поддержку
Дашборды используются не только ное название четко фиксировало его процессу принятия решений в прин-
в бизнес-организациях, но все боль- внешний вид. Концепция «даш- ципе. Вместо того, чтобы принимать
ше – в повседневной жизни разных борда» развилась от примитивных решения на основе данных, аудито-
людей: студентов, спортсменов, экранов с одним представлением рия таких дашбордов может изучать
новую предметную область или Наглядное, понятное и масштабное
журналистов. до интерактивных интерфейсов
глубже погружаться в выбранную исследование, проведенное исследо-
Разнообразие точек зрения на с несколькими представлениями вательской группой Tableau Research
тему. Такие дашборды скорее можно
дашборды велико. В сообществе и новыми целями, включая комму- по типизации дашбордов
назвать «историями, основанными
идут споры: что в принципе можно никацию, обучение и мотивацию, на данных», они чаще встречаются research.tableau.com/paper/what-do-
считать дашбордом, а что – не под- в дополнение к классическим в не-бизнес сферах: медиа, образо- we-talk-about-when-we-talk-about-
ходит под его определение? понятиям мониторинга и поддержки вание, популярная наука и другие. dashboards
Термин «дашборд» широко исполь- принятия решений.
зуется для обозначения различных Помимо стандартной категоризации
видов экранов с информацией, на три уровня дашбордов – стра-
168 бросая вызов привычному понима- тегических, тактических, опера-
169
определение дашборда
от Стивена Фью
Стивен Фью
один из наиболее известных людей
в области визуализации данных
и информационного дизайна
170
Разберем это определение на со- На одном экране – представ- Легко понять – для пользова-
ставные части: ление информации без полосы теля интуитивно понятно, что
прокрутки. Если дашборд значит каждый блок отчета.
Визуальное представление – Складывается единая картина,
выходит за границы экрана,
результат представлен в графи- и аудитория тратит ресурсы
то единая смысловая картина
ческой форме не на расшифровку таблиц
рассыпается. С одной сторо-
Информации – по содержанию ны, при быстром взгляде на и мудреных визуализаций,
в основном числовой, по фор- одноэкранный дашборд все а на аналитическую работу.
ме – в виде графиков и таблиц данные быстро считываются,
а это плюс. С другой стороны,
Наиболее важной – ключевые
это спорное условие: а что если
показатели, которые дей-
у меня очень много данных?
ствительно необходимы для
Существует множество приме-
принятия решений
ров дашбордов-лонгридов на
Сгруппированной по смыслу – несколько экранов. Но что точ-
показатели должны быть свя- но важно для дашборда – это
заны между собой, относиться возможность легко и быстро
к одной теме (отдел, продукт, проводить сравнения, а это
процесс), предоставлять не- сделать гораздо проще, если
обходимый набор ответов для все необходимое находится
пользователя рядом друг с другом
171
какие бывают
дашборды
Мы делаем сложное простым: Мы рассказываем ясную историю: Мы выражаем смысл данных: Мы показываем детали по мере
у нас есть много информации, мы хотим иметь возможность выбранные визуализации данных необходимости: мы хотим, чтобы
много данных, которые постоянно связывать данные с их контекстом должны правильно представлять каждый пользователь имел доступ
меняются, а также различные ана- в бизнесе и отвечать на вопросы информацию, которую вы хотите к нужным им данным – ни мень-
литические потребности и вопро- аудитории. Здесь решающую роль извлечь из них. ше, ни больше. Некоторым поль-
сы. Мы хотим взять эту сложность играет визуальное оформление зователям может потребоваться
и упростить ее. дашборда. более детальное представление
данных, другим может хватить
поверхностного обзора.
175
характеристики
дашбордов
У разных групп дашбордов есть свои особенности визуальной
работы с данными.
Интерактивность Многостраничность Изменение данных Уведомления и алертинг
Хотя интерактивность является уже Несмотря на то, что дашборды тра- Некоторые дашборды имеют Классическим сценарием использо-
привычным аспектом визуализации, диционно представляют собой дан- возможность обратной записи в ис- вания дашбордов является выявле-
исследователи обнаружили суще- ные для просмотра на одном экране, ходную базу данных: поддерживать ние аномалий и оповещение о них
ственные различия в использовании некоторые дашборды поддерживают анализ «что-если», моделирование с целью информирования. Пользова-
интерактивных возможностей. макеты с вкладками и многостра- и ввод данных. тель может вручную задавать поро-
Различают три типа интерактивности: ничность. Эти дашборды позволяют Семантика данных. Помимо визуаль- говое значение для отслеживания.
инструменты могут позволить переключаться между страницами с ных и функциональных аспектов, Возможность обновления. Многие
пользователю спроектировать дополнительными визуализациями. дашборды могут предоставлять цен- дашборды подключаются к источ-
(или настроить) дашборд с нуля ную семантику о данных и процессах, никам данных, которые регулярно
Подсветка и аннотирование
инструменты могут разрешить которые они визуализируют. обновляются; данные в дашбордах
Некоторые дашборды позволяют
«огранку» данных через фильтры тоже автоматически обновляются
пользователям выделять данные
и параметры и комментировать их. Такое «вме-
инструменты могут позволить шательство» не затрагивает данные
изменять состояние данных на в источнике; скорее, они позволяют
основе данных, представленных пользователям создавать аннотации
на дашборде точечно для будущего изучения или
176 для совместной работы.
как понять что нужно
показывать
Мы уже говорили про понятие шума Стивен Фью выделяет три или плохих перемен — это тоже И по численным показателям:
и сигнала в начале книги. Сигнал – типа сигналов: потенциальный сигнал. Изменения показателя
это нечто в данных, что потенциально Сигналы всегда представляют собой
заметные изменения в паттернах Отношения между показателями
представляет для нас ценность. или проблему, которую мы можем
показателей (изменение трендов)
Когда вы начинаете работать решить, или возможность, которую Исследуя данные по этим основ-
заметные изменения в размахе/ ным видам сравнения, мы можем
с новыми для себя данными, любой мы можем использовать для дости-
шум может казаться потенциальным величине жения цели составить свое представление об
сигналом. Однако, изучив данные появление уже известного и имеющемся на руках наборе катего-
Так где искать сигналы и как именно? рий и показателей, которое, в свою
и определив, что является привыч- заметного паттерна
Мы можем выделить ключевые очередь, даст нам фундамент для
ной и стандартной ситуацией, а какие
Когда данные начинают вести себя способы сравнения данных: поиска дальнейших сигналов.
паттерны необычны, сигналов оста-
по-новому — это потенциальный Сравнение по категориям:
нется не так много. Если точнее, они
скорее всего будут появляться только сигнал. Когда диапазон, в рам-
Изменения по категории
с течением времени при обновлении ках которого обычно колеблется
Изменения во времени
ваших данных. показатель, резко изменяется — это
потенциальный сигнал. Когда мы Изменения в пространстве
начинаем видеть признаки хороших Отношения между категориями 177
точки
внимания
178
В 2016 году команда Tableau Research
and Design Team провела свое соб-
ственное полевое исследование по
восприятию дашбродов.
Какие выводы были сделаны?
Большие цифры важны. И правда,
при просмотре дашборда внимание
участников мгновенно привлекали
отдельно стоящие цифры большого
размера. Обычно именно так визу-
ализируют KPI. Более того, цифры
замечали раньше всего остального
в первые секунды просмотра. И уже
после, взгляд уходил в другие кон-
трастные и выделяющиеся области
диаграмм и графиков.
179
точки
внимания
180
Больше всего внимания мы ин- Второй важный аспект – правиль- Присутствие композиции человек
стинктивно уделяем информации ное наполнение элементами и их ощущает на интуитивном уровне –
в верхнем левому углу — просто расположение на листе. Композиция это ощущение «простоты, удобства
потому, что мы привыкли так делать: представляет собой сочетание эле- и красоты».
начинаем читать слева направо ментов – визуализаций дашборда.
и сверху вниз и это очень базовый Главное правило – дизайн должен
паттерн нашего поведения. Левый располагать к себе. Не отвлекать
верхний угол – область наибольшего пользователей от той проблемы,
акцента и первичного внимания. Чем которую они надеются решить
информация на дашборде распола- благодаря дашборду.
гается ниже и правее, тем меньше
внимания ей уделяется, и это обу-
словлено нашим подсознанием
181
золотые советы
проектирования
184
быстрый чеклист
крутого дашборда
Многие люди ищут объективные кри- КРАСИВЫЙ ДАШБОРД ЭТО... ниторинговых системах, военные не формацией о хороших людях и т. п.
терии красоты, которые не менялись работают с пастельными оттенками (а как назвать красивый дашборд по
... дашборд, который красивым цветов для целей аналитики?) covid19, или совершенные уголов-
бы ни во времени, ни в пространстве.
считает автор? ные преступления?)
Но не найдя единых критериев для ... привлекательный дашборд,
разных культур и исторических перио- ... дашборд, который красивым элементы которого отличаются гар- ... дашборд может быть назван краси-
дов, некоторые приходят к выводу, что считает заказчик? монией, изяществом и т. п. (а как вым если он прост, легок в загрузке,
красота субъективна. ... или это независимая оценка кото- же фирменные цвета заказчика, и блестит как обложка модного
Восприятие красоты как удовольствия рой доверяют и автор и заказчик? которые нужно учесть, а у него весь журнала (а если источник – старый
от созерцания («красота – это обеща- стиль из 90-х?) корп-сервер и медленная база дан-
... или это точное соответствие
ние счастья», Ницше) действительно ... тот дашборд, который приятно ных заказчика и денег на расширение
техническому заданию, по которому
отчасти субъективно и зависит от рассматривать (а что делать когда железа не давали уже 9 лет, и твой
строился дашборд?
личной значимости человека для вас. в идеальный прототип залили идеальный дашборд грузится 25
Если есть задача и данные, и было минут? Красив ли он?)
клиентские данные от которых все
выполнено 20 макетов дашборда, по
перекосилось и нужно искать как ... визуализации, дашборд и т. п. назы-
каким критериям считать дашборд
скрывать недостатки, ведущие к вают красивыми, если они рассчи-
более красивым или менее красивым
усложнению восприятия?) таны на то, что произведут внешний
чем остальные?
... дашборд называют красивым, если эффект (а если заказчика тошнит от
ЭТО... на нем отображены высоконрав- баров, и он ищет счастья и эстетики
... что-либо привлекательное на вид, ственные вопросы, или он насыщен в волосяных цветных комках сетевых
на что очень приятно смотреть интересными событиями, богатыми графов или в боксплотах с тримапа-
186 (а как же контрастные цвета в мо- человеческими впечатлениями, ин- ми, не понимая как с ними работать?)
... красивый дашборд с продуман- ... или это та визуализация которая Так что же все же считать
ной последовательностью для по всем замерам позволяет красотой дашборда?
guided analytics (а заказчик только быстрее всего находить нужные
пытается оторваться от электронных ответы на вопросы и пригодна для
таблиц и кривых правок показате- долгосрочной информационной «в ситуации, когда нет времени разби-
лей прямо в базе?) работы для одного типа пользова- раться в данных, их правдивости, кри-
телей (а заказчик тебя уговаривает терием качества данных становится
... красивый дашборд с иерархией
делать царь-дашборд, на котором их внешний вид. Простыми словами
шрифтов и подбором эмоциональ-
100500 виджетов для медитации «если выглядит хорошо, значит данные
ности шрифтовых пар (а у за-
и уверяет что девяти разным функ- правильные»
казчика красота это рукописный
шрифт из сказки и TimesNewRoman циональным подразделениям будет Шинкаренко Алексей
в остальных корпоративных доку- комфортно с этим работать, так как
ментах?) он красив из-за своей сложности
и отражает много чего происходя-
... красивый дашборд в соответствии
щего в компании?)
с признанными международными
стандартами или отраслевыми под-
ходами (а заказчик тебе предлагает
собственноручно разработанную
палитру цветов похожую на китч
и от едкого лимонного у дизайнера
текут слезы, это ли красиво?) 187
иконки
на дашбордах
Под иконкой мы понимаем все, что они слегка отличаются, и это может Обычно, люди работают с интерфей-
отражает идею, объект, предмет, предоставить нам интересную сом в спешке, поэтому интерактив-
явление, чувство. информацию о том, как там люди ные иконки должны быть простыми
Обычно пользователи не замечают воспринимают самих себя и как об- (часто чёрно-белыми). Это ускоряет
иконок, гармонично вписанных щаются друг с другом. То же можно взаимодействие и облегчает работу
в ландшафт дашборда, воспри- сказать и об иконках на дашбордах глаз.
нимая их как само собой разу- и в интерактивной отчетности.
меющееся. На самом деле, такие Для дашбордов обычно использу-
визуальные подсказки помогают ются минималистичные, лаконич-
ориентироваться в пространстве ные и одноцветные иконки. Важно,
экрана с высоким содержанием чтобы любые графические образы
информации. Сигналы, подаваемые быстро считывались и не отвлекали
иконками, должны быть простыми пользователей от непосредственной
и понятными носителям любого работы с данными, не спорили с
языка. диаграммы по цвету и контрасту.
Когда вы оказываетесь в аэропорту, В приоритете — стиль иконок
то сразу замечаете иконки-ука- без заливки, ведь заливка создает
затели – они выступают в роли достаточно заметные «пятна цвета»
188 ориентиров. От региона к региону на листе дашборда.
189
история
иконок
Давайте посмотрим на разные виды ИКОНКИ БРЕНДА ИКОНКИ ДЛЯ РЕДАКЦИОННО- ИКОНКИ ДЛЯ ИНТЕРАКТИВА
иконок и поговорим об их стилях ГО ДИЗАЙНА МАТЕРИАЛОВ
Такие иконки представляют ценности Этот тип иконок строится на исполь-
и функциональности.
компании и обычно легко узнаваемы, Это крохотные картинки, которые дают зовании уже существующего словаря
т.к. построены на основе элементов представление пользователям о содер- функций и действий, то есть обычно
фирменного стиля. Это логотипы и жимом в разного рода материалах. выбираются те символы, которые уже
фирменные пиктограммы компаний, Они дают представление о том, на работают. Например, корзина или
поддерживающие их брендбук. чем можно сфокусировать внимание, тележка указывают на возможность
а что – пропустить. В большинстве, произвести покупки. Любую икон-
такие иконки забавны, так как про- ку-действие следует тестировать,
иллюстрировать материалы можно чтобы убедиться в ее соответствии
настолько разными способами, что их функции.
подбор или разработка превращается
в игру.
Если к этим иконками добавить
фирменный стиль бренда, то вы
получите маркетинговые пиктограммы
для поддержки веб-сайта компании
и ее материалов.
191
мобильная разработка
дашбордов
Только самое главное Приучите пользователей к тому, что Простота вычислений Простота дизайна
мобильные версии отчетов необхо-
Никогда не пытайтесь отобразить димы только для оценки текущей Чем проще будут формулы в объ- Функциональное пространство
абсолютно все показатели, которые ситуации в целом. Детальной анали- ектах, отображаемых в мобильной экранов мобильных устройств очень
планировались в полноценном тикой лучше заниматься в полноцен- версии листов, тем быстрее он будет ограничено. Именно по этой причине
отчете, в мобильной версии дашбор- ном отчете. Необходимо различать работать. Всем неприятно, когда не надо «перегружать» интерфейс.
да. Да, бизнес будет сопротивляться, эти области применения. любимая социальная сеть очень Лучше добавить прокрутку листа,
а вам самим будет казаться, что это медленно работает, обмен сообще- чем пытаться уместить все на один
неверно и все важно. Но если поль- ниями проходит долго, а любимый экран. Особое внимание придется
зователь решил открыть дашборд фильм в онлайн-кинотеатре заикает- уделить фильтрам, ведь с фильтрами
через мобильное устройство, то, ся каждые пять секунд. Представьте пользователь взаимодействует,
как ему бы не казалось на момент пользователя отчета, у которого тот поэтому важно, чтобы размеры
проектирования отчета, по факту ему будет открываться более минуты, а элементов и их расположение было
будут интересны только самые важ- то и нескольких. доступным.
ные показатели, имеющие ценность
в текущем моменте.
192
способы адаптации
под мобильные устройства
Используя дашборды на мобильных Способ 1. Создание копий Недостатки: Способ 2. Адаптация дашбор- автоматическое отображение
устройствах, формат дашбордов дашбордов с разными разре- сложность в поддержке при дов при помощи встроенных подходящего дашборда под
лучше специально адаптировать под шениями изменениях дашборда. Придется функций инструментов конкретное устройство.
разрешения самих устройств. Преимущества: поддерживать обе версии: для де- Некоторые BI-инструменты пред- Недостатки:
простая установка размеров сктопа и для мобильной версии. лагают автоматическое создание нет возможности менять
дашборда или задание диапа- сложность в использовании. мобильных версий под разрешения настройки форматирования
зона размеров. Вы можете в Пользователи должны будут экранов разных устройств (мобиль- или производить любые другие
точных пикселях зафиксиро- изначально выбирать нужную ные телефоны, планшеты). изменения визуализаций для
вать высоту и ширину. рабочую книжку, в зависимости Преимущества: мобильного отображения. Все
изменение любого элемента, от их устройства: для работы с легкое задание внешнего вида изменения перейдут во все виды
например, вида визуализации, мобильным приложение и для элементов и простое изменение отображений, поэтому нельзя
размера шрифтов, цветов. Лю- десктоп-браузера, что может макета дашборда. настроить внешнее форматирова-
бые изменения будут приме- запутать. сохранение логики работы ние индивидуально.
нены только к тем дашбордам, дашборда по умолчанию для всех нет гарантированного результата,
на которых будут сделаны, и не мобильных версий. в котором можно быть на 100%
будут передаваться на другие управление изменениями в од- уверенным
версии дашборда, т.к. техниче- ном месте. Мобильные версии
ски они не связаны между собой. лишь изменяют «внешний макет»
дашборда. 193
cоветы по мобильным
дашбордам
Какие фишки мы можем посоветовать Размер и количество диаграмм И самое главное – учтите интересы
по использованию дашбордов на на вашем экране также может своих зрителей. Если ваши коллеги
ТВ-экранах? значительно помочь в удобочитае- считают, что числовые данные легче
Цветовое кодирование позволяет мости и полезности. Ограничение усваиваются, используйте их, адапти-
мгновенно видеть статус показа- количества диаграмм в 4 или 5 руя под требования ТВ-дашборда.
теля. Если показатель находится штук облегчает понимание на Если им хочется поменять цвета,
в норме, сделайте его цвет ней- расстоянии. прислушайтесь к ним, но не забудь-
тральным. Как только показатель те о цветопередаче самого экрана
вышел за границы нормы – цвет телевизора. Чем легче будет аудитории
должен стать ярким, контрастным. понять данные, тем эффективнее.
Со временем, глаза привыкнут на И не полагайтесь на интерактивность.
отсутствие контрастного цвета и при Структурируйте данные, чтобы пока-
его появлении на экране – люди зать правильный уровень детализации,
отреагируют. так как люди не смогут самостоятельно
Используйте темный фон дашборда, фильтровать данные или переключать
желательно, темно-синий или тем- визуализации. Обязательно учиты-
но-серый. Белый фон слепит и ухуд- вайте такие факторы, как правильный
шает усваивание информации с период времени для отображения или
расстояния. Кстати, этот же совет количество категорий для показа.
относится и к слайдам презентаций
196 для большой аудитории.
примеры
ТВ-дашбордов
197
ошибки
на дашбордах
.03
.02
Избыточность деталей
Попытка или точности
понравиться всем
В идеальном мире, дашборд
.01
«Царь-дашборд», который даст должен всегда показывать высо-
ответы на все вопросы всех де- коуровневую информацию для
Выход за границы партаментов, не существует. Хотя быстрого обзора. Это позволяет
одного экрана многие компании пытаются его быстрее приходить к выводам.
Подумайте о том, как пользова- спроектировать. Кто готов разби- На практике, дашборды бывают
тели будут смотреть на дашборд. раться в десятках таблиц, фильтров разные. По крайней мере, ста-
И хотя многие, благодаря еже- и параметров, чтобы найти одну райтесь уходить от построчного
дневному сёрфингу в Интернете, полезную цифру из 500? вывода чисел и табличной дета-
привыкли листать длинные Совет: Продавайте себе или лизации. Вам обязательно нужны
веб-сайты и скроллить страницы – заказчику место на дашборде. эти два знака после запятой? Или
большинство из нас все равно не Представьте себе, если каждая дублирование в каждой подписи
докручивает страницы до конца. визуализация 1x1см будет стоить ее размерности – «тыс.», «чел.»,
Диаграммы внизу такого дашбор- вам сто юаней. Вы будете намного «млн.» – вместо одноразового
198 да не будут замечены. более избирательны. указания в подзаголовке?
.08
.04
Неподходящий
Отсутствие
тип визуализации
контекста
Без контекста цифры становятся
бесполезны и не приводят ни
.05 Вы могли слышать мнение, что
круговые диаграммы лучше не
использовать. Они иногда даже
к каким действиям. Не приводит
считаются плохим тоном в визу-
.07
к действиям
Поэтому, показывайте цифры ализации данных. На самом деле
в сравнении... Дашборды не должны оставлять такой запрет связан с тем, что
.06
факт/план аудиторию с вопросом: «и что Обсуждение случаев неправильного использо-
дальше?». Пусть цифры ведут подразумеваемой метрики вания круговых диаграмм больше,
сегодня/вчера
к действиям и выводам. Много шума ведет чем случаев их верного попадания
эта неделя/та же неделя про- Пользователь хочет видеть разни-
к потере сигнала в задачу. В их применении очень
шлого года Желательно чтобы каждый ваш цу в процентах между фактической
ключевой показатель был пра- Переизбыток элементами оформ- выручкой и цифрой из бюджета. легко допустить ошибку. Это верно
сегодня/среднее за последние
вильно семантически назван, имел ления, цветами, шрифтами, Но часто, вместо простого показа и для других типов визуализации,
30 дней
глагол в своем целевом виде, большим количеством подписей величины в 10%, мы выводим каждый из которых должен подхо-
... целевое значение и сроки. Тогда и картинок ведет к сложности 180К и 200К или абсолютную раз- дить под вашу цель..
... для того, чтобы понимать он будет подвигать пользователей в понимании простых цифр. Чище ницу 20К. «Остальное посчитай или
контекст. и проще – лучше. догадайся сам». 199
к действиям и принятию решений.
ошибки
на дашбордах
.09
.12
.11
.10
Не имеющая смысла Отсутствие фокусировки
вариативность Плохие композиционные на важной информации
Визуализировать один и тот же решения У каждой визуализации есть свой
показатель в разных срезах не всегда Искажения в количественных Используйте сетки и шаблоны для «вес», своя точка притяжения.
хорошо. Спросите пользователей, данных создания грамотного макета даш- Подумайте над тем, что важнее
хотя ли они это видеть. Также, Манипулирование осями, 3D-иска- борда с правильной расстановкой всего? Когда все элементы дашбор-
в инструментах начали появляться жения, игра на визуальных эффектах, диаграмм. Поставьте себя на место ды равнозначны как по смыслу,
расширения, которые собирают обманки в расчете показателей – все человека, который открыл ваш даш- так и визуально, неизвестно с чего
аналитику по использованию даш- это снижает карму исследователя борд в первый раз. Все ли ему будет нужно начинать. Обратите внимание
бордов. Посмотрите, может какой-то данных. Будьте честны. А если понятно? Можно ли что-то поменять на контрастные зоны и проведите
из дубликатов показателя можно хотите приврать, то говорите об этом местами? Что-то удалить? Добавить несколько тестирований вместе
200 удалить без ущерба для смысла? открыто. пустого пространства? с людьми.
.14
.15
.17
Нечеткие
заголовки Неадекватное
.13
Ужасный графический
Заголовки на дашборде должны использование цвета дизайн
иметь значение. Нужно, чтобы люди Используйте цвет, когда он необ-
.16
Ужасный Неприятный цвет фона, лишние лого-
могли быстро понять показатели. Не ходим. Подбирайте контрастные, типы, резкое фоновое изображение,
дизайн визуализаций называйте визуализацию «Билеты», но приятные взгляду палитры.
Неправильные обводки, тени, хитрые эффекты – не
Яркие цвета, 3D-объемы, плохой вы- назовите «Билеты на мобильной Не стремитесь к многоцветию. делают ваш дашборд приятнее глазу.
бор фона и многое другое, что можно платформе сегодня». Заголовки Если возможно, подбирайте цвета шрифты
назвать некрасивым, безвкусным помогут сделать дашборд полезным логически под те категории, которые Помните, что это тоже одна из оши-
и даже страшным. Забудьте про это. и понятным. показываете. бок дашбордизма. 201
работа над ошибками
с помощью стикеров
Стикеры помогут проектировать Оцените визуальную форму дашборда. Комфортно ли работать с данными,
дашборды когда наполнение понят- представленными в таком виде? Все ли понятно? Как происходит процесс
но, а расположение или конечный анализа этих данных?
вид диаграмм и графиков может
варьироваться и изменяться.
Как стикеры помогают в разборе
дашборда. Этот дашборд – статисти-
ка с сервиса для просмотра филь-
мов и сериалов Кинопоиск. Здесь
представлены разные диаграммы
и графики: с разбивкой по жанрам
и годам выпуска фильма, с распреде-
лением по длительности и среднему
рейтингу.
202
Можно выделить много ошибок, Не хватает контекста и иерархии Цвета не продуманы. Повторе-
связанные не только с визуальным шрифтов. ние красного цвета в нескольких
форматированием диаграмм, палитрах — потенциальный
но и выбором самих визуализаций. Отсутствует визуальная сетка. сигнал «все плохо». Перенасы-
Композиция выстроена хаотич- щенность.
Отсутствует главный заголовок, но, без логики повествования.
часть заголовков над диа- «Дыра» под спидометром.
граммами. Не все диаграммы В таблице есть горизонтальная
легко считываются, не везде прокрутка.
понятно что на них изображено. 203
Попробуем исправить дашборд, выбрать жанр «комедия», то будет
сделать его более читаемым и при- показана статистика по комедиям.
ятным для анализа. Для быстрого
проектирования мы резервируем Построили итоговый дашборд. Мы
стикеры различных размеров под выстроили визуализации по сетке
основные компоненты дашбор- и иерархию шрифтов: с крупным
дов. Стикеры могут означать как заголовком и подписями у каждой
отдельные виды визуализаций, так диаграммы.
и управляющие элементы.
Нарисовали стикеры в Miro. График
спидометра лучше заменить на
обычный KPI со средним рейтингом,
т.к. «выполнения плана» в этой Стикеры — наши помощники, когда
статистике нет. есть видение, но нет понимания чет-
Добавили еще три KPI и фильтры, кой структуры. Стикеры позволяют
а все диаграммы сделали интерак- видеть картину сразу, т. е. понимать,
тивными. То есть, при выборе любого как и где должны быть расположены
сегмента на любой визуализации, объекты. И главный плюс — воз-
все остальные перестроятся. Если можность вносить изменения в ви-
204 зуализацию, сохраняя целостность.
Использование серого цвета на даш-
бордах — отличный ход, когда
категорий слишком много. Вы не
будете отвлекать внимание от сути
данных многообразием цвета.
205
cписок вопросов
для оценки дашборда
206
ЦВЕТ ВИЗУАЛИЗАЦИИ ИНТЕРАКТИВ
Убрали цвет в серый Выбор правильной диаграммы под Кнопки
Выбрали палитру требуемый вопрос Фильтры
Добавили цвет там, Настройка элементов таблицы Параметры
где он необходим Настройка KPI Тултипы
Округления и порядки цифр Переходы
Цвета компонентов визов
207
VII интерактивность
шаг и аналитика
Медитация и интерактивность Во время визуальной медитации ум и изучать его, пока о нем не станет
пользователя, подобно спокойной известно все. Это достигается целым
проявляет связи в данных реке, движется внутри интерак- набором интерактивных элементов
тивного дашборда, максимально на дашбордах, которые максимально
погружаясь в объект. Между «Я» поддерживают практику погружения
Отбрасываем всё и ощущаем только предмет нашей медитации, настраивая пользователя и дашбордом устанав- в объект.
интерактивные элементы на дашборде. Это позволит визуально отвечать ливается связь, при которой про- ДатаЙога помогает увидеть реальный
на наши целевые вопросы. Учимся проектировать пользовательский опыт исходит максимальное восприятие мир, стоящий за данными, таким,
с помощью интерактивных элементов и, в то же время, взаимодействие с каков он есть на самом деле, не
Интерактивность позволяет тут же задавать новые вопросы к данным. Даш- интерактивным объектом. Такому вкладывая в него никакого дополни-
борд – это контакт, интерактив – связь. Когда человек постоянно концентри- состоянию должна предшествовать тельного смысла. Это также – воз-
руется на одном объекте, он обретает все более и более глубокое понимание фаза концентрации, при которой ум можность чувствовать себя уверенно
этого объекта. должен сфокусироваться на объекте. при работе с любыми данными
Стремимся не к совершенству, а к гармонии во взаимодействии – Истинное назначение седьмой ступе- и избавиться от тяжести мира на
Это условие развития. ни Датайоги в том, чтобы научиться своих плечах.
концентрироваться на объекте
208
После эпохи
информации
наступает эпоха
выбора
209
<< Чарльз Имз
210
интерактивные
визуализации
В статичных или напечатанных на бу- автор, ведете разработку визуали- Интерактивность — наиболее мощ-
маге графиках, визуализация ставит зации. В простых программах вроде ное оружие для исследования данных.
читателя перед фактом – дальней- Excel, возможностей интерактива Статичные отчеты обычно говорят об
ший анализ существующих данных практически не заложено, зато при уже найденных цифрах и хорошо ра-
невозможен из-за ограничения программировании визуализаций – ботают, когда нужно просто рассказать
формата. С переходом визуализаций вы можете практически все. кому-то о результате анализа – в сжа-
данных в веб, это ограничение снято тое время в сжатом формате.
С развитием технологий и упрощения
благодаря интерактивности – воз- доступа к данным, растут ожидания Но у любой аудитории будут появлять-
можности взаимодействовать и потребности пользователей. Теперь, ся вопросы к данным. Если заметят
с диаграммами и данными на них например, один и тот же дашборд, аномалию, то захотят узнать, что на
и получать мгновенный обновленный может использоваться в нескольких нее повлияло. Или захотят «покру-
результат. сценариях. Для того, чтобы угодить тить» данные так, чтобы, наоборот,
Если подходить к вопросу интерак- разным запросам пользовате- найти что-то необычное.
тивности продуманно, то результат лей, при разработке обращаются Под интерактивностью понимаются
от созданной интерактивной визуа- к интерактивности, так как с ее действия, которые настроены на
лизации данных будет гораздо ценнее помощью можно создать действи- диаграмме и доступны пользовате-
и значительнее. тельно разносторонний дашборд, лю для взаимодействия с данными:
Возможности интерактивности зави- поддерживающий процесс анализа изучения, преобразования, транс-
сят от инструмента, в котором вы, как по нескольким сценариям. формации. 211
ключевые направления
интерактивности
212
Несмотря на то, что с интерактивно- Интерактивные диаграммы отлично побуждая к изучению имеющихся
стью может изменяться представле- работают как сами по себе, и как со- данных, если в них что-то не так.
ние данных, сами данные в системах ставная часть целостного дашборда В идеальном мире дашборд должен
остаются неизменны. Конечно, до тех с несколькими диаграммами. способствовать диалогу между
пор, пока не используется прямой вами и данными.
Дашборды собирают воедино
ввод данных в систему хранения. несколько диаграмм и графиков,
В конечном счете, использование которые раскрывают общую тему.
интерактивности сокращает дис- Создавая дашборд, вы упрощаете
танцию между вопросом и ответом. подачу информации, стираете
Если вы готовите визуализацию для границы, делая сложное простым.
кого-то еще, то интерактивность С помощью дашбордов мы обща-
и сокращает дистанцию между емся на языке данных с другими.
вами и теми людьми, которые будут Дашборд — это прежде всего
пользоваться результатами вашей средство коммуникации. Даш-
работы. Вы не можете заранее борд представляет ценность, если
предугадать вопросы, которые могут показывает данные доступны-
возникнуть у аудитории, но вы мо- ми и наглядными средствами,
жете предоставить инструмент, кото- формируя понимание ситуации,
рый позволит получить максимум. помогая формированию выводов, 213
как настроить
интерактивность
Чтобы понять, какой способ ин- Если вы показываете категорию Если вашей аудитории хочется
терактивности необходим вам – с большим количеством зна- видеть данные в таблицах –
подумайте о специфике ваших чений (допустим, список всех добавьте переключатель вида
данных и особенностях аудитории. спортсменов олимпийских игр) – представления данных и/или
Нет необходимости добавлять все добавьте «подсветку» значений, кнопку экспорта данных в таблиц
интерактивные возможности разом. чтобы можно было акцентировать
Ваша задача состоит в упрощении внимание на выбранном эле-
работы с визуализацией, а не в ее менте и сравнить его результаты
усложнении. с другими
Задумываясь об интерактивных Если вы показываете данные, где
возможностях вашей визуализации важна точность значений – до-
или дашборда, начинайте с потреб- бавьте всплывающие подсказки,
ностей аудитории и особенностях в которых напишите значения
ваших данных. показателей и дополнительные
данные
214
аннотации
на дашбордах
Описательный анализ Сколько участников зарегистри- Метод статистическо- опросить всех (абсолютно всех)
ровалось на Марафон сегодня? пользователей нашего приложения,
данных Насколько сильно различаются
го вывода или всех читателей книги, или всех
Это самый базовый, наиболее общий результаты экзаменов прошлого Как и описательный вид анализа, ме- жителей страны. Но можем по-
и простой с точки зрения технологий года и текущего? тод статистического вывода пытается смотреть на статистику небольшой
и методов вид анализа данных. Опи- ответить на вопрос что случилось в группы людей (нашей «выборки») и
Для проведения описательного потом с определенными допущени-
сательный анализ данных стремится прошлом. Но здесь используются не
анализа используют описательную ями перенести выводы с выборки на
найти ответ на вопрос «Что случилось только имеющиеся у нас историче-
статистику: разные агрегации (сум- всю потенциальную «генеральную
в прошлом?» ские данные, но и те данные, которых
ма, количество, минимум и макси- совокупность» людей.
Для анализа берутся исторические у нас нет.
мум), отношения и пропорции, меры
данные (которые обычно легко центральной тенденции (среднее, Как пользователи оценивают В методе статистического вывода
можно получить), которые могут медиана, мода), меры разброса зна- интерфейс нашего приложения? используют полученную статистику
относиться как в недавнему периоду чений (размах, среднеквадратичное Сколько читателей книги посчита- на основе выборки для определе-
во времени (за сегодня, вчера или за отклонение). ют информацию в ней полезной? ния параметров всей генеральной
эту неделю), так и к более широкому Какой средний уровень грамот- совокупности.
диапазону дат. ности при работе с данными Как видите, здесь имеющиеся у нас
Какая книжка была лидером в России? данные сочетаются с допущениями
продаж на прошлой неделе? Ключевая особенность заключается и расчетными показателями – с теми
220 в том, что мы физически не можем данными, которых у нас не было.
Исследовательский Предсказательный чем дальше во времени от текущей Предписательный
точки, тем точность прогнозов будет
анализ анализ ниже. анализ
Этот вид анализа выходит за рамки Предсказательный анализ старается Предписательный анализ пытается
описательного анализа, разыскивая ответить на вопрос «Что вероятнее дать ответ на вопрос «Что мы долж-
ранее неизвестные или скрытые всего случится дальше?» ны делать?»
закономерности в данных. Мы не В этом виде анализа, мы исполь- Предписательный вид анализа ос-
просто хотим узнать что случилось, зуем исторические данные, чтобы нован на всех предыдущих четырех
но и почему это произошло, какой делать прогнозы. Здесь в качестве видах. Это наименее структуриро-
фактор повлиял сильнее остальных? инструментов для анализа вы- ванный и наиболее комплексный
Исследовательский анализ пытается ступает отслеживание трендов, анализ. В нем активную роль играют
найти ответ на вопрос «Что происхо- использование линий регрессии, уже не методы статистики и не
дит на самом деле?» тестирование гипотез и само про- алгоритмы анализа данных, а опыт
Детализация, поиск корреляций, гнозирование. и накопленные знания людей.
определение выбросов и анома- Прогнозы основываются на стати-
лий – все это дает чуть больше де- стических моделях, но, конечно,
талей по неизвестным нам данным, случаются события, которые никто
помогая составить полную картинку. не может прогнозировать — на-
пример, пандемия вируса. Поэтому, 221
процесс
аналитики
Алексей Арустамов
Директор и сооснователь Loginom Company
Почти всегда перед тем как данные Аналитика – как история, а вы
анализировать, их нужно подго- рассказчик. Вовлекайте слушателя
товить: связать, очистить, предо- в повествование, в исследования,
бработать, обогатить. Эта работа по в разработку. Тогда, шаг за шагом
подготовке занимает до 80% рабо- вместе с пользователем, вы полу-
чего времени любого аналитика, чите на порядок более глубокий
поэтому ее нельзя игнорировать. и применимый результат, чем
если бы вы работали в одиночку.
222
про планирование
взаимодействия
Михаил Хананашвили
UX-эксперт
223
VIII презентация
шаг и сторителлинг
226
истории против
анализа данных
227
истории против
анализа данных
229
подходы
к рассказу историй
230
Преимущество перевернутой ния, со временем узнавая их лучше показать в начале все детали, и толь-
пирамиды состоит в том, что такой и лучше. Драматичные повороты ко потом прийти к заключению?
подход позволяет читателям понять и разоблачения обычно оставляются Первый подход хорошо работает
суть новости или статьи, даже если под конец историй. Важно то, что для занятой аудитории, для которой
они прочитают только заголовок или окончание связывает воедино собы- важно быстро увидеть вывод. Второй
несколько первых предложений. тия истории и обеспечивает форму подход требует определенной смело-
Но недостатком выступает нехватка для закрытия всего сюжета. сти, но является более интересным.
четкого окончания. Таким образом, Прежде чем вы начнете разработку
перевернутая пирамида формирует истории на основе данных, уделите
только один конец истории, оставляя некоторое время, чтобы подумать
другой открытым. о цели вашей истории и о том, как
Более классические истории, такие вы хотите «провести» пользователей
как сюжеты фильмов и литературных по этой истории. Будет ли это призыв
произведений, обычно не расска- к действию, простой рассказ или вы
зывают всю информацию заранее, рассказываете о каком-то конкрет-
а постепенно раскрывают сюжетную ном случае?
линию и характер персонажей. Вы можете также решить, хотите ли
На ранней стадии мы почти ничего вы начать с итогового вывода и после
не будем знать о героях произведе- него рассказать саму историю, или 231
структурирование
слайдов
Иногда с дизайном данных можно текст, чрезмерные, сложные или планеты, звезды и ракеты, если Как найти баланс?
перестараться. Для этого Эдвард неуклюжие шрифты, орнаменти- она посвящена Дню Космонавтики.
Для этого, Тафти вводит понятие
Тафти — американский статистик рованные оси диаграммы, лишние В более спокойной среде, ни с кем
Data-ink.
и очень заметная фигура в ин- изображения или значки в графах конкурировать не нужно и эмоци-
формационном дизайне — ввел данных, 3D-графики, а также шум- ональность вместе с визуальными Показатель Data-ink ratio обо-
специальный термин junk chart. ные фоны. метафорами можно приглушить, значает соотношение полезных
Дословно его можно перевести как поставив на первый план информа- «пикселей» с информацией (data)
Но с другой стороны... Использова-
«мусорный график» или «диаграм- тивность визуализации. и графического оформления (ink)
ние изображений и образов может
ма, полная барахла», то есть на ней на визуализации. Красочный фон,
привлечь внимание и заинтересо-
много всех тех элементов, которые использование текстурных заливок,
вать аудиторию.
вообще-то не нужны для передачи изображений, активных визуаль-
информации. Для широкой публики и в медиа ных метафор — все это увеличи-
часто используют экстра-эмоцио- вает ink-составляющую (и снижает
Термин описывает все визуальные нальный подход с использованием долю полезной информации). Это
элементы на диаграммах, которые ярких метафор и образов — ведь может привести к действительно
не только излишни для понимания нужно сражаться за внимание захламлению диаграммы.
информации, но и наоборот — от- зрителя, конкурировать с другими
влекают зрителя от ее понимания. В медиа, ink-составляющая может
медиа-площадками и социальны-
Примеры ненужных элементов быть выше, чем в бизнесе и тем
ми сетями.
включают в себя тяжелые/насы- более в науке.
щенные или слишком контрастные В инфографике вполне можно
234 линии фоновой сетки, ненужный стилизовать все диаграммы под
В вопросе поиска золотой середины
между двумя полярными видами
визуализаций, мы возвращаемся
к ключевому вопросу — «кто
ваша аудитория?». Определите
ключевые характеристики тех, для
кого вы создаете визуализацию,
и вы сможете выбрать подходящее
соотношение между данными и
эмоциями.
235
чеклист
хорошей истории
.01
.02
Фокусируйтесь на самых ценных
приоритетах аудитории, находя
.03
самые важные точки историй Используйте вопросы как точку
в ваших данных входа и основу для ваших графи-
.04
Количество открытых и корпора- ков и диаграмм
Экономьте время, проверяя какие
тивных источников данных растет Используйте вопросы в качестве
данные будут поддерживать вашу
с экспоненциальной скоростью, что заголовков для ваших визуа-
историю Проработайте сценарии действий,
приводит к серьезной проблеме лизаций, чтобы ясно и понятно
Сфокусируйте вашу энергию которые ваша аудитория планиру-
выбора наиболее важных сообщений донести суть до вашей аудитории.
и время на подготовке только тех ет осуществить на основе вашей
в данных. Всегда задавайте вопросы Не переставайте думать о вопросах
данных и на том уровне детали- дата истории
о важности, приоритетах, интересе на которые вы пытаетесь ответить.
вашей аудитории. Только отвечая Все время проверяйте что, визу- зации, которые необходимы для Понимание того, как пользователи
на эти вопросы перед началом поис- альные эффекты и оформление, предоставления визуальных отве- будут использовать вашу историю
ка и анализа данных, вы сможете ис- которые вы создаете, действитель- тов для вашей аудитории. Понимая для принятия решений, поможет
ключить бесполезную информацию но отвечают на вопросы пользова- ключевые вопросы аудитории вы вам разработать правильные
и сфокусировать ваше время и силы телей и помогают сфокусироваться можете готовить необходимые функциональные возможности ин-
236 данные. терактивных отчетов и дашбордов.
на самых ценных приоритетах. на самом главном.
.08
.06
Использование цвета это всегда
диалог
.07
Располагайте ваши визуальные При неправильном использовании,
элементы в истории в зависимо-
.05
.10
.12
Проектируйте использование тек-
ста для создания разных уровней Вовлекайте аудиторию разными
фокусировки, визуальной ясности способами, как будто вы со-
.11
и последовательности подачи вместно открывайте новые идеи
идей и сообщений находящиеся в ваших данных.
Создавайте варианты истории Делайте ваши истории запомина-
.09 Текст скрывает множество недооце-
ненных возможностей дизайна исто-
рий. Продуманный текст позволяет
и ее дизайна, чтобы можно было
делиться продуктом по разным
ющимся
Чтобы знакомство с вашей историей
Уберите любой шум и отвлекаю- создать более профессиональный каналам передачи информации не было скучным для пользователя,
щие факторы на ваших визуали- вид информационного продукта. Прорабатываете варианты того, и не было похоже на информирова-
зациях Выбирайте параметры шрифта, как ваша аудитория будет получать ние о ранее сделанных находках в
Ваша цель очистить задний план форматы и размеры, которые созда- доступ к вашей истории. Будет ли это данных, вовлекайте читателей так,
ваших дата историй, дать возмож- дут настроение, поддержат тему и просмотр со стационарного компью- как будто вы открываете инсайты
ность аудитории сосредоточиться баланс вашей истории. Используйте тера или мобильного устройства? вместе с ними. Цель – вдохновить
и увидеть данные и идеи, раскры- текст как сильный элемент визуаль- Предполагается ли использование вашу аудиторию и дать ей ценные
ваемые в визуализациях. Визуально ного дизайна, чтобы привлечь вни- дашборда как статичного изображе- ответы, которых у неё не было
должны быть закодированы только мание аудитории к самым важным ния или интерактивного? Нужно ли ранее. Планируйте запоминаю-
данные и представлен контекст в ко- областям дашборда. Выстраивайте будет распечатывать интерактивный щиеся элементы подачи историй.
торых они находятся. Любые другие визуальную текстовую иерархию. отчёт? В зависимости от этих ответов Ваши пользователи будут делиться
элементы и украшательства должны Разные параметры шрифтов исполь- на вопросы вы можете создавать с другими и говорить о моментах,
238 зуйте для разных целей. созданных вами.
быть убраны. разные версии своей истории.
239
DataArt или искусство
данных
Сегодня мы можем говорить штрихов и ваши данные теперь ключевые формы: геометриче-
о полноценном направлении, в ко- похожи на картину Пита Мондриана ские фигуры, кляксы, взаимос-
тором перемешиваются искусство или Кандинского! вязи, люди
и данные. Для дата-арта лучше всего подходят линии: прямые или ломаные,
Data Art — это направление в визу- художники ХХ века, которые не жирные или тонкие, пересека-
ализации данных, задача которого боялись экспериментов и пробова- ются друг с другом или парал-
развлечь или создать эстетически ли искать новые формы и художе- лельные
красивое произведение. Это и есть ственные стили. Абстракционизм, Вместе с DataYoga, вы можете раз-
искусство, основанное на данных. экспрессионизм, кубизм, фовизм вивать свое чувство прекрасного не
Или данные, показанные как и многие другие -измы помогут только выстраивая профессиональ-
искусство? вам в создании своей картины. ные дашборды и интерактивные
Создать Data Art не так сложно, как аналитические отчеты, но и рабо-
НА ЧТО ОБРАЩАТЬ
написать художественный шедевр. тать с данными как художники,
Картину можно создать от руки или
ВНИМАНИЕ: создавая дата-арт объекты.
же воспользоваться программным цвета: яркие и контрастные или
продуктом для визуализации, блеклые и похожие, богатая
которая будет лежать в основе цветовая палитра или мини-
дата-арта. На полученную основу малистичная, использование
примените свой собственный стиль чистых цветов (желтый, синий,
или выберите стиль любимого вами черный) или сложных (охристый,
240 художника. Несколько ключевых изумрудный, серый)...
Например, если хотите сделать
картину в стиле Пита Мондриана,
то используйте прямые черные ли-
нии, квадраты и три чистых цвета:
белый, синий и красный.
Если нравится Малевич, то ком-
понуйте между собой большое
количество квадратов и прямо-
угольников, а сбоку добавьте
небольшой кружок. Все на белом
фоне с использованием красного
цвета.
И не нужно переживать из-за того,
что у Малевича большое разноо-
бразие творческих стилей — возь-
мите 1−2 близкие по стилистике
картины и выделите в них ключе-
вые элементы, чтобы перенести их
в свой дата-арт.
241
Здесь показаны данные о кругосветном
путешествии, сделанном Андреем.
Каждый квадрат – одна страна, его
площадь – количество проведенных
дней, а квадраты в двух углах – способ
въезда и выезда из страны в зависи-
мости от вида транспорта. Догадаетесь
в каких странах Андрей провел больше
всего времени?
242
В России тоже проводятся выставки
Один из интересных проектов по картин, созданных на основе данных.
дата-арту: визуализация древовидных Например, выставка «Между нулем
диаграмм (тримапов) от Бена Шнай- и единицей» от Александра Панкина
дермана. Его картины выставлялись в МОММА в Москве.
в музее современного искусства MoMA
в Нью-Йорке! mmoma.ru/exhibitions/petrovka25/
mezhdu_nulem_i_edinicej_br_
treemapart.wordpress.com aleksandr_pankin_i_avangardy 243
Playb
244
book
245
для чего нужен
playbook
.03
.04
.01
.02
Составляем композицию из любых Вспоминаем как выглядят буквы
базовых геометрических фигур: круг, нашего алфавита и цифры, и делаем
Неотрывно рисуем линию без углов квадрат, линия, точка, треугольник. композицию из букв и цифр. По
и изломов, которая пересекает себя Рисуем 2-ю линию на новой карточ- Фигуры могут перекрывать друг желанию можно добавить объем для
много раз. Полная свобода: линии ке, теперь делая постоянные углы, друга, быть разного масштаба. любой фигуры. Попробуйте перевер-
любой толщины, любого цвета, изломы, перемещаясь в новое про- Композицию придумайте сами. Наша нуть, изменить масштаб, придать
перемещение в рамках границы странство, пересекая другие линии, задача — заполнить пространство фигуре характер, изменив некоторые
248 пространства карточки. может быть экспрессивно. внутри карточки. детали.
.06
.05
Зарисуйте то, что видите перед собой Пробуем найти в линиях первых двух
из базовых геометрических фигур, карточек знакомые образы и выде-
лить их цветом или штриховкой www.dadoo.club 249
не прорабатывая никакие детали.
придумайте
диаграммы 33:11
250
нарисуйте
текст
Посмотрите на приведенные ниже ТЕКСТ 02 «ы», двадцать одна буква «ь», две #разминка
тексты и попробуйте представить В этом предложении есть сорок буквы «э», одна буква «ю», и три
их в визуальной форме. Исполь- четыре буквы «а», тридцать четыре буквы «я». © Вячеслав Кабанович
зуйте любые материалы. буквы «б», сорок четыре буквы «в»,
ТЕКСТ 01 одна буква «г», тридцать четыре
В этом предложении слово «в» буквы «д», двадцать семь букв «е»,
встречается дважды, слово «встре- одна буква «е», две буквы «ж», одна
чается» встречается двенадцать раз, буква «з», тринадцать букв «и»,
слово «дважды» встречается шесть одна буква «й», тридцать шесть
раз, слово «двенадцать» встречается букв «к», две буквы «л», шесть
трижды, слово «предложении» букв «м», девятнадцать букв «н»,
встречается дважды, слово «раз» двадцать букв «о», три буквы «п»,
встречается четырежды, слово восемнадцать букв «р», одиннад-
«слово» встречается двенадцать раз, цать букв «с», тридцать шесть букв
слово «трижды» встречается триж- «т», тридцать четыре буквы «у»,
ды, слово «четырежды» встречается одна буква «ф», одна буква «х»,
дважды, слово «шесть» встречается пятнадцать букв «ц», семь букв «ч»,
дважды, слово «этом» встречается четыре буквы «ш», одна буква «щ»,
дважды. © Сумароков Стас одна буква «ъ», восемнадцать букв 251
знакомство
с данными
Внимательно изучите таблицу. В ней содержатся какие-то данные. Что это могут быть за данные? Можете #данные
ли вы сопоставить значения в столбцах с вашими знаниями из реальной жизни? Не все столбцы можно
определить однозначно, но включите воображение и подпишите каждый столбец.
Примеры таблицы представлены из курса Кризис Данных Алексея Шинкаренко.
253
определите
тип распределения
254
таблицы
против визуализаций
Определите, какие характеристики из списка ниже относятся к таблицам, а какие – к визуализациям. #виз
Выделите строки маркерами разных цветов для того, чтобы различать особенности использования таблиц
и визуализаций.
Задействуют отделы мозга отве- Смотреть на большой объем Найти минимальное и макси-
чающие за «чтение» и «речь» данных мальное значение быстро
Узнать конкретное значение Сравнить два числа Понять данные при беглом
Увидеть общие тенденции Увидеть сразу много метрик для взгляде
255
нарисуйте свой
словарь дудлов
256
проскетчите
текст
257
нарисуйте
скетчи
258
визуализируйте
таблицу
259
улучшите визуализации
Data Pomodoro
260
261
сделайте скетч
своего резюме
262
назовите
иконки
Дополнительные символы и иконки могут помочь грамотно завершить навигацию на дашборде и упро- #скетчинг
стить пользователям работу с данными.
#дашборд
Сопоставьте изображение иконки с функцией, которую она может выполнять. Одна функция может отно-
ситься к нескольким иконкам.
263
назовите
цвета
266
#виз
267
найти ошибки
с помощью стикеров
268
269
данные:
мобильные операторы
Задания:
Провести анализ стоимости
и услуг
Понять, насколько вам подходит
текущий тариф
Узнать, кому вы звоните больше
всего
270
придумайте
заголовки
271
создайте свой
идеальный чеклист
#разминка Все просто. Понаблюдайте за тем, что важно для вас и ваших коллег.
И сформируйте свой собственный чеклист к визуализации и к дашборду.
272
создайте
DataArt
Одно из развивающихся направлений современного искусства – это искусство, основанное на данных – #разминка
data art. Используйте данные из своей жизни: поездки, финансы, взаимоотношения с людьми, еду, физи-
#виз
ческие нагрузки и все, что придет в голову для того, чтобы создать свое произведение искусства.
В вашем распоряжении карандаши, краски, фломастеры, стикеры и листы бумаги любого размера.
Вы можете использовать как знакомые вам типы диаграмм, так и те, которые вы придумаете сами. Выбе-
рите данные и запишите их, сделайте скетч, чтобы лучше понять идею, и перенесите скетч на бумагу.
Вы можете взять в качестве вдохновения настоящих художников и любые элементы дизайна, которые вам
нравятся.
Возможные наборы данных: Понаблюдайте за собой один или Возможное вдохновение можно най-
несколько дней и сделайте свой ти у таких художников, как Казимир
Зайдите в свое приложение
банка и посмотрите свои расходы собственный набор данных исходя Малевич, Марк Ротко, Пит Мондри-
из ваших занятий. Придумайте ан, Жоан Миро, Пауль Клее.
по категориям за месяц.
свои категории: с кем вы обща-
Зайдите в свое приложение лись, кто для вас этот человек,
по спортивным тренировкам общались ли вы устно или пись-
или здоровью и посмотрите на менно, какое было ваше настрое-
количество пройденных шагов, ние, как долго вы разговаривали
пробежек, тренировок или переписывались.
273
сочините
хайку
#разминка Хайку – национальная японская форма поэзии, жанр поэтической мини- Маленький краб
атюры, просто, лаконично, ёмко и достоверно изображающий природу побежал по ноге.
и человека в их нерасторжимом единстве. Чистая вода.
Традиционное японское хайку – это 17-сложное стихотворение, записы- Мацуо Басё
ваемое в один столбец (строку) и состоящее из трёх ритмических частей
по 5-7-5 слогов. Внутренне хайку делится, как правило, на две смысло-
вые части 12+5 или 5+12.
Переводы и хайку, сочинённые на других языках, принято записывать
в три строки. [http://haikai.ru/russian_haiku/]
274
Вместе с русскоязычным сообществом, DataYoga собрала свой сбор-
ник датавиз-хайку. Попробуйте написать и вы.
Хайку из сообщества:
Просят барчарт Серое небо 1 мая Луна. [Чайка белая]:
На тысячу строк Дашборд в цвет природы 2 января Снежный барс по камням бежит Load ‘Полет’ As Весной;
Грустит самурай Заказчик доволен Алфавитная сортировка Пишу скрипт Autogenerate (3);
Растёт трава, течёт ручей Расцветает пайчарт Замерли птицы «Всё как в Экселе!» Set Hokku = ‘Сейчас’;
День сменяется ночью Сотней сегментов Всё неподвижно – Заказчик сказал. Set Lyrics = ‘Зачем?’;
Грузится дашборд Просто поле чудес Нет риалтайма Грустит самурай Exit Script;
Смотрю в экран Сварганил дашборд Небо полное звёзд Взмах мотылька 1000 экселей –
Мигают логотипы Завернись в полотенце Мои мысли о самой дальней Нарушил покой. Источник данных.
Qlik, Tableau – какая разница Ступай Дашборд не готов Не близко дедлайн Поле не найдено
Таблицы чарты диаграммы Прекрасны цветы Сакэ течет рекой «Сейчас пусть так –
И чашка кофе на столе Дашборд расцветает Радуется заказчик Исправим потом»
О где вы, горы?! Не очень красиво Готов дашборд Потом – не настало. Как писать хайку
Добавил красного Клиент попросил Клиент Скрипт открыл – пустота haikai.ru/russian_haiku
И заиграл пайчарт красками Сортировки добавить «Qlik не может как наша Экселька?» Коварен фрилансер
Потому что в бокал В дашборде нет места BI Include
275
ПРЕДИСЛОВИЕ.......................................................................................................2 II шаг............................................................................................................................48
оглавление зачем вам DataYoga и чему вы научитесь..............................................................4 ясное понимание...........................................................................................48
о DataYoga.....................................................................................................................8 путь человека: как развиваться в визуализации данных......................51
DataYoga – это..............................................................................................................10 форматы обучения........................................................................................52
принципы DataYoga.....................................................................................................11 датавиз п о методу Помодоро.....................................................................53
280
Сайт DataYoga, чтобы всегда
быть с нами
datayoga.ru
281
ДАТА ЙОГА:
грамотная
работа с данными
282